Text
                    Э. М. Галеев
ОПТИМИЗАЦИЯ
)
и
* Теория
•	Экстремальные задачи
•	Линейное программирование
•	Вариационное исчисление
Задачи оптимального
управления
Условия второго порядка
в вариационном исчислении
* Примеры
* Задачи
500 задач с ответами
URSS

Э. М. Галеев ОПТИМИЗАЦИЯ ТЕОРИЯ, ПРИМЕРЫ, ЗАДАЧИ Рекомендовано Научно-методическим советом по математике и механике УМО университетов Российской Федерации в качестве учебного пособия Издание третье, исправленное и дополненное URSS МОСКВА
ББК 22.18я73 22.318 22.161.8 65.05 65.23 22.1п Галеев Эльфат Михайлович Оптимизация: Теория, примеры, задачи: Учебное пособие. Изд. 3-е, испр. и доп. — М.: Книжный дом «ЛИБРОКОМ», 2010. — 336 с. Настоящая книга посвящена важнейшим проблемам оптимизации. В ее осно- ве лежат курсы и спецкурсы по теории оптимизации, прочитанные автором на механико-математическом факультете МГУ. Рассматриваются фрагменты сле- дующих разделов теории экстремальных задач: линейного и выпуклого програм- мирования, математического программирования, классического вариационного исчисления и оптимального управления. Приводятся как необходимые, так и дос- таточные условия экстремума. Для изучения этих разделов в необходимом объеме даются элементы функционального и выпуклого анализа. В каждом параграфе после теоретической части приводятся примеры решения задач, предлагаются задачи для решения на семинарах, в контрольных работах, а также для самостоя- тельного усвоения материала. Дается обзор общих методов теории экстремума. Для студентов вузов, обучающихся по специальностям «Математика», «При- кладная математика», а также для аспирантов, преподавателей и научных работ- ников. Издательство «Книжный дом “ЛИБРОКОМ”». 117312, Москва, пр-т Шестидесятилетия Октября, 9. Формат 60x90/16. Печ. л. 21. Зак. № 2952. Отпечатано в ООО «ЛЕНАНД». 117312, Москва, пр-т Шестидесятилетия Октября, 11А, стр. 11. ISBN 978-5-397-01176-1 © Э. М. Галеев, 2002, 2009 © Книжный дом «ЛИБРОКОМ», 2009 НАУЧНАЯ И УЧЕБНАЯ ЛИТЕРАТУРА E-mail: URSS@URSS.ru Каталог изданий в Интернете: http://URSS.ru Тел./факс: 7 (499) 135-42-16 URSS Тел./факс: 7 (499) 135-42-46 7851 ID 107101 9 "785397 0 Все права защищены. Никакая часть настоящей книги не может быть воспроизведена или передана в какой бы то ни было форме и какими бы то ни было средствами, будь то элек- тронные или механические, включая фотокопирование и запись на магнитный носитель, а также размещение в Интернете, если на то нет письменного разрешения владельцев.
Оглавление Предисловие ко второму и третьему изданиям.................. 9 Предисловие................................................ 10 Введение................................................... 13 Глава 1. Экстремальные задачи ............................. 15 § 1. Конечномерные задачи без ограничений.................. 15 1.1. Постановка задачи.................................. 15 1.2. Необходимые и достаточные условия экстремума...... 15 1.2.1. Функции одной переменной.................... 15 1.2.2. Функции нескольких переменных............... 18 1.2.3. Теорема Вейерштрасса и следствие из нее..... 20 1.2.4. Критерий Сильвестра......................... 20 1.2.5. Метод Ньютона (метод касательных)........... 21 1.3. Правило решения ................................... 23 1.4. Примеры ........................................... 24 1.5. Задачи............................................. 30 § 2. Конечномерные гладкие задачи с равенствами ........... 31 2.1. Постановка задачи.................................. 31 2.2. Необходимые и достаточные условия экстремума...... 32 2.2.1. Принцип Лагранжа............................ 32 2.2.2. Конечномерная теорема об обратной функции.. 34 2.2.3. Необходимое условие экстремума II порядка... 34 2.2.4. Достаточное условие экстремума II порядка... 35 2.3. Правило решения ................................... 37 2.4. Примеры ........................................... 38 2.5. Задача Аполлония .................................. 39 2.6. Задачи............................................. 42 § 3. Конечномерные гладкие задачи с равенствами и неравенствами............................................. 43 3.1. Постановка задачи.................................. 43 3.2. Необходимые и достаточные условия экстремума...... 43 3.2.1. Принцип Лагранжа............................ 43 3.2.2. Необходимое условие экстремума II порядка... 44 3.2.3. Достаточное условие экстремума II порядка... 45 3.3. Правило решения ................................... 46 !> L
4 Оглавление 3.4. Примеры ............................................ 47 3.5. Задачи.............................................. 49 § 4. Выпуклые задачи....................................... 51 4.1. Элементы выпуклого анализа. Субдифференциал....... 51 4.2. Теоремы отделимости ................................ 54 4.3. Задачи без ограничений.............................. 55 4.4. Задачи с ограничением .............................. 56 4.5. Задача выпуклого программирования................... 56 4.6. Задачи, упражнения.................................. 61 § 5. Элементы функционального анализа ..................... 62 5.1. Нормированные и банаховы пространства .............. 62 5.1.1. Определение пространств....................... 62 5.1.2. Произведение пространств...................... 64 5.1.3. Примеры банаховых пространств................. 64 5.1.4. Сопряженное пространство, оператор............ 65 5.2. Определения производных ..................... 65 5.2.1. Производная по направлению.................... 66 5.2.2. Вариация по Лагранжу.......................... 66 5.2.3. Производная Гато.............................. 66 5.2.4. Производная Фреше............................. 67 5.2.5. Строгая дифференцируемость.................... 67 5.2.6. Частные производные........................... 68 5.2.7. Производные высших порядков................... 68 5.2.8. Контрпримеры на дифференцируемость............ 69 5.3. Некоторые теоремы дифференциального исчисления в нормированных пространствах ........................... 71 5.3.1. Теорема о суперпозиции....................... 71 5.3.2. Формула Тейлора.............................. 74 5.3.3. Теорема о среднем ............................ 74 5.3.4. Теорема о полном дифференциале................ 77 5.4. Дополнительные сведения из алгебры и функционального анализа ............................... 78 5.5. Задачи.............................................. 84 § 6. Гладкая задача без ограничений ....................... 86 6.1. Постановка задачи................................... 86 6.2. Необходимые условия I порядка....................... 86 6.3. Необходимые и достаточные условия II порядка ....... 87 § 7. Гладкая задача с равенствами.......................... 89 7.1. Постановка задачи................................... 89 7.2. Необходимые условия I порядка....................... 89 7.3. Необходимые условия II порядка ..................... 91
Оглавление 5 7.4. Достаточные условия II порядка..................... 92 § 8. Гладкая задача с равенствами и неравенствами ......... 93 8.1. Постановка задачи.................................. 93 8.2. Необходимые условия I порядка...................... 93 8.3. Необходимые условия II порядка .................... 97 8.4. Достаточные условия II порядка.................... 102 § 9. Элементы общей теории поля .......................... 108 Ответы к задачам главы 1.................................. 110 Глава 2. Линейное программирование........................ 117 § 1. Симплекс-метод................................... 118 1.1. Постановки задач. Геометрическая интерпретация .... 118 1.2. Правило решения задач по симплекс- методу......... 120 1.3. Примеры .......................................... 123 1.4. Задачи............................................ 127 § 2. Двойственность в линейном программировании . .... 128 2.1. Элементы выпуклого анализа. Преобразование Лежандра ..................... 128 2.2. Примеры .......................................... 129 2.3. Вывод двойственных задач.......................... 131 2.3.1. Вывод задачи двойственной к задаче в общей форме . . 131 2.3.2. Вывод задачи двойственной к двойственной задаче для задачи линейного программирования в общей форме .......................... 132 2.3.3. Вывод задачи двойственной к задаче в канонической форме.......................... 133 2.3.4. Упражнения ................................. 133 § 3. Обоснование симплекс- метода ........................ 134 3.1. Теоремы существования, двойственности, критерий решения....................................... 134 3.2. Свойства множества допустимых точек............... 137 3.3. Доказательство симплекс- метода................... 139 § 4. Методы нахождения начальной крайней точки ...... 142 4.1. Переход к решению двойственной задачи ............ 142 4.2. Метод искусственного базиса ...................... 144 4.3. Примеры .......................................... 147 4.4. Задачи............................................ 153 § 5. Транспортная задача.............................. 154 5.1. Постановка задачи................................. 154 5.2. Особенности задачи................................ 156
6 Оглавление 5.3. Методы нахождения начальной крайней точки ....... 157 5.4. Метод потенциалов ...........*................... 162 5.5. Примеры транспортных задач ...................... 163 5.6. Задача двойственная к транспортной задаче........ 170 5.7. Обоснование метода потенциалов решения транспортной задачи .......................... 171 5.8. Задача о назначении. Пример ..................... 173 5.9. Задачи........................................... 175 Ответы к задачам главы 2................................. 176 Глава 3. Вариационное исчисление......................... 178 § 1. Простейшая задача вариационного исчисления.......... 179 1.1. Постановка задачи............................... 179 1.2. Вывод уравнения Эйлера с помощью основной леммы вариационного исчисления ....................... 179 1.3. Вывод уравнения Эйлера с помощью леммы Дюбуа-Реймона .................................. 181 1.4. Векторный случай ................................ 183 1.5. Интегралы уравнения Эйлера .................... 184 1.6. Примеры ......................................... 184 1.7. Задачи........................................... 185 § 2. Задача Больца....................................... 190 2.1. Постановка задачи................................ 190 2.2. Необходимое условие экстремума................... 191 2.3. Многомерный случай ............................. 192 2.4. Пример .......................................... 193 2.5. Задачи Больца ................................... 195 § 3. Задача с подвижными концами ........................ 196 3.1. Постановка задачи................................ 196 3.2. Необходимые условия экстремума .................. 197 3.3. Пример .......................................... 197 3.4. Задачи с подвижными концами ..................... 199 § 4. Изопериметрическая задача .......................... 202 4.1. Постановка задачи................................ 202 4.2. Необходимое условие экстремума................... 203 4.3. Пример .......................................... 205 4.4. Задача Дидоны.................................... 206 4.5. Изопериметрические задачи ....................... 208 § 5. Задача со старшими производными..................... 211 5.1. Постановка задачи................................ 211
Оглавление ’ 7 5.2. Вывод уравнения Эйлера—-Пуассона с помощью леммы Лагранжа............................... 212 5.3. Вывод уравнения Эйлера—Пуассона с помощью леммы Дюбуа-Реймона.......................... 213 5.4. Пример ........................................... 215 5.5. Задачи со старшими производными................... 217 § 6. Задача Лагранжа ..................................... 220 6.1. Постановка задачи................................. 220 6.2. Необходимые условия экстремума ................... 221 6.3. Примеры .......................................... 225 6.4. Вывод уравнения Эйлера—Пуассона из теоремы Эйлера—Лагранжа............................. 228 6.5. Задачи Лагранжа................................... 229 Ответы к задачам главы 3................................... 235 Глава 4. Задачи оптимального управления.................... 247 § 1. Принцип максимума Понтрягина в общем случае ......... 248 1.1. Постановка задачи................................. 248 1.2. Формулировка теоремы.............................. 249 1.3. Пример ........................................... 250 § 2. Формулировка и доказательство принципа максимума Понтрягина для задачи со свободным концом ................ 253 § 3. Избранные задачи оптимального управления ............ 258 3.1. Простейшая задача о быстродействии ............... 258 3.2. Аэродинамическая задача Ньютона................... 262 3.3. Примеры задач оптимального управления............. 266 3.4. Задачи оптимального управления ................... 271 Ответы к задачам главы 4................................... 275 Глава 5. Условия второго порядка в вариационном исчислении .... 281 § 1. Простейшая задача вариационного исчисления .......... 281 1.1. Сильный и слабый экстремум ....................... 281 1.2. Пример слабого, но не сильного экстремума ........ 282 1.3. Условия Лежандра, Якоби, Вейерштрасса ............ 284 1.4. Необходимые и достаточные условия слабого и сильного экстремума ................................. 287 1.4.1. Игольчатые вариации. Условие Вейерштрасса... 287 1.4.2. Необходимое условие сильного экстремума — неравенство (7)................................... 290 1.4.3. Необходимые условия сильного экстремума.... 293 1.4.4. Лемма о скруглении углов.................... 294
8 Оглавление 1.4.5. Необходимые условия слабого экстремума........ 295 1.4.6. Поле экстремалей.............................. 297 1.4.7. Достаточные условия слабого экстремума........ 303 1.4.8. Достаточные условия сильного экстремума....... 303 1.4.9. Квадратичный функционал....................... 304 1.5. Правило решения .................................... 306 1.6. Примеры ............................................ 308 1.7. Задачи.............................................. 312 § 2. Задача Больца.......................................... 316 2.1. Сильный и слабый экстремум ......................... 316 2.2. Условия экстремума II порядка ...................... 316 2.2.1. Необходимые условия слабого экстремума........ 316 2.2.2. Достаточные условия сильного экстремума....... 319 2.2.3. Квадратичный функционал....................... 322 2.3. Пример ............................................ 324 Ответы к задачам главы 5................................... 326 Список литературы............................................ 330 Список обозначений........................................... 331 Предметный указатель......................................... 333
Предисловие ко второму и третьему изданиям Во втором и третьем изданиях исправлены все замеченные опечатки предыдущих изданий, расписаны подробнее некоторые доказательства, существенно более подробно изложены примеры, убрано громоздкое доказательство принципа максимума Понтрягина в общем случае, и, самое главное, добавлено большое число новых задач и простых, и более сложных. При большем числе задач легче будет преподавателю выбирать те из них, которые более соответствуют излагаемому в соответствующем ВУЗе курсу. Основная часть задач взята из более ранних задачников, написанных автором вместе с Алексеевым В. М., Кушниренко А. Г., Тихомиро- вым В. М. Первой попыткой создания соответствующего задачника был изданный по инициативе Тихомирова в 1980 г. в МГУ «Сборник задач по оптимальному управлению» (Галеев, Кушниренко, Тихомиров). В 1984 г. в издательстве «Наука» вышел «Сборник задач по оптимизации» (Алексеев, Галеев, Тихомиров), в котором были существенно расширены и теоретический, и заданный материал. В эти задачники были включены многие классические задачи, задачи, используемые преподавателями при ведении обязательного курса «Вариационное исчисление и оптимальное управление». Авторами задач являются многие профессора и препода- ватели кафедры общих проблем управления. Большая часть задач была создана специально для задачника студентами и аспирантами МГУ под руководством автора, а также самим автором. Этот задачник стал исполь- зоваться во многих ВУЗах при ведении занятий по курсам оптимизации и написании учебников и задачников. Задачи по линейному программированию частично взяты из «Сборника задач по ли- нейному программированию» — Заславский Ю.Л. М.: Наука, 1969.
Предисловие Задачи на отыскание наибольших и наименьших величин являют- ся актуальными на протяжении всей истории развития человечества. Особенное значение они приобретают в настоящее время, когда воз- растает важность наиболее эффективного использования природных богатств, людских ресурсов, материальных и финансовых средств. Все это приводит к необходимости отыскивать наилучшее, или, как говорят, оптимальное решение того или иного вопроса. Первые задачи на максимум и минимум были поставлены и решены в глубокой древности, когда математика только зарождалась как наука. Теория экстремальных задач начала создаваться в начале XVII века, и затем она активно развивалась вплоть до наших дней, включая в свою орбиту крупнейших математиков, таких как Ферма, Ньютон, Лейбниц, Бернулли, Эйлер, Лагранж, Пуанкаре, фон Нейман, Канторович, Пон- трягин и других. В наше время невозможно мыслить себе полноценное математическое образование без элементов теории экстремума. Монография является переработанным и расширенным переизда- нием первых пяти глав, написанных Галеевым, книги Галеев Э. М., Тихомиров В. М. «Оптимизация: теория, примеры, задачи». М.: УРСС, 2000. Книга состоит из 5 глав. Они содержат материал курса лекций по методам оптимизации, линейному программированию, оптимальному управлению и вариационному исчислению, а также спецкурса по услови- ям экстремума второго порядка на механико-математическом факультете Московского государственного университета, а также в некоторых инсти- тутах естественнонаучного профиля. Данный курс лекций был разработан целым рядом профессоров и преподавателей механико-математического факультета МГУ, на начальном этапе курс сформировался усилиями В. М. Алексеева, В. М. Тихомирова, С. В. Фомина. При написании книги использовался материал, содержащийся в ранее опубликованных книгах: [АТФ] — Алексеев В. М., Тихомиров В. М., Фомин С. В. «Оптимальное управление». М.: Наука, 1979; [АГТ] — Алексеев В. М., Галеев Э. М., Тихомиров В. М. «Сборник задач по оптимизации». М.: Наука, 1984; [ГТ] — Галеев Э. М., Тихомиров В. М. «Краткий курс теории экстре- мальных задач». М.: Изд-во МГУ, 1989. Книга является расширенным вариантом пособия Галеева Э. М. «Курс лекций по вариационному исчи- слению и оптимальному управлению». М.: Изд-во мехмата МГУ, 1996. Она предназначена для курсов, включающих элементы теории экстрему- ма любого уровня и приспособлена к действующим ныне программам. Все чертежи в LATEX'е 2е выполнены Галеевой Альфирой.
Предисловие 11 Рассматриваются следующие разделы теории экстремальных задач: задачи без ограничений, гладкие задачи с ограничениями типа равенств и неравенств, линейное программирование, вариационное исчисление, оптимальное управление, необходимые и достаточные условия экстрему- ма в вариационном исчислении. При изучении данных разделов требуется знание основ математи- ческого анализа и линейной алгебры, изучаемых на первых двух курсах технических и педагогических вузов, университетов. Предполагается, что читатели знакомы с элементарными приемами дифференцирования и интегрирования функций, умеют решать простейшие дифференци- альные уравнения, знакомы с элементарными навыками работы с ма- трицами (умножением, транспонированием, нахождением обратной). Все остальные используемые в курсе математические понятия подробно определяются. В первой главе рассматриваются задачи без ограничений, задачи с ограничениями типа равенств, с ограничениями типа равенств и не- равенств для числовых функций п переменных и в нормированных пространствах. Для каждого типа задач приводятся решения соответ- ствующих примеров. Одним из примеров является старинная задача Аполлония о нормалях к эллипсу. Методами теории экстремальных за- дач решается задача из курса алгебры о приведении квадратичной формы к главным осям. Большое внимание уделяется выпуклым задачам. Дают- ся элементы выпуклого анализа, причем выпуклый анализ в зависимости от уровня математической подготовки читателя может рассматриваться как в конечномерных пространствах, так и в линейных нормирован- ных пространствах, вводится понятие субдифференциала и доказывается теорема Куна—Таккера. В этой же главе даются некоторые элементы функционального анализа и дифференциального исчисления в норми- рованных пространствах. Вторая глава посвящена линейному программированию. В ней вна- чале даются постановки задач линейного программирования, правило решения задач в канонической форме по симплекс-методу, приводят- ся с решениями примеры. Вводится понятие двойственности, затем проводится строгое обоснование симплекс-метода, дается ряд методов нахождения первоначальной крайней точки. Полученные навыки при- меняются к некоторым наиболее известным типам задач линейного программирования — транспортным задачам и задачам о назначении. Основная цель при этом — ознакомление студентов с имеющимися ме- тодами решения задач линейного программирования и проведение обо- снования этих методов. Обоснование проводится таким образом, чтобы для решения подобных задач в дальнейшем возможно было бы самосто- ятельно создать метод решения и провести его обоснование. В пособии приведены доказательства теоремы существования решений и теоремы двойственности, позволяющие более глубоко понять данный курс.
12 Предисловие В третьей главе приводятся следующие элементарные задачи класси- ческого вариационного исчисления: простейшая задача, задача Больца, изопериметрическая задача. Все эти задачи являются частным случаем более общей задачи Лагранжа. Как частный случай задачи Лагранжа рассматриваются задача с подвижными концами и задача со старшими производными. В четвертой главе рассматриваются задачи оптимального управления. Приводится формулировка принципа максимума Понтрягина в общем случае, а также доказательство принципа максимума для задачи со сво- бодным концом. Решаются простейшая задача о быстродействии, задача Ньютона и ряд других задач оптимального управления. В пятой главе даны необходимые и достаточные условия экстремума в простейшей задаче классического вариационного исчисления и задаче Больца. Галеев Э. М. Автор благодарит В. М. Тихомирова, у которого учился теории и ре- шению задач на экстремум и который внес огромный вклад в разработку курсов оптимизации.
Введение Теорию задач на отыскание наибольших и наименьших величин называют теорией экстремальных задач. Слово maximum по латыни означает «наибольшее», слово minimum — «наименьшее». Оба этих понятия объединяются словом «экстремум» (от латинского extremum, означающего «крайнее»). Слово «экстремум», как термин, объединяющий понятия «максимум» и «минимум», ввел в употребление Дюбуа-Реймон. Ныне раздел анализа, в котором изучают разнообразные задачи на максимум и минимум, называют теорией экстремальных задач. Запись задачи в виде f{x) -> extr означает, что мы должны решить и задачу на минимум, и задачу на максимум. Задачу на максимум всегда можно свести к задаче на минимум, заменив задачу /(ж) —> max задачей f{x) —> min, где f(x) = -f(x), и наоборот. Поэтому в тех случаях, когда формулировки теорем для задач на минимум и максимум различны, мы иногда будем ограничиваться рассмотрением задачи на минимум. Задачи на максимум и минимум изначально формулируются, как правило, на языке той области, в которой они возникают. А исследуют их средствами математического анализа. Для того, чтобы можно было воспользоваться этими средствами, необходимо перевести формулировку задачи на язык математического анализа. Такой перевод называется формализацией, В общем виде формализованная задача выглядит следующим образом: найти экстремум {максимум или минимум) функции f : X R, опреде- ленной на некотором пространстве X при ограничении х 6 D {D С X). Кратко записываем так: f(x) —► extr; х Е D. (Р) Для функции одной переменной X = R, для функции нескольких переменных X = Rn. В более общих случаях X может быть линей- ным, нормированным или топологическим пространством. Ограничение х е D может быть записано в виде включения, а также в виде уравнений или неравенств. (Р) — нумерация (обозначение) задачи (от английского слова problem — задача). Множество допустимых элементов в задаче (Р) обозначаем D = D{P) или Dp, Если множество допустимых элементов совпадает со всем пространством {D = X), то задачу (Р) называем задачей без ограничений. Решением задачи (Р) на минимум является точка £ такая, что f{x) f{&) для всех точек х 6 D{P), В этом случае мы пишем
14 Введение £ € absminP. Такой минимум называется еще абсолютным, или гло- бальным. Аналогично определяется абсолютный максимум в задаче (absmaxP). Величина f(&)9 где f — решение задачи, называется чи- сленным значением задачи и обозначается Smjn или 5тах (иногда, чтобы подчеркнуть глобальность экстремума, Sabsmin или Sabsmax)- Множество решений задачи (Р) обозначается ArgP. Если экстремум не достигается, то мы должны указать последовательность точек хп, на которой значение функции f(xn) стремится к величинам Smin и Smax. При решении задачи следует отыскать не только абсолютные (гло- бальные) экстремумы задачи, но и локальные экстремумы. Точка £ является точкой локального минимума в задаче (Р) (пишем х € locminP), если существует окрестность U точки £ такая, что f(x) /(£) для любой допустимой точки х из этой окрестности (Ух 6 D П U). Аналогично точка ж является точкой локального максимума в задаче (Р) (пишем х 6 locmaxP), если существует окрестность U точки ж такая, что /(ж) f(&) У х € D А Р. Если речь идет о максимуме или минимуме, то пишем locextrP. В связи с каждой экстремальной задачей возникают вопросы: ка- ковы необходимые условия экстремума, каковы достаточные условия, существует ли решение задачи, как найти решение явно или численно. В теории экстремальных задач наиболее разработаны необходимые условия, которым должно удовлетворять решение задачи. Выписывая эти необходимые условия экстремума, мы находим некоторое множество то- чек, удовлетворяющее этим условиям. Это множество точек (мы называем их стационарными, или критическими, или экстремальными), возможно, шире, чем множество абсолютных и даже локальных экстремумов. По- этому далее надо с каждой такой точкой разобраться, доставляет она экс- тремум (и какой) или нет. Это делается с помощью достаточных условий. Одним из важнейших принципов решения задач с ограничениями является принцип Лагранжа снятия ограничений. Ниже он будет сфор- мулирован и доказан для некоторых конкретных типов задач. Сфера применимости принципа Лагранжа достаточно широка. Иногда нельзя к задаче применить имеющуюся теорему, однако этот принцип, приме- ненный без обоснования, тем не менее может привести к точкам, среди которых можно выделить решение.
Глава 1 Экстремальные задачи § 1. Конечномерные задачи без ограничений В этом параграфе даются необходимые и достаточные условия экстремума функций одной и нескольких переменных. 1.1. Постановка задачи Пусть / : Rn —> R — функция п действительных переменных, обла- дающая некоторой гладкостью. Под гладкостью мы понимаем определен- ную дифференцируемость функции. Если функция f дифференцируема к раз в точке А, мы пишем / € Dk(x). Гладкой конечномерной экстре- мальной задачей без ограничений называется следующая задача: f(x) —► extr. При решении задачи надо найти не только абсолютные (глобальные) экстремумы (минимумы и максимумы) функции, но и локальные экс- тремумы. Точка £ является точкой локального минимума (максимума) функ- ции /, если существует окрестность U€ = {ж | |я - ж| < е} точки £ такая, что f(x) f(&) (f(x) /(£)) для любой точки х из этой окрестности. При этом мы пишем А 6 locmin/ (х 6 locmax/), а если речь идет о минимуме или максимуме, то пишем А 6 locextr/. 1.2. Необходимые и достаточные условия экстремума 1.2.1. Функции одной переменной Теорема 1 (Ферма). Пусть f : R —► R — функция одного действи- тельного переменного. Если х € locextr/ — точка локального экстремума функции f и f € D(&) дифференцируема в точке х, то /'(*) = 0.
16 Глава 1. Экстремальные задачи Это соотношение мы называем условием стационарности или не- обходимым условием экстремума I порядка. Точки, удовлетворяющие условию стационарности, называются стационарными. Доказательство. По определению дифференцируемости /(£ + К) = /(£) + f(x)h + г(Л), r(h) = o(h) = o(l)h при малых h. Значит, /(ж + h) - f(x) = (f'(x) 4- o(l))h. Если бы f(&) / 0, то при h достаточно близких к нулю, величина f'(x)+o(l) имела бы знак /'(£), поскольку о(1) -* 0 при h —* 0. Само же h может принимать как положительные, так и отрицательные значения. Следовательно, разность /(£ -}- h) - /(£) может быть как меньше, так и больше нуля. Это противоречит тому, что /(£ -h h) - f(£) 0 при £ € locmin/ и f(x + h) - f(x) 0 при х 6 locmax/. Геометрически теорема Ферма утверждает, что в точке экстремума дифференцируемой функции касательная к ее графику горизонтальна. Теорема Ферма дает необходимое условие I порядка для существова- ния локального экстремума. Сформулируем необходимые и достаточные условия экстремума I-II порядка. Теорема 2. Пусть функция f € D2(x) дважды дифференцируема в точ- ке х. Необходимые условия экстремума: если & 6 locmin/ — точка локаль- ного минимума функции f, то f'(£) = 0, f"(£) > 0. Достаточные условия экстремума: если /'(£) = О, /"(4) > о, то х 6 locmin / — точка локального минимума функции f. Доказательство. По формуле Тейлора f(i + ft) = f(x) + f(£)h + ^f"(£)h2 + r(ft), r(h) = o(h2). Необходимость. Пусть х Е locmin/. Тогда, во-первых, по необходи- мому условию экстремума I порядка для функций одной переменной — теореме Ферма — f(x) = 0, во-вторых, f(x + h) - f(£) 0 при доста- точно малых h. Поэтому в силу формулы Тейлора + ft) - f(x) = |/"(*)ft2 + г (ft) > 0 (r(ft) = o(ft2)) при малых h. Разделим обе части последнего неравенства на h2 и устре- мим h к нулю. Поскольку —;-----► 0, то получим, что f"(&) 0. п2
§ 1. Конечномерные задачи без ограничений 17 Достаточность. Пусть /'(f) = 0, f"(i) > 0. Тогда по формуле Тейлора в силу условия r(h) = o(h2) |т(Л)| eh2 => r(h) -eh2 для любого е > 0 при достаточно малых h имеем: Л* + Л) - /(Л) = ^/'(*)Л2 + ’•(Л) > - е)л2 > 0 при е 2 . Следовательно, $ Е locmin/. Для локального максимума неравенства имеют противоположный вид: f"(x) 0 и f"(&) < 0 соответственно. Теоремы 1 и 2 допускают обобщения на конечномерный и бесконеч- номерный случаи (см. соответственно Глава I, п. 1.2.2 и §6). В одномерном случае можно дать почти исчерпывающий ответ на во- прос о том, является ли данная точка £ локальным экстремумом или нет. Теорема 3. Пусть функция f Е Dn(x) п раз дифференцируема в точке х. Необходимые условия экстремума: если & Е locmin (max) f — точка локального минимума (максимума) функции f, то либо f (*) = ••• =/(п)(*) = 0, либо /(f) = ... = /2m-')(f) = о, /2m)(f) > 0 (/2m>(f) < 0) (1) при некотором т:2 2т п. Достаточные условия экстремума: если выполняется условие (1), то & Е locmin (max) / — точка локального минимума (максимума) функции f. Доказательство. Пусть для определенности £ Е locmin/. По фор- муле Тейлора f(£+h) = г(Л) = о(Лп) при h -> о). к=0 Необходимость при п = 1 следует из теоремы Ферма. Пусть далее п > 1. Тогда либо f'(£) = ... = f(n\&) = 0 (в этом случае выполняется утверждение теоремы), либо f'(£) = ... = f^~l\x) = 0, f^(x) Значит, + Л) - f(£) = £ + r(h) = ^^-h! + n (Л), n (Л) = о(Л'). Поскольку £ € locmin f, to f(£ + Л) - f(£) = ——4i! + ri(h) 0 при достаточно малых по модулю h. Так как /^(А) 0, то отсюда следует, что I — четно и > 0.
18 Diaea 1. Экстремальные задачи Достаточность. Пусть /'(f) — ... = f^2m ^(Л) — 0, Ф 0. Тог- да по формуле Тейлора + = + г2(Л), ^-0 при Л-+0. (2m)l пгт Поскольку > 0, то /(£ 4- h) - f(x) 0 при достаточно малых h, т.е. £ Е locmin/. 1.2.2. Функции нескольких переменных Сформулируем необходимое условие экстремума I порядка в конеч- номерной задаче без ограничений, являющееся аналогом теоремы Ферма. Теорема 1. Если $ = (£],... ,£n) Е locextr/ — точка локального экс- тремума функции п переменных f(x]9... ,шп) и функция f Е D(£) диффе- ренцируема в точке ж, то дХ] <№i) = О _ W) _ 0 Доказательство. Рассмотрим функцию одной переменной <p(xi) = /(#!,... ,£п). Поскольку ж = (#i,...,£n) Е locextr/, то Е locextr <р. Кроме того <р Е По необходимому условию экстремума для функций одной переменной — теореме Ферма ^ = 0. дХ{ Сформулируем необходимые и достаточные условие экстремума II порядка в конечномерной задаче без ограничений. Предварительно напомним, что второй производной функции нескольких переменных является симметричная матрица вторых производных / п2 */А\ \ п А = f"{&) = \VXiVXj / f j=I а также приведем определения знакоопределенностей симметричных матриц. Матрица А называется неотрицательно определенной (Л > 0), если {Ah, h)^0 УЛ е R" 52 aijhihj > 0 VA = (Л1,..., Лп) е R”. м=1 Матрица А называется положительно определенной (А > 0), если (Ah,h}>0 УЛ€^П, Л/0.
§ 1. Конечномерные задачи без ограничений 19 Матрица А называется строго положительно определенной, если су- ществует а > 0 такое, что (АЛ, Л) > а||Л||2 Vft€Rn. Аналогично определяются неположительная й отрицательная матрицы. Отметим, что в конечномерном пространстве условие положитель- ной определенности симметричной матрицы А эквивалентно условию строгой положительности матрицы А. (Ah,h)>0 Vft€R", Л# 0 3 а>0| {Ah,h} > а|Л|2 V/iGR". В бесконечномерных пространствах это не так (см. Гл. 1, п. 6.3, Пример 2). Теорема 2. Пусть функция f Е D2(&) дважды дифференцируема в точке & = (*^Ь • • • > &п)‘ Необходимые условия экстремума: если х Е locmin(max)/ — точка локального минимума (максимума) функции f, то /'(£) = 0, (f(x)h,h) > 0 «/"(£)Л,Л) 0) УЛ Е Rn. Достаточные условия экстремума: ес/ш /'(£) = 0, </"(а)Л,Л)>0 ({f"(£)h,h) <0) VfcERn, Л^О, то z Е locmin (max) / — точка локального минимума (максимума) функ- ции f. Доказательство. По формуле Тейлора f(£ + h) = /(f) + (/'(f), Л) + |(/"(f)M) + г(А), г(Л) = о(|Л|2). Докажем теорему для случая минимума. Случай максимума аналогичен. Необходимость, Поскольку х Е locmin /, то, во-первых, по необходи- мому условию экстремума I порядка в конечномерной задаче без ограни- чений — аналогу теоремы Ферма /'(ж) = 0, во-вторых, /(^+АЛ)-/(®)^0 при достаточно малых А. Поэтому в силу формулы Тейлора д2 /(f + AA)-/(f) = y(/"(f)A,A) + r(AA)>0 (г(АЛ) = о(|А|2)) при малых А и фиксированном Л. Разделим обе части последнего нера- венства на А2 и устремим А к нулю. Поскольку что г(АЛ) —2-----► 0, то получим, Л (f(±)h,h) >0 V^ERn. Достаточность, Так как f(x) = 0, то по формуле Тейлора в силу вы- полненного условия (/"(®)Л,Л) > а|Л|2 имеем: /(f + Л) - /(f) = |(/"(f)A, Л) + г(Л) > у |Л|2 + г(А) > 0
20 Тлава 1. Экстремальные задачи при достаточно малых Д, так как r{h) = о(|Д|2). Следовательно, locmin/. п Замечание. Для квадратичных функционалов Q{x) = aijxixj усло- М = 1 вие положительной (отрицательной) определенности матрицы Л = Г(х) = (а0)^=1 является достаточным условием абсолютного минимума (максимума) функционала в стационарной точке. 1.2.3. Теорема Вейерштрасса и следствие из нее Пусть f : Rn —> R — функция п переменных. При исследова- нии вопроса о достижении функцией п переменных экстремума часто используется следующая теорема. Теорема Вейерштрасса. [19, т. 1, с. 235.] Непрерывная функция на непу- стом ограниченном замкнутом подмножестве конечномерного пространства {компакте) достигает своих абсолютных максимума и минимума. Выделим простое следствие из этой теоремы, которое часто будем использовать. Следствие. Если функция f непрерывна на R” и lim f{x) — -boo [ж [->оо ( lim f{x) = — oo), то она достигает своего абсолютного минимума |я|—>оо {максимума) на любом замкнутом подмножестве из R”. 1.2.4. Критерий Сильвестра Знакоопределенность матрицы устанавливается с помощью критерия Сильвестра. Напомним, что последовательными главными минорами матрицы А (<Ч1 ... d\k \ ..........]. dk\ • • • dkk / Главным минором матрицы А называется определитель ма- трицы размера к х к, составленной из строк и столбцов с номерами 1 • • • а«1Ц \ ... I. aikii • • • dikik / Теорема. [10, с. 260.] Пусть А — симметричная матрица. Тогда 1. Матрица А положительно определена {А > 0) тогда и только тогда, когда все ее последовательные главные миноры положительны, т. е. > 0, k = 1,... ,п.
§ 1. Конечномерные задачи без ограничений 21 2. Матрица А отрицательно определена (Л < 0) тогда и только тогда, когда все ее последовательные главные миноры чередуют знак, начиная с отрицательного, т. е. (-1 > 0, k = 1,... ,п. 3. Матрица А неотрицательно определена (А 0) тогда и только тогда, когда все ее главные миноры неотрицательны, т.е. А^,,,^ 0, 1 г'| ik п, к = 1,..., п. 4. Матрица А неположительно определена (Л 0) тогда и только тогда, когда все ее главные миноры чередуют знак, начиная с неположитель- ного, т.е. (-1)*Л|-|..лк > 0, 1 i| ik п, к = 1,... ,п. Замечание 1. Как будет показано ниже, положительность (неотрица- тельность) матрицы равносильна положительности (неотрицательности) всех собственных значений матрицы. Замечание 2. Отметим, что условие положительности последователь- ных главных миноров матрицы равносильно условию положительности всех главных миноров (см. [10, с. 260]). Для условия неотрицательности это не так, т.е. из условия неотрицательности последовательных главных миноров не следует неотрицательность всех главных миноров матрицы и, следовательно, не следует неотрицательность матрицы. п ч л /О 0\ Действительно, у матрицы А = I q I последовательные главные миноры равны нулю (Л1 = Л|2 = 0), но она не является неотрицательной: {Ah, h) = ((0, -Л2), (Л,, Л2)) = -Л2 < 0 при Л2 0. 1.2.5. Метод Ньютона (метод касательных) Для того, чтобы решить задачу без ограничений нужно найти стационарные точки — решения уравнения f(x) = 0. Для решения таких уравнений численным способом можно воспользоваться замечательным приемом, восходящим к Ньютону. Итак, пусть нам требуется решить уравнение Г(ш) = 0. (1) Здесь F — дважды непрерывно дифференцируемая функция одной пере- менной. Будем искать решение уравнения (1) методом последовательных приближений. Если хк — приближенное значение корня, то точное значение корня х = хк-\-Ьк, (2) где hk мало, и в силу дифференцируемости функции F 0 = F(£) = F(xk + hk) = F(xk) + F'(xk)hk + o(hk). F(xk) F'(xk) Пренебрегая слагаемым o(hk)9 находим, что hk = - Внеся эту поправку в формулу (2), получим новое уточненное приближенное значение корня: = xk + h*.
22 Глава 1. Экстремальные задачи Таким образом, мы имеем следующее рекуррентное соотношение для нахождения последовательных приближений к нулю уравнения (1): — &к F(xk) ГЫ' (3) Геометрически метод Ньютона эквивалентен замене дуги кривой у = F(x) касательной, проведенной в некоторой точке кривой (см. рис. 1). Пусть для определенности нам надо найти корень уравнения (1), на- ходящийся на отрезке [а, Ь] и F(b)F"(b) > 0. Положим xq = b. Проведем касательную к кривой у = F(x) в точке (b,F(b)) = (xq,F(xq)). В качестве первого приближения берется абсцисса точки пересе- чения этой касательной с осью Ох, Через точку (а?!, F(x\)) снова про- водим касательную, абсцисса точки пересечения которой дает второе приближение Х2 корня £ и т.д. (рис. 1). Очевидно, что уравнение касательной в точке (®fc,F(®fc)) есть У = F(xk) + F\xk)(x - хк). Полагая в этом уравнении у = 0, х = , имеем формулу (3) 0 = F(xk) + F1 (xk)(xk+i - хк) F(xk) F'(xk)‘ Заметим, что если в нашем случае положить xQ = а и, следовательно, F(xq)F"(xq) < 0, то, проведя касательную к кривой у = F(x) в точке (a,F(a)), мы получили бы точку х\, лежащую вне отрезка [а, Ь], т. е. при этом выбор начального значения в методе Ньютона оказался бы неудачным. Таким образом, в данном случае правильным начальным приближением £ является условие F(xq)F"(xq) > 0.
л § 1. Конечномерные задачи без ограничений 23 Имеет место следующая Теорема. Пусть F Е C2([a,b],R), значения функции F(a) и F(b) при- нимают разные знаки (F(a)F(b) < 0), функция F монотонна на отрезке [а,Ь], F'(x)F"(x) / 0 Vx Е [а,Ь]. Тогда, исходя из начального приближе- ния xq Е [а, Ь], удовлетворяющего неравенству F(xq)Fh(xq) > О, можно вычислить по методу Ньютона единственный корень уравнения F(x) = О с любой степенью точности. Если производная F\x) мало меняется на отрезке [а, Ь] или вычи- сление F'ixk) слишком трудоемко, то в формуле (3) можно положить F'(xk) = Г'(жо) для всех значений k = 0,1,2,...: Xk+'-Xk~F^)‘ Такой метод нахождения корня уравнения называется модифицированным методом Ньютона. Геометрически этот способ означает, что мы заменя- ем касательные в точках (х^,Р(х^)} прямыми параллельными первой касательной, построенной в точке (яо,Г(;ео))- Подробнее о методе Ньютона можно прочитать в книге «Основы вычислительной математики» Б. П. Демидович и И. А. Марон [11]. 1.3. Правило решения Для решения конечномерной задачи без ограничений следует: 1) Выписать необходимое условие экстремума I порядка — аналог теоремы Ферма: /'(х) = 0 <=> dXf df(x) дхп Найти точки £, удовлетворяющие необходимому условию I порядка (эти точки называются стационарными). 2) Проверить выполнение условий экстремума 11 порядка в каждой стационарной точке. Выписать матрицу вторых производных л “ 7 (ж) ~ ~{а^'- а) Проверить выполнение достаточных условий экстремума — иссле- довать ее знакоопределенность, т. е. посчитать последовательные главные миноры матрицы А: = det А: = 1,..., п.
24 Глава 1. Экстремальные задачи Если все ее они положительны, т. е. А|...д. >0, к = 1,...,п, то точка ж доставляет локальный минимум в задаче, х е locmin /. Если все ее последовательные главные миноры чередуют знак, начиная с отрицательного, т.е. (— l)*det А^.^ >0, к = 1,... ,п, то точка доставляет локальный максимум, х 6 locmax/. b) Если не выполняются достаточные условия экстремума, то надо проверить выполнение необходимых условий — исследовать ее слабую знакоопределенность, т. е. посчитать главные миноры матрицы А — определители матриц размера к х к, составленных из строк и столбцов (агIiI • * ‘ \ ..........I . aWi ' • * ahik / Если матрица А не является неотрицательно определенной (А 0), т.е. не выполняется условие, когда все ее главные миноры неотрица- тельны, т.е. А|Ь..ц. >0, 1^1 ••• ik ft, fc = 1,... ,п, то точка х не доставляет локальный минимум, х £ locmin/. Если матрица А не является неположительно определенной (А 0), т. е. не выполняется условие, когда все ее главные миноры чередуют знак, начиная с неположительного, т. е. (-l)*At|...iJfc > 0, 1 < ij < ц < п, к = 1,..., п, то точка х не доставляет локальный максимум, £ £ locmax/. 1.4. Примеры Пример /. f(x) = f(x\, х2) = х* - х\х2 + х2- 2х\ 4- х2 extr. Решение. Необходимое условие локального экстремума I порядка: f'(x\ — 0 > &f(x) _ д/(ж) __ q , Г _ “ 2 = 0; дх\ дх2 \ ~Ж] + 2а?2 4-1 = 0. Решая эту систему уравнений, находим единственную стационарную точку х — (х\,х2) = (1,0). Для проверки условий II порядка выпишем матрицу вторых производных и проверим ее знакоопределенность: л - f = ( 2 \dxidxjJiJ=l \-i 2}’ (2 — 1 \ -1 2 ) = 3 > °* Матрица А по критерию Сильвестра положительно определена. По до- статочному условию экстремума функции нескольких переменных точка х доставляет локальный минимум функции /. Поскольку // ®2\2 Зж? \ lim f(x{,x2)= lim :--2»i 4- x2 I = -boo, |x|->4-oo |s|->oo \ X 2'4 /
§ 1. Конечномерные задачи без ограничений 25 то по следствию из теоремы Вейерштрасса абсолютный минимум в за- даче должен достигаться. Значит, точка £ будет доставлять не только локальный, но и абсолютный минимум, Smjn = /(1,0) = -1. Выше показали, что 5тах = +оо. Ответ. (1,0) € absmin, Зт;п = -1; Smax = +оо. Пример 2. f(x) = /(®|,Х2) = ®* + ®, - ®? - 2®i®2 - х* —> extr. Решение. Необходимое условие локального экстремума I порядка: = О = =0 *=* /4ач ~2ж1-2ж2=0, дх\ dxi (- 2ж| - 2x2 = 0. Вычитая из первого уравнения системы второе, получим 4Я| - 4®2 = 0 ж] = а?2 Я] = Х2- Подставляя Х2 = Xi в первое уравнение системы, находим Я] и ®2- - 2х\ - 2х\ = 0 х3 = Я| О Xi = -1; 0; ^ соответственно Х2 = -1; 0: 1. Получили три стационарные точки = (1,1), = (-1,-1), = (0,0). Для проверки условий II порядка выписываем матрицу вторых производных в каждой точке стационарности: Матрица ( до ) по критерию Сильвестра положительно опре- (10 — -2 до ) = 100 - 4 = 96 > 0. По достаточному условию локального экстремума функции нескольких пе- ременных точки (1,1) и (-1,-1) доставляют локальный минимум функции /. Поскольку lim f{x\, Х2) = lim (я? 4- - (х। -Ь Х2)2} = 4-оо, |х|-»+оо |s|->oo то по следствию из теоремы Вейерштрасса абсолютный минимум в задаче должен достигаться. Значит, эти точки будут доставлять не только локальный, но и абсолютный минимум, Smin = /(1,1) = -2. / -2 -2\ Матрица ( -2 ) по кРитеРию Сильвестра не является ни по- ложительно, ни отрицательно определенной: Л| = -2 < 0, — (-2 -2\ _2 ) = 0- Она является неположительно определенной ма- трицей (4 0) и не является неотрицательно определенной матрицей
26 Глава 1. Экстремальные задачи (4 0). Следовательно, не выполняется необходимое условие локально- го минимума. Поэтому £3 = (0,0) £ locmin/. Проверим, доставляет ли точка локальный максимум. Поскольку /(Л, -h) = 2h* > 0 = f(£3) при малых h Ф 0, то ж3 £ locmax/. Таким образом, точка (0,0) £ locextr/. Выше показали, что Smax = 4-оо. Ответ. (0,0) glocextr; (-1,-1),(1,1) G absmin, Smin--2; Smax = +oo. Пример 3. Найти экстремумы неявно заданной функции двух пере- менных хз = f(xi,X2), если F(®1, Х2, х3) = х। + + хз “ 2«| -Ь 2х2 - 4ж3 - 10 = 0. о \ 5/ дхз 9f дхз Решение. Частные производные -— = -— и -— = -— находим 9Х\ ОХ\ UX2 0X2 из уравнений: dF 9F дхз ( , ч дхз FXl := + л- • т2 = °> 2^-2+ 2ХЗ-4—^ = 0, дх\ ОХ3 дХ{ I дх\ . 9F dF 9х3 Л ,дх3 . W •= т----h д--т— = 0, I 2X2 4- 2 4- (2®з - 4)-— — 0. дх2 дхз дх2 ч 9x2 Необходимое условие экстремума I порядка: 9х3($) = 9хз(£) = (♦) Г 2^, - 2 = 0, f i&i = 1, дх\ 9x2 12^2 4-2 = 0, 1#2 = “1- Подставляя координаты и х2 в заданное уравнение F(x\, ®2, ®з) = 0, находим хз 1 + 1 + хз - 2 - 2 - 4ж3 - 10 = 0 <=> хз - 4ж3 - 12 = 0 <==> х3 = -2; 6. Таким образом, получаем две стационарные точки = (£1,#2,#з) = (1,-1,-2) иж2 = (£ь #2, #з) = (1, ~ 1,6) Для проверки условий II порядка надо выписать матрицу вторых производных в каждой стационарной точке. Дифференцируя первое уравнение правой части системы уравнений (♦) по х\ и Х2 с учетом 9х3 9х3 . условия -— = -— = 0, имеем 9х ] 9x2 9^х^ 2+(2l,-4fe;=0=* а2х3| = 1 52Xi I*' 4’ 52Хз I _ 1 02Х| L2 4’ (2хз-4) 02Хз дх\дх3 0=>_^2_| =_^| =0 дх\дх3 1л1 дх\дх3 к2
§ 1. Конечномерные задачи без ограничений # ... 27 Аналогично, дифференцируя второе уравнение правой части системы (*) по и я2, получим _ ^#2жз Л #2®з I 1 92®з| 1 2 + (2х,-4)— =0=»^, = ;. ^1,, = -^ д2х3 д2хз ~ Очевидно, что -—-— = -—-—. Таким образом, dxidx2 Матрица А|$! по критерию Сильвестра является положительно опре- деленной, а матрица 4|$2 отрицательно определенной. Поэтому по доста- точному условию второго порядка Sjocmin = ““2, Siocmax = 6. МОЖНО ПО- казать, что это будут не только локальные экстремумы, но и глобальные. Ответ. (1,-1) € locextr; (1,-1) £locextr, Smin = -2; Smax = 6. Приведем несколько примеров различных свойств экстремумов в за- даче без ограничений. Пример 4. Абсолютные минимумы и максимумы достигаются в беско- нечном числе точек'. /:R“> R, f(x) = sinx. Пример 5. Функция ограничена, абсолютный максимум достигается, минимум — нет\ /:R-R, = IT*' Пример 6. Функция ограничена, но абсолютные максимум и минимум не достигаются'. f : R -> R, f(x) = arctg®. Пример 7. Функция ограничена, имеет стационарные точки, но абсо- лютные максимум и минимум не достигаются'. f : R R, f(x) = (arctg®)3. Пример 8. Функция ограничена, имеет локальные максимумы и мини- мумы, но абсолютные максимум и минимум не достигаются’. f : R -* R, f(x) = arctgx • sin®. Пример 9. Ограничение функции, заданной на плоскости, на любую пря- мую, проходящую через начало координат, имеет в нуле локальный минимум, но вместе с тем начало координат не является точкой локального минимума'. / : R2 —» R, /(®ь®2) = (®1 -З®2).
28 Глава 1. Экстремальные задачи Действительно, на любой прямой вида xi = 01x2, а 6 R, функция f(otX2,X2) = (otX2 - Х2) (otX2 ~ 3^2) = х1(а ~ ~ За?2) = = х\ (а2 - 4аш2 + ЗШ2) >0 = /(0) при малых Х2> Значит, на любой прямой вида »i = 01x2 функции f имеет локальный минимум в нуле. Аналогично на прямой Х2 = 0 функ- ция f(x 1,0) = х2 имеет минимум в нуле. С другой стороны, на параболе = 2x1 Функция /(2х2, хг) = ~х2 < 0 в любой окрестности нуля. То есть точка х = 0 не является точкой локального минимума функции /. Пример 10. Имеется единственный локальный экстремум, не являю- щийся абсолютным. / : R2 —► R, /(ш|,®2) = ®?-®1 + 2е_х?. Необходимое условие экстремума I порядка в конечномерной задаче без ограничений: /'(х) = 0 df(x) = df(x) дх\ дХ2 2х\ — 4xie = 0, -2x2 — 0, ^1=0, < 2е~х> = 1 -х, = ln(l/2) = - In2 х, = ±Ип2; < X2 — 0. Получаем в задаче три стационарные точки = (0,0), х2 = (Vln2,0), А3 = (-Ип2,0). Для проверки условий II порядка надо выписать матрицу вторых производных в каждой стационарной точке: ащу dxidxj / • • । J /-2 J ,1 /41п2 0\ L>=(o,o) ’ \ 0 "2/ ’ I*2 “ \ 0 -2J ‘ / _ 2 о\ Матрица вторых производных I q -2 / в точке = (0,0) по кри- терию Сильвестра является отрицательно определенной: Aj = -2 < 0, А2 = 4 > 0. Поэтому по достаточному условию второго порядка стацио- нарная точка &х е locmax. Очевидно, что Sabcmax = 4-°о (/(£1,0) +°о при -Ьоо). ха /41п 2 0\ Матрица вторых производных I _2 / по критерию Сильве- стра не является ни положительно, ни отрицательно определенной и бо- лее того не является ни неположительно определенной матрицей (А 0)
§ 1. Конечномерные задачи без ограничений 29 и ни неотрицательно определенной матрицей (4^0). Следовательно, не выполняется необходимое условие ни локального максимума, ни ло- кального минимума. Поэтому стационарные точки х2, х3 £ locextr/. Поскольку /(0, £) = -t2 4- 2 —> -оо при t —► 4-оо, а /(£,0) = t2 4- _,2 2е —> 4-оо при t —> 4-оо, то Smjn = -оо и Smax = 4-оо. Значит, у функции / имеется единственный локальный экстремум в точке (0,0), не являющийся абсолютным. Ответ. (0,0) € locmax, (±Ип2,0) £ locextr; Smjn = -оо; Smax = 4-оо. Пример 11. Можно ли утверждать, что если функция одной переменной имеет в какой либо точке локальный минимум, то в некоторой достаточно малой окрестности этой точки слева от точки функция убывает, а справа возрастает? Нет. Контрпример: f(x) == ® + s*n «)* х Ясно, что £ = О Е absmin/. С другой стороны, в любой окрестности нуля и справа, и слева производная f(x) = 2х(2 4- sin |) - cos |, х Ф О, принимает как положительные, так и отрицательные значения, т. е. функция / и возрастает, и убывает. Пример 12. Имеется бесконечное число локальных максимумов, но нет ни одного локального минимума: / : R2 —► R, /(®1,ж2) = sinх\ - х2. Решение. Необходимое условие экстремума I порядка: df(x) __ df(x) _ f cossi = О, dxi 9x2 t -2x2 = О, 7Г Xj = — 4- kir, k Е Z, 2 х2 = 0. Стационарные точки хк = (| 4- кя, 0), к 6 Z. Для проверки условий II порядка выпишем матрицу вторых произ- водных: л — f \ _ /“Sinxi 0\ \dxidxj I . \ 0 Проверим знакоопределенность матрицы А в точках х2п = (| 4- 4-2тмг, 0), п Е Z: Л1^ = ( 0 -5)’ Л| = -1<0, 4|2 = 2>0. Матрица по критерию Сильвестра является отрицательно опре- деленной. Поэтому по достаточному условию локального экстремума
30 Глава 1. Экстремальные задачи х2п е locmax/. Поскольку f(xi,x2) = sina?i - х2 1 = /(#2п), то эти точки будут доставлять не только локальный, но и абсолютный максимум в задаче. Проверим знакоопределенность матрицы А в точках f2n+I = (| + 4-(2п 4- 1)%,0), п е Z: Л)’ = 1 > °’ = -2 < °’ Матрица вторых производных по критерию Сильвестра не явля- ется ни положительно, ни отрицательно определенной и более того не является ни неотрицательно определенной матрицей (А 0) и ни не- положительно определенной матрицей (А £ 0). Следовательно, не вы- полняется необходимое условие ни локального минимума, ни локального максимума. Поэтому точки #2n+I не являются ни точками локально- го минимума, ни точками локального максимума. Точки локального минимума могли быть только среди стационарных точек, но там их не оказалось. Следовательно, нет ни одного локального минимума. Поскольку /(0,f) = -t2 —> -00 при t —► 4-00, то Sabsmin “ “°0- Ответ. 4- (2п 4- 1)тг, о) £ locextr V п 6 Z; (у + 2шг,о) € absmax V n G Z, Sabsmax = 1; ^absmin = “°0- 1.5. Задачи В задачах 1.1-1.22 без ограничений найти стационарные точки, про- верить их на экстремальность, а также найти все локальные и глобальные минимумы и максимумы. 1.1. f(x\,x2) = 5ж2 4-4X1^2 4- - 16®i - 12®2 extr. 1.2. f(x\, х2) = х2 - х2 - 4®i 4- 6®2 extr. 1.3. f(x], х2) — Зя2 + х2 4- 4®1®2 ” Sei - 12ш2 —► extr. . , к 50 20 1.4. f(xi,x2) = х\х2 4---1-----► extr. Xj х2 1.5. f(xi,x2,x3) = х2 4- 2xl + хз ~ 2Х[Х2 - х\ 4- 2ш3 —> extr. 1.6. f(x\, x2f х3) = х2 +х2 4- х2 - Я1®2 4-Ж] - 2®з -* extr. 1.7. /(®i, х2,х3) = х2 4- х2 4- 2®2 4- Ж]Ж2 4- 2®1®з 4- 3®2®з ~ -* extr. 1.8. f(x\,х2,х3) = х2 + х2 4- 2®з 4- 4- Зш2«з - Si —► extr. 1.9. f(x},x2) = 3®i 4- 2х2 - х] - х2—> extr.
§ 2. Конечномерные гладкие задачи с равенствами 31 1.10. = ж? + - Зх|Х2 -> extr. 1.11. f(xltX2,X3) = х] + Х2 + Х3 + 12X1X2 + 2х3 -» extr. 1.12. /(X|,X2) = 3X|X2 - X?X2 - X1X2 -»extr. 1.13. /(xi,X2) = x| + x* - (xi 4- X2)4 —» extr. 1.14. /(xj, X2) = 2xf 4- X2 - xj - 2xj -»extr. 1.15. 7(xi,X2) = X|X3ln(x|4"x^)-»extr. 1.16. /(xj, X2) = x?xl(6 - X| - X2) —> extr. 1.17. f(x\,X2) = e2l|+3®2(8x2 - 6x1X2 4- 3x2) -+ extr. 1.18. /(xl(X2) = eI|-®2(5 - 2X| 4- x2) —► extr. 1.19. /(x1.x2.x3) = xiX2X3(7 - xj - 2x2 - Зх3) -»extr. 1 1.20. f(x],X2) = y*(t2 4-Xji 4-X|)2dt —* min. — 1 (задача о полиномах Лежандра второй степени) 1 1.21. /(ж|,Ж2,жз) — J(t3+ xit2+X2t + x\)2dt—>mn. — 1 (задача о полиномах Лежандра третьей степени) 1.22. Найти экстремумы неявно заданной функции двух переменных х3 = f(x 1, Ж2), если Г(® 1, х2, х3) — х2 + х2 -Ь х] - Ж1Ж3 - Ж2Ж3 4- 2х] 4- 2х2 -Ь 2®3 - 2 = 0. § 2. Конечномерные гладкие задачи с равенствами В этом параграфе даются необходимые и достаточные условия экс- тремума в гладкой конечномерной задаче с ограничениями типа равенств. 2.1. Постановка задачи Пусть fi : Rn —► R, » = 0,1(... ,m, — функции п переменных, ото- бражающие пространство Rn в R Считаем, что все функции fi обладают
32 Глава 1. Экстремальные задачи определенной гладкостью. Гладкой конечномерной экстремальной задачей с ограничениями типа равенств называется следующая задача: /о (ж) extr; = г = 1,...,т. (Р) Таким образом, в задаче (Р) ищутся экстремумы функции на множестве, задаваемом конечным числом ограничений типа равенств. 1.1. Необходимые и достаточные условия экстремума 2.2.1. Принцип Лагранжа Сформулируем необходимое условие экстремума I порядка в гладкой конечномерной задаче с ограничениями типа равенств — принцип Ла- гранжа. Теорема. Пусть х Е locextr Р — точка локального экстремума в за- даче (Р), а функции fi, i = 0,1,... , m, непрерывно дифференцируемы в окрестности точки х (условие гладкости). Тогда существует ненулевой вектор множителей Лагранжа А = (Ao, Aj,..., Am) € Rm+1, А / 0, такой, т что для функции Лагранжа задачи (Р) Л(ж) = 52Aj/t(») выполняется «=о условие стационарности Лх(ж) = 0 <=> = 0, j = ^Xifi(x) = Q. дх> Это соотношение называется условием стационарности. Точки, удо- влетворяющие условию стационарности, называются стационарными. Доказательство проведем от противного. Предположим, что условие стационарности не выполняется. Это означает, что векторы \ дх\ ’ ’ дхп / i = 0,1,... ,тп, линейно независимы. Поэтому ранг матрицы dXj ) / W) \ dfQ(x) \ 9xn / равен m+1. Тогда по теореме о ранге матрицы (см. [15, с. 71]) существует матрица М порядка (m+1) х (тп+1) с определителем, отличным от нуля.
§ 2. Конечномерные гладкие задачи с равенствами 33 Допустим для определенности, что этой матрицей является матрица, составленная из первых столбцов матрицы Л: / д/о(£) df0(£) \ дХ\ ^®т+1 м = , detAf^O. \ дХ\ дхт+\ / Не ограничивая общности, считаем, что /о(&) = 0- Действительно, если /о(&) #= 0, то следует рассмотреть функцию /о (я) = /о(я) - /о(^) и для нее будет выполняться условие /0($) = /о(^) - /о($) = 0, а условия стационарности и точки экстремума для функций /о и /о одинаковы. Для вектора х = (ж|,...,положим F(x) = (Р0(ё), • • •, Рт(я)) = Тогда функция F отобра- жает некоторую окрестность точки х = ($i,...,£m+i) 6 Rm+I в Rrn+I и является (в силу условий гладкости теоремы) непрерывно дифферен- цируемым отображением в этой окрестности и F(x) = у — 0 в силу допустимости точки ж. Кроме того, якобиан отображения F в точке х отличен от нуля, т. е. --------- । = det I -- I dXj / V QXi J »=0,l.m = detM/0. По теореме об обратной функции в конечномерных пространствах (см. следующий пункт) существует обратное отображение F"1 некоторой окрестности точки $ = 0 в окрестность точки х такое, что F-1 (£ = 0) = х и |F-1 (у) - F-,(#)l К\у - |F-i(y) - х| с некоторой кон- стантой К > 0. В частности, для достаточно малого по модулю е определен вектор х(е) F“!(e,0,... ,0), для которого |ж(е) - ж| К|е|. Это означает, что F(x(e)) = (е,0,...,0), что равносильно равенствам /о(ж(€),£то+2,•••,#«) = е, Л(ж(г),£то+2,---,£п) = 0, i = 1,...,тп. Таким образом, для вектора ж(е) = (ж] (е),..., xm+i(e), #m+2, *.., &п) выполня- ются условия /о(ж(е)) = е, Л(ж(е)) = 0, i = (1) и при этом |x(e)-f|^Kk|. (2) Из соотношений (1)-(2) следует, что вектор £ не доставляет в задаче экстремума, ибо вблизи его существуют допустимые векторы х(е), на которых функционал /о принимает значения как большие так и меньшие чем fo(x) (напомним, что /о(^) = 0)- Получили противоречие с тем, что £ Е locextr Р. Таким образом, наше предположение (противного) неверно и тем самым теорема доказана. я
34 Глава 1. Экстремальные задачи 2.2.2. Конечномерная теорема об обратной функции Теорема (конечномерная теорема об обратной функции). [19, т. 1, с. 455.] Пусть F :U -* Rn — непрерывно дифференцируемое отображение некоторой окрестности UCRn точки £ в Rn, F(£) — £ и якобиан отобра- ( fdFi(£)\n \ жения F в точке £ отличен от нуля I det F (z) = det I —-) / 0 ). \ \ “Жу / Тогда существует обратное отображение F-1 некоторой окрестности V точки § в окрестность точки ж такое, что F~x(y) — х и |г'1(1/)-г",(^)|^к|у-^| vj/er с некоторой константой К > Q. 2.2.3. Необходимое условие экстремума II порядка Сформулируем необходимое условие минимума II порядка в гладкой конечномерной задаче с ограничениями типа равенств. Теорема. Пусть х 6 locmin Р — точка локального минимума в задаче (Р), функции /,•, г = 0,1,..., rn, дважды непрерывно дифференцируемы в ок- рестности точки % (условие гладкости), dimlin !) {/[(#),• • •, = т (условие регулярности). Тогда существует множитель Лагранжа А = (1, А],..., Am) 6 Rm+I такой, что для функции Лагранжа задачи (Р) т = /0(®)+52 А«л(®) г=1 выполняются условия стационарности*, т Л'(«) = о + 52 л,•;/($) = о «=1 и неотрицательной определенности матрицы вторых производных*. > О УЛ G К := {{/(£),h) = 0, i = 1....m}. Доказательство. Поскольку & G locmin P, то для задачи (P) гладкой конечномерной задачи с равенствами выполняется принцип Лагранжа. Согласно нему существует ненулевой вектор множителей Лагранжа А = (Ао, Ai,...,Am) 6 Rm+l, А / 0, такой, что для функции Лагранжа Л(ж) = m тп 5Z выполняется условие стационарности 52 A,/-(f) = 0. В силу г=0 г=0 условия регулярности вектора /[(*),...,/»(*) линейно независимы. Поэтому Ао / 0 и, следовательно, можно положить Ао = 1. Тем самым условие стационарности с множителем Лагранжа Ао = 1 доказано. lin означает «линейная оболочка».
§ 2. Конечномерные гладкие задачи с равенствами 35 Докажем условие неотрицательности. Возьмем вектор h 6 К. Тогда по теореме о касательном пространстве (см. §5.4) вектор h в точке х является касательным к множеству допустимых элементов в задаче (Р) D = {х е Rn | f\(x) = ... = fm(x) = 0}. По определению касательного вектора существуют число е > 0 и отображение т : [-е; е] —► Rn такие, что /1 (£ + th + r(t)) = ... = fm(£ + th + r(t)) = 0 для любого t € [-e; e] и \r(i)\ = o(t) при t —► 0. Таким образом, z + th + r(t) — допустимый элемент в задаче (Р) при t 6 [-£; е] и, так как $ € locminР, то /о(&) Поэтому по определению функции Л и формуле Тейлора /о(*) f<№ + th + r(t)) = Л(х + th + r(t)) - + th + r(0) = 1=1 = A($) + (b!(&),th + r(i)) + |(Л"(£)(£Л + T(t)),th + r(t)} + o(?) = #2 = /(*) +у <A"(*)M) + oC2). t2 Отсюда у (Aw(£)ft,ft)+o(i2) > 0 при малых t. Разделим обе части послед- него неравенства на t2 и устремим t к нулю. Получим (Л"(£)/&,Л) 0. Мы сформулировали необходимое условие минимума. Необходимое условие максимума формулируется аналогично, за исключением того, что множитель Лагранжа Л = (-1,Л|,...,Ат) 6 Rm+I и соответственно m функция Лагранжа Л(ж) = -/о(®) + S A,/j(a:). • 1=1 2.2.4. Достаточное условие экстремума II порядка Сформулируем достаточное условие минимума II порядка в гладкой конечномерной задаче с ограничениями типа равенств. Теорема. Пусть функции fa, г = 0,1,... ,т, дважды непрерывно диф- ференцируемы в окрестности точки £ (условие гладкости), dimlin {/[(#), • ••,/т(£)} = т (условие регулярности), существует множитель Ла- гранжа А = (l,Ai,...,Am) 6 Rm+I такой, что для функции Лагранжа т задачи (Р) Л(я) = /o(#)+S выполняются условия стационарности: i=i A'(f) = 0 = 0 i=l и положительной определенности матрицы вторых производных: (Л"(£)Л,Л}>0 =0, Тогда х G locmin Р — точка локального минимума в задаче (Р).
36 Глава 1. Экстремальные задачи Доказательство. Применяя лемму о правом обратном отображе- нии (см. § 5.4) к линейному оператору А := Ff(x) := (/{(&),..., • Rn ™Rm, действующему по формуле Ah = ((/{(ж), h),..., h)), построим оператор M : R™ —> Rn такой, что AoM = Iw, \Му\ С\у\ VyeRm. Возьмем х + h — допустимый элемент в задаче (fi(x + ti) = ... = fm(x -Ь ti) = 0). Положим /&2 := M(Ah) и обозначим hi := h - Д2. Тогда Ah\ = A(h -h2) = Ah - А oM(Ah) = Ah - Ah = 0. Значит, hi 6 Ker A. По формуле Тейлора 0 = F(& + h) = F(x) + Г'(£)Л + |в"(4)[Л,Л] + о(|Л|2). Отсюда существует б > 0 такое, что 1 I Ah\ = |У(А)Л| = -~F"(£)[h,h] + о(|Л|2) < С,|Л|2 У|Л| <6 2 с некоторой константой С\ > 0. Поэтому |Л-г1 = |Л£ЛЛ| С|ЛЛ| СС\|Л|2 СС|0|Л| = е|Л| при е - СС\6 и |Л| - |Л2| |Л,| = |Л - Л2| |Л| + |Л2| (1 -е)|Л| < |ft,| (1 + е)|Л|. Вновь по формуле Тейлора /о(Л + л) = Л(4 + Л) = Л(Л) + (Л'(Л),Л) + + о(|Л|2) = + + o(\h\2). Отсюда, обозначая В := ||Л"(ж)||, имеем /о(л + л) - ш = + Л2)Л1 + Л2) + о(|Л|2) = = 1((Л''Л|)Л|) + 2(Л"Л1)Л2) + (Л"Л2)Л2>) +о(|Л|2) > > I2 - 2В|Л, I • |Л2| - В|Л212) + о(|Л|2) > ||Л|2 (а( 1 - г)2 - 2В(1 + е)е - Be2) + о(|Л|2) > 0 при достаточно малых е > 0 (при е = 0 множитель в круглых скобках равен а > 0). Из последнего соотношения следует, что х 6 locminР. Мы сформулировали достаточное условие минимума. Достаточное условие максимума формулируется аналогично, за исключением того, что множитель Лагранжа А = (-1, А|,..., Ат) £ Rm+l и соответственно m функция Лагранжа Л(х) — -/о(®) + 53 «=1
§ 2. Конечномерные гладкие задачи с равенствами 37 2.3. Правило решения Для решения гладкой конечномерной задачи с ограничениями типа равенств следует: 1) Составить функцию Лагранжа m А(®) = t=0 2) Выписать необходимое условие экстремума I порядка — условие стационарности функции Лагранжа: m А'(£) = 0 <=* £а,/?(*) = 0. i=0 3) Найти точки ж, удовлетворяющие условию стационарности (эти точки называются стационарными). При этом следует отдельно рассмот- реть случаи: а) До == 0, Ь) До = 1 (или любой положительной константе), с) Ао = -1 (или любой отрицательной константе). В случае а) стационар- ные точки могут доставлять и минимум, и максимум в задаче. В случае Ь) стационарные точки могут доставлять минимум в задаче. В случае с) стационарные точки могут доставлять максимум в задаче. 4) Найти решение среди стационарных точек или доказать, что его нет. При этом можно пытаться воспользоваться непосредственной про- веркой или перейти к исследованию условий экстремума II порядка в каждой стационарной точке. Выписать матрицу вторых производных А"(£) и пространство L = {ft 6 Rn| {/?(*), ft) = 0, i = Проверить выполнение достаточных условий экстремума — положи- тельную определенность матрицы вторых производных: (А"(А)Л,Л) >0 VfteL, л#о. Если это условие положительности выполняется, то точка ж доставляет в случае Ь) локальный минимум в задаче (х 6 locmin Р); в случае с) локальный максимум в задаче Е locmaxP). 5) Если не выполняются достаточные условия экстремума, то надо проверить выполнение необходимого условия экстремума — неотрица- тельную определенность матрицы вторых производных: (А"(£)Л,Л)>0 VhGL. Если это условие неотрицательности не выполняется, то точка х не до- ставляет в случае Ь) локальный минимум в задаче (ж £ locmin Р); в случае с) локальный максимум в задаче £ locmaxP).
38 Глава 1. Экстремальные задачи 2.4. Примеры Пример 1. 4Ж1 + Зж2 -* extr; х2 4- ж2 = *• Решение. Функция Лагранжа Л = Ao(4o?i 4- Зж2) 4- А(ж2 4- ж2 - 1). Необходимое условие локального экстремума: __л f Лх| — 0, у ( 4Ао 4- 2Лз?1 —- О, и (ЛХ2=0, I ЗЛо + 2Лж2 = 0. Если Ао = 0, то А / 0. Тогда из предыдущих уравнений вытекает, что = х2 = 0, но эта точка не является допустимой. Полагаем Ао = -1. Тогда a?i = 2/А, х2 = 3/(2А). Подставляя Х\, х2 в ограничение х2+х2 = 1, получаем, что 4 9 5 -+^=1^25=4А^А=±-. /4 3\ / 4 3\ Соответственно имеем две стационарные точки I -, - \, I - -, - - I. По теореме Вейерштрасса (в силу компактности единичной окружно- сти) существуют решения задач на максимум и минимум. Рассматривая значения функционала в стационарных точках, получаем: /4 3\ \ 5’ 5 / Е absmaX> 5rnax = 5. / 4 3\ {) Cabsmin, Smin = -5. Пример 2. (Ах,х) —► extr; (х,х) = 1 (х Е R”, А = (ау)"J==i — сим- метричная матрица). Решение. Существование решения задач на минимум и на максимум следует по теореме Вейерштрасса, поскольку сфера Sn~l = {х Е Rn | |ж|2 = {х,х) = 1} компактна. Функция Лагранжа Л = Ао(Ах, х} 4- А((ж, х} - 1). Необходимое условие локального экстремума: Л' = 0 <=> АоЛж -Ь Хх = 0. Если Ао = 0, то А 0. Тогда из условия стационарности £ = 0, но эта точка не является допустимой. Полагаем Ао — — 1. Тогда Ах = Хх. Таким образом, стационарные точки — собственные вектора матрицы А. Домножив соотношение А^ = А£ на £, получим, что {А£,£) = Х{£,£) = А. Значит, решение задачи на минимум — собственный вектор матрицы Л, соответствующий наименьшему собственному значению, решение задачи на максимум — собственный вектор матрицы А, соот- ветствующий наибольшему собственному значению.
§ 2. Конечномерные гладкие задачи с равенствами 39 2.5. Задача Аполлония Древнегреческим ученым Аполлонием (III-I1 век до н. э.) в книге «Конические сечения» решается задача о проведении из некоторой точки к эллипсу самого длинного и самого короткого отрезка (см. рис. 2). При этом он решает даже более общую задачу, определяя все проходящие через эту точку отрезки, перпендикулярные, к эллипсу. Решим задачу Аполлония с помощью метода Лагранжа неопределенных множителей. Формализованно задача записывается следующим образом: /о(®1,®г) = (®t - 6)2 + (®2 “ 6)2 -> extr; /1(®ь®2) = (^) + ("“) “1=0 (а, > а2 > 0) (здесь рассматривается эквивалентная задача об экстремуме квадрата расстояния). Функция Лагранжа Л = Ао((»| - £])2 4- (®2 - 6)2) + аГ4- (—) - 1^) • \ ха] / \й2' / Необходимое условие локального экстремума — условие стационар- ности: А,. = 0 <=> А0(ж,- - £,) 4- А = 0, г = 1,2. ai Если Ао = 0, то А Ф 0, так как не все множители Лагранжа нули. Тогда — Х2 = 0, но эта точка не лежит на эллипсе. Полагаем Ао = 1. Тогда х^ — i = 1,2. Подставляя эти значе- а- 4-А ния Xi в уравнение эллипса, получаем <> Относительно А это алгебраическое уравнение четвертой степени. Поэтому число действительных корней уравнения не более четырех, и, значит, число стационарных точек задачи не более четырех. Каждому корню А соответствует своя стационарная точка х. График функции у?(А) £? А2 схематически изображен на рис. 3. Если ю(0) = 4- > 1, то точка а>2 (6,6) лежит вне эллипса. Этот случай и изображен на рисунках 3 и 4. Эллипс — ограниченное и замкнутое (т.е. компактное) множество. По теореме Вейерштрасса решение задач на минимум и максимум суще- ствует. Для полного решения задачи надо решить уравнение (1), получить А,-, найти соответствующие точки ж(Аг), подставить эти точки в /о и най- ти наименьшее и наибольшее из полученных значений функционала.
40 Глава 1. Экстремальные задачи Xi Xi Условия стационарности - £г 4- А-у = 0 О & - = А-у, i — 1,2, а? а? имеют очевидный геометрический смысл: вектор £ - я пропорциона- лен вектору-градиенту функции /f в точке х, т. е. лежит на нормали к эллипсу. Этот факт был впервые установлен Аполлонием. Выведем из полученных нами соотношений уравнение кривой, «разделяющей» те точки £, из которых можно провести две нормали, от точек, из ко- торых можно провести четыре нормали. Очевидно, что это разделение происходит для А, удовлетворяющих соотношению (1), для которых Обозначим а, 4- А = А(^а\)2^3, тогда из соотношения (2) можно найти, что а] 4- А = -Af&ai)2/3- Из последних двух уравнений, вычитая Л2 Л2 — й2 из первого второе, найдем, что А = ———тт—ггтг. Подставляя (£1«1)2/3 4- (6а2)2/3 вначале в уравнение (1) а2 4- А, а2 4- А, а затем и А, получаем уравнение разделяющей кривой: «77Й5 + «77W = 1 ~ + ~ А (£1«1) ' А \Ьа2) ' <=> (€i«i)2/3 + (М2/3 =-------- ' ((6«1)2/3 + to)273) <=> (£iai)2/3 + (6а2)2^3 =: (<4 - а2)2^3.
§ 2. Конечномерные гладкие задачи с равенствами 41 Это уравнение астроиды. Вне астроиды каждая точка имеет две нормали к эллипсу, внутри нее — четыре, на самой астроиде — три (за исключе- нием вершин, где имеются две нормали (рис. 4)). Докажем, что касательная к астроиде перпендикулярна к эллипсу в точке ее пересечения с эллипсом (рис. 5). Обозначим точку на астроиде через £. Пусть х — точка на эллипсе такая, что вектор х-£ перпендику- лярен к эллипсу. Для доказательства утверждения достаточно показать, что вектор х-£ перпендикулярен нормали п к астроиде в точке £. По доказанному выше Х{ = —-, и, значит, я; + А _ > _ ( \ __ ( А£2 \ \я24-А ^al + A / \ а* 4-A’ aj + A/ Нормалью к астроиде (£i Я|)2^3 4- (fcaj)^3 = (ai ~ Я3)2/3 в точке £ явля- ется вектор пропорциональный градиенту функции ^(£i,£2) = (6ai)2^3 + (Сг^а)2/3, т. е. вектор п = ^3<|У3)* Возьмем скалярное про- изведение векторов ж - £ и п: , ( s W/3a2/3 Afc^a2'3 Л(6в|)2/3 А(&а2)2/3 — £, П) =----5-------------5 ;--- =------=-----------з--;— = Я| -|- А Я3 4" А Я| 4~ А Я3 4~ А (подставим значения я2 4- А, выраженные через А и (&я,)2/3) = A(6a,)2/3 _ А(£2а2)2/3 = _А А •4(^1 ei)2^3 --А(6в2)2^3 А Скалярное произведение векторов равно нулю, следовательно, вектора х - £ и п перпендикулярны.
42 Глава 1. Экстремальные задачи 2.6. Задачи 2.1. ж, + ^2 —> extr; 3®| + 4x2 = 1- 2.2. eXlX2 -»extr; Xt + = 1. 2.3. Ж| + Х2 -+ extr; 5х2 + 4®i®2 + х% = 1. 2.4. х2 + 12ж I ж2 + 2х2 “* extr; 4х2 + х% = 25. 2.5. х2 + + ®з —► extr; Xi + Х2 + Xj = 1. 2.6. ®i + 2x2 + Зхз -+ extr; х2 + х2 + х2 = 1. 1 2.7. х2 + х2 + х2 -♦ extr; X| +Х2 +®з = 1, ®| +®2 - = 2' 2 2.8. 2Ж| - 6ж] - 6^2 - Зж3—> extr; otj — ж2Ч-ж3 =0, 5Ж| + Х2~2х3 = 1. 2.9. + Х2 + -* extr; Xi + ж2 - хз = h ж? + 4 + жз = 1- 2.10. х\х2 + ж2ж3 —> extr; xj + z2 = 2, х2 + ®з = 2. 2.11. Ж|»2жз -> extr; xj 4- xj + xj = 1, Ж| + ж2 4- я3 = 0. 2.12. x। + xj + xj -♦ extr; xj 4- (®2 - 3)2 4- (»з - 4)2 = 1. 2.13. Xjж2®з —► extr; Xi + ®2 4- ®з = 1. 2.14. ®i®2®3 extr; xj 4- xj 4- xj = 1. 2.15. Найти минимум линейной функции f(x) = (а,х}, а,х 6 Rn, на единичном шаре (ш, х) = 1. 2.16. Найти расстояние от точки х 6 Rn до гиперплоскости (а,®) = Ь, aeRn, bGR. 2.17. Найти расстояние от точки х Е Rn до прямой х = at 4- b, a, b Е R”. 2.18. Найти максимальную площадь прямоугольника со сторонами, па- ж2 xj раллельными осям координат, вписанного в эллипс 4- = 1- 2.19. Найти максимальный объем прямоугольного параллелепипеда со сторонами, параллельными осям координат, вписанного в эллип- 2 2 2 Х2 ®3 соид 4 + 4 + 4 af aj aj = 1. 2.20. Решить задачу Аполлония для параболы. 2.21. Решить задачу Аполлония для гиперболы.
f - ... § 3. Конечномерные гладкие задачи с равенствами и неравенствами 43 § 3. Конечномерные гладкие задачи с равенствами и неравенствами В этом параграфе даются необходимые и достаточные условия экс- тремума в гладкой конечномерной задаче с ограничениями типа равенств и неравенств. 3.1. Постановка задачи Пусть : Rn —» R, 1 = 0,1,... ,тп, — функции п переменных, ото- бражающие пространство R” в R. Считаем, что все функции обладают определенной гладкостью. Гладкой конечномерной экстремальной задачей с ограничениями типа равенств и неравенств называется следующая задача в R”: /о(я) —* min; 0, i=l,...,m', fi(x) = 0, i = т 4- 1,... ,тп. ( ) В задачах, где имеются ограничения типа неравенств, важно, рассма- триваемая задача на минимум или максимум. Для определенности мы будем рассматривать задачи на минимум. 3.2. Необходимые и достаточные условия экстремума 3.2.1. Принцип Лагранжа Сформулируем необходимое условие экстремума I порядка в гладкой конечномерной задаче с ограничениями типа равенств и неравенств — принцип Лагранжа. Теорема. Пусть & 6 locmin Р — точка локального минимума в задаче (Р), а функции fi, i = 0,1,... ,тп, непрерывно дифференцируемы в окрест- ности точки £ (условие гладкости). Тогда существует ненулевой вектор множителей Лагранжа А = (Ао, А|,..., Am) € Rm+I, А / 0, такой, что для т функции Лагранжа задачи (Р) Л(я) = 52 выполняются условия'. 1=0 а) стационарности'. л'(ж) = 0 <=> = 0, j = 1.....п <=> А,//(4) = 0; dxi 7^ Ь) дополняющей нежесткости'. = 0, i = 1,... с) неотрицательности'. Aj > 0, i = 0,1,..., mf. Доказательство этой теоремы в более общем случае см. ниже. Точки, удовлетворяющие необходимым условиям локального экстре- мума, называются критическими. В задаче на максимум Ао 0.
44 Глава 1. Экстремальные задачи Отметим, что в задаче (Р) с ограничениями типа равенств и нера- венств ограничения типа равенств можно было бы не писать, заменив любое из равенств /(») — О о 0 < f(x) < 0 двумя неравенствами f (х) О, -f(x) 0. Упражнение. Докажите, что при такой замене ограничения типа ра- венства двумя неравенствами, принцип Лагранжа в обеих задачах дает одни и те же критические точки. 3.2.2. Необходимое условие экстремума П порядка Сформулируем необходимое условие минимума II порядка в гладкой конечномерной задаче с ограничениями типа равенств и неравенств. Теорема. Пусть х е locmin Р — точка локального минимума в за- даче (Р), функции fi, i = дважды непрерывно дифференциру- емы в некоторой окрестности точки £ (условие гладкости), векторы ..., fm(x) — линейно независимы (условие регулярности). Тогда существует множитель Лагранжа Л = (A0,Ai,... ,Am) 6 Rm+1 такой, что для функции Лагранжа задачи (Р) Л(х, А) - 5? А»Л(«) г=0 выполняются условия экстремума I порядка'. д) стационарности'. Ла.(Л,А) = 0 <=> д^’~ 0, j = <=> = 0; 9xi b) дополняющей нежесткости: Xifi(x) = Q, i = \,...,m; с) неотрицательности'. A, 0, i = 0,1,... ,m; и max(Axx(x,X)h,h) >0 VheK, где K := R" | {Л(£),Л) ^0, i = = 0, i = m + 1,... ,m| — конус допустимых вариаций, а С — совокупность множителей Ла- гранжа А, для которых выполнены условия а)-с).
§ 3. Конечномерные гладкие задачи с равенствами и неравенствами 45 Доказательство этой теоремы см. в § 8. Мы сформулировали необходимое условие минимума. Необходимое условие максимума формулируется аналогично, за исключением того, что множитель Лагранжа Ао 0 и соответственно в конусе допустимых вариаций > 0. 3.2.3. Достаточное условие экстремума II порядка Сформулируем достаточное условие минимума II порядка в гладкой конечномерной задаче с ограничениями типа равенств и неравенств. Теорема. Пусть функции fi, г = 0, дважды непрерывно диф- ференцируемы в некоторой окрестности точки х (условие гладкости), векторы — линейно независимы (условие регулярно- сти), существует множитель Лагранжа А = (Ао,..., Am) е Rm+1 с Ао = 1 такой, что для функции Лагранжа задачи (Р) т А(®, А) = £2 i=0 выполняются условия экстремума I порядка: а) стационарности: MM) = 0 <=> =0, з = 1,...,п £>//(А) = 0; to b) дополняющей нежесткости: Xifi(£) = 0» i = 1,..., m; с) неотрицательности'. А;>0, » = 0,1.....m'; и max (Л1Ж(А,А)Л,Л) > а|Л|2 УЛ € К с некоторой положительной константой а, где К := {л G R" I (/•(£),Л) s; 0, i = 0,1,... ,т', (/,•(£),Л} = 0, t = mz + 1,... — конус допустимых вариаций, а С — совокупность множителей Ла- гранжа А, для которых выполнены условия а)-с) с Ао = 1. Тогда z Е locmin Р — точка локального минимума в задаче (Р). Доказательство этой теоремы см. в § 8. Достаточное условие максимума формулируется аналогично, за ис- ключением того, что множитель Лагранжа Ао = -1 и соответственно в конусе допустимых вариаций (/о(^)>^) 0.
46 Глава 1. Экстремальные задачи 3.3. Правило решения Для решения гладкой конечномерной задачи с ограничениями типа равенств и неравенств следует: т 1) Составить функцию Лагранжа А(ж) = i=0 2) Выписать необходимое условие экстремума I порядка: а) стационарности: A'(f) = О 4=> = О, ; = uXj b) дополняющей нежесткости: = 0, i= с) неотрицательности: А, > 0, г = 1,... ,пг'. 3) Найти точки ж, удовлетворяющие условиям а)-с) (эти точки назы- ваются критическими). При этом следует отдельно рассмотреть случаи а) Ао = 0; Ь) Ао = 1 (или любой положительной константе); с) Ао = -1 (или любой отрицательной константе). В случае а) критические точки могут доставлять и минимум, и мак- симум в задаче. В случае Ь) критические точки могут доставлять минимум в задаче. В случае с) критические точки могут доставлять максимум в за- даче. При нахождении критических точек в условиях дополняющей не- жесткости At/t(f) = 0 для каждого i надо рассматривать два случая: А, = 0 и А, / 0. 4) Исследовать на локальный и абсолютный экстремум найденные критические точки или, если их нет, найти Smin и Smax и указать по- следовательности допустимых точек, на которых эти абсолютные экстремумы достигаются. При этом можно пытаться воспользоваться непосредственной про- веркой или перейти к исследованию условий экстремума II порядка в каждой критической точке. Отметим, что проверка выполнения необ- ходимых или достаточных условий экстремума в задаче с ограничениями типа равенств и неравенств — задача непростая. Поэтому, как правило, мы будем при исследовании экстремума использовать непосредственную проверку, сравнивая значение исследуемой функции в критической точке с ее значениями в близких допустимых точках.
§3. Конечномерные гладкие задачи с равенствами и неравенствами 47 3.4. Примеры Пример 1. х2 + + хз mini 2ж1 “ х2 + хз 5, 4- ж2 + хз = 3. Решение. Функция Лагранжа Л = А0(ж? 4- х2 4- х2) 4- А।(2Ж1 - х2 + х3 - 5) 4- А2(ж| 4- х2 4- х3 - 3). Необходимые условия локального минимума: а) стационарности: Лж, = 0 <=> 2Ао»| 4* 2А । -ь А2 = О, л' = о {2Ao»i 4“ 2А1 4- А2 = О, 2Ао®2 ~ А| 4- А2 = О, 2Ао®з 4~ А । 4- А2 = 0; Ь) дополняющей нежесткости: Ai(2a?i - х2 4- х3 - 5) — 0; с) неотрицательности: Ао >0, А| > 0. Если Ао = 0, то из уравнений пункта а) выводим, что А| = А2 = 0 —• все множители Лагранжа — нули, а этого быть не может. Поэтому Ао ф 0, полагаем Ао = 1/2. Предположим Aj / 0, тогда в силу условия b) 2ж] - х2 4* х3 - 5 = 0. Выразим , х2, х3 из условия а) через А|,А2: = -2А! -А2, х2 = А| -А2, х3 = -А|-А2, и подставив в уравнения 4-а?2+я?з = 3, 2я] -ж24-яз = 5, получим, что Г — 2А। — А2 4~ А| — А2 — А| — А2 = 3, ч ( —2А| — ЗА2 = 3, | -4А| — 2А2 — А1 4- А2 — А। — А2 = 5, ( -6Аi - 2А2 = 5, 9 откуда А| = -— < 0 — противоречие с условием неотрицательности Ь). г» 9 * * * * 14 Значит, в случае А| 0 критических точек нет. Пусть А| = 0. Тогда Х\ = х2 = х3 = -А2. Подставляя Х{ = -А2 в равенство х\ 4* х2 4- х3 = 3, получаем, что -ЗА2 = 3 Ф А2 = -1 => Zi = х2 = х3 = 1 — единственная критическая точка. Функция f(x) = х2 4- xj 4- х2 —► оо при |ж| —> оо, значит по след- ствию из теоремы Вейерштрасса решение задачи существует, а в силу единственности критической точки решением может быть только она. Итак, £ = (1,1,1) е absmin, 5т|П = 3. Пример 2. Приведение квадратичной формы к главным осям. Пусть А = — симметричная матрица (а^ = aji) и Q(x) = п QijXiXj = {Ах, х) — соответствующая ей квадратичная форма. tj=i
48 Глава 1. Экстремальные задачи Теорема. В пространстве R” существует ортонормированный базис , fn, в котором квадратичная форма Q имеет представление п Q(x) = Дг(ж> Л) • г=1 В базисе /1,... ,fn матрица формы Q диагональна. Направления векторов называются главными осями формы Q, а переход к базису /1,..., fn называется приведением формы к главным осям. Доказательство. Если Q = 0, то Aj —... = Хп = 0, /1,..., fn — любая ортонормированная система. Пусть Q 0, тогда Q принимает положительные или отрицательные значения. Для определенности считаем, что Q принимает отрицательные значения. Рассмотрим первую экстремальную задачу {Ах,х) -* min; {х,х) 1. (Pi) Если Q принимает только неотрицательные значения, то надо рассма- тривать задачу на максимум. Решение х = /] задачи (Pi) по теореме Вейерштрасса существует, так как шар В = {х € Rn | {х,х} 1} является компактом в Rn, а функция (Ах,х) непрерывна. Функция Лагранжа задачи (Pi) А = Ао(Ах,ш) -Ь А((ш,ш) - 1). Необходимые условия минимума: а) стационарности: Хх = 0 <=> AqA/i + Xf\ = 0; b) дополняющей нежесткости: A((/i,/i) - 1) = 0; с) неотрицательности: Ао > 0, А > 0. Если Ао = 0, то А / 0 и из пункта а) выводим, что f\ = 0, но это про- тиворечит условию Ь). Поэтому Ао Ф 0, полагаем Ао = 1. Тогда из a) Af\ — -Xf\. Умно- жая последнее равенство скалярно на /1, получим, что (A/i,/i) = -A(/i,/i) - Smin < 0. Отсюда А > 0 и по условию b) (/i,/i) = 1. Таким образом, /1 — собственный вектор матрицы A, Af\ = Aj f\ (Ai = -A), |/j | — 1, Smin = Ai, Aj — минимальное собственное значение матрицы А. Обозначим L\ = {ж 6 Rn | (ж,/1) = 0} — подпространство в Rn. Если Q(x) = 0 Уя е Z/i, то Аз = ... = Хп = 0, /2, • • * > — любая ортонормированная система из L\. Пусть Q 0 на L\. Тогда Q на L\ принимает положительные или отрицательные значения. Для определенности теперь считаем, что Q принимает на L\ положительные значения. Рассмотрим вторую задачу {Ах,х) —> max; (х,х) 1, (я,/1) = 0. (Р2) Решение х = /2 задачи (Р2) по теореме Вейерштрасса существует, так как сечение шара В плоскостью L\ является по-прежнему компактом. Функция Лагранжа А = Ао(Аш,я) + А((ж,я) - 1) -Ь 2д(ш,/1).
§ 3. Конечномерные гладкие задачи с равенствами и неравенствами 49 Необходимые условия максимума: а) стационарности: Аж = 0 <=> АоА/2 + А/2 + дЛ =0; Ь) дополняющей нежесткости: А((/2,/2) - 1) = 0; с) неотрицательности: Ао ^0 (задача на максимум!), А > 0. Если Ао = 0, то из пункта а) выводим, что А/2 + д/i = 0. В силу линейной независимости векторов /| и /2 следует, что А = д = 0 — все множители Лагранжа — нули, а этого быть не может. Поэтому Ао Ф 0, полагаем Ао = -1. Тогда из а) А/2 = А/2 + д/j. Умножая последнее равенство скалярно на /1 и учитывая ортогональ- ность векторов /| и /2, получим, что (А/2, /,) = А(/2, /|) + Д</1, /i > /=/| '/*• Отсюда fl = (Af2,fi) = = <Л,А1/,> =0. Умно- жая полученное равенство А/2 = А/2 скалярно на /2, получим, что (А/2,/2) = А(/2,/2) = Smax > 0. Отсюда А > 0 и по условию Ь) (/2, fi) = 1- Таким образом, /2 — собственный вектор матрицы А, А/2 = hfi (А2 = А), |/2| = 1, векторы f\ и /2 ортогональны. Далее поступаем подобным образом. Вводим подпространство Ь2 = {х 6 R” | (ж,/J = 0, (х,/2) = 0}. Если Q(x) = 0 V® 6 12, то А3 = ... = Ап = 0, /з,— любая ортонормированная система из L2. Пусть Q 0 на L2. Тогда Q на Ь2 принимает положительные или отрицатель- ные значения. Вновь рассматриваем задачу на минимум или максимум: {Ах, х) -* extr; {х, х) 1, (ж, f\) = (ж, /2) = 0. (Р3) Решая эту задачу, получаем единичный вектор /з такой, что А/з = А3/3, /з ортогонально f\ и /2. Поступая аналогично, в итоге придем к ортонормированному базису f\,.-.,fn из собственных векторов матрицы А с собственными числами А},..., Ап. Любой вектор х 6 Rn разлагается по ортонормированному базису п п /ь...,/п В следующем виде: х = Тогда Ах = fi)Afi = »=1 «=| п = 52 Aj(®,/,)/,• и, значит, г=1 , п п v п Q(x) = (Axfx) = / 2 fi)fii fj)fj ) ~ fi) • ' г=1 ' г=1 3.5. Задачи 3.1. ®1®2®з —> extr; п 3.2. х] —> extr; _2 । 2 । 2 4 Xj -г ш2 -г я?з 1.
50 Глава 1. Экстремальные задачи 3.3. x*j -» extr; xj 1. j=i ;=i 3.4. е®1-®1 - х\ - Х2 -»extr; ®i 4- ®2 1, ®i > 0, Х2 0. 3.5. ж? 4- «2 —♦ extr; xj 4- xj 1, ®i 0, ®2 0. 3.6. xj 4- xj 4- xj -»extr; ж, 4- ®2 + ®з 12, Ж| >0, ®2 > 0> хз 0. 3.7. xj 4- 4®2 + ®з ~* extr; xt 4- ж2 + ®з 12, ®i 0, ®2 0. ®з 0. 3.8. 2xj + 2xl + 2a?i x2 - X\ - x2—> 3.9. xj + x\ 4- x3 —> extr; 3.10. 2xj 4- 2a? 1 4- 4x2 - 3x3 —► extr; 3.11. 2xj 4- 2xi 4- 4x2 - 3x3 —► extr; 3.12. 3a?i - llxi - 3x2 - x3 —> extr; 3.13. 3x2 - Ha?i “ 3x2 - x3 —► extr; extr; Ж| 4- ®2 7, ®i 0. 4 X| + X2 + X3 1» X] > 0, X\ 4» ~ X3 = j • 8a?i - 3x2 + 3x3 40, -2a?i 4- x2 - x3 = -3, x2 0. 8a?i - 3x2 4- Зш3 = 40, -2»| 4- x2 — хз -3, x2 0. a?i - 7®2 4- Зж3 4-7^0, ’ 5®i 4- 2x2 - хз ^2, a?3 > 0. a?i - 7®2 + Зж3 + 7 < 0, 5a?i 4- 2x2 - хз ^2, a?3 > 0 3.14. X\Хз - 2x2 —► extr; 2a?i - x2- Зж3 10, x2 0, 3^1 4- 2x2 4-^3 = 6. 3.15. xix2x3 —> extr; x3 1, X| > 1, x2 >1, xj 4- x2 + xj — 8. 3.16. Доказать неравенство для средних степенных / 1 JL \ 1/р / 1 JL \ 1/9 MrSW’) > 0<p<g^oo, v j=l z v ]=l путем решения экстремальной задачи \xj\p -> max; (l<p<g, a > 0). ;=1 ;=1 3.17. Доказать неравенство между средним арифметическим и средним геометрическим: Уху > 0, j = 1, п.
§ 4. Выпуклые задачи 51 § 4. Выпуклые задачи Пусть в этом пункте X — линейное нормированное пространство (определение линейного нормированного пространства см. в § 5), для простоты понимания можно считать, что X = R” — конечномерное про- странство. 4.1. Элементы выпуклого анализа. Субдифференциал Напомним определение выпуклого множества. Множество AC X называется выпуклым, если для любых двух точек и аз из Л и любого числа t 6 (0,1) элемент ta\ -Ь (1 - t)a^ € Л. Пусть С := {С|,..., Cm} С X — некоторое конечное подмножество. т т Элемент v = 52 > О, i = 1,..., т, 52 U = L называется выпуклой i=i i=i комбинацией С. Совокупность всех выпуклых комбинаций конечных подмножеств множества С называется выпуклой оболочкой С и обозначается convC (иногда со С). Можно легко показать, что множество convC совпадает с пересе- чением всех выпуклых множеств, содержащих С (иногда это свойство берут за определение выпуклой оболочки). Выпуклая оболочка конечного числа точек называется выпуклым многогранником. _ Пусть задана функция (функционал) / : X -* R := R и {-оо} и {+оо}. Множество epi f = {(а, х) е R х X | а f(x)} в пространстве R х X называется надграфиком функции f. • Функция / называется выпуклой, если надграфик / — выпуклое множество. • Функция / называется замкнутой, если надграфик f — замкнутое множество. • Функция f называется собственной, если /(ж) > -оо Vx и / +оо. Мы будем изучать выпуклые собственные функции. Для краткости будем называть их просто «выпуклые» функции. Из определения выпуклого множества сразу следует, что функция выпукла тогда и только тогда, когда выполнено неравенство Йенсена: + + (I - ОДжг) Чхъх2еХ, We (0,1). Ясно, что сумма двух выпуклых функций является функцией вы- пуклой. Но суперпозиция двух выпуклых функций не всегда является выпуклой функцией. Попробуйте привести пример! Выпуклость многих классических функций одной переменной сразу вытекает из следующей теоремы.
52 Глава 1. Экстремальные задачи Теорема 1. [Р, с. 42.] Пусть функция f : R —* R дважды непрерывно дифференцируема (f 6 Z>2(R)). Тогда она выпукла тогда и только тогда, когда ее вторая производная неотрицательна (/,г(®) > 0 Уж £ R). Приведем несколько примеров выпуклых функций, выпуклость ко- торых сразу следует из теоремы 1 и определения выпуклой функции. 1. f(x) = eax, а Е R. 2. /(х) = |x|p, р > 1. Выпуклость функций из примеров 1-2 сразу следует из теоремы 1 и определения выпуклой функции. 3. Аффинная функция f(x) = (а,х) + b, а Е Rn, Ъ Е R, в многомерном случае (/ : Rn -> R). Аффинная функция является выпуклой по неравенству Йенсена. Выпуклость функций нескольких переменных можно определять так- же из следующего многомерного обобщения теоремы 1. Теорема 2. [Р, с. 42.] Пусть функция f : Rn —> R дважды непрерывно дифференцируема (f Е P2(Rn)). Тогда она выпукла тогда и только тогда, когда ее матрица вторых производных (гессиан) всюду неотрицательно ( ,, fd2f(x)\n Л определена ( f (х) = ( -—-— ) > 0 Уш Е R ). \ \^xi^xj / ij=\ / 4. Квадратичная функция Q(x) = (Ах,х), где А — симметричная ма- трица, является выпуклой тогда и только тогда, когда матрица А неотрицательно определена. Это сразу вытекает из теоремы 2. Выпуклыми функциями многих переменных (функционалами) явля- ются также следующие функции: 5. Функция нормы ( f п /м=и,:= 1 °*+0°’ I max{|xi|,...,|xn|}, р = +оо. 6. Индикаторная функция выпуклого множества А С X 0AW-t+oo, х$А. 7. Функция Минковского выпуклого множества А С X {О, а-1 а? 6 А Уа > О, +оо, сГ'х^А Уа>0, min {а | а > 0, а”1 х Е А}, иначе.
§4. Выпуклые задачи 53 Функция Минковского означает наименьшее число, в которое надо уменьшить вектор чтобы он попал в множество А. 8. Опорная функция непустого множества А С X sA(x*) = max (ж*, х). Дадим определение важного понятия выпуклого анализа — поня- тия субдифференциала функции, обобщающего для выпуклых функций понятие производной в гладком анализе. Субдифференциалом выпуклой функции f в точке f называется следу- ющее множество в сопряженном пространстве X*: df(i) = {ж* G X* | (х\х - f(x) - /(f) V» G X}. Напомним, что сопряженным пространством X* называется прост- ранство линейных непрерывных функционалов на X. В случае X = R” сопряженное пространство (Rn)* = Rn. Из определения сразу вытекает, что субдифференциал — выпуклое множество в X*. Легко доказать, что оно замкнуто. Субдифференциал дифференцируемой функции совпадает с ее производной. Для функции одной переменной субдифференциал #/(f) — это со- вокупность угловых коэффициентов k, при которых прямые у = кх + д, проходящие через точку (f, /(f)), лежат под графиком функции у = f(x). Пример. f(x) = |ж| (см. рис. 6). sign®, х /О, [-1,1], ж = 0. Для субдифференциала суммы функций имеет место теорема анало- гичная теореме о производной суммы функций. Теорема Моро—Рокафеллара [5]. Пусть f\ и fa — выпуклые функции на X. Существует точка жо, * которой функция f\ конечна (|/i(®o)l < °0), и функция /2 непрерывна (f € C(xQ)). Тогда Э(/|+/2)(ш) = 3/1(ж) + 3/2(ш) Vs.
54 Глава 1. Экстремальные задачи При доказательстве необходимых условий экстремума в гладкой за- даче с равенствами и неравенствами нам понадобится следующая теорема о субдифференциале максимума. Теорема Дубовицкого*-Милютина [5]. Пусть f\ и — выпуклые функ- ции, непрерывные в точке х, /](£) = /2(^). Тогда dmax{/i,/2}(#) = conv(0/i(£) и 3/2(#)). Важным примером выпуклой функции является сублинейная функ- ция. Функция р называется сублинейной, если ее надграфик является выпуклым конусом с вершиной в нуле. Из неравенства Йенсена следует, что собственная функция является сублинейной тогда и только тогда, когда а) р(Хх) = Хр(х) VA>0, VxGX; b) p(xi + x2) ^p(xi)+p(x2) V«i,«2eX. Сформулируем теорему Моро—Рокафеллара и теорему Дубовицко- го-Милютина для сублинейных функций. Теорема Моро—Рокафеллара. Пусть р\,р2 — сублинейные функции, функция р\ непрерывна, функция р2 замкнута. Тогда в точке £ = О d(pt +?2) “ дР\ +&Р2- Теорема Дубовицкого—Милютина. Пусть р\,р2 — непрерывные субли- нейные функции. Тогда 9max{pi,p2}(0) = conv(dpi(0) U #р2(0)). 4.2. Теоремы отделимости При выводе необходимых условий экстремума (принципа Лагранжа) в выпуклых задачах и в задачах с равенствами и неравенствами мы будем использовать свойство отделимости непересекающихся выпуклых множеств. Определение 1. Множества Л и В из пространства X называются от- делимыми, если существует линейный непрерывный функционал А 6 X*, А Ф 0, для которого inf (А, а) > sup(A,b). Из определения следует, что множества являются отделимыми, если можно провести гиперплоскость Н = {х 6 X | (Х,х) = с}, с G R, так что одно из множеств лежит в одном замкнутом полупространстве = {х 6 X | (А,х} с}, а другое — в другом замкнутом полупространстве Н- = {хеХ\{Х,х)^с}.
§ 4. Выпуклые задачи 55 Определение 2. Множества А и В называются строго отделимыми, если существует линейный непрерывный функционал А 6 X*, для кото- рого inf (А, а) > sup(A,b). ьев Приведем результаты об отделимости в конечномерном случае. Теорема 1 (первая теорема отделимости в конечномерном простран- стве). Пусть А и В — непустые выпуклые множества в Rn, А П В = 0. Тогда множества А и В отделимы. Теорема 2 (вторая теорема отделимости в конечномерном простран- стве). Пусть А — непустое выпуклое замкнутое множество в Rn, Ъ & А. Тогда точку Ь можно строго отделить от множества А. Доказательство теорем 1, 2 см. [ГТ, с. 20]. Упражнение. Если в теореме 2 вместо точки Ъ взять множество В, то теорема не будет верна. Привести пример. Сформулируем результаты об отделимости в случае нормированных пространств. Теорема 1' (первая теорема отделимости в нормированном простран- стве). Пусть А и В — непустые выпуклые множества в X, int А Ф 0, int А П В = 0. Тогда множества А и В отделимы. Теорема 2' (вторая теорема отделимости в нормированном простран- стве). Пусть А — непустое выпуклое замкнутое множество в X, Ь & А. Тогда точку Ь можно строго отделить от множества Л. Доказательство теорем 1', 2' см. [АТФ, с. 124]. 4.3. Задачи без ограничений Пусть f : X —> R — выпуклая функция, отображающая нормиро- ванное пространство X в расширенную прямую. Выпуклой задачей без ограничений называется следующая экстремальная задача: /(®)->min. (Р) Теорема (аналог теоремы Ферма). Для того чтобы точка & доставляла в выпуклой задаче без ограничений (Р) абсолютный минимум (А 6 absminP), необходимо и достаточно, чтобы выполнялось соотношение 0 G Доказательство. £ G absminP О f(x) - /(£) > 0 = (0,® - £) V® G X О 0 G 0/(2). Поскольку из выпуклости функции / не следует, вообще говоря, выпуклость функции то существенно, что рассматривается задача на минимум а не на максимум.
56 Глава 1. Экстремальные задачи 4.4. Задачи с ограничением Пусть / : X ~► R — выпуклая функция, отображающая нормиро- ванное пространство X в расширенную прямую, D С X — выпуклое множество. Выпуклой задачей с ограничением (или просто выпуклой зада- чей) называется следующая экстремальная задача: f(x) -> min; х е D. (Р) Теорема. Пусть х € locmin Р — доставляет локальный минимум в вы- пуклой задаче (Р). Тогда х Е absminP — доставляет абсолютный минимум в этой задаче. Доказательство. Пусть х Е locmin Р. Это означает, что существует окрестность U точки Л, такая, что /(f) /(ж) V®EU ПР. (*) Возьмем произвольную точку х Е D. Тогда, поскольку х и f из Р, то х = (1 - а)х -Ь ах Е U П Р при достаточно малом а > 0. Следовательно, (♦) /(f) < f(x) — /((1 - а)х -Ь ах) (по неравенству Йенсена) (1 - a)/(f) + otf(x), откуда a/(f) otf(x) О /(f) f(x) V® Е Р. Значит, f доста- вляет абсолютный минимум в задаче (Р). Из теоремы следует, что в выпуклой задаче локальный минимум является и абсолютным (глобальным). Поэтому в дальнейшем в выпуклых задачах, говоря «минимум», имеем в виду абсолютный минимум. 4.5. Задача выпуклого программирования Пусть fi : X —> R, I = 0,1,..., т, — выпуклые функции, отображаю- щие линейное нормированное пространство X в расширенную прямую, А С X — выпуклое множество. Задачей выпуклого программирования называется следующая экстремальная задача: /о(ж) —► min; fa(x) 0, г = 1,...,пг, х Е А. (Р) Точка х называется допустимой в задаче (Р), если х Е А и выпол- няются все заданные ограничения типа неравенств. Упражнение. Докажите, что задача выпуклого программирования является выпуклой задачей, т. е., что множество допустимых элементов в этой задаче является выпуклым множеством. При проверке достаточных условий минимума в задаче выпуклого программирования будет использоваться некоторое условие регулярности множества допустимых элементов — условие Слейтера. Множество допустимых элементов в задаче (Р) удовлетворяет условию Слейтера, если существует точка х Е А, для которой /t(f) <0, i = 1,..., т.
§4. Выпуклые задачи 57 Теорема Куна—Ъккера. 1. Если А Е absminP — решение задачи выпуклого программирования, то найдется ненулевой вектор множителей Лагранжа A = (A0,AI,...,Am)GRm+l, т такой, что для функции Лагранжа К(х) = ^2Xifi(x) выполняются 1=0 условия: а) принцип минимума для функции Лагранжа minA(s) = Л(£); х€А Ь) дополняющей нежесткости: = 0, i — 1,..., т; с) неотрицательности: Xi > О, i = 0,1,... .т. 2. Если для допустимой точки А выполнены условия а)-с) и Ао 0, то & Е absminP. 3. Если для допустимой точки х выполнены условия а) - с) и мно- жество допустимых элементов удовлетворяет условию Слейтера, то £ Е absminP. Доказательство. Пусть £Е absminP. Не ограничивая общности, счи- таем, что /о(&) = 0 — иначе введем новую функцию /о(я) = /о(я)“/о(#)- Положим B={b = (bo,b........ 6 Rm+I | Эх € А : /,(х) < Ь», » = 0,1,... ,т}. Покажем, что В — непустое выпуклое множество. Действительно, неотрицательный октант R™+1 С В, т.е. любой вектор с неотрицатель- ными компонентами принадлежит В. ибо в определении множества В можно положить х = х. Докажем выпуклость множества В. Пусть точ- ки b и Ъ1 принадлежат множеству В. Надо доказать, что otb+ (1 - ot)b' Е В Va Е (0,1). Поскольку точки b.b' Е В. то по определению множества В существуют х.х* Е А такие, что /,(«) bi. fi(x') Ь-, i = 0,1,... .т. Положим ха = ах 4- (1 - а)х*. Тогда ха Е А. поскольку А — выпукло, а ввиду выпуклости функций fi. i = 0,1,...,т. по неравенству Йенсена Л(®«) = fi{ax + (1 -а)х) а/,(х) + (1 - а)/,(х') < abi + (1 - а)Ь\, т. е. точка ab + (1 - а)Ь' & В. Обозначим С = {с = (со, 0,...,0) G Rm+1 | со < 0} — открытый луч в пространстве Rm+I. Ясно, что С — непустое выпуклое множество.
58 Глава 1. Экстремальные задачи Покажем, что С П В = 0, Действительно, если бы существовала точка с 6 С П В, то ввиду определения множества В отсюда следовало бы, что имеется элемент х Е Л, для которого выполняются неравенства: /о(я) со < 0, fi(x) 0, i = 1,..., т. Но из этих неравенств следует, что для допустимой точки х /о(я) < /о(&) = 0, т.е. £ £ absminP. Получили противоречие с условием теоремы х Е absminP. Значит С П В = 0. По первой теореме отделимости в конечномерном пространстве множества В и С можно отделить, т. е. существует вектор А = (Ао, Аь ..., Ат) 0, для которого т т inf V Xibi sup XiCi = sup Аой) > 0 . с<о Таким образом, 22 АД > О УЬеВ. (*) 1=0 Из неравенства (*) будут выведены условия неотрицательности, дополняющей нежесткости и принцип минимума. 1. Условие неотрицательности. Поскольку, как мы уже говорили, лю- бой вектор с неотрицательными компонентами принадлежит В, то вектор (0,...,0,1,0,..., 0) Е В, где единица стоит на г-ом месте (счет начинаем с нуля). Подставив эту точку в неравенство (*), получим, что А, 0. Условие дополняющей нежесткости. Нетрудно видеть, что точка (0,..., 0, /.(f), 0,..., 0) ЕВ. Действительно, в определении множества В возьмем х = £, тогда х Е А и нужные неравенства выполняются. Под- ставив эту точку в неравенство (*), имеем Xifi(£) 0. Если At/t(f) > 0, то (так как по уже доказанному условию неотрицательности А, > 0) fi(£) > 0 — это противоречит допустимости точки ж. Значит, А,/,(А) = 0. Принцип минимума. Возьмем точку х Е А, тогда точка (/о(я),/1(я), ..., /т(ж)) Е В. Тогда по неравенству (*) т т А(ж) = 2 о = 2 i=0 i=0 так как, не ограничивая общности, положили /о(&) = 0 и по уже дока- занному условию дополняющей нежесткости Xifi(£) = 0, i = 1,...,тп. Таким образом, принцип минимума для функции Лагранжа доказан. 2. Пусть для допустимой точки £ выполнены условия а)-с) и Ао ф 0. Положим Ао = 1. Тогда для любой допустимой точки х будет выполняться неравенство ш т \ ш ш+22 = А<*) < л(г) /0(х)+22 л(®) 1=1 1=1
§4. Выпуклые задачи 59 (в последней сумме все слагаемые неположительны). Неравенство /0(£) /о(®) ДЛЯ любой допустимой точки х означает, что х Е absminP. 3. Пусть для допустимой точки А выполнены условия а)-с) и мно- жество допустимых элементов удовлетворяет условию Слейтера. Пред- положим, что при этом Ао = 0. Так как вектор А ± 0, то в силу условия неотрицательности существует хотя бы одно Xj > 0, j Е Следовательно, m с) т А(£) = 2а,Л(х) < Ау/у(х) < 0 £ А,•/,($) = A(i). i-1 i= I Но это полученное неравенство противоречит условию а). Значит, наше предположение, что Ао = 0 неверно. Поэтому Ао / 0 и по доказанному п. 2 £ Е absminP. Теорема Куна—Таккера полностью доказана. Из теоремы Куна—Таккера можно вывести достаточные условия абсолютного минимума в выпуклой задаче с неравенствами без ограни- чения типа включения. Рассмотрим задачу /о(®) -> min; fi(x) 0, i = 1,..., m. (P') Теорема. Пусть : X —> R, i = 0,..., m, — выпуклые функции, f — допустимая точка в задаче (Р1) (£ 6 Dy), для функции Лагранжа т &(х) = 52 с множителем Лагранжа Ао > 0 в точке А выполняются i=0 условия: а) условие стационарности функции Лагранжа: 0 6 9А(£); Ь) дополняющей нежесткости: Xifi(£) = 0, i = 1,..., m; с) неотрицательности: А, > б, i == 1,..., т. Тогда & 6 absminP'. Доказательство. Поскольку /t : X —* R, г = 0,..., тп, — выпуклые m функции, то функция Лагранжа А(ш) = ^Xifi(x) с неотрицательными «=о множителями Лагранжа является выпуклой функцией. По аналогу теоре- мы Ферма для выпуклых функций условие 0 6 дА(£) является необходи- мым и достаточным условием абсолютного минимума функции Лагранжа в точке х. Значит, условие стационарности функции Лагранжа в насто- ящей теореме равносильно принципу минимума для функции Лагранжа в теореме Куна—Таккера. Таким образом, для нашей задачи выполняют- ся соотношения а)-с) теоремы Куна—Таккера с множителем Лагранжа Ао 0. По п.2 теоремы Куна—Таккера следует, что £ Е absminP'. Легко видеть, что теорема остается верной и для задач с ограниче- ниями типа равенств и неравенств, если функции, задающие равенства,
60 Глава 1. Экстремальные задачи являются аффинными. (В этом случае, как мы говорили об этом в п. 3.2 равенство f(x) = 0 <=> 0 f(x) < 0 заменяется двумя неравенствами f(x) 0, -f(x) 0. Из аффинности функции f следует выпуклость функций f и -/.) Пример. /(®1,ж2) — х* 4- Х]Х2 4- х] 4- 3|Ш] + х2 - 2| -* min. Решение. Функция f(x) является выпуклой функцией как сумма двух выпуклых функций. Действительно, функция д(х) = х] + х^х2 + х2 выпукла по Теореме 2 п. 4.1, так как по критерию Сильвестра матрица вторых производных / д2д(х) \2 /2 \dXidXj / \1 1\ 2 / положительно определена и не зависит от ж. Очевидно, что функция Л(ж|,ж2) = |ж] + х2 - 2|, являющаяся модулем линейной функции также является выпуклой функцией. Необходимое и достаточное условие экстремума в выпуклой задаче без ограничений: 0 Е df(£) = dg(x) + 3dh(ty (1) (использовали теорему Моро—Рокафеллара о субдифференциале суммы функций). Для дифференцируемой функции ее субдифференциал совпа- дает с производной. Поэтому дд(£) = (2&\ 4- #2,#i + 2£2). Найдем dh(&) в точке недифференцируемости функции Л, т.е. при xi + х2 - 2 = 0. По определению субдифференциала a = (a],a2)edh(x) (ж-£,а) ^h(x) - Уж ER2 <=> а\+а2ж2~й|Х| -а2#2 |Ж| Ч-ж2 — 2| -1£] +#2-2| УЖ1,ж2. (2) Полагая в неравенстве (2) х2 = 0, получим, что а\Х\ |ж| - 2| + С\ для любого жь откуда вытекает, что [aj 1. Полагая Ж1 = -ж2, получим, что (а2 - й])ж2 С2 для любого х2, откуда вытекает, что а\ — а2. Таким образом, а = (a,a), |а| 1. При таких значениях а в точках х2 таких, что х\ + х2 - 2 = 0 неравенство (2) будет выполняться: a(ai| + ®2 - 2) |a:i + ®2 _ 2| V®|,x2. ; Поэтому Значит dh(x) = < ' (2®i + х2 Ч (1,1), ®|+a:2-2>0) > (а, а), |а| 1, + ®2 _ 2 = 0, (—1,-1), ®1+О!2-2<0. | j - 3, Xi + 2х2 + 3), Xi + х2 - 2 > 0, df(x) = < (2^1 4- х2 + 3a,®i 4- 2х2 4- За), |а| ^1, Xi + х2 - 2 = 0, (2ж| 4” х2 ~ 3, 4” 2х2 — 3), 4~ х2 — 2 < 0.
§4. Выпуклые задачи 61 Следовательно, соотношение (I) запишется в виде Г 2xi -Ь ®2 + 3 = 0, \ Xi + 2х2 + 3 = 0, при Х| + х2 - 2 > 0, (0 J 2х| + х2 + За = 0, ( X] + 2x2 + За = 0, при Х|+х2-2 = 0, (|а| I) (И) ( 2Х| + х2 - 3 = 0, Х| + 2х2 — 3 = 0, при Х| + х2 — 2 < 0. («*) В случае (») нет критических точек, так как из уравнений системы следует, что Х| + х2 = —2 — противоречие с условием ®i + х2 - 2 > 0. В случае (Hi) также нет критических точек, так как из уравнений системы следует, что Х| + х2 = 2 — противоречие с условием xi + Х2 - 2 < 0. В случае (Н) система из трех уравнений с тремя неизвестными имеет единственное решение = Л2 = 1, а = -1. Таким образом, 5т,п = 3, ПРИ А| = х2 = 1. 4.6. Задачи, упражнения В задачах 4.1-4.4 выяснить, при каких значениях параметра функции являются выпуклыми: 4.1. f(x) = ах2 + Ъх + с. 4.2. /(х) = ае2* + be* + с. 4.3. /(хьх2) = (|Х||Р + |х2Г)1/₽, р > 0. 4.4. /(х|,х2) = ацх2 + 2в|2Х|Х2 + в22х2. В задачах 4.5-4.6 выяснить, являются ли выпуклыми функции: л с f/-.\ _ /®lnx + (1 -х)1п(1 -х), 0<х<1, ’ ' '' ' +оо, иначе. 4.6. /(х) = min{X| + х21 Х| + х2 = х}. 4.7. /(х) = 2|х-1| + |х|; 9f(i) =? В задачах 4.8-4.15 вычислить субдифференциалы выпуклых функций в точке Л = 0: 4.8. /(х) = тах{х, 0}. 4.9. /(х) = тах{е®, 1 - х}. 4.10. /(xi,..., хп) = |х| := ( У* /2.
62 Глава 1. Экстремальные задачи п 4.11. .......... .. j=i 4.12. /(»],... ,хп) = max |ж,|. п 4.13. /(а?],... ,хп) = max х,-. 4.14. /(^1,... ,жп) = тах{0, aERn. 4.15. / : X —► R, f(x) = ||ж|| (X — нормированное пространство). 4.16. Найти функцию Минковского для треугольника с вершинами в точ- / 1 >/3\ ках (1,0Ц--,±— 4.17. Привести пример выпуклой замкнутой функции / и точки А таких, что |/(£)| < оо, df(£) = 0. 4.18. Привести пример выпуклой, но не замкнутой функции. 4.19. Показать на примере, что суперпозиция двух выпуклых функций не всегда выпукла. 4.20. Доказать, что любая выпуклая функция, конечная на всей прямой, непрерывна. 4.21. Доказать, что не существует выпуклой ограниченной функции, определенной на всей прямой и отличной от константы. Решить выпуклые задачи 4.22-4.25: 4.22. /(жьжз) = ж? - Я|Ж2 + + 3|ж] - Х2 - 2| —> min. 4.23. f(x\, Х2) = х* + ®2 + 4max {xi, х2} —► min. 4.24. /(®ьХ2) = х] -Ь ®2 + lyj(ж| - ai)2 4- (®2 “ min. 4.25. /(Ж1,ж2) = 4-Ж2 + 2a|a?i 4-^2 - 1| —► min (a>0). § 5. Элементы функционального анализа 5.1. Нормированные и банаховы пространства 5.1.1. Определение пространств Непустое множество X элементов называется линейным (векторным) пространством, если а) для любых элементов х,у Е X однозначно определен элемент из X, называемый их суммой и обозначаемый х -Ь у;
§ 5. Элементы функционального анализа 63 Ь) для любого числа А Е R и элемента х однозначно определен эле- мент, называемый произведением числа А на элемент х и обознача- емый Ах. Эти операции должны удовлетворять следующим условиям: I. Г. х + у = у + х — коммутативность. 2°. (х 4- у) 4- z = х + (у 4- z) — ассоциативность. 3°. Существует элемент 0 такой, что х 4-0 = х Ух Е X. Элемент 0 называется нулевым элементом. 4°. Для любого элемента х существует элемент, обозначаемый через -х, такой, что х 4- (~х) = 0. II. 1°. 1‘Х = Х. 2°. а(@х) = а/?(х). III. Г. (а 4- fi)x = ах 4- flx. 2°. а(х + у) = ах + ау. Линейное пространство X называется нормированным, если на X определен функционал || • || : X —► R, называемый нормой и удовлетворя- ющий условиям: а) ||х|| 0 Ух Е X и ||х|| = 0 О х = 0; Ь) ||ах|| = |а| • ||х|| У a Е R, Ух Е X; с) ||®1 +«211 11®||1 + Н®2|| Чх},Х2еХ. Линейное нормированное пространство иногда будем называть для краткости нормированным пространством. Иногда, чтобы подчеркнуть, что норма задана именно на X, мы пишем ||х||х. Две нормы на X ||х||। и ||х||2 называются эквивалентными, если существуют положительные константы С\ и Сг такие, что С'1||®||, Всякое нормированное пространство становится метрическим, если в нем ввести расстояние d(xj,X2) = ||xi - Х2Ц. В метрическом простран- стве естественным образом вводятся понятия открытых и замкнутых множеств, сходимость. Последовательность точек {xn}£L| метрического пространства назы- вается фундаментальной, если она удовлетворяет критерию Коши, т. е. если для любого е > 0 существует Ne такое, что d(xnpxn2) < € для всех fti,n2 > Не- метрическое пространство называется полным, если любая фунда- ментальная последовательность сходится. Полное относительно введенного расстояния метрическое простран- ство называется банаховым пространством. Отметим, что всякое конечномерное нормированное пространство является банаховым. Бесконечномерное нормированное пространство не обязано быть банаховым.
64 Глава 1. Экстремальные задачи f 5.1.2. Произведение пространств I Пусть X и Y линейные нормированные пространства. Декартово произведение X х Y можно превратить в линейное нормированное про- странство, введя норму ||(®,1/)Нхху = max{||®||x,||j/||y}. Легко проверить, что все аксиомы нормы выполняются. Отметим очевидное утверждение: декартово произведение банаховых пространств банахово. 5.1.3. Примеры банаховых пространств 1. Конечномерное пространство Rn, состоящее из векторов х = (хь... ,®п) с нормой Эту норму иногда называют евклидовой нормой, а расстояние, вводимое | с помощью этой нормы, называют евклидовым расстоянием. \ 2. Конечномерное пространство lp, 1 р оо, состоящее из векто- ров х = (ж|,..., хп) с нормой k max{|®i|,... ,|®п|}, р = оо. Отметим, что в конечномерном пространстве все нормы эквива- лентны. I 3. Бесконечномерное пространство I2, состоящее из последователь- ностей х = .{ш„}^=| (иногда пишем, х — (®ь... ,жп,...)), для которых 00 52 < 00, С нормой п=1 / 00 \ !/2 f 11®Н»2 = • ' П=1 ' I 4. Пространство C([io,M) := непрерывных на отрезке [£о, £| ] функций «(•) с нормой 11®(-)11с(|Ы|1) = max. Обобщением этого пространства является пространство C(K,Rn) непрерывных вектор-функций «(•) : К —* R”, заданных на компакте К, с нормой 11®(-)Нс(к) = тюс |®(i)|.
§ 5. Элементы функционального анализа 65 5. Пространство С,1([<о» М) := О’1 ([£о»<i]> R) непрерывно дифферен- цируемых на отрезке [to, t\] функций х(-) с нормой 11®(-)11с'([40,«||) = п’ах{Н«(-)11с((«оЛ|)»11®(-)11сфоЛ|)}- Обобщением этого пространства является пространство С(7Г, Rn) г раз непрерывно дифференцируемых вектор-функций х(-) : К -» R”, заданных на компакте К с нормой н®(')11с*(лг) = шах {||®(-)11с(Д), 11®(-)11с(д), • • •, 11®(г)(-)Нс(к)} • 5.1.4. Сопряженное пространство, оператор Совокупность X* всех линейных непрерывных функционалов на нормированном пространстве X образует сопряженное к X пространство. Оно является банаховым пространством относительно нормы 11®Ъ- := max (х*,х), 1Нх<1 где (ж*, ж) означает действие функционала х* на элемент ж. Пусть X и Y — нормированные пространства. Через L(X,Y) обо- значим пространство линейных непрерывных операторов из X в Y. Пусть Л Е £(Х,У). Тогда можно определить сопряженный оператор Л*: У* —► X* такой, что (АУ,ж) = (у*,Лж) Уж Е X. Для линейного непрерывного функционала на произведении про- странств имеет место следующая очевидная Лемма. Всякий функционал Л Е (X х У)* однозначно представляется в виде (Л, (®,у)) = (х*,х) + {у*,у), где х* G X*, у* е У*. 5.2. Определения производных Для вещественных функций одного вещественного переменного два определения — существование конечного предела lim № + *)-/№ h-0 h и возможность асимптотического разложения при Л —> О № + h) = /(f) + /'(f )Л + o(h) (2) *— приводят к одному и тому же понятию дифференцируемости. Но уже Для функций двух и большего числа переменных существует несколько
66 Глава 1. Экстремальные задачи различных подходов к понятию дифференцируемости (гладкости). Опре- деление (1) ведет к понятиям производной по направлению, вариации по Лагранжу и производной Гато. Определение (2) ведет к понятиям производной Фреше и строгой дифференцируемости. Пусть далее в этом пункте X,Y,Z — линейные нормированные пространства. Как правило (если это не оговорено иначе), / : X —> Y — отображение пространства X или некоторой окрестности точки f 6 X в пространство У2\ 5.2.1. Производная по направлению Будем говорить, что отображение / имеет в точке f производную по направлению h, если существует предел справа lim ---------------=: о. / (f, Л), А-+0 А ' ' который обозначается 6+f($9h). Плюс в индексе здесь указывает на то, что берется именно предел справа. 5.2.2. Вариация по Лагранжу Если отображение f имеет в точке ж производную по всем напра- влениям и 6+f($9h) = -6+f(£,-h) =: 6f(£,h) УЛ е X, то говорят, что отображение / имеет в точке & вариацию по Лагранжу. При этом ото- бражение h —* h) называют вариацией по Лагранжу. Таким образом, вариация по Лагранжу ' А->0 А 5.2.3. Производная Вето Если оператор вариации по Лагранжу •): X —► Y линеен и не- прерывен по h ($/(£,•) € £(Х,У)), то говорят, что / дифференцируемо по Гато в точке £, а оператор £/(&,•) называется производной Гато отображения f в точке £ и обозначается /^(f). Отсюда следует, что если отображение f дифференцируемо по Гато в точке ж, то для любого фиксированного h имеет место разложение /(f 4- АЛ) = /(f) + A/^(f )[Л] + г(Л, А), где ||г(Л, А)||у = о(|А|) при А 0. Отметим, что отображение, дифференцируемое по Гато в точке ж, не обязано быть непрерывным в этой точке (см. Пример 4, п. 5.2.8). Но вполне содержателен пример, когда X = R\ Y = Rm. Элемент из L(X,Y) опре- деляется в этом случае матрицей размера п х т.
§ 5. Элементы функционального анализа 67 5.2.4. Производная Фреше Отображение / называют дифференцируемым по Фреше в точке х и пишут f 6 D(x), если существуют линейный непрерывный оператор f(x) : X —> Y и отображение г : X -* Y такие, что /(^ + Л)-Ж + Г(х)[Л] + г(Л). (*) где ||r(h)l|y = о(||Л||х) при ||Л||х -* 0. Оператор f(£) называется производной Фреше. Это разложение можно кратко записать так: /(£ + h) = /(f) + f(x)[h] + o(h), понимая o(h) как элемент пространства У, для которого \\o(h)|| = o(||fe||) при ||h|| —► 0. Через /'(f) [Л] обозначено значение отображения /'(f) на элементе h. Из разложения (*) следует, что функция, дифференцируемая по Фре- ше, непрерывна в точке дифференцируемости, а также дифференцируема в этой точке по Гато. Уже в двумерном случае эти два понятия раз- личаются: из дифференцируемости функции по Гато не следует ее дифференцируемость по Фреше (см. Пример 4, п. 5.2.8). Аналогично из дифференцируемости по Гато по определению вытекает существо- вание вариации по Лагранжу. И снова (уже в двумерном случае) эти понятия различны. Отметим, что производная Фреше линейного опера- тора совпадает с самим оператором. Если в каждой точке х открытого множества U отображение / € D(x), а отображение х —> f'(x) непрерывно, то пишем f 6 C[(U). На языке е-б определение дифференцируемости по Фреше отобра- жения / в точке f формулируется так: существует оператор /'(f) е L(X,Y) такой, что для любого е > 0 найдется д > 0, при котором для любого ||h|| < б выполняется неравенство ||/(f + Л) - /(*) - /Willy < е||Л|1х. Из разложения (*) следует, что производная Фреше определена одно- значно, ибо равенство X\h - k^h = o(h) для линейных непрерывных операторов Л1 и Аг возможно лишь при Ai = Л2. 5.2.5. Строгая дифференцируемость Во многих задачах конечномерного и бесконечномерного анализа дифференцируемости по Фреше в точке недостаточно для получения содержательного результата. Это побуждает к следующему усилению дифференцируемости в точке. Пусть отображение / дифференцируемо по Фреше в точке х. Оно называется строго дифференцируемым в точке х (при этом пишут / € 5Z>(f)), если для любого е > 0 найдется такое б > 0, что для
68 Глава 1. Экстремальные задачи всех Я] и удовлетворяющих неравенствам ||xi - х|| < б, ||ж2 - #11 < <5, выполнено неравенство ||/(X|) - f(x2) - /'(®)[®! - х1]Ну ell®! - ®2||х- Из определения следует, что функция, строго дифференцируемая по Фре- ше в точке, непрерывна в некоторой окрестности этой точки. Ниже будет показано, что если производная Фреше (даже производ- ная Гато) отображения непрерывна в точке, то отображение будет строго дифференцируемо в этой точке. 5.2.6. Частные производные Пусть X, Y, Z — нормированные пространства. Рассмотрим отобра- жение f :XxY —> Z, (£,у) е XxY. Если отображение х f(x9у) диф- ференцируемо в точке х по Фреше, то его производная называется част- ной производной по х отображения f в точке (А, #) и обозначается flx(x9 у) А или —------. Аналогично определяется частная производная по у дх 5.2.7. Производные высших порядков Дадим теперь определение второй производной Фреше. Если отобра- жение f : X —> У дифференцируемо в каждой точке х 6 X, то определено отображение х -+ f'(x) пространства X в пространство L(X,Y). По- скольку L(X,Y) также является нормированным пространством, то мож- но ставить вопрос о существовании второй производной отображения f f G L(X,L(X,Y)). Для вектора h[ 6 X оператор f"(x)[hi] е £(Х,У). Возьмем вектор h2 6 X, тогда определено отображение Таким образом, определено билинейное (линейное по каждому аргумен- ту) отображение f"(x) : X х X —► У. Аналогично определяются производные высших порядков. Теорема (о смешанных производных). [АТФ, с. 156.] Если отображе- ние f € D2(&) дважды дифференцируемо в точке £, то f"(x)[hi9h2] = f"@)[h29h{] Vh{9h2 6 X. Замечание. Можно считать, что отображения определены не на всем пространстве, а в окрестности рассматриваемых точек.
§ 5. Элементы функционального анализа л-' 69 5.2.8. Контрпримеры на дифференцируемость Приведем несколько контрпримеров, показывающих, что введенные понятия дифференцируемости действительно различны. Пример /. Непрерывная функция не имеет в фиксированной точке производной ни по какому направлению: х ’ # = 0. О, х = О, На прямой R имеются с точностью до умножения на положительную константу два направления: h\ = 1 и hi = -1. Однако пределы по обоим направлениям не существуют. Действительно, предел ----v---- A sin { 1 = lim ——- — lim sin - i=o A-*4-0 A A—>4-0 A Л=1 не существует. В силу четности функции / не существует также предел по направлению h = ~ 1. Пример 2. Непрерывная функция имеет в фиксированной точке про- изводную по всем направлениям, но не имеет в этой точке вариации по Лагранжу: /:R->R, /(я) = |я|, £ = 0. Как и в примере 1, на прямой R имеются с точностью до умножения на положительную константу два направления: h\ — 1 и hi = -1. Пределы по обоим направлениям существуют: h=hi /(а + АЛ)-/(£) lim --------------- л-.+о А .. |АЛ<1 ... |А| , = lim —-— — lim — = 1. *=0 Л-»4-0 А А—>4-0 А Л=Л, Но предел /(1 + АЛ)-/(1) ~ пт-------:------- £ A-о А 1=0 Л=1 1- |д| = lim — a-о А не существует. Следовательно, отображение / не имеет в точке х = 0 вариации по Лагранжу. Отметим, что если £ Ф 0, то 0/(£,Л) = /(#)[/&] = sign# • h. Пример 3. Отображение имеет в фиксированной точке вариацию по Ла- гранжу, непрерывно в этой точке, но не имеет в этой точке производной Гато. Определим отображение в полярных координатах х = (хi, ш2) = (г cos у?, г sin у?) по формуле: / : R2 R, f(x) = г cos Зу>, х = 0.
70 Глава 1. Экстремальные задачи Вычислим вариацию по Лагранжу данного отображения в точке f = 0. Возьмем произвольное направление h = (t cos a, t sin а). Тогда t. Afcos3a = lim--------= t cos За. *=o A-° л Покажем, что вариация по Лагранжу не является линейным оператором по h. Действительно, возьмем два вектора h\ = (1, 0) = (cos0,sin0) (t = 1, а = 0) и hi = (0,1) = (cosу,sin (t = 1, а = тг/2). Тогда h\ +hi = (1,1) = (>/2cos >/2sin. Однако +hi) = a/2cos^-- — -1 Ф 6f(&fhi) + 6f(£,hi) = cos 0-b cos — — 1. Пример 4. Отображение f имеет в фиксированной точке производную Гате, но не имеет в этой точке производной Фреше: «2 = ®1, > 0, в остальных случаях, / : R2—► R, /(«) = {£ * = (0,0). <• ч Поскольку Л f (* h\ - lim + Aft) - - Hm П о г (ж, h) — lim----------------= lim —-— = О А—»0 А А—»0 А h, то производная Гато существует и /g(£) = 0. С другой для любого стороны, функция / разрывна в точке £ = (0,0), а функция, дифферен- цируемая по Фреше, должна быть непрерывна в точке дифференциру- емости. Пример 5. Функция имеет в фиксированной точке производную Фреше, но не строго дифференцируема в этой точке: /:R-+R, f(x) = (x2’ х Рационально, . & = 0 (0, х иррационально,
§ 5. Элементы функционального анализа 71 Выписанная функция одной (!) переменной дифференцируема в точ- ке £ = 0. Значит она дифференцируема по Фреше в этой точке. С другой стороны, функция имеет разрывы в любой окрестности нуля, а стро- го дифференцируемая функция должна быть непрерывна в некоторой окрестности А. 5.3. Некоторые теоремы дифференциального исчисления в нормированных пространствах Приведем несколько теорем, наиболее часто используемых для ре- шения экстремальных задач. 5.3.1. Теорема о суперпозиции Теорема. Пусть X,Y,Z — линейные нормированные пространства, : X —► У, : Y Z, ip(£) — у, f = ^otpi X—^Z — суперпозиция ото- бражений (риф. Тогда, если отображение ф дифференцируемо по Фреше в точке у, а отображение <р в в точке х имеет вариацию по Лагранжу (дифференцируемо по Гато, дифференцируемо по Фреше), то отображение f обладает в точке х тем же свойством, что и отображение <р, и при этом соответственно А) ДО,Л) = ^)1М^^)1 VhtX. В) /^) = ^(0)о^(*)- С) /'(*) = ^'(0) ° ?'(*) D) Если отображения ф Е SD(y) и <р Е SD(x) строго дифференцируемы в точках $ и £, соответственно, то отображение f G SD(£) также строго дифференцируемо в точке х. Доказательство. А) Вариация по Лагранжу. Вычислим вариацию по Лагранжу отображения 6f(x,h). По определению у $ Л f(* h\ lim + lim + Xh^ ~ oflx.ni := lim------;-------= lim-----------:---------- — ' A—>o A A—*o A (По определению производной Фреше отображения в точке у вытекает, что + Л) = + °(Л)- Перепишем это разложение в виде '/’(у) ~ VW = - 0] + о(у - #) для у = + АЛ), з) = ¥>($).) “ ^(*)1 + + АЛ) ~ Н®)) = lim-----------------------------------------= a-о А (Из определения вариации по Лагранжу отображения <р в точке х выте- кает, что <р(£ -h Xh) - <р(х) = Х6<р(х, h) + о(А).)
72 Глава 1. Экстремальные задачи J <р(х + Xh) - <р(х)1 = lim -----------------’ 1 o(Xti(p(x,h) + о(А)) + lim-----------------------— А-»0 А Л = 4- lim = ip'^)[6<p(x,h)], A-»0 Л что и доказывает формулу для вариации по Лагранжу суперпозиции отображений. В) Производная по Гато. Если отображение у? дифференцируемо по Гато в точке £, то по определению производной по Гато оператор = 6ip(x,h) е Б(Х,У). Тогда по уже доказанному п. А) оператор 6f(£, h) = ^(у)[^(яЛ)] = £ L(X,Z). Это означает, что отображение f дифференцируемо по Гато в точке £ и производная по Гато /g(®) = V>'(»)0 4>с№)- С) Производная по Фреше. Так как отображение ip 6 D(x), а отображе- ние ф 6 D(y), то из определения дифференцируемости по Фреше для лю- бых £1,^2 > 0, найдутся такие <5], <52 > 0, что из неравенств ||® - ж|| < Ну ~ УН < ^2, следуют неравенства ||p(®)-p(*)-V(*)[®-*]||y Oi||®-*lbr, (1) ||^(») - 'Ф(у) ~ ~ 0]||я «ally - 3>||г• (2) По неравенству треугольника для норм следует, что для элемента у = <р(х) выполняется неравенство II» - »Н == М®) “ 1P(*)II Н^Л*)!® “ *1|| +<й11® - *|| ||/(*)|| • ||® - *|| + £11|® - *|| (||F'(*)|| 4- e,)||® - *|| б2 (3) Г 62 1 при ||® - *|| < 6 := min ||у'(^)Ц +"ё"’^1 J ’ и’ значит> при II® _ *11 < для элементов у = <р(х) и х справедливы неравенства (1)-(3). Тогда ||/(®) - /(*) - ^'(»)[р'(*)[® - *]]|| = (вычтем и добавим ф\у)[<р(х) - ^(#)]) = ||^М®)) - - /(0)М®) - Н*)] + + - £]]|| < (по неравенству треугольника для норм) IIV’^C®)) - V’(v’W) - ^'(^)И®) - ^)1|| + (2) +1|^'(^)[*»(®) - <р^) - р'(£)[® - *1111 £2|Ь(а:) - ^(*)|| 4-1№'(0)11 ’ IH®) “ ^(*) “ У’'(*)[® “ *]||
§ 5. Элементы функционального анализа 73 <3>=C%(|l¥>'(z)|| + е,)||® - *11 + ll^'($)lle> II® - *11 = . = (e2|k'(*)|| + £2ffi + (0)11)11® — *11 <е||х-*||. Это и означает, что отображение / € D(£) и /'(f) = ^(§) 0 ^(^)- Действительно, для любого е > 0 подберем 6i,e2 > 0 так, чтобы выполнялось неравенство £2lk'(£)ll + е2б| +£1||^'($)|| < е. По этим б|,е2 найдем $i,02 > 0, так, чтобы имели место соотношения (1)-(3). По и 62 выбирается б. D) Строгая дифференцируемость. Так как отображение у? Е SD(z), а отображение гр Е SP(§), то по определению строгой дифференцируе- мости для любых £1,б2 > 0, найдутся такие tfi,tf2 > 0, что из неравенств ||®« - #11 < «I, \\yi “ §11 < £2, i = 1,2, следуют неравенства ||^(a;i) - <р(х2) - ¥>'(*)[ж| - ж2]||г £11|®1 - ®2||х, (4) м»1) —Ф(У2) ~ ^'(0)Ь - Ы||г «С е2||з/1 - йНг. (5) Из соотношения (4) по неравенству треугольника для норм следует, что для элементов yi = <p(xi) IIj/1 -3/2II ||^'(*)[®i -®г]II +£|||®1 -®г|| <(l|p'(*)||+ei)ll®i -®г11- (6) Полагая в соотношении (4) х\ = xt-, ж2 = £, имеем также ||^(®,j - Н*) - p'(*)[®i - *] || < б| ll®i - *11, i = 1,2. Отсюда по неравенству треугольника для норм следует, что для элементов Vi = И®;) выполняются неравенства Из/.- -011=М®<) -¥>(*)ll «s |к'(*)[®.- -*1||+б|||®< -*Н с ^||/(*)||-||®<-*|| + £1||®,--*||^(||^(*)||+е1)||®,--*||^«2, *=1,2, (7) ( 62 1 при <£:=min< 77—777771-------------, <$i ?. Следовательно, при ||xt-£||<tf Ilk Wll+ei J для yi = <p(xi) и Xi справедливы неравенства (4)-(7). Тогда ||/(®1) - /(®2) - ^'(0)[Р'(*)[®1 “ ®2]J|| = (вычтем и добавим гр\$)[<р(х\) - у?(®2)]) = IIV’M®!)) - ^(Н®г)) - /(0){^(®1) - ¥>(®2)1 + + ^'(0)М®|) “ ¥>(®2)1 “ ^'(0)1^'(*)1®1 “ ®2П|| < (по неравенству треугольника для норм) И^И®!)) - ^(Н®2)) - ^'(0)[^(®1) “ ^(®г)]II + + |К(0)И®1) “ ~ /(*)1® 1 - ®2]]||W
74 Глава 1. Экстремальные задачи < е2||¥>(®1) - ¥>(®2)|| + ||^'(0)|| • IIН®1) - ^(«2) - - «2]II < (6),(4) б2(||р (£)|| +ei)||®i - ®2|| + |h&'(0)||Ei||®i - ®2|| = = (6211^)11 + £261 + 6i||/(j»||)||®i - ®2|| сП®! - ®2||. Это и означает, что отображение f 6 SD(£). Действительно, для любого е > 0 подберем , в2 > 0 так, чтобы выполнялось неравенство £2||?>'(£)11+ £2^1 + £1Н^(з»11 < По этим €1,62 найдем 62 > 0, так, чтобы имели место соотношения (4)-(7). По и 62 выбирается б. Теорема полностью доказана. Замечание. Теорема о суперпозиции не имеет места для производной Гато. Доказательство, Пусть <р : R2 —* R2, <р(х) = = (ж2,ж2), £ = О, <р(£) = # = О, ♦ *(,„») = [!• »'=»=»>» [0, в остальных случаях. Функция <р дифференцируема по Фреше в точке £ и даже строго диффе- ; ренцируема (проверьте!), функция дифференцируема по Гато в точке у (см. Пример 4, п. 5.2.8). С другой стороны, функция /(®) = </> О <р(х) = ^(®?,®2) = ( 1’ ®1 = ®2> ®2 > 0 * «2 = I®. I, ®2 > 0, L 0, в остальных случаях, являющаяся суперпозицией отображений <р и не дифференцируема по Гато в точке х (и даже не имеет в этой точке производных . по направлениям h = (1,1) и h = (-1,1)). 5.3.2. Формула Тейлора Теорема. [АТФ, с. 159.] Пусть отображение f 6 Dn(£) п раз дифферен- цируемо по Фреше в точке А. Тогда имеет место разложение в ряд Тейлора f(£ + h) = /($) + /'(А)[Л] + Л] + • • • + ^/(п)(*)[Л, • • •, Л]+Ф), J где ||г(Л)|| = o(||h||n) при h—* 0. 5.3.3. Теорема о среднем Хорошо известно, что для числовых функций одного переменного справедлива следующая теорема Лагранжа, называемая иногда также теоремой о среднем значении или формулой конечных приращений: Теорема Лагранжа. Если функция f : [а, Ь] —* R непрерывна на отрезке ' [а, д] и дифференцируема в интервале (а, Ь), то существует точка с € (а, Ъ) такая, что /(Ь)-/(а) = /'(с)(д-а). (*) S
§5. Элементы функционального анализа 75 Замечание 1. Формула (*) остается справедливой и для числовых функ- ций /(®), аргумент которых принадлежит произвольному линейному нор- мированному пространству. Дифференцируемость понимается в смысле Гато. (f: X —► R, X — линейное нормированное пространство, f 6 С[а,Ь]3), Р<;(а.Ь)3 4) => (*))• Доказательство. Полагая <p{t) := / (а + - а)), мы сводим доказа- тельство к случаю функции одной переменной: /(Ь) - /(а) = ^(1) - ^(0) = <р'(0) = /'(а + 6(Ь - a))(b - а) = /'(с)(д - а), где 0 6 (0,1), с — a + 0(b — а) 6 (а, Ъ). Замечание 2. Для векторнозначных функций теорема Лагранжа не верна. Доказательство. Пусть f : R —> R2, f(x) = (sin®,-cosж). Тогда /'(я)[Л] = (cosх, sin х)[Л] = (hcosх, hsin ж), h 6 R. В то же время для любого с /(2тг) - /(0) = (sin 2тг, - cos 2тг) - (sin 0, - cos 0) — (0,0) / / /z(c)[2Tr - 0] = 2?r(cosc,sinc), так как cos с и sine ни для какого с одновременно в ноль не обращаются. Значит, формула (*) для функции / не имеет места. Отметим, что в анализе, как правило, используется не сама форму- ла (*), а вытекающая из нее оценка 17(b) - /(а)| sup |/(с)I • |Ь - а|. с€(а,Ь) Покажем, что в этом более слабом виде утверждение распространяется уже на случай произвольных нормированных пространств. По традиции оно сохраняет название «теорема о среднем», хотя, конечно, его следовало бы назвать «теоремой об оценке конечного приращения». Теорема о среднем. Пусть X,Y — линейные нормированные простран- ства, отображение f : X —> У дифференцируемо по Гато в каждой точке отрезка [а,д]. Тогда ||/(Ь) - /(а)|| sup ||/с(с)|| • ||» - а||. с€(а,6) Доказательство. По лемме Банаха (см. п. 5.4) для любого у 6 Y, а значит, и для у — /(Ь) - /(а) найдется элемент у* € Y* такой, что НЛ = 1 И (у*,у) = 1Ы1, т.е. у, f(b) - f(a)) = ||/(b) - /(<0||. Обозначим <p(t) = (?/*,/(а + f(& - а))). Поскольку у* — линейный непрерывный функционал, а отображение / в каждой точке отрезка 3) Отрезок [а, д] = {х € X | х = a + t(b - а), 0 t 1}. 4> Интервал (а, Ь) = {ж € X | х = a + t(b - а), 0 < t < 1}.
76 Глава 1. Экстремальные задачи [а, д] имеет производную Гато, то по теореме о суперпозиции, пользуясь тем, что производная Фреше линейного непрерывного функционала совпадает с ним самим, получим <p\t) = {у*, f'G (а 4- t(b - а)) [& - а]) Vt е [0,1]. Из дифференцируемости функции ^следует ее непрерывность на отрезке [0,1], и, следовательно, к ней можно применить формулу Лагранжа: у?(1) - у?(0) = в е (0,1). Поэтому ||/(Ь) - /(«)|| = <У*,Ю) - f(a)) = ?(1) - ?(0) = = = (»*,/i(e + ^(b-a))[b-a])ll,,< ||/с(в + ^(Ь-а))[Ь-а1|| ||/с(в + 0(Ь~в))|| • lib-ell < suP ||/g(c)|| • ||b-a||. c€(a,&) Следствие 1. Пусть выполнены все условия теоремы о среднем (f € « оператор Л G Б(Х,У). Тогда ||/(Ь)-7(а)-Л(Ь-а)|| < sup ||/с(<0 -Л|| • ||Ь- а||. с€(а,Ь) Доказательство. Надо применить теорему о среднем к отображению 5(х) = f(x) - Л. Следствие 2. Пусть X,Y — линейные нормированные пространства, отображение F : X Y дифференцируемо по Гато в некоторой окрест- ности точки £, отображение х —> /с(ж) непрерывно в точке х. Тогда отображение f строго дифференцируемо в точке х (а следовательно, и дифференцируемо по Фреше в той же точке). Доказательство. В силу непрерывности отображения х—>/с(ж) в точ- ке ж для любого е > 0 найдется такое б > 0, что || fo(x) - /g(^)|| < £ при ||ш - X|| < д. В силу выпуклости шара В := ,б) — {х | ||х - £|| < из условия я 1,^2 £ В следует, что отрезок [»ь шг] 6 В. По следствию 1 теоремы о среднем с Л = /g(^) получаем ||/(®|) - /(®2) - /g(*)[®1 “ ®2] || sup ||/g(®) -/g(£)|| -Ikl -®2ll O||®1 -®2ll, что означает строгую дифференцируемость отображения f в точке х. Следствие 2 показывает, что при проверке дифференцируемости конкретного функционала достаточно доказать существование произ- водной Гато и проверить ее непрерывность. Это гарантирует строгую дифференцируемость и тем более существование производной Фреше.
§5. Элементы функционального анализа 77 Следствие 3. Существование второй производной Фреше в точке га- рантирует строгую дифференцируемость отображения в этой точке (f € г>2(ж) => / е $ад). Доказательство. Покажем, что все условия для выполнения След- ствия 2 имеются. Действительно, из существования второй производной фреше в точке х следует существование производной Фреше (и, следова- тельно, существование производной Гато) в некоторой окрестности этой точки, а также непрерывность производной Фреше (и, следовательно, непрерывность производной Гато) в точке £. Тогда по Следствию 2 вытекает строгая дифференцируемость отображения в этой точке. 5.3.4. Теорема о полном дифференциале Теорема. Пусть X,Y,Z — линейные нормированные пространства, отображение F : X xY -+ Z имеет в каждой точке (х, у) из некоторой окрестности точки (х,$) Е X xY частные производные Fx(x,y) и Fy(x,y) в смысле Гато, являющиеся непрерывными в точке (£, у). Тогда F Е SD(&, у) строго дифференцируемо в той же точке и при этом F\W)[&4)] = + Доказательство. В силу непрерывности отображений Fx(x,y) и Fy(x,y) в точке (х9$) для любого е > 0 можно найти б > 0 такое, что для любой точки (х,у) из «прямоугольной» окрестности V := х точки (£,у) существуют частные производные Fx(x,y) и Fy(x,y) в смысле Гато и выполняются неравенства ||ГДх,у)-Гв(М)1| <«. ||Fy(a:, у) - ^)|| < е. (*) Легко видеть, что если точки (х\,у\), (а^З/г) лежат в V, то и точка (®2,2/i) С V и, более того, оба отрезка [(»i,3/1), (ж2,3/1)], [(ж2,3/1), (я?2,3/2)] содержатся в V в силу выпуклости множества У. Поэтому отображе- ния х —► F(x,y\) и у —> F(x2,y) дифференцируемы по Гато: первое отображение имеет производную Fx(x,yi) на отрезке [х|, ж2], второе Fy(x29y) на [2/1,3/2]- Применяя следствие 1 теоремы о среднем к этим отображениям, получаем в силу (*) ||F(®l,»i)-F(x2,y2)-F,(M)[®i “ --FyСМ)Ь “Skill = (вычтем и добавим F(a?2,2/i)) = ||F(®i,yi) -F(x2,yt) -F.(M)[®i -®г! + + F(x2,yi) -Г(®2,У2) -Fy(W)[yi - 2/2111 (по неравенству треугольника для норм и Следствию 1 Теоремы о сред- нем) max ||Fi(®,2/i)-Fx(*,^)||-||®i-®г|| + х€(®ь®2)
78 Глава 1. Экстремальные задачи + max ||Гу(®2,у)-Г,(М)||' НУ| “Ы <«Н®1 ~ М + е|1з/1 “Н для любых (®i,3/i),(®2,3/2) £ К что и означает строгую дифференциру- емость отображения F в точке (£,$) и дает явный вид производной Фреше (и полного дифференциала) отображения от двух переменных. 5.4. Дополнительные сведения из алгебры и функционального анализа В этом пункте приводятся дополнительные сведения из алгебры и функционального анализа, которые понадобятся для доказательства теорем об условиях экстремума в гладких экстремальных задачах в нор- мированных пространствах. Определение. Аннулятором А1- множества А линейного нормиро- ванного пространства X называется множество линейных непрерывных функционалов х*, для которых {х*,х) = 0 для любого х 6 А: А1 := {ж* G X* | (х\х) = 0 УжЕ А}. Отметим, что аннулятор А1 всегда содержит нулевой элемент (ж* = 0) сопряженного пространства X*. Лемма о нетривиальности аннулятора. Пусть L — замкнутое соб- ственное (L / X) подпространство линейного нормированного простран- ства X. Тогда аннулятор L1 содержит ненулевой элемент ж* 6 X*. Доказательство. Поскольку L / X, то существует точка ж £ По второй теореме отделимости (о строгой отделимости точки, не при- надлежащей выпуклому замкнутому множеству) существует линейный ; непрерывный функционал ж* G X*, строго разделяющий точку А и под- пространство L (L — подпространство линейного пространства и, еле- * довательно, выпукло) sup {х*,х} < (ж*,£). (*) xf:L | Из этого неравенства следует, что ж* 0. Покажем, что х* 6 L1, т.е. {х*9 х} == 0 Ух 6 L. Действительно, если бы существовало xq 6 L, для ко- ' торого (x*,xq) Ф О', то поскольку ажо 6 L для любого a 6 R, было бы sup (ж*, х) sup (ж*, ажо) = -Ьоо. xEL a€R Это не так в силу неравенства (*). Следовательно, (ж*, ж) = 0 Ух 6 L ? и, поэтому ж* 6 Далее нам понадобятся следующие две теоремы из функционального анализа.
§5. Элементы функционального анализа 79 Теорема Банаха об открытости. [КФ, с. 262; ГТ, с. 109.] Пусть X, Y — банаховы пространства, Л — непрерывный линейный оператор из X в Y, являющийся эпиморфизмом (Л : X ™ У). Тогда образ каждого открытого множества в X открыт в У. Теорема Банаха об обратном операторе. [КФ, с. 213.] Пусть X, Y — банаховы пространства, Л — непрерывный линейный оператор из X в Y, являющийся эпиморфизмом и КегЛ = 0. Тогда существуют обратный оператор Л""1 : У —► X, так же линейный и непрерывный. Лемма Банаха. [ГТ, с. 109.] X — линейное нормированное простран- ство, xqE X. Тогда существует линейный непрерывный функционал х* е X* такой, что ||х*|| = 1, {x*,xQ) = ||жо||. Лемма Банаха является следствием из известной теоремы Хана- Банаха о продолжении линейного функционала. Лемма о правом обратном отображении. Пусть X,Y т- банаховы пространства, Л — непрерывный линейный оператор из X в У, являющийся эпиморфизмом. Тогда существуют отображение M:Y —>Х (необязательно непрерывное и необязательно линейное) и константа С > 0 такие, что Ком = 1у5\ IIAfyll <C’liyll Vyey. Доказательство. Обозначим Вх := {х € X | ||х|| < 1} — открытый шар в пространстве X радиуса 1. По теореме Банаха об открытости образ открытого множества Квх открыт. Поскольку при линейном отображе- нии ноль переходит в ноль, то множество ЛВу содержит внутренней точкой ноль, и, следовательно, содержит какой-то открытый шар с цен- тром в нуле бВу := {у 6 У | ||з/|| < 6}. Значит, для любого у € бВу найдется х(у) такой, что Ах(у) = у, ||я(^)|| < 1. Для любого у 6 У обо- 2|Ы| / бу \ и бу и б значим Му := —— ж( —— ). Тогда Lnr-J = - < б и из определения ’ <5 '2||у||/ Н2||у||Н 2 отображения М имеем: л ./ЭД (6у й 211у11а/ (6у й 2imi 6у HlLf„||- _ЭД г 2||«ll |,Му|1 б V2||y||' б ' \2|Ы|) < tfllyl1’ Лемма о замкнутости образа. Пусть X,Y,Z — банаховы прост- ранства, А : X У, В \ X —> Z — линейные непрерывные операторы, подпространство 1mA замкнуто в У, подпространство ВКегА замкнуто в Z, С :X-+YxZ, Сх := (Ах,Вх). Тогда С — линейный непрерывный оператор и подпространство Im С замкнуто в У х Z. 5) Через Ту обозначается тождественный оператор на пространстве Y.
80 Глава 1. Экстремальные задачи Доказательство. Очевидно, что оператор С линеен и непрерывен. Докажем замкнутость его образа. Замкнутое подпространство Y = Im Л банахового пространства Y — банахово и по определению образа отображения Л : X —> Y — эпиморфизм. По лемме о правом обратном отображении существуют оператор М : Y -* X и константа К > 0 такие, что _ Аом = /?, Уз/er. Пусть точка (у, z) Е Im С принадлежит замыканию образа опе- ратора С. Это означает, что найдется последовательность такая, что у = lim Ахп Е У, z — НтВжп. Положим hn := М(Ахп - у}, zn := В(хп - hn). Тогда по свойству оператора М, получим: НМ = ||М(Ахп - у)|| Ж’Щхп - з/Н -> 0, А(шп - Лп) = Ахп - А(М(Ахп - у)) = Ахп - (Ах„ -у) = у. Поэтому, Bhn —> 0 в силу непрерывности оператора В и z — limzn = НтВ(жп - hn) — lim Вхп, т. е. z принадлежит замыканию множества S — {£ = Вх | Ах = у}. Это множество, как легко видеть, является сдвигом подпространства ВКегЛ, следовательно, замкнуто. Итак, z Е S = S. Это означает, что существует х Е X : Ах — у, Вх = z, т.е. (y.z) 6 Im С. Лемма об аннуляторе ядра регулярного оператора. Пусть X, Y — банаховы пространства. Л : X —* У — линейный непрерывный эпиморфизм. Тогда (КегЛ)1 = Im Л*. Доказательство. А) Докажем, что Im Л* С (КегЛ)1. Возьмем ж* 6 Im Л* О х* = А*у*. Тогда (ж*, ж) = (Л*2/*,ж) = <2/*, Ах} — 0 Уж Е КегЛ. Значит, ж* € (КегЛ)1, т.е. Im Л* С (КегЛ)1. В) Докажем, что (КегЛ)1 С Im Л*. Возьмем ж* € (КегЛ)1, т.е. {х*,х} = 0 Уж Е КегЛ. Применим лемму о замкнутости образа для пространств X. Y, Z = R и отображений Л, Вх := {х*,х}. Усло- вия леммы выполняются: подпространство Im Л = У замкнуто в У, подпространство ВКегЛ = (я*, КегЛ) = 0 замкнуто в Z = R. По лем- ме о замкнутости образа подпространство Im С — Im (Л, ж*) замкнуто bYxZ = YxR. Подпространство Im (Л, ж*) является собственным, так как точка (0,1) £ Im (Л, ж*) (если Лж = 0, то (ж*, ж) = 0/1). По лемме о нетрйвиальности аннулятора замкнутого собственного подпространства существует ненулевой линейный непрерывный функ- ционал (г/*, А) Е (1т(Л,ж*))х Е (У х R)* = У* х R такой, что ((з/*, А), (Лж, (ж*,ж))} = 0 <=> {у*. Лж) + А(ж*,ж) = 0 <=> <==> (Л*2/*, ж) -|- А(ж*, ж) = 0 <==> (А*у* + Аж*, ж) = 0 Уж Е X <=> <=> Л V + Аж* = 0.
§ 5. Элементы функционального анализа 81 Причем А 0 (ибо иначе (у*, Ах) = 0 Vx Е X A=>Y у* = 0 — противоречие). Тогда ж* = А*(-у*/Х) G Im 4*, т.е. (КегЛ)1 С Im Л*. Теорема об обратном отображении. Пусть X,Z — банаховы простран- ства, F t X Z, F(£) 2. Если F G SD(£) и F'(i) является эпиморфиз- мом, то существуют обратное отображение F"1 : W С Z —» X некоторой окрестности W точки z и константа К > 0 такие, что F-1(i) = ж и F(F~'(z)) = z, ||F‘‘(z) - F”1(z)|| sj K\\z - z|| Vz G W. Теорема Люстерника. Пусть X, Z — банаховы пространства, отобра- жение F : X Z, F G SD(£), оператор F'(£) является эпиморфизмом. Тогда существуют отображение <р \U С X —► X некоторой окрестности U точки х и число К > О такие, что F(x + <р(х)) = F(£), ||^(®)|| ЛГ||Г(®) - F(x)|| V® € U. Доказательство этой теоремы основано на модифицированном ме- тоде Ньютона. А) Не ограничивая общности, для краткости записи, считаем, что = 0 и F(£) = 0. По лемме о правом обратном операторе для оператора F'(£) : X—+Z существуют обратное отображение М : Z -* X и константа (не ограничивая общности, можем считать ее большей единицы) С > 1 такие, что F'(&) oM = Iz, IIM^II C||z|| e z. Отображение F € SD(&), поэтому для e = существует 6 > 0 такое, что ||F(®') - F(x") - - x")|| ± ||®' - ®"|| (1) zc* при ||ж'|| < б, ||ж"|| < 6. Из строгой дифференцируемости в точке х = 0 следует также непрерывность непрерывность F в некоторой окрестности нуля. Выберем бВ) 9 столь малым, чтобы ||х|| + C||F(®)|| < 6/2 при ||ш|| < б'. Для элемента х G U := 6(0, б1) определим последовательность элемен- тов Rn} с помощью рекуррентного соотношения Ui п>о, & = ®. (2) В) Докажем по индукции, что ||£п|| < б Vn > 0. Действительно, 1|£о|| = ||ж|| < 6/2. При п = 1 из (2) и леммы о правом обратном операторе получаем оценку ||6 - ж|| = ||MF(x)|| C||F(s)||, (3) откуда по неравенству треугольника для норм ||61| ||ж|| -bC||F(x)|| < 6/2. Пусть 116Ц < 6 при i = 0,1,..., k (fc> 1). Выведем отсюда, что Цб+ill <
82 Глава 1. Экстремальные задачи Из соотношения (2) следует, что &+|-&+МР(&) = 0. Применяя к обеим частям этого равенства оператор получим для i = 0,1,..., к Р'Шш-^i]+F'(£)[MF^i)] = 0 F'(*)[6+i -f.]+F(6)=0, (4) откуда ’ Пб+i - 611 = Нмг(б)|| ^С|№)11 = (вычтем из Г(6) выражение F(6-i) + F'(£)(£i - £,_i) равное нулю в силу " соотношения (4)) = C||F(6) - F(6-|) - F'(Wi - 6-1)|| < Л (01 1 2116 - 6-1II С (аналогично) ^||6-i - 6-2II < => 116+1 - 611 116 " ®Н 2 ^С||Г(®)|| < 1 • р г = 1,..., к. (5) J Отсюда в силу неравенства треугольника для норм получаем » 116+1II = 116+1 ~ 6 + 6 “ б-i + • •• + 6 _ 6 +611 * 116+1 “ 611 +116 “ 6-111 + • • • + 116 - 611 + 116II < ( 1 1 1 \ 6 б с * < \2к+ 2к~'+'" + 2J2 + 2<6' 1 т Таким образом, мы получили, что ||£&+||| < откуда по индукции t следует, что ||£п|| < б для любого п > 0 и неравенство (5) выполняется | для всех элементов последовательности . t С) Из неравенства (5) следует, что i ll£n+m ~ £n|| = ||£n+m ~ £п+т-\ 4" £n+m-l — Сп+т-2 4“•• • "h £п-М — £n 11 ll£n+m — £n+m-ill + ||£n+m-1 ““ £n+m-2ll 4“ ... 4“ ||£n+l “ £n|| /1 1 1 \ 6 2 6 I I ~~T 4“ ? 4- ♦.. 4- — It < — - т —> 0 при n-*oo, \ 2n+m—2 2n J 2 2n 2 ? t. e. {£«}n>o — фундаментальная последовательность и, значит, она | сходится в силу банаховости X. Обозначим у>(ж) = lim £п -х. Поскольку t п-»оо ? ||£п - #11 = ll£n - £n-i 4- £n-i - £п-2 4-... 4- & _ £1 4- £1 - ®Н Т Н£п - £п-1II4- ||£п—1 ~ £п—2II4-... 4- ||£г - £i|| 4- ||£i - ж|| | (5) / 1 1 \ 1 < 116 - *11 + ^2 + • • • + 9 2116 - *1Ь " то ||^(®)|| = Шп ||6 - ®|| 2||6 - шН С 2C||F(a:)|| = ЛГ||Г(®)||
§5. Элементы функционального анализа 83 (положили по определению К = 2С) и II® + У>(ж)|| ||®|| + ||<р(®)|| С ||®|| + 2C||F(®)|| < <5. Отображение F, как объяснялось выше, непрерывно в окрестности £ = 0, и, значит, непрерывно в точке х + <р(х) = lim £rt, и поэтому П-+ОО F(x + <р(х)) = lim F(&) - lim - &) = 0 = F(x). n—>00 П—*00 Пусть X — линейное нормированное пространство, М — некоторое его подмножество. Элемент h G X называется односторонним касатель- ным (полукасательным) вектором к множеству М в точке х Е X, если существуют е > 0 и отображение г : (0, е] —► X, такие, что a) x + th + r(t)eM Vt е (0,е]; Ь) НОН = °(0 при t -> -{-О. Вектор h называется касательным к множеству М в точке х, если векторы h и -h являются односторонними касательными векторами к М в £. Иными словами, элемент h 6 X называется касательным вектором к множеству М в точке £ 6 М, если существуют е > 0 и отображение г : [-£,£] —► X, такие, что a) ь) НОН= °(0 при о* Множество всех касательных векторов к М в точке А обозначает- ся Т&М, множество односторонних касательных векторов обозначается Т%М. Очевидно, что Т&М и Т^М — конусы. Если множество ТАМ является подпространством в X, то оно называется касательным про- странством к множеству М в точке х. Во многих случаях, в том числе и представляющих значительный ин- терес для теории экстремальных задач, множество касательных векторов может быть найдено при помощи такого следствия из теоремы Люстер- ника. Теорема (о касательном пространстве). Пусть X,Z — банаховы про- странства, F : X Z, F Е SD(x), оператор Ff(£) — эпиморфизм, мно- жество М = {х 6 X | F(x) = Г(ж)}. Тогда Т*М = КегГ'(ж). Доказательство. А) Докажем, что Т£М С KerF'(f). Пусть h G Т&М, тогда существуют е > 0 и отображение г : [-е,е] -* X, такие, что х + th -Ь r(t) Е М Vt 6 [-е,е], ||г(0|| = o(t) при t —> 0. При малых t Г(£) = F(x + th + r(t)) = F(x) + tF'(x)[h] + o(t). Отсюда tF'(z)[/i] + o(t) — 0 и, значит, = 0, т.e. he KerFr(x) => T&M C KerF’(x).
84 Глава 1. Экстремальные задачи В) Докажем, что KerF'(£) С Т&М. Пусть h G KerF'(®). Положим r(t) = <р(х + th), где <р — отображение, построенное в теореме Люстер- ника. Тогда при малых t F(& + th + r(t)) = F(£ + th + p(x + th)) = F(x) <^x + th + r(t) e M, ||r(t)||d^||^ + fft)|| ^K\\F(£ + th)-F(&)\\ = = + *(0|| = *И)11 = °(0, t. e. h e TtM => KerF'(a) C TtM. Таким образом, T&M — KerF'(£). 5.5. Задачи Найти производные Фреше следующих отображений. 5.1. f : X —► У, f(x) = Ах, X,Y — линейные нормированные про- странства, Л 6 L(X,Y). В задачах 5.2—5.3, 5.5-5.10 Н — гильбертово пространство. 5.2. f : Н R, f(x) = {а,х)9 a G Я. 5.3. / : Я —> R, f(x) = {x,x). 5.4. f : Rn —► R, f(x) = (Ax,x), A — симметрическая матрица. 5.5. / : Я—» R, f(x) = (x,x)3. 5.6. f : H \ {0} - R, f(x) = ||x|| = ^7} . 5.7. / : Я —» R, f(x) = (x,x)3/2. 5.8. /:Я\{0}-^Я, /(x) = ®||x||. 5.9. f(x) = x||®||3. 5.10. /:Я\{0}^Я, /(®) = й^. IFII 5.11. / : R2 —» R2, f(xi,x2) = (xlx2,xj + x%), Л = (1,2). I 5.12. f : C([0,1]) -> R, f(x( )) = J x(t)dt. о i 5.13. f : C([0,1]) R, f(x( )) = J x(t)a(t)dt, a( ) G C([0,1]). о
§ 5. Элементы функционального анализа 85 5.14. f : С([0,1]) R, /(«(•)) = ( / x(t) dt) . х о 1 5.15. f : С([0,1]) - R, /(«(•)) = J x\t) dt. О 5.16. f : С([0,1]) R, /(х( )) = (У x\t) dt) . О 5.17. f : С([0,1]) R, /(®( )) = (У x2(t)a(t)<tt) , а() G С([0,1]). х о 5.18. f : С([0,1]) - R, /(»(•)) = (Jx\t)a(t)dt^ , а(-) € С([0,1]). 5.19. / : <7([0,1]) -> R, f(x(:)) = x(0). 5.20. / : С([0,1])-+R, /(х()) = х2(1). 5.21. f : С([0,1]) - R, /(«(•)) = х(0)®(1). 5.22. /:С([0,1])-С([0,1]), /(«(•)) = ®2(0)®(1). 5.23. f : С([0,1]) С([0,1]), = ®()®(1). 5.24. f : С([0,1]) -> R, /(®()) = sinx(0). 5.25. f : С([0,1]) -* R, /(ш(-)) = cos®(-). 5.26. / : С([0,1]) —» R, /(ж(-)) = sinx(0)cosx(l). 5.27. f : С([0,1]) —> R, /(х( )) = sin ®(-) cos х(0). 5.28. f : С([0,1]) -+ R, /(х(-)) = sin®(l)cosa:(-). 5.29. f : С([0,1]) R, f(x( )) = el(0). 5.30. / : С([0,1]) - R, /(®(-)) = x(l)l(0) (£(t) > 0 VO < t C 1). 5.31. f : C([0,1]) R, /(®(-)) = (sin®(0))COSit(1). 5.32. f : C([0,1]) C([0,1]), /(®(-)) = <p(t,x(t)), G C-‘(R2). 1 5.33. / : C([0,1])-> R, /(®( )) = j y>(x(t))dt, ^GC'(R). 0
1 86 Глава 1. Экстремальные задачи 5.34. f : С'([0,1]) - С([0,1]), f(x&) = д/1+®2(«). 5.35. f : С1 ([to,11]) - R, f(x()) = L G C'(R3). 5.36. f : C'dio^i]) -» R, = JL(t,x(t),x(t))dt, L G C’(R3). ? to В задачах 5.37-5.39 указать точки, где функции f : Rn —► R не диф- ференцируемы по Фреше. / п \ 1/2 5.37. f(x) = (£>Л • ' >=> . > 5.38. /(®) = max |®,|. п \ 5.39. f(x) = £>,|. 2=1 « § 6. Гладкая задача без ограничений | В этом параграфе даются необходимые и достаточные условия 7 экстремума функционалов в нормированных пространствах. % 6.1. Постановка задачи I Пусть / : X -* R — отображение линейного нормированного про- F странства X во множество действительных чисел (в этом случае обычно говорим функционал на пространстве X), обладающее некоторой глад- костью, т. е. определенными свойствами дифференцируемости. Гладкой I задачей без ограничений называется задача об отыскании экстремумов ; этого функционала: | f(x) —* extr. 6.2. Необходимые условия I порядка Теорема 1 (аналог теоремы Ферма в нормированных пространствах). Пусть х € locextr/ — точка локального экстремума функционала f '< и функционал f дифференцируем по Фреше (имеет вариацию по Лагранжу) в точке х. Тогда /'(f) = 0 (да, ti) = 0 V h е X).
§ 6. Гладкая задача без ограничений 87 Доказательство. Возьмем произвольный, но фиксированный эле- мент h е X. Рассмотрим функцию у?(А) = f(x + Xh). Поскольку f 6 locextr/, то 0 е locextr— локальный экстремум функции По теореме Ферма для функций одной переменной ^д(О) = 0. По опре- делению вариации по Лагранжу это эквивалентно тому, что £/(£, h) = 0. В силу произвольности h h) = 0 V h e X. Если функционал / дифференцируем по Фреше в точке ж, то в этой точке он имеет вариацию по Лагранжу и /'(£)[Л] = tf/(£, h). Поскольку из уже доказанного следует, что эта вариация £/(£, •) = 0, то и f\£) — 0 в силу определения дифференцируемости по Фреше. 6.3. Необходимые и достаточные условия II порядка Теорема 2. Пусть функционал f е D2{£) дважды дифференцируем по Фреше в точке Необходимые условия экстремума: если f е locmin(max)/, то f(x) = 0, /”(£)[Л,Л] > 0 (f"(£)[h,h] 0) УЛ е X. Достаточные условия экстремума: если /'(#) = 0 и f"(£)[h,h] > а||Л||2 (7"(4)[Л,Л] < -а||Л||2) УЛбХ (*) при некотором a > 0, то х е locmin (max) /. Доказательство. По формуле Тейлора /(4 + Л) = /(4) + /'(4)[Л] + р"(Л)[Л, Л] + r(h), r(h) = о(| |Л| |2). Докажем теорему для случая минимума. Случай максимума аналогичен. Необходимость. Поскольку А е locmin/, то, во-первых, по теореме Ферма /'(f) = 0, во-вторых, /(£ + Xh) - /(f) > 0 при достаточно малых А. Поэтому в силу формулы Тейлора 7(4 + АЛ) - 7(4) = — 7"(4)[Л, Л] + г(АЛ) > 0 (г(АЛ) = о(|А|2)) при малых А. Разделим обе части последнего неравенства на А2 и устре- л r(Xh) мим А к нулю. Поскольку --------► 0, то отсюда f"(£)[h,h] 0 VheX. Достаточность. Так как f(i) = 0, то по формуле Тейлора в силу заданного условия /"(£)[Л,Л] > а||Л||2 имеем: /(4 + Л) - 7(4) = | Л] + г(Л) > у ||Л||2 + г(Л) > 0
88 Глава 1. Экстремальные задачи при достаточно малых h, так как r(ti) — о(||Л||2). Следовательно, А Е locmin/. Условие (*) называется условием строгой положительности (отрица- тельности) второй производной Фреше функционала f. Отметим, что в конечномерных пространствах условие положитель- ной определенности симметричной матрицы А гарантирует строгую положительность матрицы А (и, значит, является достаточным условием минимума в стационарной точке). В бесконечномерных пространствах это не так. Пример 7. В бесконечномерных пространствах условие положитель- ной определенности отображения не гарантирует строгой положительно- сти отображения. х2 ‘t-— Л П=1 Второй дифференциал f в нуле 00 h2 Л0)М = 2У^>0 УЛ^О 7^ п и, следовательно, является положительно определенным. Но вместе с тем второй дифференциал отображения / в нуле не является строго положительным. Действительно, неравенство f"(x)[h,h] а||Л||2 Vh не может выполняться ни для какой константы а > 0, поскольку на последовательности векторов {жп} = еп, п = 1,2,... (еп — п-й базисный вектор пространства Z2), п Пример 2. В бесконечномерных пространствах условие равенства нулю первой производной и положительной определенности второй производной не гарантируют локального экстремума отображения. оо / 2 \ / : I2 R, /(®) = 52 ( ту “ 4 ) min. п=1 4 ' Точка х = 0 является стационарной. Действительно, ж = Е - «х) => /'и=о. \ nJ 7 п=1 х ' Второй дифференциал отображения / в нуле 0° » 2 /"(0)[/1,Л]=2\2^>0 УЛ^О n=l
§ 7. Гладкая задача с равенствами 89 и, следовательно, является положительно определенным, но вместе с тем как легко видеть не является строго положительным. В задаче на мини- мум точка х = 0 & locmin/, поскольку на последовательности векторов {шп} = еп/п, п = 1,2,... (еп — n-й базисный вектор пространства J2), f(xn) = 1/п5 - 1/п4 < 0 = /(0) при п > 1, а сама последовательность {еп/п} —* х = 0 в пространстве /2 при п -* +оо. § 7. Гладкая задача с равенствами 7.1. Постановка задачи Пусть X,Y — линейные нормированные пространства. Функционал f : X R и отображение F : X —> Y обладают определенной глад- костью. Гладкой экстремальной задачей с ограничениями типа равенств в нормированных пространствах называется следующая задача: f(x) extr; F(x) = 0. (Р) Отметим, что отображение типа равенства в бесконечномерных пространствах может содержать в себе как конечное, так и бесконечное число равенств. 7.2. Необходимые условия I порядка Теорема (правило множителей Лагранжа). Пусть х 6 locextrР — точ- ка локального экстремума в задаче (Р), X,Y — банаховы пространства (условие банаховости), функционал f и отображение F 6 SD(x) — строго дифференцируемы в точке & (условие гладкости), ImF'(£) — замкнутое подпространство в Y (ослабленное условие регулярности). Тогда суще- ствуют множители Лагранжа Ао 6 R и функционал у* 6 Y* не равные одно- временно нулю, (Ао, у*) Ф 0, и такие, что для функции Лагранжа задачи (Р) А(®) = Ао/(®) + Л®)) выполняется условие стационарности: A'(f) = 0 (о A0(/'(f), Л) 4- <»*,У(«)[Л]> = 0 УЛ е X & & + (г'(а))У,л) = о ул е х Ао/'(а) + (г'(а))У = о). Доказательство. Определим отображение .F(®) :=(/(«)-/(*), F(x)), F:X-^RxY. Очевидно, что отображение F 6 SD(£) и производная Фреше jF'(f) = (/'(f), F'(f)) : X R х У.
90 Глава !. Экстремальные задачи Возможно одно из двух: образ Imp'(я) совпадает или не совпадает со всем пространством R х У. А) Вырожденный случай: 1тР'(:г) R х У. К отображению F'(x) применим лемму о замкнутости образа. Условия леммы выполняются. Действительно, подпространство ImF'(£) замкнуто по условию. Под- пространство /'(Кег-^(®)) также замкнуто. (Множество /'(KerF'(£)) является подпространством в R. Но в R имеются всего два подпро- странства: 0 и R. И оба они замкнутые. Значит, в любом случае подпространство /'(KerF'(£)) замкнуто в R.) По лемме о замкнутости образа подпространство 1тЛ'(^) замкнуто в R х У. Так как оно не со- впадает с R х У, то Imp'(я) — собственное замкнутое подпространство в R х У. По лемме о нетривиальное™ аннулятора существуют число Ао и функционал j/* Е У*, не равные нулю одновременно и такие, что, (Ао, 3/*) 6 ±. Значит, ((A0,3/*),Im^(®))=0 <(А0,/),^)[Л]> = 0 УЛеХ «=* {(Ао,А ((/'(«).*). о <=?> (Xof'(£),h') + {y,,F'(ai)[h]') = O VheX. А это и есть условие стационарности. В) Невырожденный случай: = Rx У. По теореме об обратном отображении существуют отображение 77”1 : Ж С R х У —* X некоторой окрестности W точки (а,#) ((а,#) = (0,0)) и константа К > 0 такие, что F~x(a,y) = х, ^(^~'(а,у))=(а,у), ||7-|(а,з/)-^~|(а,з/)||^Ж'||(а,з/)-(й,$)|| <=> ^||jP-|(a,2/)-^||C^||(a,J/)|| V(a,y)EW. Положим х(е) = для достаточно малого по модулю е. Тогда ^(®(е)) = (М) «=> /(®(е)) - /(®) = е, г(®(е)) = 0, ||х(£) - *|| = ||^-'(е,0) - *|| ЛГ||(е,0)|| = ЛГ|е|. Из этих соотношений следует, что вектор А не доставляет в задаче экстре- мума, ибо вблизи его существуют допустимые векторы х(е), на которых функционал f принимает значения как большие так и меньшие чем /(ж). Получили противоречие с тем, что А 6 locextr Р. Таким образом, невырожденный случай невозможен, и тем самым теорема доказана. Замечание. Если в условиях теоремы выполнено условие регулярности отображения F в точке х, т.е. ImF'(£) = У, то множитель Ао / 0, w, следовательно, можем считать его равным единице: Ао = 1.
§ 7. Гладкая задача с равенствами 91 Действительно, если Ао = 0, то j/* / 0 в силу того, что множители Ла- гранжа одновременно в ноль не обращаются. Поэтому условие стационар- ности приобретает вид: {y\F'(£)[h]) = О УЛ Е X о (y*,Y) = 0 О у* = 0. Получили противоречие. 7.3. Необходимые условия II порядка Теорема. Пусть f 6 locmin Р — точка локального минимума в задаче (Р), X,Y — банаховы пространства (условие банаховости), функцио- нал f и отображение F имеют в точке х вторые производные Фреше (f, F Е P2(f)) (условие гладкости), ImF'(£) = Y (условие регулярно- сти). Тогда существует множитель Лагранжа — функционал у* Е У* та- кой, что для функции Лагранжа с множителем Лагранжа Ао = 1 задачи (Р) Л(®) = f(x) + (y*,F(x)} выполняются условия стационарности: Л'(£) = 0 4- (Г^)) V = 0) (1) и неотрицательности: Л"(£)[Л,Л]^0 VfteKerF'(f). (2) Доказательство. Напомним, что по Следствию 3 п. 5.3.3 существо- вание второй производной Фреше в точке гарантирует строгую диффе- ренцируемость отображения в этой точке. Поэтому условие стационарности (1) с множителем Лагранжа Ао = 1 вытекает из правила множителей Лагранжа для гладкой задачи с равен- ствами и замечания к нему (см. предыдущий пункт). Докажем условие неотрицательности. Возьмем h е KerF'(f). Тог- да по теореме о касательном пространстве KerF'(f) = Т&М, где М = {х Е X | F(x) — F(£) = 0}. Следовательно, h Е Т&М и, зна- чит, существуют е > 0 и отображение т : [-е; е] —» X такие, что F(f -ь th + r(t)) = 0 У £ Е [-е; е] и ||г(£)|| = o(t) при t -* 0. Таким обра- зом, & 4- th + r(t) — допустимый элемент в задаче (Р) при t Е [-е; б] и, так как f Е locminP, то /(f) /(f+th+r(t)). Поэтому по определению функции Л и по формуле Тейлора /(f) s?/(f + th + r(t)) = f(& + th + r(t)) + {y*,F(& + th + r(t))) - (добавим и вычтем (у*, F(f + th + r(t)))) - (y*,F(£ + th + r(t)')') = A(f + th + r(t)) - (y*,F(& + th + = = A(f) + A'(f)[Wi + r(i)] +|A"(f)[fft + r(i),f/i4-r(0] 4-о(||£Л + г(£)||2) = f2 = fW + -A"W[h,h]+o(t2).
92 Глава 1. Экстремальные задачи Отсюда р -A."(£)[h,h] + o(t2)^0 при малых t. Разделим обе части последнего неравенства на t1 и устре- мим t к нулю. Получим Л"(х)[Л,Л] >0. 7.4. Достаточные условия II порядка Теорема. Пусть выполняются условия теоремы о необходимых условиях II порядка (банаховость, гладкость, регулярность, стационарность для функции Лагранжа Л(®) = /(х) + (y*,F(x)') с множителем Ао = 1) и для некоторого а > 0 выполняется условие строгой положительности: Л"(«)[Л,Л] >а||Л||2 VfteKerF'(^)- Тогда х 6 locmin Р — точка локального минимума в задаче (Р). Доказательство. По лемме о правом обратном отображении к отобра- жению Ff(x) : X ™ Y существуют отображение М : Y —> X и константа С > 0 такие, что, F'(f) о М = IY, \\Му\\ С\\у\\ Vy G У. Возьмем z + h — допустимый элемент в задаче (F(£ -Ь h) = 0). Поло- жим •= и обозначим h\ := h-h2. Тогда F'(£)[fy] = F’(£)[h - h2] = Fl(£)[h] - F'(£)M(F'(£)[h]) = F'(£)[b] - F'(£)[h] = 0. Значит, h\ G KerF'(f). По формуле Тейлора 0 = + Л) = F(&) + Г'(£)[Л] + ^F"(x)[h,h] + о(||Л||2) => => F'(f)[ft] = - о(||Л||2). Отсюда существует б > 0 такое, что И(*)1М|| = ||к"(а)[л,л]|| + о(1|л||2) c-illM2 v||ft|| < б с некоторой константой С\ > 0. Поэтому ||ЛгЦ = ||ЛГ(Г'(4)[Л])|| С||Г'(£)[Л]|| CCdl/ill2 СС^||Л|| = е||Л|| при е = ССХ6 и ||Л||-||Л2|| ИМ = ||Л - Л2|| ||Л|| + ||М (1 - е)||Л|| ЦЛ111 (1 4- е)||Л|Ь Вновь по формуле Тейлора /(£ + Л) = Л(£ + Л) = Л(4) + A'(f) [Л] + ^Л"(£)[Л, Л] + о(||Л||2) = л'==0/(«) + ^л"(л)[л,л] + о(11М12).
Л-'*" § 8. Гладкая задача с равенствами и неравенствами 93 Отсюда, обозначая В := ||Л"(£)||, имеем 4- h) - f(x) = 1л"[Л, 4- h2, + Л2] + о(||Л||2) = = | (Л"[Л,, hi J 4- 2Л"[Л!, Л2] 4- Л"[Л2) Л2]) + о(||Л||2) > 1- (а||Л| ||2 - 2ВЦЛ, || • ||Л2|| - В||Л2||2) 4- о(||Л||2) > UNI2 («(1 - £)2 - 2В(1 + е)е - Be2) 4- о(||Л||2) > О при достаточно малых е > 0 (при е = 0 множитель в круглых скобках равен а > 0). Из последнего соотношения следует, что А € locmin Р. § 8. Гладкая задача с равенствами и неравенствами 8.1. Постановка задачи Пусть X, Y — линейные нормированные пространства. Отображение F : X —> У, функционалы fi : X —> R, г = 0,1,... ,m, обладают неко- торой гладкостью. Гладкой экстремальной задачей с ограничениями типа равенств и неравенств в нормированных пространствах называется сле- дующая задача: /о(я) min; /,(ж) О, г=1,...,тп, F(x) = 0. (Р) 8.2. Необходимые условия I порядка Теорема (правило множителей Лагранжа). Пусть А € locminР — точка локального минимума в задаче (Р), X, Y — банаховы пространства (условие банаховости), отображения F,fi 6 SD(£), i = 0,1,... , m, — строго дифференцируемы в точке £ (условие гладкости), ImF'(£) — за- мкнутое подпространство в Y (ослабленное условие регулярности). Тогда существуют множители Лагранжа — вектор А = (Ао, А|,..., Ат) € Rm+1 и функционал у* € У* не равные одновременно нулю, (A,j/*) / 0, и такие, что для функции Лагранжа задачи (Р) т + У* ЭД) 1=о выполняются условия: а) стационарности: Л'(£) = 0
94 Глава 1. Экстремальные задачи (т + У,Г'($)[Л]) = о УЛ € X <* г=О т \ ^£AJ?(f) + (F'(f))V = o); t=O ' b) дополняющей нежесткоспиг. Xifi(£) = О, i = с) неотрицательности'. А, О, i = 0,1,... ,m. Доказательство. Можно считать, что /о(&) = 0, иначе рассмотрим функцию /о(я) = /о(ж) - /о(#)« Если /t(f) / 0 при 1 i тп, то отбросим эти ограничения, поскольку для локального экстремума огра- ничения fi(x) < 0 несущественны и полагаем At- = 0. Таким образом, можно считать, что условия дополняющей нежесткости уже выполнены. А) Вырожденный случай. ImF'(£) / Y. Тогда Im F’ (х) есть замкнутое собственное подпространство Y. По лемме о нетривиальное™ анну- лятора замкнутого собственного подпространства существует ненулевой функционал у* Е (imF'^))1 С У*. Это означает, что {у*9у} — 0 Vy Е ImF'(x) & = 0 Wh Е X <=> (F'(#))*2/* = 0. Остается поло- жить Л,- = 0, i = 0,1,..., тп, и приходим к утверждению теоремы. В) Невырожденный случай. = Y, т.е. оператор F'(£) отобра- жает пространство X на все Y. Положим для 0 k m Ак = {ЛеА-|(Л(*),Л) <0, i = k,...,m, Г'(£)[Л] = 0}. Очевидно, что Aq С А\ С ... С Ат. Лемма 1 (основная). Ао — пустое множество. Доказательство. Предположим противное, т.е. Aq^ 0. Тогда суще- ствует вектор h Е КегР'(ж), для которого (/•(£), Л) <0, i = 0,1,... ,тп. По теореме р касательном пространстве KerF'(A) = Т&М, где М = {х Е X | F(x) = F(f) = 0}. Значит, существует отображение г : [-£,£] —* X (е > 0) такое, что ||г(ОН = °(0, f + th + r(t) ЕМ + th + r(t)) = 0 Wg[-m], (1) При малых t > 0 для i = 0,1,..., m имеем неравенства fi(x + th + r(t)) + h) + o(t)<0. (10 Соотношения (1) и (lj), i = 1,...,m, означают, что при малых t > 0 элемент x + th + r(t) допустимый в задаче (Р). Но при этом неравен- ство (1о) (/о(я + th -Ь r(t)) < 0 = при малых t > 0) противоречит тому, что х е locmin Р.
§8. Гладкая задача с равенствами и неравенствами 95 С) Лемма 2. Если Ат есть пустое множество, то для задачи (Р) верен принцип Лагранжа, Доказательство. Если Am = {h G X | (/т(£)Л) < 0, Fl(x)[Л] = 0} = 0, ТО = 0 Vh G KerF'(£) (действительно, если бы существовало h : > 0, F'(£)[h] = 0, то < 0, F'(£)[-h] = 0 => -h e Am => Am / 0 — противоречие), т.е. /™(£) G (KerF/(^))±- Так как по лемме об аннуляторе ядра регулярного оператора (KerF'(Л))х — Im(F'(&))*, то G Im(F'(£))* и, значит, существует у* G У*, для которого /™(£) 4- (F'(£)) V = 0. Получили условие стационарности функции Лагранжа А(ж) с Ао — • • • = ^т-1 “ 0, Хт — 1. Таким образом, из пп. В) и С) вытекает, что либо принцип Лагранжа уже обоснован (Ат = 0), либо 3 к, 0 к < т : Аь = 0, 0. (2) D) Лемма 3. Если выполнены соотношения (2), то h = 0 является решением следующей задачи’, min; i = k + \,...,m, Р'(г) [Л] = 0. (P) Доказательство. Предположим, что утверждение леммы неверно. Тогда найдется такой элемент ту, что (Л(ж),ту) < 0, 0, i = k +1,..., m, F'(£) [ту] = 0. Пусть £ — элемент, принадлежащий , т-е. <Л-(^)»€> <^0, i + 1,... ,т, F'(£)[£] = 0. Тогда при малом t > 0 элемент ту 4- принадлежит Аь в противоречии с (2). Е) Завершение доказательства. Применим к задаче (Р) теорему Куна—Таккера, учтя при этом, что условие Слейтера для этой задачи выполнено (из-за непустоты A*+i). По этой теореме найдутся неотри- цательные числа Afc = 1, А*+1,...,Лт, такие, что выполняются условия дополняющей нежесткости А< Л(Л) = 0, i = k 4- 1,..., т, и для функции _ __ т Лагранжа задачи (Р) A(7i) = 13 At(/t-(A),k) в точке h = 0 выполнен принцип минимума: min А(Л) = Л(Л) = 0 <=> Л(Л) = V А,•(/,'(£), Л) > Л(Л) = AeKerF'(i) = £М/<(*)>°) = ° Vft€KerF'(4). I=fc _ m Из последнего соотношения вытекает, что Л(Л) = = 0 i=k для любого h. G KerF'(£) (действительно, если бы существовало
96 Глава 1. Экстремальные задачи h е КегГ'(Я) : Л(Л) > 0, то -Л е KerF'(£), Л(-Л) < 0 = Л(Л) - проти- воречит принципу минимума), т. е, 52 € (KerF'(£)) . Поскольку i=k по лемме об аннуляторе ядра регулярного оператора (KerF'(^))1 = Im (F'(^))*> то существует у* е Y*, для которого т ]ГАг/!(*)+(Г'(£))У = 0. i-k Это и есть условие стационарности функции Лагранжа Л(ж), если положить Ло = ... = Afc-i =0. Замечание. Из доказательства теоремы следует, что если ImF'(f) = Y (т.е. если F регулярно в £) и существует элемент h е КегГ'(£), для которого h) <0, i — 1,...,пг, О 0 (назовем это условие аналогом условия Слейтера), то Ао ф 0 и, следовательно, можем полагать Ло = 1. Приведем еще одно доказательство правила множителей Лагранжа в задаче с ограничениями типа равенств и неравенств в нормированных пространствах с использованием элементов выпуклого анализа. Доказательство. Как и в предыдущем случае, не ограничивая общности, считаем, что Л(£)= 0, i — 0,1,... ,пг. Будем рассматривать основной невырожденный случай*. ImF'(£)= У. Рассмотрим задачу без ограничений tp(h) := max (//(ж),Л) -ь £Ker.F'(£)(h) —> min, где &4(-) — индикаторная функция выпуклого множества А. Напомним, \ /0, хЕ А, что6А(х) = [+оо9 . Лемма. Вектор h = 0 доставляет абсолютный минимум функции <р (h = 0 е absmin <р). Доказательство. Доказательство леммы проведем от противного. Предположим, что 0 £ absmin <р. Тогда SabSmin < 0- Следовательно, существует вектор h е КегГ'(й), для которого max < 0 О < 0, i — 0,...,m. Поскольку ImF'(f) = У, то по теореме о касательном пространстве h е KerF'(^) = Т*М9 где М = {х | F(x) = F(f) = О}. Тогда по определению касательного вектора существует отображение г : [-е, е] —► X такое, что F(# + th -Ь r(t)) = 0 Vf Е [-e,e], ||г(ОП = o(t). Поэтому /<(# + th + r(0) = fi(&) + (f№),th + r(t)) + о(|\th -b r(t)11) = h) -b o(t) < 0 при малых t > 0, i = 0,1,..., m.
f.. § 8. Гладкая задача с равенствами и неравенствами 97 Таким образом, вектор я + th -h r(t) является допустимым элементом в задаче (Р), но при этом /0(® + th 4- r(t)) < 0 = /о(^)« Получаем противоречие с тем, что & 6 locminР. Вектор h = 0 доставляет абсолютный минимум выпуклой функции у?, следовательно, по аналогу теоремы Ферма для минимума выпуклой функции 0 е 9<p{h). По теореме Моро—Рокафелл ара субдифференциал суммы функций равен сумме субдифференциалов, значит, о е д<р( ) = д ._max (//(f), •) + dSKerF1 (f)(). По теореме Дубовицкого—Милютина субдифференциал максимума фун- кций равен выпуклой оболочке субдифференциалов, следовательно, д max = conv{/o(£),...,/^(£)}. По определению субдиф- ференциала функции dSKerF1 (f)(0) = {Л* € X* | (Л‘,Л) < <5KerF'(f)(/i) - - 5KerF'(f)(0) Vh е Х}0еК£Г(4) = {Л* | (Л*,Л) < 0KerF'(f)(ft) V/i} - = {h* | (Л*,Л) 0 Vft 6 KerF'(f)} = = (KerF'(f))x = Im(F'(f))* (по лемме об аннуляторе ядра регулярного оператора). Таким образом, 0 е conv{/o(£),... 4- Im (F'(£))*. Значит, существуют вектор т Л е Rm+I такой, что 53^’ = 1, At- 0, и функционал у* е У*, для |=о которых 52 + (F'(a)) V = °- t=0 8.3. Необходимые условия II порядка Теорема. Пусть х 6 locmin Р — точка локального минимума в задаче (Р), X,Y — банаховы пространства (условие банаховости), функционалы Л, г — 0,1,..., m, w отображение F — дважды дифференцируемы по Фреше в некоторой окрестности точки £ (условие гладкости), ImF'(f) = Y (условие регулярности). Тогда max Xxx(£,X9y*)[h9h] >0 VhtK, (Лу*)е£ где Л(ж, A,j/*) = £2л«Л(®) + «=о К := {he Х| (//(A), h) СО, г = 0,1,...,т, F'(f)[Zi] = 0}
98 Глава 1. Экстремальные задачи — конус допустимых вариаций, а £ := < (А,у*) € Rm+I хГ т ^Aif!(£) + (F,(£))y = O; »=0 At/t(£) = 0, i = 1,... ,т; А, > О, i = 0,1,...,т, А, = 1 > / 0. 1=0 ' Множество С — совокупность наборов (А,?/*), для которых выполнены условия а)-с) правила множителей Лагранжа для задач с равенствами т и неравенствами и $2 А, = 1. i=0 Доказательство основано на лемме о минимаксе и теореме Лю- стерника. Непустота множества £ следует из теоремы о необходимых условиях экстремума I порядка в гладкой экстремальной задаче с огра- ничениями типа равенств и неравенств в нормированных пространствах. Лемма 1 (о минимаксе). Пусть X,Y — банаховы пространства, Л. 6 L(X ,Y) — линейный непрерывный оператор из X на пространство Y, АХ = Y, х* 6 I* - функционалы на X, i— 1,..., п, такие, что max > 0 Vx 6 КегЛ; (*) положим S(a,y) := min max (а,4-(®*,®)) для векторов a ERn, у 6 У. Тогда а) величина S(a,y) имеет двойственное представление (п У2^ + {у*,у) где s£(a,y) — опорная функция множества С := |(A,j/*) G R" х х Y* | 23AjxJ + Л*у* = 0, Aj > 0, i = 1,... ,п, 22 A j = 1} в точке («.у); Ь) минимум в определении S(a,y) и максимум в зС(а,у) достигаются. Доказательство. Нетрудно видеть, что следующие три задачи экви- валентны: <р(х) := max {а, -Ь (ж*, ш)} -Ь бМЛх) —► inf, (Pi) где Му {х | Ах + у = 0} (=> Sinf(P|) = S(a,j/)); max {at + &} -> inf; £6 M(y), (P2) t=1_n
§ 8. Падкая задача с равенствами и неравенствами 99 где М(у) := {£= (£i,...,£n)G R” | Эх GX : 6 = <^,х}, Ах +у = 0}; c-*inf; + i = fGM(ji). (P3) Здесь My, M(y) — аффинные многообразия соответственно в X и Rn. Возьмем элемент х, для которого Ах 4- у = 0. Тогда Му = х + КегЛ, и, следовательно, М(у) = {£ | & = {х-,х} + (st*,h), h G КегЛ}. Возьмем произвольный вектор £ 6 М(у). Тогда £ = (х*,х) + (ж*,h), где h G КегЛ. По условию леммы найдется г0 £ {1,...,п} такое, что {x*io,h} 0 и, значит, max {<ц +&} > а,-0 + + (x*i(),h} > > i=l,...,n > min {а,- + {x*i,x}} =: С € М(у) Таким образом, значения задачи (Pz), а вместе с этим и значения задач (Р|),(Р3) ограничены снизу. Задача (Р3) — задача линейного програм- мирования, значит по теореме существования в (Р3) решение существует и, следовательно, в остальных задачах решение также существует. Обо- значим решение в задаче (Р|) через ж. Поскольку ж 6 ArgPi, то (так как <р — выпуклая функция) х 6 absminу?. Отсюда 0 6 д<р(£) и по теореме Моро—Рокафеллара (d(f+g) = Of + dg) 0 G max {а, -Ь (ж*,я)}) + d(<5My(x))| (1) По теореме Дубовицкого—Милютина, если /(£) =#(£), то 0тах{/,0}|$ = conv(d/|f U ЭДД Для наших функций это означает, что max {di 4- t=l,...,n Л,- >0, i = 1, ,n, EA« = L t=l Вычислим субдифференциал второго слагаемого: 0(ШУ(£)) = {®* | {х*,х - £) 6Му(х) - ЬМУ(£) V® G X} = (А — допустимый элемент в задаче (Р\), следовательно, £ G Му и, значит, бМу(£) = 0) = {ж* | {х*,х -£) 6Му(х) Va: € X} = {х* | {х*,х - £) 0 V® G Му} = (поскольку х € Му := {х | Ах + у = 0}, то условие х € Му равносильно условию h = х - £ € КегЛ) = {х* | {x*,h) = 0Vh€ КегЛ} = (КегЛ)1 = 1тЛ*.
100 Глава 1. Экстремальные задачи Тогда из соотношения (1) следует, что существуют вектор А = (Аь..., Ап) и функционал 6 Y*, для которых выполняются соотношения: = 0, А, > 0, = (2) г=1 :=1 При этом, если А, > 0, то по теореме Дубовицкого—Милютина, а,- + = S(a,j/). Далее имеем п п п п s(a> у) = 52 А^(а> у) = 52 а* (<».•+= 52 А'а'+(52 > *)- г=1 t=l i=l t=l n n n = 5? a) = 52 - <#*>> = 52 A«a»’+(y*> y^- i=l i-l i=l n С другой стороны, если (A,y‘) G C, to a»®< + A*j/* = 0 и для любого 1=1 x такого, что Ах 4- у = 0 будет выполнено п п п 52 А«а*’+<у’> у) = 52А«а« <у*>Л®>=52 А<а,‘ ~ <AV. х)й=с «=1 «=1 »=1 п п п = 2 "Ь 2 ^ixi 9 = 2 “Ь t=l »=1 «=1 п max (а,- 4- (®‘, х)) А,- = max (а,- + (а£, х)). «=1,...,п т—' «=1 Тогда п п 52 А‘а’ + ^*’^ .min (ai + (x*i>x}) = S(a,y) = 52^а‘ + <0*>У>> x:Ax+y=0i=l,...,n г=1 t=l т.е. S(a,y)= max (^А,-^ + (у*,у}} = + (у\у). (А,У*)€£ 4=1 / i=l Введем обозначения: х$ := //(Я), Л := Г'(я), а, := ^fi(£)[h,h]9 i = 0,1,... ,m, у := -FH(£)[h,h]9 где h 6 К — некоторый фиксированный вектор. В лемме п. 8.3, использованной при доказательстве необходимых условий I порядка в задачах с равенствами и неравенствами, было дока- зано, что вектор h = 0 доставляет абсолютный минимум функционалу у?, где := max (/f-(f),Zi)+^KerF,(A)(h). Значит, max (//(A), h) 0
§ 8. Гладкая задача с равенствами и неравенствами 101 для любого h 6 KerF'(f). Следовательно, условие (1) леммы о минимак- се выполняется. По этой лемме существует элемент £ = £(h), Л£ + у= 0, для которого max (а< + (я,*, С) = max ( V' А, а,- + {у*,у}) = •=о.т \ " / 1 / т \ = ?+ {y,F"(x)[h,h]) ) = 2 (Л,у’)€£ \ " / = х max A.xx(A,X,y*)[h,h]. (2) 2 (А,у*)€£ По формуле Тейлора в силу условий F((x) [Л] = 0иА£ + л = 0 F(£+th+t2£) = + + = #2 = *>'(£)[£] + уГ"(£)[Л,Л] + o(t2) = t2(M + у) + o(t2) = o(t2). По теореме Люстерника существует отображение <р : U —► X некоторой окрестность точки £ такое, что г(® + ^(ж)) = о, ||^)||^if||F(®)|| Уже и. Полагая r(t) := + th +12£), получим, что при малых t F(£ + th +t2{ + r(0) = F(& + th +t2£ 4- <p(£ + th + ^)) = 0, ||r(0ll ЛЯ* + th + e20ll = o(t2). He ограничивая общности, считаем, что /<(4) = 0, i = 0,1,... ,т. Рас- смотрим задачу: max fi(x) —> min; F(x) = 0. (Р') Лемма 2. же locmin P'. Доказательство. Проведем доказательство леммы от противного. Предположим, что точка £ £ locmin Pf. Тогда для любого 6 > 0 существу- ет точка х = х(6) такая, что ||ж - f || < 6 и max fi(x) < max fi(i) = 0 <=> fi(x) <0, i = 0,... ,m, F(x) = 0. Значит, точка x является допусти- мой в задаче Р и /о(®) < 0 = /о(£)- Следовательно, точка А locminР — противоречие с условием теоремы. Поэтому наше предположение, что точка ± locminР' неверно и, значит, А е locminР'. По лемме 2 при малых t > 0 0= max fi(A) max fi(£+ th + t2£+ r(t)) = max s/t(#) + i=0,1,...,m t=0,l,...,m
102 Глава 1. Экстремальные задачи + f-(£)[th +t2 ( + r(t)] + +К + r(t),th + t2t + r(f)] + o(*2)} = {t2 1 *Л'(£)[Л] + *2/Wl + ^fi(^)[h,h] + o(?) f < 2 J 4(«)[4C0 . ( 11, < t2 max { /!($)[fl + -f№)[h,Л] f + o(t2) = = t2 max {{х*,£) +ai} + o(t2) = max ЛИ(МУ)[М] W)- i=0,l,...,m 2 (A,y*)€£ Разделим обе части неравенства на t2/2 и устремим t нулю. Получим max Azx(£, A,j/*)[/i,h] > 0 для любого вектора h Е К, (А,Г)€£ 8.4. Достаточные условия II порядка Теорема. Пусть выполняются условия теоремы о необходимых услови- ях второго порядка (банаховость, гладкость, регулярность), множество С^0 и для некоторого а > 0 выполняется условие строгой положитель- ности: max Лжж(А,А,з/*)[^,Л] > а||Л||2 (М*)€£ для любого h, принадлежащего конусу допустимых вариаций К, Тогда & Е locmin Р — точка локального минимума в задаче (Р). Доказательство. Не ограничивая общности, считаем, что Д(£) = 0, i = 0,1,..., m. Покажем, что существует б > 0 такое, что условия ^0, i = 0,l,...,m, F(s + /i) = 0 (1) противоречивы при ||Л|| < б, h / 0. Из этого сразу будет следовать, что точка х Е locmin Р. Действительно, пусть вектор h удовлетворяет условию (1) и ||Л|| < Тогда по формуле Тейлора Я(« + Л) = №) + (Л(«), л) + Л] + п(Л), ||г,(Л)|| = о(||Л|I2), F(£ + Л) = ад + ад[Л] + Л] + г(Л), ||г(Л)|| = 0(||Л||2). Введем обозначения: х$ := //(^)» Л := /(®) •= тах а» := Л] + г,(Л), у := |р"(А)[Л,Л] + г(Л). Тогда в силу соотноше- ний (1) разложения перепишутся в виде fi(£ + Л) = {Xi,h) + a,i < 0, г = 0, A.h + y = 0. (2)
§ 8. Гладкая задача с равенствами и неравенствами 103 Откуда <«*, h}+ < |а<I CtIIЛИ2, ЦЛЛЦ = ||у|| Cj ||Л||2. (3) По лемме Хоффмана расстояние от вектора h до конуса допустимых вариаций К оценивается по формуле d(h,K9X) ^С2 *,Л)+ + ||ЛЛ|| <Сз||Л||2. Поэтому вектор h можно представить в виде суммы векторов h = hy + h2, где h\ Е К, а вектор h2 допускает оценку ||Л2|| Gll^ll2- Пусть б2 выбрано так, чтобы из условия ||h|| б2 следовало бы неравенство Сз1|Л|| С z (достаточно положить (02 = хтг)- Тогда 2 \ 2Сз / НМ > ПЫ1 - НМ > 1|Л|| - Сз||Л||2 > ||Л||(1 - С3||Л||) > у и, значит, ||Л2||^Сз||Л||2^4Сз||Л1Ц2. (4) По лемме о компактности множества £ вытекает, что если (А,?/*) 6 £, то II1HI < С4. Пусть <53 настолько мало, что из условия ||й|| < следует неравенство т ГИШ'М С>||2 to 16 ^1|Л>1|2. (5) Обозначим С5 := max ||ЛЖЖ(£,А,з/*)||. Если (А,з/*) е £, то по опре- делению множества £ выполняются условия: А, > 0, г = 0,1,... ,т9 52 А< = 1, 52 А,(ж*,®) + {Л*у*,х} = 0 4* 52А<(®*,®) + (з/‘,Лх) = 0 для |=о 1=0 |=о m любого х Е X. Отсюда $2 А|(ж*,ж) = 0 для любого х 6 КегЛ. Значит, t=0 max (xLx) 0 для любого х Е КегЛ. Следовательно, применима «=0,1,...,т лемма о минимаксе. По этой лемме (0 U) 0> max fi(£ + h)— max {{xt,h} + a,}> *=0,l,...,m i=0,l,...,m / m к min max {{х:,х} + а,}л^*в max ( A,a, + ) = .............. ' = max ( У2 A<—/"(*)1Л> Л] + (У*> *1 / + 5Z А‘Г<(Л) + (Wer 2 \ 2 /
104 Глава 1. Экстремальные задачи + (у*,г(Л))) - max +Л2>Л1 +М - 7IIM2 > / 2 (А,у*)€£ 4 >1 max Лхв(«,А,/)[ЛьЛ|] - С5ЦЛ1 ||||Л2|| - ^НЫ2 - 7IIM2 > 2 (Л,г)€£ 2 4 (iy ЦЛ1II2 - 4СзС5||Л, II3 - 8CjCs||M4 - ^||Л|||1 > о, если только из неравенства ||Л|| < 6 min{^,^}^} следует неравенство ^||Л,||2 >4С3С5||М3 + 8С32С5|1М4^ >4СзС5||М + 8С32С5||М2, которое всегда будет выполняться при достаточно малых h\, а в си- лу неравенства ||Л|| 2||fti|| и при достаточно малых h. Получили противоречие: 0 max fi(x 4- h) > 0. Лемма (о замкнутости). Пусть X — банахово пространство, L,L' С X — подпространства в X, причем L — замкнутое подпространство, а подпространство L1 конечной размерности (dim 17 < 4-оо). Тогда сумма L + L' ~ замкнутое подпространство. Доказательство. Достаточно доказать, что сумма Z-blina для любого вектора a Е X будет замкнутым подпространством (тогда аналогично подпространства L 4- lin {ai, a^}, ..., L 4- lin {ai,..., ап} также будут зам- кнутыми). Если вектор a 6 L, то подпространство L 4- lin а = L замкнуто. Если вектор а £ Ь, то по II теореме об отделимости точка а и подпро- странство L (выпуклое замкнутое множество) строго отделимы. Значит, существует функционал ж* 6 X* такой, что sup {х*, х) < (х*,а). Из этого неравенства вытекает, что х* Е LL —- аннулятору подпространства L. (Если бы существовало xq Е L, для которого (х*, xq) / 0, то посколь- ку axQ Е L для любого а Е R, было бы max {х*, х) max {х*, axQ} = 4-оо. xeL a€R Это не так. Следовательно, {х*,х} = 0 V® Е L и, поэтому х* Е Ь1.) Не ограничивая общности, считаем, что (ж*, а) = 1 (этого мы можем добиться, умножая функционал ж* на какое-то положительное число). Пусть точка z принадлежит замыканию множества L 4-lin a (z Е L -h lin а), т.е. точка z является предельной точкой множества L 4- linа. Следовательно, существуют последовательности £п Е L, Хп Е R такие, что 4- Хпа —\zn—> z. Тогда в силу непрерывности функционала (ж*,zn) —► {x*,z} =:А. С другой стороны, {x*,zn} = (я*,£п 4- Хпа) = (ж*,£п) + An(®*,a) = Ап (здесь (®*,^п) = 0, так как ж* Е Iх, а Е £). Значит, Ап —> А и, следовательно, = zn - Ana z - Ха =:£ Е L (в силу замкнутости L). Отсюда zn = £п 4- Хпа —> £ 4- Ха = z Е L 4- lin а. Таким образом, множество L 4- lin а — замкнуто.
§ 8. Гладкая задача с равенствами и неравенствами 105 Лемма (о компактности £). Пусть X,Y — банаховы пространства, оператор Л 6 L(X,Y), АХ = Y, функционалы ж* Е X*, i= 1,... ,п. Тогда множество £ := {(А,у*) Е R” х К* | Л8ж* -Ь Л* у* =0, А, 0, i = п 1 1,..., n, S Ai = 11 является компактом. Доказательство. Рассмотрим симплекс Е |а Е Rn | At > 0, г — п ч n 1,..., n, А» = 1 г и отображение : Rn —* X* такое, у>(А) ^ixi • t=i ) »=1 Очевидно, что симплекс Е — компакт, а отображение <р непрерывно. То- гда множество y?(S) С X* —• компакт (образ компакта при непрерывном отображении является компактом). Возьмем точку (A,j/*) Е £. Это озна- чает по определению множеств^ £, что р(А) + Л*2/* = 0. Следовательно, множество у?(Е) С Im Л*. По лемме об аннуляторе ядра регулярного оператора Im Л* = (КегЛ)1. Множество (КегЛ)1 замкнуто (аннулятор всегда замкнут), значит, и множество Im Л* замкнуто и, следователь- но, является банаховым пространством. Отметим, что КегЛ* = {0}. (Действительно, если Л* Е КегЛ*, то Л*Л* = 0. Это означает, что (Л*Л*,х} = 0 для любого х Е X, следовательно, (Ь*,Лж) = 0 для любого х Е X, Поскольку ЛХ = Y, то отсюда следует, что Л* = 0). По теореме Банаха об обратном операторе для линейного непрерывного оператора Л* : Y* —* ImA* С X* существует линейный непрерывный обратный опе- ратор Л*-1 : Im Л* У*. Образ компакта при непрерывном отображении является компактом, поэтому Л*-1у?(Е) — компакт. Но тогда и множество {(А, 2/*) 6 £} = {(A,A*“!y>(A)) | А Е Е} также является компактом. Лемма (о двойственности для задачи о кратчайшем расстоянии). Пусть X — линейное нормированное пространство, К С X — непустое выпуклое подмножество. Тогда d(x,K,X)— sup {(х*,х) - sK(x*)}, IMKi где d(x,K,X) = inf {||я-2/|| | у Е К} — расстояние от элемента х до мно- жества К, Доказательство. Напомним некоторые сведения из выпуклого ана- лиза. Опорной функцией множества К С X называется функция sK(x*) =fsup (ж*, ж), конволюцией двух функций f и g называется функ- х£К ция (/ © g)(n) = inf (/(Ж1) -h g(xi)), сопряженной функцией к функ- Я|-Ь®2=а? ции f называется функция /*(ж*) — Бир((ж*,ж) - /(ж)), индикаторной
106 Глава 1. Экстремальные задачи функцией множества К называется функция 6К(х) = { ® имеет место формула (/ ® д)* = f* +д*. Обозначим N(x) := ||®||. Тогда d(x,K,X) = inf H® - ®2ll = inf(||a: - oijll+ ^ЛГ(а:2))<=Ф x2GK x2 d=® inf (||®,|| + ^(®2)) = (iV®^)(a:). ®l+«2=® Тогда по формуле взятия сопряженной функции от конволюции d*(-,K9X)(x*) = (N® бКУ(х') = N*(x*) + (ЯХ)*(®*) = (по определению сопряженной функции) = sup((®*,®) - ||®||) + sup((®*,®) - бК(х)) = = ( +оо |й 5 !’ + sup <®‘>= 6(ВХ'^ + 8К(Х*У I 4-00, ||® || > 1, хек Функция х —► d(x9 К9Х) является непрерывной, выпуклой (в силу вы- пуклости К) и, следовательно, замкнута. Тогда по теореме Фенхеля— Моро (/ = /**) d(x,K,X) = d(x,K,X)** =* sup«®*,®) - 6(ВХ*)(х*) - sK(x*)) = X* = sup ((®*,®) - sK(x*)). IklKi Лемма (о сопряженном конусе). Пусть X,Y — банаховы простран- ства, оператор N. 6 £(Х,У), ЛХ = У, функционалы ®* 6 X*, i = 1,... ,п, конус К := {х 6 X | {х•, х) О, i = 1,..., п, Л® = 0}. Тогда сопряженный конус к конусу К представим в виде X* = ®J е X* So + ^jA,®-+AV = 0, Ai^O, »=1,. 1=1 ,п, /€У*>. т-т rr* def Доказательство. По определению сопряженного множества К = 6 X* | (®$,®) > О V® 6 К}, Пусть 6 X*. Если х 6 КегЛ, то либо существует i € {1,... ,п} такое, что (я*,®) > 0 и тогда max (®*,®) > 0; либо (®*,®) 0, i = значит, ® 6 К и тогда по определению сопряженного множества (®$,®) > 0. Таким образом, в любом случае max (®-,®) > О V® 6 КегЛ. Следовательно, точка
л §8. Гладкая задача с равенствами и неравенствами 107 х = 0 6 absmin( max (х*,х) + ЖегЛ(ж)). По аналогу теоремы Ферма для выпуклых функций 0 G + 0КегА(ж))|х=о = сопу{ж$,я:|,... ,ж*} + 1mA*. п Значит, существует пара (А, у*) € Rn+1 х У* такая, что 52 А<®?+Л*у‘ = 0, i=0 п п А, > 0, » = 0,1,...,п, = 1-Если ло = о,то = о имож- t=0 «=1 п Д. у* но прийти к противоречию. Если Ао / 0, то io4~5^—а^-ЬЛ* — =0. t=i Ао Ао Лемма (Хоффмана). Пусть X,Y — банаховы пространства, оператор А 6 L(X,Y), АХ = У, функционалы х* 6 X*, i — 1,... ,п, конус К := {х € X | (ж*, х} < 0, i = 1,..., п, Ах = 0}. Тогда существует константа С > 0 такая, что d(h,К,Х)<с( £>?,х)+ + ||Л®||). Доказательство. Положим L = Нп{ж*,... ,ж*} 4- Im Л*. По лемме об аннуляторе ядра сюръективного оператора 1mA* = (КегЛ)1 — замкнуто (аннулятор всегда замкнут). Тогда 1mA* — замкнут и, следовательно по лемме о замкнутости L — замкнутое подпространство и тем самым банахово пространство. п Обозначим Л| (А,у*)=+ Л*у*. Тогда оператор Л| G L(R" х Y* ,L). 1=1 Поскольку Л| : R" х У* ™ L, то по лемме о правом обратном отображении существуют оператор М : L -+ R” х У* и константа С > 0 такие, что Л1 о М = IL, ||Af®*|| s$ С||®*|| V®* € L, т.е. если ||®*|| ^1 и Мх* = (А,у*), то п l|M®*||R.xr. :=£|AilWKC. i=l Отсюда следует, что |А,| С, С. По лемме (о двойственности для задачи о кратчайшем расстоянии) d(x,K,X) = sup {{х*,х) - sK(x*)} = sup - sup(»*,Zi)} = llx’lici 1 Лек J
108 Diaea 1. Экстремальные задачи (поскольку К* = {х* G X* | (®*,Л> > 0 УЛ G ЛГ}, то -К* = {ж* 6 X* | (x*,h) ОУ he К}) = sup /(«*,«> - (О’ sup {(ж*,х) I -х* ек*} = 1ИК1 I l+°°> ® £ Л , J 11^11^1 (по лемме о сопряженном конусе) X П -ч = sup < (х*,х} х* = 52 А,®* + Л*/, А,0, i = 1,... ,п, y*eY* > = Ikll^i I J А,ж* + Л* у*, х 0<w, ll/KcU (п \ 22(®;,®)++цл®1|). «=1 ' § 9. Элементы общей теории поля Рассмотрим гладкую экстремальную конечномерную задачу с огра- ничениями типа равенств /(ж) -* min; F(x) = 0. (Р) Здесь f : Rn —► R, F : Rn —> Rm. Функции /,F обладают определенной гладкостью. Стандартным возмущением задачи (Р) называется серия задач с параметром b Е Rm f(x) -> min; F(x) = Ь. (Pb) Теорема (о поле в конечномерных задачах с равенствами). Пусть функции f,F 6 C2(Rn) дважды непрерывно дифференцируемы (условие гладкости), ImF'(£) = Rm (условие регулярности), существует вектор множителей Лагранжа £ Е R™, такой, что для функции Лагранжа А(ж,з/) = f(x) 4- {y,F(x)) задачи (Р) с множителем Лагранжа с Ао = 1 выполняется необходимое условие экстремума I порядка — условие стаци- онарности'. Лж(М) = 0 и достаточное условие экстремума II порядка — условие положительности: Лхт(^,2»[Л,Л] >0 VJiEKerF'(a), Л / 0, Тогда существуют функции х :U и у :U —> Rm, х = х(Ъ), у = у(Ъ), определенные в некоторой окрестности нуля U С <9(0, Rm), для которых ш(0) = А, з/(0) = ; система уравнений ^х(х,у) = 0, F(x) = b
§ 9. Элементы общей теории поля 109 выполняется в этой окрестности тогда и только тогда, когда х = х(Ъ), У = 3/0); причем x(b) Е locmin Рь для любого b£U. Доказательство. Введем отображение Ф : Rn х Rm —► Rn х Rm, дей- ствующее по формуле Ф(ж,у) := (&x(x,y)9F(x)) = (f(x) + {y,F'(x)),F(x)). Тогда Ф(£,$) = (ЛЖ,Г(^)) = (0,0). Покажем, что отображение Ф удовле- творяет условиям теоремы об обратной функции в точке (&у) п.2.2.2. Условие гладкости Ф Е С1 в некоторой окрестности точки (х,у) выпол- няется в силу заданного условия гладкости на функции f,F. Якобиан отображения det Ф'(^, ^) # 0. Действительно: Ф'(М)[(®>2/)] = Ф«(М)[®] + ФуСМИ»] =(AII[o:],F' (*)[«]) + + ((j/,F'(£)),0) = (Л^И + <y,F'(i)>,F'(4)[®J). Если (х,у) е КегФ'(£,#), то F'(£)[a:] = 0 и + = (1) Умножая это векторное равенство на х, получим Лжж[ж,ж] -Ь (y,F'(£)[x]) = Кхх[х,ж] = 0. Отсюда в силу условия положительности х = 0. Поэтому из равенства (1) (3/,F'(#)) — 0. Из условия регулярности ImF'(£) = Rm следует линей- ная независимость строк матрицы F'(£). Следовательно, из равенства (j/,F'(£)) — 0 вытекает, что у = 0. Таким образом, КегФ'(£,$) = 0. Значит, якобиан де1Ф'(£,$) Ф 0. По теореме об обратной функции для отображения Ф существует прообраз точек из некоторой окрестности точки (0,0). В том числе суще- ствует прообраз точек вида (0,Ь) при b Е U Е (9(0). Значит, существуют непрерывные в точке b = 0 функции х :U —>Rnuy:U-► Rm, ж — х(Ъ), У = 3/0), ж(0) = £, з/(0) = #, определенные в некоторой окрестности нуля U е 0(0, Rm), для которых Ф(ж(Ь),1/0)) = (0,Ь) О Лх(ж(Ь),1/0)) = 0, F(x(b)) = Ь. В конечномерном случае положительность матрицы эквивалентна ее строгой положительности. Значит, существует константа р > 0 такая, что Axx(&,^)[h,h] /Я0||2 для любого h Е KerF‘(x). Отображение F'(x(b)) является непрерывным отображением от Ь. Поэтому > ^||А||2 Vft € KerF'(®(6)). Отображение Лжж(ж0),2/0)) является непрерывным отображением от Ь. Следовательно, ||AXJ(x0),y0)) — Azz|| —.
110 Глава 1. Экстремальные задачи Ранг непрерывной матрицы локально постоянен, значит 1тГ'(ж(Ь)) = Rm. Таким образом, при h € KerF'(x(b)) &xx(x(b),y(b))[h,h] = Л.хх(£, y)[h, Л] + + (Axx(x(b),y(b)) - AxM))[h,h] > £||ЛЦ2 - ^|ЛЦ2 = >Ц2- Поэтому в точке ж(Ь) выполняются достаточные условия минимума для точки х(Ь). Следовательно, ж(Ь) 6 locmin Рь. Аналогично доказывается и бесконечномерный вариант этой тео- ремы. Поле экстремалей, которое строится далее при доказательстве до- статочных условий экстремума в вариационном исчислении, будет по- строено таким же образом. Только в качестве возмущающего параметра в вариационном исчислении берутся краевые условия на правом конце. Ответы к задачам главы 1 1.1. (-4,14) G absmin, Smin = -52; Smax = +od. 1.2. (2,3) t locextr, Smin = -oo; Smax = +oo. 1.3. (8,-10) t locextr, Smin = -oo; Smax = ±oo. 1.4. (5,2) G locmin , Smin = -oo; Smax = ±oo. 1.5. (1,1/2, -1) G absmin, Smin = -3/2; Smax = +oo. / 2 1 \ 4 1.6. (-p-p 1) € absmin, Smin = Smax = +00. 1.7. (|> -1, £ locextr , Smin = -OO, Smax = ±00. 1.8. £locextr; Smin =-00, Smax =+00. 1.9. (1,1) G locmax, (-1,1) £ locextr; Smin = -00, Smax = +00. 1.10. (1,1) G locmin, (0,0) £ locextr; Smin = -00, Smax = +00. 1.11. (24,144,-1) G locmin , (0,0, -1) £ locextr; Smin = -00, Smax = +00. 1.12. (1,1) Glocmax, (0,0),(0,3),(3,0) ^locextr; Smin = -oo, Smax = +oo. 1.13. (0,0) £locextr, Smin = -00, Smax = +00. 1.14. (1/2,±1),(-1/2,±1) G absmin, Smin = -9/8; (0,0) G locmax, (0,±1),(±1/2,0) <L locextr; Smax = +00. 1.15. I-^=,-5==) G locmin, G locmax, (±l,0),(0,±l) £ \v2e v2e/ \v2e v2e/ locextr; Smin = -00, Smax = +00. 1.16. (2,3) G locmax, (0,®г) € locmax при x-i G (-00; 0) U (6; +00), (0,2:2) G locmin при 0 < x2 < 6, (0,0),(0,6),(®i,0) £ locextr; Smin = _OO, Smax = ±OO.
Ответы к задачам главы 1 111 1.17. (0,0) Е absmin, Smin = 0; & locextr; Smax = +оо. 1.18. (1, -2) locextr , •S'min ~ 00, Sjnax == -J-00. (7 — 2x2\ 0,®2,---3--), (#l,®2,0)£ locextr; стационарные точки (®ь 0, x$) при некоторых соотношени- ях доставляют локальный минимум, максимум или не доставляют локального экстремума; Smjn = -оо, Smax = 4-оо. О 1 8 1.20. t — — 6 absmin, Smin = Т7> *^тах 4~оо. 3 45 32 8 1.21. f - у G absmin, Smin = —; Smax = +оо. 1.22. (-3 - Тб, -3 - Тб) G absmin, Smin = -4 - 276, (-3 + у/б, -3 + 76) G absmax, Smax = -4 4- 276. 2 L 5s) € absmin> S™n = Smax = +00. (y 2) absmax, Smax = e , Smin = 0. 2-3. (^.-^Gabsmin, Smin=-T2, (-4=,-^) Gabsmax, Smax=v/2. 2.4. (2,-3), (-2,3) G absmin, Smjn = -50, (^,4^, (-|,-4) G absmax, ^max ~ . 4 2-5. -) e absmin, Smin = Smax = +oo. 2.7. 2.6. (-!=,-=,-=) G absmax, Smax =-/14, f-—^=,—^=,--^=) VvT4 V14 714/ \ 714 714 714/ absmin, Smin = -714. 3. 8’ G G absmin, Smi„ = Smax /33 229 \ , . „ 1071 2'8' Vi’”!’’98) € absm,n> Smin =----Smax = +°O. 2‘9‘ (I’5’ I) € absmax’ ~ I’ (°>°>-1) e absmin, Smin = -1. 2.10. (-1,1,1) € absmin, Smin = 0, (1,1,1) G absmax, Smax = 2.
112 2.12. 2.13. 2.14. 2.15. 2.16. 2.17. 2.18. 2.19. 2.20. 2.21. Глава 1. Экстремальные задачи (о, Y» y) е absmax> ^max = 36, (о, Y» -г) е absmin, Smin = 16. (|, I’ locmax, (t,0,1 -1) € locmin при t € (0,1), (t,0,1 -1) € f locmax при t G (-oo, 0) U (1, +oo), (0,0,1), (1,0,0), (i, 1 -1,0) £ locextr Vi, 5max = +oo, Smin = -oo. / 1 , 1 1 \ / 1 , 1 1 \ v . i----7=,±-7=, —= ), I ~7=,±—я,—7=l€absmm, \ -Уб V3 W V\/6 >/3 \/2/ 1 /1.1 1 \ / 1.1 1 \ . Sabsmin- у'б’ Л’ ^)€absmax’ ^absmax== ^у/з * стационарные точки (a?i,0,а?з) E locmin при Ж|Жз > 0 (х2 4-ж2 = 1); (х|,0,®з) 6 locmax при ®i®3 < 0 (х2 + х2 = = 1); (±1,0,0), (0,0,±1) £ locextr; (®1,ж2,0) £ locextr при х । 4- х] = 1. а -— G absrnin, Smin = -|а|. |а| а_=,л b -М а _1(а,«)-Ь| х — х ± d • . tj , bmjn — . Ы2 Ы = ь ^min — — 6| — р“р(а, х — ft) J Стороны прямоугольника: а\у/2,а>2у/2, площадь 2aia2. 2ai 2a2 2аз 8 Стороны параллелепипеда: ~т=, ——^=, объем —т=в|а2вз. v3 v3 v3 3v3 Из точки с координатами (&,&) к параболе у = ах2 (а > 0) мож- но провести три нормали, если точка расположена выше кривой _£ _1 2 £2 = 3 • 2 3 a ± 2“Ia~l; две нормали из точек на этой кривой кроме точки одну нормаль из точек ниже этой кривой и точки (0,2~,a“I). (т \ 2 /,, \ 2 — ) “ ( — ) = 1 • Из точки с ко- Л] / \ а>2 / ординатами (£i,&) можно провести три нормали к ближайшей ве- 2 2 2 тви гиперболы и одну к дальней, если (£i«1)3 - (^гУ > (а2+ а2)3; две нормали к ближайшей ветви гиперболы и одну к дальней из точек (£ь$2), Для которых последнее неравенство обращается (Л . 2\ й| 4~ л2 1 0, ±------ I; из всех остальных точек плоскости можно провести по одной нормали к каждой ветви гиперболы.
Ответы к задачам главы 1 113 3.2. (О,..., 0) Е absmin, Smin = 0, (±n ^4,..., ±п ,уЧ) € absmax, 5max = \/n, критические точки (0,. ..,0,±т_|/Ч,... ,±7n“*^4) £ locextr (и их всевозможные перестановки координат), m = 1,...,п - 1. 3.3. (0,...,0) 6 absmin, Smjn = 0, (±n“^2,...,±n-1^2) € absmax, Smax=l, критические точки (0,... ,0,±m“^2,... ,±m-1^2) £ locextr (и их всевозможные перестановки координат), т = 2,..., п. 3.4. (0,1) 6 absmin, Smin = е-1 - 1; (1,0) б absmax, Smax = е - 1; (0,0) £ locextr. 3.5. (0,0) Е absmin, Smin = 0; (л/3/2,1/2) Е absmax, 5max = 5/4; крити- ческая точка (0,1) £ locextr. 3.6. (0,0,0) Е absmin, Smin = 0; (12,0,0),(0,12,0),(0,0,12) Е absmax, Smax = 144; (4,4,4), (0,6,6), (6,0,6), (6,6,0) £ locextr. 3.7. (0,0,0) E absmin, Smin = 0; (0,12,0) E absmax, 5max — 576, (£, ^), (^. '-I,o), (o.^4),(6,0,6),(.2,0,0),(0,0,12) I locmax. 3-8. (z’z) е absmin, Sabsmin = -7; “---------- " \о о/ 133 3 максимум (о, , ( g, g ) £ locextr; (о, Е locmax, Sabsrnax = -Foo. критические точки в задаче на ЗА (Н’Ч)6absmin’ s-=n; (“'j’-j)’ (й-г) е1ос“,г; / 3 1\ (о, -, -) e locmax, 5max = +00. \ 4 4/ 3.10. (-2,0,7) e absmin, Smin = -17; 5max = +00. 3.11. (-5/2,0,20) G absmin, Smjn — -52,5; Smax = +00. 3.12. (16,257,592) £ locextr; Smin = -00; Smax = +00. 3.13. (0,1,0) e absmin; Smin = 0, Smax = +00. 3’14’ \7,~35,~~5/ 6 locmin, Smin = -00; (1,0,3) € locmax, Smax +00; (-1,6, -3) locextr.
114 3.15. 4.1. 4.2. 4.3. 4.4. 4.5. 4.6. 4.7. 4.8. 4.9. 4.10. 4.11. 4.12. 4.13. 4.14. 4.15. 4.16. 4.17. 4.18. 4.19. 4.22. 4.23. Глава 1. Экстремальные задачи (Уб,1, 1),(1,Уб, 1),(1, 1,л/6) € absmin, 5m,n = Уб; (\/г71'71) 6absm“’ s"“ = a > 0. a > 0, b > 0. 1. a,| > 0, <122 0, в||Oj2 — в]2 0. Да. Да. {-3, x < 0, [-3,-1], x = 0, -1, 0 < x < 1, [-1,3], x = l, 3, 1 < x. 0/(0) = [0,1]. 0/(0) = [-i,i]. 0/(O) = {l/ = (l/i,...,2/n)eRB | ы<1} 0/(0) = (у = (у....... € R” I max |%-| 1}. I I J = l,...,n J 0/(o) = {i/ = (i/i,...,i/„)eRn | EI%|<1}. 0/(o) = {i/ = (yi,--.,i/n)eRn | E% = 1, % >o, j = i,...,n 0/(0) = [0, a]. 9/(0) = B* = {x‘eX*|||x*llx-^l}. тах{ж| + \/3®2,Si _ \/Зж2, -2ж|}. f(x) = (_V1-a:2> |®| j J> &=±i. ' (+00, |x| > 1, (0, |®|<1, f(x) = S 1, l®l = 1, ( +oo, |®| > 1. f(t) = e~{, g(x) = x2, fog = e~x2. (1,-1) G absmin, Smin = 3. (-!,-!)€ absmin, 5min = -2.
Ответы к задачам главы 1 115 f- 4.24. a2 + al < 1 => (01,02) € absmin, Smin = a2 + al; a2 + al > 1 => ( ~/===> ~f==== ) e absmin, 5min = 2д/a] + al - 1. ' у al + a2 Vе? + ar 4.25. 0 < a =» (a, a) G absmin, Smin = -2a2 + 2a 1 /1 1\ 1 2 < “ \2’ 2) 6 absmin> Smin = 2’ 5.1. /'(£)[Л] = ЛЛ. 5.2. /'(£)[Л] = (a,h). 5.3. f'(£)[h] = 2(£,h). 5.4. /'($)[*»] = 2(Л*,Л). 5.5. f'(£)[h] = 6{£,£)2{£,h). 5.6. mi4= 5.7. Г(Л)[Л] = 3||4||(*,Л>. 5.8. /'(^)[Л] = П*1|Л + 5.9. /'(£)[>*] = 11*Н3Л + 3£р||(£,Л>. “•"•«•'Й-ТЖ 5.11. /'(*)[(Л|,Л2)1 = (2hi+h2,2ht +4Л2). 5.12. /'(£(•))[&(•)] = У h(t)dt. О 1 5.13. /(^0)14)] = У a(t)h(t)dt. о 5.14. /'(*(•))[/»(•)] = З^У£(t)dtj • Jh(t)dt. О о 5.15. /'($(•))[&(•)] = 3 У &2(t)h(t)dt. О 5.16. т))[л()1=б(У &4t)dt\2 j 4 о о
116 5.17. 5.18. 5.19. 5.20. 5.21. 5.22. 5.23. 5.24. 5.25. 5.26. 5.27. 5.28. 5.29. 5.30. 5.31. 5.32. 5.33. 5.34. 5.35. 5.36. 5.37. 5.38. 5.39. Глава 1. Экстремальные задачи /'(£(•))[&(•)] = 6 ( У & dtj J £(t)a(t)h(t) dt. 0 0 f1 (f (•))[/»(•)] = 6 j &\t)a(t) dt J dt. I /'(*(.))[Л()] = Л(0). ° ? /'(*(•)№()] = 2А(1)Л(1). /'(*(•))[*(•)] = «(1)Л(0) + А(0)Л(1). /'(£(•))[*(•)] = 2f(0)f(l)ft(0) + f2(0)ft(l). = cos£(0) • Л(0). /,(^( ))[Л(>)] = cos£(0)cos£(l) • Л(0) - sin£(0)sin£(l) • Л(1). 4 /(£(’)) РИ‘)] = cos£(-)cos£(0) • Л(-) - sinA( )sinx(0) • Л(0). | = cos£(l)cos4(-) • Л(1) - sin£(l)sin£(-) • Л(-). J т))[Л(-)1 = е4(о)Л(О). | /'(*(-))[Л( )] = f(l)*<0) (ft(O)lnf(l) + *(0)^) • J m))(A0] = (sinf(0)r4<')(cos*(1)с^(у - f sin f (1)Л(1) In sin £(0)^. f'^(-))[h(-)] = <px(t,£(t))h(t). । S' т))[л(.)1=у^(о)л(ол. I ° f : т»[ад1 = yi + r(0 /'(ОМ)! = Lx(t, £(t),A(t))h(t) + Li(t, £(t), £(t))h(t). <i io | x = 0. | {ж = (si,... 9хп) | = |ж;| для некоторых i {® = (®.....®n) I ®l -®2 • ••• -Xn = 0}. I ,j
Глава 2 Линейное программирование В линейном программировании изучаются задачи об экстремуме линейной функции нескольких переменных при ограничениях типа равенств и неравенств, задаваемых также линейными функциями. Рождение линейного программирования принято отсчитывать от ра- боты Л. В. Канторовича 1939 года об оптимизации раскроя листов фанеры для самолетов и распределения ограниченных ресурсов в более общих проблемах, где впервые было показано, что многие задачи экономики формализуются как задачи об экстремуме линейной функции при линей- ных ограничениях. Канторович для рассмотренного им класса задач ввел двойственные переменные, дал им содержательную экономическую ин- терпретацию и описал алгоритм решения двойственной задачи близкий по духу к симплекс-методу. Через несколько лет (около 1947 года) интерес к подобным задачам возник у американских математиков. Этот интерес был вызван пробле- мами, связанными с экономикой и военно-промышленным комплексом. Из числа экономистов, пропагандировавших среди математиков данный класс задач, следует прежде всего назвать Т. Купманса. Он же ввел термин «линейное программирование» (linear programming). Впослед- ствии Канторовичу и Купмансу была присуждена Нобелевская премия по экономике за 1975 год. Слово «программирование» заимствовано из зарубежной литературы и в данном случае означает не что иное, как «планирование». Симплекс-метод был разработан Д. Данцигом. Общая теория была построена коллективом математиков, среди которых следует отметить так же Куна, Таккера, Гурвица и Дж. фон Неймана. В этой главе рассматриваются постановки задач линейного програм- мирования, правило решения задач в канонической форме по симплекс- методу, приводятся с решениями примеры. Вводится понятие двойствен- ности, проводится обоснование симплекс-метода, дается ряд методов нахождения первоначальной крайней точки. Рассматриваются наиболее известные типы задач линейного программирования — транспортные задачи и задачи о назначении.
118 Глава 2. Линейное программирование §1. Симплекс-метод 1.1. Постановки задач. Геометрическая интерпретация Задачей линейного программирования в канонической форме называется л. задача нахождения максимума линейной функции от п переменных х = (жь... ,хп) f(x) = CiXi+C2X2 + ... +СпХп, J удовлетворяющей системе т линейных неравенств А {а}ж1 -Ь а^х2 4- ... + а”хп = | a2xj + а2х2 -Ь ... + а2хп = Ь2, | 4“ 4~ ... 4“ ®тожп = Ьт, и ограничениями неотрицательности Xj 0, j = 1,...,п. Поскольку ; уравнения системы можно умножать на -1, то считаем, что в задаче J линейного программирования в канонической форме 5, > 0, i = 1,..., тп. В дальнейшем мы, как правило, будем использовать векторно- матричную запись: (с, х} шах; Ах = Ь, ж > 0. (Рк) Здесь х = (ж ],..., жп) 6 R” - неизвестная переменная, заданные вектора с = (cj,..., Сп) е R” и Ъ = (Ь|,..., bm) е Rm, п (с, х) := CjXj — скалярное произведение векторов с и ж, (aj ... а" \ I а1 * ап / ит • • • ит / — заданная матрица со столбцами i а3 = I ... J , j = l,...,n, \dm/ размеров m x n. Функция f называется целевой функцией, вектор с — вектором стой- л мости, вектор Ъ — вектором ограничений, матрица А — матрицей условий. Обозначим Sp — численное значение задачи (Р), ArgP — множество решений задачи (Р), т.е. множество допустимых точек ж 6 R”, для которых (с,ж) = Sp.
§ 1. Симплекс-метод 119 Задачей линейного программирования в общей форме назовем задачу (с, х) -» min; Ах b. (Р) Иногда задачи линейного программирования рассматриваются приве- денными к нормальной форме (с, х) -* max; Ах Ь, х > 0. (Рп) Каноническая форма более удобна при описании алгоритмов ре- шения, задачи в общей и нормальной формах часто используются при рассмотрении проблем существования решений и двойственности. Двой- ственные задачи для задач в нормальной форме приобретают наиболее симметричный вид. Сведение различных форм задач друг к другу Задачи в различных формах легко сводятся друг к другу путем введе- ния дополнительных координат и изменением матрицы А. Все получен- ные формы одной задачи одновременно: а) имеют пустое или непустое множество допустимых точек; Ь) имеют или не имеют конечное решение. Например, если дана задача в нормальной форме, то ее можно свести к задаче в канонической форме путем введения дополнительных координат х = (жп+i,...»хп+т): (с, х) —> max; Ах + 1х = Ь, ж > 0, ж > 0. Здесь I — единичная матрица размеров т х т. В качестве упражнений попробуйте самостоятельно свести другие формы задач линейного программирования друг к другу. Упражнения 1. Свести задачу в канонической форме к задаче в нормальной форме. 2. Свести задачу в канонической форме к задаче в общей форме. 3. Свести задачу в общей форме к задаче в нормальной форме. 4. Свести задачу в общей форме к задаче в канонической форме. 5. Свести задачу в нормальной форме к задаче в общей форме. Геометрическая интерпретация. Рассмотрим более подробно задачу ли- нейного программирования в канонической форме. Через Р(А) будем обозначать множество допустимых точек в задаче (Р*) (P(Pfc) := {я е Rn | Ах = Ь, ж 0}). Множество D(Pk) является выпуклым многогран- ником в пространстве Rn. Линии уровня функционала (с, ж) являются гиперплоскостями. Нетрудно видеть, что экстремум линейной функции (если он существует) достигается в крайней (угловой) точке выпуклого многогранника. Напомним, что точка d выпуклого множества D называется крайней (угловой), если не существует точек d\, di Е D, d\ Ф d2, и числа t E (0,1) таких, что d = td\ 4- (1 - t)d2. У многогранников крайние точки — вер- шины. Имеет место следующая
120 Глава 2. Линейное программирование Теорема Минковского. Выпуклый компакт в R" является выпуклой оболочкой своих крайних точек Число крайних точек множества D, задаваемого в виде конечного чи- сла линейных равенств и неравенств, является конечным. Таким образом, для решения задачи линейного программирования (если оно существу- | ет), достаточно перебрать значения функции (с.х) во всех крайних точках множества D, Но нахождение всех этих крайних точек и перебор значений функции (с, х) — операция довольно трудоемкая. Описывае- ; мый ниже симплекс-метод решения задачи линейного программирования J позволяет, начиная с некоторой исходной крайней точки, переходить к другой по направлению наибольшего возрастания функции (с, х). Свое t название симплекс-метод получил из-за вида множества допустимых эле- ментов, которое в простейших задачах имеет вид симплексов (отрезка, треугольника и т. д.) | Задача (Pk) называется невырожденной, если любая крайняя точка | множества D(Pk) содержит ровно т положительных координат. Пусть х — крайняя точка в невырожденной задаче с положительными f координатами (для определенности первыми) х\,..., хт. Тогда вектор х можно представить в виде х = (хь, хп), где хь = (xi,..., хт) — базисный . вектор, Xi > 0, i = l,...,m, хп = (0,. ..,0) 6 Rn-m — небазисный вектор. Аналогично матрицу А можно представить в виде А = (4&,АП). Будет доказано в п. 3.2, что матрица Аь невырожденная, то есть ее " определитель отличен от нуля. * 1. 2. Правило решения задач по симплекс-методу Для решения невырожденной задачи линейного программирования следует: 1. Привести задачу к задаче в канонической форме (Р*). 2. Отыскать крайнюю точку х = (ш!,...,жт, 0,..., 0), Xi >0, i = l,...,m, множества допустимых элементов D(P*). Методы нахождения на- t чальной крайней точки будут описаны ниже в § 4. | 3. Построить симплексную таблицу для начальной крайней точки х. Пояснения к построению таблицы: В таблице т 4- 4 строки и п + 4 столбца. В первом столбце, начиная с третьего по т + 2-е место, нахо- дятся базисные векторы a!,...,am, соответствующие положительным координатам начальной крайней точки х = (®i, ..., хт, 0,..., 0). , Бесконечномерный аналог этой теоремы: выпуклый компакт в нормированном (и даже локально-выпуклом линейном топологическом) пространстве является выпуклой оболочкой своих крайних точек был доказан Крейном и Мильманом. Его называют теоремой Крейна—Мильмана.
§ 1. Симплекс-метод 121 Во втором столбце на аналогичных местах стоят значения Cj вектора с с теми же номерами, что и столбцы а7. Последний столбец заполняется при исследовании симплексной таблицы. В первой строке, начиная с четвертого столбца, стоят элементы Cj,... ,Сп- Вторая строка, начиная с третьего столбца, — векторы Ъ,а1,...,ап. Под ними — разложения этих векторов по базису а19...,ат. Ясно, m что Ъ = a1 Xi & Ах = Ь. То есть разложением вектора Ъ явля- i=i ется вектор хъ ненулевых координат крайней точки х. Предполо- жим, что вектора a3, j = 1,...,п, имеют следующее разложение m по базису а{9...,ат: а3 = ^a'xij О а3 = Аьх3 о А = АъХ, где г=1 X = {Жу}|=1,...,т — матрица разложений векторов а1,...,а” по базису состоящая из столбцов Тогда X — А^’А, то есть неизвестные векторы-столбцы х3 отыскиваются с помощью обратной матрицы: х3 — А^а?. Очевидно, что при i = 1,...,тп разложения век- / 0 \ торов а* тривиальны: а1 = а*, то есть в этом случае х3 = \ ° / (е3 — вектор-столбец канонического базиса). В предпоследней строке z в столбце под вектором Ъ (ж&) запишем zq = Тогда z0 —- значение функционала в начальной крайней точке х. Под векторами a3, j = 1,...,п, запишем zj = {сь,х3}, то есть z = (z\,..., zn) = сьX. Очевидно, что Zj = с? при j = 1,..., т. с С| Сщ Cm+l . .. сл ... Cn базис ъ (хь) а1 ... ат ат+1 .. . aja an а1 С1 1 ... 0 ®1т+1 ... хИо xln ii. ... ... ... ... ... ... а*0 xio 0 0 1 Xiojo xion ^0 ... ... .. . ат Ст хт 0 1 хтт+1 ... xmjo xmn tm Z (Cj, ХЬ} Cl ^771 (Ct,xm+') {Cb,Xia) {cb, xn) д 0 0 Дт-Н А* дп
122 Глава 2. Линейное программирование В последней строке Д, начиная с четвертого столбца, записывается разность между элементами предпоследней строки и элементами первой строки: Д = z - с О Д, = Zi - с,, i = 1,...,п. 4. Исследовать симплексную таблицу. а) Если Д > 0, то крайняя точка х — решение задачи (х 6 ArgPk). b) Если для некоторого j Ду < 0 и ж7 < О, то значение задачи Spk = -Ьоо. с) Пусть в строке Д имеются отрицательные числа, а соответствующие столбцы х^ содержат положительные числа. Предположим, что min Ду = Ду0 < 0. Ясно, что m + 1 jo п. з Столбец, соответствующий индексу jo называется разрешающим столб- цом. Если min Ду достигается на нескольких значениях j, то в качестве з разрешающего столбца выбираем столбец с любым таким индексом. Обо- значим ti := 5 — a;/,- > 0 > >0. Эти значения Ц ставим соответствен- I J но в последнем столбце симплексной таблицы. Пусть = min ti > 0. Строка вектора а*0 называется разрешающей. Если mini, достигается i на нескольких значениях г, то в качестве разрешающей строки выбираем любую такую строку. Элемент х,оуо называется разрешающим элементом симплексной таблицы. Далее необходимо из числа базисных векторов исключить вектор а*0, вместо него взять вектор а70. Значение функционала на новой крайней точке х' с новыми базисными векторами a1,...,a*0"’l,aj0, a*o+1, ...,am, возрастет на величину -$>0Ду0. 5. Построить новую симплексную таблицу для нового базиса а1,..., а'°~!, a-70, аг°+\..., ат, т. е. фактически разложить векторы Ь, а1,..., а”, по новому базису. Укажем без обоснования (оно будет приведено в п. 3.3) способ по- строения новой симплексной таблицы по предыдущей. Элементы та- блицы x'ij, лежащие под векторами Ь,a1,... ,an, и не лежащие в разре- шающей строке старой симплексной таблицы, вычисляются по правилу прямоугольника*. f _ _ xioxijo ! _ • — Xi , — «Cfj , г ^0, из числа Xij вычесть произведение Xioj на деленное на х^0. Яс- но, что в разрешающем столбце новой симплексной таблицы «|оуо = 1, остальные элементы равны нулю (xjyo =0, i Ф го, г = 1,...,пг). Эле- менты разрешающей строки новой таблицы вычисляются путем деления
§ 1. Симплекс-метод 123 элементов разрешающей строки старой таблицы на величину Xiojo: X1. = _?!»_ х'. . - fisi - 1 п ж»о - > хы ~ . > 3 -1,•••,«. •^ojo ^ojo Далее необходимо вновь исследовать симплексную таблицу, т. е. вернуться к п. 4 и так далее, пока не придем к решению задачи. Отметим, что симплекс-метод позволяет решать точно так же и вы- рожденные задачи линейного программирования. Число положительных координат крайней точки в таких задачах может быть меньше т, но чи- сло базисных векторов всегда равняется рангу матрицы Л, величина может оказаться равной нулю. Теоретически в вырожденных задачах возможно зацикливание, когда через несколько этапов приходим к уже рассмотренной ранее крайней точке и это возвращение может происходить бесконечное число раз. При этом значение целевой функции не меняется и, значит, = 0. Перейти от вырожденной задачи к невырожденной можно путем сколь угодно малого изменения начальных данных задачи. 1.3. Примеры Производственная задача Одним из важнейших экономических прототипов математической модели данной задачи является производственная задача. Пусть на пред- приятии имеются производственные ресурсы (сырье) т типов в объемах Ь1,...,ЬТО. Предприятие производит продукцию п видов. На производ- ство единицы продукции j-ro вида (j = 1,... ,п) требуется использовать ресурс каждого г-го типа в объеме а^. Прибыль от реализации единицы продукции j-го вида равна Cj. Следовательно, при изготовлении Xj еди- ниц продукции каждого вида прибыль предприятия составит величину п cjxj. Надо найти план производства (zj,..., хп) такой, чтобы прибыль предприятия была максимальной. Равенства а-Ж| 4- ajxi 4-Ь = bi будут означать, что весь ресурс каждого г-го типа израсходован полно- стью. Если ресурсы могут быть израсходованы неполностью, то план про- изводства должен удовлетворять неравенствам ----, i = 1,..., m. Можно так же рассматривать смешанную производственную задачу, в которой часть ресурсов должна быть израсходована полностью, а часть может быть израсходована частично. Задача на минимакс Приведем задачу, не являющуюся задачей линейного программиро- вания, но путем замены переменных сводящуюся к задаче линейного программирования.
124 Глава 2. Линейное программирование Пусть f(x) = тахр](ж),...,1*(ж)} — функция п переменных х = (ж|,...,жп) — является максимумом линейных функций. Здесь ls = (cs,x} - d8 — линейные функции, х,с8 е Rn, ds Е R, s = 1,... ,fc, A ~ матрица m x n, b€Rm. Рассмотрим следующую задачу f(x) -* min; Ax = b, ж > 0. (P) В отличие от задачи линейного программирования функция f(x) не явля- ется линейной. Покажем, что задача (Р) эквивалентна задаче линейного программирования яп+1 —► min; Цж)^жп+ь a = l,...,fc, Ах = Ь, ж > 0. (Р') Действительно, если & Е AigP, то (f,fn+i •= /(f)) G ArgP1, (Если допустить, что вектор (f,/(f)) ArgP', то существует вектор х Е Р(Р) такой, что f(x) < /(f) =» f gf ArgP — противоречие.) С другой стороны, если (f,fn+i) € ArgP', то f Е AigP. (Если допустить, что f £• ArgP, то существует вектор х Е Р(Р) такой, что /(ж) < /(f). Значит, вектор (ж, /(ж) Е D(P') и хп+{ < fn+i => (f ,fn+1) i ArgP' — противоречие.) Пример 1. Решить невырожденную задачу линейного программиро- вания в канонической форме 2ж| + жз-Ь жз - Ж4 —> max; ж, 0, i = 1,2,3,4, “ Ж2 4-Жз = 1, 2Ж1+®2 + Ж4 = 3, с заданной начальной крайней точкой ж = (0,0,1,3). Решение. Базисные векторы а3 = (1,0) и а4 = (0,1). Составим первую симплексную таблицу: с 2 1 1 -1 t базис Хъ а1 а2 а3 а4 а3 1 1 1 -1 1 0 а4 -1 3 2 1 0 1 3 Z -2 -1 -2 1 -1 д -3 -3 0 0 Из таблицы видно, что в качестве разрешающего столбца можно взять столбцы а1 и а2. Возьмем для определенности столбец а2. Тогда t = 3, разрешающая строка а4. Заменяем в базисе вектор а4 на вектор а2
§ 1. Симплекс-метод 125 и для нового базиса строим вторую симплексную таблицу: с 2 1 1 -1 t базис Хь а1 а2 а3 а4 а3 1 4 3 0 1 1 а2 1 3 2 1 0 1 Z 7 5 1 1 2 д 3 0 0 3 Вектор Д > О, поэтому точка х = (0,3,4,0) является решением задачи и Smax = 7. Если бы в качестве разрешающего столбца в первой симплексной таблице взяли столбец а1, то пришли бы к той же точке (0,3,4,0), но за большее число шагов. Пример 2. Решить задачу линейного программирования Ш] + х2 4- 4- х4 4- х5 4- Жб —> шах; Xi 0, i = 1,... ,6, Ж] 4“ х2 4- 2®3 4- Зж4 4- 6ш6 = 9, ж24- ж34- х4 4- ж6 = 3, ж3 4- х4 - х5 4- 2я6 = 1, х4 4- х6- 1, с заданной начальной крайней точкой х = (1,2,0,0,1,1). Решение. Базисные векторы а1 — (1,0,0,0), а2 = (1,1,0,0), а5 = (0,0,-1,0) и а6 — (6,1,2,1). Матрица (11 0 6\ 0 1 0 1] 00-121 0 0 0 1/ не является единичной, поэтому найдем для нее обратную матрицу. Для этого записываем рядом две матрицы: нашу матрицу Аь и единичную. Далее сводим матрицу Аь к единичной путем элементарных преобразо- ваний строк. Полученная в результате преобразований матрица на месте единичной матрицы и является обратной к нашей матрице Аь. Напомним, что элементарными преобразованиями матрицы являются: а) перестановка двух строк; Ь) умножение строки на число отличное от нуля и с) прибавление к одной строке другой строки, умноженной на любое число.
126 Глава 2. Линейное программирование /1 1 0 6 1 0 0 О' /1 0 0 5 1 -1 0 0\ 1 0 1 0 1 0 1 0 0 0 1 0 1 0 1 0 01 0 0 -1 2 0 0 1 0 0 0 1 •2 0 0 -1 0 н \0 0 0 1 0 0 0 1, \0 0 0 1 0 0 0 1/ /1 0 0 0 1 • -1 0 —5\ <1 0 0 0 1 -1 0 -5\ 10 1 0 1 0 1 0 0 1 0 1 0 0 0 1 0 -1 I 0 0 1 2 0 0 1 0 0 0 1 0 0 0 -1 2 Г \о 0 0 1 0 0 0 1/ <0 0 0 1 0 0 0 1/ На первом этапе мы умножили третью строку на - -1,1 из первой строки вычли вторую. На втором этапе из первой строки вычли четвертую, умноженную на 5. На третьем этапе из второй строки вычли четвертую, а к третьей строке прибавили удвоенную четвертую. Таким образом, получили, что /1 -1 0 -5\ ,-1 _ 10 1 - 0 0 0 -1 -1 ] 2 ’ \0 0 0 1/ Далее находим разложения векторов а3, , а4 по базису а1, а2, а5, а6: /1 -1 0 —5\ /2\ / 1\ .7 3 _ 4-1„3 _ I 0 1 0 -1 | 1 1 1 - 1 1 1 ® А/, & I Q 0 -1 2 1 ' -1 ’ \о 0 0 1/ \0/ \ 0/ /1 -1 0 —5\ /з\ /-ЗХ 4 л-1 4 | 0 1 0 -1 1 1 1 1 _ 1 0 1 ® — А/, а — I Q 0 -1 2 1 1 | “ 1 г \о 0 0 1/ \ 1 / \ 1/ Разложением вектора Ъ является вектор (1,2,1,1) ненулевых координат крайней точки. Составим первую симплексную таблицу: с 1 1 1 1 1 1 t базис хь а1 а2 а3 а4 а5 а6 а1 1 1 1 0 1 -3 0 0 а2 1 2 0 1 1 0 0 0 а5 1 1 0 0 -1 1 1 0 1 а6 1 1 0 0 0 1 0 1 1 Z 5 1 1 1 -1 1 1 д 0 0 0 -2 0 0
§ 1. Симплекс-метод 127 Разрешающий столбец а4. В качестве разрешающей строки можно взять строки а5 и а6. Возьмем для определенности строку а6. Тогда t = 1, разрешающая строка а6. Заменяем в базисе вектор а6 на вектор а4 и для нового базиса строим вторую симплексную таблицу: с 1 1 1 1 1 1 1 базис Хь а1 а2 а3 а4 а5 а6 а1 1 4 1 0 1 0 0 3 а2 1 2 0 1 1 0 0 0 а5 1 0 0 0 — 1 0 1 -1 а4 1 1 0 0 0 1 0 1 Z 7 1 1 1 1 1 3 д 0 0 0 0 0 2 Вектор А 0, поэтому точка £ = (4,2,0,1,0,0) является решением задачи и Smax = 7. Полученная крайняя точка содержит только три положительные координаты. Значит, решенная нами задача является вырожденной. 1.4. Задачи Задачи линейного программирования в канонической форме с за- данной первоначальной крайней точкой. 1.1. Ж] 4- ж2 + Ху -* max; ж8>0, i = 1,2,3, +Ж2 + Ж3 = 2, ЗЖ1 - Ж2 + Хз = 0, ж0 = (0,1, 1). 1.2. 2Ж| 4- ж24-Зжз4- Ж4-»тах; ж<>0, i = 1,2,3,4, Ж| 4- 2ж2 4- 5жз - Ж4 = 4, Ж] - ж2 - Жз4’2ж4 = 1, ж0 = (0,0,1,1). 1.3. 6Ж| 4-Ж2 4-4жз - 5ж4~*тах; ж» >0, i = 1,2,3,4, ЗЖ1 4- ж2 - Ж3 4* Ж4 = 4, 5ж|4-ж2+ жз - Ж4 = 4, ж0 = (1,0,0,1). 1.4. Ж1 4- ж24-Жз-Ь ж4-*тах; ж4>0, г= 1,2,3,4, Ж| 4- Зж2 4- Жз 4* 2ж4-= 5, 2Ж1 -Жз4- ж4 = 1, ж0 = (0,1,0,1). 1.5. Ж1 + ж24- Жз4- ж44- Ж5 —>max; жв^0, г=1,...,5, 2Ж1 4- Зж2 4- 5ж3 4- 7ж4 4- 9ж5 = 19, Ж1 - ж2 + ж44-2ж5 = 2, ж0 = (0,0,1,2,0).
128 Глава 2. Линейное программирование 1.6. X) + ®2 + ®з + au-* max; х.^0, i= 1,2,3,4, ®i + ®2 + ®з + 3®4 = 3, ®1 + ®2 ~ ®3 + ®4 = 1» ®1-®2 + ®з+ ®4 = 1, ®0 = (0,0,0, 1). 1.7. Х\ 4- 2x2 4- 2жз + ®4 + 6®5 —* max; ®,>0, »=1,...,5, Xt +ЗХ2 + ЗХ3+ ®4 + 9а:5 = 18, Х\ + 5X2 +2®4 + 8®5 = 13, ®з + ®5 = 3, ®о — (0,1,2,0,1). 1.8. ®|-®2 + ®3+ ®4 _ _ ®б“* max; ®,>0, »=1,...,6, 2®i + Х2 4- ®з 4- 3®4 4- Зж5 4- 2хб = 7, ®i - х3 4- х5- х6 = -2, ®2 + ®з+ ®4+ ®5 + 2®6 = 5, х0= (0,0,2,0,1,1). 1.9. ®i + Х2+ Х3 + ЗХ4- Х5~2хв+ ху—»тах; Ж] 4- 2X2 4- 3®6 + ®7 = 8. Xi 4- Зж2 + 2жз + 2®б + 3®7 = 15, Х2 4- Зхз + 2®4 4- 2®5 - Зхв 4- Зх3 = 11, Хз 4- Зж4 4- ®5 - 2®б + ®7 = 5, ®i>0, » = 1,...,7, ®о = (1,0,0,1,0,1,4). ? § 2. Двойственность в линейном программировании 2.1. Элементы выпуклого анализа. Преобразование Лежандра Пусть / : Rn —> R — некоторая функция. Преобразованием Лежандра функции f (или сопряженной функцией к /) называется функция f*(y) :=sup {(х,у) -f(x)}. X Y Из определения /* видно, что /* — верхняя грань семейства аффин- ных функций (ш, у) - f(x). Ее надграфик является выпуклым множеством (как пересечение выпуклых множеств — полупространств). Следователь- но, /* — выпуклая функция. Из определения сопряженной функции следует неравенство Юнга'. (^3/) /(®) + /*Ы Va;,2/GRn. Функция /**(ж) := sup {(®,2/> - /*(?/)}> являющаяся сопряженной у к /*, называется второй сопряженной к /. В теории двойственности для задач линейного программирования важной является следующая теорема выпуклого анализа.
§ 2. Двойственность в линейном программировании 129 Теорема Фенхеля—Моро. [АГТ, с. 37] Собственная функция совпадает со своей второй сопряженной (/(ж) = тогда и только тогда, когда она выпукла и замкнута (т. е. когда ее надграфик epi f — выпуклое и замкнутое множество), 2.2. Примеры Пример 1. Найти первую и вторую сопряженные (в смысле Лежандра) функции к функции f(x) = ах2 + Ъх + с в зависимости от значений параметров а, Ь, с. Решение. По определению сопряженной функции Г (у) = sup {{ж,у) - /(ж)} = sup {ху - аж2 - Ъх - с} = X X = sup {-аж2 + (у - Ъ)х - с}. X j ( у — Ъ\2 Если а > 0, то парабола -аж + (у - Ь)х - с = -а! ж----2аГ) + (у- ь)2 (у-ъ)2 y-b —--------с достигает своего максимума —-------с при ж = ——. 4а 4а 2а Поэтому Найдем вторую сопряженную к /. По определению /**(«) := sup {(х, у} - f (у)} = sup/ху - + с| = у у I 4а J ( {у-Ь- lax)2 2 ) = sup<--------------1- ах + Ъх + с >. » I 4а J п , / \ {у-Ь-lax)2 2 1 Парабола и{у) :=--------------1- ах + Ъх + с достигает своего макси- 4а мума при у = Ь 4- 2аж. Следовательно, (1 (у “ Ь — 2аж)2 о 1 о f (ж) = sup< - --------— 4- аж 4- Ъх 4- с > = аж 4- Ъх 4- с. у I 4а J Если а = 0, то функция (у - Ь)х - с ~> 4-оо, если у / Ъ, при ж —> 4-оо или х —► -оо. Поэтому Г {у) = sup {{у- Ъ)х - с} = | Уу^Ьь'
130 Глава 2. Линейное программирование Найдем вторую сопряженную к /. Нетрудно видеть, что := sup {(х,у) =sup|®y-}=ba: + c. у У I I ~ ’ у -f- U. J Если а < 0, то парабола -ах2 -Ь (у - Ъ)х - с с осями, направленными вверх, стремится к -Ьоо при х —► 4-оо. Значит, f*(y) = +оо. Найдем вторую сопряженную к /. Нетрудно видеть, что f*(x) := sup {{х,у) - f (у)} = sup {ж?/ - (+оо)} = -оо. у у Пример 2. Найти первую и вторую сопряженные (в смысле Лежандра) функции к функции /(ж) = ех. Решение. По определению сопряженной функции f (у) = sup {{х,у) - f(x)} = sup {ху - е®} = sup д(х)9 X XX где д(х) := ху - ех. Найдем максимум функции д(х). Имеем д'(х) = у - ех = 0 х = 1пу при у > 0. Поскольку д"(х) = -ех < 0, то по достаточному условию экстремума гладкой функции при у > 0 в этой точке будет достигаться максимум этой функции. Подставляя х = In 2/ в д(х)9 находим, что sup д(х) ~ у\пу - у. х Если у = 0, то очевидно, что sup д(х) = sup{-e®} = 0. Если у < 0, X X то д(х) —> 4-оо при х -оо. Таким образом, {З/lny-y, у>0, 0, у = О, 4-оо, у < 0. Найдем вторую сопряженную к /. По определению {fy\ny-y, у>0, 'j ху - < 0, у = 0, > = ( 4-оо, у < О J = max {sup {ж?/ - у\пу 4- у},0}. У>0 Нетрудно видеть, что функция и(у) := ху - ylny + у достигает своего максимума при у > 0 в точке обращения в нуль своей производной. Действительно, и(у) = х - In у - 1 4-1 = х - In у = О <^у = ех, и" (у) = -~ < 0 при у > 0.
§ 2. Двойственность в линейном программировании 131 Подставляя это значение у в выражение для /**(ж), получаем /**(ж) = max{sup{»3/ -ylny + у}90} = тах{еж,0} = ех. у>0 Равенство /**(ж) = f(x) = ех следует также непосредственно из тео- ремы Фенхеля—Моро, поскольку функция ех является выпуклой и замк- нутой. 2.3. Вывод двойственных задач 2.3.1. Вывод задачи двойственной к задаче в общей форме Рассмотрим задачу линейного программирования в общей форме (с, х} min; Ах Ь. (Р) Обозначим через S(b) inf {(с, х) | Ах b} — S-функцию зада- чи (Р), рассматривая аргумент Ъ как параметр в задаче (Р). Определение. Двойственной задачей к задаче линейного программиро- вания в общей форме называется задача нахождения второй сопряженной (в смысле Лежандра) функции S**(b) для S-функции задачи (Р). Для нахождения второй сопряженной необходимо найти вначале первую сопряженную функцию к функции S(b): S*(?/) = sup{(3/,b)-S(b)} =sup{(j/,b) - inf{(c,a?) | АжО}} = ь ь х = sup{(У,- (с,®> | Ах С &} = s ® = ь<х [ +оо, иначе {sup{(4‘y-c,®)}, [о, А*у = с, у^О, +*оо, иначе иначе. Найдем сопряженную в смысле Лежандра функцию к функции S*(j/), т.е. вторую сопряженную к функции S(b): S**(b) = sup{(y,b) - S‘(y)} = sup{(y,b) I A*y = с, у 0}. у v Таким образом, двойственной задачей к задаче линейного програм- мирования в общей форме является следующая задача: (Ь, у) —► max; А*у — с, у 0. (Р**) Для задачи линейного программирования в нормальной форме: . (с, х) —> max; Аж О, ж > О, (Рп)
132 Глава 2. Линейное программирование выпишем без доказательства двойственную задачу (попробуйте сделать это самостоятельно): (5, у) rnin; А*У > с, 3/ > О- Как мы видим, двойственная задача в этом случае обладает определен- ной симметрией по отношению к исходной. Элементы Ъ и с меняются местами, максимум меняется на минимум, матрица А меняется на транс- понированную, и матричное неравенство меняет знак. 2.3.2. Вывод задачи двойственной к двойственной задаче для задачи линейного программирования в общей форме Покажем, что понятие «двойственности» введено правильно, т.е. двойственная задача к двойственной является исходной задачей. (5, у) —* max; А*у — с, у 0. (Р«) Для того, чтобы вывести двойственную задачу к задаче (Р**) надо вначале свести ее к задаче линейного программирования в общей форме, для которой уже известна двойственная задача. Вначале сведем задачу на минимум, заменяя функционал (Ъ9у) на функционал (-Ъ,у). Затем заменим равенство А*у = с на два нера- венства с А*у с о А*у с, -Л*у -с. Получим эквивалентную задачу линейного программирования в общей форме: (-5,2/) —► min; Двойственная к ней будет следующая задача: ((с,-с, 0), (ж1, ж2, ж3)) —> max; /ж1 \ (А - А I) I ж2 = -5, ж1 0, ж2 0, \ ж3 7 ж3 ^0. Перепишем эту задачу в виде (с, ж1 - ж2) —► max; Л(ж* - ж2) 4- ж3 — -5, ж1 0, ж2 0, ж3 0. Равенство Л(ж! - ж2) -Ь ж3 = -Ъ эквивалентно неравенству Л(ж! - ж2) > -5, поскольку ж3 0. Обозначим ж = ж2 — ж1, тогда ограничений на знак ж уже не будет. Задача перепишется в виде -(с,ж) —> max; —Ах -Ъ.
§ 2. Двойственность в линейном программировании 133 Заменяя max на min и умножая матричное неравенство на -1, придем к задаче (с, х) -* min; Ах Ь, (Р) являющейся двойственной к задаче (Р**), которая совпадает с исходной задачей (Р). Таким образом, мы убедились, что термин «двойственная задача» используется правильно. 2.3.3. Вывод задачи двойственной к задаче в канонической форме Задачу линейного программирования в канонической форме (с, ж) —> max; Ах — Ь, ж > О, (Р&) сведем к задаче на минимум: (-с, ж) —► min; Ах = Ь, ж > О, , (Р') при этом Spk — -Sp>. Обозначим через S(b) := тГ{(-с,ж) | Ах = Ь, ж > 0} — S-функцию задачи (Р'), рассматривая аргумент Ъ как параметр в задаче (Р'). Найдем первую сопряженную функцию к функции S(d): S*(b*) = sup{ (Ь* - S(b)} = sup{ (Ь* - inf {(-с,ж) | Ах = Ь, ж > 0} } = ъ ь х = 8ир{(Ь*,Ь) + (с,ж) | Ах = Ъ, ж>0} =8ир{(д*,Аж)-Ь(с,ж) |ж>0} = Ъ,х х = sup{(A*b*+С,х} IX 0} = ( °’ А*Ь*+с°’ х 1' ' J (+оо, иначе. Найдем сопряженную в смысле Лежандра функцию к функции S*(b*), т.е. вторую сопряженную к функции S(d): S**(b) = sup{(6*,b) - 5*(Ь*)} = sup{(d‘,b) I A*b* +c 0} => => SP- = -S**(b) = inf{(-b*,b) | A*b* + c sS 0}. k ъ* Полагая у = -b*, получаем Sp” = inf{(?/,b) | -А*у + c 0}, и, следова- k у тельно, имеем следующую двойственную задачу {у, b) min; А^у > с. (Pfc**) 2.3.4. Упражнения 1. Вывести двойственную для задачи линейного программирования в нормальной форме с помощью преобразования Лежандра. 2. Вывести двойственную для задачи линейного программирования в нормальной форме путем сведения ее к общей задаче линейного программирования.
134 Глава 2. Линейное программирование 3. Вывести двойственную для задачи линейного программирования в канонической форме путем сведения ее к общей задаче линейного программирования. 4. Вывести двойственную для задачи линейного программирования (с, ж) —►inf; Ах = Ь, х 0, путем сведения ее к канонической задаче, для которой двойственная известна. 5. Вывести двойственную для задачи линейного программирования в нормальной форме путем сведения ее к канонической задаче. 6. Вывеси двойственную для задачи линейного программирования (с,х) —> inf; Ах Ъ, ж > 0 с помощью преобразования Лежандра. 7. Вывести двойственную для задачи линейного программирования (с, х) —> sup; Аж > Ь, ж > 0 с помощью преобразования Лежандра. § 3. Обоснование симплекс-метода 3.1. Теоремы существования, двойственности, критерий решения Приведем три теоремы, играющие важную роль при обосновании симплекс-метода. Рассмотрим задачу линейного программирования в общей форме (с, ж) —> min; Ах Ь, (Р) где с, ж е Rn, b е Rm, матрица размеров т х п а1 ••• а1 \ ...........I 4 ... <&/ ( в' \ со столбцами а3 = I ... I , j = 1,..., п. \а}т/ Обозначим Sp — численное значение задачи (Р), ArgP — множество решений задачи (Р), т.е. множество допустимых точек ж 6 R”, для которых (с,ж) — Sp. Теорема существования. Если численное значение задачи (Р) конечно (|Sp| < -Ьоо), то ее решение существует (ArgP / 0). Доказательство. Отметим сразу, что поскольку численное значе- ние задачи конечно, то множество допустимых элементов непусто (Р(Р) / 0). Рассмотрим множество К := {(a,z) 6 R х Rm | Зж : (с,ж) а, Ах z}. Ясно, что К — выпуклый конус.
§3. Обоснование симплекс-метода 135 Напомним два определения из выпуклого анализа. Пусть С := {сь... 'С^п} С Rn — некоторое конечное подмноже- т ство. Элемент fc = > О, i = l,...,m, называется конической i=i комбинацией С. Выпуклая коническая оболочка конечного числа точек называется конечнопорожденным конусом. Лемма 1. Конус К — конечнопорожденный. Доказательство леммы 1. Покажем, что К = сопе{±^,... ,±£пло, где (,• = j = т}0 = (1,0,...,0), т/i = (0,1,..., 0),..., 7}m = (0,0,..., 1) — канонический базис в пространстве Rm+I. Вложение cone{±£1,... , • Лт} С К следует из того, что все образующие конуса лежат в К. Действительно, полагая х = ±е,- (ei,...,en — канонический базис в Rn) в определении конуса К, мы получим, что Е К, j = 1,..., п; для векторов щ надо взять х = 0. Обратно, если вектор (a,z) = (a,z\,... ,zm) Е К, то существует х = Е Rn, для которого (с,х) а, Ах z. Значит, для не- которого набора чисел /30 > 0, ..., 0т 0 выполняются соотношения {с,х) +/3о = a, Ax + /3 = z (0 = (01,...,Рт)) <=> n n <=> 52cixi + = “> ^2aixi + Pi ~ j=\ j=l Но это как раз и означает, что п т ^я^ + ^РМ = (<*>*) j=l i=0 Поскольку п п 52 = 52 Ksign x3 • 6)> >1 >1 то (a, z) € cone ...... ±£в, т?0, • • •, Ут}- Лемма 2 (о замкнутости конечнопорожденного конуса). Конечнопо- рожденный конус замкнут. Доказательство. Доказательство проведем индукцией по числу m по- рождающих точек. Если m = 1, то конус К = {х Е Rn | х = tkx, t 0} — полупрямая, очевидно, замкнутая. Пусть теорема верна для конусов, по- рожденных m-1 точкой, m > 2, и пусть заданы m точек k\,..., km. Если конус К = cone &ш} содержит векторы -fc|,..., -km, то К — ко- нечномерное подпространство, т. е. замкнутое множество. В противном
щаяся последовательность, {tni} —► -Ьоо) 136 Глава 2. Линейное программирование случае существует вектор (пусть это будет -fcm), который не принадлежит К (~кт £ К). Обозначим К1 := cone {fc|,..., &m-i}• По предположению индукции конус К1 замкнут и К = {к | к = к1 + tkm, к1 Е Kf, t 0}. Пусть {кп := к,п -Ь tnkm}ne^ последовательность векторов из К, сходящаяся к к Е R” (кп —► к). Из последовательности {Г1} выберем сходящуюся подпоследовательность {tni} i 0. Имеются две воз- можности: либо i конечное число, либо t = +оо. В первом случае получим, что числа k,ni = kni - tnikm —> к - tkm Е Kf (в силу замкнутости конуса К1), т.е. к Е К и, следовательно, К замкнуто. Во втором случае, fc/n* кп* деля kni на tni, имеем: — -Ь кт = — —> 0 при i -4 оо ({&”*} — сходя- С t k,ni . Откуда — сходится к -кт, что невозможно так как -кт & К'. • ; Поскольку Sp — inf {а | Эх: (с,х) = а, то существуют последовательности {я*} и {ск*}, а*—при к—>-Ьоо, для кото- рых {с,хк) = otk, Ахк^Ъ (это означает, что последовательность точек (ак,Ь)ЕК — замкнутому по лемме 2 множеству. Поэтому предельная точка (d,b) Е К, Тогда по определению множества К существует точка £ такая, что (с,£) а = Sp, Ах Ь. Это означает, что £ Е ArgP. Теоре- ма существования доказана. 1 Вернемся к задаче линейного программирования в общей форме. В п. 2.3 мы обозначили через S(b) := inf {(с,х) | Ах Ъ} — S-функцию X задачи (Р), рассматривая аргумент Ъ как параметр в задаче (Р). Лемма 3. S — выпуклая замкнутая функция. Доказательство леммы легко выводится из соотношения epiS = К, где К — выпуклый замкнутый конус, рассмотренный при доказательстве теоремы существования. Лемма 4. Пусть f : R” —► R — выпуклая замкнутая функция и суще- ствует точка z0 такая, что f(zQ) = -оо. Тогда f(z) = -оо Vz Е dom/. Напомним, что двойственной задачей к задаче линейного програм- мирования в общей форме является следующая задача: (Ъ, у) —► шах; А*у = с, у ^0. (Р**) Теорема двойственности. Для пары двойственных задач линейного про- граммирования (Р) и (Р**) имеет место следующая альтернатива*, или зна- чение одной из задач конечно (и тогда конечно значение другой и оба значения совпадают), или множество допустимых элементов в одной из задач пусто (и тогда другая задача либо несовместна, либо имеет бесконечное значение).
§3. Обоснование симплекс-метода 137 Доказательство. 1) Пусть |S(b)| < оо, тогда поскольку по лемме 3 S — выпуклая замкнутая функция, то по лемме 4 S(z) > -оо Vz Е Rm. По теореме Фенхеля—Моро п. 2.1 S**(d) = S(b). Это означает, что конечно значение двойственной задачи и оба значения совпадают. 2) Пусть Dp = 0 (о S(b) = -boo), тогда либо а) существует точка z0 такая, что S(zQ) = -оо, тогда S* = -boo, следовательно, S** = -оо, т.е. Рр** = 0 (это означает, что множество допустимых элементов в двой- ственной задаче пусто), либо b) S(z) > -оо Vz Е Rm, тогда по теореме фенхеля—Моро S**(b) = S(b) = -|-оо (это означает, что двойственная задача имеет бесконечное значение). Критерий решения. Пусть х,у — допустимые элементы в задачах (Р) и (Р**) соответственно (£ Е Р(Р), $ 6 Р(Р**)). Тогда точки х,у явля- ются решениями в задачах (Р) и (Р**) соответственно (Л Е ArgP, у Е ArgP**) тогда и только тогда, когда М> = <$,&>. Доказательство. Необходимость. Пусть £ Е ArgP**, тогда у Е Р(Р**) и (ihty — Sp**. Аналогично, £ Е ArgP, тогда х Е D(P) и (с,х) = Sp. Значение задачи (Р) при этом конечно (|Sp| < -boo). Значит по теореме двойственности значение двойственной задачи также конечно и оба значения совпадают (Sp = Sp**). Следовательно, (с,х) = (у,Ь). Достаточность. Пусть х Е D(P), у Е Р(Р**) и (с, х) = ($,Ь). Возь- мем произвольные допустимые элементы х Е D(P), у Е D(P**). Это означает, что Ах < д, А*у = с, у 0. В силу этих условий на х и у имеем (с, х) = (А*у,х) = (у, Ах) (у,Ь). Из этого соотношения вытекает, что (с, х) (#,Ь) = (с, х) Уя Е D(P). Это означает, что ж Е ArgP. Аналогично доказывается, что уЕArgP**. и 3.2. Свойства множества допустимых точек Рассмотрим задачу линейного программирования в канонической форме (с, х) —► max; Ах = Ь, х 0. (Pk) Предложение 1. Пусть ж = (®i,... ,я*,0,... ,0) Е Rn, ж, > 0, i = 1,..., fc, — допустимая точка в задаче (Pk) (х Е D(Pk)). Тогда х является крайней точкой множества допустимых элементов D(Pk) тогда и только тогда, когда столбцы а[,...,ак матрицы А линейно независимы. Доказательство. Необходимость. Пусть х — крайняя точка. Дока- жем, что тогда столбцы а1,...,^ линейно независимы. Доказатель- ство будем вести от противного. Допустим противное, что столбцы
138 Глава 2. Линейное программирование а1,..., а* линейно зависимы. Тогда существует ненулевой набор мно* * жителей Ai,...,A* такой, что 53А,а* = 0. Значит АХ = 0 для вектора «=1 А = (Ai,..., А*,0,...,0) Е R”. Поэтому точка x(t) := х -НА Е Dpk при малых t как больше, так и меньше нуля. Это означает, что точка ж не является крайней. Получили противоречие. Значит, наше допущение, что столбцы а1,...,а* линейно зависимы — неверно. То есть столбцы а1,..., ак линейно независимы. Достаточность. Пусть столбцы, соответствующие положительным координатам точки х линейно независимы. Для определенности будем считать, что это столбцы а1,...,^. Докажем, что тогда х — крайняя точка. Доказательство вновь будем вести от противного. Допустим противное, что х не является крайней точкой. Тогда существуют точки у Е D(Pk) и z Е B(Pfc), у Ф z, отличные от х и число t Е (0,1) такие, что х = ty + (1 - t)z. Из этого равенства и условий х = (»j,... ,ж*,0,... ,0), Xi > 0, г = l,...,fc, y,z 0 вытекает, что у = (з/i,... ... ,0), к z = (zi,...,zfc,0,...,0). А из условий Ay — b & YyiaX = Ь, Az = Ъ & «-1 к , к , = Ъ следует, что Y(Vi ~ zi)a* = 0- Это означает, что столбцы «=1 г=1 а1,...,ак линейно зависимы. Получили противоречие. Значит, наше допущение, что х не является крайней точкой — неверно. То есть х является крайней точкой. Поскольку количество линейно независимых столбцов не может превышать количества строк матрицы А, то крайняя точка содержит не более т положительных элементов. Предложение 2. Пусть (Р*) — невырожденная задача линейного про- граммирования в канонической форме, х = (х^,..., хь> 0,..., 0) € R”, > 0, г = 1,..., к, — допустимая точка в задаче (Pk) (х Е D(P&)). Тогда a) fc > тп; Ь) точка х является крайней точкой множества допустимых элементов D(Pk) тогда и только тогда, когда к = т. Доказательство, а) Доказательство будем вести от противного. До- пустим противное, что существует допустимая точка, у которой менее тп положительных координат. Для определенности пусть это первые к ко- ординат (к < тп). Рассмотрим множество D = {у Е R* | Ау = Ъ, у 0}, где А := {а1,...,а*} — матрица, состоящая из_ первых к столбцов исходной матрицы А. Точка х = (xi,...,Xk) 6 D, то есть множество D непусто. Пусть у -г крайняя точка множества D (докажите само- стоятельно ее существование). У нее число положительных координат I (I < к < т) будет меньше т и соответствующие I столбцов матрицы А по предложению 1 линейно независимы. Тогда вновь по предложению 1
§ 3. Обоснование симплекс-метода 139 точка £ = (#, 0,..., 0) 6 Rn будет крайней точкой множества допусти- мых элементов в задаче (Р), причем число положительных координат I у нее меньше т. Это противоречит невырожденности задачи. Значит, наше допущение, что существует допустимая точка, у которой имеется менее т положительных координат, неверно. То есть к > т, Ь) Необходимость непосредственно следует из определения невыро- жденной задачи (в невырожденной задаче любая крайняя точка имеет ровно т положительных координат). Достаточность, Пусть х = (ж|,... ,жт,0,... ,0) 6 Dpk, жг > 0, i = — допустимая точка в задаче (Pfc). Докажем, что тогда х — крайняя точка множества допустимых элементов. Доказательство будем вести от противного. Предположим противное, что точка х не является крайней. Тогда по предложению 1 столбцы а1,..., ат матрицы А линей- но зависимы. Это означает, что существует ненулевой набор множителей т Л1,...,Ат такой, что 52А:аг = 0. Значит, ЛА = 0 для вектора А = «=1 (А],..., Ат,0,... ,0) £ Rn. Поэтому А(х 4- tX) = Ах 4- tAX = Ах = b Vt, а вектор х 4- tX 0 при малых t как больше, так и меньше нуля, т. е. х 4- tX С DPk. Поскольку Xi + tXi = Xi > 0 при t = 0, то увеличивая |t|, придем к случаю, когда еще одна координата вектора х + tX обратится а ноль, а все остальные по-прежнему больше или равняются нулю. Таким д образом, при некотором t допустимая точка х -h tX будет иметь менее т положительных координат. Это противоречит пункту а) данного предло- жения. Получили противоречие. Значит, наше предположение, что точ- ка х не является крайней — неверно. То есть х является крайней точкой. 3.3. Доказательство симплекс-метода Рассмотрим невырожденную задачу линейного программирования в канонической форме (с, х) max; Ах = Ь, ж > 0. (Рк) Напомним, что двойственной к ней является следующая задача: А*у^с. (Р") При изложении правила решения задачи в канонической форме мы пользовались фактами, которые были даны там без обоснования. Сейчас мы их докажем, оформив утверждение в виде теоремы. Теорема. Пусть ж = (ж],...,жто,0,..., 0) € Rn, Xi >0, i= 1,..., т — крайняя точка множества допустимых элементов D(Pk). Тогда: а) если А^$,то вектор ж — решение задачи (Р&), а вектор у := 1 — решение двойственной задачи (РЦ*)', b) если для некоторого j Aj <0 и ж-7 0, то значение задачи Spk = +оо;
140 Глава 2. Линейное программирование с) если не выполнены условия пп. а) и Ь), то точка х' является новой крайней точкой множества допустимых элементов D(Pk), значение функционала при этом возрастет на величину -ti0&j09 а разложение векторов х1, а1,... ,ап производится согласно симплекс-методу. Доказательство. Напомним, что по предложению 1 detA& / 0, т.е. матрица Аь обратима. а) Пусть Д > 0. Преобразуем это условие с учетом определения векторов z := сьХ9 у := О уАь = сь и матрицы X (АьХ = А): Д>0О2-с>0О2>со сьХ с у АьХ с <^уА^ со А* у с. Значит, у является допустимым вектором в задаче (Р**) двойствен- ной к задаче (Р*). Кроме того в силу условия АьХь — Ъ (с,х) = (сь,хь) = {уАь,хь} = {Аьу,хь) = {у,Аьхь) = {у,Ъ). По критерию решения п. 3.1 х — решение в задаче (Р*), а у — решение в двойственной задаче (Р**). Ь) Положим x(t) := х - t(x3,0) + tej (ei,...,en — канонический базис в Rn). Тогда x(t) = (xb - tx3,0) -b te j > 0 W > 0 в силу условия а? 0 и Ax(t) = Ах ~ ЬАьх3 -b tAej = Ь - ta3 -b to? = д. Значит, x(t) — допустимый элемент для любого t > 0, при этом (c,x(t)) = (^х-Цх3,0)+tej) = (с,х) -Цсь.х3)+t{c,ej} = (с,ж) -tzj+tcj = = {c,x} - t(Zj — Cj) — {c,x} - tAj —► -boo при t —► -boo. с) Предположим, что не выполнены условия пп. а) и Ь) теоремы. Тогда для некоторого j0 такого, что m -b 1 jo п, выполнено условие Д7о < 0 и величина , . J xi tio := min < — * I xijo I X* ** > 0 r = 7^ > °- ) xiojo Возьмем x1 := x - ^0(a^°,0) -b^oejo. Докажем, что вектор x' является новой крайней точкой в задаче (Р&). Покажем вначале, что он является допустимым вектором. Как и в пункте Ь) выводим, что Ax' = Ъ. Имеем xi — xi — xi xijo 0 XWo Xj = 0 при i = m -b 1,..., n, i / при i = 1,... ,m; Xio — ho ~ >0. Xiojo Таким образом, ж' > 0, и значит, вектор х1 является допустимым в невырожденной задаче (Р*)- По построению у вектора х1 по сравнению с вектором х добавилась одна положительная Jo-я координата, а какие-
§3. Обоснование симплекс-метода 141 то обратились в ноль. Поскольку по предложению 2а) у допустимой точки число положительных координат-не менее тп, то в ноль может обратиться только одна координата (это ж'0-я координата обратилась в ноль). Значит, у вектора х' имеется ровно т положительных координат на местах 1,..., i0 - Mo -М, • • •, ям‘о. Следовательно, по предложению 2Ь) xf — крайняя точка. (Отметим, что в невырожденной задаче число положительных компонент у крайней точки может уменьшаться.) Выписанные формулы означают, что в новой симплексной таблице столбец х' вычисляется согласно указанному методу построения сим- плексной таблицы. Покажем, что и остальные столбцы x'i в новой симплексной таблице строятся по этому же способу. Для этого вычи- слим координаты x'ij разложения столбцов aJ, j = 1,...,п, матрицы А по базису а1,... ,а*0-1 ,ajo,a*o+l,... 9ат. В старом базисе мы имели следующие разложения: т т а3 = 52а‘®и ~ 52 a'Xi3 + j = 1...............п- (О «=1 1=1 т В частности при j = j0 aia = a'xijo + а*°х^<,- t=l Поскольку ± 0, то выразим а*0 из последнего уравнения ГЛ t’=l ж*оУо ж*оУо »¥«о и подставим в соотношение (1). Получим разложения по базису а1,..., а1°“\а70, а*0*1,..., ат: Таким образом, Aj = %ij - XtojXtj~, г^го, i=l,...,m, => х 'ijQ = 0, i / г0, Xiojo ** **030
142 Глава 2. Линейное программирование § 4. Методы нахождения начальной крайней точки 4.1. Переход к решению двойственной задачи Рассмотрим метод решения задач линейного программирования пу- тем перехода к двойственной задаче и решения полученной двойственной задачи. При этом строка Д последней симплекс-таблицы даст нам ре- шение исходной задачи. Пусть нам дана следующая задача линейного программирования: (&, у) —> min; А*у > с, у Q. (Р) Двойственной для нее является задача в нормальной форме (с, х) max; Ах Ь, я > 0. (Р**) Сведем эту задачу к эквивалентной задаче в канонической форме путем добавления неотрицательных (искусственных) переменных х = (®n+i,..., хп+т) и единичной матрицы I: (с,х) —> max; Ах 4- 1х = Ъ, ж > 0, х 0 <=> <=> (с, х) —> max; Ах = Ь, х 0 (с=(с,0), ж = (ж,ж), А = АГ). (Р) Задачу (Р) с вектором Ь > 0 можно решить симплекс-методом, взяв в качестве исходной крайней точки точку (0, ...,О,Ь],...,Ьт) Е Rn+m. Эта точка будет крайней по Предложению 1 п. 3.2, поскольку столбцы единичной матрицы Г, соответствующие положительным координатам этой точки, линейно независимы. __ __ Пусть вектор х — (ж, ж) является решением задачи (Р) (х Е ArgP). Тогда соответственно х является решением задачи (Р**) (х Е ArgP**). А по теореме п. 3.3 вектор у := сьА^{ является решением задачи, двой- ственной к задаче в канонической форме Р: —* - ( / А* \ / с \ t \ (Ь, у) min; Ау^с 1/ > 0 I. То есть у является решением исходной задачи (Р). При этом Sp - Sp, а из разложения АьХ = А О ~Х = А^’А X = А^А, X = A^I = А^1 получим, что вектор у = сьАъ1 = сьХ = z = z- c = &. Таким образом, часть строки Д последней симплекс-таблицы, лежа- щей под разложениями векторов искусственных переменных, дает нам решение исходной задачи (Р).
§4. Методы нахождения начальной крайней точки , 143 Пример. Решить задачу линейного программирования путем перехода к двойственной задаче. Пусть необходимо решить следующую задачу: 4j/i + 2у2 min; 3/, > О, i = 1,2, + 3/2 > 15, З3/1 + 4з/2 > 27, j/] + 5j/2 > 20. (Р) Решение. Двойственной для данной задачи линейного программиро- вания будет следующая задача в нормальной форме (выведите это само- стоятельно): 15®] + Х1х2 + 20®з -* max; ж, > 0, i= 1,2,3, 9»| + 3®2 + из 4, ®i ч- 4ш2 + 5ш3 2. (Р**) Сведем эту задачу к задаче в канонической форме путем добавления неотрицательных (искусственных) переменных ж4, и х5 и заменяя нера- венства равенствами: 15a?i 4- 27ж2 + 20ж3 —> max; > 0, i = 1,..., 5, 9Ш! -Ь 3®2 + Ж3+Я4 =4, (р) х{+4х2 + 5х3 -Ь®5 = 2. В выписанной задаче линейного программирования в каноничес- кой форме в качестве первоначальной крайней точки возьмем точку х = (0,0,0,4,2). Эта точка будет крайней по Предложению 1 п. 3.2, поскольку столбцы единичной матрицы, соответствующие положитель- ным координатам этой точки, линейно независимы. Тогда базисными векторами будут векторы а4 = (1,0), а5 = (0,1). Составим первую симплексную таблицу для задачи в канонической форме (Р): С 15 27 20 0 0 t базис Хь а1 а2 а3 а4 а5 а4 0 4 9 3 1 1 0 4 3 а5 0 2 1 4 5 0 1 1 2 Z 0 0 0 0 0 0 А -15 -27 -20 0 ' 0 В первой симплексной таблице разрешающий столбец а2, разрешаю- щая строка а5, разрешающий элемент симплексной таблицы 4. Заменяем в базисе вектор искусственных переменных а5 на вектор а2 и для нового
144 Глава 2. Линейное программирование базиса строим вторую симплексную таблицу: с 15 27 20 0 0 i базис Хь а1 а2 а3 а4 а5 а4 0 5 2 33 4 0 4 1 _ 3 4 10 33 а2 27 1 2 1 4 1 5 4 0 I 4 2 Z 27 2 27 4 27 135 4 0 27 4 д _ зз 4 0 55 4 0 27 4 Во второй симплексной таблице разрешающий столбец а1, разре- шающая строка а4, разрешающий элемент симплексной таблицы 33/4. Заменяем в базисе вектор искусственных переменных а4 на вектор а1 и для нового базиса строим третью симплексную таблицу: с 15 27 20 0 0 t базис Хь а1 а2 а3 а4 а5 а1 15 10 33 1 0 _ 1 3 4 33 __ jl п а2 27 и 33 0 1 4 3 33 п Z 16 15 27 31 1 6 д 0 0 11 1 6 Вектор Д > 0, поэтому точка х = (33’33’^’^’^) является реше- нием двойственной задачи с добавленными искусственными перемен- ными (Р), а вектор £ = является решением задачи (Р**) и Sp — Sp** = 16. В последней симплекс-таблице под разложениями векторов искус- ственных переменных стоят числа 1, 6, являющиеся значениями решения исходной задачи (Р), т. е. вектор § = (1,6) является решением задачи (Р) и Sp = 16. 4.2. Метод искусственного базиса Метод добавления искусственных переменных используется для отыскания начальной крайней точки в задаче линейного программиро- вания в канонической форме (с, х) —> max; Ах = Ь, х 0. (Л) ..
§ 4. Методы нахождения начальной крайней точки 145 Не ограничивая общности, можем считать, что все координаты вектора Ъ неотрицательны. Если это не так, например, bj < 0, то умножим обе части j-го уравнения на -1. Поэтому далее считаем, что Ь > 0. Рассмотрим вспомогательную задачу, добавляя искусственные пере- менные х = (жп+|,..., хп+т) и единичную матрицу 1, т - У? ~* таХ’ Ах + 1х = Ь, Ж > 0, Ж > 0. (Р) 1=1 Поскольку значение задачи Sp 0 и множество допустимых элементов Р(Р) # 0 (ж := (0,..., 0, dj,..., Ьт) € Р(Р)), то значение задачи конеч- но (|Sp| < +оо). По теореме существования п. 3.1 решение в задаче (Р) существует. Причем, если в исходной задаче (Pk) множество допустимых элементов непусто (D(P*) / 0), то значение задачи Sp = 0, а решением задачи (Р) будет крайняя точка, у которой все искусственные перемен- ные равны нулю. Задачу (Р) можно решить симплекс-методом, взяв в качестве исходной крайней точки точку х. Эта точка будет крайней по Предложению 1 п. 3?2, поскольку столбцы единичной матрицы J, соответствующие базисным_координатам точки ж, линейно независимы. При решении задачи (Р) симплекс-методом могут возникнуть три исхода: 1) Не все искусственные переменные равны нулю. Это означает, что исходная задача (Pk) не имеет допустимых элементов. Действительно, если не все искусственные переменные равны нулю, то Sp < 0. Предположим, что исходная задача (Р*) имеет допустимые элементы, например, ж0. Но тогда Sp < 0 = ((0,-1),(®°,0)) — противоречие. Значит, наше предположение, что исходная задача (Р^) имеет допустимые элементы, неверно. 2) Все искусственные переменные равны нулю и среди базисных векторов нет векторов, соответствующих^ искусственным переменным. Это означает, что решением в задаче (Р) будет ж = (ж, 0) — крайняя точка множества D(P), Точка £ будет крайней точкой множества Р(Р^) по Предложению 1, поскольку столбцы матрицы А, соответствующие базисным координатам, линейно независимы. Далее, взяв в качестве первоначальной крайней точки точку ж, можем приступать ко второму этапу — решению задачи (Р*) по симплекс-методу с найденной крайней точкой. Таким образом, мы имеем двуэтапный метод решения задачи (Pk),
146 Глава 2. Линейное программирование 3) Все искусственные переменные равны нулю и среди базисных векторов есть вектора, соответствующие искусственным переменным. В этом случае надо исключить из числа базисных вектора, соответствующие искусственным переменным. Пусть, например, в последней таблице имеется строка с искус- ственной переменной xn+i0. Будем считать эту строку разрешающей. В качестве разрешающего столбца возьмем столбец aj0, jo такой, что хп+^ 0. Столбец Ъ новой симплексной таблицы при этом не из- / f xn+i0%ij0 менится (по правилу прямоугольника х{ = я,--------— = Х{, так как Ж»+«0>0 жп+<0 = 0), только вместо переменной будет стоять переменная ж7о. Значение функционала (с, х} также не изменится. Этот процесс закончится удалением всех базисных векторов, соответствующих искус- ственным переменным, с заменой их на неискусственные, или окажется, что xn+iQj = 0, j = 1,...,п. Так как Xij — г-я координата разложения вектора а} по базисному вектору а1, то тогда все векторы а}, j = 1,..., п, включая вектор 5, можно разложить по базисным без вектора an+t°. Значит, «о-я строка исходной системы уравнений является линейно за- висимой от остальных строк и на втором этапе можем просто вычеркнуть из симплексной таблицы г0-ю строку, содержащую эту искусственную переменную, и начать второй этап с меньшим числом базисных векторов. Таким образом, двуэтапный симплекс-метод позволяет для любой задачи линейного программирования в канонической форме: 1) обнаружить, что исходная задача не имеет допустимых элементов, или 2) найти первоначальную крайнюю точку в задаче (Р) и решить задачу по симплекс-методу, или 3) исключить линейно зависимые равенства и решить задачу по сим- плекс-методу с найденной крайней точкой, имеющей менее т по- ложительных элементов. Замечание. Вместо такого двуэтапного решения задачи (Рь) можно решать следующую задачу (ее принято называть М-задачей) (с, (х, х)) —* шах; Ах + 1х = Ь, ж > 0, ж > 0, где c = (c,-M,...,-M)eRn+m, М — положительное число. Нетрудно показать, что при любом достаточ- но большом М первые п координат полученного решения определяют решение в (Pfc), а искусственные переменные равны нулю.
§ 4. Методы нахождения начальной крайней точки 147 4.3. Примеры Пример 1. Решить методом искусственного базиса задачу: Ж| + 2x2 + Зхз - ®4 -* max; х,-> О, i= 1,2,3,4, ®i + 2x2 + хз + х4 = 10, 2ж| + хг + 5хз =20, ®1 + 2x2 + Зх3 = 15. Рассмотрим вспомогательную задачу, добавляя искусственные пере- менные х5,хв: -х5 - хе —» max; х,- > 0, г = 1,...,6, ®i + 2X2 + ®з + = Ю, 2xi + ®2 + 5хз + х5 = 20, xi + 2х2 + Зх3 + х6 = 15. Исходная крайняя точка х = (0,0,0,10,20,15). Базисные векторы а4 = (1,0,0), а5 = (0,1,0), а6 = (0,0,1). Составим первую симплексную таблицу для вспомогательной задачи: с 0 0 0 0 -1 -1 t базис ХЬ а1 а2 а3 а4 а5 а6 а4 0 10 1 2 1 1 0 0 10 а5 -1 20 2 1 5 0 1 0 4 а6 — 1 15 1 2 3 0 0 1 5 Z -35 -3 -3 -8 0 -1 — 1 д -3 -3 -8 0 0 0 Из таблицы видно, что разрешающим столбцом является столбец а3, разрешающая строка а5. Заменяем в базисе вектор а5 на вектор а3 и для нового базиса строим вторую симплексную таблицу: с 0 0 0 0 -1 -1 t базис Хь а1 а2 а3 а4 а5 а6 а4 0 6 3 5 9 5 0 1 _ 1 5 0 ю 3 а3 0 4 2 5 1 5 1 0 1 5 0 20 а6 -1 . 3 _ 1 5 7 5 0 0 _ 3 5 1 Г5 7 Z -3 1 5 7 5 0 0 3 5 -1 д 1 5 _ 7 5 0 0 8 5 0
148 Глава 2. Линейное программирование Из таблицы видно, что разрешающим столбцом является столбец а2, разрешающая строка а6. Заменяем в базисе вектор а6 на вектор а2 и для нового базиса строим третью симплексную таблицу: с 0 0 0 0 -1 -1 t базис ХЬ а1 а2 а3 а4 а5 а6 а4 0 Г5 7 6 7 0 0 1 4 7 _ 9 7 а3 0 25 7 3 7 0 1 0 2 7 _ 1 7 а2 0 15 7 _ 1 7 1 0 0 1 5 7 Z 0 0 0 0 0 0 0 д 0 0 0 0 1 1 Вектор Д > О, поэтому точка д / 15 25 15 2 = (0,—,—,—,0,0 \ 7 7 7 является решением вспомогательной задачи и Smax = 0. Перейдем к решению основной задачи. Составим первую симплекс- ную таблицу для начальной крайней точки х Разложения векторов ж,а1 по базису а4,а3,а2 берем из последней сим- плексной таблицы: с 1 2 3 -1 t базис Хь а' а2 а3 а4 а4 -1 Г5 7 6 7 0 0 1 5 2 а3 3 25 7 3 7 0 1 0 25 3 а2 2 15 7 _ 1 7 1 0 0 Z 22 7 1 7 2 3 -1 д _ 6 7 0 0 0 Разрешающим столбцом является столбец а1, разрешающая строка а4. Заменяем в базисе вектор а4 на вектор а1 и для нового базиса строим вторую симплексную таблицу:
§4. Методы нахождения начальной крайней точки 149 с 1 2 3 -1 t базис Хъ а1 а2 а3 а4 а1 1 5 2 1 0 0 7 6 а3 3 5 2 0 0 1 _ 1 2 а2 2 5 2 0 1 0 1 6 Z 15 1 2 3 0 д 0 0 0 1 Вектор А О, поэтому точка £ = исходной задачи и Smax = 15. является решением Пример 2. Решить методом искусственного базиса задачу: - 2ж2 + ®з —► max; Xi >0, i = 1,2,3, + #з = 5, 2а?! + х2 = 3, -2Я| 4- 2х2 = 4. Решение. Рассмотрим вспомогательную задачу, добавляя искусствен- ные переменные ®4,®5- -ж4 - а?5 шах; х, > 0, i = 1,..., 5, -Ь ж2 + ®з =5, 2а?1 + х2 +ж4 =3, -2х\+2х2 4-ж5 = 4. Исходная крайняя точка х = (0,0,5,3,4). Базисные векторы а3 = (1,0,0), а4 = (0,1,0), а5 = (0,0,1). Составим первую симплексную таблицу для вспомогательной задачи: с 0 0 0 -1 -1 t базис Хь а1 а2 а3 а4 а5 а3 0 5 1 1 1 0 0 5 а4 -1 3 2 1 0 1 0 3 а5 -1 4 -2 2 0 0 1 2 Z -7 0 -3 0 -1 -1 д 0 -3 0 0 0 Разрешающий столбец а2, разрешающая строка а5. Заменяем в базисе вектор а5 на вектор а2 и для нового базиса строим вторую симплексную
150 Глава 2. Линейное программирование таблицу: с 0 0 0 -1 -1 t базис Хь. а1 а2 а3 а4 в5 а3 0 3 2 0 1 0 _ 1 2 3 2 а4 -1 1 3 0 0 1 _ 1 2 1 3 а2 0 2 -1 1 0 0 1 2 Z -1 -3 0 0 -1 1 2 д -3 0 0 0 3 2 Во второй симплексной таблице разрешающий столбец а1, разреша- ющая строка а4. Заменяем в базисе вектор искусственных переменных а4 на вектор а1 и для нового базиса строим третью симплексную таблицу: с 0 0 0 -1 -1 t базис ХЬ а1 а2 а3 а4 а5 а3 0 7 3 0 0 1 _ 2 3 _ 1 6 а1 0 1 3 1 0 0 1 3 1 6 а2 0 7 3 0 1 0 1 3 1 3 Z 0 0 0 0 0 0 д 0 0 0 1 1 Вектор Д > 0, поэтому точка х — 1 7 7 3’3’3’ о, о) является решением вспомогательной задачи с добавленными искусствен- ными переменными, и Smax = 0. Перейдем к решению основной задачи. Составим первую симплекс- ную таблицу для начальной крайней точки х 1 7 7\ 3’3’3/ Разложения вектора х по базису а3, а1, а2 берем из последней симплекс- ной таблицы:
§ 4. Методы нахождения начальной крайней точки | 151 с 1 1 -2 1 t базис Хь а1 а2 а3 а3 1 7 3 0 0 1 а1 1 1 3 1 0 0 а2 -2 7 3 0 1 0 Z -2 1 -2 1 д 0 0 0 Вектор Д > О, поэтому точка /1 7 7\ (з’з’з) является решением исходной задачи и Smax = -2. Заметим, что на самом деле исходная задача тривиально решается, так как мы имеем систему из трех линейных уравнений с тремя неизвестными. И эта система имеет единственное решение х fi.z.zy Кз’з’з/ Пример 3. Решить, вводя искусственные переменные задачу: 2®i + я?2 4- Зжз + 5ж4 —> max; ж, >0, i = 1,2,3,4, 2Ж1 4- Зж2 4- жз 4- 2ж4 30, 4Ж1 4- 2ж2 4- жз 4- 2ж4 40, + 2ж2 4- Зж3 4- ж4 25. Добавив неотрицательные переменные ж$,Жб,Ж7, получим задачу в канонической форме: 2Ж1 4- Х2 4- Зж3 4~ 5ж4 max; ж« > 0, г=1,...,7, 2ж14-Зж2 4- Жз4-2ж44-ж5 =30, 4Ж1 4- 2ж2 4- Жз 4- 2ж4 4- ж6 = 40, Ж1 4- 2ж2 4- Зжз 4- ж4 4- ж? = 25. Исходная крайняя точка ж = (0,0,0,0,30,40,25). Базисные векторы а5 = (1,0,0), а6 = (0,1,0), а7 = (0,0,1).
152 Глава 2. Линейное программирование Составим первую симплексную таблицу: с 2 1 3 5 0 0 0 t базис Хь а1 а2 а3 а4 а5 а6 а7 а5 0 30 2 3 1 2 1 0 0 15 а6 0 40 4 2 1 2 0 1 0 20 а7 0 25 1 2 3 1 0 0 1 25 Z 0 0 0 0 0 0 0 0 д -2 -1 -3 -5 0 0 0 В первой симплексной таблице разрешающим столбцом является столбец а4, Разрешающая строка a5, t = 15. Заменяем в базисе век- тор а5 на вектор а4 и для нового базиса строим вторую симплексную таблицу: с 2 1 3 5 0 0 0 t базис хь а1 а2 а3 а4 а5 а6 а7 а4 5 15 1 3 2 1 2 1 1 2 0 0 30 а6 0 10 2 -1 0 0 -1 1 0 а7 0 10 0 1 2 5 2 0 _ 1 2 0 1 4 75 5 ]5 2 5 2 5 5 2 0 0 д 3 13 2 _ 1 2 0 5 2 0 0 Во второй симплексной таблице разрешающий столбец а3, разреша- ющая строка a7, t = 4. Заменяем в базисе вектор а7 на вектор а3 и для нового базиса строим третью симплексную таблицу для базиса а4, а6, а3: с 2 1 3 5 0 0 0 t базис Xfr а1 а2 а3 а4 а5 а6 а7 а4 5 13 1 7 5 0 1 3 5 0 _ 1 5 а6 0 10 2 -1 0 0 -1 1 0 а3 3 4 0 1 5 1 0 _ 1 5 0 2 5 Z 77 5 38 5 3 5 12 5 0 1 5 д 3 33 5 0 0 22 5 0 . 1 5
§ 4. Методы нахождения начальной крайней точки 153 Вектор Д > 0, поэтому крайняя точка х = (0,0,4,13,0,10,0) являет- ся решением расширенной задачи, а решением исходной задачи является ТОЧКа S = (0,0,4, 13), Smax == 77. 4.4. Задачи Задачи линейного программирования в канонической форме с неза- данной первоначальной крайней точкой. Решить методом искусственного базиса. 4.1. Х1 4-4s2 4-s3max; s,>0, i= 1,2,3, Х\ — х2 4-Яз = 3, 2si - 5s2 - S3 = 0. 4.2. 10s2 4- S3—► max; s,>0, г = 1,2,3, si - 5,5s2 - 7s3 — -13, Si - 14,5s2 4-7s3 = 15. 4.3. Si 4- 2s24- 3s3 - 4s4-*max; s, > 0, i= 1,2,3,4, Si 4- s2 - S3 4- S4 = 2, Si -h 14s2 4- IOS3 - 10s4 = 24. 4.4. sj-5s2- s3 4-s4max; s.>0, i = 1,2,3,4, Si -h 3s2 + 3s3 4- s4 = 3, 2si 4- S3 - S4 = 4. 4.5. ®i 4- s2 4- s3 4- S4—>max; Sj>0, = 1,2,3,4, 4sj -h 2x2 4- 5s3 - S4 = 5, 5si 4- 3s2 4- 6S3 - 2s4 = 5, 3si 4- 2x2 4- 4s3 - S4 = 4. 4.6. Si 4-10s2 - S3 4- 5s4 —► max; s.>0, i= 1,2,3,4, Si 4- 2s2 - s3 - S4 = 1, -Si 4- 2s2 4- 3s3 4- S4 = 2, Si 4“ 5s2 4- S3 — S4 = 5. 4.7. S] 4-2s2 4-3s3 + 4s4 + 5s5 —* max; s,>0, t=l,...,5, s2 4- s3 - 2s4 -h 7s5 = 2, 6sj -h s3 - 2S4-h 7s5 = 2, Si 4- s2 -2s44-7s5 = 2. 4.8. S|4-S2- S3 4- S4-2S5—> max; s,>0, i=l,...,5, 3si 4- s2 4- S3 4- S4 - 2S5 = 10, 6si 4- S2 4- 2s3 4- 3s4 - 4S5 = 20, 10s 1 4- s2 4- 3s3 4- 6S4 - 7S5 = 30.
154 Глава 2. Линейное программирование 4.9. ®i - 4®2 + ®4-h Ж5+ ж6—>max; ®t>0, i = 1,...,6, 14® । - 14®2 + 12®з + 5®4 + 6x5 -b 3®6 = 8, - x2+ 2x3 + ®5 =0, 16® 1 - 16®2 + 8x3 + 7®4 + 4®5 + 5®6 = 12. § 5. Транспортная задача Важный частный случай задач линейного программирования — транспортные задачи. Это математические модели разнообразных при- кладных задач по оптимизации перевозок. Распространенность в при- ложениях задач транспортного типа оправдывает неослабевающее вни- мание к ним. Транспортные задачи решаются методом потенциалов, который является усовершенствованием симплекс-метода, примененно- го к данному более узкому типу задач. В этом параграфе мы приведем постановку транспортной задачи, методы отыскания исходной крайней точки, решение задачи методом потенциалов, двойственную к транс- портной задаче, обоснование метода потенциалов, задачу о назначении, примеры. 5.1. Постановка задачи Транспортной задачей по критерию стоимости называется следующая задача о минимизации стоимости перевозок. Пусть в пунктах отправления А],...,Ат сосредоточено соответ- ственно единиц некоторого однородного груза. Этот груз следует перевезти в п пунктов назначения Bj,...,Bn, причем в ка- ждый из них надлежит завезти соответственно Ъ},..., Ъп единиц груза. Стоимость перевозки единицы груза из пункта Л, в пункт Bj равна су. Обозначая через количество единиц груза, предназначенного к отправке из пункта Л/ в пункт Bj9 получим задачу нахождения плана перевозок, при котором общая стоимость окажется минимальной: т п (с,х): = ЕЕ CijXij —> min; г=1 j=\ Xij^O, i = l,...,m, j = l,...,n, (P) n Xij = di, i = 1,...,m, (a) >=1 m j = (b) t=l В матричном виде ограничения задачи (a)-(b) имеют вид:
§5. Транспортная задача 155 /11... 1 0 0 ... О ... 0 0 .. О 0 ... О 1 1 ... 1 ... 0 0.. 6 6 ... 6 6 6 ... 6 i i .. 1 О ... О 1 О ... О ... 1 о .. О 1 ... О 0 1 ... О .... О 1 .. о 1 о о \ 6 6 ... 16 6... i /. 6 6 .. / «и \ Ши х\п ®2| «22 Я2п Ж7П| хт2 д2 \ Ьп / \ хтп / План перевозок и стоимость перевозок представляются в виде векторов х = (xij, i = 1,... ,яг, j = 1,... ,n), с = (cij, г = 1,... ,тп, j = 1, ... ,n) соответственно, или матриц X = , С = . Уравнения (а) означают, что из пункта отправления Ai весь груз вывезен в пункты назначения (потребления). Уравнения (Ъ) означают, что количество груза, завезенного в пункт Bj со всех пунктов отправления, соответствует требуемому. Естественно считать, что общий запас груза на всех пунктах отпра- вления равен суммарной потребности всех пунктов назначения, т. е. т п ^/ai = '^lbj==M- i=i ;=1 В этом случае говорят, что имеется замкнутая модель транспортной за- дачи. Рассмотрим незамкнутые модели транспортной задачи и покажем, как они могут быть сведены к замкнутой модели. Если суммарные запасы отправителей больше суммарной ПОТребНО- rn п сти пунктов назначения, т.е. 52а« > 52 by, то равенства (а) заменяются t=l У=1 неравенствами п «ij I = 1,. . . , 771, У=1 а условие (Ь) остается без изменений. В этом случае вводится фиктивный т п пункт назначения Вп+\ с требуемой величиной завоза Ьп+\ — 52 аг - 22 fy i=i j=\ и нулевыми стоимостями перевозок в этот пункт. Добавляя новые неотрицательные переменные «,п+1» i = 1,. - , ш, приходим к замкнутой модели транспортной задачи с ограничениями в виде равенств (a)-(b).
156 Глава 2. Линейное программирование Если суммарные запасы отправителей меньше суммарных запросов т п пунктов назначения, т.е. 52 < 52 fy, то равенства (Ь) заменяются i=i j=i неравенствами т i=l а условие (а) остается без изменений. В этом случае вводится фиктив- ный пункт отправления с требуемой величиной вывоза ат+\ = п т 52 “ 52 ai и нулевыми стоимостями перевозок из этого пункта. Доба- j=i «=| вляя новые неотрицательные переменные j = 1,... ,п, приходим к замкнутой модели транспортной задачи с ограничениями в виде ра- венств (а)-(Ь). 5.2. Особенности задачи Транспортная задача является задачей линейного программирова- ния и может быть решена симплекс-методом, который значительно упрощается в виду простого строения системы ограничений (a)-(b). Этот упрощенный метод мы и опишем ниже. Предварительно дока- жем некоторые утверждения, имеющие место для транспортных задач. Лемма 1. Для любой транспортной задачи существует допустимый план перевозок (Dp Ф 0). Cbjbj . . Доказательство. Положим Xij = тогда уравнения (а) будут выполняться: п п , п 4-^ 3 4^ м м 4^ 3 м ;=! 7=1 7=1 Аналогично показывается выполнение уравнений (Ь). Значит х^ — допу- стимый план перевозок. Отметим, что поскольку значение задачи ограничено снизу нулем и допустимый план перевозок имеется по лемме 1, то в задаче (Р) по те- ореме существования решения п. 3.1 (|Sp| < -boo => ArgP / 0) опти- мальный план существует. Лемма 2. Ранг системы ограничений (а)-(Ь) равен т + п- 1. Доказательство. Если сложить первые тп строк матрицы ограниче- ний А и вычесть из них последние п строк, то получим нулевую строку. Следовательно, ранг матрицы А меньше m + п.
§ 5. Транспортная задача 157 С другой стороны, располагая т - 1 строку матрицы А (начиная со второй), под п последними строками, получим треугольную матрицу из m-hn~ 1 строк, ранг которой равен количеству уравнений (т + п - 1). Таким образом, ранг матрицы А равен т 4- п - 1. По предложению 1 п. 3.2 (столбцы матрицы ограничений, соот- ветствующие положительным координатам крайней точки, линейно независимы) и лемме 2 (количество линейно-независимых столбцов не превышает т 4- п - 1) крайняя точка в задаче может иметь не более т 4- п - 1 положительных координат. Лемма 3. Любые т 4- п - 1 строк матрицы А линейно независимы. Доказательство. Любая строка матрицы А (для определенности возьмем строку из системы уравнений (а)) равна сумме всех строк системы уравнений (Ь) минус сумма всех строк уравнений (а) без этой строки, то есть является линейной комбинацией оставшихся m + п - 1 строк. А так как ранг матрицы А равен m -Ь п - 1, то оставшиеся строки линейно независимы. Отметим, что не любые m 4- п - 1 столбцов матрицы А являются линейно независимыми (приведите пример!). 5.3. Методы нахождения начальной крайней точки Рассмотрим замкнутую модель транспортной задачи. Как мы уже знаем, незамкнутая модель может быть легко сведена к замкнутой введением фиктивного поставщика или фиктивного потребителя. 1. Метод «северо-западного угла». Назначим максимально возможную перевозку из пункта отправления А| в пункт назначения В\. То есть заполняем верхний левый элемент матрицы X первоначальной крайней точки. При этом либо пункт отправления Ai, либо пункт назначения В\, либо оба эти пункта окажутся полностью обслуженными. Если пункт отправления Ai оказался полностью обслуженным, то в дальнейшем при нахождении первоначального плана перевозок вы- водим из рассмотрения первую строку матрицы X и рассматриваем только оставшуюся часть матрицы. Если пункт назначения В\ оказал- ся полностью обслуженным, то аналогично выводим первый столбец из дальнейшего рассмотрения. Если же и пункт отправления, и пункт назначения оказались полностью обслуженными (так может случиться только в вырожденной задаче), то вывести из рассмотрения следует или первый столбец, или первую строку матрицы X. Условимся для определенности выводить из рассмотрения первый столбец матрицы. В этом случае в число базисных элементов на следующем этапе введем элемент с нулевым значением перевозки, стоящий в северо-западном Углу оставшейся части матрицы X, т.е. в базис войдет второй элемент в строке, считая вычеркиваемый элемент первым.
158 Глава 2. Линейное программирование Эту процедуру продолжаем до тех пор, пока все пункты отправления и пункты назначения не будут обслужены. Последней перевозкой будет перевозка из пункта отправления Ат в пункт назначения Вп. На каждом шаге обслуживается один из пунктов отправления или назначения, а на последнем шаге обслуживаются и последний пункт отправления и последний пункт назначения. Поэтому число базисных элементов будет ровно т + п - 1. Найденный план будет допустимым планом перевозок, содержащим не более т + п - 1 положительных координат и являющийся (как будет показано ниже) крайней точкой множества допустимых элементов. Отметим, что данный метод нахождения первоначальной крайней точки не учитывает стоимости перевозок. Поэтому начальный план может оказаться далеко не оптимальным. Приведем другие методы нахождения начальной крайней точки, учитывающие стоимости перевозок. 2. Минимум по матрице. Выберем в платежной матрице С мини- мальный элемент. Пусть min Cjj = cto<7o. Назначим максимально воз- м можную перевозку из пункта отправления Ai0 в пункт назначения Bj0. Если минимальная стоимость перевозки достигается на нескольких эле- ментах, то выбираем любой из них. Тем самым пункт отправления До или пункт назначения Bj0 (или оба пункта одновременно) будет об- служен. А в платежной матрице соответствующая строка или столбец выводятся из дальнейшего рассмотрения. Если и пункт отправления, и пункт назначения одновременно обслужились, то для определенности как и в п. 1 будем выводить из рассмотрения столбец матрицы X. В оставшейся части платежной матрицы вновь ищется минимальный элемент и процедура повторяется до тех пор, пока первоначальный план перевозок не будет получен. Найденный план будет допустимым планом перевозок, содержащим не более т + п - 1 положительных координат с числом базисных элементов m4-n—1 и являющийся крайней точкой множества допустимых элементов. 3. Минимум по строке. Выберем в первой строке платежной матри- цы С минимальный по величине элемент. Предположим minciy = C|j0. з Назначим максимально возможную перевозку из пункта отправления в пункт назначения Ву0. Если минимум достигается на нескольких эле- ментах, то выбираем любой из них. Тем самым пункт отправления Aj или пункт назначения Bj0 (или оба пункта одновременно) будет обслужен. А в платежной матрице первая строка или соответствующий столбец выводятся из дальнейшего рассмотрения. В первой строке оставшейся части платежной матрицы вновь ищется минимальный элемент и процедура повторяется до тех пор пока пер- воначальный план перевозок не будет получен (первой строкой может
§ 5. Транспортная задача 159 оказаться вновь первая строка исходной матрицы без какого-то элемента или вторая строка исходной матрицы без какого-то элемента). В итоге получаем крайнюю точку множества допустимых элементов задачи. 4. Минимум по столбцу. Выберем в первом столбце платежной матри- цы С минимальный по величине элемент. Предположим min ct| = Ci0|. i Назначим максимально возможную перевозку из пункта отправления До в пункт назначения В\. Если минимум достигается на нескольких эле- ментах, то выбираем любой из них. Тем самым пункт отправления Ло или пункт назначения В\ будет обслужен. А в платежной матрице соответствующая строка или первый столбец выводятся из дальнейшего рассмотрения. В первом столбце оставшейся части платежной матрицы вновь ищется минимальный элемент и процедура повторяется до тех пор пока первоначальный план перевозок не будет получен (первым столбцом может оказаться вновь первый столбец исходной матрицы без какого-то элемента или второй столбец исходной матрицы без какого-то элемента). В итоге получаем первоначальную крайнюю точку множества допу- стимых элементов задачи. Лемма 4. Описанные выше методы нахождения первоначального плана перевозок, приводят к первоначальной крайней точке множества допусти- мых элементов. Доказательство. По предложению 1 достаточно доказать, что соот- ветствующие базисным элементам столбцы матрицы А линейно незави- симы. Отметим, что описанные методы нахождения первоначального плана перевозок содержат общий элемент действия: на каждом этапе мы выводим из рассмотрения либо столбец, либо строку матрицы X. Доказательство можно провести индукцией по числу m -h п = к. Пусть m + п = 2 — минимально возможное число. Матрица А состоит из единственного элемента и утверждение очевидно. Предположим, что для m 4- п = к получаемые этим методом столбцы линейно независимы. Докажем соответствующее утверждение для т+п = к+1. Не ограничивая общности, считаем, что на первом этапе выводится из рассмотрения первая строка или первый столбец (в противном случае мы можем строки или столбцы переобозначить и поменять местами). Если мы выводим из рассмотрения первую строку матрицы, то это означает, что первый пункт отправления Ai обслужен полностью, — базисный элемент, а все элементы = 0, j = 2,...,п. Первое ограничение уравнений (а) выполнено, в матрице ограничений А можно убрать первую строку и первые п столбцов. Получилась меньшая матрица размера (m - 1 + n) х (т - 1)п, а для нее по предположению индукции соответствующие столбцы являются линейно независимыми. Добавление
160 Глава 2. Линейное программирование столбца с единицей на первом месте (и еще на одном из последних п мест) к т + п - 2 столбцам, расширенным и начинающимся с нуля образует систему т + п - 1 линейно независимых столбцов. Если мы выводим из рассмотрения первый столбец матрицы, то это означает, что первый пункт назначения обслужен полностью, жц — базисный элемент, а все элементы жц =0, i = 2,. ..,m. Первое огра- ничение уравнений (Ь) выполнено, в матрице ограничений А можно убрать т + 1 -ю строку и соответствующие т столбцов. Получилась подобная меньшая матрица размера (m + n - 1) х (п - 1)т, а для нее по предположению индукции соответствующие столбцы являются ли- нейно независимыми. Добавление столбца с единицей на т -Ь 1-м месте (и еще на одном из первых т мест) к т 4- п - 2 линейно независимым столбцам, расширенным и имеющим на m 4- 1-м месте нули образует си- стему из т+п-1 линейно независимых столбцов. Индукция закончена. Примеры нахождения начальной крайней точки Пример 1. Метод «Северо-западного угла». Зададим транспортную задачу в виде платежной матрицы. Ь, =40 Ь2 = 15 Ь3 = 42 Ь4 = 13 а\ = 10 2 1 5 11 а>2 — 80 4 3 4 2 а3 = 20 6 2 7 8 Построим по методу «Северо-западного угла» первоначальный план перевозок. Назначим максимально возможную перевозку равную 10 из пункта отправления Ai в пункт назначения В\. То есть заполняем верх- ний левый элемент матрицы X первоначального плана перевозок. При этом из пункта отправления А] весь груз окажется вывезенным. В пункт назначения В| остается привести 30 единиц груза. В дальнейшем при нахождении первоначального плана перевозок выводим из рассмотре- ния первую строку матрицы 3 х 4 и рассматриваем только оставшуюся матрицу 2x4. Назначим максимально возможную перевозку равную 30 из пункта отправления А2 в пункт назначения В\. То есть заполняем верхний левый элемент оставшейся матрицы X. При этом пункт назначения Bi окажется полностью обслуженным. В пункте отправления А2 останется 50 единиц груза. Выводим из рассмотрения первый столбец матрицы 2 х 4 и рассматриваем только оставшуюся матрицу 2x3. Назначим максимально возможную перевозку равную 15 из пункта отправления А2 в пункт назначения В2. То есть заполняем верхний левый элемент оставшейся матрицы 2x3. При этом пункт назначения В2 окажется полностью обслуженным. В пункте отправления А2 останется
§ 5. Транспортная задача 161 35 единиц груза. Выводим из рассмотрения первый столбец матрицы 2 х 3 и рассматриваем только оставшуюся матрицу 2x2. Назначим максимально возможную перевозку равную 35 из пункта отправления А2 в пункт назначения Вз. То есть заполняем верхний левый элемент матрицы 2x2. При из пункта отправления А2 весь груз оказался вывезенным. В пункт назначения В3 остается привезти 7 единиц груза, которые привозятся из пункта отправления Аз. После этого в пункте отправления А3 остается 13 единиц груза, который перевозится в пункт назначения В4. Л = 40 Ь2 = 15 Ьз = 42 Ь4= 13 в! = 10 10 0 0 0 а2 — 80 30 15 35 0 аз = 20 0 0 7 13 Для краткости в матрице плана перевозок не пишем нулевые значения небазисных перевозок. Число ненулевых элементов в первоначальном плане перевозок т + п - 1 =4 + 3—1 = 6. Значение функционала {с,х') = 2-10 + 4-30 + 3- 15 + 4- 35 + 7 -7 + 8- 13 = 478. Пример 2. Метод «Минимума по матрице». Рассмотрим транспортную задачу из примера 1. Выберем в платежной матрице С минимальный элемент. Им является стоимость ci2 = 1. Назначим максимально возможную перевозку равную 10 из пункта отправления А] в пункт назначения В2. При этом из пункта отправления А] весь груз окажется вывезенным. В платежной матрице первая строка выводится из дальнейшего рассмотрения. В оставшейся части платежной матрицы 2x4 вновь ищется ми- нимальный элемент. Минимальная стоимость перевозки достигается на двух элементах сз2 = с24 = 2. Выбираем любой из них. Для опреде- ленности Сз2. Назначим максимально возможную перевозку равную 5 из пункта отправления Аз в пункт назначения В2. При этом пункт назначения В2 окажется полностью обслуженным. В платежной матрице 2x4 второй столбец выводится из дальнейшего рассмотрения. 6, =40 h = 15 Ьз = 42 64= 13 а, = 10 0 10 0 0 а2 = 80 40 0 27 13 аз — 20 0 5 15 0 В оставшейся части платежной матрицы 2x3 вновь ищется мини- мальный элемент. Им является стоимость с24 = 2. Назначим максималь- но возможную перевозку равную 13 из пункта отправления А2 в пункт
162 Глава 2. Линейное программирование назначения В4. При этом пункт назначения В4 окажется полностью обслуженным. В платежной матрице последний столбец выводится из дальнейшего рассмотрения. В оставшейся части платежной матрицы 2x2 вновь ищется ми- нимальный элемент. Минимальная стоимость перевозки достигается на двух элементах с2| = с23 = 4. Выбираем любой из них. Для опреде- ленности c2i. Назначим максимально возможную перевозку равную 40 из пункта отправления А2 в пункт назначения В|. При этом пункт назначения В] окажется полностью обслуженным. В платежной матрице первый столбец выводится из дальнейшего рассмотрения. Остается привезти 42 единицы груза в пункт назначения В3. Остав- шиеся 27 единиц груза в пункте отправления А2 и 15 единиц груза в пункте отправления Ау остается привезти в пункт назначения Вз. Значение функционала (с,х2) = 1 • 10 +2 • 5 + 2 • 13 + 4 • 40 4-4 • 27 + 7 • 15 = 419. Метод «Минимума по матрице», учитывающий стоимости перевозок в данном примере оказался более эффективным по сравнению с методом «Северо-западного угла». 5.4. Метод потенциалов Сформулируем правило решения транспортной задачи методом по- тенциалов (обоснование этого метода будет дано в п. 5.7). Для решения транспортной задачи следует: 1. Привести задачу к замкнутой модели (см. п. 5.1). 2. Найти первоначальный план перевозок х, являющийся крайней точкой множества допустимых элементов. Он содержит m + п - 1 поло- жительных компонент, назовем их базисными. При нахождении мы можем использовать любой из описанных выше методов нахождения первоначального плана перевозок. 3. Исследование плана перевозок х. Для найденного плана х построить матрицу С = , Cij Uj+Vj, определяя т+п потенциалов Vj из системы т + п - 1 уравнений: щ 4- Vj = C{j для базисных индексов i,j. Эти уравнения линейно независимы (это следует из линейной незави- симости столбцов, соответствующих базисным элементам), поэтому для однозначного определения потенциалов Ui,Vj положим заранее один из потенциалов заданной величине, например, положим и\ = 0. __ т п Замечание. Элементы матрицы С и величина 4- 5Z bjVj i=l ;=1 не зависят от первоначального выбора и\.
i § 5. Транспортная задача 163 Действительно. Предположим, что вместо первоначального потен- циала U] мы бы взяли потенциал = и\ 4-1 Тогда v\ = vj - t и все щ щ +t, Vj — Vj -t при базисных i,j, поскольку щ + Vj = Cij при базисных i,j. Следовательно, сумма щ 4- Vj = ui + t + Vj-t = щ + Vj = не зависит от выбора первоначального потенциала и\. 4. Провести исследование матрицы Д := С - С. Если Д > 0, то исследуемый план х является решением задачи (Р), а потенциалы Ui,Vj являются решением двойственной задачи. Если среди элементов матрицы Д есть отрицательные, то выберем элемент с наименьшим значением. Пусть, например, Д<оуо = min Д^ < 0. 5. Построить новый план перевозок, являющийся крайней точкой множе- ства допустимых элементов. Положим x'iQj0 = t, x^j = Xij ± t для базисных индексов i, j, где t — некоторая положительная величина (не изменяя остальные небазисные компоненты х^ равные нулю) так, чтобы х^ по-прежнему были нео- трицательны, но одна из базисных компонент обратилась бы в ноль. Вектор матрицы А, соответствующий этой компоненте, выводим из чи- сла базисных, а вектор матрицы А, соответствующий переменной вводим в число базисных векторов. Далее вновь начинаем исследование полученной крайней точки х1, т. е. возвращаемся к п. 3. В невырожденной задаче в ноль может обратиться только одна из компонент вектора х. В вырожденной задаче в ноль может обратиться несколько компонент. В этом случае из числа базисных векторов ис- ключается любой вектор с нулевым значением, как правило исключается вектор с наибольшей стоимостью перевозок. 5.5. Примеры транспортных задач Пример 1. 2хц 4- 2®12 4- 4®и + 8^14 4- 4®21 4- 5ж22 4- 7®23 4- 6ж24 + 4- 6ж31 4- Зж32 4- 4язз + 9ж34 -* min; #ц 4- ж|2 -Ь Ж|з 4- Ж|4 = 14, #21 + #22 + #23 + #24 = 18, #31 + #32 4~ #33 4“ #34 = 16, #11 4“ #21 4-#з1 4-#41 ^22, #12 4“ #22 4“ #32 4- #42 2, #13 4- #23 4“ #зз 4- #43 17, #14 4~ #24 4" #з4 4“ Х44 ^11, Xij^O, г =1,2,3, >=1,2,3,4. 1 Решение. Поскольку суммарные запасы груза на всех пунктах отправления меньше суммарных запросов пунктов назначения, т. е. 3 4 52 а» = 48 < 53^ — 52, то надо привести задачу к замкнутой модели. «=1 >1
164 Глава 2. Линейное программирование Введем фиктивный пункт отправления А4 с требуемой величиной выво- 4 3 за а4 = = 4 и нулевыми стоимостями перевозок из этого j=l i=l пункта. Зададим транспортную задачу в виде платежной матрицы: bl = 22 Ъ2 = 2 Ь3 = 17 Ь4 = 11 а( = 14 2 2 4 8 fl 2 = 18 4 5 7 6 fl2 — 16 6 3 4 9 а4 = 4 0 0 0 0 Построим по методу «Северо-западного угла» первоначальное распреде- ление: bj =22 Ьг = 2 b3 = 17 b4 = 11 ai = 14 14 di = 18 8 2 8 d2 = 16 9 7 a4 = 4 4 Для краткости в матрице плана перевозок не пишем нулевые значения небазисных перевозок. Значение функционала равно 225. Число ненуле- вых элементов в первоначальном плане перевозок m+n-1 = 4+4-1 = 7. Это позволяет сразу перейти к исследованию на оптимальность найден- ного плана. Построим матрицу С2\* Vi = 2 V2 = 3 «3 = 5 v4 = 10 ui = 0 2 3 5 10 U2 = 2 4 5 7 12 «3 = -1 1 2 4 9 щ — -10 -8 -7 -5 0 О -1 -1 -2 В матрице Д = С - С = I q I минимальный элемент \8 7 5 О/ Д24 = min Ди- = -6 < 0. Добавляя в первоначальный план распределе- ния на место нулевого небазисного элемента ®24 величину t, получим 2) В матрице С базисные элементы будем выделять полужирным шрифтом.
§ 5.11ранспортная задача 165 второй план возможных перевозок: 14 8 2 8-« t 9 + t 7 — t 4 14 8 2 1 7 16 4 Величина t = 7. Значение функционала = 183. Построим матрицу С\ Vi = 2 «2 = 3 Vy = 5 V4 — 4 и\ = 0 2 3 5 4 u2 = 2 4 5 7 6 Uy = -1 1 2 4 3 щ — -4 —2 -1 1 0 (° -1 -1 4\ В матрице A = C - C = 0 5 0 1 0 0 01 6 I минимальные элементы V 1 -1 0/ А12 = Ди = Д43 = т^п Ди = -1 < 0. Во множество базисных элементов ij включим элемент Ж43 с наименьшей стоимостью перевозок. Добавляя в первоначальный план распределения на место нулевого небазисного элемента я4з величину t9 получим третий план возможных перевозок: 14 8 2 1 -t 7 + t 16 t 4-t 14 8 2 8 16 1 3 Величина t = 1. Значение функционала = 182. Построим матрицу С: Vi = 2 v2 = 3 vy = 4 V4 — 4 tzj = 0 2 3 4 4 u2 = 2 4 5 6 6 Uy — 0 2 3 4 4 щ = —4 -2 -1 0 0
166 Глава 2. Линейное программирование /О -1 0 4\ п л 77 I 0 0 1 0 1 В матрице Д = С - С = q q $ I минимальный элемент \2 1 О О/ Д12 = min Дь = -1 < 0. Добавляя в первоначальный план распределения м на место нулевого небазисного элемента Х\2 величину f, получим четвертый план возможных перевозок: 14 -t t —> 12 2 8 4" t 2-t 8 10 8 16 16 1 3 1 3 Величина t = 2. Значение функционала = 180. Построим матрицу С: «1=2 «2 = 2 «3 = 4 v4 — 4 u\ = 0 2 2 4 4 u2 = 2 4 4 6 6 «3 = 0 2 2 4 4 u4 = —4 -2 -2 0 0 (0 0 0 4\ 4 1 0 5 I О’ то найденный четвертый 2 2 0 0/ план перевозок является оптимальным и суммарная стоимость 180. Пример 2. х\। + 2ш12 4- Зхjз + 4х14 + 4®2i + 3®22 4- 2®23 + 2®з2 4- 2®зз 4- ®34 -> min; £|1 4“ #12 4~ Я13 4~ ®14 = 3. а?21 4- Х22 4- ®23 4“ £24 = 4. #31 4“ #32 4~ Хзз 4~ Х34 = 5. £ц 4~ ®21 4~ £31 = 2; ®12 4~ #22 4“ £32 = з. #13 4- #23 4- Хзз = 4. £14 4~ £24 4~ Х34 = 3; Xij >0, i = 1,2,3, j = 1,2,3,4. Решение. Поскольку суммарные запасы отправителей равны суммар- 3 4 ным запросам потребителей, т.е. = ^,bj = 12, то данная задача i=l j=l является замкнутой моделью транспортной задачи.
§ 5. Транспортная задача 167 Зададим задачу виде платежной матрицы: Ь| =2 ь2 = з Ь3 = 4 &4 = 3 й| = 3 1 2 3 4 а2 = 4 4 3 2 0 а3 — 5 0 2 2 1 Построим по методу «Северо-западного угла» первоначальное распреде- ление: Ь1 =2 Ь2 = 3 Ъ3 = 4 Ь4 = 3 й] = 3 2 1 а2 = 4 2 2 а3 = 5 2 3 Для краткости в Матрице плана перевозок не пишем нулевые значения не- базисных перевозок. Значение функционала равно 21. Число ненулевых элементов в первоначальном плане перевозок m+n-1 = 3+4-1 = 6. Это позволяет сразу перейти к^сследованию на оптимальность найденного плана. Построим матрицу С: V| = 1 v2 = 2 v3 — .1 v4 = 0 и\ — 0 1 2 1 0 и2 — 1 2 3 2 1 Из = 1 2 3 2 1 _ / ° ° 2 4\ В матрице Д = С - С = ( 2 0 0 -1 1 минимальный элемент \-2 -1 О О/ Дз1 = min Ду = -2 < 0. Добавляя в первоначальный план распределения Величина t = 2. Из трех обнулившихся базисных элементов в базисе оставили два элемента с наименьшими стоимостями перевозок. Значение
168 Глава 2. Линейное программирование функционала равно 17. Построим матрицу С: Vj = 1 V2 = 2 v3 = 3 «4 = 2 u\ = 0 1 2 3 2 U2 — — 1 0 1 2 1 «3 = -1 0 1 2 1 _ /0 0 0 2\ В матрице Д = С - С = I 4 2 0 -1) минимальный элемент \0 1 О О/ Д24 = min Д^-=-1 < 0. Добавляя в первоначальный план распреде- м ления на место нулевого небазисного элемента ®24 величину t, получим третий план возможных перевозок: 0 3 4-t t 2 Q + t 3-t 0 3 1 3 2 3 Величина t — 3. Значение функционала = 14. Построим матрицу С: Vj = 1 V2 = 2 v3 = 3 v4 = 1 U\ = 0 1 2 3 1 U2 = “I 0 1 2 0 u3 = -1 0 1 2 0 _ /б 0 0 3\ В матрице Д = С - С = ( 4 2 0 0) все элементы неотрицатель- \0 1 0 1/ ны. Значит найденный третий план перевозок является оптимальным и суммарная стоимость всех перевозок равняется 14. Пример 3. 5жц +4ш12 4- 13®1з + 9е14 + 2ш2| 4- 7®22 4- + 8®24 4- + 9ш31 + 7ш32 + 11£зз -Ь 7я34 + ж41 -Ь 6ж42 4- £43 -Ь Х44 -► min; ли 4-£12 4-£13 4-£14 = 19, £ц 4~ £21 4-£31 4-£41 = 9, £21 4~ х22 4~ £23 + £24 = 7, £12 4~ £22 4~ £32 4~ £42 = 17, £31 + £32 4- £33 4- £34 = Н, £13 4- £23 4- £33 4- £43 == 15, £41 4- я42 4- £43 + £44 = 15, £14 4- £24 4* £34 4- £44 =11, Xij 0, i9j = 1,2,3,4.
§ 5. Транспортная задача 169 Решение. Представим задачу замкнутого типа в стандартной форме: II л" Ь2 = 17 Ь3 = 15 ь4 = н а( = 19 5 4 13 9 а2 — 7 2 7 6 8 а2= 11 9 7 11 7 а4 — 15 1 6 1 1 Построим по методу «Северо-западного угла» первоначальный план: ja- il so b2 = 17 b3 = 15 b4 = 11 а, = 19 9 10 а2 = 7 7 0 а2 = 11 11 а4= 15 4 11 Для краткости в матрице плана перевозок не пишем нулевые значения небазисных перевозок. Значение функционала равно 270. Число элемен- тов в базисе т-Ьп-1 — 4 + 4-1—7. Один базисный элемент оказался нулевым. Это означает, что задача является вырожденной. Перейдем к ис- следованию на оптимальность найденного плана. Построим матрицу С: «1=5 «2 = 4 «з = 3 «4 = 3 щ = 0 5 4 3 3 и2 = 3 8 7 6 6 «з = 8 13 12 11 11 «4 = -2 3 2 1 1 / 0 0 10 6\ — А Л 7=7 1 “"6 0 0 2 1 w В матрице Д = С - С = 1 q -4 1 минимальны^ элемент \-2 4 0 0/ Д21 = min = -6 < 0. Добавляя в первоначальный план распределе- ния на место нулевого небазисного элемента ж21 величину t, получим Второй план возможных перевозок: 9-i 10 + t —> 2 17 t 7-t 0 7 0 11 11 4 11 4 11
170 Глава 2. Линейное программирование Величина t = 7.,Значение функционала = 228. Построим матрицу С: Vi = 5 V2 = 4 «з = 9 «4 = 9 щ — 0 5 4 9 9 «2 = -3 2 1 6 6 Uy — 2 7 6 11 11 щ = -8 -3 -4 1 1 (0 0 4 0\ 0 6 0 2 1 2 1 0-4 минимальный элемент 4 10 0 0/ Д34 = min Ду = -4 < 0. Третий план перевозок: 2 17 7 0 11 -t t 4 + t 11 -t 2 17 7 0 11 15 0 Величина t — 11. В этом случае обнуляются сразу два базисных эле- мента. Оставим из них в базисе элемент Х44 с наименьшей стоимостью перевозок. Значение функционала равно 184. Построим матрицу С: Vi = 5 v2 = 4 v3 = 9 «4 = 9 Щ = 0 5 4 9 9 u2 = -3 2 1 6 6 Uy = -2 3 2 7 7 Щ = -8 -3 —4 1 1 /0 0 4 0\ Матрица Д = C - C = 1 0 1 6 6 5 0 4 2 1 q 1 > 0. Значит третий план \4 10 0 0/ перевозок является оптимальным и стоимость всех перевозок равна 184. 5.6. Задача двойственная к транспортной задаче Рассмотрим транспортную задачу: т п (с, х) : = ЕЕ Cijfyj —> min; »=i >1
§ 5. Транспортная задача 171 (Р) (а) (Ь) / т п \ замкнутого типа (. Двойственной к ней будет (см. п. 2.5) задача 3 т п {а, и) + {Ь, ®) := aiui + 52 bivi max; ... t=l >1 V ) . Ui+Vj^Cij, i = l,...,m, j = l,...,n, в которой двойственными переменными являются потенциалы и = (щ.....ит), v = (vl,...,vn). В матричном виде ограничения задачи (Р**) имеют вид: /10. 1 о . 0 10. 0 0 1. C|2 1 о . 0 1 . 0 1 . \ 6 6 .. 0 0 0. 0 10. 0 0 1. 0 0 0. i i 6 . 10 1. um Vl V2 Vn cln C21 C22 Cm2 Матрица ограничений является транспонированной по отношению к ма- трице ограничений исходной транспортной задачи (Р). 5.7. Обоснование метода потенциалов решения транспортной задачи Теорема. Крайняя точка х является решением в невырожденной транс- портной задаче (Р) тогда и только тогда, когда вектор Д > 0. 6 i 6 6 . о о . i 6 6 . u2 ^2n Cmn '
172 Глава 2. Линейное программирование Доказательство. Достаточность. Пусть Д > 0. Это означает, что для точки х найдены потенциалы Ui,Vj такие, что Д^ := Cjj - с;; = Cij - (Ui + Vj) >0, i — 1,..., m, j = 1,..., n, причем щ + Vj — Cij для ба- зисных г, j (множество базисных индексов обозначим В). Следовательно, щ + Vj Cij, i = 1,...,пг, j = l,...,n. Таким образом, условие Д > 0 равносильно тому, что вектор (и, v) является допустимым в двойственной задаче (Р**)> С другой стороны, поскольку Xij = 0 при (i,j) £ В, то т п т п (с, х) = 52 52 чх*з= 52 wa = 52 = 5252<и«'+v^xa- i=l j=l i,j£B i,j£B t=l j=l Разбивая последнюю сумму на две и учитывая условия (а) и (Ь), продол- жим последнее равенство т п т п т п пт (с, х)=52 52 и*хи+52 52 = 52 52 +52 52 = •=1 j=| 1=1 ,=1 i=l 7=1 7=1 ,=1 т п = 52Uiai+^2v3bj = <а’“) + (b>vy i=t j=i Отсюда по критерию решения п. 3.1 х — решение в прямой за- даче (Р), а (и, v) — решение в двойственной задаче (Р**). Необходимость. Пусть х — оптимальный план. Докажем, что тогда Д > 0. Проведем доказательство от противного. Допустим, что это условие не выполняется, т.е. существует Д1о;о < 0. Поскольку Д^ = 0 для (г, j) Е В, то (г0, Jo) £ В. Возьмем достаточно малое t > 0 так, чтобы х +1 0, где вектор t = {tij} выбирается по методу потенциалов, {±t или 0, i,j Е В, i ~ $0, j = Jo, О, иначе. Условия (a)-(b) допустимости вектора х 4-1 в задаче (Р) равносильны условиям: 52*v=0> 52*У=О> (♦) «=1 У=1 Поскольку Cij = &ij + Cij = + Vj), to m n (с, X + 0 - (c, x) = (C, 0 = 52 52+ (“« + Vi)) bij = i-1 j=1 m n m n n m —52 ^ijUj+5252+52 v3 52 =^«ол^ол- t=l ;=l 1=1 j=l 7=1 1=1
§ 5. Транспортная задача 173 Последние два слагаемых в этой сумме равняются нулю в силу соот- ношения (*). Слагаемые Aijtij = 0 при (i,j) / («о, Jo), так как в этом произведении один из сомножителей равен нулю: Д.у = 0 при (г, j) 6 В, tij = 0 при (г, j) & В, (i,j) (io,Jo). Таким образом, (с, х 4- — (с, х) = ^iojotiojo < О, значит, х не является оптимальным планом. Получили противоречие. Следовательно, наше допущение, что существует Д^о < 0 неверно и, если х — оптимальный план, то обязательно Д > 0. 5.8. Задача о назначении. Пример Пусть некоторая фирма нанимает т служащих на п вакантных мест. Известно, что при назначении i-ro служащего на j-e место фирма получит Cij прибыли. На какие должности кого надо назначить, чтобы общая прибыль фирмы после назначений была наибольшей? Таким образом, задача о назначении является частным случаем транспортной задачи о максимуме функционала, когда at = bj — 1, i = 1,... ,m, j = 1,... ,n: m n (c, x) := У2 max5 xij 0, i = 1,... , 7П, j = 1,... , n, t=l ;=1 m n = 1, j = l,...,n; = i=l,..,m. t=l Задачи о назначении также решаются методом потенциалов, предва- рительно перейдя от задачи на максимум к задаче на минимум т п -(с, ж) = ЕЕ -CjjXy min. i=l y=i Поэтому, если в платежной матрице задачи о назначении стоимости были Cij, то при решении методом потенциалов берутся стоимости -с^. Пример. 5хн 4-4ж12 4- 7»1з 4- 6ш21 + 7ж22 + Зж23 4- 8x31 4* Нж32 4-2ж33 —► max; 4- ®12 + ли = 1, Жц 4- ж21 + ®3| = 1, Ж21 4~ Х22 4~ ®23 = 1, Я12 + Х22 4* ж32 = 1, Ж31 4- ®32 4- ®33 = 1, Я|3 + ®23 + Хзз = 1, Xij > 0, i,j = 1,2,3. Решение. Задачу о назначении можно задать в виде платежной матрицы, не указывая величины поскольку они равны 1:
174 Глава 2. Линейное программирование 5 4 7 6 7 3 8 11 2 Перейдем от задачи на максимум к задаче на минимум, при этом в пла- тежной матрице стоимости поменяют свой знак: -5 -4 -7 -6 — 7 -3 -8 -11 -2 Построим по методу «Северо-западного угла» первоначальное рас- пределение. Два нулевых элемента будем считать базисными, чтобы Значение функционала равно -14. Построим матрицу С: v\ = -5 v2 = -8 «з = 1 щ = 0 -5 -8 1 U2 — 1 -4 -7 2 из = -3 -8 -11 -2 _ /04 -8\ В матрице Д = С - С = ( -2 0 -5] минимальный элемент \ 0 0 0/ Д13 = min Дй = -8 < 0. Добавляя в начальный план распределения м на место нулевого небазисного элемента х в величину t, получим второй план: 1 -t t 1 0 + i 0 1 -t 0 1 1 1 0 Величина t = 1. Из двух обнулившихся базисных элементов в базисе оставили элемент с наименьшей стоимостью. Значение функционала
§ 5. Транспортная задача 175 равно -22. Построим матрицу С: Vi = -5 V2 = -8 Vj = -7 «1=0 -5 -8 — 7 «2 = 1 -4 -7 -6 «3 = -з -8 -11 -10 _ / 0 4 0\ В матрице Д = С - С = I -2 0 3 I минимальный элемент \ 0 0 8/ Д21 = пни Ду = -2 < 0. Добавляя во второй план распределения на место нулевого небазисного элемента ®21 величину t, получим третий план распределения должностей: 0 1 t 1 -t 1 -t o + t 0 1 1 0 1 Величина t = 1. Из двух обнулившихся базисных элементов в базисе оставили элемент с наименьшей стоимостью. Значение функционала равно -24. Построим матрицу С: Vi = -5 «2 = -8 V3 = -7 «1=0 -5 -8 -7 U2 = -1 -6 -9 -8 «з = -3 -8 -11 -10 _ /0 4 0\ В матрице Д = С - С = [ 0 2 5] все элементы неотрицательны. \0 0 8/ Значит найденное распределение является оптимальным и значение исходной задачи равняется 24. 5.9. Задачи 5.1. 2жц + 3xi2 + 4xi3 + xu + 3x2i 4-4ж22 Ч-2а?2з + 5х24 + ^31 4- 7^32 4- 5®зз 4- 4- 7®з4 4- 4- 2®42 4- 8x43 4- 2x44 —> min; Иц 4-^2 4-аЧз 4-Ж14-7, Жп 4-®2i 4- Ж31 4-я4| = 11, $21 4- Х22 4- ®23 4- ®24 — 8, Ж]2 4- ®22 4“ ж32 4- ^42 = 2, ®31 4“ ^32 4“ ®зз 4- »34 = 5, ж1з 4- ®2з 4- жзз 4- #43 = 6, ®41 4- 3?42 4- ®43 4- Х44 = 6, Ш|4 4“ ^24 4“ Ж34 + Ж44 = 7, Xij 0, i,j = 1,2,3,4.
176 Глава 2. Линейное программирование 5.2. Ши 4» 3»|2 4- Юш 1з 4- 6®i4 4- 7»21 4- 2^22 4- 5®2з 4- 8^24 4-.5®з| 4- 2®з2 4- 2о?зз 4- 9»з4 4- 2ж4| 4- я42 4- Зж43 4- 4®^ -» min; #11 4- #12 4- #в 4- #14 = 6, #21 + х22 4* #23 + #24 = 18, #31 4- #32 4- ®зз 4- #34 = 14, Х41 4- #42 4- #43 4- Х44 = 10, #ц 4- #21 4- #31 4- #4i = 14. Ж12 4“ я?22 + Я?32 4-Ж42 = И3 #13 4-#23 4~ #зз 4-#43 = 8. #14 4- $24 4- #34 4- Х44 = 15, xij 0, i,j = 1,2,3,4. 5.3. 4#н 4- ЗШ|2 4- 3®|з 4* 6#2i 4- 4#22 4- 5#2з 4- 5#3i 4- 4#32 4- 6#33 4- 6#4i 4- 9#42 4- Ю#43 —► min; #11 4-#12 4-#13 8, #21 4- #22 + #23 17, #31 4- #32 + #33 7, #41 4* #42 4- #43 4, #11 4-#21 4" #31 4" #41 = 5, #12 4- #22 4- #32 4- #42 = 15, #13 4- #23 4- #33 + #43 — Ю, #v>0, г, = 1,2,3,4, j = 1,2,3. 5.4. 2#п 4- 6®i2 4- 2®i3 4- #i4 4- 2#i5 4- 9#2i 4- 4#22 4- 3#2з 4- 4#24 4- 3#25 4- 5ж31 4- 2#32 4- 8#33 4- 2ж34 4- 5#35 min; #11 +#21 4* #31 = 15, #11 + #12 4- #13 4- #14 4- #15 = 13, #12 4-#22 + #32 — 7, #21 + #22 4“ #23 4“ #24 4- #25 = 11, #13 4- #23 4- #зз — 14, #3i 4- #32 4- #33 + #34 4- #35 = 27, #i4 4-#24 4-#34 = 9, #15 4- #25 4- #35 = 6, #о>0, i= 1,2,3, j = 1,2,3,4,5. Ответы к задачам главы 2 1.1. (1,3,0) е Arg; Smax = 4. 1.2. (0,3,0,2), (2,1,0,0) € ArgP; Smax = 5. 1.3. (0,4,0,0) € Arg; Smax = 4. 1.4. (2,0,3,0) е Arg; Smax = 5. 1.5. (5,3,0,0) G Arg; Smax = 8. 1.6. (1,1, 1,0) G Arg; Smax = 3. 1.7. (5,0,3,4,0) G Arg; Smax = 15. 1.8. (1,2,3,0,0,0) G Aig; Smax = 2. 1.9. (5,0,4,1,0,1,0) G Arg; Smax = 10. 4.1. (5,2,0) G Extr, (5,2,0) G Arg; Smax = 13. 4.2. (1,0,2) G Extr; Smax =+oo, ((1,-10,1), (1 + 10M.2 + ^)) = 9 3 + — t —> 4-oo при t —> 4-oo.
Ответы к задачам главы 2 4.3. е Extr, (4,0,2,0) G Arg; Smax = 10. 4.4. (|,0, |,о) G Extr, (рО,О,^) GAig; Smax = 3. 4.5. (0,1,1,2) G Extr, (1,2,0,3) G Arg; Smax = 6. 4.6. D = 0 => Smax=.-oo. 4.7. (o, 0,0,0, у) 6 Extr; Smax = +oo, ^(1,2,3,4,5), (o,0,0,i, у + _» +oo при t -♦ 4-00. 4.8. (0,0,10,0,0), (10,0,0,0,10) G Arg; Smax = -10. 4.9. (O,O,O,1,O,D e Extr, (0,0,0,1,0,1) GAtg; 5max = 2. 5.1. Жп = 4, жм = 3, ®2i = 2, X23 = 6, X31 = 5, «42 = 2, X44 = 4; ^min = 46. 5.2. ®n = 6, ®22 = 11, ®24 = 7, ®3i = 6, ®зз = 8, X41 = 2, X44 = 8; ^min= 166. 5.3. ®i3 = 8, X22 = 15, ®23 = 2, Ж31 = 5; Smjn = 119. 5.4. = 10, «в = 3, ®23 = И, ®3i = 5, «32 = 7, «34 = 9, ®35 = 6;
Глава 3 Вариационное исчисление Началу появления вариационного исчисления дала толчок работа И. Бернулли 1696 года «Новая задача, к решению которой приглашаются математики», в которой поставлена задача о брахистохроне. В вертикаль- ной плоскости даны две точки А и В. Определить путь АМВ, спускаясь по которому под действием собственной тяжести тело М, начав двигаться из точки А, дойдет до точки В за кратчайшее время. Вводя в плоско- сти систему координат так, чтобы ось t была горизонтальна, а ось х вертикальна, и пользуясь законом Галилея о скорости тела, падающего вниз под действием силы тяжести, можно выписать формализованную постановку задачи: Г х/1 + ш2(0 .. / ——р—— dt —» min; j х/Ф) *0 x(tQ) = Xq, X(ti) = X[. Здесь и далее точка над функцией (i(t)) означает производную этой функции по t. Поставленная задача была решена самим И. Бернулли, а также Я. Бер- нулли, Лейбницем, Лопиталем и Ньютоном. Решение Лейбница было основано на аппроксимации кривых ломаными. Развитая затем в работах Эйлера, эта идея заложила основы прямых методов в вариационном исчислении. Выписанная выше задача об экстремуме интегрального функционала при заданных условиях на концах, является простейшей задачей вариационного исчисления, к рассмотрению которых мы сейчас и перейдем. В третьей главе приводятся также и другие элементарные задачи вариационного исчисления: задача Больца, изопериметрическая задача. Все они являются частными случаями более общей задачи Лагранжа. Как частные случаи задачи Лагранжа рассматриваются задача с подвижными концами и задача со старшими производными.
Л"*'*'v § 1. Простейшая задача вариационного исчисления 179 § 1. Простейшая задача вариационного исчисления 1.1. Постановка задачи Простейшей задачей вариационного исчисления называется следующая экстремальная задача в пространстве h J(x(.)) = J L(t9x(t)9x(t)) dt —► extr; x(to) = xQ, x(ti) = x\. (P) to Здесь L = L(t, x, x) — функция трех переменных, называемая ин- тегр антом. Отрезок [£о> £1 ] предполагается фиксированным и конечным, to < t\. Экстремум в задаче рассматривается среди непрерывно диф- ференцируемых функций х 6 С1 2 ([to, М, R), удовлетворяющих условиям на концах, или краевым условиям: x(to) = х0, x(t\) = х\. Такие функции называются допустимыми. Определение. Говорим, что допустимая функция А доставляет слабый локальный минимум в задаче (Р), и пишем х 6 wlocmin^P, если существу- ет 6 > 0 такое, что 7(ж(-)) > 7(ж(-)) для любой допустимой функции х (® € Р(Р)), для которой ||®(>) - A(-)llcI([io3il)2> < s- Наряду со слабым экстремумом в классическом вариационном ис- числении также изучается сильный экстремум. При этом расширяется класс функций, среди которых рассматривается задача. Сильный мини- мум ищется в более широком пространстве, чем С]([to,]), а именно, в пространстве кусочно-дифференцируемых функций РС{([t0, t\]). Стро- гое определение сильного экстремума будет дано в главе 5 п. 1. Однако, как правило, функции, доставляющие абсолютный (гло- бальный) экстремум в С1 или PC1, доставляют абсолютный экстремум и среди более широкого класса функций — всех абсолютно непрерывных функций, на которых функционал J определен. 1.2. Вывод уравнения Эйлера с помощью основной леммы вариационного исчисления Теорема. Пусть функция х доставляет слабый локальный экстремум в задаче (Р) (х 6 wlocextrP), функции L,Lx,Lx — непрерывны как функ- ции трех переменных, Lx Е С^фо,^]). Тогда функция х удовлетворяет Weak — слабый. 2) Напомним, что 11»11с«(!*.Л|1> := max {ll»llc([Wil)> H»Hc((Wil)}> где :=
180 Глава 3. Вариационное исчисление уравнению Эйлера d ~ --Li(t) + Lx(t) = 0 at d I d I Здесь Li(t) := — L(t,x,x) xssi(i), аналогично Lx(t) := — L(t,x,x) x=f(0. dX *4=4(0 Выписанное дифференциальное уравнение второго порядка было впер- вые (в 1744 году) выведено Эйлером. Он, аппроксимируя кривые ломаными, вывел уравнение, которому были должны удовлетворять экстремали. Впоследствии Лагранж назвал его уравнением Эйлера, Сам Лагранж выводил это уравнение (в 1759 году), варьируя кривую, подо- зреваемую на экстремум. Выделил из приращения функционала главную линейную часть, которые называл вариациями, и воспользовался тем, что в точке экстремума вариация должна обращаться в нуль. Метод вариа- ции, предложенный Лагранжем, стал общепринятым. Этим методом мы и выведем далее уравнение Эйлера. Функции, удовлетворяющие уравнению Эйлера задачи (Р), назы- ваются экстремалями. Множество экстремалей обозначаем Е(Р). До- пустимые функции (класса С1 с заданными граничными условиями), удовлетворяющие уравнению Эйлера, называются допустимыми экстре- малями. Множество допустимых экстремалей обозначаем DE(P). Доказательство. Возьмем произвольную, но фиксированную функ- цию h 6 С'([<о, 11])3>. Поскольку х 6 wlocextrP, то функция одного переменного ti := j(4(-) + Aft(-)) = /+ АЛ(0,4(0 + Xh(t)) dt to имеет экстремум при А = 0. Положим F(t, X) = L(t, 4(0 + АЛ(0,4(0 + АЛ(0). Из условий гладкости, наложенных на L,x,h, следует, что функция <р дифференцируема в нуле. (Действительно, функции F и Fx непрерывны в некотором прямоугольнике [£0,М х [-Ао, Ао], и, значит по известной теореме из анализа можно дифференцировать под знаком интеграла.) Но тогда по теореме Ферма у/(0) = 0. Дифференцируя функцию <р и полагая А = 0, получаем ti <р'(0) = J(Li(t)h(t) + Lx(t)h(t))dt = O УЛее^ЬоЛ]). (1) to 3) Со(ко.М) := {*( ) € ill) I Л(«о) = =o}.
§ 1. Простейшая задача вариационного исчисления 181 Проинтегрируем по частям первое слагаемое в соотношении (1) для h Е Со(Go,ti]) (здесь мы пользуемся условием теоремы, что Li Е С1 (Go, *1 ])): i| $i i| Lihdt = j Lidh = - J hdLi = - J ^L^hdt. to ' to to to Свободные члены при интегрировании по частям равняются нулю, так как Л(£о) = h(t]) = 0. Тогда соотношение (1) перепишется в виде h ~^Li(t) + Lx(t))h(t)dt = O yhecU[to,ti]>- (2) to Основная лемма вариационного исчисления (лемма Лагранжа). Пусть функция а непрерывна на отрезке [to> £>] (а € C(Go, <i]) и t\ a(t)h(t)dt = Q VfcEC<}(Go,*i])- ^0 Тогда a(t) = 0. Доказательство леммы. Предположим а(т) / 0 в некоторой точке т € Go, • Для определенности, пусть а(т) > 0. Тогда в силу непрерыв- ности функция a(t) > 0 и в некоторой окрестности точки т, например, отрезке [t0,Ti] С Go,*iL Пусть h Е Cj(Go, ^ij) — положительная в этой окрестности функция и равная нулю вне ее, типа «шапочки», например, h(t\ = / - то)2(* - Т|)2, t е [то, л], ° 10, ^[то.т,]. «I Тогда h Е Со (Go, t\]) — допустимая в лемме функция, но / a(t)h(t) dt > 0, to что противоречит условию леммы. Лемма Лагранжа доказана. По лемме Лагранжа из соотношения (2) вытекает уравнение Эй- лера. 1.3. Вывод уравнения Эйлера с помощью леммы Дюбуа-Реймона В этом пункте мы выведем уравнение Эйлера для меньших условий гладкостей, наложенных на интегрант L. При выводе уравнения Эйлера вместо леммы Лагранжа будем использовать лемму Дюбуа-Реймона.
182 Глава 3. Вариационное исчисление Теорема. Пусть функция & доставляет слабый локальный экстремум в задаче (Р) (х Е wlocextrP), функции Ь,Ъх,Ьх — непрерывны в некоторой окрестности расширенного графика (L,LX,L± Е'С(О(Г^))). Тогда Li — непрерывно дифференцируемая функция (Lx Е С1 ([to, ])) w функция х удовлетворяет уравнению Эйлера d- at Доказательство. Возьмем произвольную, но фиксированную фун- кцию h Е Со ([to, ]). Поскольку х Е wlocextrP, то функция одного переменного ti р(А) :=J(*(•) +АЛ0) = JL(t,&(t) + Xh(t),£(t) + Xh(t))dt to имеет экстремум при Л = 0. Положим F(t, А) = L(t, x(t) + Xh(t), &(t) 4- АЛ(<)). Из условий гладкости, наложенных на L,x,h, следует, что функция <р дифференцируема в нуле. (Действительно, функции F и F\ непрерывны в некотором прямоугольнике [t0, t>] х [-Ао,Ао], и, значит по известной теореме из анализа можно дифференцировать под знаком интеграла.) Но тогда по теореме Ферма у/(0) = 0- Дифференцируя функцию <р и полагая А = 0, получаем <р'(о) = j(Lx(t)h(t) + dt = о vft e cMmi]). (i) to Здесь мы не можем, как в предыдущем случае, брать второй интеграл по частям, поскольку не задана дифференцируемость функции L±(t). Уравнение (1) означает, что вариация по Лагранжу функционала J равна нулю: (£(•),Л0) =0 УЛ е Со([М1В- Лемма Дюбуа-Реймона. Пусть функции ao,at € C([t0> i11) и < У + ао(0Л(0) dt = 0 УЛ е Cd([Mi]). to Тогда функция а>\ Е С’фо,^]) и выполняется дифференциальное уравнение ““77ai(0 + МО = 0 Vt Е [to,tj (аналог уравнения Эйлера). dt 4)^i :=
§ 1. Простейшая задача вариационного исчисления 183 Из леммы Дюбуа-Реймона и соотношения (1) следует утверждение теоремы. Доказательство леммы. Возьмем функцию р € С’^оЛ]) такую, что ii il p(t) == ао(0, Jp(t) dt = J a\(t)dt. to to Она существует, так как p(t) = ао(0 — дифференциальное уравнение 1-го порядка, решение которого определено с точностью до константы, а выбором константы можно удовлетворить второе условие. Тогда для любой функции h 6 Со(|/о,М) по условию леммы должно выполняться равенство Ь h t} J (a\(t)h(t) + aQ(t)h(t))dt = f a}(t)h(t)dt + J h(t)dp(t) = to to to <1 $1 i| =Jai(t)h(t)dt+h(t)p(t)^ - jp(t)h(t)dt = J(ai(t)-p(t))h(t)dt = 0. (2) io io io t Возьмем функцию h(t) = J(й|(т) - p(r)) dr. Тогда ti = a\ - p и io Л e Со(ко,*1])- Действительно, равенство Л(^о) = 0 следует из определе- ния функции Й, равенство h(t\) = 0 вытекает в силу выбора функции р: it й(^) = f(^1(0 - p(t)) dt = 0. Значит для функции h должно вы- io подняться равенство (2), то есть J(й| -p)2dt = 0. Отсюда следует, что io d a\(t) = p(t). Таким образом aj 6 С1 ([to,tj) и ai(t)4-a0(t) = 0. Лемма dt Дюбуа-Реймона, а вместе с ней и теорема доказаны. 1.4. Векторный случай Мы сформулировали теорему для одномерной задачи вариационного исчисления. Аналогично ставится векторная задача и формулируются необходимые условия экстремума. Пусть x(t) = (®i(t),... ,xn(t)) — n-мерная вектор-функция, инте- грант L == 1/(£,Ж|,...,жп,Ж|,...,жп) — функция 2п + 1 переменного.
184 Глава 3. Вариационное исчисление Рассмотрим задачу в пространстве х ... х «I JL(t, Х\,..., хП9 х।,..., хп) dt —> extr; to Xi(tj) = Xij, i=l,...,n, j = 0,1. Необходимые условия экстремума в простейшей векторной задаче состоят из системы уравнений Эйлера + = i=l,...,n. dt Доказательство теоремы в векторном случае тривиально редуцируется к одномерному случаю. 1.5' Интегралы уравнения Эйлера Если интегрант L = L(t> х, х) не зависит явно от одной из перемен- ных, то уравнение Эйлера сводится к более простым уравнениям. 1. Если интегрант L = L(t9x) не зависит явно от х, то имеет место интеграл импульса L*(t) = const. 2. Если интегрант L = Цх9х) не зависит явно от t9 то имеет место интеграл энергии (оба названия интегралов взяты из классической механики) ^(t)Lx(t) - L(t) = const. Для доказательства интеграла энергии достаточно продифференцировать последнее равенство по t и воспользоваться уравнением Эйлера: .. — . d — — • — .. . / d \ Lx^ = 0 v— х I 4* ) = 0. dt \ dt / Замечание. Отметим, что при выводе интеграла энергии мы использо- вали дополнительное предположение о существовании второй производ- ной f. Интеграл энергии имеет также лишнюю экстремаль &(t) = const. 1.6. Примеры 1 Пример 1. J(x(-)) = f x2dt-+ min; ж(0) = 0, ш(1) = 1. о Уравнение Эйлера: х = 0. Общее решение: х = C\t 4- С2. Из начальных условий находим един- ственную допустимую экстремаль: А = L
§ 1. Простейшая задача вариационного исчисления 185 Докажем, что она доставляет абсолютный минимум в задаче, т. е. £ = t Е absmin. Для этого надо показать, что J(a;(-)) > J(®(-)) Для любой допустимой функции х, или, что то же самое, + > J(£) для любой функции h € Со ([0,1]). Действительно, I ill J(f + ft)-J(4) = J(£ + h)2dt-J £2dt = 2 Jihdt + Jh2dt^ 0 0 о 0 1 1 1 ^2 J &hdt = 2 J fd/i = 2^ft|^-2 J £hdt = O. 0 0 0 Таким образом, разность всегда неотрицательна, то есть имеем абсолют- ный минимум. = 0. Зх/2 Пример 2. <7(ж(-)) = У* (я2 “ ®2) ~* ™п» о Уравнение Эйлера: х + х = 0. Общее решение: х = С] sinf -Ь С? cost. Из начальных условий на- ходим единственную допустимую экстремаль: £ = 0. Покажем, что она не доставляет локального минимума, т. е. £ g wlocmin. 1 2t Рассмотрим последовательность функций xn(t) = — sin—. Очевид- п 3 но, что хп — допустимые функции и хп —► ж в метрике простран- ства С1 ([0,1]), но при этом Зх/2 = ^ / (5 c°s2 7 -sin2 7)dt = (| - о < 0 = о Получили, что значение функционала на хп меньше, чем на ж, значит £ не доставляет слабого локального минимума. Из этого примера видно, что уравнение Эйлера — необходимое, но не достаточное условие экс- тремума. 1.7. Задачи j х2 dt extr; ж(0) = 1, ж(1) = 0. о То 1.2. J х2 dt —> extr; о ж(0) = 0, x(TQ) = $.
186 Глава 3. Вариационное исчисление 1.3. 1.4. 1.5. 1.6. 1.7. 1.8. 1.9. 1.10. 1.11. 1.12. 1.13. 1 J(х2 -x)dt extr; ж(0) = ®(1) — 0. о То j(х2 -x)dt~* extr; ж(0) = 0, ®(То) = С о То j (х2 -x)dt—> extr; ж(0) = х(То) = 0. о । J (х2 + tx)dt —> extr; ж(0) = х(1) = О о । J(х2 - t2x) dt -+ extr; ®(0) = ®(1) = 0. о е У tx2 dt -♦ extr; ж(1) = 0, х(е) = 1. е J(tx2 + 2х) dt extr; х(1) = х(е) = 0. 1 1 J(1 + t)x2 dt -* extr; ж(0) = 0, х(1) = 1. о е J(tx2 + 2х) dt -+ extr; ®(1) = 1, х(е) = 0. । е J(x~ extr» ж0) = h ®(е) = 2. 1 2 J t2x2dt extr; ж(1) = 3, х(2) = 1.
§ 1. Простейшая задача вариационного исчисления 187 1.14. 3 (t2 - 1)х2 dt —extr; ®(2) = 0, ®(3) = 1. 2 1.15. е У (2х - t2x2) dt —> extr; ж(1) = е, ж(е) = 0. 1 1.16. л J х2х2 dt —► extr; ж(0) = 1, ж(1) = >/2. 0 1.17. 1 У х2х2 dt -> extr; ж(0) = 2, ж(1) = л/3. 0 4/3 1.18. У Jdt^extr; ®(0) = 1, х(|)=1.' 0 1.19. 1 У ехх2 dt —► extr; х(0) = 0, ж(1) = 1п4. 0 1.20. 1 У (х2 -Ь хх + 12ta) dt —► extr; ж(0) = х(1) = 0. 0 1.21. е У (tx2 + хх) dt extr; ж(1) = 0, ж(е) = 1. 1 1.22. 1 У(t2x2 + 12ж2) dt extr; х(0) = 0, ж(1) = 1. 0 1.23. 1 1 (х2 + х2) dt —► extr; х(— 1) = х(1) = 1. — I I 1.24. у*(х2 + 4а?) dt -»extr; ®(-1) =-1, ®(1) = 1. — 1
188 Пгава 3. Вариационное исчисление 1.25. J(х2 4- х2 4- 2х) dt extr; ж(0) = я(1) = 0. о 1.26. j (х2 4- х2 4- tx) dt -♦ extr; ж(0) = ж(1) = 0. о То 1.27. J(х2 + х2) dt —► extr; ж(0) = 0, x(Tq) = £. о 1 1.28. J(4xsini - х2 - х2) dt extr; ж(0) = ж(1) = 0. о । 1.29. J(х2 + х2 + 6х sh 2t) dt —► extr; ж(0) = ж(1) = 0. о То 1.30. J(х2 + х2 - 4xsint) dt extr; ж(0) = 0, x(TQ) = о То 1.31. J(х2 + х2 4- 6х sh20 dt extr; ж(0) = 0, x(Tq) = о । 1.32. J(х2 + х2 + 4х sht) dt —> extr; ж(0) = -1, ®(1) = 0. о То 1.33. J(х2 + х2 + 4х sh£) dt —* extr; ж(0) = 0, x(Tq) = о 1 1.34. J(х2 4- х2 + 4х cht) dt —> extr; ж(0) = ж(1) = 0. о То 1.35. У\х2 4- х2 4- 4х cht) dt —► extr; ж(0) = 0, х(Тц) = £. о,
§ 1. Простейшая задача вариационного исчисления 189 »/2 1.36. j(х2 - x2)dt —» extr; ®(0) = 1, = 0. о »/2 1.37. J(х2 - х2) dt —»extr; ®(0) = 0, = 1- о »/2 1.38. У (х2 - х2 + 4®cos<) dt —* extr; ®(0) = ® = 0. о »/2 1.39. J(х2 — х2 -4х sin t) dt —»extr; ж(0) — ж = 0. о /л/1 _i_ j»2 ---------dt —> extr; ж(0) = ж(1) = 1. х о То 1.43. J ху/1 + x2dt -> extr; х(-Т0) = ж(Т0) = £ -То (задача о минимальной поверхности вращения). Г л/1 + ±2 144. / -----extr; x(to) = ®0, ^Gi) = (жо > 0, Xj > 0) J (задача о брахистохроне). То 1.45. J y/x-^'hy/l + x2dt —► extr; ж(0) = 0, x(Tq) = £ (h > 0) о (задача о стрельбе).
190 Глава 3. Вариационное исчисление ^г/2 1.46. J(xj + xj + 2«i®2) Л —► extr; ei(0) = ж2(0) = 0, (у) = L о I 1.47. У(xj + xj - 2ж]Ж2)dt -> extr; Ж|(0) = ж2(0) = 0, xj(l) = sh 1, о ж2(1) = - sh 1. । 1.48. У(xj+®2 + 2±|±2)Л—>extr; Ж1(0) = ж2(0) = 0, ®i(l) = ®2(l) = shl. о 1 1.49. / (xiX2 + xix2)dt —► extr; Ж|(0) = ж2(0) = 1, Ж|(1) = е, ж2(1) = J е о 1Г/2 1.50. У(±i±2 - Ж|Я2)бй —► extr; »i(0) = ж2(0) = О, х\ (у) = 1, о I 1.51. У(i|±2+6tai + \2t2X2)dt —>extr; Ж|(0)=ж2(0)—0, Ж|(1)=я2(1)==1. о । 1.52. У(xj + 2±2 + ±з + 2х\Х2 + 2ж2$з)dt extr; £|(0) = жз(0) = 1, о х2(0) = -1, «|(у) = р »2(у)=0, жз(у)=-^. § 2. Задача Больца 2.1. Постановка задачи Задачей Больца называется следующая экстремальная Задача без огра- ничений в пространстве В(х( )) — У L(t,x(t),x(t)) dt + l(x(to)9x(ti)) —► extr. (P) to
f • §2. Задача Больца 191 Здесь L = L(t,x9x) — функция трех, а I = l(x{to),x(ti)) — функ- ция двух переменных. Задача Больца — элементарная задача вариаци- онного исчисления. Функционал В называется функционалом Больца, функция I — терминантом. Любые функции класса С1 фо, М) являют- ся допустимыми в задаче. Определение. Говорим, что допустимая функция х доставляет слабый локальный минимум в задаче (Р), и пишем х Е wlocminP, если существует 6 > 0 такое, что В(х(-)) В (£(•)) ДО* любой допустимой функции х, для которой ||ш(-) - £(-)Нс‘((М11) < 6- 2.2. Необходимое условие экстремума Теорема. Пусть функция А доставляет слабый локальный экстремум в задаче (Р) (f 6 wlocextrP), функции L,LX,LX — непрерывны в некоторой окрестности расширенного графика (L,LX,LX Е С(О(Г^))), функ- ция I — непрерывно дифференцируема в окрестности точки ($(to)>£(ti)) (1 е С1 (О(£($о), £(*i)))). Тогда Lx — непрерывно дифференцируемая функ- ция (Zf Е С’фоЛ])) и выполнены а) уравнение Эйлера —ЕДО+ £«(*) = ° vte [to3i]; at b) условия трансверсальности Доказательство. Возьмем произвольную, но фиксированную фун- кцию h Е С^фоЛ]). Поскольку А Е locextrР, то функция одного пере- менного р(Х) :=B(£(-) + Xh(-)) = ii = У Z(f,f(O + AA(O.*(O + AA(O)^ + i(^o) + ^ft(M,*Gi) + Aft(fi)) to имеет экстремум при А = 0. Но тогда по теореме Ферма у/(0) = 0. Диф- ференцируя функцию и полагая А = 0, получаем h ¥>'(0) = j + Lx(t)h(t)) dt + 4(МЛ(<о) + 4о,)Л(<|) = о (1) «о ' Vft е c'([to3i]).
192 Глава 3. Вариационное исчисление Равенство (1) выполняется для любой функции h 6 С1 фо, ]), а значит и для функций h 6 СоФо,М)- Следовательно, из (1) вытекает, что h J (Li(t)h(t) + Lx(t)h(t))dt = O УЛ € Со (Ио, М)- <0 Отсюда по лемме Дюбуа-Реймона функция Lx € С1 фо, ^i]) и выполня- ется дифференциальное уравнение d - --Дф)4-Дф) = 0 Vte[tQ,ti] at — уравнение Эйлера. Для завершения доказательства теоремы осталось вывести условия трансверсальности. Проинтегрируем по частям первый интеграл в со- отношении (1) (оно стало возможным в силу доказанного включения ЬгЮес'фоЛ])): ti t\ Li(t)h(t)dt= L±(t)dh(t) = Li(t)h(t)\ - h(t)-Lt(t)dt. J lio J at to to to Подставляя полученное выражение в соотношение (1) и учитывая уже доказанное уравнение Эйлера, получим *1 р'(0) = У (“М + ^(0)л(0 dt + to _ 4-(£ф|) 4- 4- (—£фо) 4- Ц*о))^Фо) = = (^^1) + ^))^!) + (-£ИМ + и)М) = 0 VftG С'фо,^]). (2) Подставляя в (2) последовательно h(t) — t-t\ и h(t) = t-to, придем к условиям трансверсальности Ltfa) = 1Х^ и = -i^). Тем самым теорема полностью доказана. 2.3. Многомерный случай Мы сформулировали теорему для одномерной задачи Больца клас- сического вариационного исчисления. Совершенно аналогично ставится векторная задача Больца и формулируются необходимые условия экстре- мума. Пусть x(t) = (жф),... ,жп(0) — n-мерная вектор-функция, инте- грант L = L(i,a?i,... ,шп,±1,... ,±п) — функция 2п4-1 переменного, тер- минант I = / (я?фо),. • • . ,Ягф1)) — функция 2п перемен-
§ 2. Задача Больца jfT- -' - 193 ных. Рассмотрим задачу в пространстве х • • • х Сгфо, L К) J L(t,x\f... ,хп,х\9... ,xn) dt 4» + г(ж1(^о),.-.,жп(^о),Ж1О|),...,®п(^)) —►extr. Укажем на необходимые изменения при формулировке условий экстремума для векторного случая. Необходимые условия экстремума в векторной задаче Больца состоят из системы п уравнений Эйлера d - -~Ь*Д0 + = 0, i = 1,... ,п, dt и системы 2п условий трансверсальности ДьД^о) = = i = 1,Я. Доказательство теоремы в векторном случае тривиально редуцирует- ся к одномерному случаю. Действительно, фиксируем у векгор-функции я(.) = ((&](•),...,яп(-)) все компоненты кроме жД-), Тогда функционал Больца будет зависеть только от одной функции жД-): В(хД-)) = В((#Д-), ...,(•),жД-),(•)> • • •>*«(’))• А Для одномерного случая необходи- мые условия экстремума — уравнение Эйлера и условия трансверсаль- ности по жД-) — уже доказаны. Каждое уравнение Эйлера — дифференциальное уравнение второго порядка — содержит при интегрировании две константы. Всего — 2п констант интегрирования. Для их нахождения у нас есть 2п уравнений — условий трансверсальности. В таком случае, когда количество неизвест- ных совпадает с количеством уравнений для их нахождения, мы говорим о полноте набора условий для нахождения экстремали. Как правило, во всех наших задачах мы имеем полный набор условий для определения неизвестных. 2.4. Пример 1 В(ж(-)) = j\x2-x) dt + я2(1) —>extr. о Решение. Необходимые условия экстремума: а) уравнение Эйлера d d 1 + = 0 2±- 1 = 0 <=» -2ж- 1 =0 ж = --; dt dt 2
194 Глава 3. Вариационное исчисление Ь) условия трансверсальности ( Lt(0) = 1Х(О}, ( 2i(0) = 0, Г ®(0) = 0, lbi(l) = -^(i) 12®(1) = —2®(1), l®(l) = -s(l). Решение уравнения Эйлера: t t2 х — — — -F Ci, x — —— 4- Cjt 4* C3. 2 4 Из условий трансверсальности находим константы С\ и Су. р(0) = 0, 3 1 ®(1) — “ж(1)> [ “2 — - — С2 О Сз — 3-? Таким образом, имеется единственная допустимая экстремаль £ =-. 4 Покажем, что она доставляет абсолютный минимум в задаче. Дей- ствительно, если функция h 6 С’([0,1]), то 1 В(£04-Л0)-В(£0)== У + + о 1 ill - j\&2-£)dt-£2(l) = J2£hdt + У h2dt- Jhdt+2£(l)h(l) + h2(l) 0 0 0 0 I (отбросим неотрицательные слагаемые J h2 dt и Л2(1), внесем функцию h о под знак дифференциала, проинтегрируем по частям и объединим два интеграла, вынося за скобки h) । 1 i J 2£dh- J ЛЛ+2£(1)Л(1) = 24(0Л(0|*+J(-2£-l)hdt+2£(l)h(l) = 0 0 о (функция £ удовлетворяет уравнению Эйлера -2х - 1 = 0 и условиям трансверсальности ж(0) = 0, ж(1) = -®(1)) = 2£(1)Ь(1) - 2£(0)Ь(0) + 2£(1)Ь(1) = 2(^(1) 4- dft( 1))Л( 1) = 0. 3 _ f2 Следовательно, £ = —-— 6 absmin. 4 Л1 t2 3 t2\ 1 /t3 3t\p 1 2-94-3 1 444/ 4 \64/lo4 12 3 о
jl*-*'*- § 2. Задача Больца 195 Очевидно, что Smax = -f-oo. Действительно, возьмем последователь- ность функций xn(t) = п, тогда В(хп(-)) = -п-Н2 —> +оо при п —> оо. 3 -t2 1 Ответ. —— € absmin, Smin = Smax = +оо. 4 3 2.5. Задачи Больца 2.1. J (х2 + 2х) dt + ж2(0) -+ extr. о 1 2.2. J х2 di + 4ж2(0) - 5ж2(1) —► extr. о 2.3. J(х2 -x)dt- -> extr. о 1 2.4. J(х2 -Ь х2) dt - 2ж(1) sh 1 —> extr. о 1Г 2.5. У (х2 + х2 - 4® sint) dt + 2х2(0) + 2®(т) - ®2(%) -♦ extr. о »/2 2.6. У (х2 - х2) dt + ®2(0) - ж2 (у) + 4® —»extr. о <г/2 2.7. У (х2 -х2 - 2х) dt - 2®2(0) - х2 (у) —> extr. о i 2.8. У (®|®2 + xtXi)dt + ®i(0)®г(1) + ®i(l)®2(0) -> extr. о е-1 2.9. У (t + l)i2 dt + 2®(0)(®(е - 1) + 1) -> extr. . о
196 Глава 3. Вариационное исчисление 2 2.10. J t2x2dt - 2ж(1) 4- ж2(2) —> extr. 1 е 2.11. J 2(tx2 4- хх) dt 4- Зя2(1) - х2(е) - 4х(е) —► extr. 1 з 2.12. У 4iV dt 4- /(0) - 8ж(3) — extr. о 1 2.13. J ехх2 dt 4- 4е®(0) 4- 32е~х(,) -> extr. о 1 2.14. J е<+,(±2 4-2ж2) dt 4-2ж(1)(ж(0) 4-1) -* extr. о § 3. Задача с подвижными концами 3.1. Постановка задачи Задачей с подвижными концами называется следующая экстремальная задача в пространстве С!(Д) х R2: J(£) = J f(t9x9x)dt + lQ(tQ9x(tQ)9ti9x(t{)) -> extr; (P) <o k(to,x{to)9t\9x(t\)) =0, i = 1,... 9m9 (1) где £ = (x(-)9tQ9ti)9 Д — заданный конечный отрезок, to,*i € Д, to < t|. Частным случаем является задача, в которой один из концов или даже оба закреплены. Элемент £ = (я(-),*о»*1) называется допустимым, если х 6 С^Д), t$,t\ 6 Д, to < t|, и выполняются условия (1) на концах. Определение. Говорим, что допустимый элемент £ = (#(•), to,tj) до- ставляет слабый локальный минимум в задаче (Р), и пишем £ 6 wlocminP, если существует 6 > 0 такое, что J(g) > J(£) для любого допустимого элемента £ — (ж(’МоЛ), Для которого ||ш(-)-^(-)||с«(д) < 6, |t0 -tol < 1*1 -Ъ\<б.
§ 3. Задача с подвижными концами 197 3.2. Необходимые условия экстремума Теорема. Пусть элемент £ = («(•), Л) доставляет слабый локальный экстремум в задаче (Р) (£ 6 wlocextrP), функции L.LX, Li ~ непрерывны в некоторой окрестности расширенного графика := {(t,x(t),£(t)) 116 Д } (L,Lx,Li 6<'(О(Г^))), функции Ц — непрерывно дифференцируемы в окрестности точки (1ъ,£(1о),1\,£(1\)) 0» £ С4 (£o,#(£oMb#(£i))), г = 0,1,..., яг. Тогда существует ненулевой вектор множителей Лагранжа Л = (Ао,..., Ато) € Rm+1, А Ф 0, такой, что для функции Лагранжа Ч т А(ж(-)ЛЛ) = / + ; »=о *0 выполнены условия: а) стационарности по х — уравнение Эйлера для интегранта L = Ао/(£,я,ж) d d --М)+М) = о w е д + Ш) = о; dt dt т Ь) трансверсальности по х для терминанта I = AJ,(^o,®(^o), «=о Ь^(£с) = £r(io) = £в(*о)’ Lx(i\) = -lx(td Xofi(l\) = с) стационарности по подвижным концам (выписывается только для по- движных концов отрезка интегрирования): 4 = 0 <=> -АоМ) + U. + ix{t^(k) = о, = 0 <=> Ао/(?|) 4- ltx 4- ix(t\)^(i\) = 0. Необходимые условия экстремума в задаче с подвижными концами непосредственно будут вытекать из необходимых условий экстремума в задаче Лагранжа п. 6.2. 3.3. Пример т J(x(-),T) = J(х2 - х + l)dtextr; ж(0) = 0. о
198 Глава 3. Вариационное исчисление Решение. Функция Лагранжа: Л - л(а:( ),т) - у А0(ж2 - х + 1) dt + А,ш(0). О Необходимые условия экстремума: а) уравнение Эйлера для интегранта L = А0(ж2 - х -Ь 1) d d — 3-Дс-h Дг = 0 <=> ——2АдЖ — Aq = 0 <=> —2Aqx — Ао = 0; at at b) трансверсальность по х для терминанта I = Х\х(0) ( Дс(0) = ^ж(о)? ( 2Ао®(О) = А], 1 Li(T) = 1 2A0i(T) = 0; с) стационарность по Т (выписываем только для подвижного конца отрезка интегрирования) Лт = О <=> А0(±2(Т) - х(Т) + 1) = 0. Если Ао = 0, то из Ъ) следует, что Ai = 0 — все множители Лагранжа оказались нулями. Этого не может быть. Значит, Ао / 0. Положим Ао = 1. Тогда условия а)-с) преобразуются к виду -2а - 1 = 0, х(Т) = 0, х(Т) = 1. t t2 Из первого уравнения следует, что х =-----h С\, х =------FCit + C2. 2 4 Поскольку а(0) = 0, то С2 = 0. Неизвестные С],Т определяются из условий Т -у +С1 =°- Т2 ~— + с}т = \. 4 х(Т) = О, х(Т) = 1 Отсюда находим, что t = 2, С\ = 1. Таким образом, в задаче имеется единственный допустимый экстре- / i2 \ мальный элемент £ = (£(•), I1) == -Н,2у. Покажем, что £ не доставляет локального экстремума, т.е. что в лю- бой его окрестности существует другой допустимый элемент, на котором значение функционала J в точке £ как больше, так и меньше значения функционала J в точке £. Действительно, возьмем допустимый элемент / t2 \ £ = (х(),Т) = (-- -Н, т). Тогда
V.. § 3. Задача с подвижными концами 199 J(f) = / ((-| + 1)2"("7+0 + 1)di = f (у-< + 2)<« = О о Т 2 = 2/(^-l)2di> J(0 = 2У*(~1)2<« О о при Т > Т и J(£) < J(£) при Т <t, поскольку под знаком интеграла стоит неотрицательная функция. Найдем абсолютный минимум в задаче. Возьмем последовательность п элементов £п = (хп(-),Тп) = (£,п); тогда J(£n) = /(2 - t)dt -* -оо при о п —► +оо, т.е. Smin = -оо. Если вместо исходной задачи с подвижным правым концом Т рассмотреть задачу с фиксированным концом Т = То, то нетрудно вывести, что функция, доставляющая абсолютный минимум в новой задаче, существует (ее легко найти, решая задачу с фиксирован- ным То) и абсолютный минимум в задаче будет конечным для каждого фиксированного То. При этом значение абсолютного минимума будет стремиться к -оо при То —► +оо. Найдем абсолютный максимум в задаче. Возьмем последовательность 1 элементов = (жп(-),Тп) = (nt, 1); тогда J(xn(),T) =J(n2-ni+l)di-*+oo о при п —> +оо, Т. е. Smax = +00. Л ft2 \ Ответ. Допустимая экстремальная пара (£(•), Т) = +t,2J £ wlocextr, Smin = -00, Smax = +00. 3.4. Задачи с подвижными концами 3.1. J x2dt—> extr; ж(1) = 1. о J х2 dt - 2ж2(1) extr; я(0) = 0. о 33-J о —> extr; ж(1) = 0.
200 Глава 3. Вариационное исчисление 3.4. 3.5. 3.6. 3.7. 3.8. 3.9. 3.10. 3.11. 3.12. 3.13. 3.14. 2 J(ж2 — x)dt~* extr; х(0) = 0. о е J(tx2 + 2х) dt extr; ж(1) = 0. । т J x2dt—> extr; ж(0) = О, T -Ь х(Т) 4-1 = 0. о т J i2df —>extr; ж(0) = О, (Т - 1)ж2(Т) + 2 = 0. о т J х3 dt—> extr; ж(0) = О, Т + х(Т) = 1. о т J (х2 + x)dt extr; ж(0) = 1. о т J(х2 + x)dt -* extr; х(Т) = Т. о т J(ж2 + х) dt extr; ж(0) = 0, х(Т) = £. о т J(х2 + x)dt-* extr; ж(0) = 0, х(Т) = Т. о т J (х2 + x + 2)dt—> extr; ж(0) = 0. о тг/4 ,2 - х2) dt -» extr; ш(0) = 1. о
f . § 3. Задача с подвижными концами 201 То 3.15. J(х2 - х2) dt —> extr; ж(0) = 0. 0 1Г/4 3.16. J(х2 -х2 + 4х cos t) dt extr; ж(0) = 0. 0 %/2 3.17. J(x2 - x2 + 4xsintf) dt -* extr; = 0- ж/4 3.18. J (x2 + x2 + 4x sh t) dt -» extr; ®(0) = 0. 0 3.19. 1 J(x2 4- x2 + 4x ch£)dt “► extr; ж(1) = 0. 0 3.20. i j(x2 4- x2) dt - ж2(1) —► extr; x(0) = 1. 0 To 3.21. J(x2 4- x2) dt —> extr; ж(Т0) —6 о . T 3.22. J(x2 4- x2) dt —► extr; ж(0) = 0, x(T) 4- T 4-1 — 0. 0 T 3.23. J(x2 4- x2) dt -* extr; x(T) 4- T - 1 = 0. 0 T 3.24. J \/l + x2 dt —> extr; ®(0) — 0, T2x(T) = 1. о 3.25. f x/1 + X2 I dt —► extr; x(0) = 1. J X 0
202 Глава 3. Вариационное исчисление Г л/1 + ж2 3.26. / ---------dt —► extr; ж(1) = 1. J х о Т J------- /«/1 -L. ф2 --------dt -+ extr; ж(0) = 1, х(Т) = Т - 1. х о т ,-------- /\/1 + ж2 --------dt -> extr; ж(0) = 1, 2Т + х(Т) = 2. х о То 3.29. У 2:5/1 + x2dt —»extr; x(Tq) = о 3.30. J * — - xtX2^dt —> extr; ®|(1) = ж2(1) = 1. о 3.31. У - 2?|a:2j dt -»extr; Х|(0) = ®2(0) = 1. 0 § 4. Изопериметрическая задача 4.1. Постановка задачи Изопериметрической задачей в вариационном исчислении называется следующая экстремальная задача в пространстве О'1 ([to, t1 ]): Jo(®(-)) = J h(t,x(t),x(t)) dt -> extr; <0 tl (P) (1) (2) > — I fiyt.xit),^)) dt = ai, z = to x(to) = xo, x(ti) = Xt, где a,,..., am — заданные числа (оц € R). Отрезок [to,t|] является фиксированным и конечным, to < ii- Огра- ничения вида (1) называются изопериметрическими. Экстремум в задаче
§ 4. Изопериметрическая задача 203 рассматривается среди функций х 6 С1 (|/о» ]), удовлетворяющих изо- периметрическим условиям (1) и условиям (2) на концах; такие функции называются допустимыми. Определение. Говорим, что допустимая функция х доставляет слабый локальный минимум в задаче (Р), и пишем £ € wlocminP, если существует б > 0 такое, что Jo(®(-)) ЛОЮ) любой допустимой функции х, для которой ||®(-) - £(-)llc'([Wi]) < 6- 4.2. Необходимое условие экстремума Теорема. Пусть функция £ доставляет слабый локальный экстремум в задаче (Р) (£ 6 wlocextrР), функции fi, fix, fa, i' = 0,1,...,m, — непре- рывны в некоторой окрестности расширенного графика 6 с№)))- Тогда существует вектор множителей Лагранжа А = (Ао,...,Ат) 6 т Rm+I, А/0, такой, что для лагранжиана L — ^2 я, выполняется 1=0 условие гладкости L± Е С1 фо, ]) и выполнено уравнение Эйлера -^-Li(t) + Lx(t) = O vte[«o,«i]. at Доказательство. Выпишем вариацию по Лагранжу функционала J(x) = / f(t,x,x) dt, найденную нами при выводе необходимых условий «о в простейшей задаче вариационного исчисления (п. 1.3) &/($(.), л()) = у(А(ОЛ(О + А(ОЛ(О) dt, h е сМм,]). to Рассмотрим следующее линейное отображение А функционального про- странства СофоЛ]) в конечномерное пространство Rm+I^: Со фо,£]])—> Rm+I), действующее по формуле Ah = (<5J0(£, h), 6Ji (&,h),..., 6Jm(x, h)). Возможны два случая: 1) Im Л Ф Rm+I, т.е. А — отображение на часть пространства Rm+I (вырожденный случай); 2) Im Л = Rm+I, т.е. Л — отображение на все пространство Rm+1 (невырожденный случай). 1) Вырожденный случай. Пусть Im Л / Rm+1. Образ линейного про- странства при линейном отображении является подпространством. Зна-
204 Глава 3. Вариационное исчисление чит, в этом случае 1mA есть подпространство в Rm+1 размерности тп. Погрузим его в какое-нибудь подпространство размерности т (гипер- плоскость). Следовательно, найдутся числа А0,...,Ат, не все равные нулю и такие, что ^XiZi = 0 Уг € Im Л <=> 22 А,ЛЛ(*,Л) = 0 УЛ G Co([to, ])- i=0 t=0 Откуда из явного вида для 6Ji(£,h) имеем У / т т х / + 22А‘Л‘(*)Л(О) = 0 УЛ G СЖМ)- io V‘=° <=о ' Тогда из леммы Дюбуа-Реймона следует, что для лагранжиана L = т выполняется условие гладкости 6 С^фоЛИ) и выпол- :=0 нено уравнение Эйлера d ~ --^(О + М) = о vte[tM at 2) Невырожденный случай. Пусть ImA = Rm+I. Покажем, что не- вырожденный случай невозможен. Тем самым теорема будет полностью доказана. Возьмем е0 = (1,0,... ,0), ..., ет = (0,... ,0,1) — канонический базис в Rm+I. Поскольку образ отображения A ImA = Rm+I, то существуют функции hj е Со (р0, й ]) такие, что Ahj = ej, j = 0,1,..., m, то есть 6Ji(£,hj) = fiij ^6ij = { o’ f у’ символ Кронекера^ . Рассмотрим функцию F : Rm+I —> Rm+I, действующую по формуле / т т ч F(/3) = ( Jo+ 22Pihi}’• • • -(£ + L) • У=0 >0 Нетрудно проверить, что в силу заданных условий гладкости функций построенная функция F непрерывно дифференцируема в некоторой окрестности точки р = 0 и ЛД) = (-W), • • • > Лп(£)) = (ао, aj,..., ат) = & (а0 ’= Jo(&))- Поскольку якобиан отображения F не равен нулю как определитель еди- ничной матрицы (F'(0) = (tf Л(£, fy))™=0 = I — единичная матрица), то по теореме об обратной функции существует обратное отображение некоторой окрестности точки d в окрестность точки р = F“J(d) = 0
§ 4. Изопериметрическая задача 205 такое, что |Г_|(а)-Г"'(а)| S? А1а-а| <=> |Г-1(а)| «С Aja - А| с некоторой константой К > 0. Возьмем а = а(е) = (ао Ч- . .,аш) при достаточно малом е и обозначим /?(е) = Р"1(а(е)). Тогда F(/3(e)) = a(e), т.е. Jo ($() + £ Д>(е)ЛД-)) = ао + е, \ j=0 ' Ji (*(•) + 52&(£)М )) = ««•> * = 1...т> 4 3=0 ' при этом |F"'(a)| ^A|a-d| <=► |/3(е)| К|е|. Получилось, что в любой окрестности экстремальной функции £ в пространстве C,l([to»^i]) существует допустимая функция (а именно т £(•) + 22/3j(e)fy(-)), на которой значение функционала может быть и больше (при е > 0), и меньше (при е < 0) чем на А. Пришли к про- тиворечию, что £ не доставляет локального экстремума. Таким образом, случай 2) невозможен. 4.3. Пример । 1 J(®(.)) = Jх2 dt extr; Jxdt = O, ж(0) = 0, ж(1) = 1. о о Решение. Лагранжиан L = Ло±2 4- Aj®. Необходимое условие экстремума — уравнение Эйлера для лагран- жиана L d d 4- = 0 — —2Ао® 4* Aj — 0 <=> —2Ao® 4- Aj — 0. at dt Если Ao = 0, то Aj = 0 — все множители Лагранжа — нули. Этого не может быть. Положим Ао = 1/2. Тогда х = Ai. Общее решение этого диф- ференциального уравнения: х = C\t2 4- C2t 4- Сз- Неизвестные константы Ci, С2,Су находим из условий на концах и изопериметрических условий: ж(0) = 0 =Ф Су = 0, ж(1) = 1 => С\ 4- С2 = 1, 1 1 /Г 1 С] с2 xdt = o=> /(С|Г4’С20^ = 0=>у+ у =0. о о
206 Глава 3. Вариационное исчисление Отсюда С| = 3, Сг = -2. Таким образом, в задаче имеется един- ственная допустимая экстремаль ж = 3t2 - 2t. Покажем с помощью непосредственной проверки, что найденная допустимая экстремаль х доставляет абсолютный минимум в задаче. Возьмем функцию h 6 С] ([0,1]) такую, чтобы х + Л была допустимой функцией. Для этого надо взять функцию Л, такую, что Л(0) = Л(1) = 0 1 и f hdt = 0. о Тогда J($() + Л( )) - /(£(•)) = j\i + Л)2 dt - £hdt + i (отбросим неотрицательное слагаемое f h2 dt и далее интегрируем по о частям с учетом условий на h) it 11 >2У£hdt^2У£dh = -2 j£hdt = -12 Jhdt = 0. 0 0 0 0 Таким образом, разность всегда неотрицательна. Значит, имеем абсолют- ный минимум. 11 3 2 Smin = j&2dt = У(6t - 2)2dt = -^y-+4t|‘ = 12 -12 + 4 = 4. о о Очевидно, что Smax = -boo. Действительно, возьмем последователь- ность допустимых функций xn(t) = £(t) + nsin2irt, тогда J(xn(-)) —> -boo при п —» оо. Ответ. 3t2 -2te absmin, Smin = 4, Smax = -boo. 4.4. Задача Дидоны Одними из первых задач на отыскание наибольших и наименьших величин являлись изопериметрические задачи о нахождении замкну- той кривой, имеющей заданную длину и охватывающую наибольшую площадь, и о нахождении пространственной замкнутой поверхности, имеющей заданную площадь и охватывающей наибольший объем. Еще до Аристотеля (IV век до н. э.) было известно, что среди изопериметри- ческих (имеющих равную длину) кривых наиболее вместимой является окружность, а среди изопифанных (имеющих равную площадь) поверх- ностей — сфера.
f— Ц. §4. Изопериметрическая задача 207 Изопериметрическая задача содержится также в легенде о царице Дидоне. Описываемые события легенда относит к 825 году до н. э. Финикийская царица Дидона и с ней небольшая часть жителей горо- да Тира, спасаясь от преследований, покинули родной город и в поисках счастья отправились на кораблях на запад вдоль берегов Средиземного моря. Выбрав на африканском побережье удобное место (нынешний Ту- нисский залив), Дидона и ее спутники решили основать здесь город. Эта идея не понравилась местным жителям, но все же финикийской царице удалось уговорить их предводителя Ярба, и он простодушно и неосторож- но согласился уступить Дидоне клочок земли, «который можно окружить бычьей шкурой». Хитрая финикиянка, разрезав шкуру на тонкие ремни, связала их в один длинный ремень и, окружив им значительную тер- риторию, заложила на ней город Карфаген. В память об этой истории карфагенская цитадель получила название Бирса (шкура). Из истории город Карфаген помнится нам еще войнами с Римом за обладание господством на Средиземном море (Пунические войны, Ш-П век до н.э.), которые завершились взятием римлянами Карфагена и его разрушением. Мы видим, что Дидона «решала» классическую изопериметрическую задачу о наибольшей вместимости. Естественно считать, что Дидона хо- тела сохранить выход к морю. Тогда мы получаем первую задачу Дидоны. Среди всех кривых длины I с концами на фиксированной прямой (пря- молинейный берег), найти ту, которая ограничивает фигуру наибольшей площади. Формализованная задача имеет вид: т т J xdt-+ max; J \/l + x2dt ~ I, x(-T) = x(T) = 0 -T -T (здесь T — подвижный конец). Эта задача относится к типу задач Ла- гранжа (см. §6). Давайте решим вторую задачу Дидоны, в которой оба конца кривой за- креплены на прямой. Формализованная вторая задача Дидоны имеет вид: То То J xdt-+max-i J \/1 И- = Z, ж(-Т0) = ж(Т0) = 0 -То -То (здесь То — фиксировано). Это — задача, укладывающаяся в схему изо- периметрических задач п. 4.1. Приведем ее решение с помощью вариа- ционного исчисления. Лагранжиан L = Aqx -h А\/1 -Ь®2. Необходимое условие — уравнение Эйлера -+ Lx = 0 d + Ао = 0. di 1 diy/Tf#
208 Глава 3. Вариационное исчисление Если Ао — 0, то А / 0 (не все множители Лагранжа — нули) и, значит, из уравнения Эйлера d Хх Хх -----== = 0 => у = const => х = const. -^1 -|» x/1 + ж2 Тогда из условий на концах и изопериметрического условия следует, что z = 0, I = 2Т0. Если Ао / 0, то положим Ао = 1. Тогда из уравнения Эйлера вытекает, что d Хх Хх ——. — 1 <=> — ... .. — t -|- С\. dt \/1 -h ж2 д/1 + я2 Возведя последнее уравнение в квадрат, выразим х: -и > С\2 г—s \2+2-(t > Г-\2Л > -Л a—s А (< + С'1)2 — = (<+С|) ^Xx-(t+C{) (1+®)4=>® -A2_(i+Ci)2 «=* <=> я = J+CI ^).dx= (t+Ci)dt 1х2-и + С^2 i^-Ct+G)2 i^-Ct+Ci)2 v ( Проинтегрировав no t полученное уравнение, имеем: х + С2 = Т\/^2 - (t + C|)2 О (^+С1)2-ь(ш-ьС2)2 = А2. Это уравнение окружности. Из условий на концах x(-TQ) = x(TQ) следует, что С] = 0, т.е. £2 + (я + С2)2 = А2. Неизвестные константы С*2,А определяются единственным образом (А с точностью до знака) из условия x(Tq) = 0 и изопериметрического условия. При 2То < I *гТ0 имеется единственная (с точностью до знака) экстремаль, являющаяся дугой длины I окружности, проходящей через точки (±То,О), с центром на оси х. Поскольку у нас задача на максимум, то мы выбираем экстремаль, лежащую в верхней полуплоскости. При I < 2Т0 в задаче нет допустимых функций, при I > яТо нет допустимых экстремалей. Можно показать, что в этом случае рещением будет полу- окружность радиуса То, «поднятая» на высоту (I - itTq)/2 вместе с двумя вертикальными отрезками этой длины. 4.5. Изопериметрические задачи 4.1. J х2 dt extr; о 4.2. J х2 dt —> extr; о J xdt = 1, я(0) = ш(1) = 0. о Уxdt = 0, ж(0) = 1, ж(1) = 0. о
# .... § 4. Изопериметрическая задача 209 4.3. 1 1 J x2dt~* extr; J xdt = 39 ж(0) = 1, ж(1) — 6. 0 0 4.4. I 1 J х2 dt —* extr; J txdt = 1, «(0) = ®(1) = 0. 0 0 1 1 4.5. 1 1 /x2dt —* extr; Jtxdt = 0, ®(0) = 0, ®(1) = 1. 0 0 4.6. 1 1 J x2 dt —> extr; J txdt = 0, ®(0) = -4, ®(1) = 4. 0 0 1 1 1 4.7. I I 1 j x2 dt —> extr; J txdt = J xdt = 09 ж(0) = 0, ж(1) = 1. 0 0 0 4.8. .1 1 1 Jx2dt —►extr; Jtxdt — Q, Jxdt = \9 ж(0) = ж(1) = 0. 0 0 0 1 1 1 4.9. 1x2dt—>extr9 Jtxdt =-2, Jxdt — -^9 ж(0) —2, ж(1) = —14. 0 0 0 1Г Ж 4.10. /» Г тс 1 x2dt —>extr; / xcostdt = у, ж(0) = 1, ж(тг) = -1. 0 0 ж к 4.11. Jх2dt —► extr; Jxsintdt = 0, ж(0) = 0, х(тс) = 1. 0 0 % % 4.12. л а З^г / ®sinidi -+ extr; J x2dt = —, x(0) = 0, х(тг) = ir. 0 0 Ж % 7Г 4.13. Уx2dt —► extr; Jxcostdt = Jxsintdt = я + 29 ж(0) = 2, ООО ж(тг) = 0. «
210 Глава 3. Вариационное исчисление । 1 4.14. J *extr; J xe~ldt = e, х(0) — 2е + 1, ж(1) = 2. о о 4.15. У x2d,t—> о extr; J xe*dt = O, ®(0) = О, 1(1) = 1. О 4.16. J х2 dt —> extr; о Jxetdt = l, х(0) = х(1) = 0. о /е2 + 1 хе1 dt = —-—, ж(0) = 0, ж(1) = е. о /1 — Зе“2 1 хе~* dt =---------, ж(0) = 0, х(1) = -. 4 е о 2 4.19. У t2x2dt —> extr; i 2 ж(1)= 1, ж(2) = 2. 4.20. 2 У t3x2 dt —► extr; J x2 dt —> extr; о 0 % Jxcostdt — 1, ®(0) = x(ic) = 0. Я-/2 4.23. J (x2 - x2) dt extr; о = 0. 4.24. + x2 dt -+ extr; To J y/\^x2 dt = l9 x(-TQ) = x(TQ) = 0. -To
§ 5. Задача со старшими производными 211 4.25. I x\x2dt —> extr; i о 0 *1(1) = 1, *2(1) = 2. J x2dt = О, Ж| (0) = ®2(0) = 0, о 4.26. 4.27. J x\x2dt —> extr; J x\dt = 1, j x2dt = 0, 0 00 xj(O) = ®i(l) = ж2(0) = 0, ж2(1) = 1. J х\х2 dt —► extr; J tx\ dt = Q9 J tx2 dt = 0, 0 0 0 Xi(O) = Ж|(1) = ®2(0) = 0, &2(1) = 1. 4.28. J (х\ + Xi) о aj2(l) = -3. extr; J X\X2dt = O,Zj(O) = x2(0) = 0, ®i(l) = 1, 0 /Г 4 t(x\ - x2) dt —► extr; / ±i±2 dt = о 0 £i(0) = ж2(0) = ®2(1) = 0, ®i(l) = 2. § 5. Задача co старшими производными 5.1. Постановка задачи Задачей со старшими производными в вариационном исчислении на- зывается следующая экстремальная задача в пространстве Сп ф031 ]): J(®(-)) = j L(t,x(t),x(t),x(t),...,x^n\t))dt—^extr, (P) *0 = xkj, fc = 0,1...n-1, 3 =0,1. (1) Здесьинтегрант L = L(t,x,x,...,x^) — функция п+2 переменных. Отрезок [^o, ] является фиксированным и конечным, tQ < t{. Экстремум в задаче рассматривается среди функций х 6 Сп([*о,М)> удовлетворяю- щих условиям на концах (1); такие функции называются допустимыми. Определение. Говорим, что допустимая функция х доставляет слабый локальный минимум в задаче (Р), и пишем х е wlocminP, если существует
212 Глава 3. Вариационное исчисление б > 0 такое, что J(x(-)) > для любой допустимой функции х, для которой ||х( ) - *()||o([t0.*.]>5) < е- 5.2. Вывод уравнения Эйлера—Пуассона с помощью леммы Лагранжа Теорема. Пусть функция х доставляет слабый локальный экстремум в задаче (Р) (х € wlocextrP), функции L,Lx,LXi... ,Lx<n) — непрерывны в некоторой окрестности расширенного графика 6), (L, LXi..., Lxw Е С(О(Г^ Lx(k) е C*([Wi]), — 1, - ,п. Тогда выполнено урав- нение Эйлера—Пуассона п dk k=0 При п — 1 уравнение Эйлера—Пуассона совпадает с уравнением Эйлера. При п = 2 уравнение Эйлера—Пуассона выглядит следующим образом: d2 ~ d~ Доказательство. Будем выводить уравнение Эйлера-Пуассона ме- тодом вариаций. Вычислим вариацию по Лагранжу функционала J. Возьмем произвольную, но фиксированную функцию h е С$ (fo, t\]) * 6 7>- Поскольку х 6 wlocextrP, то функция одного переменного h <р(Х) := + АЛ) = J L(t, & + АЛ, it + АЛ,..., ?п) + АЛ(п)) dt имеет экстремум при А = 0. Но тогда по теореме Ферма у/(0) = 0. Дифференцируя функцию у? и полагая А = 0, получаем = = = O УЛеСоЖМ)- (1) Проинтегрируем по частям к раз каждое слагаемое в соотношении (1): J Lxlk)hwdt = J - j'h{k~'}dtXM = to <0 *0 5> 11г/llc«((Mi]) “ max{ ||ir|lc-((t0,«i ]) ll#llc<Uo.ti])>••• Пг/^Нсфо.е, |)} • 6) “ {(«,Л(О>(О....Д<П)(О) € Rn+211 e [to.M}• 7) Co"(ко.M) = {* 6 C"([t0,ti]) I hw(to) = ftw(«i) = 0, k = 0,1.n- 1}.
Л"'* < § 5. Задача со старшими производными 213 (свободные члены интегрирования по частям равны нулю, поскольку Л € С"([fo,]) и, значит, h^fto) = Л^(<|) = 0, к — 0,1,... ,п - 1) «0 *0 Тогда соотношение (1) перепишется в виде Лп dk \ ]лл = 0 V*еCon([fo,ill). to к=0 Отсюда по основной лемме вариационного исчисления (лемме Лаг- ранжа 8>) п. 1.2 следует выполнение уравнения Эйлера—Пуассона. 5.3. Вывод уравнения Эйлера—Пуассона с помощью леммы Дюбуа-Реймона В этом пункте мы выведем уравнение Эйлера—Пуассона для мень- ших условий гладкостей, наложенных на интегрант L. Вместо леммы Лагранжа будем использовать обобщенную лемму Дюбуа-Реймона. Теорема. Пусть функция & доставляет слабый локальный экстре- мум в задаче (Р) (А 6 wlocextrP), функции L,Lx,Li,... ,LX(*> — непрерывны в некоторой окрестности расширенного графика (Ь,^,...,^) € C(O(P^W))). Тогда функции Lx^, ОЛ тДн») + I + Lx(*-ih • • непрерывно дифференцируемы на от- dt\ dt / резке [to,tj и выполнено уравнение + Дг(«-’> ) + ) . • . ) 4- Lx = 0. at J J J Если ДиЮ 6 C*([Wi]), fc = l,...,n, то полученное уравнение совпадает с уравнением Эйлера—Пуассона. Доказательство. Возьмем произвольную, но фиксированную функ- цию h € Cq ([to, <il). Поскольку £ 6 wlocextrP, то функция одного 8> В формулировке леммы Лагранжа вместо пространства Cq([<o,M) можно было взять пространство Cq([4o, ti]), а при доказательстве соответственно взять функцию — f (-—( dt\” \
214 Пгава 3. Вариационное исчисление переменного <р(Х) := + АЛ) = У L(t, £ + АЛ, £ + АЛ,..., £(п) + АЛ(п)) dt to имеет экстремум при А = 0. Но тогда по теореме Ферма у>'(0) = 0. Дифференцируя функцию <р и полагая А = 0, получаем dt = O VfteCon(bo,ii]). (1) io »=« Здесь мы не можем, как в предыдущем случае, брать интегралы по частям, поскольку не задана дифференцируемость функций . Обобщенная лемма Дюбуа-Реймона. Пусть а*() € СфоЛ]) и n Го fe==0 <tt = 0 Vft6C?([t0.ti]). d d f d \ Тогдафункции ап, -—an+an-i, --- I -~an+an_| 4-an_2,... непрерывно dt dt \ dt / дифференцируемы на отрезке [to, tj и выполнено уравнение (аналог уравнения Эйлера—Пуассона) d / / d ( d \ \ \ “37 I • • I “37 I ~Лап 4- йп-1 I 4- <4-2 ) • • ) 4- ао — 0. dt \ \ dt \ dt J J J Из обобщенной леммы Дюбуа-Реймона и соотношения (1) следует утверждение теоремы. Доказательство леммы. Рассмотрим следующую систему из п ли- нейных дифференциальных уравнений: Г -ро 4- ао = 0, I -Pk -Pk-i + а* = 0, к = 1,... ,п - 1. Эта система легко решается с помощью последовательного интегриро- вания уравнений, начиная с первого. При этом непрерывно дифферен- цируемая функция рп_| определена с точностью до многочлена степени п - 1. Подберем этот многочлен таким образом, чтобы для функции pn-i выполнялись условия (2) -т)*(рп_|(т)-ап(т))</т = 0, fc = 0, l,...,n-1. (3) to
§ 5. Задача со старшими производными 215 Рассмотрим функцию h9 определяемую по формуле *о Из определения функции h вытекает, что = ап -рп-\ и h^k\to) = О, к = 0,1,... ,п - 1. Кроме того в силу условий (3) = 0, к — 0,1, ... ,п - 1. Значит, h 6 Со (ко,М)- Тогда для h по условию леммы (подставим из системы (2) ak = Pk +Pk-i и соотношение ап = pn_i +h№) Из полученного равенства 0 = f(h^)2dt следует, что = 0. Отсюда <0 ап = pn-i • Поскольку из системы (2) вытекает, что все функции р* не- прерывно дифференцируемы, то а„ =рп-1 6 С' ([to, 11 ]). Выразим pn_2 из последнего уравнения системы: pn-2 = -?n-i +®n-i = -an+an-i (отсюда вновь следует, что -dn4-an-i € С1 ([to, tj)) и подставим в предпоследнее. Проводя эту процедуру для рп-з, • • • ,Ро, придем в итоге к непрерывной дифференцируемости остальных, указанных в лемме функций и спра- ведливости дифференциального уравнения. 5.4. Пример j(®(-)) = J х2 dt —* extr; ®(0) = i(0) = ®(1) = 0, ®(1) = 1. о Решение. Интегрант: L = х2.
216 Глава 3. Вариационное исчисление Необходимое условие — уравнение Эйлера—Пуассона л#2 - + t'® = 0 <=> х^ = 0. dt2 dt Общее решение уравнения Эйлера—Пуассона: х = Cji3 + C2f2 + C3t + C4. Неизвестные константы С\,С2,Сз,С4 находим из условий на концах ж(0) = 0 => С4 = 0; х(0) = 0 => С3 = 0; ®(1) = 0, ГС1+С2 = 0, СС1 = 1, 4(1) - 1, \ЗС1+2С2 = 1, (С2 = -1. Таким образом, единственная допустимая экстремаль х = t3 - t2. Покажем с помощью непосредственной проверки, что функция £ до- ставляет абсолютный минимум в задаче. Возьмем функцию h е С2([0,1]) такую, чтобы функция х -Ь h была допустимой. Для этого надо взять функцию Л, для которой Л(0) = h(l) = А(0) = А(1) = 0. Тогда । iiii = j(й+h)2 dt-f 3?dt = 2 У &hdt+Jh2dt^2 f Midi. 0 0 0 0 0 Дважды интегрируя по частям с учетом условий на Л, получим 1 1 J(£4-ft)-J(£)>2 f &dh = 2£h\'o-2 J £{3}hdt = 0 0 1 1 = -2^ £(3)dft = -2£(3)ft|o + 2 У* £whdt = O. о о Таким образом, разность всегда неотрицательна, то есть имеем абсолют- ный минимум 1 1 1 (6f-2)2 dt = У(36t2-24«+4) dt = 12t3-12t2+4t |’ = 4. ооо Л Очевидно, что Smax = -l-оо. Действительно, возьмем последователь- ность допустимых функций xn(t) = &(t)+nt2(t-1)2, тогда J(xn( )) —► +оо при п —► 00. Ответ, t3 — t2 6 absmin, ‘S’absmin = 4, ^absmax =
§5. Задача со старшими производными 217 5.5. Задачи со старшими производными 5.1. f x2dt—> extr; я(0) = ±(0) = я(1) = 0, ш(1) = 1. о 1 5.2. J х2 dt extr; ж(0) = ж(1) = ±(1) = 0, ±(0) = 1. о 1 5.3. У х2 dt —► extr; х(0) = ж(1) = 0, ®(0) = -1, я(1) = 1. о i 5.4. J(х2 - 48») dt —► extr; я(О) = я(1) = ж(О) = ж(1) = О. о 1 . 5.5. J(х2 - 48») dt —► extr; ж(О) = 1, ж(О) = -4, ж(1) = ж(1) = О. о 1 5.6. J(48а? - х2) dt —► extr; ж(О) = ж(О) = О, ж(1) = 1, ж(1) = 4. о । 5.7. J(24tx - ж2) dt —> extr; ж(О) = ж(О) = ж(1) = О, ж(1) = —. о 1 5.8. J(ж2 - 24£ж) dt -► extr; ж(О) = ж(О) = О, ж(1) = ±(1) = 1. о % 5.9. J(х2 - х2) dt —> extr; ®(О) = ®(ir) = О, i(O) = 1, i(ir) = -1. о % 5.10. У*(х2-х2) dt -> extr; ®(0) = 0, i(0) = 1, х(т) = shtr, i(ir) = chir. о * J(x2-x2)dt-> extr; ®(0) = i(0) = 0, x(ir) = chw+l, i(%) = shw. 5.11. о
218 5.12. 5.13. 5.14. 5.15. 5.16. 5.17. 5.18. 5.19. 5.20. 5.21. 5.22. Глава 3. Вариационное исчисление J(x2-x2)dt —» extr; ®(0) = х(0) = 0, х(тг) = sh%, ®(тг) = сЬтг+1. о »/2 J(х2 - x2)dt -* extr; ®(0) = ®(0) = = О, = 1- о Г J(х2 -|- 4ж2) dt —> extr; ж(0) = ±(0) = х(тг) = 0, ж(тг) = shir, о 7Г J(x2 + 4x2)dt —>extr; ж(0) = -1, ±(0) = 0, ж(тг) —ch?r, i(7r) = sh7r. о 7Г J(х2 + 4®2) dt —> extr; з(0) = i(0) = x(ir) = 0, i(ir) = shir, о т/2 J(х2 - x2)dt -+ extr; ®(0) = i(0) = 1, о </2 У (x2 -x2)dt—> extr; ж(0) = i(0) = x (y) = 0, ® (y) = 1. о % J (x2 - x2) dt —> extr; ж(0) = x(0) = х(я) = 0, ж(тг) = 1. о i J(x2 + x2) dt —► extr; ж(0) = 1, i(0) = 0, ж(1) = ch 1, i(l) = sh 1. о i J(x2 4- x2) dt —► extr; ж(0) = 0, ±(0) = 1, z(l) = sfy 1, ±(1) = ch 1. о i У e~lx2dt —> extr; ж(0) = 0, ®(0) = 1, ж(1) = e, ±(1) = 2e. о
§ 5. Задача со старшими производными 219 j* 5.23. 5.24. 5.25. 5.26. 5.27. 5.28. 5.29. 5.30. 5.31. 5.32. 5.33. J е~*х2 dt —* extr; ж(0) = i(0) = 1, ®(1) = i(l) = е. о е J tx2dt -<• extr; ®(1) = 0, i(l) = 1, ®(е) = е, х(е) = 2. 1 е Jt2x2dt -» extr; ж(1) = 0, х(е) = i(l) = 1, х(е) = । е f t3x2dt —> extr; ж(1) — 1, х(е) — ±(1) = -1, х(е) = - —. J ее1 1 1 J(t + 1)ж2 dt —> extr; ж(0) = ±(0) = 0, ж(1) = 1, ±(1) = 2. о 1 J (t + 1)2ж2 dt —► extr; ш(0) — 0, ж(1) = 1п2, ж(0) ~ 1, ±(1) = о е j(t + l)t»2 dt —> extr; ж(1) = 0, x(l) = 1, x(e) = e, x(e) = 2. i i J(t + l)3a?2d£ —► extr; ж(0) = 1, ж(1) = ±(0) = -1, ±(1) = о j (a/3))2 dt —► extr; ш(0) = i(0) = f(O) = 0, ж(1) = 1, ±(1) = 3, о a?(l) = 6. J (x^)2 dt —> extr; о a(l) = 12. J(x^)2 dt extr; о ж(0) = ±(0) = x(0) = 0, ж(1) = 1, ±(1) = 4, я(0) = ±(0) = ж(0) — ж(1) = ±(1) = 0, z(l) = 2.
220 Глава 3. Вариационное исчисление । 5.34. j\x^)2dt —>extr; ж(0) = ±(0) = ж(0) = х(1) = ж(1) = 0, ж(1) — 1. о 5.35. J ((я<3>)2 + ж2) dt —> extr; о ж(1) = ё(1) = sh 1. к/2 5.36. J ((л<3>)2 - х2) dt —► extr; о 5.37. J((ж(3))2 -x2).dt -* extr; о ш(тг) = тг, х(я) = 2. ж(0) = ж(0) = 0, ж(0) = 1, ж(1) = ch 1, ж(0) = ±(0) = & (у) — О, ж(0) = ж(0) = ж(0) = ж(тг) = О, 5.38. J ((s(3))2-±2)<ft->extr; я(0) = ±(0) = ж(0) = 0, ш(тг) = ж(тг) = sh?r, о ж(тг) = chir + 1. §6. Задача Лагранжа Все задачи, изученные нами в предыдущих пунктах, являются част- ными случаями или могут быть сведены к задаче (мы сформулируем ее чуть позже), поставленной Лагранжем в сочинении «Аналитическая механика» в 1788 году. Для ее решения Лагранж использовал метод неопределенных множителей, который впоследствии стали называть ме- тодом множителей Лагранжа. Впрочем этот метод не был им аккуратно обоснован, и понадобилось более ста лет для того, чтобы придать рассу- ждениям Лагранжа вид строго доказанной теоремы. 6.1. Постановка задачи Задачей Лагранжа называется следующая экстремальная задача Во(£) —* min; Bj(£) 0, г = 1,..., т, = 0, i = m' + ' (Р) xa(t) - <p(t,x(t)) = 0 Vt е Д, (1)
§ 6. Задача Лагранжа 221 где £ = (x(-),to,t\), ж(-) € C^A.R”), *оЛ G А, < *ь А — заданный конечный отрезок, <! BiU) = J+ i = 0,l,...,m. io Условие (1), называемое дифференциальной связью, может быть на- ложено не на все координаты вектор-функции х(-) = (ж| (•),..., яп(-)), а только на некоторые, для определенности на первые к координат: ii(t) “ <f>i(t,x(t)) = 0, i = 1,...,к. Обозначим далее х = (ха,хр), где ха = to,..., хк), хр = (ж*+1,..., хп). Если дифференциальная связь от- сутствует, то к = 0 и х = Хр. Поскольку вместо ха в функции fi(t,x,x) можно подставить из (1) равное ему выражение <p(t,x), то в дальнейшем считаем, что fi ~ Частным случаем задачи (Р) является задача, в которой один из концов to или t\ — подвижный, а другой закреплен или оба конца отрезка интегрирования [t0>£i] фиксированы. Элемент (, для которого выполнены все указанные условия и огра- ничения задачи, называется допустимым. Определение. Говорим, что допустимый элемент £ = (£(•),£о,£1) доставляет слабый локальный минимум в задаче Лагранжа (Р), и пишем £ € wlocminP, если существует д > 0 такое, что Во(£) Во(£) Для любого допустимого элемента £ = (я(-),$о,М> Для которого ll£ ”"?llc,(A)xR2 < (||ж(-) “^ОНсЦД) < И1-£||<^)* 6.2. Необходимые условия экстремума Теорема Эйлера—Лагранжа. Пусть элемент £ = (#(•), £о>£|) доставля- ет слабый локальный минимум в задаче Лагранжа (Р) (£ 6 wlocminP), функции fi9fix,fu непрерывны в некоторой окрестности расширенно- го графика := Н 6 Д} (fi,fiX,fu € С(О(Г^))), i = 0,1,..., пг, функции <р,<рх непрерывны в некоторой окрестности графика Г& := {(t,£(t)) | t 6 А} (<р,<рх € ^(О(ГЛ))), функции Ц непре- рывно дифференцируемы в некоторой окрестности точки (to,£(io), t\, #(£])) (k e cl (o(£0, f(£o), , aft)))), i = o, i,... , m (условие гладкости). Тогда найдутся множители Лагранжа (А,р) € Rm+I х C^AjR*), А Ф 0, такие, что для функции Лагранжа Л(£0, Wi) = J(/(*,X,Хр) + p(t)(ха - <p(t,х))) dt -Н(to, x(to),ti,x(ti)), io
222 Глава 3. Вариационное исчисление где т т f (t9 X, Хр) — •£/?)> = (^0, ®(^о)> ^1, а'(^1)) г=0 «=0 — терминант, выполнены условия: а) стационарности по х( ) — уравнение Эйлера для лагранжиана L(t,x,x) = f(t9x,Xp) -bp(±a - <p(t,x)) -p(t)-p(t)<pXa(t) + fxJt) = 0, d a - ^hp (0 " P(0^(0 + fxp(t) = 0; -~Mt)+Lx(t) = 0 W6A«=J at b) трансверсальности no x (М — Ix(Iq) — lx(tx) P(^o) — £ra(i0), A/j(M = ^Xp(t^9 P(^) “ —lxa(t\)9 fip(h) = —Ixpfti)} с) стационарности no подвижным концам (выписывается только для подвижных концов отрезка интегрирования) Л«о = о <=> “/(?о) + ko + ix(to)$(to) = 0, At| = 0 « f\t}) + lti + ixM&(ti) = 0; d) дополняющей нежесткости e) неотрицательности Xi ^0, i = 0, Доказательство теоремы Эйлера—Лагранжа основано на правиле множителей Лагранжа для гладких задач с ограничениями типа равенств и неравенств в нормированных пространствах (глава 1, п. 8.2). Поскольку равенство Bt- = 0 можно заменить двумя неравенствами В, 0, -В, 0, то в дальнейшем для простоты записи считаем, что у нас имеются только ограничения типа неравенств и т! = т. Покажем, что все условия теоремы о правиле множютелей Лагранжа в полученной задаче B0(£)-*min; В»(£)^0, г=1,...,т, F(<) = 0. (Р) выполняются. Здесь X = C!(A,Rn) х R2, У = C(A,R*). Это банаховы пространства — условие банаховости выполняется.
§6. Задача Лагранжа 223 Из непрерывной дифференцируемости функций в теореме Эйлера- Лагранжа следует, что функционалы Bi : X —> R, i = 0,1,..., т, и ото- бражение F : X —► У, = -₽'(®(,)ЗоЛ|) = ®а(0 - строго дифференцируемы в точке £ — условие гладкости выполняется. Ослабленное условие регулярности — условие замкнутости образа оператора F'(f) выполняется, так как 1тГ'(Г) = У = C(A,R*) — замк- нутое пространство. Действительно, то> л] = h(0 - <pXa(t)h(t), а система линейных дифференциальных уравнений с непрерывными коэффициентами М-&.(*)*(*) = »(0 (О имеет решение для любого у(-) G С(Д,И*), определенное на всем отрез- ке Д, с любым граничным условием в форме Коши Л(?о) = Таким обра- зом, Im !?(£) = C(A,Rfc) — замкнутое пространство. Все условия теоремы главы 1 п. 8.2 выполняются. Согласно этой тео- реме существуют вектор A = (A0,Ai,...,Am) Е Rm+I и функционал у* ЕУ* не равные одновременно нулю и такие, что для функции Лагранжа т дю = 22 a.w+<»*.**«)>=л(®о, w.) = »=0 = J f(t,x,Xfl)dt+ (y*,xa(t) - + фо,®(*оМ1.®(<|)) to выполняются условия: а') стационарности Л$=0<=$>Ах=О (4»Л1(,=0, Л1э=0), Л<0=0, Л(| =0; b') дополняющей нежесткости: А,В,(£) = 0, i = 1,... ,т; с1) неотрицательности: А,- > 0, »= 0,1,... ,т. Покажем, что из уравнения Л1а = 0 следует существование функции р G C’(A>Rfc) такой, что </,»(•» = / p(t)y(t)dt vУ е C(A,R‘) *0 и для которой выполняются условия а)-Ь) теоремы Эйлера—Лагранжа. Тогда Л = Л и теорема будет доказана. Уравнения Эйлера и усло- вия трансверсальности по хр будут вытекать из условия стационарно- сти функции Лагранжа Л по хр. Они выводятся как и для задачи Больца.
224 Глава 3. Вариационное исчисление Распишем условие стационарности Л по ха: Л1а=0 <=> ЛХа[Л]-0 VftGC'(A,R*) <=> i, *=> f dt+iXaMh(t0)++ (У*,Л(0 - ipXa(t)h(t)} = o. to Отсюда в силу соотношения (1) fi (»*,»(•)) = -1 khdt - lXaMJ - lx„{tl}h(ii) Vу G C(A), V7 € R*. (2) Определим функцию p из условий: -p(0 - p(t)ipxJt) + fXa(t) = 0, p(£i) = -te(i,)- (3) По теореме существования и единственности решения задачи Коши для линейной неоднородной системы [АТФ, с. 191] функция р 6 определяется нашими условиями однозначно. Тогда уравнение Эйлера по ха и условие стационарности по ха в точке t\ будет выполняться. В силу соотношений (3) и (1) имеем: fi ii Г d Л Г / = “ P(*o)ft(*o) = (ph + ph) dt = J dt J to to fl J (jx.h - p<pXah + py + pyx.h) dt to dt. it л Находя из последнего соотношения f fx,hdt и подставляя полученное h выражение в (2), получим i, <»*.»()> = j py dt- р(£1)Л(£1) +p(io)h(io) - 1ХаМ7 = to ' fl i Jpydt +7(p(*o) - U(<0)) Vy € C(4,R*), V7 G R*. *0
§ 6. Задача Лагранжа f •" 225 Поскольку функция у(-) и вектор 7 определяются независимо, то зна- чение функционала (?/*,?/(•)) не зависит от 7, и, значит, коэффициент при 7 должен обращаться в ноль. Откуда следует, что (/.»()) = У Р(О?(0 dt> ?$>) = U(to). Таким образом, Л = Л. Теорема полностью доказана. 6.3. Примеры 1 1 Пример 1. J(®(-)) = J x2dt—> extr; J xdt = 0) ®(1) = 1. о о Решение. Выписанная задача не является изопериметрической зада- чей, поскольку не задано граничное условие функции ж(-) в нуле. Задачу надо решать как задачу Лагранжа. Функция Лагранжа: 1 Л = У(Аож2 +А|х)(Й +Л2(я(1) - 1). о Необходимые условия: а) уравнение Эйлера для лагранжиана L = Ао®2 + А|® d + Lx — 0 — 2Ао® + А| =0; dt b) трансверсальность по х для терминанта I = А2(®(1) - 1) ЬДО) = Ц0), ЬД1) - <=> 2А0®(0) = 0, 2А0®(1) = -А2; Если Ао = 0, то из a) Ai = 0, а из Ь) А2 = 0 — все множители Лагранжа — нули. Этого не может быть. Положим Ао = 1/2. Тогда х = Ар Общее решение: х = C\t2 + C^t + С3. Неизвестные константы находим из условия трансверсальности ®(0) = 0, условия на конце в единице и изопериметрического условия: ±(0) = 0 => С2 = 0, ' ж(1) = 1, 1 У х dt = 0 о Ci+C3 = 1, У+ Сз = 0.
226 Глава 3. Вариационное исчисление Отсюда С\ = 3/2, С3 = -1/2. Таким образом, в задаче имеется един- ственная допустимая экстремаль £ = (3f2 - 1 )/2. Покажем с помощью непосредственной проверки, что функция £ до- ставляет абсолютный минимум в задаче. Возьмем функцию h 6 С1 ([0,1]) такую, чтобы х 4- h была допустимой функцией. Для этого надо взять । функцию h, для которой Л(1) = 0 и f hdt = Q. Тогда о 1 iiii J(£+h)-J(£) = J(i+h)2dt-/i)2dt = 2 / £hdt+/h2dt>2 J &hdt. 0 0 0 0 0 Интегрируя по частям с учетом условий на h и условия трансверсальности ж(0) — 0, получим 1 1 1 J(x + h)~ J(£) ^2j&dh = 2#л| * - 2 / £hdt = -6 / hdt = 0. 0 0 0 Таким образом, разность всегда неотрицательна, то есть имеем абсо- лютный минимум. Г 2 Г Г 3 11 Smin = & dt= / (3t)2 dt = / 9t2dt = — | = 3. 0 0 0 Очевидно, что Smax = 4-00. Действительно, возьмем последователь- ность допустимых функций xn(t) = 4- nsinlirt, тогда । 7(жп()) = f (#(0 4- п2тгcos2irt)2dt +00 при п —> 4-оо. о Ответ. (3t2 - 1)/2 е absmin, Smin - 3, Smax = 4-оо. i Пример 2, J х2 dt —> extr; ж(0) = ±(0) = 0, я(1) = 1. о Решение. Выписанная задача не является задачей со старшими производными, поскольку не задано значение производной функции ж(-) в единице. Задачу надо свести к задаче Лагранжа, вводя вместо функции х вектор-функцию (я|,ж2), и обозначения: Ж| = ж, х2 = х. Тогда исходная задача сведется к задаче Лагранжа: 1 x2dt-> extr; ±1=ж2, ®i(0)=0, ж2(0) = 0, a?i(l) = 1. о
§ 6. Задача Лагранжа 227 Функция Лагранжа: 1 л = /См!-®2))^ + Ai®i(0)+A2®2(0) + A3(xi(1)- 1). о Необходимые условия: а) система уравнений Эйлера для лагранжиана L = Ло»2 d d +£Ж1 =0 = Др2+Дг2 = 0 <==> -2Ао®2-р = О; at at b) трансверсальность по х для терминанта I = AiXj(O) + Агя^О) + Аз(®1(1)-1) Д»|(°) — k,(0)> ?(°) = Al, р(1) = -Аз, Ь*2(0) — ^г(о), AhU) — “1*2(1) **=* 2А0®2(0) = А2, 2Ао±2(1) = О; с) неотрицательность Ао > 0. Если Ао=О, то из а) следует, что р=0, а из Ь) А, = А2 = Аз = 0 — все множители Лагранжа — нули. Этого не может быть. Положим Ао = 1/2. Тогда из a) ®^=0<4>®^ = 0. Общее решение: x = C\t3 Ч-Сг^+Сз^ + Сд. Неизвестные константы Cj.G.CS.Q находим из условия трансверсаль- ности а:2(1) = 0ч=>х(1) = 0 и условий на концах: ж(0) = 0 => Сд = 0, i(0) = 0 => С3 = 0, (с _ 1 Го:(1) = 1, ГС,+С2=1, I С|-"2’ ( х (1) = 0 [ 6С, + 2С2 = 0 _ 3 (С2 2. Таким образом, в задаче имеется единственная допустимая экстре- маль & = —t3/2 + 3«2/2. Покажем с помощью непосредственной проверки, что функция х до- ставляет абсолютный минимум в задаче. Возьмем функцию h е С2([0,1]) такую, чтобы f + h была допустимой функцией. Для этого надо взять функцию Л, для которой h(fi) = Л(1) = Л(0) = 0. Тогда для функционала 1 J(®(.)) = f x2dt имеем и 1 J(£+ft)-J(£) = J (&+h)2dt- 0 1111 f £2di = 2 J £hdt+J h2dt^2 J &hdi. 0 0 0 0
228 Глава 3. Вариационное исчисление Интегрируя дважды по частям с учетом условий на функцию h и условия трансверсальности ё(1) = О, получим 1 1 1 J(£+ft)-J(£)^2 j У £(3)Л<й=-2;й(3)л|°+2 J £{4)hdt=0. 0 0 о Таким образом разность всегда неотрицательна, то есть имеем абсо- лютный минимум. 1 । 1 Smin = J&2dt = J(-3t + 3)2dt = 9 J(t2-2t + l)dt = 3t3-9t2 + 9t |° = 3. 0 0 0 Найдем абсолютный максимум в задаче. Возьмем последовательность допустимых функций xn(t) = £(t) 4- nt2(t - 1); тогда J(an()) = J(f(0-bn(6^-2))2d^->4-oo прип—>4-oo, т.е. Smax = 4-oo. о t3 3t2 Ответ. - — 4- — € absmin, Smin = 3, Smax = -boo. 6.4. Вывод уравнения Эйлера—Пуассона из теоремы Эйлера—Лагранжа Вернемся к задаче со старшими производными: ti = JL(f,x(0,±(0,x(f),...,x<n\0) dt extr; (P) <0 x{k\tj) = Xkj, fc = 0,l,...,n-1, j = 0,1. (1) Теорема. Пусть z 6 wlocextrP, функции L,LX, L±,^^Lx(n) — не- прерывны в некоторой окрестности расширенного графика Тогда функции Lx(n), -—£^(Я) 4-L^-o, -— ( --Д(.)4’Дм) 4-Дн),... at dt \ at / непрерывно дифференцируемы на отрезке [£q, и выполнено уравнение dt ~ 37 Д^*) Де^-’) ) 4- Zx(»-2) ) ... ) 4- Дв — 0. at \ at / / /
§ 6. Задача Лагранжа 229 Доказательство, Приведем задачу со старшими производными к за- даче Лагранжа, сделав замену переменных хк = к = 1,... ,п, J L(t9xb хъ...9хП9хп) dtextr; xk=xk+i, fc = l,...,n-l, *0 = ®k-ij> k = l,...,n, j = 0,1. Здесь переменной является вектор-функция (х\,... ,хп). Поскольку функция £ доставляет локальный экстремум в задаче со старшими про- изводными (Р), то вектор-функция . 9хп) доставляет локальный экстремум в задаче Лагранжа (Р'). Выпишем согласно теореме Эйлера- Лагранжа необходимые условия стационарности для лагранжиана п-1 L = A0Z(t х2,..., хп, хп) + “ ®*+i)- fc=i Терминальную часть функции Лагранжа, а также остальные необходи- мые условия экстремума, не играющие существенной роли в задаче с закрепленными концами и фиксированным отрезком интегрирования, не выписываем. Система уравнений Эйлера: Г ~Р\ + До Ди = 0, “Ь ^Х]с = 0, J —рк 4» ДоД^ Pk—\ “О, к — 2,..., п — 1, & ’П I ““57^оДя + — Рп-\ = 0. \ dt Если До = 0, то из системы уравнений Эйлера следует, что рп_\ = ... = Р\ = 0. Все множители Лагранжа — нули. Пусть До / 0. Положим До = 1. Выразим рп_| из последнего уравнения и подставим в предпоследнее; проводя эту процедуру для рп-2>... ,р\,. придем в итоге к уравнению Эйлера—Пуассона. 6.5. Задачи Лагранжа 6.1. 6.2. 6.3. j х2 dt extr; о J х2 dt —> extr; о j х2 dt —> extr; о J xdt = 1. о i J xdt= 1, ®(0) = 0. о i J txdt = 1, ш(0) = 0. о
230 Глава 3. Вариационное исчисление 6.4. 1 1 J х2 dt—* extr; J txdt = 0, ж(0) = 1. 0 0 1 1 1 6.5. Jx2 dt —* extr; Jtxdt — 0, Jxdt — 0, x(Q) = 1. 0 0 0 1 1 1 6.6. J x2 dt-* extr; J txdt — 0, J xdt — 0, ж(1) — 1. 0 0 0 T T 6.7. Jx2dt-* extr; Jxdt — 1; ж(0) = 3. 0 0 T T 6.8. I x2dt —> extr; / xdt = x(T) — 1. 0 0 7Г 7Г 6.9. J x2 dt—* extr; J xsintdt= 1, ж(0) = 0. 0 0 % % % 6.10. Jx2 dt —* extr; Jxsintdt = Jxcostdt = 0, ж(0) = 0. 0 0 0 % % % 6.11. /» л /* 7Г / ±2ctt—*extr; 1 xsintdt —-2, 1 xcostdt=—, ж(0) = 0. ООО 1 1 6.12. J x2dt-* extr; J xe* dt = 1, ж(0) = 0. 0 0 1 1 6.13. J x2 dt—* extr; J x2dt = 1. 0 0 1 1 1 6.14. J x2dt—*extr9 j x2dt^\9 J xdt = 0. 0 0 0 1 1 6.15. J x2 dt-* extr; J x2dt — I, x{0) = 0. 0 0 1 1 6.16. J xdt extr; J \/l + x2 dt = j, ®(1) = 0. 0 0
? - § 6. Задача Лагранжа 231 6.17. 0 0 Jxdt —> extr; j y/1 4- ж2 dt = у x(-1) = 0. —i —i 6.18. J +X2 + extf. _ X2(Qj _ j 0 6.19. 1 f x2 dt —> extr; ®(0) = ®(1) =,0, i(0) = 1. 0 6.20. 1 f x2dt-> extr; ®(0) = ®(0) = 0, i(l) = 1. 0 6.21. 1 J(x2 - 48») dt —> extr; »(0) = x(l) = 0. 0 6.22. i J(»2 ” 48») dt extr; »(0) = »(i) = »(0) = 0. 0 6.23. i J(»2 4- 48») dt -* extr; »(0) = 0, »(!) = !. 6.24. 0 f 1 e2 1 tx2dt —> extr; »(1) = e4- »(e) = y, »(1) = 1. i 6.25. e J tx2dt —> extr; ®(1) = 0, i(l) = 1, i(e) = 2. i 6.26. e J t2x2dt —* extr; xe(1) = -1, x(e) = ®(1) = e. i 6.27. e J t2x2 dt —»extr; ®(1) = 0, i(l) = 1, x(e) = . i 6.28. e f e 3 1 e / t3x2dt -> extr; i(l) = x(e) = i(e) = —, ®(1) = 1 - J £ L x I 6.29. e f t3x2 dt —* extr; ®(1) = 1, i(l) = -l, x(e) = —тг. ./ e2 ।
232 6.30. 6.31. 6.32. 6.33. 6.34. 6.35. 6.36. 6.37. 6.38. 6.39. 6.40. 6.41. 6.42. Глава 3. Вариационное исчисление % У (х2 + 4®2) dt -»extr; о 7Г У (®2 + 4®2) dt —» extr; о х/2 У (®2 -x2)dt extr; о % У (®2 -x2)dt—> extr; о % J (х2 - х2) di —> extr; о % У (®2 - ®2) dt -* extr; о К У (®2 - ®2) dt —»extr; о я/2 У (®2 - ®2) dt —* extr, о »/2 У (х2 -x2)dt-> extr; о % J (х2 - х2) dt —> extr; о % J (х2 - х2) dt -* extr; о % У (х2 - ®2) dt -* extr; о % У (®2 - ®2) dt —»extr; о ®(0) = ®(0) = 0, ®(ir) = shir. ®(0) = ®(0) = 0, ®(ir) = shir. ®(0) = 1. ®(0) = 1. ®(ir) = 1. ®(ir) = 1. ®(0) = 0, ®(у) = 1- ®(0) = 0, i(y) = 1., ®(0) = 0, i(ir) = 1. ®(0) = 0, ®(ir) = 1. ®(0) = ®(ir) = О, ®(0) = 1. ®(0) = ®(ir) = 0, ®(ir) - 1.
§ 6. Задача Лагранжа 233 7Г 6.43. J (х2 - х2) dt —» extr; х(0) = 1, х(0) = х(%) = 0. 0 % 6.44. У (х2 -x2)dt —> extr; х(0) = х(тг) = 0, х(%) = 1. 0 »/2 6.45. У'(х2 - х2) dt —► extr; х (у) = 1, х(0) = х = 0 0 1 6.46. У (х2 4- a:2) dt —► extr; х(0) = 0, х(1) = sh 1, х(1) = ch 1. 0 1 6.47. J(х2 4- х2) dt —> extr; х(0) = - sh 1, ±(0) = ch 1, ж(1) = 0. 0 1 6.48. J(х2 + х2) dt —► extr; ж(0) = ж(0) = 0, ж(1) = sh 1. 0 1 6.49. У(х2 + х2) dt —»extr; х(0) = sh 1, х(1) = х(1) = 0. 0 %/2 6.50. У(х2 - х2) dt -»extr; х(0) = 0, х (у) = 1 + у, х (у) = 0 т/2 6.51. J (х2 - х2) dt —> extr; ж(0) = ±(0) = 0, х (у) = 1. 0 1 1 6.52. Jxdt —► extr; Jх2 dt = 1, ж(0) — ж(1) = 0. 0 0 1 1 6.53. Jxdt —> extr; jx2dt — 1, ж(0) = ±(0) = ®(1) = 0. 0 0 1 1 6.54. Jxdt extr; Jx2dt — 1, ж(0) — ±(0) — ж(1) = i(l) = 0. 0 0 1 1 6.55. / x2 dt —> extr; / x dt = 1, ®(0) = 0. О О
234 Глава 3. Вариационное исчисление 1 । 6.56. j x2dt extr; J xdt = l, ж(1) = ±(0) = 0. 0 0 1 1 6.57. J x2 dt -* extr; J xdt = 1, s(0) = ±(0) = i(l) = 0. 0 0 1 1 6.58. J x2 dt-+ extr; j xdt~\, ж(0) = a?(l) = ±(0) = 0. 0 0 1 1 6.59. J x2 dt —> extr; Jxdt = 1, я(0) = ж(1) = ±(0) = ±(1) = 0. 0 0 1 1 6.60. Jx2 dt extr; Jx2dt = \, ж(0) = ±(0) = 0. 0 0 1 III 6.61. J x2 dt -* extr; J x2dt = \, J xdt = J txdt~O. 0 0 0 0 1 1 1 6.62. Jx2 dt —> extr; Jx2 dt = 1, J xdt — 0, ж(0) = ж(1), ±(0) = i(l) 0 0 0 T 6.63. T —► extr; J x2dt~4, ж(0) = 0, ±(0) = 1, ±(T) = -1. 0 T 6.64. T —> extr; J x2 dt = 1, x(0) = ±(0) — 0, x(T) — 1. 0 T 6.65. T —> extr; J x2dt= 1, ж(0) — ±(0) = x(T) = 0, x(T) = 1. 0 T 6.66. T extr; J x2dt = 4, ж(0) = x(0) = 0, x(T) = 1, x(T) = 2. 0 । 6.67. ±(1) —* extr; J x2dt = 4, ш(0) = ±(0) = z(l) = 0. 0 i 6.68. x(l) -» extr; J x2dt= 12, x(0) = ®(0) = i(l) = 0. 0
Ответы к задачам главы 3 235 1 6.69. J (a/3))2 dt —► extr; ж(0) = ±(0) = ж(0) = 0, ±(1) = 1. о 1 6.70. J (х^У dt —> extr; ж(0) = ±(0) = ж(0), я(1) = 1. о 1 6.71. J (х^У dt -> extr; ж(0) = ж(0) = ж(0) = 0, ж(1) = 1. о 1 6.72. J (®^)2 dt -► extr; ж(0) = ±(0) = ж(0) = ±(1) = 0, ж(1) = 1. о Ответы к задачам главы 3 1.1. 1 -1 е absmin, Smin = 1, Smax = 4-оо. ft 1.2. — € absmin, Smax — +00. -м) 1.3. - — + т 6 absmin, Smin = - —; Smax = -boo. 4 4 48 1.4. “+(4- + “г)*е absmin, Smax = -boo. 4 4 / 1.5. ^Г°- € absmin, Smin = Smax = +oo. 1.6. 1.7. 1.8. t3 — t 1 e absmin, Smin = , Smax = +°°- t -t4 € absmin, Smax = +00- ini 6 absmin, Smjn = 1; Smax = +°o. 1.9. t - 1 - (e - 1) ini e absmin, Smin = 1, Smax = +°°. 1.10. 1П^ ~t € absmin, Smin = 1. Smax = +oo. In 2 1.11. t- elnt E absmin, Smax = +oo. 1 -|- e 3 — t 1.12. —— Intd—— e absmax, Smin = -oo. 4 7 1.13. - - 1 e absmin, Smin = Smax = +°o. c
236 1.14. 1.15. 1.16. 1.17. 1.18. 1.19. 1.20. 1.21. 1.22. 1.23. 1.24. 1.25. 1.26. 1.27. 1.28. 1.29. 1.30. 1.31. 1.32. 1.33. 1.34. 1.35. Глава 3. Вариационное исчисление 1п« --Цг— € absmin, Smax — +оо. In | е — Int € absmax, Smin = -0°. c Vt+ 1 G absmin, Smax = +oo. V4-t G absmin, Smin = -; Smax = +oo. 4 — 2)2 -——— G strlocmin, Smin = -oo, Smax = +oo, (t - I)2 £ locextr. 4 2 ln(t +1) G absmin, Smax = +oo. t3 -1 G absmin, Smax = +oo. Int G absmin, Smax = +oo. t3 € absmin, Smin — 3, Smax “ +oo. ch t . — — G absmin, Smax = +00. ch 1 sh2i , . „ — — € absmin, Smax = +°°- sh2 е* + е'-* -----------1 G absmin, Smax = +oo. 1 + e sh t t . . — — - - e absmin, Smax = +00. 2 sh 1 2 £sht . . „ 2 , „ —— G absmin, Smin = £ CthTo, Snax = +00. shTo sin 1 sht sini----—— € absmax, Smin = -oo. sh 1 sh 2 sh t sh2t-------—— € absmm, Smax = +oo. sh 1 (£-sinTo)sht sin * + 2--e absmm, Smax = +°°. shTo (£-sh2To)shi , . „ Sh2< + ------—------ € absmin, Smax = +oo. shT0 (t - l)cht 6 absmin, Smax = +oo. (£-TochTo)shi , . „ t chi + —----—-------€ absmin, Smax = +oo. shT0 3-sh2 (t - l)sht e absmin, Smin = —, Smax = +oo. (-Д=- +1 - To) shi G absmin, Smax = +oo. \shTo /
f * Ответы к задачам главы 3 237 1.36. cosi G absmin, Smin = 0; Smax = -boo. 1.37. sin* G absmin, Smjn = 0, Smax = -boo. / 7Г\ 7Г 1.38. 11 - - ) sin* E absmin, Smin = Smax - -boo. \ 2/ 4 1.39. tcost G absmin, Smax = -boo. 1.40. \/l + - t2 G absmin, Smax = -boo. 1.41. Vi - t2 G absmin, 5max = -boo. 1.42. V2t - t2 G absmin, Smax = -boo. t 1.43. Допустимые экстремали — цепные линии вида С ch —, где кон- То станта С отыскивается из условия на конце С ch — = £. Причем 1£1 ' 1£1 при — > а имеются две допустимые экстремали, при — — а То То имеется одна допустимая экстремаль, при -- < <* допустимых экс- То тремалей нет, где а определяется из системы уравнений а = shr, т = cthr, Smax = -boo. Подробное исследование задачи содержится в книге [ИТ, с. 427]. 1.44. Экстремаль записывается в параметрической форме следующим 2 2 а а образом: х = — (1 - cost), t = — (т - sinr) -b с. Константы а и с однозначно отыскиваются из начальных условий. Допустимая экстремаль доставляет absmin, Smax = -boo. Исследование задачи содержится в книге [АТФ, с. 113]. 1.45. Экстремали, удовлетворяющие начальному условию ж(0) = 0, име- 1 | С1 ют вид С) = Ct + ———t2. Константа С отыскивается из гра- 4л ничного условия ж(То) = С Уравнение огибающей этого семейства *2 имеет вид х = — - h (в баллистике эта кривая носит наимено- 4h вание кривой безопасности). Причем при £ > - h имеются две 4л £12 допустимые экстремали, при £ = -7 - h имеется одна допустимая 4л Т2 экстремаль, при ( < — - h допустимых экстремалей нет. В случае 4h двух экстремалей верхняя (в осях t,-x), носящая название на- весной, не дает локального экстремума, нижняя (настильная) дает сильный минимум. Smax = -boo. 1.46. (sin£, - sin£) G absmin, Smax = -boo.
238 1.47. 1.48. 1.49. 1.50. 1.51. 1.52. 2.1. 2.2. 2.3. 2.4. 2.5. 2.6. 2.7. 2.8. 2.9. 2.10. 2.11. 2.12. 2.13. 2.14. 3.1. 3.2. 3.3. Глава 3. Вариационное исчисление (sh t, - sh t) e absmin, Smax = +oo. Допустимая экстремаль £(t) = (sht.sht); Smin = -oo (®n(t) = #(t)4- (sin irnt, - sin irnt)); Smax = +oo (®n(t) = #(t) 4- (sin *nt, sin irnt)). Допустимая экстремаль £(t) = (e‘,e-<); Smin — -oo (a:n(t) = £(t) + (sin irnt, - sin irnt)); Smax = +oo (rrn(t) = #(t) + (sin irnt, sin irnt)). Допустимая экстремаль f(t)=(sint,-sint); Smin = -oo (xn(t) = £(t) + (sin2nt,-sin2nt)); Smax = +oo (xn(t) = £(t) 4- (sin2nt,sin2nt)). Допустимая экстремаль £(t) = (t*,t3); Smjn = -oo (xn(t) = £(t) + (sin irnt, - sin irnt)) ; Smax = +oo (xn(t) = £(t) + (sin irnt, sin irnt)). Допустимая экстремаль £(t) = (t 4-cost,-cost,cost-t); Smin = -oo (xn(t) = £(t) + (0, —n sin 2t, 0)); Smax = 4-oo (®B(t) = £(t) + (0, n sin 2t, 0)). t2 4 у -1 - 1 G absmin, Smin = - -; Smax = 4-oo. X = 0 £ locextr, Smin = -oo (®B(t) = n), Smax = 4-00. t2 + 3 ----— t locextr, Smin = -OO (xn(t) = n), Smax = 4-00. cht € absmin, Smax = +00. e* + sin t € absmin, Smax — 4-oo. sint 4- cost £ locextr, Smin = -oo (xn(t) = n), Smax = 4-oo. cost - 1 i locextr, Smin = -OO (®n(t) = n), Smax = 4-oo. (0,0)?locextr, Smin = -00 (xn(t) = (n,-n)), Smax = 4-00 (xn(t) = (n,n)). ln(t + 1) - 1 6 absmin, Smax = 4-oo. I 4-1 € absmin, Smax = 4-oo. In t + 1 G absmin, Smax = 4-oo. Допустимые экстремали: , ^тах----ЬОО. 2ln(t + 1) G absmin, Smax = +оо. е* - —г € absmin, Smax = 4-оо. е} + 1 £ = 1 € absmin, Smin = 0, Smax = 4-оо (®n(t) = n{t -1)4-1). 0 £ locextr, Smin = -oo (®n(t) = nt), Smax = 4-oo. t2 - 1 u o ------G absmin, 5^., = +oo. 4
Ответы к задачам главы 3 239 3.4. +1 G absmin, SmIn = --, Smax = +°о. 4 3 3.5. t - elnt - 1 G absmin, Smax = +oo. 3.6. (£ = -2t, f = 1) G absmin, Smjn = 4, Smax = +oo. 3.7. = ±4t, t1 = G absmin, Smin = 8, Smax = +oo. 3.8. (f = 0, f = 1) locextr, Smin = -oo, Smax — +oo. / t2 \ 3.9. = —-£+l, f = 2) £ locextr, Smin = -oo (жп(£) = 1-t, Tn = n), Smax = +°°- 3.10. (& = J-8,T=locextr, Smin = -oo (xn(t) = —^-+n,TB = n), Smax = +00. f t2 > 0 => = —, T = 2y/^J %. locextr , Smin = -00 f-t, 0^£s$l, ®„(f)=J -1, l^i^n-1, T„ = l(£+l)(£-n+l)-l, n-lsU^n, 'max ft2 \ 3.12. Qfc = - - (1 + V5)t, T = 8 + 4VSJ Ц locextr, Smin = -oo / .. t2 — nt _ \ „ ^®n(£) = д F £, Tn — nj > Smax----FOO. / t2 \ 3.13. \£ — — ~V2t, t = 2>/2j g locextr, Smin = -oo (xn(t) = -t, Tn = n), Smax == +00. 3.14. sin£ + cost G absmin, Smax = +oo. 3.15. To<^=>* = OG absmin, Tq = у => Csint G absmin VC G IR; Smin == 0; Tq > у =+ Smin = — °O; Smax == +°°. 3.16. (t - у - 1) sin£ G absmin, SmaK = +oo. 3.17. (y - t - 1) cos£ G absmin, Smax = +oo. sht(shl+chl) 3.18. t chi----1——-------- G absmin, Smax = +oo. ch 1 3.19. t sh£ - th 1 cht G absmin, Smax = +oo. 3.20. e* G absmin, Smax = +°°- 3.21. — G absmin, Smin = thT0; Smax = +oo. СП10
240 3.22. 3.23. 3.24. 3.25. 3.26. 3.27. 3.28. 3.29. 3.30. 3.31. 4.1. 4.2. 4.3. 4.4. 4.5. 4.6. 4.7. 4.8. 4.9. 4.10. Глава 3. Вариационное исчисление £ = -2 chi’ sht, где t — единственное решение уравнения sh2T = Т+ 1. $ = 2 shT cht, где t — единственное решение уравнения sh2T + Т= 1. А = ^=, = 2'^, Smax = +°О. \/1 + 2t - t2 € absmin, Smax = +оо. V2 -12 е absmin, Smax = +оо. £ = >/1 + 2t - t2, t = 2, Smax = +oo. = -\/l + 2i - t2, T = 1 - € absmin, Smax = +oo. t Допустимые экстремали — цепные линии вида С ch —, где кон- О Т станта С отыскивается из условия на конце С ch — = Причем с* при > а имеются две допустимые экстремали, при = а То То имеется одна допустимая экстремаль, при < а допустимых экс- То тремалей нет, где а определяется из системы уравнений а = shr, Г = CthT, S^ = +00. (cost cost\ -----r>---r I • cos 1 cos 1 / Допустимая экстремаль (cos 14- tg 1 sin t, cos 14- tg 1 sin t). -6t2 4- f>t e absmin, Smin = 12; Smax = +oo (xn(t) = -~(2n + l)sin(2n 4- l)%t^. 3t2 - 4t 4-1 € absmin, Smjn = 4, Smax = 4-oo. 3t2 4- 2t 4-1 € absmin, SmaK = 4-oo. y(-t3 4- t) € absmin, Smin = 45; Smax = +oo. 5t3 — 3t к - « —-— e absmin, Smin = 6, Smax = +oo. 5t3 4- 3t - 4 € absmin, Smax — 4-oo. ч 10t3 - 12t2 4- 3t € absmin, Smax = 4-oo. 60i3 - 96f2 4- 36i € absmin, Smin = 192, Smax = +oo- - 10t3 - 12t2 4- 6t 4- 2 6 absmin, Smax = +°o. COSt € absmin , Smin = j, Smax = +oo.
Ответы к задачам главы 3 241 4.11. € absmin, Smax = +оо. 1Г 4.12. t 4-sint € absmax, t - sint € absmin. 4.13. 2sini + cost 4- 1 € absmin, Smax = 4-oo. 4.14. 2eI-i - t 4- 1 G absmin, Smin = 2e2 4- 2e - 3, Smax = 4-oo. 2(1-e‘) (e-l)t v „ 4.15. -5—-------- 4- --— G absmin, Smax = +00. ez - 4e 4- 3 e - 3 , „ 2(te -1 - e‘4-1) u „ 4.16. --------w--— G absmin, Smm = +00. (3 - e)(e - 1) 4.17. te* G absmin, Smax = +00. 4.18. te-tG absmin, Smax = 4-oo. 7 4.19. t G absmin, Smin = Smax = +<» 4 4.20. -y G absmin, Smax = +00. t 4.21. Допустимые экстремали: ±A/2sinfcir£, к 6 IN, ±\/2sinirf 6 absmin, Smin ~ Smax = 4~°O* 4 4.22. —tsint + Csint VCelR, Smax — +°o- ir 8 4.23. — tcost, Smax =+00- 7Г . To \ 4.24. Допустимые экстремали — цепные линии вида ±С ( ch — - ch —), т где константа С > 0 отыскивается из условия 2Csh— = I. Причем при I > 2Т0 имеются две допустимые экстремали, при I = 2То имеется одна допустимая экстремаль & = 0, при I < 2Tq допустимых экстремалей нет, Smax = 4-оо. 4.25. Единственная допустимая экстремаль (3t2 - 2t,6t2 - 4t) £ locextr, Smin = ~OO, ^max ~ 4"OO. 4.26. (-6? 4- 6i,3t2 - 2t) i locextr, Smin = -oo, Smax = +oo. / 5i3 3t\ 4.27. (^0, — - —J ilocextr, Smin = -oo, Smax = +<». 4.28. (3t2-2t, 3i2-6t), (-3t2+4t, -3i2) t locextr, Smin = -oo, Smax = 4-00. 4.29. (-? 4- 3t,i3 - t), (i3 4- -i3 + t)£ locextr, 5тщ = -oo, Smax = 4-oo. 5.1. -2t3 4- 3t2 G absmin, Smin = 132; Smax = 4-oo. 5.2. t(t - I)2 6 absmin, Smax = 4-oo. 5.3. t2 - t G absmin, Smjn = 4; Smax = 4-oo.
242 5.4. 5.5. 5.6. 5.7. 5.8. 5.9. 5.10. 5.11. 5.12. 5.13. 5.14. 5.15. 5.16. 5.17. 5.18. 5.19. 5.20. 5.21. 5.22. 5.23. 5.24. 5.25. 5.26. 5.27. 5.28. 5.29. 5.30. 5.31. 5.32. 5.33. Глава 3. Вариационное исчисление t4 - 2t3 4-t1 2 G absmin, Smin = -Smax = +oo. t4 - 4t3 4- 6t2 - 4t 4-1 G absmin, Smax = 4-oo. t4 G absmax, Smjn = -oo. t2(t3 - 2t 4-1) u ------—------G absmax, Smin = -oo. t5 4- 3t3 - 2t2 , . „ ------—------G absmm, Smax = 4-oo. sint G absmin, Smax = 4-oo. sh t G absmin, Smax = 4-oo. chi - cost G absmin, Smax = 4-oo. sh t - sint G absmin, Smin = 2 sh%; Smax — 4-oo. / 7r\sint-shi , ir chi-cosi (1 4- sh - J--------4- ch -----------G absmm, 5max = 4-oo. ch t sin t - sh i cos t G absmin, Smax = 4-oo. -chicost G absmin, Smax = 4-oo. -shtsint G absmin, Smax = 4-oo. 14- cos t G absmin, Smax = 4-oo. 2(sin t - cos t - 14-1) --------------------G absmin, Smax = 4-oo. 4 - 7Г 1 - cost —-— G absmm, Smax = 4-00. cht G absmin, Smax = 4-oo. sh t G absmin, Smax = 4-00. te4 G absmin, Smax = 4-00. e4 G absmin, Smax — 4-00. t In t G absmin, 5max = 4-00. Int G absmin, Smax = 4-00. у G absmin, 5max = 4-00. t t2 G absmin, Smin = 6; Smax = 4-oo. ln(t 4-1) € absmin, Smax = 4-oo. tint G absmin, Smin = e; Smax = 4-00. 1 s -—- G absmin, 5max = 4-00. t “I- 1 t3 G absmin, Smin = 36; Smax = 4-oo. t4 G absmin, Smax = 4-00. t3(t - I)2 G absmin, Smjn = 36; Smax = 4-00.
Ответы к задачам главы 3 243 5.34. 6*5 - 15£4 + 10f Е absmin, Smin = 720; Smax = +оо. 5.35. sh2 „ sht G absmin, Smin = —; Smax = +oo. 5.36. 1 - COS t, Smax = +00. 5.37. t - Sint, Smax = 4“OO. 5.38. SM - sintf, Smax = 4~OO. 6.1. 1 G absmin, Smin - 0; Smax = +oo (xn(t) = sin(2n+ l)irt) . 6.2. 3i2 —— + 3t G absmin, Smin = 3; Smax = +oo (xn(t) = 2 ) sin(2n + l)%t). 6.3. 5t3 15t , . „ 15 —Г + “Г e absmin, Smin = V’ Sm™ = +00- 4 4 2 6.4. 5t3- 15t + 8 L „ И E absmin, Smin = 5max = +00- о о 6.5. 20f , ——1_ + 1 E absmin, Smin — 8; Smax — 4-oo. 6.6. 20f , 1 — 6t 4- ~ E absmin, Smm “ 8; Smax — 4-oo. 6.7. (sfc = 3, ^-0 € absmin, Smin = 0; (£ = 3*2-6*4-3, f = 1) glocextr, Smax — 4-OO. 6.8. = I, T = E absmin, Smin = 0; (^ = Г = 1) locextr; Smax = 4-OO. 6.9. 2 —(f + sini) G absmin; Smax = +°°- Зтг 6.10. 8„ fl - cost - ^-(t + sint)) G absmin; Smax = +°o- 16 - 3ir2 \ 4 / 6.11. cost - 1 G absmin; Smax = +oo. 6.12. 2(e‘-et-l) L „ -Ц— G absmin; Smax = +oo. e2 - 4e 4-1 6.13. Допустимые экстремали x = ±\/2cos kirt, к E IN; x = ±1 E absmin, Smin Smax ~ 4~OO. 6.14. Допустимые экстремали х = ±\/2cosfc7rf, k Е IN; £ = ±a/2cosit£ Е absmin, Smin = it2; Smax = +°°-
244 6.15. 6.16. 6.17. 6.18. 6.19. 6.20. 6.21. 6.22. 6.23. 6.24. 6.25. 6.26. 6.27. 6.28. 6.29. 6.30. 6.31. 6.32. 6.33. 6.34. Глава 3. Вариационное исчисление Допустимые экстремали х = ±>/2sin \ к + z^t, & € Z; г- vt 1Г2 „ & ±V2sin — € absmin, Smjn = —; Smax = +oo. 7Г /------- 7Г - v I -t2 G absmin, Smjn = v I - i2 G absmax, Smax = —. 4 4 - x/l -12 G absmin, Smin = € absmax, Smax = —. л 4 z . zch(i-l) ch(t-l)\ . „ x = (£|,®2) = I \ , —4-—) G absmin; Smax = +00. \ ch 1 ch 1 / t2 +1 E absmin, Smin = 1; Smax = +00. t2 — G absmin, Smin = 1; Smax = +00. 4 1 24 Г - 2r +t G absmin, Smin = Smtul = +00. 5t3 3t2 9 t4 - — + — G absmin, Smin - 5max = +00. -t4 + 2t3 G absmin; Smax = +00. ---et(\nt - 1) G absmin; 5max = -boo. tint E absmin; Smax = +00. (t + e) Inf - t E absmin; Smax = +00. Int G absmin; Smax = +00. e — + int € absmin; Smax = +oo. I G absmin, Sm^ = +oo. & thir(chtsint - shtcost) . , . , ----------------------- - shtsint G absmin; Smax = -boo. ch t sin t - sh t(th it sin t -b cos t) G absmin; Smax = -boo. sint + sht (1-shf)(cost-bcht) Допустимая экстремаль -----------1--------2ch----------£locextr; ‘S'min — — OO; Smax = -bOO. cost + cht 1-bchir .t Допустимая экстремаль----------------—----(sht -b sint) £ locextr; 2 2 shir ^min ~ "—OO, Smax = -bOO. sint-bcth^cost cht + ch(ir-t) Допустимая экстремаль ------——--------------т-т--------£ locextr; 2 2sh% ^min “ ~OO; Smax -bOO.
Ответы к задачам главы 3 245 1 4-chir. . cos^-bch^ w t 6.35. Допустимая экстремаль ———(shf 4- sinf)-----------------£ locextr; 2 shir 2 ‘Snin ~ —оо; Smax = 4~оо. (1 4-chir)(cosf 4-chJ) sM4-sin£ 6.36. Допустимая экстремаль---------—------------------------£ locextr; 2shTr 2 5min = —OO; Smax 4~00. , sin£ sh£ 6.37. — 4- ГТТ € absmin; Smax 2 2 Sil 2 6.38. Допустимая экстремаль chi cost 2shf ~~ & locextr; Smax = +oo. 6.39. Допустимая экстремаль £(t) = xn(t) = £(t) + n( chi - cosi - shi sini _, —---------— locextr; Smin = -oo 2 СП 2 shir(sht - sint)\\ г ~ I I! omax —boo. chtr+1 // 6.40. Допустимая экстремаль £(t) = ——-----------— & locextr; Smin = -oo 2 ch % 2 ,. / , . shir(sh(7r - i) + sint)\\ xn(t) = £(t) + n ch(% -1) + cos t----------chir +'i------/ J ’ Smax = +00. 6.41. sini € absmin, Smin = 0; Smax = +oo. 6.42. - sini € absmin, Smin = 0; Smax = +oo. 6.43. Допустимая экстремаль £(t) = cos i £ locextr; Smjn = —oo f ,, / shtrfshi - sini)\ \ „ I ®n(0 = &(t) + n( Chi - COSi-------------) I ; Smax V '' '' \ ch% +1 // 6.44. £ = - cos i i locextr; Smin = -oo I ®n sh 7r(sh(x - i) + sin i) \ \ -------------Г “I : I I > Smax — +oo. chtr + 1 / / 6.45. sini G absmin, Smin = 0; Smax = +oo. sh2 „ 6.46. shi G absmin; Smin — —; -Smax = +oo sh2 6.47. sh(t - 1) G absmin; Smin = —; Smax = +oo. 6.48. chi - 1 G absmin; Smax = +oo. 6.49. 1 - ch(i - 1) G absmin; Smax = +<»• 6.50. i + sini G absmin; = +oo. 6.51. 1 - cost G absmin; Smm = +oo. 6.52. £ = -^(t4-2t3+t) G absmax, -£ G absmin, Smax = -Smin = —7=. 2v6 2v30
246 Глава 3. Вариационное исчисление 6.53. А = -?-(2t4 - 5t3 + 3t2) G absmax, -x G absmin, Smax = -Smin = —7= 6 8v5 6.54. ± - I)2 G absmax, -£ G absmin, Smax = -Smjn = — 2 12v5 6.55. 2t G absmin, Smin = 0; Smax = +00. 6.56. -^(t4 - 6t2 + 5) G absmin, Smin = Smax = +00. 10 z 6.57. ^-t2(t - 2)2 G absmin, Smin = 45; SmaK = +00. 8 6.58. —t4 —+ 2(M2 6 absmin, Smax = +oo. 6.59. 30*2(* - I)2 E absmin, Smin = 720; Smax = 4-oo. 6.60. £ = C((cha> 4- coso>)(shart - sinart) - (sho; 4- sino>)(chatf - cosotf)) 6 absmin, (о; — минимальный положительный корень уравнения ch w cos cu = 1, константа С находится из изопериметрического усло- вия); Smin ~ > Smax = 4“ОО. 6.61. £ = C((cha> - cosa?)(sh^ - sin art) - (sha; - sina>)(chatf - cosart)) 6 absmin, (a; — минимальный положительный корень уравнения ch w cos w = 1, константа С находится из изопериметрического усло- вия); Smin = j Smax — 4*00. 6.62. Допустимые экстремали = л/28т(2тг^4-7) V7 Е IR, Е absmin, Smin = (2я*)4; Smax ~ 4-00. 6.63. (х = J(1 - t), Т = 1) Е absmin, Smin = 1; Smax = 4-00. / t2 Л \ 6.64. = у, T = Ij E absmin, Smin = 1; Smax - +00. / t3 t2 Л \ 6.65. (x = — ~ —, T* = 4) E absmin, Smin = 4; Smax = 4-oo. \ 16 4 / 6.66. (x = t2t T = 1) € absmin, Smm = 1; Smax = 4-oo. 6.67. -t3 4-12 € absmin, Smin = -1; t3 -t2 E absmax, Smax = 1. 6.68. 2£3 - 3£2 E absmin, Smin = -1; -2J3 + 3£2 E absmax, Smax = 1- t4 t3 6.69. + — € absmin, Smm = 3; Smax = 4-oo. 8 2 t2 4- 2t + 2 6.70. ---------G absmin, Зт|п = 0; Smax = 4-00. %, t5 - 5t4 4- 10f3 6.71. -------------G absmin, Smin = 20; Smax = 4-00. 8f5 _ 25t4 4- 20t3 6.72. -------------G absmin, Smin = 320; 5max = 4-00.
f ’ Глава 4 Задачи оптимального управления В этой главе рассматриваются задачи оптимального управления. Приводятся формулировка и доказательство принципа максимума Пон- трягина в общем случае, доказательство принципа максимума в частном случае для задачи со свободным концом. Решаются простейшая задача о быстродействии, аэродинамическая задача Ньютона и ряд других задач оптимального управления. В пятидесятых годах потребности прикладных дисциплин (техники, экономики и др.) стимулировали постановку и рассмотрение нового клас- са экстремальных задач, получивших название задач оптимального упра- вления. Необходимое условие экстремума для задач этого класса — «Прин- цип максимума», — сформулированное Л. С. Понтрягиным в 1956 году, было доказано и развито впоследствии им, его учениками и сотрудни- ками. Важно отметить, что это условие имеет существенно иную форму в сравнении с классическими уравнениями Эйлера и Лагранжа: в качестве обязательного условия в решении задачи оптимального управления вхо- дит решение вспомогательной задачи на максимум (отсюда и название — «принцип максимума»). За разработку теории оптимального управления Понтрягину и его сотрудникам В. Г. Болтянскому, Р. В. Гамкрелидзе и Е. Ф. Мищенко в 1962 году была присуждена Ленинская премия. Понтрягин рассматривал задачу на максимум, мы же для единообра- зия с прошлым материалом будем рассматривать задачу на минимум, называя соответствующее условие условием оптимальности, и формули- ровать необходимые условия в лагранжевой форме. В отличие от задачи Лагранжа в задаче оптимального управления вводится управление и появляется дополнительное ограничение типа включения на управление: и 6 17. Множество U определяет возможности человека влиять на происходящий процесс.
248 Глава 4. Задачи оптимального управления § 1. Принцип максимума Понтрягина в общем случае 1.1. Постановка задачи Задачей оптимального управления (в понтрягинской форме) будем на- зывать следующую задачу: Во(£) -* min; В,(£) О, i = 1,..., т, Bt(£) = 0, i = m + (Р) i(t) - ip(t,x(t),ute)) = 0 VfGT, (1) u(t) EU VtEb, (2) где С = (®(),и(Мо,*1), х G PC’^R"), и G PC(A,Rr)'\ tQ,t{ Е Д, to < fi, Д — заданный конечный отрезок, U С Rr — произвольное множество, Т С Д — множество точек непрерывности управления и, h Bite) - J fi(t>x(t),u(t)) dt + li(to,x(to)A\,x(tr))9 i = 0,1,... ,m. to Вектор-функция x = (xi9... ,xn) называется фазовой переменной, век- тор-функция и = (и\,...,иг) называется управлением. Ограничение (1), являющееся дифференциальным уравнением, называется дифференциаль- ным ограничением или дифференциальной связью. Оно должно выполнять- ся во всех точках непрерывности управления и. В отличие от задачи Лагранжа имеется ограничение (2) типа включения, которое должно выполняться во всех точках t 6 Д, а фазовая переменная х = (®i,..., хп) может иметь меньшую гладкость. Частным случаем задачи оптимального управления (Р) является задача, в которой один из концов или даже оба закреплены. Элемент £, для которого выполнены все указанные условия и огра- ничения задачи, называется допустимым, или еще говорят допустимым управляемым процессом. Допустимый управляемый процесс £ = ($(-)3(-),£оД1) называется (локально) оптимальным (или еще говорят оптимальным в сильном смысле процессом), если существует 8 > 0 такое, что Во(£) > Во(£) для любого допустимого управляемого процесса £ = {x(-),u(;),tQ,t\), для которого Ik(-) - *(•)Нс(д) < 6, Но - £ol < 6, |t| - it | < 6. s Здесь PC(A,Rn) — пространство кусочно-непрерывных на отрезке Д вектор- функций, соответственно РС^Д, Rn) — пространство непрерывных вектор-функциЙ, имеющих кусочно-непрерывную производную. Напомним, что кусочно-непрерывной функцией называется функция, имеющая не более конечного числа разрывов первого рода (в точках разрывов существуют конечные пределы слева и справа).
§ 1. Принцип максимума Понтрягина в общем случае 249 1.2. Формулировка теоремы Теорема. Пусть £ = (#(•),й(-),£0 Л) — оптимальный (в сильном смысле) процесс в задаче оптимального управления (Р)\ функции fi, i = 0,1,..., т, <р и их частные производные по х непрерывны в некоторой окрестности множества {(t,£(t)) | t Е Д}, декартово умноженного на U, а функ- ции Ц, i = 0,1,... ,т, непрерывно дифференцируемы в окрестности точки (£о,^(£о),£ь^(^)) (условие гладкости). Тогда найдутся множители Лагранжа (Л,р) Е Rm+I х PC^AjR"), А / 0, такие, что для функции Лагранжа K(x^),u^),tQ,t}) = «1 = j (f(t.x,u)+p(t)(x-<p(t,x,u)))dt + l(tQ,x(tQ),t\,x(t[)), to где f(t,x,u) -^Xifi(t,x,u), I = y^Xili(tQ,x(tQ),ti,x(ti)) t=0 t=0 — терминант, выполнены условия: а) стационарность no x — уравнение Эйлера для лагранжиана L(t,x,x,u) = f(t,x,u) -hp (ж - <p(t ,x,u)) d _ ~L^t) + Lx(t) = 0 Vt E T -p(t) + fx(t) - p(t)<px(t) = 0; at b) трансверсальность no x ^x(fo) “ ^c(to) P&) = ^r(io)’ Li(tl) “ P(^l) = с) оптимальность no и minL(t,^(t),i(t),u) =L(t,^(t),i{t),U(t)) <==> -p(t)p(t,&(t),u)} = f(t) -p(typ(t) ^teT; d) стационарность no подвижным концам (выписывается только для по- движных концов отрезка интегрирования) Л«о = 0 “/(^о) + k0 + h(to)i(fo) = 0, Afl = о /(£0 + ltl + ixMi(ii) = 0;
250 Глава 4. Задачи оптимального управления е) дополняющая нежесткость AtBt(f) = 0, г=1,...,тп; f) неотрицательность А« >0, i = 0,l,...,m'. Покажем, что утверждение теоремы находится в полном соответствии с принципом Лагранжа, о котором в книге неоднократно шла речь. Дей- ствительно, функция Лагранжа Л = A(z(»),ti(’),to>ti) является функцией трех аргументов: фазовой переменной ж(-), управления и(-), концов отрезка интегрирования to,t\. Согласно общему принципу Лагранжа, надо рассмотреть задачи о минимуме функции Лагранжа, в которых фиксированы все аргументы, кроме одного, и выписать необходимые условия минимума функции Лагранжа: Л(я(-),й( ),£о,£|) min; (i) A(f( ),u( ),£o,^i) -* min; (ii) A(£(*),fl(),to,t|) -* min. (iii) Задача (i) является задачей Больца, необходимые условия экстремума в которой — уравнение Эйлера и условия трансверсальности. Задача (ii) является элементарной задачей оптимального управления. Минимум интеграла достигается, если подынтегральная функция достигает своего минимума по выбору возможных управлений — это и есть условие оптимальности по управлению. Задача (iii) является задачей нахождения минимума функции двух переменных, необходимые условия экстремума в которой — теорема Ферма — равенство нулю в точке минимума частных производных по to и t|. 1.3. Пример 4 В(ш(-)) = J(х2 + х) dt -* extr; |±| 1, ш(0) = 0. о Решение. Приведем задачу к виду задач оптимального управления, введя управление и: 4 J(и2 + x)dt extr; х = и, иЕ [-1,1], ж(0) = 0. о * Функция Лагранжа: 4 А = J (Ао(^2 + х) + р(х “ *0) + А1 ж(0). о
§ 1. Принцип максимума Понтрягина в общем случае 251 Необходимые условия: а) уравнение Эйлера для лагранжиана L = А0(г? + х)+р(х - и) d — —Li 4- Lx — О at —р 4- Ад — 0; Ь) трансверсальность по х для терминанта I = Aja^O) Ь*(0) = /х(о), Ь*(4) = р(0) = Аь р(4) = 0; с) оптимальность по и min {Xqu2 - ри} = Аой2 - рй; «€[-1,1] d) неотрицательность Ао > 0 в задаче на минимум, Ао 0 в задаче на максимум. Если Ао = 0, то из а) р = 0 и из b) р = Ai = 0 — все множители Лагранжа оказались нулями. В задаче на минимум положим Ао = 1. Тогда из а) р = 1 и из Ь) р = t - 4. Из условия с) следует, что 0 0 < 2, 2 t 4. Интегрируя, получаем '-* + Сь х = < t2 --2t + C2, 4 0 t 2, 2 4. Из начального условия х(0) = 0 выводим, что С\ = 0, а из условия непре- рывности в точке t = 2 имеем -2 = 1 - 44- С2 о С2 = 1. Таким образом, {-*, t1 — - 2* -Ь 1, 4 0 2, 2 4. Докажем с помощью непосредственной проверки, что функция х до- ставляет абсолютный минимум в задаче. Возьмем функцию h 6 PC1 ([0,4]) такую, чтобы f+h была допустимой в задаче. Для этого надо взять функ-
252 Глава 4. Задачи оптимального управления цию h, для которой |£ + h\ 1, h(Q) = 0. Имеем В(& + h) - В($) = I ((& + h)2 + £ + h)dt- [(£2 + &)dt = о Интегрируя по частям в первом интеграле с учетом условий Л(0) = 0, £(4) = 0, получим 4 4 . В(£ + h)~ В(х) > 2£h|*+ j(~2£ +l)hdt = J(-22 + l)hdt. о о Подставляя в последний интеграл найденную функцию х и разбивая отрезок интегрирования на два, имеем 2 4 2 В(ж + Л) - В(£) j(-2£ + l)hdt + j\-2£+\)hdt = Jhdt^O, 0 2 0 ибо h(t) 0 при t G [0,2], так как Л(0) — 0, и h > 0 при t G [0,2] (т.е. функция h возрастает на отрезке [0,2] и, следовательно, неотрицательна). Итак, £ G absmin. 4 2 4 2 Smin = B(2) = J(£2+£)dt = J(l-t)dt + У((|-2)2 ++ = 0 0 2 / £2X|2 f/t2 \ /t3 , \|4 2 = U--) + / (z--4< + 5)d< = 2-2+(--2i2+5f) = -4-. \ 2/lo J \2 / \6 /12 3 2 В задаче на максимум положим Ао = -1. Тогда из а) р = -1 и из Ь) р = 4 - L Из условия с) min {—и2 - ри} = —й2 - рй wel-i,i] ч следует, что й = = signp = sign (4 - t) — 1, 0 t < 4. Интегрируя, получаем f = t + С. Из начального условия х(0) = 0 выте- кает, что С = 0. Таким образом, £ = L
§ 2. Принцип максимума в частном случае 253 Докажем с помощью непосредственной проверки, что функция £ до- ставляет абсолютный максимум в задаче. Возьмем функцию ЛбРС^ОЛ]) такую, чтобы х + h была допустимой в задаче. Для этого надо взять функцию h, для которой + h\ 1 |1 + h\ 1 О -2 h 0), Л(0) = 0. Как и при проверке экстремали на минимум имеем 4 4 4 4 4 В(х + Л) - В(х) = 2 J&hdt + У h2dt + Jhdt = j(2 + h)hdt + J hdt. 0 0 0 0 0 Оба интеграла неположительны, поскольку в первом интеграле h 0, а 2 + А > 0, а во втором интеграле h 0, так как h(0) = 0 и h 0 (т.е. функция h убывает). Следовательно, В(х + h) - В(£) 0, т. е. х = t 6 absmax; 4,4 2 Smax = В(О = J(&2 + £)dt = j\l + t)dt = (f + y)|* = 4 + 8=12. о о То, что х = t G absmax можно было бы получить и без непо- средственной проверки из условия самой задачи. Разобьем исходный 4 функционал на два интеграла. Максимум f х2 dt при |±| 1 достигается о 4 на |ж| = 1, а максимум f xdt при |£| < 1, ш(0) = 0, достигается при о наибольшем возрастании функции ж, т. е. при х = 1 (о £ = £). Ответ. < 'S'max “ 12. -t, t2 — — 2^ + 1, 4 0 t 2, 2 2 < < absmin, Smin = -4j; * € absmax, § 2. Формулировка и доказательство принципа максимума Понтрягина для задачи со свободным концом Приведем формулировку и доказательство принципа максимума Понтрягина для следующего частного случая задачи оптимального управ- ления — задачи со свободным концом и закрепленным временем (концы
254 Глава 4. Задачи оптимального управления отрезка интегрирования фиксированы): h B(®(-),w(-)) = I f(t9x(t)9u(t)) dt + l(x(t{)) —> min; ** (P) x(t) - <p(t9x(t)9u(t)) =0 w g t, u(t)EU WgR03i], x(tQ) = xQ, где фазовая перемен ная х G PC1 ([£о Л i ], R”), управление и G РС( [2о Л i ], Rr), U С Rr — произвольное множество, Т С — множество точек не- прерывности управления и(-). Теорема. Пусть (£(•), &(•)) “ оптимальный управляемый процесс в зада- че оптимального управления (Р) ((£,й) 6 strlocminP), функции f,<p непре- рывны в некоторой окрестности множества Г& = {(t,£(t)) | t Е декартово умноженного на U, частные производные (по Фреше) fX9 <рх определены на этом множестве и непрерывны в точках множества Гм — {(t,£(t)3(0) | t G [*оЛ]}, функция I дифференцируема (по Фреше) в точке x(t\) (I G D(£(t\))). Тогда выполняется условие оптимальности по и: V^GT, VuGtf, (1) где р — единственное решение дифференциального уравнения -р(О + А(О-р(О^(0 = о vt€T (2) с краевым условием p(t,) = -l'(*(*i)). (3) Отметим, что принцип оптимальности (1) с условиями (2)-(3) может быть выведен из необходимых условий оптимальности в общей задаче оптимального управления, множитель Лагранжа Ао при функционале В оказывается равным единице, а условие трансверсальности по x(Iq) не существенно. Доказательство. Единственность решения уравнения (2) с краевым условием (3) следует из теоремы существования и единственности решения задачи Коши для линейных систем [АТФ,с. 191]. А) Игольчатые вариации. Зафиксируем точку rGT, управление vEU и такое малое число а 0, что отрезок [т - а,т] С Т. Управление “ 1 v, t G [т - а,г), назовем элементарной игольчатой вариацией управления й (рис. 9).
§ 2. Принцип максимума в частном случае 255 Пусть жЛ(-) — решение уравнения x(t) = ^(t,£(t)»Ua(0) с началь- ным условием x(to) = ж0. По локальной теореме существования решения дифференциального уравнения [АТФ,с. 186-189] функция ха определе- на при малых а в некоторой окрестности точки но из леммы 1, формулируемой ниже, следует, что на самом деле вектор-функция ха определяется единственным образом на всем отрезке [£0, М- Посколь- ку при t Е управление ua(t) = й($), то на полуинтервале [<о»т - а) функции ха и ж, являющиеся решениями одного и того же дифференциального уравнения, совпадают (см. рис. 10). Функция ха на- зывается элементарной игольчатой вариацией функции ж, а пара (ха,иа) — элементарной игольчатой вариацией процесса (£,й). Тройку (т, v,a), опре- деляющую эту вариацию, будем называть элементарной иголкой. В) Лемма 1 (о свойствах элементарной игольчатой вариации). Пусть в элементарной иголке (t,v,ol) точка т Е Т и управление v EU фикси- рованы. Тогда существует число £ > 0 такое, что для любого а Е [0,е] отрезок [т - а,т] С Т, а функция ха — игольчатая вариация функции £ — определена на всем отрезке [to3i]; пРи этом при а —► +0 1) функция xa(j) —► £(•) в метрике пространства С'([4оЛ|]>Ип); ®а(‘) “ £(•) 2) функция------------► !/(•) в метрике пространства C([r,^],Rn), где ot функция у кусочно дифференцируема на отрезке [т, t\ ] и удовлетворяет дифференциальному уравнению з/(0 = <М*М0 v*e[r,MnT (4) с начальным условием у(т) = <р(т, £(т), v) - $(т). (5) Доказательство леммы 1. Существование функции ха следует из теоремы существования решения обыкновенного дифференциального уравнения, а сходимости функций следуют соответственно из теорем о непрерывной и непрерывно дифференцируемой зависимости решения
256 Глава 4. Задачи оптимального управления от начальных данных. Полное доказательство этих утверждений мы здесь не приводим, отсылая к книге АТФ, с. 89-91. Докажем, что функция у кусочно дифференцируема на отрезке [т,£|], удовлетворяет начальному условию (5) и дифференциальному уравнению (4). Восстанавливая значение функций ха и £ в точке t е [r,ti] через их производные и учитывая то, что эти функции удовле- творяют дифференциальному уравнению х = <p(t,x,u), имеем t ,,vdef .. *^(0 1. /* , y(t) — hm ——-----— = lim / —————ds = a-*4-0 CK a—>4-0 J Ot t т f <p(s,xa(s),ua(s))-$(s} 1 /* , . /ч ч .4 , — lim /----------------—---------ds = lim — / (<p(s,xa(s),v)-<b(8))ds+ a-*+0J a a->+OOt J ' ' io г-a + lim [ |im (>;(!,1М1,),„)_,г(а))| + a-*+0j Ot a-»4-0V ' Is6[r-a,r] т , i:— f ($я(з)[Жа0-£0] + о(Жа0~£0))(5) + lim I ---------------------------------------as — a^+Qj a t = <р(т,£(т),у)-ф(т) + J fix(s)y(s)ds. T (6) При переходе к пределу в первом интеграле мы воспользовались теоремой о среднем для определенных интегралов 2\ а во втором интеграле мы вначале воспользовались дифференцируемостью по Фреше отображения ?:C([eoM*nHc(lMl’Rn) в точке £(-)3\ а потом перешли к пределу под знаком интеграла 4\ При этом ||о(®а ~ ^)llc([r,i,],R*) lim ------------------------------ а->4-0 а .. I £)11с ll®a £||с л и и л — hm —----------------—--------------------= 0 - ||2/||с - 0. a-»4-0 ||®а — £||с Ot Подставляя в уравнение (6) значение t = т, получаем'начальное усло- вие (5) для функции у в точке т, а продифференцировав это уравнение 2> Подынтегральная функция непрерывна. Дифференцируемость следует из заданных условий гладкости функции ^Подынтегральная функция сходится в метрике пространства C([r,tj],Rn) к функ- ции у.
§ 2. Принцип максимума в частном случае 257 по t, получим, что функция у удовлетворяет дифференциальному урав- нению (4). С) Лемма 2 (о приращении функционала). Пусть в элементарной иголке (т, v, а) точка т 6 Т и управление v Е U фиксированы, В(а) := В(®л(‘),«<»(•)). Тогда функция В дифференцируема справа в нуле и в'(+о) = - /(т) - 0(т)) Доказательство леммы 2. Используя теорему о среднем для опреде- ленных интегралов, правило перехода к пределу под знаком интеграла, дифференцируемость по Фреше и лемму 1, получим p7_ia\_ i5m -В(а)“#(0) B(xa,Uot)-В(£,й) -о (4-0) = Пт -----------= lim ----------------— а->+0 а а-*+0 a = lim If hf(t,xa(t),ua(t))-f(t))dt\+ lim = a~>+oa ' у a—>4-0 a tf) T tl = ^(f f^dt + f + + lim ----------------------------------------- a->+0 a = lim + 11m + + v ,/1«€[т-Л;т] a-*+0j a т ti 4-/'(г(«1))^1) = /(т>«(т)>»)-/(т)+У fx(t)y(t)dt-p(ti)y(t]). Выражая fx из уравнения (2), учитывая уравнение (4), и начальное усло- вие (5) для у(т), имеем ti tt ti h J fxydt = j(p + p$x)ydt = j(py + py) dt = f ^(py)dt = T T T T = - p(r)y(r) = p(ti)y(ti) - p(t)(<p(t,£(t),v) - 0(r)). ‘t . Подставляя найденное значение f fxydt в выражение для В'(+0), полу- чим искомое представление.
258 Глава 4. Задачи оптимального управления D) Завершение доказательства. Из леммы 1 следует, что если а G [0,е], то (ха, иа) — допустимый управляемый процесс и ха( ) равномерно стре- мится к х( ). Поскольку (£,й) — оптимальный процесс, то при малых а > О В(ха,иа) В(Я,й) <=> В(а) В(0). Отсюда по лемме 2 В'(+0) > 0, и из выражения для В'(+0) вытекает, что /(т,ш(т), v) - p(t)^(t,£(t),v) >/(т) - р(т)0(т) VtGT, Vv G U9 т. e. выполняется соотношение (1). Теорема полностью доказана. § 3. Избранные задачи оптимального управления 3.1. Простейшая задача о быстродействии Рассмотрим задачу о наибыстрейшей остановке лифта в шахте, во- шедшую во многие монографии по оптимальному управлению. Лифт управляется под воздействием внешней силы, которая может изменяться в заданных пределах, регулируемых человеком. Предположим, что воз- можности действующей силы, а следовательно, и ускорения, ограничены какой-то величиной, например, ускорение может изменяться от -1 до +1. Требуется за кратчайшее время Т остановить (х(Т) = 0) лифт, для определенности в начале координат (х(Т) = 0). Нетрудно видеть, что задача может быть формализована следующим образом: Т —* min; |ё| 1, ж(0) = £1, х(0) — х(Т) = х(Т) = 0. Аналогично формализуется задача о машине, движущейся прямоли- нейно без трения по горизонтальной дороге. Машина может двигаться в любую сторону с ускорением, не превышающем единицу. Требуется остановить машину в определенном месте за кратчайшее время. Решение. Приведем задачу к виду задач оптимального управления, вводя вместо функции х вектор-функцию (®i,«2), управление и и обо- значения: Х\ = х, х2 — х, и — х, T-*min; ±i=®2, x2—ut ug[-1,1], ®1(0) = 6, ®2(0) = fc, X\(T) = x2(T) = 0. Функция Лагранжа: т А = J (?1(0(®1 - x2)+p2(t)(i2 - «)) dt + о + XqT + A|(®i(0) -^i) + A2(x2(0) -&) +Аз;Е1(Т) + А4®2(Г). Необходимые условия:
§ 3. Избранные задачи оптимального управления 259 а) система уравнений Эйлера для лагранжиана L = - х^) + Рг(О(®2 - «) -0. >"^£i2 + Lll = ° ( ~Pi = о, I -Р2 - Pl = О <=> Рг(О = C\t + C2; Ь) трансверсальность по х для терминанта I = А0Т 4- Ai(®i(0) - £i) 4- A2(®2(0)-6) + A3®i(T) + A4»2(T) ДсДО) == lXi(o)9 Li^T) =-1Х1(т) <=>Pi(O) = A|, pi(T) = -A3, Дв2(0) — iX2(0), Li2(T) = -lX2(T) <=> ?2(0) = A2, Pi(T) = -A4; с) оптимальность по и (не зависящие от и слагаемые не выписываем) min {-P2(t)u} = -p2(t)ti(t) => u(t) = «€[-1,1] = Г signp2(0, Рз(О / 0, [любое из [-1,1], р2(0 = 0; d) стационарность по Т: Лу = 0 <=> Ао 4- A3±i(T) 4- А4±2(Т) = 0; е) неотрицательность: Ао > 0. Учитывая то, что из начального условия следует xi(T) = 0, а из b) А4 = -р2(Т), получаем, что d) равносильно условию Ао = р2(Т)й(Т). Поэтому если Ао = 0, то р2(Т) = 0 либо й(Т) = 0, но тогда из с) вновь р2(Т) = 0. При этом р2 не может быть тождественным нулем, ибо иначе все множители Лагранжа были бы нулями. Значит, из a) p2(t) = C(t -Т), а тогда из с) следует, что u(t) = 1 или u(t) = -1. Множество начальных условий, соответствующих таким управлениям, описывается уравнением 6 = ^(6) •= 6>о, б^о, Действительно, пусть u(t) = 1 о f2(0 = l*2^ °ж2(£) = °®i(0 = (t - Т)2/2 => = £2/2 > 0 => ^2 = -у/2£\ (при извлечении квадратного корня берем знак минус, поскольку & = х2(0) = -Т < 0, при этом ми- нимальное время движения Т = -£2 > 0). В случае u(t) = -1 аналогично получаем, что & = 5^/--2£i, £i 0. Ниже покажем, что найденное время движения действительно доставляет минимум в задаче. Таким образом, в нашей задаче в этих случаях минимум достигается при Ао = 0.
260 Глава 4. Задачи оптимального управления Если же & £ ^(6), т0 Ао 5^ 0, и мы полагаем Ао = 1. Тогда из d) вытекает, что |р2(Т)| = 1 и функция р2 меняет свой знак в интервале (0,Т) (случай, когда функция р2 не меняет свой знак в интервале (0,Т) и u(t) = ±1, уже был рассмотрен при Ао = 0). То есть имеются две возможности (см. рис. 11): pt(t) = C(t-T) + i, P2(t) = C(t-T)-l. Этим возможностям в силу Ь) соответствуют такие управления: . (-1, (Ю<т, _ f 1, OsUCr, X 1, 7<t^T, \-1, 7<t^T. Рассмотрим траектории, соответствующие оптимальным управлени- ям и+ и и~ на плоскости (х[9х2)9 называемой фазовой плоскостью (см. рис. 12). Для тех значений t9 для которых u(t) = 1, имеем . t? . „ Xj х2 = 1=>±|=ж2 = ^4-С=>Ж|=у-ЬС^-ЬС = — -Ь С. Таким образом, фазовая траектория, соответствующая этим значени- ям t9 является куском параболы = х2/2 + С. Направление движения по такой параболе определяется из условия возрастания х2, так как в этом случае х2 = 1. Аналогично получаем, что для тех значений t9 для кото- рых u(t) — -1, фазовая траектория — кусок параболы = -х2/2 + С, а направление движения определяется из условия убывания х2, так как ±2 = - 1. Укажем теперь то место на фазовой плоскости (х\9х2)9 где должно совершаться переключение управления. В искомую точку (0,0) (х\(Т) = ж2(Т) = 0) мы должны попасть не более чем с одним переключением,
§ 3. Избранные задачи оптимального управления 261 двигаясь по фазовой траектории по разрешенному направлению. Сово- купность начальных условий, соответствующих управлениям и+ и и~, описывается неравенствами £2 > ¥>(£1) (для и+) и £2 < ¥>(£1) (для и~). Переключения совершаются на кривой £2 = ^(£1)- При этом, как не- трудно видеть, для каждого начального условия имеется единственная фазовая кривая, приводящая в точку (0,0). Поскольку всегда |ж2| = 1 на оптимальной траектории, то х2 — |£| 4-С и, значит, время движения Т = Varx2 (вариация функции х2). Одна- ко проще находить оптимальное время Т, строя функцию ж() класса PC2([tQ, 11 ]), удовлетворяющую необходимым условиям экстремума и на- чальным условиям. В примере 2 пункта 3.3 будет приведено решение одной из конкретных задач быстродействия. Покажем, что построенная таким образом оптимальная траекто- рия, начинающаяся в точке (£^£2), доставляет решение задаче. Пусть этой траектории соответствует управление й (для определенности й“), функция х и время Т. Предположим, что имеется некоторый другой до- пустимый управляемый процесс (ж, и,Т), Т Доопределим функцию ж() нулем на отрезке [Т, Т]. Воспользуемся следующей формулой восстановления функции по ее n-й производной X{t} = (^П)! J (t " ds + ^к\- По этой формуле при п = 2 в силу условий на левом конце функции х и ж в точке т можно представить в виде г я(т) = J(т - s)x(s) ds + &г + Cl. о Поскольку £(з) = 1 > x(s) для любого s € [0, т], то т - х(т) = J(т - s)(l - x(s))ds 0, о причем равенство здесь возможно только, если во всех точках непрерыв- ности x(s) = 1, а тогда x(t) = для любого t 6 [0,т]. Воспользуемся другой формулой восстановления функции по ее п-й производной = (^Iji /(< " ^П~'х(П)^ ds + ^
262 Глава 4. Задачи оптимального управления По этой формуле при п = 2 в силу условий на правом конце функции х и £ в точке t = т можно представить в виде т х(т) = J(s - t)x(s) ds. т Поскольку &(s) = -1 ж(з) для любого S Е [т, Т], то т х(т) - х(т) — J(s - т)(-1 - x(s))ds О, причем равенство и здесь возможно только, если x(s) = -1, а тогда x(t) = £(t) для любого t е [т, Т]. Таким образом, имеем, что х(т) = £(т) и, следовательно, x(t) = £(t) W Е [О, Т]. Отсюда Т = Т. 3.2. Аэродинамическая задача Ньютона Задача Ньютона — это задача о сопротивлении движению тела вра- щения в «редкой» среде. Необходимо выбрать форму тела вращения так, чтобы сопротивление движению было минимально. История задачи В 1687 году вышли «Математические начала натуральной филосо- фии» Ньютона. В седьмом разделе, озаглавленном «О движении жид- костей и сопротивлении брошенных тел», Ньютон рассматривает задачу касательной к кривой в ке Р. Тогда если имеет о сопротивлении шара и ци- линдра в «редкой» среде. Затем в «Поучении», при исследова- нии сопротивления усеченного конуса, Ньютон делает следу- ющее утверждение. Пусть DNEG — некото- рая кривая (рис. 13). Из произ- вольной точкц N кривой опу- стим перпендикуляр на ось АВ и из заданной точки G про- ведем прямую, параллельную точке N. Эта прямая пересечет ось АВ в точ- MN GP3 место пропорция то тело
§ 3. Избранные задачи оптимального управления 263 получающееся вращением кривой DNEG около оси АВ, будет испыты- вать наименьшее сопротивление в вышеупомянутой редкой среде среди других тел такой же длины и ширины. Ньютон не дал объяснения тому, как он пришел к этому резуль- тату. Опубликованные в наше время материалы Ньютона показывают, что он владел элементами многих конструкций, которые потом были использованы при создании вариационного исчисления. Но, как будет видно в дальнейшем, задача Ньютона относится даже собственно не к вариационному исчислению, а к оптимальному управле- нию, теория которого начала разрабатываться только в середине этого века. Формализация задачи Сопротивление движущегося тела зависит от законов сопротивления среды. Ньютон представлял себе среду состоящей из неподвижных частиц фиксированной массы т, являющихся абсолютно упругими шарами. Мы также будем придерживаться этого предположения. Пусть тело вращения вокруг оси х движется в направле- нии, обратном оси х в описан- ной выше среде со скоростью v (рис. 14). Элемент dr на оси г при вращении вокруг Ох описы- вает кольцо da. Этому кольцу соответствует пояс dS на те- ле вращения. За время dt этот пояс «вытеснит» объем dV — 2тгг drvdt, где 2тгг dr — площадь da. При этом слой столкнется Р Р с N = —-dV = — 2тгг dr vdt ча- га га стицами, где р — плотность сре- ды. Предположим, что участок ds наклонен к оси г под углом <р. Тогда одна частица, ударившись о слой получит приращение импуль- са, равное m{v2 - ^i) = -2ravcosy? • п, = |^| = v, n — единичный вектор нормали к dE. По третьему закону Ньютона, тело получит при- ращение импульса 2mv cos <рп. За время dt таких приращений будет а так как в силу симметрии компоненты пг вектора -п, т.е. ортого- нальные оси вращения, сократятся, то суммарное приращение импульса будет направлено вдоль оси х и модуль его будет равен 2р7Г7Ч7 dr dt 2 2 2 N2mvcos<pcos<p =-----------2ravcos <p = 4pirv rcos <pdrdt. m
264 Глава 4. Задачи оптимального управления В силу второго закона Ньютона это приращение равно dFdt, сле- довательно dF = 4pirv2rcos2 <pdr, где к = 4pv2ir. Просуммировав dF по всем поясам dS (т.е. по всем элементам dr), получим F = k г dr / \ cos2 <р = Ц— = -----у —Г 1+tg2^ /Й®\2 L I Т I J \ \drj / Таким образом, заменив г на t и R на То» получаем экстремальную задачу: То Г tdt J 1 + х2 о —► min; *(о)=о, ®(т0)=е. Очевидно, что нижняя грань интеграла равна 0. Действительно, ----г? > 0 при t € [0,То], и выбрав ломаную x(t) так, чтобы |i(t)| 1 4- х1 был очень большим, получим сколь угодно малый интеграл. Получается противоречие, т.е. чем более зазубрен профиль на теле, тем меньше сопротивление. Дело в том, что в формализации неявно использовалась монотонность профиля, так как только в этом случае частица сталкива- ется с телом один раз. Таким образом к условию задачи нужно добавить требование ж > 0. Форма тела вращения задается функцией x(t) такой, что ж(0) = 0, ж(2Ь) = £ (£ — заданное число). Для того, чтобы столкно- вение частицы среды учитывать только один раз, налагаем условие и 0. Формализованно задача оптимального управления выписывается следующим образом: То / ------ _> mjn; х — и, ж(0) = 0, x(Tq) = £. J 1 4-гг о Функция Лагранжа То л = f (i^“2 + X* ~ “)) dt + Ai®(°) + Хг(х(то) ~ £)• о Необходимые условия: а) уравнение Эйлера: -р — 0 р = const); b) трансверсальность по х\ р(0) = Ai, р(То) = “А2; с) оптимальность по и: min 4 --г - ри > = ----г - рй; ' u>o 11 + и2 r J 1 + й2 d) неотрицательность: Ао 0.
§ 3. Избранные задачи оптимального управления 265 Если Ао = 0, то р / 0 (если р = 0, то из Ь) следует, что Ai — Л2 = 0 — все множители Лагранжа — нули). Минимум в соотношении с) конечен только, если р < 0, при этом й = 0, т.е. & — 0. Из условия я(0) = 0 вытекает, что ж = 0, тогда £ = 0. Пусть Ао # 0. Положим Ао = 1. Тогда для достижения минимума в с) необходимо, чтобы р < 0 (если р 0, то функция L(t9u) := t -----г -ри 1 монотонно убывает с возрастанием и и не достигает минимума). Если u(t) > 0, то Lu = 0. И из с) управление ti(t) должно находиться из уравнения Lu(t,U)- р (1+г{2)2 -0 <=*► Р (1+и2)2' (0 При малых значениях t > 0 производная Lu(t,u) > 0 для любого и > 0. Значит, min L(t,u) = Z(i,0). Таким образом, Л f 0, 0 t < т, U “ I й(0, Т t^ То- Момент излома управления т характеризуется уравнениями 2й(т)т Р —------------г, Т (1 +й2(т)) (второе уравнение в (2) Цт -0,0) = — условие совпадения ми- нимумов в точке т). Подставив р из первого уравнения соотношения (2) во второе, находим, что й2(т) = 1. От- сюда й(т) = 1 (ибо й 0), и тогда снова из первого уравнения (2) полу- чаем равенство т = -2р. После излома оптимальное реше- ние удовлетворяет соотношению (1), из которого следует, что ± р(1 + и2)2 2и -%(- +2м + «3). 2\и / Но dx dx dx — = и — = — dt du dt dt dt — = и— du ' du -I- 2u -|- 3u . Интегрируя это соотношение с учетом равенства х(т) = 0, й(т) = 1, получаем параметрические уравнения искомой оптимальной кривой: £ = “(ln- + tt2 + ^u4) + ^р, t = -¥(- +2и + и3}, р<0. 2\ и 4/8 2\и /
266 Глава 4. Задачи оптимального управления Константа р определяется из начального условия x(Tq) = £. Эту кривую называют кривой Ньютона. Покажем, что £ доставляет абсолютный минимум в задаче. В силу оптимальности по и для любой допустимой функции х 6 PC1 ([О, То]), ®(0) = О, ®(Т0) = 6 ,, > —г?— - ?*(*)• 1 + x2(t) 1 + ^(0 Интегрируя это соотношение и учитывая, что То То J x(t)dt — J i(t)dt = C о о получаем То То Г tdt > Г tdt J 1 + х2 ' J 1 + Д2 о о 1 + ж Значит, ж 6 absmin. Сопоставим полученное решение с решением, полученным Ньюто- ном. Обозначим MN = t, ВМ = х9 BG = т, угол BGP = у?. Тогда из построения Ньютона имеем ВР '1'1 О ') о — = tgy? = x(t) => BP = ТХ9 GP2 = BG2 + BP2 = (x2 + l)r2. BG Таким образом, из пропорции Ньютона MN GP3 t _ т\х2 +1)3/2 it _т GP ~ 4BPBG2 (x2 + \y/2r~ 4rxr2 (x2 4-1)2 “ 4’ Но это — не что иное, как соотношение (1), в которое подставлено значение р0 = -т/2. Отметим еще, что «затупленность» кривой и условие на скачок в точке G = т (угол там равен 135°) были по существу преду- смотрены Ньютоном в его «Поучении» об усеченном конусе. 3.3. Примеры задач оптимального управления 2 Пример 1. Jxdt —> extr; |ё| 2, ж(0) = ±(0) = ж(2) = 0. о Решение. Эту задачу можно свести к задаче оптимального управле- ния, вводя вместо функции х вектор-функцию (®л,®2) и управление и и обозначения: х\ = х, Х2 = х9 и = х. Тогда наша задача сведется к задаче оптимального управления:
§ 3. Избранные задачи оптимального управления 267 2 У я j (ft-* extr; ±1=ж2, х2 = и9 ие[-2,2], Xj (0) = х2(0) = х2(2) = 0. о Функция Лагранжа: 2 л = J(Лоя?!+Р| (0(^1 -x2)+p2(t)(x2-u)) ^-ьА|ж1(0)-ЬА2ж2(0) + А3ж2(2). о Необходимые условия: а) система уравнений Эйлера для лагранжиана L = Аож । + р । (t) (х । - х2) + р2(0(®2-«) ,' - + = “• в Г + А. = о, о f >' = А"‘ tС- -±1„+1„=о '~f2~r,=<> 1й«) = -А«у-а+с'; а& Ь) трансверсальность по х для терминанта I = AjXj (0)-ЬА2ж2(0)-ЬА3х2(2) Дг,(0) — ^,(0), ^i,(2) = -ZZ1(2) <=> Р\(0) = A], pi(2) = 0, Д*2(0) = ^2(о)» ^х2(2) = -1х2(2) Рг(9) = ^2, Рг(2) = -А3; с) оптимальность по и и mn^{-p2(t)u} = -p2(*)#(0 => £(0 = ( 2signp2(0, [любое из [—2,2], Р2&) £ 0, p2(f) = 0; d) неотрицательность Ао > 0 в задаче на минимум, Ао 0 в задаче на максимум. Если Ао = 0, то из а) следует, что р\ = С и из Ь) р\ = 0. Поэтому из а) р2 = С1 / 0, иначе все множители Лагранжа оказались бы нулями. Значит из с) й = 2 или й = -2, т. е. х = 2 или х = -2, откуда х — t2 + A\t -Ь А2 или х = -t2 + Bit + В2. В обоих случаях не существует функции такого вида, удовлетворяющей условиям на концах ж(0) = ж(0) — х(2) = 0. Полагаем Ао = 1 в задаче на минимум. Тогда из a) p\(t) = t + С - 2)2 и из b) pi(t) — t - 2, далее из а) следует, что p2(t) =-—+ С". Получили, что р2(0 ~ парабола с ветвями, направленными вниз и вер- шиной на оси t = 2, следовательно, p2(t) или не меняет свой знак на отрезке [0,2], или меняет его с минуса на плюс в некоторой точке т 6 (0,2). И, значит, из с) оптимальное управление й на всем отрезке
268 Глава 4. Задачи оптимального управления тождественно равняется двум или минус двум или меняет свое значение с минус двух на плюс два в некоторой точке т. Но как мы уже выяснили в первых двух случаях функций, удовлетворяющих начальным условиям нет. Осталось рассмотреть случай Интегрируя это равенство, находим, что a f-2t + C|, ОС* Ст, X 2t + C2i r<t^2. Из условий на концах ±(0) == х(2) = О 1 _ Г -2t, * [2*~4, т < t С 2. Поскольку функция должна быть непрерывной в точке т, то -2т = 2т-4, откуда т = 1. Интегрируя еще раз, получаем .= f-t2 + C1, 1t2 - 4t + C2, Ю < 2. Из начального условия ж(0) — О О С\ = 0 и условия непрерывности в точке т — 1 : -1 = 1 - 4+С2 <=> С2 = 2 находим допустимую экстремаль 0 t 1, 1t2 -4t + 2, 1 s? 2. Докажем с помощью непосредственной проверки, что функция f доставляет абсолютный минимум в задаче. Возьмем функцию h € РС2([0,2]) такую, чтобы А + h была допустимой в задаче. Для этого надо взять функцию Л, для которой |£ -Ь Л| С 2, Л(0) = Л(0) = Л(2) = 0. 2 Имеем для функционала — f xdt о 2 2 2 2 2 J(£+h)-J(f) = J (&+h)dt-J £dt = J hdt = - J p2hdt = - J hdp2. о ooo о Интегрируя по частям дважды с учетом условий Л(0) = А(0) = Л(2) = 0, р2(2) = 0, получим 2 2 2 2 /|2 Г. . \2 Г „ Г.. hp2dt-hp2\ = / hdp2 = hp2\ - / hp2dt = - / hp2dt. о о оо
§ 3. Избранные задачи оптимального управления 269 Разбивая отрезок интегрирования на два и учитывая, что Г h О, 0 5U5J1, Г Р2 о, 0^^1, 1 h 0, 1 2, а 1Р2 > 0, 1 2, имеем I 2 J(x + h) - J(f) = - J hp2 dt - J hp2 dt 0. о i Таким образом, x € absmin. При этом 2 12 Smin = J(£()) = f £dt~ J-t2dt + j\t2-4t + 2)dt = 0 0 I t3|l /t3 7 \|2 1 8 1 = -T +(--2t2 + 2t) =--8 + 4—-+ 2-2 = —2. 3 Io \ 3 /li 33 3 Ясно, что при решении задачи на максимум -х 6 absmax, Smax = 2, так как функционал J(x) является нечетной функцией относительно х, а множество допустимых функций симметрично относительно нуля. Ответ. ж = ^тах = 2. Г-г2, Ь2-4« + 2, ?5J5i’eabsmin’ 5™п = -2; 1 t -х е absmax, Пример 2, Т~> min; -1 х 3, ш(0) = 1, х(Т) — -1, ±(0) = х(Т) = 0. Решение. Приведем задачу к виду задач оптимального управления, вводя вместо функции х вектор-функцию (х\,х2), управление и и обо- значения: Ш| = х, х2 = х, и = х, Т —> min; х{ = х2, х2 = и, ие [-1,3], ®!(0) = 1, Ж1(Т) = -1, ш2(0) = х2(Т) = 0. Функция Лагранжа: т А = / ~ + Р2^^®2 “ dt + о 4- XqT 4- Aj (®j (0) — 1) 4- А2ж2(0) 4~ Аз (ш| (Т) +1)4- А4Ш2(Т). Необходимые условия: а) система уравнений Эйлера для лагранжиана L — pi(t)(xi - х2) + P2(t)(x2 - и)
270 1лава 4. Задачи оптимального управления -Аг dtLi' _±г diLi2 + Дг| — 0, + ЬХ2 = о, А-Р1' = о, «•И«) = С11 + С!; Ь) трансверсальность по х для терминанта I = А0Т + А|(Х|(0)-1)ч- А2^(0) + А3(Ж|(Т) + 1) + А4Ж2(Т) Дв,(0) ““ hl(0)> Pl (°) - Ль Дг2СЛ = *“^2(т) Рг(О) = А2, Р1(Т) = -А3, р2(Т) = -А4; с) оптимальность по и min {-P2(t)u} = ~P2(t)u(t) => U(t) = < u€[—1,3] з, любое из [“1,3], P2(t) < 0, P2(t) > 0, р2(0 = 0; d) стационарность по Т: Лт(Т) = 0 Ао + A3±i(T) + А4±2(Т) = 0; е) неотрицательность: Ао > 0. Учитывая то, что из начального условия следует х\(Т) = 0, а из Ь) А4 = -р2(т)9 получаем, что d) равносильно условию Ао = р2(Т)й(Т). Поэтому если Ао = 0, то р2(Т) = 0 либо й(Т) = 0, но отсюда из с) вновь р2(Т) = 0. При этом р2 не может быть тождественным нулем, ибо иначе все множители Лагранжа были бы нулями. Значит, из а) р2(0 = C(t - Т), С Ф 0, а тогда из с) следует, что й(£) = -1 или й(0 = 3, т.е. f = -1 или £ = 3, откуда х = -tf2/2 -Ь A\t -Ь Л2 или х = 3t2/2 + Bit -ь В2. В обоих случаях не существует функции такого вида, удовлетворяющей условиям на концах ш(0) = 1, х(Т) = -1, я(0) = х(Т) = 0. Таким образом, в случае Ао = 0 нет допустимых экстремалей. Полагаем Ао = 1. В силу условий п. а) р2 — линейная функция, не тождественно равная нулю. Значит р2 может менять свой знак на от- резке [0,Т] не более одного раза. Причем, если функция р2 не меняет свой знак на [0,Т], то U(t) = -1 или й(0 = 3. В обоих случаях мы уже проверили, что нет допустимых экстремалей. Поэтому р2 меняет знак на [0, Т] ровно один раз в некоторой точке г 6 (0,2). Получаем две возможности: л - Г 3, 0 5UO, Л X Г-1, О^^т, ““‘“t-i, r<l^T, "ЛИ 1, = i=( Первый случай невозможен, так как тогда параболы с заданными услови- ями на концах не пересекаются. Интегрируя второе равенство, находим, что + О^^т, “ (3* + с2, r<t^T.
§ 3. Избранные задачи оптимального управления 271 Из условий на концах ±(0) = х(Т) = 0 имеем Поскольку £ 6 РС2([0,Т]), то функция х должна быть непрерывной в точке т, поэтому -т = 3(т - Т), откуда т = ЗТ/4. Интегрируя еще раз, получаем х — < 4+с. 3(t - Т)2 2 ЗТ °^Т’ ЗТ — SU Г. 4 Из начальных условий ж(0) = 1, х(Т) = -1 следует, что С = 1, D = -1, ЗТ 9Т2 ЗТ2 , а из условия непрерывности в точке т = —: + 1 = —— 1 4 находим, что Т = -^=. Таким образом, имеется единственная допустимая экстремаль А = < t2 -i+l, 4 \2 3, --7?) _ 4 - 1, УЗ t -=. 2 5/3 Аналогично тому, как это было сделано в простейшей задаче быстро- действия, можно показать, что £ 6 absmin, т. е. найденное значение 4 Т = доставляет абсолютный минимум в задаче. Ответ. < t2 -I+l, 2 4 е absmin, 5min = -7= 4 Л /3’ 3.4. Задачи оптимального управления 7%/4 3.1. J xsintdt extr; |±| 1, х(0) = 0. о 3.2. хsin t dt -* extr; |±| 1, х(-я) = ж(тг) = 0.
Til Глава 4. Задачи оптимального управления 4 3.3. J(х2 + x)dt—> extr; о То 3.4. J (х2 + x)dt~* extr; о То 3.5. J(х2 -x)dt—> extr; о То 3.6. J(х2 + x)dt~* extr; о То 3.7. J(х2 + x)dt~* extr; о То 3.8. J (х2 -x)dt-> extr; о т 3.9. J (х2 + x)dt-> extr; о % 3.10. j\i2 - х2) dt —»extr; о Зт/2 3.11. У (®2 - ®2) dt extr; о То 3.12. j(х2 - ®2) dt -» extr; о То 3.13. I (х2 - х2) dt —* extr; |®| 1, ®(4) = 0. |®| 1, ®(0) = 0. |®| 1, ®(0) = 0. |®| < 1, ®(То) = О. |®| 1, ®(0) = ®(Т0) = 0. |®| 1, ®(0) = ®(То) = 0. |®|<1, ®(0) = 0, ®(Т) = 2. |®| 1, ®(0) = 0. |®| 1, ®(0) = «(у) =0- |®| 1, ®(0) = 0. 4 |®| С 1. ®(0) = ®(То) = О-
§ 3. Избранные задачи оптимального управления 273 3.14. Jxdt —> extr; о |f | 2, ж(0) = х(0) = 0. 3.15. J xdt extr; |f| 2, ж(1) = ж(1) = 0. о 3.16. J xdt —> extr; |f| 2, ж(0) = ±(1) = 0. о 3.17. 3.18. 2 xdt 0 2 J xdt 0 —► extr; -* extr; |£| 2, ®(0) + x(2) = 0, i(2) = 0. I®l « U, ж(0) + x(2) = 0, i(0) = 0. 3.19. i J xdt 0 extr; |f|S U, x(0) + x(l) = 0, ®(0) + i(l) = 0. 3.20. 2 J xdt 0 —► extr; 1*1* S2, x(0) = i(0) = ®(2) = 0. 3.21. 2 J xdt 0 4 —► extr; |®| s £2, i(0) = i(2) = x(2) = 0. 3.22. J xdt 0 —► extr; l®l « U, ж(0) — ®(4) = 0. 3.23. 4 J xdt 0 -* extr; l®l« % 2, ®(0) = ®(4) = i(4) = 0. 3.24. 4 xdt —> extr; l®l« £2, x(0) = ®(4) = i(0) = ±(4) = 0. о
274 3.25. 3.26. 3.27. 3.28. 3.29. 3.30. 3.31. 3.32. 3.33. 3.34. 3.35. 3.36. 3.37. 3.38. 3.39. 3.40. Глава 4. Задачи оптимального управления 4 Jxdt extr; |я| 2, ж(0) + ж(4) = 0, ±(0) = ±(4) = 0. о Т —► min; |я| 2, ж(-1) = 1, х(Т) = -1, ±(-1) = х(Т) = 0. Т —> min; |ё| 2, ж(-1) = -1, ж(Т) = 1, ±(-1) = х(Т) = 0. Т -* min; |ё| 2, ±(0) = х(Т) = 0, ж(0) = 1, х(Т) = 3. Т -* min; -3 х 1, ж(0) = 3, х(Т) = -5, ±(0) = х(Т) = 0. Т — min; 0 х 1, ж(0) = ±(0) = ж(Т) = х(Т) = 0. Т min; |ё| 1, ж(0) = ±(0) — х(Т) = 0. Т —> min; |ё| 1, ж(0) = ±(0) = ®(Т) — 0. 2 J |ж| dt -* min; х -2, ж(0) = 0, х(2) = -1, х(2) = -2. о 2 J |ж| dt —* min; х -2, ж(0) — х(0) — 0, х(2) = -3. о 2 J |ж| dt min; х -2, х(0) = х(2) = 0, х(2) = 3. о 2 J |ж| dt —► min; х 2, х(0) = 0, я(2) = 1, ±(2) = 2. о 2 J |ж|бИ —> min; х 2, я(0) = 1, ±(0) = -2, х(2) = 0. о । J х2 dt -+ min; х 24, ж(0) = 11, я(1) = ±(1) = 0. о 2 J х2 dt min; ж > 6, ш(0) = ±(0) = 0, х(2) = 17. о /о П х2 dt -> min; |®| 1, ж(0) = ±(0) = 0, х(1) = - —. о
Ответы к задачам главы 4 275 2 3.41. ж(2) -* extr; |±| 2, J х2 dt = 2, ж(0) = 0. о То 3.42. х(Т0) —> extr; J х2 dt = 1, |±| 1, ж(0) = 0. о i I д.2 \ —2--------!“ —► extr; я(1) = £. о То 3.44. J(ху - ух) dt sup; х2 4- у2 1, ж(0) = ж(Т0), 3/(0) - 3/(7о). о То 3.45. j(ху - ух) dt -► sup; (х - £)2 4- у2 1, я(0) = я(Т0), 3/(0) = у(Тц). о То 3.46. J(xy- ух) dt-* sup; + (|) ж(О) = ®(Го), у(0) = у(То). о То 3.47. J(ху -yx)dt-* sup; |ж| 1, |у| 1, x(Q) = ж(Т0), 3/(0) = y(TQ). о То 3.48. J(ху - ух) dt -> sup; |i| 4- |у| 1, т(0) = ®(Т0), 3/(0) = y(TQ). о 1 3.49. J x2dt-* sup; |ж| 1, х(0) = 0. о Ответы к задачам главы 4 3.1. х = < ‘-Р 6 absmin, Е absmax.
276 Глава 4. Задачи оптимального управления 17Г v + t, -t, t у, € absmin, Smjn = -4; -& G absmax, % t - 7Г, — О 1Г, 2 ^max ~ 4. ( *2 3.3. <4 0 < i < 2, absmjn> 4-te absmax. 11 - 4, 2 t 4, 3.4. t2 Tot m л T0^2=>£ = j-y-;T0>2=> {-t, 0 t < To - 2, ^~Го^ + 1-Т0> T0-2<*CTo, 4 £ € absmin; t G absmax. t2 4 t2 Tot To To < 2 =>-- + — G absmin, Smin = - —; To > 2 => 4 2 12 {i, OsU«$To-2, -(t - To)2 G absmin; -t G absmax, V л 0! -1 + TO, To-2<t<T0, 4 T2 ^max = To 4 ~. 3.6. t2 To2 To^2=j>*=---7-;To>2=>4 = 4 4 f G absmin; -t + To G absmax. t2 - 7 + 1-Г°’ J-To, 0 t 2, 2 t To, 3.7. To 4 => £ = 4Г°}; To > 4 => -t, 0 < t у - 2, kf-T0, у + 2 sj t To , £ G absmin; 2 E absmax. kTo-t
Ответы к задачам главы 4 277 3.8. То 4 =► & = У 4 е absmin, Smin = То > 4 => 48 £ = < _ILzJlL 4 Е absmin; То -1, «-То, Е absmax, Smax = То + • 4 3.9. Допустимая экстремаль в задаче на минимум: х = д’ Т — 3; 5min — оо, Smax — 4~оо. J-l, 3.10. {t, cost sinr’ 6 absmin, где т — корень уравнения т3 -ctg т, Sm\n = у; Smax = тг. 3.11. х = ± < t, cos (t - sin (т з%\ ’ Зтг т 3.12. корень уравнения т = Зтг ----T, 2---6 absmin, где т — Зтг r\ _ 2т3 _ Зтг ” j з ^min — ? <bmax — ’ То<^=>Л = О€ absmin, Smjn = 0; To = => i = Csinf € absmin V|CK1, Smin = 0; ТГ ( t, To>y=>f = ±|^ — корень уравнения rctg(T0-T) = 1, т € (То~^;То), Smin - - у, Smax — Tq. Решение задачи см. [АГТ, № 11.44]. € absmin, где т ,з 3.13. То<тг=>£ = О€ absmin, Smin = 0; То — тг => х = С sin! 6 absmin V|CK 1, -Smin = O;
2П 3.14. 3.15. 3.16. 3.17. 3.18. 3.19. 3.20. 3.21. 3.22. 3.23. 3.24. 3.25. Глава 4. Задачи оптимального управления To я-. To T-2’T t. — Smin = у > Omax O«u <r, t^I^To-t, G absmin, lT0-i, ~ To-rsU^To, /To \ где т — корень уравнения т tg — r j = 1, лежащий на отрезке t /2-кпт , \ sign sin ——— dr I. To J о , 1 , 1 -Г G absmin, Smin = Г G absmax, Smax = ~(t - I)2 G absmin, Smin = -y (t - I)2 G absmax, Smm = |. , 2 , 2 r - 2t G absmin, Smjn = - -; -t + 2t G absmax, Smax = у 4 4 £ = (f - 2)2 - 2 G absmin, 5min = - -; -* € absmax, Smax = ~. 4 4 £ = t2 - 2 G absmin, Smjn = G absmax, Smax = -. , 1 , 1 r - t G absmin, Smjn = — -; -t +1 G absmax, Smax = -. о о G absmin; 1t2 - (8 - 4V2)t + 12 - -£ G absmax. £ = ~ 2’ ,2 ? S * 5 o’ € absmin; € absmax. 3 1, 1 t 3, G absmin, Smjn = -4; -£ G absmax, , 32 , 32 r - 4t G absmin, Smjn = ——; -t + 4t € absmax, Smax = — • J «5 A f t2 4- (8 - 8 75)t, 0^t^2-/2. . . _ 32(2-75). 2^<i«4,€abSmm-S"“ =--------------Г"’ . . „ 32(2-vT) -ж 6 absmax, 5max =------- (-t2, X = < (t - 2)2 - 2, I -G-4)2, Smax = 4. (-12, £ = < (t - 2)2 - 2, I-G-4)2, 10^3,6 absmin, -£ G absmax.
Ответы к задачам главы 4 .... 279 3.26. (&= t -1 f = Л е absmin. \ t2-2t, 0<<С1. ‘ycausuuii. з-27- (*={-<’I £ “iS‘i«?:f=')eabsmi"' 3.28. (*={^_ь * =2)e absoln. 3.29. 3t2 „ -T + 3, (t - 8/T3)2 2 -5, 6 absmin. 3.30. Допустимые экстремали существуют при £i > Й/2, 6 <0, U=l(t-t)2 . т = ^—f = ) Gabsmin. \ И 2—,r^t^T, 2(2 2(г J ( & к 3.31. £2 0 ==> = — у 4- 4~ £ь — &J € absmin; (2 < о => (а = у + (2t + $1, t = -&) € absmin. 3.32. <1 > 0 => (х = - у + (2t + 6,^ = 6 + У&2+ 2£i) € absmin; £1 < 0 => (f = у + (2t + 6, t = -6 + \/<2 “2^1) € absmin; ^i = 0=>f = 06 absmin. Г 0, 3.33. 0^^ 1, 1 c t 2, G absmin, Smin = 2. 3.34. £ = < f-t2, l-2t+ 1, oct < 1, ,. . . c ~ "I . G absmin, Smin = 2. 1 C 3.35. X = < (2t, l з - (e- 0<t<l, v „ 2)2 Ю C 2 6 absmin> 5"ii" ~ 2- 3.36. X — « f °, i а- о2, o^t<i, v „ 1 t c 2 6 abstnln > S™n = 2- 3.37. = < f (t-1)2, 10, 0 1 G absmin, Smin = 2. 1 < t 2, 3.38. 8<3 *- 18t+ 11, 12(i - I)2, £ = 2 6 absmin. i 1, 2
280 3.39. 3.40. 3.41. 3.42. 3.43. 3.44. 3.45. 3.46. 3.47. 3.48. 3.49. Глава 4. Задачи оптимального управления ._ f-t3+6t2, t 3t2 + 3t - 1, 2’ Л-‘1 + 5 -t E absmin, Smjn = -2; t E absmax, Smax = 2. Tq < 1 => допустимых экстремалей нет; 1 & == лтг absmax, «S'max== ^-^o> € € absmin. 1 I 24’ 2 1 2’ 2 € absmin, Smin = -. х = < 4 = < HI 1 => $ = $ G absmin; |£| > 1 => 'с, , , € absmin, где константа С отыс- '-jci)- ic0‘s’’ кивается из граничного условия на правом конце: С ch (1 - —) =£; Smax = +00 (®„(0 = n(t -!)+£)• Оптимальная траектория — окружность радиуса —. Решение этой 2% задачи и задач №№3.45-3.48 см. [АТФ, стр. НО]. Оптимальная траектория — эллипс (®2 + у2)'/2 ~£у = const. = Я2. Оптимальная траектория — эллипс Оптимальная траектория — квадрат |®| + |у| = const. Оптимальная траектория — квадрат |ж| = const, |у| = const. 7 к . f . (2n + 1)тгт , Допустимые экстремали: &п\ч = ± / sign cos---------------ат, о п е Z; ®о € absmax.
Глава 5 Условия второго порядка в вариационном исчислении В этой главе даны необходимые и достаточные условия экстрему- ма в простейшей задаче вариационного исчисления. Это классические условия — условия Лежандра, Якоби, Вейерштрасса и другие. При- чем эти условия будут выведены как следствия принципа максимума. Условие Вейерштрасса будет также выведено без принципа максимума с помощью игольчатых вариаций. При выводе достаточных условий в простейшей задаче вариационного исчисления будет строиться поле экстремалей, выводиться основная формула Вейерштрасса. Формулиру- ется и доказывается отдельно теорема о необходимых и достаточных условиях экстремума в простейшей задаче вариационного исчисления с квадратичным функционалом. Аналогичные необходимые и достаточ- ные условия экстремума могут быть получены и в других задачах (Больца, изопериметрической задаче, задаче со старшими производными). § 1. Простейшая задача вариационного исчисления Рассмотрим простейшую задачу вариационного исчисления (для определенности задачу на минимум) J(a(-)) = JL(t9x(t),x(t)) dt inf; x(tQ) = xQi x(ti) = x\. (P) *0 1.1. Сильный и слабый экстремум Задачу (Р) мы рассматривали на слабый экстремум. Иногда чтобы подчеркнуть, что задача рассматривается на слабый экстремум, мы будем писать P(W). Множество допустимых элементов в задаче на слабый экс- тремум D(P(W)) составляют непрерывно дифференцируемые функции класса С{ ([£о» М) с заданными условиями на концах.
282 Глава 5. Условия второго порядка в вариационном исчислении Напомним, что функция £ Е D(P(W)) доставляет слабый локальный минимум в задаче (Р) (£ Е wlocminP), если она доставляет локальный минимум в пространстве С1 ([to* ti ])» т.е. если существует б > 0 такое, что J(x) J(x) для любой функции х Е D(P(W)), для которой Н®0 - £(-)Hc'([MiI) < 6- Наряду со слабым экстремумом простейшую задачу вариационного исчисления будем рассматривать на сильный экстремум P(S) (буква S — начальная буква слова strong — сильный). Множество допустимых элементов в задаче на сильный экстремум D(P(S)) составляют кусочно- дифференцируемые функции класса РСХ фо, t\]) с заданными условиями на концах. Функция f Е P(P(S)) доставляет сильный локальный минимум в зада- че (Р) (£ Е strlocminP), если она доставляет локальный минимум в про- странстве Сфо,^1]), т.е. если существует б > 0 такое, что J(x) J(A) для любой функции х Е P(P(S)), для которой Н«(-) - £(-)11с([Ы|]) < 6- Так как множество функций, среди которых доставляется силь- ный экстремум, шире, чем для слабого экстремума, то если функция х Е С^фоЛ]) доставляет сильный, то она доставляет и слабый экстре- мум. Поэтому для функций f Е Сх ([£о> $1 ]) необходимое условие слабого экстремума является необходимым условием сильного, а достаточное условие сильного экстремума является достаточным условием слабого. 1.2. Пример слабого, но не сильного экстремума Приведем пример задачи, в которой допустимая экстремаль доста- вляет слабый локальный минимум, но не доставляет сильного локального минимума I J х3 dt —► inf; ж(0) = 0, я(1) = 1. о Необходимое условие слабого, а значит и сильного экстремума — уравнение Эйлера: d d ") + Др = О Ф=> 37 Зх = 0 <=> Зх = С <==> х = const. dt dt Общее решение уравнения Эйлера: х = C\t + С2. Из условий на концах находим, что С\ — 1, = 0. Таким образом, имеется единственная допу- стимая экстремаль А = L Покажем, что она доставляет слабый локальный минимум в задаче (f Е wlocmin). Действительно, если h Е Со([О,1]), то I для функционала J(x) — f х3 dt имеем о
§ 1. Простейшая задача вариационного исчисления 283 (*) Отсюда видно, что если ||/i||i <3,то 3 + А($)>0 и, значит, J(x + h)^ J(£), т. е. х € wlocmin. Покажем, что & не доставляет сильного локального минимума (х £ strlocmin). Рассмотрим последовательность функций hn (n > 1) та- Легко понять, что hn е РСо([0,1]) и ||hnllc([o,i]) 0 при п —► оо. По- ложим хп = $ + hn. Получим последовательность допустимых (в задаче на сильный экстремум) функций хп, хп(-) —> £(•) в метрике пространства С([0,1]), для которых в силу (*) 1 \/п 1 f hn(3 + hn)dt = / n(3-Vn)dt+ [-(з+ dt = J J J n\ yn/ 0 0 1/2 /-6 4 = 3 - >/n + - + —7= -00, n Пу/П при n —► oo, т.е. функция £ не доставляет сильного локального мини- мума (# £ Strlocmin), более ТОГО Sstrabsmin = “00. Ниже в п. 1.4.3 в лемме о скруглении углов покажем, что функция класса С1, доставляющая абсолютный слабый экстремум, доставляет И СИЛЬНЫЙ, Т.е. £strabsminP “ ^wabsminP- В нашей задаче можно было построить последовательность допусти- мых функций хп класса С1 такую, что J(xn) —> -оо, т.е. сгладить функ- ции жп.
284 Глава 5. Условия второго порядка в вариационном исчислении 1.3. Условия Лежавдра, Якоби, Вейерштрасса Рассмотрим простейшую задачу вариационного исчисления, для определенности задачу на минимум ti J(x(-)) = J L(t,x(t),x(t)) dt -> inf; x(t0) = xQ, x(t\)=x\. (P) to Пусть £ € C’UWi]) — некоторая фиксированная допустимая (£(to) = ®o, #(0) = ®i) экстремаль (т.е. функция £ удовлетворяет уравнению Эйлера). Далее предполагаем, что интегрант L по меньшей мере дважды непрерывно дифференцируем в некоторой окрестности расширенного графика (L G С2(О(Г^))). Возьмем функцию Л € C(J([to,i|]). Пусть £ £ wlocminP, тогда функция одного переменного t. <р(Х) = J{£(•) + ЛЛ()) = J L(t, £(t) + Xh(t), £(t) + АЛ(0) dt to имеет минимум при А = 0. Из условий, наложенных на гладкость функ- ции L следует, что функция у?(А) дважды дифференцируема в нуле. Поэтому по необходимому условию минимума первого порядка (по тео- реме Ферма) у>'(0) = 0, т.е. ti ^'(0) = J (Li(t)h(t) + Lx(t)h(t))dt = О УЛеС^фоЛ])- (1) to В главе 3 п. 1.3 было показано, что из соотношения (1) следует уравнение Эйлера — необходимое условие слабого минимума в простейшей задаче. По необходимому условию второго порядка минимума для функции одной переменной ¥>"(0) 0» т.е. ti /(0) = f+ 2Lxi(t)h(t)h(t) + Lxx(t)h2(t)) dt^O t0 * ул е <Ш]). Из соотношения (2) выводятся условия второго порядка минимума для простейшей задачи вариационного исчисления. Важную роль играет коэффициент La(t) при Л2. _ Говорим, что на экстремали Л выполнено условие Лежандра, если bii(0 > 0 Vt € [io,<i] и усиленное условие Лежандра, если L±±(t) > О Vt € [Mib
§ 1. Простейшая задача вариационного исчисления 285 В векторном случае х = (жь... ,шп) е L±± — &хх L±i±i L±nXi LXiXi Двя±1 L±nxn ^Х\Хп Lxnxn (L±ixi ... (Дс|Х| * • • Дг|Жя — матрицы размера п х п. Отметим, что матрица Lix(t) является транс- понированной к матрице Lxx(t) и {Lxxh,h} = = (h,Lxxh). Условие Lxx(t) 0 означает неотрицательную определенность ма- трицы, условие Lxx(t) > 0 — положительную определенность матрицы. Соотношение (2) можно переписать в виде <0 Lxxh,ii) + 2(Lxxh,h} 4- {ЪххЬ,1ъ^ улесЖ-МХ). Пусть далее LXi,Lxx,Lxx € С1 ([io, ti ], Rn ) и выполнено усиленное условие Лежандра. Уравнение Эйлера по h - —L^t) + Lh(t) = 0 для интегранта dt L = L(t, h, h) := Lix(t)h\t) + 2Lxi(t)h(t)h(t) + Lxx(t)h2(t), т. e. уравнение "4 (Lxi(t)h(t) + Lxx(t)h(t)) + Lxx(t)h(t) + Lxx(t)h(t) = 0 CIC называется уравнением Якоби для исходной задачи на экстремали х. Точка т называется сопряженной к точке tQ, если для решения уравнения Якоби Л(-) с начальными данными h(£o) = 0, h(tQ) = 1, функция h в точке т обращается в ноль (h(r) = 0). Говорят, что на х выполнено условие Якоби, если в интервале (Jo, ti) нет точек, сопряжен- ных с tn, и усиленное условие Якоби, если в полуинтервале нет точек, сопряженных с Уравнение Якоби — линейное дифференциальное уравнение второго порядка, которое (из-за усиленного условия Лежандра) можно разрешить относительно второй производной. Для векгор-функций х = (ш|,...,жп) ищется фундаментальная си- стема решений уравнения Якоби — матрица /h[(i) ... h№) я(0 = (л'(0...лп(0)= ............ \ftn(0 ••• ^п(0
286 Глава 5. Условия второго порядка в вариационном исчислении с начальными условиями Я(£о) = 0 (нулевая матрица), Я(£о) = I (еди- ( \ ничная матрица) или det-ff(f0) # 0. Векгор-столбцы h' = I ... I — \^п) решения системы уравнений Якоби. Нетрудно понять, что точка т явля- ется сопряженной тогда и только тогда, когда матрица Я(-) является вырожденной, т.е. det Я(т) = 0 Пусть f : Rn —► R — дифференцируемая функция п переменных. Функцию 8(х9х) := f(x) - f(x) - f'(x)(x - х) назовем функцией Вейерштрасса функции /. Геометрический смысл функций 8 таков: 8(x9xf) — разность в точке х1 между значением / и значением аффинной функции, касательной к графику / в точке х. Отсюда ясно, что если / выпукла, то 8(х9х') 0. Можно показать, что верно и обратное. Пусть L — интегрант простейшей задачи вариационного исчисления. Функция 8(t9 х, х9 и) := L(t, х9 и) - L(t9 х9 х) - L±{t, х9 х)(и - х) называется функцией Вейерштрасса интегранта L. Таким образом, 8(t,x,x9u) — функция Вейерштрасса функции х —> L(t9x9x)9 где t, х играют роль параметров. Говорят, что на экстремали £ выполнено условие Вейерштрасса, если v 8(t9 х9 и) = L(t9 £, и) - L(t9 х9 f- £) > 0 Vu G Rn Vt G [t0, ]. Геометрический смысл условия Вейерштрасса на экстремали х: для любого фиксированного t G [to,M график функции L=L(x)=L(t9£(t)9x) (как функции от х) лежит выше касательной к кривой L в точке £(t).
1 § 1. Простейшая задача вариационного исчисления 287 Если функция L(x) выпуклая по х для любых t, х, то условие Вейер- штрасса выполняется на любой экстремали 1.4. Необходимые и достаточные условия слабого и сильного экстремума Рассмотрим простейшую задачу вариационного исчисления для век- тор-функций х = (®i,... ,хп) (для определенности задачу на минимум) J(z(-)) = JL(t,x(t),x(t)) dt —► inf; x(tQ) = ж0, (P) to 1.4.1. Игольчатые вариации. Условие Вейерштрасса Понятие сильного экстремума ввел в вариационное исчисление Вей- ерштрасс. Для доказательства необходимого условия сильного минимума Вейерштрасс употребил специальные вариации экстремальной функции & вида x\(t) = + hx(t), где А О, f£A + (*-T)f, t е [т-А,т], МО = Лл(<;т,е) = I £А - (t - т)^х/л, t е [т.т + VX}, ({ € Rn). I 0, t £ [г - А, г 4- л/А], Производная вариации hx(t) имеет вид, изображенный на рис. 17 (для удобства изображения взято п = 1, £ > 0). При малом А она не- сколько напоминает иголку, в связи с чем подобные вариации называют «игольчатыми». Такие вариации приспособлены к исследованию задач
288 Глава 5. Условия второго порядка в вариационном исчислении на сильный экстремум. Игольчатые вариации несколько иного вида ис- пользовались при доказательстве принципа максимума Понтрягина. Очевидно, что жд(-) —► £(•) в метрике пространства Сфо,fj, Rn) при А - 0. С помощью игольчатых вариаций докажем условие Вейерштрас- са — необходимое условие сильного минимума в простейшей задаче вариационного исчисления на классе кусочно-гладких функций. Теорема. Пусть функция & Е доставляет сильный ло- кальный минимум в задаче (Р) (£ € strlocmin Р), и интегрант L непрерывно дифференцируем в некоторой окрестности расширенного графика = {(t,«(t),i(t)) | « € [to.i|]} {L G С'(О(Г^))). Тогда на 4 выполняется условие Вейерштрасса Е(т,£(т),£(т),£(т) + £) := Ь(т,4(т),4(т)+ {) - Л(т,±(т),«(т)) - -^4(т,4(т),4(т)) >0 G Rn, Vr G [t0,ti]. Нетрудно видеть, что выписанное условие Вейерштрасса является тем же самым, что и в п. 1.3: E(t9£(t)9i(t)9u) = L(t9£(t)9u) > 0 VuERn, Vf E[WiL где t = т, и = i(r) Ч-£. Доказательство. Возьмем точку т Е (^о,М (случаи т = t^9t\ до- казываются предельными переходами т —► tQi т t\ в неравенстве). Рассмотрим выписанную выше игольчатую вариацию xx(t) = £(t) + hx(t) функции х. При достаточно малых А > 0 отрезок [т - А,т 4- \/А] С Т9 функция хх допустима в задаче на сильный экстремум (хх Е P(P(S))): хх 6 PC1 (fa), *i]), xx(ti) = &(ti) 4- hx(ti) = xi9 i = 0,1. Очевидно, что функция жд(-) -* £(•) в метрике пространства С([^о,t\]) при А —► 0. Поскольку £ Е strlocmin Р, то функция одного переменного у?(А) = 7(жа) = J(£ + hx) имеет минимум при А = 0, т.е. <р(Х) ^(0). Отсюда следует, что если производная справа в нуле у/(4-0) существует, то у/(+0) > 0. Вычислим р'(4-0). Поскольку функции £(t) и xx(t) совпадают при t Е [£о,т - А] и t Е [т 4- х/А, t\} то, разбивая отрезок интегрирования [£о, £> ] на четыре отрезка, имеем </,m_ lim .. _ <p (4*0) = lim --;----= lim ------------= A-»+0 A A-+0 A t| r = lim у [(L(t,xx,xx)-L(t,&,&))dt= lim у [ (L(t,Xx,£+£)-it(t))dt+ A—»4-0 Л J A—»+0 Л J id t-X
f — V § 1. Простейшая задача вариационного исчисления 289 т+у/Х 4- lim - / Jj 4-J2. A—>4-0 A J По теореме о среднем для определенных интегралов Ji —► £(т, х(т),х(т) 4- О - £(т) при А -+ 0. Из условий гладкости, наложенных на интегрант L, вытекает диф- ференцируемость по Фреше отображения L : С*([т,т + v^A],R") —► С([т,т + действующего по формуле Ь(®(-)) = L(t,x(i),x(t)). По определению дифференцируемости по Фреше L(xx)-L(x) = L(£ + hx)-L(x) = L'(£)[hx]+r(hx) = t,xhx+Lihx + r(hx), где ||г(Лл)( )Нс([г,г+Л]) = 0(llftA(-)llc'([r,r+v5|)) = °(^)> так как Н^аОПс'Цг.т+л/Л]) = max{H'lAllc([r,r+?A])>II^Allc([r>r+v/A])} = = тах{|£|А, |£|л/д} = |£|Ул. Поэтому т+у/Х /2 = дНто^- J (txh\ + L±hx 4- r(hx)^ dt = т-Ьх/Л т+yfX = lim у [ Lx(£X - (t - t)£a/A) dt -h lim f Lx(-£x/X)dt+ A—>4-0 A J A—>4-0 A J r r r+Vx 4- lim - / r(hx) dt =: Ai + A2 + A3. A—+4-0 A у Используя теорему о среднем для определенных интегралов, найдем ве- личины Ai, А2, Лз: т4-\/А т4-аА Ai = lim А->4-0 ~ Ит —= А-+0 у/Х = о, т+у/Х A2 = -lim -J= / L±idt = -L^, А—>4-0 у A J
290 Глава 5. Условия второго порядка в вариационном исчислении r+\fX г+а/А 1лз1^*™пТ / |г(Лд)|<й lim Y [ ||г(Ла)(-)11с(1г,г+^»<к = Л—*+0 Л J А—>+U Л J т т о(л/Х) = -> 0 => А3 = 0. \/А В итоге, Л = -L±(t)£ и р'(+0) = Цт, £(т), А(т) + () - t(r) - Li(r)^ > 0. Нетрудно видеть, что выписанное условие Вейерштрасса является тем же самым, что и в формулировке теоремы, где t = r, и = £(т)-Ь £. Условие Вейерштрасса доказано. В задаче на максимум условие Вейерштрасса меняет свой знак. Ниже условие Вейерштрасса будет выведено из принципа максимума Понтрягина. 1.4.2. Необходимое условие сильного экстремума — неравенство (7) Выведем еще одно неравенство, являющееся необходимым усло- вием сильного минимума. При этом доказательство неравенства будет существенно проще доказательства условия Вейерштрасса, а условием гладкости является просто непрерывность интегранта L. Для функции L, дифференцируемой по х в точке £(t), неравенство будет совпадать с условием Вейерштрасса. Рассмотрим следующие вариации допустимой экстремали £. Пусть точка т € [to, tj и произвольные числа £, ?? > 0 фиксированы. Положим ®а(0 = *(0 + Ла(О> где А > 0, t 6 [т - А,т], hx(t) = < ^А - (t - т)т}, '€ [г.г + ^], 0, £ £ [т - А,т + — "I к 1 1] J
§ 1. Простейшая задача вариационного исчисления 291 Рис. 18 При т] — вариации совпадают с вариациями Вейерштрасса. Теорема. Пусть функция & Е PC1 ([to, ]) доставляет сильный ло- кальный минимум в задаче (Р) (£ Е strlocminP), интегрант L непреры- вен в некоторой окрестности множества расширенного графика (L Е С(О(Г^))), Т С [t0,t|] ~ множество точек непрерывности функции Тогда на х выполняется условие T}L(r, £(т), f (т) + $)+$£(т, £(т),&(т) -??)-(£ + ??)Ь(т, £(т), £(т)) > 0 V<,?7 > 0, УтЕТ. (7) Доказательство. Возьмем точку т Е (to, tj) П Т (случаи т = to, ti до- казываются предельными переходами т —► t0, т —► t\ в неравенстве (7)). Рассмотрим выписанную выше игольчатую вариацию xA(t) = £(t) + hx(t) функции А. При достаточно малых А > 0 отрезок [т-А,т + —1 С Т, L у J функция х\ допустима в задаче на сильный экстремум (хх Е D(P(S))): е РС[([t0,11 ]), xx(ti) = £(tf) + hx(ti) = Xi, i = 0,1. Очевидно, что функция жд(-) —> £(•) в метрике пространства C([t0,tJ) при А —► 0. Поскольку £ Е strlocminP, то функция одного переменного у?(А) = J(xx) = J(x + hx) имеет минимум при А = 0, т.е. у?(А) > ^(0). Отсюда следует, что если производная справа в нуле у/(+0) существует, то у>'(+0) > 0. Вычислим ^(-Ь0). Поскольку функции f(t) и »A(t) совпадают при t G [t0,r - А] и t е [т + — ,tj то, разбивая отрезок
292 Глава 5. Условия второго порядка в вариационном исчислении интегрирования [£о> ] на четыре отрезка, имеем m _ |im _ lim A®a) - J(F) _ (4-U) — Inn -----;---= lim ---------------= K' л-4+о А a—*+o A h = ^lim^ i j xx, i\) - L(t,£,#)) dt = to (интегралы на промежутках интегрирования [to,r - A], [rd---,t\ L 1] обращаются в ноль) (Ь(<>®А,^+^)_-^(О)^+Л^то т-A II t 1 у & (по теореме о среднем для определенных интегралов) (умножим обе части неравенства на у) <=> £(т), &(т) 4- £) 4- £1(т, #(т), &(т) - rj) - (£ 4- 0 > 0, Ут€Т. Геометрический смысл условия (7) на экстремали ж: для любого фик- сированного t € Т точка (#(0, L(t, &(t), £(£))) лежит ниже любой хорды с концами по разные стороны от х графика функции L=L(x)=L(t,£(t),x) (как функции от х). Действительно, (первое соотношение — это просто тождество, проверяемое сложением дробей, второе соотношение получается, если разделить обе части усло- вия (7) на £ 4- ?;). Для выпуклой функции Цх) условие (7) будет выполняться на любой функции х е РС[ ([*оЛ]) • Если L — дифференцируемая в точке i функция, то из условия (7) вытекает условие Вейерштрасса.
Л"’ § 1. Простейшая задача вариационного исчисления 293 1.4.3. Необходимые условия сильного экстремума Теорема 1. Пусть функция £ 6 C^lWibR") доставляет сильный локальный минимум в задаче (Р) (х 6 strlocminP), интегрант L непрерывно дифференцируем в некоторой окрестности расширенного графика (L G С1 (Ofy))). Тогда на х выполняется уравнение Эйлера и удовлетворяется условие Вейерштрасса £Г(£, ж, ?z)—Z/(£,:r,£)—> 0 VuG R", W G [WiL Если при этом существует La(t) Vt € [^0,^1], то выполняется также условие Лежандра*, L±x(t) > О V$ G [£о>]- Доказательство. Формализуем задачу (Р) как задачу оптимального управления «I J L(t,x, и) dt —> inf; х = и, x(to) = xQi x(t\) — х\. (Р') «о Условие х G strlocminP равносильно тому, что пара (х,и), где u(t) = x(t), является оптимальным процессом в задаче оптимального управления (Р'). Поэтому согласно принципу максимума Понтрягина найдутся множители Лагранжа Ао, А|, А2 и р() G PC1 ([^о> ]), А / 0, и та- кие, что для функции Лагранжа задачи (Р') ii А = J(ХъЬ(1,х,и) + p(t)(x - uty dt -I- А1(ш(^о) - xq) + А2(ш(^) - Ш|) i0 выполняются условия: а) уравнение Эйлера: -~?p(t) 4- А0Ь®(0 = 0 Vt G [£о> t\]; dt b) трансверсальности по х: p(to) = Аь p(t\) = -А2; с) оптимальности по и: min{AoZ/(*,£(0,tO ~p(t)u} — XQL(t,x(t),x(t)) -p(t)x(t). u€R* /(«) d) неотрицательности: Ao > 0. Если Ao = 0, то из с) (поскольку минимум конечен и равен -p(t)f(t)) вытекает, что p(t) = 0, тогда из Ь) —- что все множители Лагранжа нули. Значит, Ао # 0. Полагаем в задаче на минимум Aq = 1. Тогда из с) по необходимому условию I порядка минимума функции f(u) = L(t,x(t),u) - p(t)u следует, что f(u) = 0 о Lz(t) = p(t), а по необходимому условию II порядка > 0 V£ 6 [Wib Подставляя
294 Глава 5. Условия второго порядка в вариационном исчислении р = L& в условие стационарности по ж, получаем уравнение Эйлера. Условие оптимальности по и при Ао = 1 и р = Lx Vu G R", [Ml] есть не что иное, как условие Вейерштрасса. 1.4.4. Лемма о скруглении углов Лемма. Пусть функция & 6 PC’^o^iLR”), интегрант L 6 C(R2n+l). Тогда существует последовательность гладких функций GC'CMibR”), = Xk(tt) = такая, что хь(-) —> £(•) в метрике пространства C([fo, tj), и lim J(xk) = J(£). fc—*00 Доказательство. Для простоты записи проведем доказательство для п = 1. Возьмем функцию Рис. 19 Она непрерывна, а ее производная при t = 0 имеет скачок величи- ны -1, \h(t)\ 1/4, \h(t)\ 1/2. Пусть ъ G « = 1,...,т, — точки разрыва производной £ и Д, = $(т:- -Ь 0) - - 0) — ее скачки в этих точках. Функция /&*(•,т^) — (\/k)h(k{- - т^)), график которой получается из графика функции h преобразованиями подобия и сдвига, также непре- рывна, и ее производная непрерывна, кроме точки т,, где она по-преж- нему имеет скачок -1, кроме того т<)| l/(4fc), |Л*($,т:)| 1/2. тп Тогда функция xk(t) = #(0 + 52 Д|Л*(4,п) непрерывна вместе со сво- i=l ей производной на отрезке fo,причем xk(t) = &(t) вне отрезков
§ 1. Простейшая задача вариационного исчисления 295 [т,- - \/k,n + 1/fc]. В частности, для достаточно больших к эти отрезки не перекрываются, xk(to) = xk(ti) = £(fi), |xt(f)-f(f)| = ^2^ihk(t,Ti) < — max|A,| = — ->0 при fc->+oo, »=1 m 1 A |ifc(t)-4(t)|= sC-max|&i| = y (Д := тах|Д<1). »=1 На компакте т I' '1 4fc0’ w 2 J непрерывная функция L ограничена: \L(t, ж, ж)| М. Поэтому |j(^)-J(x)| = fL(t,xkixk)dt- J io io т T*+'Jk 4Мт — при *=1т.-1/к и, следовательно, J(xk) -* J(£) при к —> +оо. Следствие. Абсолютный экстремум в задаче (Р) на сильный бый экстремум совпадают: S3tTab3minp = SwabSminP- Для локальных экстремумов это может быть не так (см. п. 1.2). и сла- 1.4.5. Необходимые условия слабого экстремума Теорема 2. Пусть функция ж 6 С2фо, t\]> Rn) доставляет слабый ло- кальный минимум в задаче (Р) (х 6 wlocminP), интегрант L трижды непрерывно дифференцируем в некоторой окрестности расширенного гра- фика (L е С3(<Э(Г^))). Тогда на ж выполняется уравнение Эйлера, условие Лежандра и, если на экстремали х выполнено усиленное условие Лежандра > 0 6 [*о> fi]), то выполняется и условие Якоби, т. е. на интервале ($оЛ1) сопряженных точек. В задаче на максимум условие Лежандра меняет свой знак. Доказательство. Для простоты записи проведем доказательство для п = 1. 1) Вывод уравнения Эйлера и условия Лежандра. Поскольку функ- ция ж 6 wlocminP, то для любой функции h 6 СоФо>М) функция у?(А) = J(£( ) + АЛ(-)) имеет локальный минимум в нуле. Тогда по не- обходимому условию минимума функции одного переменного (р\0) = О
296 Глава 5. Условия второго порядка в вариационном исчислении и у/'(0) > 0. В главе 3 п. 1.3 было показано, что первое условие равно- сильно выполнению уравнения Эйлера на функции £. Второе условие эквивалентно неотрицательности функционала К(Л()) = J+ 2Lxx(t)h(t)h(t) + Lxx(t)h2(t)) dt^O to Vfe G сЖМ)- Из неотрицательности и вида функционала К следует, что функция h(t) = 0 доставляет абсолютный минимум (слабый) в задаче K(h()) = J(Lxxh2 + 2Lxxhh + Lxxh2)dt-^mf; h(t0) = h(tt) = 0. (P") to По следствию из леммы о скруглении углов функция h = 0 доставляет в задаче (Р") и сильный минимум. Тогда в силу теоремы 1 о необходимых условиях сильного минимума в задаче (Р") на h выполняется условие Лежандра для интегранта h(t), h(t)) := + 2Lxi(t)h(t)h(t) + Lxx(t)h2(t), t. e. > 0 о Lxx(t) > 0 W E [to,t\]. Таким образом, условие Лежан- дра в задаче (Р) выполнено. 2) Вывод условия Якоби. Предположим противное, что условие Якоби не выполнено, т.е. существует точка т Е (to,t\) и нетривиальное (h £ 0) решение h Е уравнения Якоби, для которого h(to) = h(r) = 0. Отметим, что из нетривиальное™ решения h однородного линейного дифференциального уравнения второго порядка с условием h(r) = 0 вытекает, что h(r) 0. Положим h(t) = Так как О, Т ч * *!• функция h удовлетворяет уравнению Якоби, то после интегрирования по частям получим К(л(.))= j (Lah2 + 2Lx±hh + Lxxh2)dt = «о т — (Ь&х^ 4“ Lxxhh + Lxxhh 4- Lxxhty dt = to T T — J* (Lxxh 4- L±xh)hdt 4" 4~ Lxxh^hdt = to to
\ dt^xxh'} 4“ LXxh + hdt — 0. § 1. Простейшая задача вариационного исчисления 297 = (Lah Ч" -F <0 Таким образом, K(h) — 0, а это означает, что h Е absminP" (наряду с функцией h = 0). Проводя рассуждения, аналогичные проведенным в теореме 1, получим, что найдется функция р е PC^UWi]) такая, что для лагранжиана квадратичной задачи L(t, h, h) = Lxxh2 + 2Lxxhh+Lxxh2 на экстремали h выполняется уравнение p(t) = <=» p(t) = 2(Zi4(0A(0 + Lix(t)h(t)). Поскольку h(t) = 0 при t > т, to p(r 4-0) = 0 и в силу непрерывности функции р 0 = р(т - 0) - 2Lxx(t)K(t - 0) - 2Lxx(r)h(r) = 0, откуда h(r) — 0 (ибо Lxx(r) 0 из-за усиленного условия Лежандра). Мы пришли к противоречию с условием h(r) / 0. Таким образом, предположение противного неверно и условие Якоби выполнено. 1.4.6. Поле экстремалей Рассмотрим простейшую задачу вариационного исчисления ti J(x( )) — J L(t,x(t),x(t)) dt —> inf; ш(^0) = xQi x(ti) = X[. (P) to Полем экстремалей в задаче (Р) называется множество (иногда го- ворят «семейство») экстремалей {ж(-,А)}, «(•,•) Е C’QMi] х A,Rn), с параметром А Е A Е C?(Rn) (о Л — некоторое открытое множество в пространстве Rn). (Напомним, что экстремаль это функция, удо- влетворяющая уравнению Эйлера.) Если для поля экстремалей существует точка (£*,я*) такая, что я(£*,А) = ж* для всех А е Л, то это поле называется центральным полем экстремалей^ а точка (£*,ж*) называется центром поля экстремалей. Пусть £ — допустимая экстремаль в задаче (Р) (т. е. экстремаль с заданными в задаче граничными условиями). Говорим, что экстремаль А включена в поле экстремалей {ш(,А)}, если £(♦) = ж(-,А) при некото- ром А € Л. Говорим, что экстремаль х, включенная в поле экстремалей, окружена полем экстремалей, если существует окрестность G графика Г$ такая, что для любой точки (т,£) из этой окрестности имеется единственная экстремаль семейства, проходящая через эту точку; причем функция А : G —► Rn, А = А(т,£), должна быть класса C}{G). Единствен- ность экстремали, проходящей через точку (т,£), означает, что по точке Е G значение А = А(т,£) отыскивается единственным образом.
298 Глава 5. Условия второго порядка в вариационном исчислении Функция и: G R”, u(r,£) = ~x[t, А(т,£))1 =: ®(т, А(т,£)) at И=т называется функцией наклона поля. Отметим, что на экстремали х функ- ция наклона поля u(t9 £(£)) = £(t) совпадает с производной функции £(t). Пример (гармонический осциллятор). J(х2 - х2) dt -* min; x(to) = = 0 (0 < tQ < ti < тг). Уравнение Эйлера х -Ь х = 0. Экстремали этого функционала имеют вид x(t) = С\ sinf + CjcosL Допустимая экстремаль £(t) = 0. Совокуп- ность экстремалей x(t9X) = Asinf есть центральное поле экстремалей с центром в точке (0,0), включающее, в частности, экстремаль £ при А = 0, покрывающее полосу 0 < t < тг. Найдем экстремаль поля, проходящую через точку (т,£) (0 < т < тг): х(т9 A) = £ о Asinr = £ О А = => x(t9 А(т,£)) = sinL Функция smr sinr d i d £ I наклона поля и(т,£) — —x(t9 А(т,£)) = — -—sin J = £ctgr. dt I т dt Sin T li=T Построение центрального поля экстремалей Теорема. Пусть £ 6 С2фо, t\], Rn) — допустимая экстремаль в зада- че (Р) (х Е DE(P))9 интегрант L трижды непрерывно дифференцируем в некоторой окрестности расширенного графика (L Е С3(О(Г^)))9 на & выполнены усиленные условия Лежандра и Якоби, Тогда & можно окру- жить центральным полем экстремалей, покрывающим полосу [£о, ] х R”. Доказательство. Распишем уравнение Эйлера Так как выполнено усиленное условие Лежандра, то есть неравенство Lix(t) > 0W 6 [Wi], то в силу непрерывности функции (напомним, что L Е С3) найдется такое U Е О(Г^)9 что Lxx(t9x9x) > 0 V(t9x9x) Е U, Значит, в области U уравнение Эйлера (1) равносильно системе, разрешенной относительно производных ж — Lxx (Lx — Ьц Lxxx) v—> где $(t,x,y) := Lj.(t,x,y)(Lx(t,x,y) - Lit(t,x,y) - Lix(t,x,y)y). В силу заданной гладкости интегранта L функция Ф непрерывно дифференцируема в окрестности U. Тогда по теореме существования
..... § 1. Простейшая задача вариационного исчисления 299 и непрерывно дифференцируемой зависимости решения от начальных данных (Гл. 4, п. 1.3) найдутся такие е > 0 и б > 0, что а) решение х продолжимо на отрезок [£0 - еЛ\ + е]; Ь) для любого А 6 Л := {А 6 R” | |А| < 6} на отрезке ~ t\ 4-е] опре- делено решение ж(-,А) уравнения Эйлера с начальными данными x(t*9 А) = ж(^), x(t*9 А) = x(t*) + А, где t* — некоторая точка интер- вала (to - e9to). При этом функция x(t9 А) непрерывно дифференцируема как функ- ция двух переменных (х(>9 ) е С1 (fa - e9t\ -be] xA,Rn)). Значит, множество экстремалей {ж(-,А)}, А 6 Л, является полем экстремалей (даже центральным). В силу единственности решения дифференциаль- ного уравнения х(«, А) = А при А = 0, т. е. экстремаль £ включена в поле экстремалей {ж(-, А)}. Покажем, что экстремаль &(t)9 при t 6 [£о,М окру- жена этим центральным полем экстремалей. Положим H(t9t^) := eT®(^^)L п = жа(^А)|а=:0 0Л IA—и = I......), V CfAj IA—0 / тогда H(t*9t*) = —А)1 = = О» ил I А=0 0 л H(t*9t*) = — x(t9 А)| )| = а “ ях (^(^*) + = 0t \0л 1А=0/ О Л I А=0 0Л Поскольку x(t9X) — экстремаль для любого А, |А| < б9 то, дифферен- цируя уравнение Эйлера (1) по А и меняя порядок дифференцирования в первом слагаемом, получим 0= ^7ii(^®(^A),i(t,A))+Irx(t,«(t,A),i(t,A))) I 4=> ол \ at / ia=o “ “J7 (^хх —х(^,А)| at х 0л I А—о 0л »А—о/ +^xi 1 П=О 0Л IA—О 0Л I А—О Значит, матрица Я(-,^) удовлетворяет уравнению Якоби с начальны- ми условиями H(t*9t*) = 0, H(t*9tt) = I. Пусть H(t9to) — матричное решение уравнения Якоби с условиями Hfa9to) = 0, Hfa9to) = I,
300 Глава 5. Условия второго порядка в вариационном исчислении Поскольку выполнено усиленное условие Якоби, то не существует не- тривиального решения h уравнения Якоби, удовлетворяющего условиям Л(^о) = h(r) = 0, to < т Таким образом, усиленное условие Якоби равносильно невырожденности матрицы при любом t 6 (£о»М- Но тогда снова в силу теоремы существования и непрерывной зависи- мости решения от начальных данных при достаточной близости t* к to матрица Я(М») будет невырожденной для любого t G [*о, *1 ] - Рассмотрим функцию Ф : Rn+l —► Rn+I, действующую по формуле Ф(т, А) = (т,ж(т, А)), для т G (to~Mi +0, A G Л. Функция Ф переводит точки (т, А) в точки (т,£), где £ = ж(т, А). При этом Ф(*,0) = (*,&(*, 0)) = М(0) и якобиан detф'|(<>0) = det ) =det®A(«,O) =detK(f,t,) #0 при t G [£о>£|]• По теореме об обратной функции (для каждой фикси- рованной точки t е (Wd) существуют функция Ф”1 и число б > 0 (зависящие от t) такие, что ф-^т,^) = (т, А) для любой точки (т,£), для которой |£-т| < б, |£(0-£| < б, и Ф(т, А)=Г(т,ж(т, А)) = (т,£). Обратная функция сопоставляет точке (т,£) точку (т, А) единственным образом. Поэтому существует единственное А = А(т,£) (зависящее от t) такое, что ж(т, А(т,£)) = С Значит, экстремаль я(-, А) действительно проходит через точку (т,£) и она из поля экстремалей определяется единственным образом. В силу компактности графика Г& = {(£,£(0) € Rn+I | t е [to,0]} (из любого открытого покрытия компакта можно выбрать конечное подпокрытие) можно найти одно 6Qi такое, что для любой точки (т,£), для которой т е [Md, |#(т) -£1 < Фъ существует (и, как нетрудно понять, единственное) А = А(т,£) (не зависящее от 0 при котором х(т, А(т,£)) = При этом гладкость функции А такая же, как гладкость поля {ж(-,А)}, т.е. С1. Построение центрального поля, окружающего экстремаль, закончено. Замечание. Пусть £ = 0 является допустимой экстремалью в зада- че (Р). В условиях предыдущей теоремы для окружения ее централь- ным полем экстремалей достаточно взять семейство функций ж(-,А) = ° Для отображения / :Rn Rn, /(жь...,зя) = (/i(®i,...,®n),...,/n(®b---,®n)), матрица Якоби f = /в/1 дх\ дхп Ofn dfn 1 .11 • < \№|
§ 1. Простейшая задача вариационного исчисления 301 где t* < tQ настолько близко к Iq, что матрица невы- рождена при tQ t t\. Это поле покрывает всю полосу to t[. Кроме того я(т, А) = £ О Я(т,£*)А = £ А = А(т,£) = Я“!(тЛ)£ £ с'- Функция наклона поля «(т,6 = 4®(<,А(т,О)| = H(r,tt)X(r,0 = at I t-т S-функция и ее дифференциал Пусть ж( , А) — дважды непрерывно дифференцируемое центральное поле экстремалей с центром (£*, ж*), окружающее допустимую экстремаль £(•), и интегрант L — трижды непрерывно дифференцируем в некоторой окрестности расширенного графика (L 6 С3(О(Г^))). Функция т S(r,£) = J £(£,ж(£, А(т,£)),а:(<,А(т,£))) <й называется S-функцией центрального поля я(-, А). Найдем дифференциал S-функции. Он понадобится нам для вывода основной формулы Вейер- штрасса при доказательстве достаточных условий сильного экстремума. Для нахождения частных производных S-функции нам понадобятся не- которые соотношения. Имеем по определению поля и функции наклона поля ®(т,А(т,£)) = £. Дифференцируя обе части этого тождества по т, получим х(т,А(т($)) +®л(т,А(т,^))Аг(т,0 = 0=5> => -®аАт = ®(т, А(т,О) == (т) (и(т,£) — функция наклона поля). Дифференцируя обе части тождества по £, получим ®а(т, А(т,£))А{(т,£) = 1 (О (/ — единичная матрица). Поскольку (£*,я*) — центр поля, то ж(£*,А) = я*, и, значит, выполняется следующее соотношение ®а(*.,А(т,£)) =0. (*) Найдем dS/дт, дифференцируя по т интеграл с переменным верхним пределом, и используя непрерывность шА, вытекающую из того, что ж(-, А) 6 С2. Имеем = £(т,£,«(т,$)) +
302 Глава 5. Условия второго порядка в вариационном исчислении + Li(t,x(t,А(т,$)),х(<,А(т,$)))£д(<,А(т,£))Аг(т,£)^ dt = b(r,f,u) + т т т 4~ {Lx^x^T 4* LiXxXT) dt = L{t, tt) 4~ Lxx\Xf dt 4- Lx dxxX? ~ T = £(т,£,а)4-Дьа?лАт|е 4- J (j~Li + Lx)xxXTdt = t* (71W L (т, С u(r, 0) - Lx (r, £, u(t, £)) u(t9 0- При выводе мы воспользовались тем, что функции ж(-, Л) — экстремали, т. е. удовлетворяют уравнению Эйлера. Формула для dS/d£ выводится аналогично. Дифференцируя по £, получим т т т — J*(LxxxX^ 4“ LiXxX$) dt = J* LxxxX% dt 4- J* L± dxxX^ = t, t, t = £^1^ +1 ^-^Li + L^x^dt^L^T.C^T,^). t* Таким образом, имеет место следующая формула для дифференциала функции S: t ч dS dS dS<T^) = ^dT^ — ^ = = {L{r,i,u(T,i))-Li (T,i,u(T,i))u(T,i)}dT^Li(T,i,u(r,(})di. Основная формула Вейерштрасса В частности, для функции х € формула для диффе- ренциала функции S примет вид: dS(t,x(t)) = (ь(£,ж(£),и(£,я(£))) - L±(t9x(t)9u(t9x(t)))u{t9x(t))^ dt + 4- Li (t, x(t), u(t9 ®(0)) dx(t) = = Б(^,ш(0,?д(^,®(0)) Li(t9x(t)9u(t9x(t))) (x(t) - u(f,x(t))) dt, (1)
x(t), u(t, x(t)), x(t)) dt. Л-'* kv § 1. Простейшая задача вариационного исчисления 303 В таком виде мы ей и будем пользоваться в дальнейшем. Отметим также, что, поскольку u(t,x(t)) — x(i), то dS(t,x(t)) = L(t)dt. (2) Поэтому для допустимой экстремали £(•) и для допустимой функции ж(-) имеем равенство i| if ti J(&) = У = У dS(t,£(t)) = S(ti,xl)-S(t0,x0) = J dS(t,x(t)). to io «0 Следовательно, по формуле (1) ti i| J(x) - J(x) = JL(t,x(t),x(t)) dt - J dS(t,x(t)) = io io ii ,®(0,i(t)) - L(t,x(t),u(t,x(t))) - Li(t,x(t),u(t,x(t)))x i0 ij x (x(t) - u(t, ®(t)))) dt = i0 Эту формулу называют основной формулой Вейерштрасса, 1.4.7. Достаточные условия слабого экстремума Теорема 3. Пусть функция х Е C2([^o,^],Rn) — допустимая экстре- маль в задаче (Р), интегрант L трижды непрерывно дифференцируем в некоторой окрестности расширенного графика (L Е на & выполнены усиленные условия Лежандра и Якоби, Тогда х доставляет слабый локальный минимум (х Е wlocminP) [АТФ, с. 377]. 1.4.8. Достаточные условия сильного экстремума Теорема 4. Пусть функция я Е C2([$o,M>R") — допустимая экстре- маль в задаче (Р), интегрант L ЕС3 (V х R”), где V С Rn+I — некоторая окрестность графика Г$, на х выполнены усиленные условия Лежандра и Якоби, интегрант L является выпуклым по х на V. Тогда х доставляет сильный локальный минимум (х Е strlocminP). Доказательство. Условия теоремы позволяют (см. п. 1.4.5) окру- жить £ центральным полем экстремалей ш(*,А), покрывающим некото- рую окрестность U С V графика Г&. Пусть х Е PC^Ro^i]) — произ- вольная допустимая функция, график Гх которой расположен в этой
304 Глава 5. Условия второго порядка в вариационном исчислении окрестности. Тогда по основной формуле Вейерштрасса п. 1.4.6 /(я)-/(£)== fE(t,x(t),u(t,x{t)),x(t))dt. <о Из выпуклости интегранта следует (см. п. 1.3), что если точка (t,x) Е U, то £(t,x,u,x) 0 для любых (и,х) Е Rn х Rn. Таким образом, J E(t,x(t),u(t,x(t)),x(t))dt 0 ^0 и, значит, J(x) J(&), т.е. функция f доставляет сильный минимум. 1.4.9. Квадратичный функционал Рассмотрим задачу простейшую задачу вариационного исчисления с квадратичным функционалом для вектор-функций ж(-) = (®1(-),...,жп(-)) ii j(x(-)) = J({Ах,х} 4- 2{Сх,х) + (Bx,x})dt -* inf; io ж(^о) “ «^0» ®(^|) = на слабый и сильный экстремум. Здесь A(t),B(t), C(t) — матрицы поряд- ка п х п, А,В — симметричные матрицы2^. Теорема 5. Пусть в задаче (Р') матрицы А и С непрерывно диф- ференцируемы, а В непрерывна; выполнено усиленное условие Лежандра. Тогда, если выполнено усиленное условие Якоби, то допустимая экстремаль существует, единственна и доставляет абсолютный минимум. Если же не выполнено условие Якоби, то значение задачи равно -оо (Sabsmin = -оо). Заметим, что по лемме о скруглении углов абсолютный минимум и сильный, и слабый совпадают. Квадратичную относительно 2п-мерного вектора h = (х,у) (х € Rn,y € Rn) форму на пространстве R2n можно представить через симметрическую .матрицу М размера 2п х 2п в виде Q(h) = Тогда матрицу М можно записать в вице М = С В ) ’ гдс матРицы и в являются симметрическими, а матрица С не обязана быть симметрической. Значит, квадратичная форма запишется в виде Q(h) = Q((x, у), (х, у)) = £ Св ) ( * ) , (х, у)^ = (Ах, х) + (С*у, х) + (Сх, у) + (By, у) = (Ах, х} + 2(Сх, у) + (By, у}.
§ 1. Простейшая задача вариационного исчисления 305 Доказательство. Отметим вначале, что для квадратичных функцио- налов имеет место равенство + Л) = J(4) 4- j'(±)[Л] 4- ft]. Если х — допустимая экстремаль в задаче, то J* (х)[Л] = 0 УЛ е Со ([Wi ]) (это соотношение, как было доказано ранее, эквивалентно уравнению Эйлера). Поскольку для квадратичных функционалов = то на экстремали f выполняется соотношение J(& + h) = J(£) + J(h) Vft 6 Софо,*!])- (*) Предположим, выполнено усиленное условие Якоби. Докажем существо- вание допустимой экстремали и ее единственность. Обозначим H(t,to), Я(М1) — матричные решения уравнения Эйлера (совпадающего для квадратичной задачи с уравнением Якоби), удовлетворяющие крае- вым условиям = 0, H(to,tQ) = 7, H{t\9t]) = 0, = I. Из усиленного условия Якоби вытекает, что матрицы H(t,to) и невырождены для t € (tfo^i] и fo, t]) соответственно. Положим Яо(О = Тогда Яо(М = А -Hb(^i) = 0, Я1(^о) = О, Я1(^) = 7, и, значит, &(t) = Hv(t)xQ + H\(t)x\ — допустимая экстремаль в задаче (Р'). Эта экстре- маль единственна, поскольку если бы существовала другая допустимая экстремаль х, то функция h = £ - х была бы нетривиальным решением уравнения Якоби с граничными условиями h(to) = h(t\) = 0, а это про- тиворечит усиленному условию Якоби. Экстремаль £ можно (см. теорему о построении центрального поля экстремалей) окружить центральным полем экстремалей, покрывающем полосу to < $ t\ с функцией наклона поля и(т,£). Возьмем произволь- ную допустимую функцию х 6 РС} ([^о, !)• Тогда по основной формуле Вейерштрасса *1 J(x)-J(x) = J £(t9x(t)9u{t9x(t))9x(t)) dt — to ii = J ^L(t9x9x) - L(t,x9u(t,x)) - {Lx[t9xiu(t,x)')9x - u(t,x)^dt ~ to
306 Глава 5. Условия второго порядка в вариационном исчислении (для квадратичной функции L(x)-L(u)-L'(u)(x-u)={(\/2)L"(u)(x-u), (*-«))) ‘1 = J (^La(t,x,u)(x - и),х-uj dt = J (A(t)(x-u),x -ц)<й>0, <0 to ибо A(t) — положительно определенная матрица по усиленному условию Лежандра. Значит, функция А € absminP'. Предположим, что не выполнено условие Якоби. Тогда функция h = 0 £ absmin Р" не доставляет абсолютный минимум в задаче J(7i(-)) = J((ЛЛ,h) 4- 2{Ch9h) + {Bh9h))dt — min; h(^o) = ft(ti) = O (если h = 0 E absminP", то по теореме о необходимых условиях слабого минимума выполнено условие Якоби). Значит, SabsminP" < 0- Поэтому существует функция h е Co(Ro,*i]) такая, что J(h) < 0. Но тогда в силу соотношения (*) J(x 4- Xh) = J(£) 4- J(Xh) = J(£) 4- X2J(h) -* -oo при A 4-OO, T.e. SabsminF = “OO. 1.5. Правило решения Для решения простейшей задачи классического вариационного ис- числения с использованием необходимых и достаточных условий экстре- мума следует: 1. Найти допустимые экстремали, т.е. допустимые функции, удовле- творяющие необходимым условиям экстремума I порядка. Для этого надо а) Выписать необходимое условие экстремума I порядка — уравнение Эйлера: d ~~т;Ъх 4- Lx = 0. at b) Найти решения этого уравнения (они называются «экстремалями»). с) Найти решения уравнения Эйлера, удовлетворяющие заданным усло- виям на концах (они называются «допустимыми экстремалями»). 2. Проверка необходимых и достаточных условий экстремума II поряд- ка. а) Проверить выполнение условия Лежандра:
f...... § 1. Простейшая задача вариационного исчисления 307 Если Li±(t) > 0 VJ 6 [Jo, J|] (выполнено условие Лежандра), то зна- чит, выполнено необходимое условие слабого (а, следовательно, и силь- ного) минимума. Если 0 VJ 6 [to,] (выполнено условие Лежандра), то зна- чит, выполнено необходимое условие слабого (а, следовательно, и силь- ного) максимума. Если же величина Z/*i(J) знакопеременна на отрезке [Jo, t\ ] (не вы- полнено условие Лежандра), то значит, не выполнено необходимое усло- вие слабого (а, следовательно, и сильного) экстремума. В этом случае найденная допустимая экстремаль не доставляет слабого, и тем более, сильного экстремума. Если Lxxify > 0 VJ Е [to,] или Lii(t) < 0 VJ € [t0,tj (выполнено усиленное условие Лежандра), то значит, выполнено необходимое усло- вие слабого и сильного минимума, соответственно максимума. В этом случае переходим к исследованию условия Якоби. Ь) Проверить выполнение условия Якоби: bi) Выписать интегрант квадратичного функционала L(t,h,h) := La(t)h\t) + 2Lxx(t)h(t)h(t) + Lxx(t)h2(t). Ьг) Выписать уравнение Якоби на экстремали А, т.е. уравнение Эйлера для интегранта L(t9h,h): d~ ~diLil + Lh = 0- и решить его с начальными данными fc(J0) = 0, h(to) = 1 Ьз) Найти сопряженные точки т, т.е. нули найденного решения h(t) уравнения Якоби при t > Jo. 64) Проверить выполнение условия Якоби: Если в интервале (Jo, Ji) нет точек, сопряженных с Jo (выполнено условие Якоби), то значит, выполнено необходимое условие слабого (а, следовательно, и сильного) экстремума. Если же в интервале (Jo, Ji) есть сопряженные точки (не выполнено условие Якоби), то значит, не выполнено необходимое условие слабого 3) Для вектор-функций z(-) = (a?i (•),..., жп(-)) ищется фундаментальная система реше- / Л](0 ... ний уравнения Якоби — матрица Я(0 = (ft’(t) ... hn(t)J = 1 .......... I \hi(0 ... с начальными условиями Я(<о) = 0 (нулевая матрица), H(tQ) -1 (единичная матрица) или det#(io) # 0- Вектор-столбцы Л*(-) = I ... I — решения системы уравнений W)/ Якоби. Сопряженными точками будут точки т — нули уравнения с!е1Я(т) = 0.
308 Глава 5. Условия второго порядка в вариационном исчислении (а, следовательно, и сильного) экстремума. В этом случае найденная допустимая экстремаль не доставляет слабого, и тем более, сильного экс- тремума. Если в полуинтервале нет точек, сопряженных с tQ (выполнено усиленное условие Якоби), то значит, выполнено достаточное условие слабого экстремума. Следовательно (напомним, что уже выполнено усиленное условие Лежандра), найденная экстремаль доставляет слабый локальный минимум (если La(t) > 0 Vt 6 [£о,t J) или максимум (если L±*(t) < 0 V*€[Mi]). Проверка на сильный экстремум. с) Если интегрант L является выпуклым по х при всех фиксированных t и х9 рассматриваемых в качестве параметра, то £ доставляет сильный минимум в задаче. Аналогично, если интегрант L является вогнутым по ж, то £ доставляет сильный максимум в задаче. d) Если интегрант L не является ни выпуклым, ни вогнутым, то следует проверить выполнение необходимого условия сильного экстрему- ма — условия Вейерштрасса: ^,^,^,u) = £(^,^,t4)-£(f,^,f)-Zi(0(u-^)^0 VueR, WG[Wil в задаче на минимум (£ 0 в задаче на максимум). Если не выполнено условие Вейерштрасса, то в этом случае найден- ная допустимая экстремаль не доставляет сильного экстремума. 1.6. Примеры Пример 1. Исследуем с помощью условий второго порядка задачу, рассмотренную нами в п. 1.2: 1 j(a?(.)) = J х3 dt —► inf; л(0) = 0, s(l) = 1. о Мы выяснили ранее, что имеется единственная допустимая экстремаль £ = t, доставляющая слабый локальный минимум в задаче и не доста- вляющая сильного. При этом нами была построена последовательность допустимых (в задаче на сильный экстремум) функций хп G РС’фоЛИ)» шп(*) -» £(•) в СфоЛ1]), для которой J(a?n(-)) -* -оо при п -* оо. Поскольку Lii(t) = 6£(t) = 6 > 0 Vt € [0,1], то выполняется усилен- ное условие Лежандра. Выпишем уравнение Якоби, которое является уравнением Эйлера по h at
§ 1. Простейшая задача вариационного исчисления 309 для интегранта L = Lah2 + 2Lixhh + Lxxh2 = 6h2: d • *• - — 12ft = 0 <=!> ft = 0. dt Общее решение уравнения Якоби: h = Сit -Ь Cj. Начальным условиям Л(0) = 0, А(0) = 1, удовлетворяет функция h(t) = t. Эта функция не имеет нулей в полуинтервале (0,1]. Значит, сопряженных точек нет, и стало быть выполнено усиленное условие Якоби. По теореме 3 выполнено достаточное условие слабого локального минимума, значит А Е wlocmin. Поскольку функция L = х3 не выпукла по ж, то достаточное условие сильного минимума не выполняется. Проверим необходимое условие сильного минимума — условие Вейерштрасса: £(t, х, и) = L(t, Ь, и) - L(t, £, £) - Lx(t)(u - й) = = и3 - х - ЗА2(и - Я) = и3 - 1 - 3(и - 1) > 0 (?) V«GR, Vie [0,1]. Оно не выполняется. Так как не выполняется необходимое условие, то функция х не доставляет сильного локального минимума. Ответ. Единственная допустимая экстремаль х = t € wlocmin, и х £ strlocmin, Smin — -oo. Пример 2, Исследуем с помощью условий второго порядка задачу, рассмотренную нами в главе 3 п. 1.6 (пример 2): Зтг/2 J(x(-)) = J (х2 - x2)dt —► inf; ш(0) = о Уравнение Эйлера: х + х = 0. Мы выяснили ранее, что имеется единственная допустимая экс- тремаль ж — 0, не доставляющая даже слабого локального минимума в задаче. При этом нами была построена последовательность допусти- 1 2t мых функций xn(t) = - sin—, хп() £(•) в ^([0,1]), для которых п 3 •7(жп(*)) < о= •Л^(’))- Поскольку Lxx(t) = 2 > 0 We [0, Зтг/2], то выполняется усиленное условие Лежандра. Выпишем уравнение Якоби, которое является уравнением Эйлера по h -±Lh(t) + Lh(t) = O at для интегранта L = Lah2 -Ь 2Lxxhh + Lxxh2 = 2h2 - 2h2: /i, 4- Jz, = 0 <=> /i = Cisin£ + C2COst
310 Глава 5. Условия второго порядка в вариационном исчислении Начальным условиям Л(0)=0, А(0) = 1, удовлетворяет функция h(t) = sint Эта функция в интервале (0, Зтг/2) обращается в ноль в точке т = тг. Таким образом, в интервале (0, Зтг/2) имеется сопряженная точка, и ста- ло быть не выполнено необходимое условие Якоби слабого локального минимума, значит допустимая экстремаль £(*) не доставляет в задаче слабый минимум, и тем более не доставляет сильный минимум. Если воспользоваться теоремой 5 о необходимых и достаточных условиях экстремума в простейшей задаче вариационного исчисления с квадратичным функционалом, то из того, что не выполнено условие Якоби, будет следовать, что абсолютный минимум в задача равен -оо. Уравнение Эйлера совпало с уравнением Якоби. Это не случайно. Так бывает, если интегрант исходной задачи является квадратичной функцией от я, ж. Ответ. Единственная допустимая экстремаль £ = 0 £ wlocmin, и тем более х & strlocmin, Smin = -оо. Пример 3 (простейшая векторная задача вариационного исчисления, в которой допустимая экстремаль единственна и доставляет сильный экстремум). 1 7(ж()) = ^(ж1( )»ж2(-)) ~ У(Я1 +^2 + 2ж]Ж2)сй inf; о ®!(0) = 0, ж2(0) = 0, X|(l) = sinl, s2(l) = -sinl. Условие экстремума I порядка — система уравнений Эйлера'. Pl = *2, (4) _ S .. »Ь« — Л J. [ж2 = ЖЬ 1 Последнему дифференциальному уравнению 4-ого порядка соответствует характеристическое уравнение к4 = 1. Его корни fcjj2 = ±1, Л?з,4 = Поэтому общее решение дифференциального уравнения Ж| = C|Sh£ 4- С2 ch^-ЬСз sinf-bC4 cost Тогда ж2 = = С\ sh^-bC2ch^-C3sin^-C4CosL Начальные условия: ( 31(0) = С2 + С4 = 0 Г ®1 = С, sh« + c3sint ( ®2(0) = С2 - С4 = 0, 2 4 ( х2 = С\ sh t - С3 sin t, Г Ж1(1) = Cj sh 1 + С3 sin 1 = sin 1, _ = { ®2(1) = Ci shl - C3sinl = -sin 1, 1 ’ 3 Единственная допустимая экстремаль xt = sinf, £2 = -sint. Условия экстремума П порядка. Условие Лежандра. La = ( ^х'х' -Х|Х2 ) = ( л э ) • X LХ}Х\ / X / Эта матрица положительно определена, следовательно, выполняется усиленное условие Лежандра.
§ 1. Простейшая задача вариационного исчисления 311 Условие Якоби, г. — I LX\xx nxx — l о X ^2®1 T __ f Д&!®! nxx — I X *JX2X\ ^Х\Х\ ^Х\Х2 I ___ “r T T I ~ x±i UX2X] J^X2X2 / О О О О О 2 2 О ^Л|®2 ^Х2Х2 1^Х2Х2 Квадратичный интегрант Z(*, h9 h) = {Lixh, h) + 2(Lxih9 h) + (Lxxh9 h) = = 2h] + 2hl + 4/^2 = 2L(t, h9 h). Отметим, что для квадратичного функционала всегда L = 2L. Система уравнений Якоби (система уравнений Эйлера для квадра- тичного интегранта L): /Я.=*2.^4Г>=Л„ Ищем фундаментальную систему решений уравнения Яко(5и — матрицу Я(0 = = f такую, что Я(0) = 0 (нулевая ма- \М0 h2(t)/ трица), Я(0) = I (единичная матрица). Для вектооа h'(t}= (= ( С| sht + C2chf + C3sint+ C4cost\ \hl2(t)) \C|Shi4-C2chi-C3sinf-C4COsf/’ Cj ch t 4- C2 sh t 4- C3 cos t - C4 sin t \ _ , ± Л , должны выполняться гра- CicM4-C2sh*-C3cos£ 4-C4sinf) ничные условия 'л!(о) = с2+с'4 = о, ^(0) = С2-С4 = 0 _ _ _ 1 ft}(0) = CI + C’3 = l, 2 . Л'(0) = Сх - Сз = О, (sht+sini \ / shf-sinf \ shi-sin» ) • Аналогично находим: Л2(0 = I sh(+\in< ]. Сопряженные точки являются корнями уравнения shr - sinr \ 2 . I =0 <=> shr + sinr I 2 / Л1 / shr 4- sinr 2 shr - sinr 2 det Я(т) = 0 <=> det
312 Глава 5. Условия второго порядка в вариационном исчислении <=> (shr-Fsinr)2 - (shr-sinr)2 = 0 <=> <=> shrsin7 = 0 т = kir, к Е N. На полуинтервале (0,1] нет сопряженных точек, следовательно, вы- полняется усиленное условие Якоби. По теореме 3 п. 1.4.6 вектор ж = (£i,£2) = (sin£,-sin0 € wlocmin. Условие Вейерштрасса — необходимое условие сильного минимума — выполняется: f,и) := L(t,и) -L(t,Л,f= = и\ + и22 + 2i& 2£,£2 - ( № ) , " Д1 ) \ = \ \ 2х2 / \ и2 - х2 / / = и2 + и2 + 2£|£j —~ ~ 2£i<82 — 2^i(ui — 4|) — 2&2(^и,2 ~ ^2) = = (и|-Л|)24-(«2-42)2^0 V(«i,u2)€R2, Vt G [0,1]. Выпуклость интегранта по х. Функция L(t,x,i) = x2 + х2 + 2х\х2 выпукла по гс, так как Ьц — положительно определенная матрица для любых (t9x) ER3. По теореме 4 п. 1.4.7 вектор & == (£|, ж2) 6 striocmin. (Отметим, что из условия выпуклости интегранта L по х следует выпол- нение условия Вейерштрасса.) Если воспользоваться теоремой 5 п. 1.4.8 для квадратичных функцио- налов, то можно было бы, проверив усиленные условия Лежандра и Вей- ерштрасса, сразу сказать, что £ = (£|,£2) Е absmin (и слабый, и сильный). 1 । Sabsmin = J(£) = У (2 cos2t - 2 sin21) dt - 2 J cos 2t dt = sin 2^ = sin 2. о о Ответ. Единственная допустимая экстремаль (sinJ,-sin£) E absmin, ‘S'min = Sin 2. 1.7. Задачи Найти экстремали и исследовать их на слабый и сильный экстремум. %/4 1.1. J(4я2 - i2) dt extr; ж(0) = 1, ® = °- о г/4 1.2. J(х2 - 4ж2) dt -♦ extr; х(О) = 0, = 1« о
fi*' § 1. Простейшая задача вариационного исчисления 313 Зтг/4 1.3. J (х2 - 4я2) dt —► extr; ж(0) = О, = ~1- о */2 1.4. J(2х 4- х2 - х2) dt —> extr; ж(0) — ж(у) = О. о Зэг/2 1.5. J (х2 -х2 - 2х) dt -> extr; z(O) = = о %/2 1.6. J(х2 - х2 -tx)dt —» extr; ж(О) = — О. о %/2 1.7. J(х2 - х2 4- 4х sh£) dt -+ extr; я(О) = у) = О* о То 1.8. J(х2 - х2 -Ь 4х shtf) dt —> extr; ж(0) = 0, x(Tq) = £. о 1Г/2 1.9. J(6®sin2t -Ь х2 - х2) dt —> extr; х(0) = ж(у) = о То 1.10. J(х2 - х2 - вх sin2£) dt —> extr; ж(0) — 0, x(Tq) = о %/2 1.11. J(4xsint 4» х2 - x2)dt —► extr; ж(0) = = 0. о 3JT/2 1.12. J (х2 -х2 - 4xsint)dt -* extr; z(0) = ~ °- о %/2 1.13. I (х2 - х2 -b4®cos0d^ —> extr; ш(0) = — О- о
314 1.14. 1.15. 1.16. 1.17. 1.18. 1.19. 1.20. 1.21. 1.22. 1.23. 1.24. 1.25. Глава 5. Условия второго порядка в вариационном исчислении %/2 J (х2 - х2 + 4® cos t) dt —> extr; ж(0) = 0, x (= — • о 3x/2 J (x2 “ x2 4- 4xcost) dt extr; «(0) = 0, . о To J(x2 - x2 + 4x cos t) dt —> extr; ®(0) = 0, x(Tq) = о To J(x2 - x2 - 4x sini) dt -* extr; x(O) = 0, x(Tq) = о i J(x2 -Ь Зж2)е2< dt extr; ®(0) = 1, ж(1) = e. о i У (x2 - x2)e2i dt —> extr; ж(0) = 0, ж(1) = e. о To У (x2 - x2)e2t dt —> extr; a?(0) = 0, ж(Т0) = 6 о i J sinxdt —► extr; ж(0) = 0, ж(1) — о i У cos ж (ft -* extr; ж(0) = 0, ж(1) = тг. о To У sin x dt -► extr; ®(0) = 0, ж(То) = 6 о To У cosxdt -* extr; ж(0) = 0, a?(2o) = о To У xex dt extr; ®(0) = 0, x(Tq) = о
315 § 1. Простейшая задача вариационного исчисления 1.26. х2ех dt —► extr; ж(0) = 0, ж(1) = 2. о 1.27. J(ж3 4- 4ж2) dt —> extr; ж(0) = 0, ж(1) = -1. о То 1.28. J ж3 dt -* extr; ж(О) = О, x(Tq) = £. о То 1.29. J(ж3 - ж2) dt extr; ж(О) = О, ж(Т0) = 6 о То 1.30. J(ж3 + ж2) dt —> extr; ж(0) = 0, ж (То) = £• о 3/2 1.31. J(ж3 4- 2ж) dt -* extr; ж(0) = 0, ж(|) = 1. о То 1.32. J(ж5 4- 5ж) dt -> extr; ж(0) = 0, ж(Т0) = С о 1 1.33. J(1 - ж2)2 dt -> extr; ж(0) = 0, ж(1) = о То 1.34. У (ж2 - жж3) dt —► extr; ж(0) = 0, ж(Т0) = О о (исследовать допустимую экстремаль f (t) = 0). । 1.35. J(ж2 - 4жж3 + 2£ж4) dt —> extr; ж(0) = ж(1) = О о (исследовать допустимую экстремаль £(t) = 0).
316 Глава 5. Условия второго порядка в вариационном исчислении § 2. Задача Больца Рассмотрим задачу Больца (для определенности задачу на минимум) для вектор-функций ®() = (a:i «I В(®(-)) = J L(t,x(t),x(t))dt + l(x(to),x(t\)) —> min. (Р) *0 2.1. Сильный и слабый экстремум Напомним, что функция я Е С1 ([t0, tiL Rn) доставляет слабый ло- кальный минимум в задаче (Р) (£ Е wlocminP), если она доставляет локальный минимум в пространстве Cl([to,tJ,Rn), т.е. если существует б > 0 такое, что В(х) > B(f) для любой функции х Е C^Qto, t|J), Для которой ||«0 -®(*)lh([WiLR") < 6- Наряду со слабым экстремумом в задаче Больца как и в простей- шей задаче классического вариационного исчисления рассматривается понятие сильного экстремума. Функция ж Е PC’Qto^tiLR”) доставляет сильный локальный минимум (ж Е strlocminP), если она доставляет ло- кальный минимум в пространстве C([to,t|],Rft), т.е. если существует б > 0 такое, что В(х) В(£) для любой функции х Е PC,l([to,^i], Rn), для которой Цж(-) - a(-)||c(lW1],r«) < б. Так как множество функций, среди которых доставляется силь- ный экстремум, шире, чем для слабого экстремума, то если функция ж Е С1 ([to, ti],Rn) доставляет сильный, то она доставляет и слабый экс- тремум. Поэтому для функций £ Е С1 ([to, t|], Rn) необходимое условие слабого экстремума является необходимым условием сильного, а до- статочное условие сильного экстремума является достаточным условием слабого. В этом разделе будут сформулированы и доказаны необходимые и достаточные условия слабого и сильного экстремума в задаче Больца, а также рассмотрена задача Больца с квадратичным функционалом. Доказательства условий II порядка в задаче Больца во многом аналогичны доказательствам условий II порядка в простейшей задаче классического вариационного исчисления. Поэтому они будут проведены более кратко. 2.2. Условия экстремума II порядка 2.2.1. Необходимые условия слабого экстремума Теорема. Пусть функция & Е C2([to,t|],Rn) доставляет слабый ло- кальный минимум в задаче (Р) Е wlocminP), интегрант L трижды не- прерывно дифференцируем в некоторой окрестности расширенного графика
§ 2. Задача Больца 317 (L 6 С3(О(ГА^))). терминант I дважды непрерывно дифференцируем в точке (x(to).x{t\)). Тогда на х выполняются а) уравнение Эйлера'. d- -TLi(t) + Lx(t) = Q WGRo,M at и условия трансверсальности'. ^х(^о) = £r(i0), Ml) = Ь) условие Лежандра'. Lxx(t) >0 VJ 6 [Jo, tj; с) если на x выполнено усиленное условие Лежандра, то выполняется и условие Якоби'. d) если выполняются усиленное условие Лежандра и усиленное условие Яко- би. то для любого вектора (До, h\) € R2n решение уравнения Якоби Д(-) с краевыми условиями h(tQ) = h0, h(ti) = h\. существует, единственно и (P + Q)(h)>0, где Л . Л |*i P(/i) {Lxxh 4- Txxh. h) » I io Q(h) '.= Q(hQ,hi) := l"(f0,^i)[(^o,M, (hQ.h})]. xo;=x(to), x{:=x(ti). Доказательство. Необходимость а) была установлена нами ранее в главе 3 п. 2.2. Далее очевидно, что если х доставляет слабый ло- кальный минимум в задаче (Р), то функция х доставляет слабый локальный минимум в простейшей задаче вариационного исчисления: JL(t.x.x)dt —> min; x(Iq) = £q. x(ti) = &i, <0 и, значит, в соответствии с теоремой 2 из п. 1.4.5 выполнены условия Ь)-с). Докажем утверждение d). Покажем вначале, что решение уравнения Якоби с краевыми условиями Ji(to) = hQ. h(ti) = hi. существует и един- ственно. Докажем существование. Из усиленного условия Лежандра (Lxx(t) > 0 VJ 6 [^o»^i]) вытекает, что матрица Lxi положительно определена и, значит, невырождена и обратима. Поэтому уравнение Якоби ““ (L&xh 4- Lxxh) 4~ Lxxh 4- Lxxh = 0 < > Lxx(t)h 4- A(t)h 4- C(t)h = 0 представляет собой систему из п дифференциальных уравнений второго порядка с непрерывными коэффициентами, которую в силу обратимо- сти матрицы Lxx можно разрешить относительно старших производных.
318 Глава 5. Условия второго порядка в вариационном исчислении По известной из теории дифференциальных уравнений теореме существо- вания и единственности (см., например, АТФ стр. 191) существуют фунда- ментальные матрицы решений уравнения Якоби H(t9 tQ) и H(t9 0 с крае- выми условиями H(to,tQ) = 0, Я(^о,М = Z, и H(t\9t\) = 0, = I. Из усиленного условия Якоби (на полуинтервале (£0,М нет сопряжен- ных точек) вытекает, что матрицы H(t9to) и H(t9ti) невырождены для t 6 (to,0 и [to,0 соответственно. Положим Но(О == Н(М1)Н-1(*о,0 и Ht(t) = Тогда Я0(М = Л Яо(0 = 0, = 0, H\(t\) = Z, и, значит, функция Л(£;Ло,Л1) = HQ(t)hQ 4- H\(t)hi является решением уравнения Якоби с краевыми условиями h(tQ'9hQ9hi) = Ло, h{t ।, ho, Л> ।) — h \. Докажем единственность. Действительно, предположим, что суще- ствует другое решение уравнения Якоби h( ) с теми же краевыми усло- виями. Тогда функция h(-) = Л(;^о,^|) - Л0 является нетривиальным решением уравнения Якоби с граничными условиями h(to) = h(t\) = 0 и, следовательно, t\ — точка сопряженная с to, а это противоречит усиленному условию Якоби. Поскольку ж 6 wlocminВ, то по необходимому условию II порядка локального минимума функционала В ti B"(£)[h, h] = j ({Lah, h} + 2(Lxih, h) + (Lxxh, h))dt + to + l"(£0,£l)[(h0,hi),(h0,hl)]=K(h) + Q(h) > 0 Vfe e C'([t0)M) (h0 h(t0), Л, := h(tf)). (*) Пусть далее h{) — решение уравнения Якоби с краевыми условиями Л(0 = Ло, hfa) = hj. Тогда K(h) = J*{Lxxh Lxxhydh} 4“ {ttxxh'VLxxh9h) dt = to to ii dt = to ti Л) tjxxh-У L xxh, dt 4- {La h+txxh> h}^ — P(h) to (в последнем интеграле подынтегральное выражение равно 0, так как функция h удовлетворяет уравнению Якоби). Подставляя в неравен- ство (*) вместо K(h) равное ему P(h), получим, что (Р 4- Q)(h) 0.
§ 2. Задача Больца 319 Замечание. Если в определение оператора Р подставить вместо h построенное при доказательстве теоремы решение уравнения Якоби то получим, что Р(Л) = (£4И0(Яо(ОЛо+Я1(0Л1) +^(О(Яо(ОЛо + Я|(0Л|), ЯофЛо + ЖОл,)^ = (£44(е|)(яоа1)Ло+Я1(«|)Л|) +^4«а|)Л|,Л1) - - (М*о)(Яо(*о)Ло +Я,(МЛ|) + Wo)fto,M = Р(Ло,Л1). Значит, Р также как и Q является квадратичной формой. 2.2.2. Достаточные условия сильного экстремума Теорема. Пусть функция х Е С2([$о, t\], Rn) — допустимая экстремаль в задаче (Р), интегрант L Е C3(V х Rn), где V С Rn+l — некоторая окрестность графика, терминант I дважды непрерывно дифференцируем в точке (£(to)>$(ti))» ня $ выполнены усиленные условия Лежандра и Якоби, интегрант L является выпуклым по х на V, квадратичная форма P + Q (см. п. 2.2.1) положительно определена. Тогда & доставляет сильный локальный минимум в задаче (Р) (£ Е strlocminP). Доказательство. Обозначим £0 •= ж(£0)> &\ •= По теоре- ме существования и непрерывной зависимости решения от начальных данных для любого е > 0 существует б = б(е) > 0 такое, что для любой точки (a?o,®i) 6 В((#о,#1),^) существует единственное решение уравнения Эйлера х(--,х$,х\) с начальными условиями x(Iq,xq,x\) — х0, я(£1;яо,Я|) =®i и ||ж(-; ж0, х\) - При этом не ограни- чивая общности, будем считать, что б е. Возьмем произвольную функцию х Е PC^Qto^i]) (жо •= ж(*о)> := ж(*1)), для которой ||ж(-) - #(-)llc([Wil) < Тогда точка (жо,®1) € В((#о,#1),6) и для нее, как было сказано выше, существует решение уравнения Эйлера x(-;xq,xi) с начальными условиями ш(^о;жо,®1) = x(ti;xQ,Xi) = xi и ||ж(-;жо,®1)-^(Ollc’dMd) <е Окружим экстремаль x(*;xQ,x\) центральным полем экстремалей (см. п. 1.4.5). Это можно сделать, так как из условия выполнения усиленных условий Лежандра и Якоби на экстремали А усиленные условия Лежандра и Якоби в силу условий гладкости будут выполнены и в некоторой окрестности расширенного графика . Тогда В(®(-)) = J(a:(-)) + l(x(io).®(i|)) = J(®(-)) “ J(®(;®o.®i)) + + J(x(;xo,xi)) + l(xo,xi) = J(®()) - ®o,®i)) + Ф(®о,®|), где Ф(®о,®|) := J(®(-;®o>®i)) + i(®o,®i) =
320 Глава 5. Условия второго порадка в вариационном исчислении ti to — функция двух переменных xq и х^. Из построения следует, что ||®0 - ®(-;®o,®i)llc([w,|) = 11®О “ *() + *() ~ ®о,®1)Нс Н«0 - *(-)Нс + PC) - ®(-;®о,®1)||с < 6 + е 2е. В п. 1.4.7 было показано, что по основной формуле Вейерштрасса для экстремали я(-;жо,®1) и функции ш(-) близких в метрике пространства Сфо,t\] в силу выпуклости интегрант L является выпуклым по х *i J(x(-))-J(x(-;x0,xl)) = jEdt^O. to Покажем, что функция Ф(«о>®|) имеет локальный минимум в точке (жо,#|), т.е., что Ф(®о,»1)>Ф(^о,^) = В(^)). Тем самым теорема будет доказана. Найдем первую производную функции Ф(ж0,®1). При доказательстве необходимых условий экстремума I порядка в задаче Больца (1л. 3 п. 2.2) было найдено, что ti В'(®(-))[Л(-)1 = f (Lji + L*h)dt + lx,h(ti) + M(*o) = «1 = У (-^Ьх + ^)лл + ^(<|)л(«|)-^(«о)л(М + ^л(^) + ^л(М <0 va 6 c'awii). На экстремали я(-, xq, aj выражение под знаком интеграла тождественно равно нулю, следовательно, Из полученной формулы для В'(х(-, х0,х\))[Л(-)] следует, что на экс- тремали х(-,хо,®|)) производная В'(х(-,®о,®i))[A(’)] как Функционал от Л( ) зависит только от h(to),h(ti) — значений функции Л(-) в точках t0,t|. На допустимой экстремали £ выражения в скобках обращаются
.... §2. Задача Больца 321 в ноль в силу условий трансверсальности, поэтому в'(а())[л()] = о УЛес'фо.М) Ф'($о,£1) = B'(a:(-;Ao,^i)) = В'(£(-)) = 0. Выпишем вторую производную функционала Больца: В"(£(-))[Л(-), Л0] = f ({Liih, h} + 2{lxih, h) + (txxh, h}) dt 4- *0 + <и,л(М,л(*|)} +2(UWW) + v/i e c'Qfo.M)- При доказательстве необходимых условий слабого экстремума II порядка в задаче Больца в предыдущей теореме было доказано, что существует единственное решение уравнения Якоби Д(-) = /ь(*;йо,М с краевыми условиями h(to) = Ло, h(t\) = h\ и дано его представление. Тогда Ф''(4о^|)[(Ло,Л1),(Ло,Л|)] = В"(®(-;жо,ж1))[Л(-;ЛоЛ|),Л(-;ЛоЛ|)] = tl = j ({Lxxh,h) 4- (ДсаЛ>М + {Lxxh.h} 4- (Lxxh,h)} dt-]- i° + (^г1а:|Л’1,Л1)-ь2(/а;|ХоЛо>Л’1) + (ixoxohQ,hQ) = J{Lxxh + Lxxh,dh) 4- *0 ii 4-{i'xx^'^~ijxxh,h)dt-]-Q(hQ,h\) = (Lxxh-]-Lxxh,h)^ 4- io T 4- j xxh-]rLxxlij 4-Lxxh-]-Lxxh,h^dt + Q(hQ,h\) — (P-hQ)(/&o,foi) to (функция Л( ;ЛоЛ1) удовлетворяет уравнению Якоби, поэтому выра- жение под знаком интеграла тождественно равно нулю). Вследствие положительной определенности Р -h Q по достаточному условию мини- мума функции нескольких переменных (ш0,Ж|) е locmin Ф. Значит, если точка (жо,Е1) лежит в малой окрестности точки (zo,#i), то Ф(х0,Х|) >Ф(£о,^0=5(0- Таким образом, если ||ш(-)-aOllcaWiLR") < то ^(ш) и> значит, функция х 6 strlocminP.
322 Глава 5. Условия второго порядка в вариационном исчислении 2.2.3. Квадратичный функционал Рассмотрим задачу Больца с квадратичным функционалом для век- тор-функций з(-) = (®i (•),... ,зп(-)) В(з()) = /({Ах, х) + 2(Сз^з) + {Вх, 3)J dt + L(t, х, х) + (a3|,3i) + 2(73|,3р) + (/Ззо,зо) + <а,Д?1> 4- (Mo) -> min, {Р') /(30,3i) на слабый и сильный экстремум. Здесь з0 = з(£0), х\ = з(0, 4(2), B(t), С(0, а, /3,7 — матрицы порядка п х п, 4,В,а,/3 — симметричные ма- трицы, векторы a,b Е Rn. Для квадратичного функционала матрицы Р и Q, введенные в п. 2.2.1, примут вид: (?(ЛоЛ1):=г"(*о,«1)[(ЛоЛ1),(ЛоЛ1)] = 2(аЛ|>Л|)+4(7Л1Ло) + 2^Ло,Ло>, Р(Л0, Л|) := {Lah+Lixh, h) | *‘ = 2{Ah + Ch,h) |*' = 2< Л (£,) (Яо(< 1)Ло + +Я («! )Л|) + C(ti )Л| ,Л|) - 2( A(t0) (Яо(<о)Ло+Я| (*о)Л|) + С(«0)Ло,Ло), где h{t) Ho{t)hQ+Я] (t)h\, Яо, Hi — решения уравнения Якоби с крае- выми условиями, Яо(М = ^, HQ(t\) = 0, Bi(£o) = O, Я1(^) = 1, ^о-=^о), Xi £(^1). Теорема. Пусть в задаче {Р') матрицы А и С непрерывно дифферен- цируемы, а В непрерывная выполнено усиленное условие Лежандра. Тогда, если выполнено усиленное условие Якоби, матрица Р + Q неотрицательно определена и существует допустимая экстремаль, то она доставляет абсолютный минимум. Если же не выполнено условие Якоби или выполнено усиленное условие Якоби, а матрица Р + Q не является неотрицательно определенной, то значение задачи равно -00 (Sabsmin = -00). Доказательство. Пусть выполнено усиленное условие Якоби. Возь- мем произвольную функцию з Е С’фо,^])- Обозначим зо := з(£о), з1 := x(t\). Как уже отмечалось при исследовании простейшей зада- чи вариационного исчисления с квадратичным функционалом (п. 1.4.8) уравнение Якоби для квадратичного функционала совпадает с уравне- нием Эйлера и при выполнении усиленного условия Якоби для любых xQ,Xi Е Rn существует и единственно решение уравнения Эйлера (Яко- би) з(;зо,31), для которого з(£о;зо,3|) = з0, x(tf,XQ,x\) = Х\. Это решение можно записать в виде з(-;зо,31) = Яо( )зо + Я|(-)з|. Действи- тельно, для него з(^0;ж0,31) = Яо(^о)^о + H](tQ)x 1 = Зо, з(^;зо,31) = Я0(^1)з0+ Я1(^)х] =3].
§ 2. Задача Больца 323 Представим функционал В в следующем виде: В(х(-)) = J(®(-)) + /(®о,®|) = 7(ж(-)) - J(x{-;x0,xi)) + + J(x( ;xo,xi)) + 1(а;о, Ж]) = J(®()) - J(®(-;®o»®i)) + Ф(®о,®|), где Ф(а:о,®1) := В(х(-;х0,Х])) = J(x(-;xo,xi)) + l(xo,xi) — функция двух переменных ®0 и ®|. В п. 1.4.8 было показано, что по основной формуле Вейерштрасса для экстремали ®(-;®о,®1) t, J(x(-)) - J(x(-;xo,Xi)) = J Cdt^O. *0 Пусть £ — допустимая экстремаль. Покажем, что функция двух пере- менных Ф(ж0»®1) имеет глобальный минимум в точке ($о,Я]) (£0 := £\ := £(£|)). В п.2.2.2 было показано, что Ф'(«о,^1)[(ЛоЛ1)1 = о Vfto./i! 6 R". Вторая производная функции Ф(®о>®1), выписанная в п. 2.2.2, в точке (&o,£i) на функции Л(-;®о»®1) := Яо()Ло + Я1()Л1 будет иметь вид: ф"(4о,*1)[(Ло, Л1), (ho, Л,)] = <£44Л + Х*гЛ,Л)|‘' +<?(Ло,Л|) = = (Р + <?)(Ло,Л|) >0. Следовательно, по Теореме 2 Гл. 1 п. 4.1 функция Ф(жо>®1) является выпуклой и ее минимум в точке является глобальным. Итак, доказано, что в точке (£0> #i) функция имеет глобальный минимум. Тогда Ф(Жо,®1)>Ф(^о,^1) = В(«(-^о,®1)) = В(^(-)) Vs0,*i ER" и, значит, В(ж(-)) > В(£()) Vx е С1 => & € strlocmin Р. Предположим теперь, что не выполнено условие Якоби или выпол- нено усиленное условие Якоби, а матрица Р + Q не является неотри- цательно определенной. Тогда функция h = 0 £ absminP" не доставляет абсолютный минимум в задаче В(Л()) = у ({Ah, Л) + 2{Ch, h) + {Bh, h}) dt + <0 + {ahi , M + 2<7hj, hQ) + {fihQ, hQ) -* min; (P") (если h = 0 G absminP", то по теореме о необходимых условиях слабого минимума выполнено условие Якоби и, если выполнено усиленное усло- вие Якоби, то матрица Р + Q является неотрицательно определенной). Значит, SabsminP" < 0- Поэтому существует функция h G С1 ([*оЛ]) такая,
324 Глава 5. Условия второго порядка в вариационном исчислении что B(ti) < 0. Но тогда B(Xh) = X2B(h) + X((a,hi) 4- {b9hQ}) —> -oo при A -► +00, T. e. SabsminF = -00. Замечание. Если в задаче (Р') терминальная часть функционала Больца не содержит линейных по Ло,^1 слагаемых и выполнено усилен- ное условие Якоби, то множество допустимых экстремалей непусто. Оно содержит функцию £ = 0. Действительно, функция £ = 0 удовлетворяет уравнению Эйлера, которое для квадратичного функционала является однородным. В условия трансверсальности j L±(tQ) = 4(<0), ( 2A(tQ)x(tQ) 4- 2C*s(M = 27х(^) 4- 2/ИМ> |W = -U), 12Л(^1)^1)4-2С^1) = -2а^0-27ММ> вместо произвольной экстремали я(-) подставим экстремаль вида ж(-; я0, Ж1) = Яо(-)&о +Я1 (•)&!: 2А(*о)(Яо(*о)&о + Я1(*о)ж1) + 2С*«о = 27Ж1 4- 2/Зж0, 24(^|)(Яо(^|)а;о + Я|(^1)а;1)4-2С*ш| =-2^ - 27*ш0. Относительно xQ и «1 получили однородную систему линейных уравне- ний, которая, как известно из линейной алгебры, всегда имеет решение, среди которых имеется решение xq = Х| = 0. Следовательно, функция ж е О будет являться допустимой экстремалью, возможно не един- ственной. 2.3. Пример 1 В(х( )) = J(х2 - ж2) dt 4- х2(0) - я2(1) 4- 4я(1) —> extr. о Условия экстремума I порядка: а) уравнение Эйлера'. d --7^4-^ = О Ё4-ж = 0 <=> х = С\ sin£ 4- Oncost dt (ж = С\ cosi - С2 sin2); b) условия трансверсальности*. ( Lx(0) = Цо), __ ( f(0) = ж(0), 1ЬД1) = -^(1), 1®(1) = ®(1)-2 fCl=C2’ =С = — [ С] cos 1 - С\ sin 1 = С\ sin 1 -h Ci cos 1 - 2 1 2 sin 1 *
§ 2. Задача Больца 325 ... „ Л sint-bcos£ Единственная допустимая экстремаль х =----------. sin 1 Условия экстремума !! порядка. Условие Лежандра, La = 2 > 0 — выполняется усиленное условие Лежандра в задаче на минимум.. Условие Якоби. Поскольку La — La — Lxx — 2, то квадратичный интегрант £ = ti±h2 + 2Lxxhh + txxh2 = 2h2 - 2h2. Уравнение Якоби (уравнение Эйлера для интегранта L) - — + Lh = 0 <=> h + h = О <=> h = Ci sin t + Cj cos i; UC Ищем решения уравнения Якоби H\(t) с краевыми условиями Яо(О) = 1, Яо(1) = О, Я,(0) = О, Я|(1) = 1. Находим, что я„(0 = ^, и,(,) = £Н| (я,(() = -^. я,«) = ^). sin 1 sin 1 \ sin 1 sin 1 / Нули функции H\(t) = — точки т = fc?r, k е N, являются sin 1 сопряженными точками. На полуинтервале (0,1] нет сопряженных точек, следовательно, выполняется усиленное условие Якоби. Квадратичная форма Р + Q (задана на R2): Р = Х44(1)(Яо(1)Ло +Я|(1)Л|)Л| - 24ДО)(Яо(О)Ло + Я1(О)Л|)Ло = 2 2 = ——hoh{ -Ь (2ctg l)h| + (2ctg 1)^о - => sin 1 sin 1 A n ( 2ctgl —2/sin 1 \ a/iu ( \ “ <-2/sinl 2ctgl )• в = <(«(0).«(1))=(0 _2J^ p , o = ( 2ctg 1 + 2 -2/sin 1 \ 4 \ -2/sin 1 2ctg 1 - 2 J ' Поскольку det = 2ctgl + 2 > 0, det4|2 = det(P + Q) = 4ctg2l - 4 - 4 = -8 < 0, то по критерию Сильвестра (см. Гл. 1, п. 1.2.3) квадра- тичная форма матрица P + Q не является неотрицательно определенной. Не выполняется необходимое условие слабого локального миниму- ма — неотрицательность квадратичной формы Р -h Q. Следовательно, £ £ wlocmin и тем более х £ strlocmin. По теореме об условиях экстремума для квадратичного функцио- нала, если выполнено усиленное условие Якоби, матрица Р + Q не является неотрицательно определенной, то значение задачи равно -оо (^absmin “ ~~ 00) •
326 Глава 5. Условия второго порядка в вариационном исчислении Покажем, что SabSmax = 4-оо. Возьмем последовательность функций xn(t) = sinirnt Тогда шп(0) = яп(1) = 0 и, следовательно, J - %п) dt = J (я2п2 cos2 irnt - sin2 irnt) dt = о 0 2 2 f 14-cos2tt?i£ = V П J 2 1 - cos 2nnt dt = 0 --2 „2 1 ТГ n — 1 Г- при п —> 4-оо. о 2 Ответы к задачам главы 5 1.1. cos2t 6 absmax, Smjn = -оо. 1.2. sin 2t 6 absmin, Smax = 4-oo. 1.3. Допустимая экстремаль sin 2t £ wlocextr (тг/2 — сопряженная точ- ка => не выполнено необходимое условие Якоби), Smin = -оо, ^тах = 4~00. 1.4. cos* -h sin£ - 1 6 absmax, Smin = -оо. 1.5. Допустимая экстремаль costf-sinf- 1 £ wlocextr (тг — сопряженная точка => не выполнено необходимое условие Якоби), Smin = -оо, «^тах ~ 4~00. тг sin t - 2t ----------G absmin, Smax - 4-oo. 4 тг sh t - sh у sin t e absmin, Smax = -boo. 1.6. 1.7. (( - shTo)sin£ 1.8. О < To < тг => допустимая экстремаль--—--------hshtf € absmin; sin To тг — сопряженная точка => при To > тг не выполнено необ- ходимое условие Якоби => допустимые экстремали £ wlocextr, Smin = -оо; То = тг => при £ = sh тг допустимая экстремаль Csintf 4- shtf G absmin VC G IR; при £ Ф shтг допустимых экстрема- лей нет и Smin = -оо; Smax = 4-оо. 1.9. sin2£ 6 absmax; Smin = -оо. 1.10. О < То < тг => допустимая экстремаль j “ 2cosT0) sint 4- sin2£ 6 absmin; тг — сопряженная точка => при То > тг не вы- полнено необходимое условие Якоби => допустимые экстремали
Ответы к задачам главы 5 V., 327 £ wlocextr, Smin — -oo; lb = тг => при £ = О допустимая экстремаль С sin t+sin 2t G absmin VC G IR; при £ / О допустимых экстремалей нет и Smin = -оо; Smax = 4-оо. 1.11. fcosf 6 absmax, Smin = -oo. 1.12. Jcostf £ wlocextr, Smm = -oo, Smax = 4-oo. 1.13. (t - sin£ G absmin, Smax = 4-oo. 1.14. tsint E absmin, Smax = 4-oo. 1.15. Допустимая экстремаль fsint £ wlocextr (тг — сопряженная точ- ка => не выполнено необходимое условие Якоби), Smin — -оо, ^max = +00. 1.16. О<То<тг=> допустимая экстремаль -То) sin$-Msin$Gabsmin; тг — сопряженная точка => при То > тг не выполнено необходимое условие Якоби => допустимые экстремали £wlocextr, Smin = -oo; То = тг => при £ = О допустимая экстремаль (t 4- С) sinf € absmin VC 6 IR? ‘Snin “ ~^Г> При £/0 Smin——00; 'Snax = 4"00. 1.17. /£ —TqcosTqX 0 < To < тг допустимая экстремаль (---—;-----1 sin t +1 cos t G \ sin To ' absmin; тг — сопряженная точка => при То > тг не выполнено необходимое условие Якоби => допустимые экстремали £ wlocextr, Smin — -оо; То — тг => при £ = -тг допустимая экстремаль Zcos£4-Csin£ G absmin VC G IR, Smin = при £ / -тг Smin = -oo; 'S'max — +00. 1.18. e* G absmin, Smax = 4-oo. 1.19. te2"4 G absmax, Smin = -oo. ££er°_* 1.20. —-— G absmin, Smax — 4-oo. To TTf 1.21. Smin — —£ absmax, Smax — 1* 1.22. TT$ G absmin, Smin — — 1» Smax 1 • £ 1.23. -ТГ 4- 2кт < — < 2&ТГ, к G Z, — G wlocmin, strlocmin To To (не выполнено необходимое условие Вейерштрасса); 2Л?тг < — < То тг 4- 2fcTr, к G Z, => & G wlocmax, strlocmax; = Л:тг, к G Z, => То требуется дополнительное исследование; Smin = -То, Smax = То.
328 1.24. 1.25. 1.26. 1.27. 1.28. 1.29. 1.30. 1.31. 1.32. Глава 5. Условия второго порядка в вариационном исчислении т £ Зт £t — + 2кт < — <--------1- 2кя, =>£ = — € wlocmin, £ strlocmin 2 То 2 То (не выполнено необходимое условие Вейерштрасса); ТГ £ тг ----h 2&тг < — < - 4- 2kir, к 6 Z, => z € wlocmax, £ strlocmax; 2 2b 2 £ тг — = —ь Астг, к 6 Z, => требуется дополнительное исследование; То 2 Smin “ ~То, Smax = То» £ £* £ — >-2=>А = — 6 wlocmin, £ strlocmin; — < -2 => £ 6 wlocmax, То То То £ strlocmax; = -2 =>£ £wlocextr, Smin = -oo, Smax = +oo. To 2t e wlocmin, Smax = +oo. - t € wlocmin, £ strlocmin, Smjn = -oo, Smax = +oo. £t £>0=>f = — € wlocmin, £ strlocmin; £ < 0 => £ 6 wlocmax, £ To strlocmax; £ = 0 => £ £ wlocextr, Smin = -oo, Smax = +oo. To ££ To f > — =>&= — € wlocmin. 4. strlocmin; £< — =>&€ wlocmax, % s 3 To 3 To strlocmax; £ — — => z £ wlocextr, Smin = -oo, Smax = +oo. To ££ To £ > —- => f = — E wlocmin, £ strlocmin; £ < - ^- => £ 6 wlocmax, 3 To 3 To £ strlocmax; £ = -у => A £ wlocextr, Smin = -oo, Smax = +<»• /2 \3/2 \3 V Wlocextr, Smin = -OO, Smax = +<». 4 5/4 4 e > -t05/4 => £ = - ~|t05/4 => -x 6 wlocmax, £ strlocmax, где константа С отыскивает- ся из граничного условия на правом конце: - (jt -р'С)5/Ч - С5^ = Id; е = ^Г05/4 => £ = ^5/4 t strlocextr; =^£ = -*«5/4 t strlocextr; |£| < ^Т05^4 => допустимых экстремалей нет, Smin = -оо, Smax ~ +00. 6 wlocmin, £ strlocmin; £ <
Ответы к задачам главы 5 329 1.33. |£| > =>£ = £t€ wlocmin, £ strlocmin; |£| < => ж 6 wlocmax, Г О, £ strlocmax, Smin = < . *^тах 1.34. Допустимая экстремаль ®($) не является решением задачи, так как по теореме Боголюбова Smin = -oo, Smax = 4-оо. 1.35. На допустимой экстремали £(£) = 0 выполнены достаточные усло- вия слабого минимума: поле А) = А окружает экстремаль и усло- вие Лежандра также выполнено: = 2 > 0. Необходимое условие Вейерштрасса также выполнено, поскольку функция ж2 + 2£±4 вы- пукла. Сильного минимума однако нет. Достаточно взять ломаную {М k(\-t) 1 - h ’ 0 h, и для любого к > 0 подобрать h > 0 так, что J(e(-; k,h)) < 0.
Список литературы [1] [АГТ] Алексеев В. М., Галеев Э. М., Тихомиров В. М. Сборник задач по опти- мизации. М.: Наука, 1984. [2] [АТФ] Алексеев В. М., Тихомиров В. М., Фомин С. В, Оптимальное управле- ние. М.: Наука, 1979. [3] Габасов Р., Кириллова Ф. М. Методы оптимизации. Минск: Изд-во БГУ, 1981. [4] [ГТ] Галеев Э. М.9 Тихомиров В. М. Краткий курс теории экстремальных задач. М.: Изд-во МГУ, 1989. [5] Галеев Э.М., Тихомиров В.М. Оптимизация: теория, примеры, задачи. М.: URSS, 2000. [6] Галеев Э.М.9 Кушниренко А. Г, Тихомиров В, М. Сборник задач по опти- мальному управлению. М.: Изд-во МГУ, 1980. [7] Галеев Э. М. Классическое вариационное исчисление, оптимальное упра- вление. М.: Изд-во МГГА, 1995. [8] Галеев Э. М. Линейное программирование. М.: Изд-во МГГА, 1995. [9] Галеев Э. М. Экстремальные задачи. М.: Изд-во МГГА, 1996. [10] Гантмахер Ф. Р. Теория матриц. М.: Наука, 1988. [11] Демидович Б.П., Марон И. А. Основы вычислительной математики. М.: Наука, 1966. [12] Заславский Ю.Л. Сборник задач по линейному программированию. М.: Наука, 1969. [13] Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974. [14] Карманов В. Г. Математическое программирование. М.: Наука, 1980. [15] КурошА.Г. Курс высшей алгебры. М.: Наука, 1975. [16] Магарил-Ильяев Г. Г., Тихомиров В. М. Выпуклый анализ и его приложения. М.: URSS, 2000. [17] [Р] Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973. [18] Саульев В, К. Прикладная и вычислительная математика. М.: Изд-во МАИ, 1971. Вып.З. [19] Фихтенгольц ГМ. Курс дифференциального и интегрального исчисления. М.: Наука, 1969. Т.1, 2.
Список обозначений absmin (absmax) — абсолютный, т.е. глобальный минимум (максимум) в задаче locmin (locmax, locextr) — локальный минимум (максимум, экстремум) Smin (Smax), иногда, чтобы подчеркнуть глобальность экстремума Sabsmin (Sabsmax)» — численное значение абсолютного минимума (максимума) задачи (Р) — нумерация (обозначение) задачи Arg Р — множество решений задачи (Р) Sp — численное значение задачи (Р) Р(Р), иногда Dp, — множество допустимых элементов в задаче (Р) Р(£) — множество функций дифференцируемых в точке £ Dk(£) — множество функций к раз дифференцируемых в точке £ (fc > 1) (а, 6) — скалярное произведение векторов а и Ъ Ип {аь..., ат} — линейная оболочка векторов си,..., ат I — единичная матрица {*|Л(х)} — множество элементов х, обладающих свойством А(х) X* — пространство сопряженное с X {х*,х} — значение линейного функционала я?* на элементе х ЦХ9 Y) —- пространство линейных непрерывных отображений из прос- транства X в пространство Y — аннулятор множества L Л* — оператор, сопряженный с оператором Л, (Л*з/*,«) = (у*,Ля?) ж(-) — обозначение, которым подчеркивается, что я?(*) является элементом функционального пространства C([WiLR) — пространство непрерывных на отрезке [$оЛ] функций я?( ): R -♦ Rn с нормой ||я?(‘)||о = maxte[Wl] |я?(0| С(К, Rn) — пространство непрерывных вектор-функций я?( ): К —► Rn, заданных на компакте К с нормой ||я?(-)||0 = шах^ |я?(0| Cr(K,Rn) — пространство г раз непрерывно дифференцируемых вектор- функ- ций я?(-): К —► Rn, заданных на компакте К с нормой ИОН, = max {iMOIIo, ИОНо, • • •. ll*(r)(0llo} R :=Rll {-oo} U {+00} — расширенная числовая прямая cone С, иногда со С, — линейная оболочка множества С conv С — выпуклая оболочка множества С
332 Список обозначений dom / ~ эффективное множество функции f epi f — надграфик функции / бА(х) ~ индикаторная функция выпуклого множества А sA(y) — опорная функция множества А df(&) — субдифференциал выпуклой функции f в точке £ #+/(£, h) — производная по направлению h отображения f в точке £ 6f(£, •) вариация по Лагранжу отображения f в точке х /с(«) — производная Гато отображения / в точке & f'(£)[h] — действие производной (Фреше) /'(^) на элемент h SD(£) -- множество отображений строго дифференцируемых в точке £ гр о(р — суперпозиция отображений (р и гр, (гро<р)(х) = Ё(й, 6) — открытый шар радиуса б с центром в точке £ Т$М — множество всех касательных векторов к множеству М в точке £ Т$М — множество односторонних касательных векторов к множеству М в точке £ хь (Аь) ~ базисный вектор (матрица) в линейном программировании хп (Ап) — небазисный вектор (матрица) /* — сопряженная (в смысле Лежандра) функция к функции f — вторая сопряженная функция к функции / Р** _ двойственная задача к задаче Р Е(Р) — множество экстремалей в задаче (Р) DE(P) — множество допустимых экстремалей в задаче (Р) wlocmin (wlocmax, wlocextr) — слабый локальный минимум (максимум, экстре- мум) strlocmin (strlocmax, strlocextr) — сильный локальный минимум (максимум, экстремум) РС(Д, Rn) — пространство кусочно-непрерывных на отрезке Д вектор-функций РС^Д, Rn) — пространство кусочно-дифференцируемых на отрезке Д вектор- функций О! (Ro,t\]) = {h( ) 6 С1 (R0,M) I h(tQ) = h(t}) = 0} := {(t,#(0) I * € Ro, i|]} — график функции £ := {($,£(£),;£(£)) 11 € Ro, ij]} — расширенный график функции $ О (A) — (открытая) окрестность множества А
Предметный указатель Аннулятор множества 78 Вариация по Лагранжу 66, 87, 180, 203 вектор базисный 120, 143 — касательный 83 — небазисный 120 — ограничений 118 — стоимости 118 выпуклая комбинация 51 — оболочка 51 выпуклый многогранник 51 Дифференцируемость по Гато 75 ---Фреше 67, 87 — строгая 66, 67, 76 Задача Аполлония 39 - Больца 178, 190, 192 — выпуклая без ограничений 55 ---с ограничением 56 — выпуклого программирования 56 — гладкая бесконечномерная без ограничений 86 ------с равенствами 89 ---------и неравенствами 93 ---конечномерная без ограничений 15 ------с равенствами 31 ---------и неравенствами 43 — Дидоны 206, 207 — изопериметрическая 178, 202, 206, 281 — Лагранжа 178, 220 — линейного программирования в канонической форме 118, 119, 127, 133 ------в нормальной форме 119, 131 ------в общей форме 119 ------двойственная 131 ------> невырожденная 120, 124, 138 — на минимакс 123 — Ньютона аэродинамическая 247, 262 — о брахистохроне 178, 189 — о быстродействии 247, 258, 261 — о минимальной поверхности вращения 189 — о назначении 117, 173 — о стрельбе 189 — оптимального управления 247, 248 — производственная 123 — простейшая вариационного исчисления 179 ---КВИ 281, 282 — с подвижными концами 178, 196, 199 — со старшими производными 178, 211, 217 — транспортная 117, 154 ---двойственная 170 ---, замкнутая модель 155, 166 Иголка элементарная 255 игольчатая вариация управления элементарная 254 ---функции 290 -------элементарная 255 интеграл импульса 184 — энергии 184 интегрант 179, 181 искусственные переменные 142, 144, 145 Конус допустимых вариаций 44, 98 — конечнопорожденный 135 критерий Коши 63 ~ решения 134, 137 — Сильвестра 20 Лагранжиан 203, 204 лемма Банаха 75, 79
334 Предметный указатель лемма Дюбуа-Реймона 181-183 ---обобщенная 214 — Лагранжа 181 — о замкнутости 104 ---конечнопорожденного конуса 135 ---образа 79, 80 — о компактности 105 — о нетривиальное™ аннулятора 78, 80 — о правом обратном 79, 80 — о приращении функционала 257 — о свойствах элементарной игольчатой вариации 255 — о скруглении углов 294 — о минимаксе 98 — об аннуляторе ядра регулярного оператора 80, 97 — основная КВИ 181 Матрица базисная 145, 163 — небазисная 166 — определенная неотрицательно 18 ---отрицательно 27, 28 ---положительно 18, 19 метод искусственного базиса 144 — «Минимума по матрице» 158 — «Минимума по столбцу» 159 — «Минимума по строке» 158 — Ньютона 21-23 — потенциалов 154, 162, 173 — «Северо-западного угла» 157, 164 минимум (максимум) 13, 56 — (максимум) абсолютный 331 — (максимум) глобальный 179 — (максимум) слабый 191 минор главный 20 ---последовательный 20, 21, 23 Многогранник выпуклый 119 многогранник выпуклый 135 множества отделимые 54 — строго отделимые 55 множество выпуклое 51 — решений задачи 14, 118 множители Лагранжа 32, 34, 36, 44, 89 Надграфик функции 51 неравенство Йенсена 51 - Юнга 128 нормы эквивалентные 63 Оболочка выпуклая 97 ограничение дифференциальное 248 — изопериметрическое 202 — на концах 203 Поле экстремалей 281, 297, 298 ---центральное 297 поля центр 301 — экстремалей центр 297 последовательность фундаментальная 63 правило прямоугольника 122, 146 преобразование Лежандра 128 принцип Лагранжа 14, 32, 43, 54 — максимума Понтрягина 247, 248, 253, 288 производная высшего порядка 68 — Гато 66 — по направлению 66 — Фреше 66, 67 — частная 26, 68 пространство банахово 62, 63 — касательное 83 — линейное 62 — метрическое 63 — нормированное 51, 62, 63 — полное 63 — сопряженное 53, 65 процесс допустимый 248 — оптимальный 248 Симплекс-метод 118 симплекс-метод 117, 120, 123, 140 субдифференциал 51, 53 Теорема Банаха об обратном операторе 79 -------открытости 79 — Вейерштрасса 20, 38 — двойственности 136 — Дубовицкого—Милютина 54 — Крейна—Мильмана 120 — Куна—Таккера 57, 59 — Лагранжа 74, 75 — Люстерника 81, 83
Предметный указатель 335 теорема Минковского 120 — Моро—Рокафеллара 53 — о касательном пространстве 83 — о поле в конечномерных задачах с равенствами 108 — о полном дифференциале 77 — о смешанных производных 68 — о среднем 74-76 — о суперпозиции 71 — об обратной функции 33, 34 — об обратном отображении 90 — отделимости вторая 55 ---первая 55 — существования 134, 136 — Фенхеля—Моро 129, 131 — Ферма 15, 16 — Эйлера—Лагранжа 221-223 терминант 191, 192 точка крайняя (угловая) 119 — критическая 43, 46 — локального минимума 14, 15 -------(максимума) 15 — сопряженная 285 — стационарная 16, 23, 32 Управление 248 уравнение Эйлера 180 — Эйлера—Пуассона 212, 216 — Якоби 285 условие Вейерштрасса 281, 284, 286 — дополняющей нежесткости 43, 58 — Лежандра 284 ---усиленное 284, 285 — на концах (краевые) 179 — неотрицательности 21, 37, 58 — оптимальности 247 — Слейтера 56 — стационарности 16, 32 ---по подвижным концам 197 — строгой положительности 19, 88 — трансверсальности 192 - Якоби 285, 296 ---усиленное 285, 295 Фазовая переменная 248 — плоскость 260 — траектория 260 формализация 13 формула Вейерштрасса основная 281, 301, 303 — Тейлора 16, 74 функционал Больца 191, 193 функция аффинная 52, 128, 286 — Вейерштрасса 286 ---интегранта 286 — выпуклая 51 — замкнутая 51 — индикаторная 52 — квадратичная 52 — кусочно-непрерывная 248 — Лагранжа 37-39 — Минковского 52 — начклона поля 298 — опорная 53 — собственная 51 — сопряженная 128 --- вторая 128 — сублинейная 54 — целевая 118, 123 Численное значение задачи 14, 134 Экстремаль 180 — включена в поле 297 — допустимая 180 экстремум 13, 15 S-функция 131, 133, 301 — , дифференциал 301
MIRSSIHL L®3 "и Ж. S^S^jggi Уважаемые читатели! Уважаемые авторы! Наше издательство специализируется на выпуске научной и учебной литературы, в том числе монографий, журналов, трудов ученых Россий- ской академии наук, научно-исследовательских институтов и учебных заведений. Мы предлагаем авторам свои услуги на выгодных экономи- ческих условиях. При этом мы берем на себя всю работу по подготовке издания — от набора, редактирования и верстки до тиражирования и распространения. URSS Среди вышедших и готовящихся к изданию книг мы предлагаем Вам следующие: Понтрягин Л. С. Принцип максимума в оптимальном управлении. Зеликин М. И. Оптимальное управление и вариационное исчисление. Софиева Ю. Н., Цирлин А, М. Введение в задачи и методы условной оптимизации. Ковалев М. М. Дискретная оптимизация (целочисленное программирование). Ковалев М. М. Матроиды в дискретной оптимизиции. Балакришнан А. Введение в теорию оптимизации в гильбертовом пространстве. Бондаренко В. А,, Максименко А. И. Геометрические конструкции и сложность в комбинаторной оптимизации. Эльсгольц Л. Э. Вариационное исчисление. Дикин И. И. Метод внутренних точек в линейном и нелинейном программировании. Сухарев А. Г. Минимаксные алгоритмы в задачах численного анализа. Морозов В. В. и др. Исследование операций в задачах и упражнениях. Саати Т. Л. Принятие решений при зависимостях и обратных связях. Шнолъ Э. Э. Семь лекций по вычислительной математике. Тарасевич Ю. Ю. Математическое и компьютерное моделирование. Тарасевич Ю. Ю. Перколяция: теория, приложения, алгоритмы. Тарасевич Ю. Ю. Информационные технологии в математике. Мышкис А.Д. Элементы теории математических моделей. Блехман И. И., Мышкис А.Д.У Пановко Я. Г. Прикладная математика. Плохотников К. Э. Математическое моделирование и вычислительный эксперимент. Хинчин А. Я. Работы по математической теории массового обслуживания. Гнеденко Б. В., Коваленко И. Н. Введение в теорию массового обслуживания. Федулов А. А. и др. Введение в теорию статистически ненадежных решений. Цыгичко В. Н. Прогнозирование социально-экономических процессов. Колесников А. П. Численный анализ: Аналитические и топологические методы. Колесников А. П. Топологические методы в теории приближений и численном анализе. Самарский А. А. и др. Задачи и упражнения по численным методам. Самарский А. А., Вабшцевич П. И. Вычислительная теплопередача. Самарский А. А., Попов Ю. П. Разностные методы решения задач газовой динамики. Самарский A. А., Гулин А. В. Устойчивость разностных схем. Гулин А. В., Ионкин Н. И., Морозова В. А. Устойчивость нелокальных разностных схем. Данфорд Н., Шварц Дж. Т. Линейные операторы. Общая теория. Дубровин Б. А., Новиков С. П., Фоменко А. Т. Современная геометрия. Т. 1-3. По всем вопросам Вы можете обратиться к нам: тел./факс (499) 135-42-16, 135-42-46 или электронной почтой URSS@URSS.ru Полный каталог изданий представлен в интернет-магазине: http://URSS.ru Научная и учебная литература IIRSS ni я тИММ' i nwssaru y r ’linssfrai «lURSSruj^juilSSrir f
Эльфат Михайлович ГАЛЕЕВ Доктор физико-математических наук, профессор ка- федры общих проблем управления механико-матема- тического факультета Московского государственного университета им. М. В. Ломоносова. Специалист в об- ласти теории аппроксимации, функционального ана- лиза, теории экстремальных задач и методики пре- _________________ подавания элементарной математики. Автор более 150 научных работ, в том числе ряда монографий по теории экстремальных задач и учебно-методических пособий по подготовке к всту- пительным экзаменам по математике в МГУ. Представляем другие книги нашего издательства: ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ" КОСМОСА lu-oci глн<:пк>. аиьмя ТЕКСТУРА РЕАЛЬНОСТИ а БРАЙАН ГРИН ТКАНЬ В. Феллер МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ТЕОРИЮ ВЕРОЯТНОСТЕЙ ПЕНРОУЗ ТЕОРИЯ _ ВЕРОЯТНОСТЕЙ СИСТЕМНЫЙ АНАЛИЗ В ТО лекциях Роджео Новый УМ • : КОРОЛЯ НЕРАВЕНСТВА Г. Г. Харди Д. Е. Литлвуд Г. Полна р E-mail: Jk URSS@URSS.ru ’'Чг Каталог изданий J в Интернете: urss http://URSS.ru 7851 ID 107101 НАУЧНАЯ И УЧЕБНАЯ ЛИТЕРАТУРА Тел./факс: 7 (499) 135-42-16 Тел./факс: 7 (499) 135-42-46 9 785397 01 1 76 1 > Любые отзывы о настоящем издании, а также обнаруженные опечатки присылайте по адресу URSS@URSS.ru. Ваши замечания и предложения будут учтены и отражены на web-странице этой книги в нашем интернет-магазине http://URSS.ru