/
Text
Э. М. Галеев
ОПТИМИЗАЦИЯ
а теория
д примеры
а задачи
Книга рекомендована
научно-методическим Советом
по математике и механике
УМО университетов
Российской Федерации
Москва • 2002
ББК22.18я73, 22.318
Галеев Эльфат Михайлович
Оптимизация: теория, примеры, задачи: Учебное пособие. — М.: Едиториал
УРСС, 2002. - 304 с.
I&ВN 5-354-00204-4
Книга посвящена важнейшим проблемам оптимизации. Она построена на
базе преподавания теории оптамизации на механико-математическом факуль-
факультете МГУ. В основе ее лежат курсы и спецкурсы, прочитанные Э. М. Галеевым.
Рассматриваются фрагменты следующих разделов теории экстремальных задач:
линейного и выпуклого программирования, математического программирова-
программирования, классического вариационного исчисления и оптимального управления.
Приводятся как необходимые, так и достаточные условия экстремума. Для изу-
изучения этих разделов в необходимом объеме даются элементы функционального
и выпуклого анализа. В каждом параграфе после теоретической части приво-
приводятся примеры решения задач, предлагаются задачи для решения на семинарах,
контрольных и для домашних заданий. Дается обзор общих методов теории
экстремума.
Для студентов вузов по специальностям «Математика», «Прикладная
математика», а также для аспирантов, преподавателей и научных работников.
Издательство «Ециториал УРСС». 117312, г. Москва, пр-т 60-летия Октября, 9.
Лицензия ИД N5175 от 25.06.2001 г. Подписано к печати 02.09.2002 г.
Формат 60x90/16. Тираж 960 экз. Печ. л. 19. Зак. № 49.
Отпечатано в типографии ООО «Рохос». 117312, г. Москва, пр-т 60-летия Октября, 9.
1 БИБЛИОТЕКА I
ИЗДАТЕЛЬСТВО " "ш ш 15В14
НАУЧНОЙ И УЧЕБНОЙ ЛИТЕРАТУРЫ
Е-тай: игез@игез.ги
Каталог изданий
в 1пЫтвк №р://иг$з.ги
Тел./факс: 7 @95) 135-44-23
Тел./факс: 7 @95) 135-42-46
> Э. М. Галеев, 2002
> Едиториал УРСС, 2002
1 БИБЛИОТЕКА I
Предисловие
Задачи на отыскание наибольших и наименьших величин являют-
являются актуальными на протяжении всей истории развития человечества.
Особенное значение они приобретают в настоящее время, когда воз-
возрастает важность наиболее эффективного использования природных
богатств, людских ресурсов, материальных и финансовых средств. Все
это приводит к необходимости отыскивать наилучшее, или, как говорят,
оптимальное решение того или иного вопроса.
Первые задачи на максимум и минимум были поставлены и ре-
решены в глубокой древности, когда математика только зарождалась
как наука. Теория экстремальных задач начала создаваться в начале
XVII века, и затем она активно развивалась вплоть до наших дней,
включая в свою орбиту крупнейших математиков, таких как Ферма,
Ньютон, Лейбниц, Бернулли, Эйлер, Лагранж, Пуанкаре, фон Нейман,
Канторович, Понтрягин и других. В наше время невозможно мыслить
себе полноценное математическое образование без элементов теории
экстремума.
Монография является переработанным и расширенным переизда-
переизданием первых пяти глав, написанных Танеевым, книги Галеев Э. М.,
Тихомиров В. М. «Оптимизация: теория, примеры, задачи». М.: УРСС,
2000. Книга состоит из 5 глав. Они содержат материал курса лекций
по методам оптимизации, линейному программированию, оптимальному
управлению и вариационному исчислению, а также спецкурса по услови-
условиям экстремума второго порядка на механико-математическом факультете
Московского государственного университета, а также в некоторых инсти-
институтах естественнонаучного профиля. Данный курс лекций был разработан
целым рядом профессоров и преподавателей механико-математического
факультета МГУ, на начальном этапе курс сформировался усилиями
В. М. Алексеева, В. М. Тихомирова, С. В. Фомина. При написании книги
использовался материал, содержащийся в ранее опубликованных книгах:
[АТФ] — Алексеев В.М., Тихомиров В.М., Фомин СВ. «Оптимальное
управление». М.: Наука, 1979; [АГТ] — Алексеев В. М., Галеев Э. М.,
Тихомиров В. М. «Сборник задач по оптимизации». М.: Наука, 1984;
[ГТ] — Галеев Э. М., Тихомиров В. М. «Краткий курс теории экстре-
экстремальных задач». М.: Изд-во МГУ, 1989. Книга является расширенным
вариантом пособия Галеева Э. М. «Курс лекций по вариационному исчи-
исчислению и оптимальному управлению». М.: Изд-во мехмата МГУ, 1996.
Она предназначена для курсов, включающих элементы теории экстрему-
экстремума любого уровня и приспособлена к действующим ныне программам.
Все чертежи в ЬАТЕХ'е 2е выполнены Танеевой Альфирой.
4 Предисловие
Рассматриваются следующие разделы теории экстремальных задач:
задачи без ограничений, гладкие задачи с ограничениями типа равенств
и неравенств, линейное программирование, вариационное исчисление,
оптимальное управление, необходимые и достаточные условия экстрему-
экстремума в вариационном исчислении.
При изучении данных разделов требуется знание основ математиче-
математического анализа и линейной алгебры, изучаемых на первых двух курсах
технических и педагогических вузов, университетов. Предполагается,
что читатели знакомы с элементарными приемами дифференцирования
и интегрирования функций, умеют решать простейшие дифференци-
дифференциальные уравнения, знакомы с элементарными навыками работы с ма-
матрицами (умножением, транспонированием, нахождением обратной).
Все остальные используемые в курсе математические понятия подробно
определяются.
В первой главе рассматриваются задачи без ограничений, задачи
с ограничениями типа равенств, с ограничениями типа равенств и не-
неравенств для числовых функций п переменных и в нормированных
пространствах. Для каждого типа задач приводятся решения соответ-
соответствующих примеров. Одним из примеров является старинная задача
Аполлония о нормалях к эллипсу. Методами теории экстремальных за-
задач решается задача из курса алгебры о приведении квадратичной формы
к главным осям. Большое внимание уделяется выпуклым задачам. Дают-
Даются элементы выпуклого анализа, причем выпуклый анализ в зависимости
от уровня математической подготовки читателя может рассматриваться
как в конечномерных пространствах, так и в линейных нормирован-
нормированных пространствах, вводится понятие субдифференциала и доказывается
теорема Куна—Таккера. В этой же главе даются некоторые элементы
функционального анализа и дифференциального исчисления в норми-
нормированных пространствах.
Вторая глава посвящена линейному программированию. В ней вна-
вначале даются постановки задач линейного программирования, правило
решения задач в канонической форме по симплекс-методу, приводят-
приводятся с решениями примеры. Вводится понятие двойственности, затем
проводится строгое обоснование симплекс-метода, дается ряд методов
нахождения первоначальной крайней точки. Полученные навыки при-
применяются к некоторым наиболее известным типам задач линейного
программирования — транспортным задачам и задачам о назначении.
Основная цель при этом — ознакомление студентов с имеющимися ме-
методами решения задач линейного программирования и проведение обо-
обоснования этих методов. Обоснование проводится таким образом, чтобы
для решения подобных задач в дальнейшем возможно было бы самосто-
самостоятельно создать метод решения и провести его обоснование. В пособии
приведены доказательства теоремы существования решений и теоремы
двойственности, позволяющие более глубоко понять данный курс.
Предисловие 5
В третьей главе приводятся следующие элементарные задачи класси-
классического вариационного исчисления: простейшая задача, задача Больца,
изопериметрическая задача. Все эти задачи являются частным случаем
более обшей задачи Лагранжа. Как частный случай задачи Лагранжа
рассматриваются задача с подвижными концами и задача со старшими
производными.
В четвертой главе рассматриваются задачи оптимального управле-
управления. Приводится формулировка и доказательство принципа максимума
Понтрягина в общем случае, а также принципа максимума для задачи
со свободным концом. Решаются простейшая задача о быстродействии,
задача Ньютона и ряд других задач оптимального управления.
В пятой главе даны необходимые и достаточные условия экстремума
в простейшей задаче классического вариационного исчисления и задаче
Больца.
Галеев Э. М.
Автор благодарит В. М. Тихомирова, у которого учился теории и ре-
решению задач на экстремум и который внес огромный вклад в разработку
курсов оптимизации.
Введение
Теорию задач на отыскание наибольших и наименьших величин
называют теорией экстремальных задач.
Слово тах1тит по латыни означает «наибольшее», слово тШтит —
«наименьшее». Оба этих понятия объединяются словом «экстремум»
(от латинского ех(гетит, означающего «крайнее»). Слово «экстремум»,
как термин, объединяющий понятия «максимум» и «минимум», ввел
в употребление Дюбуа-Реймон. Ныне раздел анализа, в котором изучают
разнообразные задачи на максимум и минимум, называют теорией
экстремальных задач.
Запись задачи в виде /(х) —+ ех1г означает, что мы должны решить
и задачу на минимум, и задачу на максимум.
Задачу на максимум всегда можно свести к задаче на минимум,
заменив задачу }(х) -+ тах задачей }(х) -+ тш, где }(х) = -}(х),
и наоборот. Поэтому в тех случаях, когда формулировки теорем для задач
на минимум и максимум различны, мы иногда будем ограничиваться
рассмотрением задачи на минимум.
Задачи на максимум и минимум изначально формулируются, как
правило, на языке той области, в которой они возникают. А исследуют
их средствами математического анализа. Для того, чтобы можно было
воспользоваться этими средствами, необходимо перевести формулировку
задачи на язык математического анализа. Такой перевод называется
формализацией.
В общем виде формализованная задача выглядит следующим образом:
найти экстремум {максимум или минимум) функции /: X —+ К, опреде-
определенной на некотором пространстве X при ограничении х € Т> (ОС X).
Кратко записываем так:
/(х) -* ех1г; Х&Б. (Р)
Для функции одной переменной X = К, для функции нескольких
переменных X = К". В более общих случаях X может быть линей-
линейным, нормированным или топологическим пространством. Ограничение
х € Т) может быть записано в виде включения, а также в виде уравнений
или неравенств. (Р) — нумерация (обозначение) задачи (от английского
слова ргоЫет — задача). Множество допустимых элементов в задаче (Р)
обозначаем Б = -О(-Р) или Др. Если множество допустимых элементов
совпадает со всем пространством (Б = X), то задачу (Р) называем
задачей без ограничений.
Решением задачи (Р) на минимум является точка х такая, что
/(ж) ^ }(х) щы всех точек х € О{Р). В этом случае мы пишем
Введение 7
х € аЪзтшР. Такой минимум называется еще абсолютным, или гло-
глобальным. Аналогично определяется абсолютный максимум в задаче
(аЪяпахР). Величина /(ж), где х — решение задачи, называется чи-
численным значением задачи и обозначается 5тщ или 5тах (иногда, чтобы
подчеркнуть глобальность экстремума, 5аь5тт или 5аЬ8тах)- Множество
решений задачи (Р) обозначается Аг§Р. Если экстремум не достигается,
то мы должны указать последовательность точек х„, на которой значение
функции }{хп) стремится к величинам 5т}„ и 5тах.
При решении задачи следует отыскать не только абсолютные (гло-
(глобальные) экстремумы задачи, но и локальные экстремумы. Точка х
является точкой локального минимума в задаче (Р) (пишем х € 1остшР),
если существует окрестность V точки х такая, что }(х) ^ /(х) для любой
допустимой точки х из этой окрестности (V х 6 Ъ Л 17). Аналогично
точка х является точкой локального максимума в задаче (Р) (пишем
х € 1остахР), если существует окрестность V точки х такая, что
/(х) ^ /(&) V х € В П Л. Если речь идет о максимуме или минимуме,
то пишем 1осехггР.
В связи с каждой экстремальной задачей возникают вопросы: ка-
каковы необходимые условия экстремума, каковы достаточные условия,
существует ли решение задачи, как найти решение явно или численно.
В теории экстремальных задач наиболее разработаны необходимые
условия, которым должно удовлетворять решение задачи. Выписывая эти
необходимые условия экстремума, мы находим некоторое множество то-
точек, удовлетворяющее этим условиям. Это множество точек (мы называем
их стационарными, или критическими, или экстремальными), возможно,
шире, чем множество абсолютных и даже локальных экстремумов. По-
Поэтому далее надо с каждой такой точкой разобраться, доставляет она экс-
экстремум (и какой) или нет. Это делается с помощью достаточных условий.
Одним из важнейших принципов решения задач с ограничениями
является принцип Яагранжа снятия ограничений. Ниже он будет сфор-
сформулирован и доказан для некоторых конкретных типов задач. Сфера
применимости принципа Лагранжа достаточно широка. Иногда нельзя
к задаче применить имеющуюся теорему, однако этот принцип, приме-
примененный без обоснования, тем не менее может привести к точкам, среди
которых можно выделить решение.
Глава 1
Экстремальные задачи
§ 1. Конечномерные задачи без ограничений
В этом параграфе даются необходимые и достаточные условия
экстремума функций одной и нескольких переменных.
1.1. Постановка задачи
Пусть /: К" -+ К — функция п действительных переменных, обла-
обладающая некоторой гладкостью. Под гладкостью мы понимаем определен-
определенную дифференцируемость функции. Если функция / дифференцируема
й раз в точке х, мы пишем / € Бк(х). Гладкой конечномерной экстре-
экстремальной задачей без ограничений называется следующая задача:
/(х) -+ ех!г.
При решении задачи надо найти не только абсолютные (глобальные)
экстремумы (минимумы и максимумы) функции, но и локальные экс-
экстремумы.
Точка х является точкой локального минимума (максимума) функ-
функции /, если существует окрестность Ле = {х | \х— х\ < е} точки х такая,
что }(х) ^ }(х) (}(х) < }{х)) для любой точки х из этой окрестности.
При этом мы пишем х € 1остш/ (х € 1остах/), а если речь идет о
минимуме или максимуме, то пишем х € 1осех1г/.
1.2. Необходимые и достаточные условия экстремума
1.2.1. Функции одной переменной
Теорема 1 (Ферма). Пусть /: К -+ К — функция одного действи-
действительного переменного. Если х € 1осех1г/ — точка локального экстремума
функции / и / € О{&) дифференцируема в точке х, то
§ 1. Конечномерные задачи без ограничений 9
Доказательство. По определению дифференцируемости /(ж + к) =
}(х) + }'(х)к + г (к), г (к) — о(к) = о(\)к при малых к. Значит,
Если бы /'(х) ф О, то при к достаточно близких к нулю, величина
}'(х) + о(\) имела бы знак /'(х), поскольку оA) -+ 0 при к -+ 0.
Само же к может принимать как положительные, так и отрицательные
значения. Следовательно, разность /(х + к) — /D) может быть как
меньше, так и больше нуля. Это противоречит тому, что /(х+к) — /(х) ^ 0
при х е 1остш / и /(х + к) - /(х) ^ 0 при ж € 1остах /. ■
Геометрически теорема Ферма утверждает, что в точке экстремума
дифференцируемой функции касательная к ее графику горизонтальна.
Теорема 2. Пусть функция / € ^?2(^) дважды дифференцируема
в точке х.
Необходимые условия экстремума: если х € 1осгшп / — точка локаль-
локального минимума функции /, то
/'D) = 0, /"(х) > 0.
Достаточные условия экстремума: если
Г{х) = 0, /"D) > 0,
то х € 1ос1шп / — точка локального минимума функции /.
Доказательство. По формуле Тейлора
/D + А) = /D) + /'D)А + \}"{*)П2 + г(А), г(А) = о(к2).
Необходимость. Пусть х € 1осгшп/. Тогда, во-первых, по необходи-
необходимому условию экстремума I порядка для функций одной переменной —
теореме Ферма — /'(х) — 0, во-вторых, }(х -г Л) - /(х) > 0 при
достаточно малых к. Поэтому в силу формулы Тейлора
/D + к) - /D) = \Г\х)к2 + г(А) ^ 0 (г(А) = о(к2))
при малых Л. Разделим обе части последнего неравенства на Л и устре-
устремим к к нулю. Поскольку —х > 0, то получим, что /"D) ^ 0.
к1-
Достаточность. Пусть /'D) = 0, /"D) > 0. Тогда по формуле
Тейлора в силу условия г (к) = о(к2) «• \г(к)\ ^ еЛ2 =>• г(к) ^ -еЛ2 для
любого е > 0 при достаточно малых Л имеем:
/D + к) - /D) = ^/"D)Л2 + г(А) ^ (^ - е) к2 > 0
при г ^ . Следовательно, х € 1оспгт/. ■
10 Глава 1. Экстремальные задачи
Для локального максимума неравенства имеют противоположный
вид: }"(х) ^ 0 и }"(х) < 0 соответственно.
В одномерном случае можно дать почти исчерпывающий ответ
на вопрос о том, является ли данная точка х локальным экстремумом
или нет.
Теорема 3. Пусть функция / € Б" (А) п раз дифференцируема в точке х.
Необходимые условия экстремума: если х € 1осгшп (тах) / — точка
локального минимума (максимума) функции /, то либо /'(А) = ... =
/(п)(х) = 0, либо
}'(х) = ...= {Bт~1\х) = 0, /{2т)(х) > 0 (/Bт)(ж) < 0) A)
при некотором т: 2 ^ 2т ^ п.
Достаточные условия экстремума: если выполняется условие A), то
А € 1остш (тах) / — точка локального минимума (максимума) функции /.
Доказательство. Пусть для определенности х € 1осгшп/. По фор-
формуле Тейлора
= о(А") (^?-0 приЛ->о).
Необходимость при п = 1 следует из теоремы Ферма. Пусть далее
п> 1. Тогда либо /'(х) = ... = /(п)(ж) = 0, либо }'(х) = ... =
/(')(*) = 0, /(;)B) /0,!^п. Значит,
А) - !(х) = 53 —Г1* +г(Н) =
к=1 А"
Поскольку х е 1остт/, то }(х+ к) - }(х) = —ур~^ +п(к) ^ 0 при
достаточно малых по модулю к. Так как /®(х) Ф 0, то отсюда следует,
что / — четно и }A)(х) > 0.
Достаточность. Пусть /'(х) = ... = /<2т-!)(ж) = 0, /2тB) / 0.
Тогда по формуле Тейлора
приЛ-,0.
Поскольку /Bт)(ж) > 0, то /(х + к)~ /(х) ^ 0 при достаточно малых к,
т.е. х € кклшп/. ■
§ 1. Конечномерные задачи без ограничений 11
1.2.2. Функции нескольких переменных
Сформулируем необходимое условие экстремума I порядка в конеч-
конечномерной задаче без ограничений, являющееся аналогом теоремы Ферма.
Теорема 1. Если х = (XI,... ,хп) € 1осех1г/ — точка локального
экстремума функции п переменных }{х\,... ,хп) и функция / €
дифференцируема в точке х, то
...0.
ОХ\ ОХп
Доказательство. Рассмотрим функцию одной переменной <р(хг) =
/(хь...,хг_ихг,Х1+и...,хп). Поскольку х = (хь...,хп) € 1осех1г/,
то щ € 1осех1гу. Кроме того <р € ^?(ж,). По необходимолгу условию
экстремума для функций одной переменной — теореме Ферма
Сформулируем необходимые и достаточные условие экстремума II
порядка в конечномерной задаче без ограничений. Предварительно
напомним, что второй производной функции нескольких переменных
является симметричная матрица вторых производных
а также приведем определения знакоопределенностей симметричных
матриц. Матрица А называется неотрицательно определенной (А ^ 0),
если
п
^О V Н = (Нь... ,кп) € К".
Матрица А называется положительно определенной (А > 0), если
(Ак,Н)>0 УЛЕК", й/0.
Матрица А называется строго положительно определенной, если
существует а > 0 такое, что
{АН,Н) >а\\Н\\2 У/геК".
Аналогично определяются неположительная и отрицательная матрицы.
Отметим, что в конечномерном пространстве условие положительной
определенности симметричной матрицы А эквивалентно условию стро-
строгой положительности матрицы А. В бесконечномерных пространствах
это не так (см. [АТФ, с. 242]).
12 Глава 1. Экстремальные задачи
Теорема 2. Пусть функция / € Т> (х) дважды дифференцируема в точке
Х=(хи...,Хп).
Необходимые условия экстремума: еогм ^ € 1осгшп (тах) / — точка
локального минимума (максимума) функции /, то
}'{х) = о, </"D)а, л) > о (</"D)а, л) < о) V л е к".
Достаточные условия экстремума: если
/'D) = 0, </"D)А, Л) > 0 (</"D)А, Л) < 0) V Л € К", Л / 0,
то х €. 1осгшп (тах) / — точка локального минимума (максимума) функ-
функции /.
Доказательство. По формуле Тейлора
/D + Л) = /D) + (/'D), Л) + |(/"D)А, Л) + г(А), г(А) = о(\Н\2).
Докажем теорему для случая минимума. Случай максимума аналогичен.
Необходимость. Поскольку А € 1остт/, то, во-первых, по не-
необходимому условию экстремума I порядка в конечномерной задаче
без ограничений — аналогу теоремы Ферма /'(х) = 0, во-вторых,
}(х + АЛ) - /(х) > 0 при достаточно малых А. Поэтому в силу формулы
Тейлора
/D +АА) - /D) - у(/"D)А,А) +г(АА) ^ 0 (г(АА) = о(|А|2))
при мальгх А и фиксированном к. Разделим обе части последнего
, г(АА)
неравенства на А и устремим А к нулю. Поскольку —-^ ► 0, то
получим, что
(/"D)А,А)>0 УЛеК".
Достаточность. Так как }'(х) = 0, то по формуле Тейлора в силу
выполненного условия (/"(х)Н, к) > а\к\ имеем:
/D +А) - /D) = ^(/"D)А,А) +г(А) > ^|Л|2 +Г(А) > 0
при достаточно малых к, так как г (к) = о(\к\ ). Следовательно,
х € 1осгшп/. ■
п
Замечание. Для квадратичных функционалов (}(х) = ]Г) а^Х{Х^
условие положительной (отрицательной) определенности матрицы
А = }"(х) = (ац)" -=1 является достаточным условием абсолютного ми-
минимума (максимума) функционала в стационарной точке.
§ 1. Конечномерные задачи без ограничений 13
1.2.3. Критерий Сильвестра
Знакоопределенность матрицы устанавливается с помощью критерия
Сильвестра.
Напомним, что последовательными главными минорами матрицы А
(«11 ••• «1*\
I.
Главным минором -4^...^ матрицы А называется определитель ма-
матрицы размера к х к, составленной из строк и столбцов с номерами
Теорема. [10, с. 260.] Пусть А — симметричная матрица. Тогда
1. Матрица А положительно определена (А > 0) тогда и только
тогда, когда все ее последовательные главные миноры положительны, т. е.
■А-1...Н > 0, к = 1,...,п.
2. Матрица А отрицательно определена (А < 0) тогда и только
тогда, когда все ее последовательные главные миноры чередуют знак,
начиная с отрицательного, т. е. (— 1)*<1е1.41...ц > 0, к = 1,..., п.
3. Матрица А неотрицательно определена (А ^ 0) тогда и только
тогда, когда все ее главные миноры неотрицательны, т.е. -4;,,..г* ^ 0,
1 ^ г-1 ^ ... ^ г* ^ п, к = 1,... , п.
4. Матрица А неположительно определена {А ^ 0) тогда и только
тогда, когда все ее главные миноры чередуют знак, начиная с неположи-
неположительного, т.е. (—1)*-4;,...4 ^0, 1 ^ г\ ^ ... ^ г* ^ п, к = 1,... ,п.
Замечание 1. Как будет показано ниже, положительность (неотрица-
(неотрицательность) матрицы равносильна положительности (неотрицательности)
всех собственных значений матрицы.
Замечание 2. Отметим, что условие положительности последователь-
последовательных главных миноров матрицы равносильно условию положительности
всех главных миноров (см. [10, с. 260]). Для условия неотрицательности
это не так, т. е. из условия неотрицательности последовательных главных
миноров не следует неотрицательность всех главных миноров матрицы
и, следовательно, не следует неотрицательность матрицы.
гт - а /о оА
Действительно, у матрицы А = I . . последовательные главные
миноры равны нулю (^1 = А& = 0), но она не является неотрицательной:
{АН, к) = (@, -Л2), (Нь Н2)) = ~Н22<0 при к2 ф 0.
1.2.4. Метод Ньютона (метод касательных)
Для того, чтобы решить задачу без ограничений нужно найти
стационарные точки — решения уравнения /'(ж) = 0. Для решения таких
уравнений численным способом можно воспользоваться замечательным
14
Глава 1. Экстремальные задачи
приемом, восходящим к Ньютону. Итак, пусть нам требуется решить
уравнение
Р(х) = 0. A)
Здесь Р — дважды непрерывно дифференцируемая функция одной пере-
переменной. Будем искать решение уравнения A) методом последовательных
приближений. Если хк — приближенное значение корня, то точное
значение корня
± = хк + кк, B)
где кк мало, и в силу дифференцируемости функции Р
0 = Р(Л) = Р{хк + кк) = Р{хк) + Р\хк)кк + о{кк).
Р(хк)
Пренебрегая слагаемым о(Л*), находим, что кк — -~.—г- Внеся эту
Р (хк)
поправку в формулу B), получим новое уточненное приближенное
значение корня:
Хк+1 =Хк + Нк.
Таким образом, мы имеем следующее рекуррентное соотношение для
нахождения последовательных приближений к нулю уравнения A):
= хк -
Р'(хкУ
C)
Геометрически метод Ньютона эквивалентен замене дуги кри-
кривой у = Р(х) касательной, проведенной в некоторой точке кривой
(см. рис. 1).
Рис. 1
§ 1. Конечномерные задачи без ограничений 15
Пусть для определенности нам надо найти корень уравнения A),
находящийся на отрезке [а, Ь] и Р(Ь)Р"(Ь) > 0. Положим х0 — Ь.
Проведем касательную к кривой у = Е(х) в точке (Ь,Р(Ь)) = (хо,Р(хо)).
В качестве первого приближения Х\ берется абсцисса точки пере-
пересечения этой касательной с осью Ох. Через точку (ж1,^(а;1)) снова
проводим касательную, абсцисса точки пересечения которой дает второе
приближение х^ корня х и т.д. (рис. 1).
Очевидно, что уравнение касательной в точке (хк,Р(хк)) есть
Р'(хк)(х-хк).
Полагая в этом уравнении у = 0, х = хк+\, имеем формулу C)
О = Р{хк) + Р'(хк)(хк+1 - хк) <=> хк+1 = хк- (Хк)
Заметим, что если в нашем случае положить х0 — а и, следовательно,
Р(хо)Р"(хо) < 0, то, проведя касательную к кривой у = Р(х) в точке
(а,Р(а)}, мы получили бы точку Х\, лежащую вне отрезка [а, Ь], т.е.
при этом выбор начального значения в методе Ньютона оказался бы
неудачным. Таким образом, в данном случае правильным начальным
приближением х является условие Р(хо)Р"(хо) > 0.
Имеет место следующая
Теорема. Пусть Р € С2({а, Ь],К), значения функции Р(а) и Р(Ь) при-
принимают разные знаки (Р(а)Р(Ь) < 0), функция Р монотонна на отрезке
[а, Ь], Р'{х)Р"(х) ф 0 V х € [а, Ь]. Тогда, исходя из начального приближе-
приближения х0 € [а, Ь], удовлетворяющего неравенству Р(хо)Р"(х0) > 0, можно
вычислить по методу Ньютона единственный корень уравнения Р{х) = 0
с любой степенью точности.
Если производная Р'{х) мало меняется на отрезке [а, Ь] или вычи-
вычисление Р'{хк) слишком трудоемко, то в формуле C) можно положить
Р'(%к) = Р'(%о) для всех значений к = 0,1,2,... :
Такой метод нахождения корня уравнения называется модифицированным
методом Ньютона. Геометрически этот способ означает, что мы заме-
заменяем касательные в точках (хк,Р(хк)} прямыми параллельными первой
касательной, построенной в точке (жо,^(а;о)).
Подробнее о методе Ньютона можно прочитать в книге «Основы
вычислительной математики» Б. П. Демидович и И. А Марон [11].
16 Глава 1. Экстремальные задачи
1.3. Правило решения
Для решения конечномерной задачи без ограничений следует:
1) Выписать необходимое условие экстремума I порядка — аналог
теоремы Ферма:
Найти точки х, удовлетворяющие необходимому условию I порядка
(эти точки называются стационарными).
2) Проверить выполнение условий экстремума II порядка в каждой
стационарной точке.
Выписать матрицу вторых производных
а) Проверить выполнение достаточных условий экстремума — иссле-
исследовать ее знакоопределенность, т. е. посчитать последовательные главные
миноры матрицы А:
Если все ее они положительны, т.е. А^,.* > О, А = 1,...,п, то
точка х доставляет локальный минимум в задаче, х 6 1остш/.
Если все ее последовательные главные миноры чередуют знак,
начиная с отрицательного, т.е. (—1)*<1е1.4.1...* > 0, к~ 1,... ,п, то точка
доставляет локальный максимум, х 6 1остах/.
Ь) Если не выполняются достаточные условия экстремума, то надо
проверить выполнение необходимых условий — исследовать ее слабую
знакоопределенность, т.е. посчитать главные миноры матрицы А —
определители матриц размера к х к, составленных из строк и столбцов
/«М, •••
с номерами г1}..., г»: А{1...^ :— йе1 I
V «,у, ■ ■ ■
Если матрица А не является неотрицательно определенной (А % 0),
т.е. не выполняется условие, когда все ее главные миноры неотрица-
неотрицательны, т. е. 4,-,...,^ ^ 0, 1 ^ г\ ^ ... ^ г* ^ п, к — 1,..., п, то точка х
не доставляет локальный минимум, х % 1осггшг /.
Если матрица А не является неположительно определенной (А ^ 0),
т. е. не выполняется условие, когда все ее главные миноры чередуют знак,
начиная с неположительного, т. е. (—1) А^...^ ^0, 1^*1^... ^ г* ^ п,
к = 1,..., п, то точка ж не доставляет локальный максимум, ж 0 1остах/.
§ 1. Конечномерные задачи без ограничений 17
1.4. Примеры
Пример 1. }{х) = }(х\, х2) = х\ — Х\Х2 + х2 — 2х\ + Х2 —+ ех1г.
Необходимое условие экстремума I порядка:
дхх дх2 \ -XI + 2х2 + 1 = 0.
Решая эту систему, находим единственную стационарную точку ж = A,0).
(&НхУ\ ( 2 -1\
Матрица вторых производных I *— I = I , . по кри-
\дх{дх^/^=1 \~1 I)
терию Сильвестра положительно определена. По достаточному усло-
условию локального экстремума функции нескольких переменных точка
A,0) € 1осппп/. Поскольку функционал является квадратичным, то
A,0) € аЪяшп/, а 5тах = +оо.
Пример 2. /(х) = /(жь х2) = х\ + х\ - х\ - 2х\Х2 - х\ -+ еххг.
Необходимое условие экстремума I порядка:
дхг дх2 \ 4х32 - 2а?1 - 2х2 = 0.
Решая эту систему уравнений, находим стационарные точки ж1 =
(хьх2) - A,1), х1 = (-1,-1), ж3 = @,0). Для проверки условий
II порядка выписываем матрицу вторых производных:
A,1)
- 2 -2
(-1,-1)
= (-2 -2)
1,0) \-2 -2)
( 10 -2\
., ( 10 -2\ „
Матрица I __ .„ I по критерию Сильвестра положительно опре-
определена. По достаточному условию локального экстремума функции
нескольких переменных точки A,1) и (-1,-1) доставляют локальный
минимум функции /.
Поскольку Шп }{х) = Ит х\ + х\ — (х,у + х2) — +сх>, то по след-
|х|—>оо |ж|—»оо
ствию из теоремы Вейерштрасса она достигает своего абсолютного
минимума. Следовательно, A,1), (-1,-1) € аЪшип, 5пш, = /A,1) =
/(-1,-1) = -2.
(-2 -2\
Матрица I _ . I по критерию Сильвестра не является ни поло-
положительно, ни отрицательно определенной. Она является неположительно
18
Глава 1. Экстремальные задачи
определенной матрицей (А ^ 0) и не является неотрицательно опреде-
определенной матрицей [А^ 0). Следовательно, не выполняется необходимое
условие локального минимума. Поэтому ж3 = @,0) 01осгшп/. Посколь-
Поскольку /(Л, -к) = 2Л4 > 0 = /(ж3) при малых к ф 0, то ж3 ^ 1остах/.
Очевидно, что 5тах —- +оо.
Пример 3. Найти экстремумы неявно заданной функции двух пере-
переменных жз = /(Х[,Х2), если
Р(хг,х2, х3) ~
+ х\ - 2хх + 2х2 - 4ж3 -10 = 0.
д/ дхт, д/ дхт.
Решение. Частные производные = и -— = -—
дх\ дх\ ОХ2 ОХ2
из уравнений:
находим
дР дР дхт,
дР дР дхг
дх2 дхт, дх2
2а?!- 2 + B*3 -4)-^ -О,
дхт,
+ 2 +B*3-4)—-=0.
ОХ2
(*)
Необходимое условие экстремума I порядка:
0*з(*) _ дх3(х) _ (*) г 2хг - 2 = О,
ж, = -1.
Подставляя найденную точку (жьжг) = A,-1) в заданное уравнение
Р(х1,Х2,х3) = 0, находим две стационарные точки х1 = (^ьж2,ж3) =
A,-1,-2) и ж2 = (*ьж2,ж3) = A,-1,6)
Для проверки условий II порядка надо выписать матрицу вторых
производных в каждой стационарной точке. Дифференцируя первое
уравнение правой части системы уравнений (*) по х\ и Х2 с учетом
дхт, дхт,
условия -— = —-1- = 0, имеем
ах\ ОХ2
92а;з
92а;з
д2х3
4' д2х.
1
Bх3 - 4)
= 0:
х2
= 0.
Аналогично, дифференцируя второе уравнение правой части системы (*)
ПО Хх И Х2, ПОЛУЧИМ
'д2
х2
д2х2
§ 1. Конечномерные задачи без ограничений 19
д2хг дгхъ
Очевидно, что -—-— = -—-—. Таким образом,
А =
_ А/4
О 1/4
/4 у '
_ ^-1/4 О
О -1/4
Матрица А\ц по критерию Сильвестра является положительно
определенной, а матрица А\^2 отрицательно определенной. Поэтому
по достаточному условию второго порядка ^ост|п = — 2, Гостах = 6.
Можно показать, что это будут не только локальные экстремумы,
но и глобальные.
Приведем несколько примеров различных свойств экстремумов в за-
задаче без ограничений.
Пример 4. Абсолютные минимумы и максимумы достигаются в беско-
бесконечном числе точек:
/: К-+К, /(ж) = &тх.
Пример 5. Функция ограничена, абсолютный максимум достигается,
минимум — нет:
Пример 6. Функция ограничена, но абсолютные максимум и минимум
не достигаются:
/: К -> К, /(х) = агс18 х.
Пример 7. Функция ограничена, имеет стационарные точки, но абсо-
абсолютные максимум и минимум не достигаются:
Пример 8. Функция ограничена, имеет локальные максимумы и мини-
минимумы, но абсолютные максимум и минимум не достигаются:
/: К -+ К, }(х) — агс1§ х ■ яп х.
Пример 9. Ограничение функции, заданной на плоскости, на любую пря-
прямую, проходящую через начало координат, имеет в нуле локальный минимум,
но вместе с тем начало координат не является точкой локального минимума:
/: К2 -> К, /(агь х2) = (ал - х22)(Х1 - 3x1).
Действительно, на любой прямой вида х{ = ах2, а € К, функ-
функция /(ах2,Х2) = (ах2 - х1)(ах2 - 3x1) — х\{а ~ хт){а ~ ^Х2) = Х2(а2~
4ах2 + Зх2,) ^ 0 = /@) при малых хг- Значит, на любой прямой
20 Глава 1. Экстремальные задачи
вида Ху = ах2 функции / имеет локальный минимум в нуле. Анало-
Аналогично на прямой х2 = 0 функция /B^,0) = х1 имеет минимум в нуле.
С другой стороны, на параболе х1 = 2х\ функция /Bх2, х2) = — х2 < 0
в любой окрестности нуля. То есть точка ж = 0 не является точкой
локального минимума функции /.
Пример 10. Имеется единственный локальный экстремум, не яв-
являющийся абсолютным:
/: К2 -+ К, }(хих2) = х\ - х\ + 2е~хК
Необходимое условие экстремума I порядка в конечномерной задаче
без ограничений:
= 0^ ^М = ^М = 0^ !2х1-4х1е-х2^0;
дхг дх2
\ -2х2 = 0,
"^1=0,
х2 = 0.
Получаем в задаче три стационарные точки ж1 = @,0), ж2 = (\/1п2,0),
ж3 = (-\/Е2,0).
Для проверки условий II порядка надо выписать матрицу вторых
производных в каждой стационарной точке:
г . 1
2 - 4е~х* + 8х\е~^ 0
0 -2
-2 0
0 -2
, Л
/41п2 0
V 0 -2
Матрица вторых производных I . _„ в точке Ху = @,0) по кри-
критерию Сильвестра является отрицательно определенной: А\ = — 2 < 0,
А2 = 4 > 0. Поэтому по достаточному условию второго порядка стацио-
стационарная точка ж1 е 1остах. Очевидно, что 8аЬсаак = +оо (/(ж^О) -+ +сх)
при XI -+ +СХ)).
\л /41п2 0\ „
Матрица вторых производных I _ _„ I по критерию Силь-
0
вестра не является ни положительно, ни отрицательно определенной
и более того не является ни неположительно определенной матри-
матрицей (.4 ^ 0) и ни неотрицательно определенной матрицей (.4 ^ 0).
Следовательно, не выполняется необходимое условие ни локального
§ 1. Конечномерные задачи без ограничений 21
максимума, ни локального минимума. Поэтому стационарные точки ж2,
ж3 01осех1г/.
Очевидно, что 5а)Э5тах = +оо. Действительно, функция /(х1,0) —
хг + 2е~~Х1 —+ +оо при Х\ —+ +оо. Значит, у функции / имеется
единственный локальный экстремум в точке х = @,0), не являющийся
абсолютным.
Пример 11. Можно ли утверждать, что если функция одной переменной
имеет в какой либо точке локальный минимум, то в некоторой достаточно
малой окрестности этой точки слева от точки функция убывает, а справа
возрастает ?
Нет. Контрпример: /(ж) = { ^ B + 5[п х)'
х = 0.
Ясно, что ж — О € аЪ&тт/. С другой стороны, в любой окрестности
нуля и справа, и слева производная }'{х) = 2а;B + кт ^) - сок ~, х Ф О,
принимает как положительные, так и отрицательные значения, т.е.
функция / и возрастает, и убывает.
Пример 12. Имеется бесконечное число локальных максимумов, но нет
ни одного локального минимума:
/: К -+ К, /(Х1,Х2) = &тх2-хг.
Необходимое условие экстремума I порядка:
д/(х) _ д/(х) _ Г -2х, = 0; Г *! = °;
—_ — —_ — ^ \' —У" Л _
Стационарные точки хк = (о, | + кж), к&Ъ.
Для проверки условий II порядка надо выписать матрицу вторых
производных в каждой стационарной точке:
0 -апаг2
А
@,1+2шг)
"(
~2
0
Матрица I „ _. ) по критерию Сильвестра является отрицатель-
отрицательно определенной: Ах = -2 < 0, Аг = 2 > 0. Поэтому по достаточному
условию второго порядка @, | + 2птг) € 1остах /V п € 2.
22 Глава 1. Экстремальные задачи
Матрица I . . I по критерию Сильвестра не является неот-
неотрицательно определенной матрицей (.4 ~$- 0). Следовательно, не вы-
выполняется необходимое условие локального минимума. Поэтому точки
@. | + Bп + 1)тг) не доставляют локального минимума. Точки локаль-
локального минимума могли быть только среди стационарных точек, но там их
не оказалось. Следовательно, нет ни одного локального минимума.
1.5. Задачи, упражнения
В задачах 1.1—1.17 без ограничений найти стационарные точки,
проверить их на экстремальность, а также найти все локальные и
глобальные минимумы и максимумы.
1.1.
1.2.
1.3.
1.4.
1.5.
1.6.
1.7.
1.8.
1.9.
/К
/0*1,
/(Ж1,
/(Х\,
/(Ж1,
Ж2) = XI'.
ж2) = х\
х2) = 5х-
Ж2) = Ху
ж2) = Зж
ж2) = ж4
ж2) = 2ж'
-х\
1 + 4
+ 3;32
[Ж2 —
+ Я24
[ + *
50
Ж1
- '■
Х\Х
-х\
2
- 1
- (
\-
20
ж2
-+ ех1г.
6ж2 -+ ех!г.
2 + а?2 — 16а?1 — 12а?2
+^
\Х\Х2
*\-
^+Ж!Ж2 + 2Ж!Ж
-+ ех!г.
К1а;2 —+ ех!г.
ж2) —+ ех!г.
2ж2 -+ ех!г.
-+ ех!г.
!ж3 —+ ех!г.
ех!г.
1.10. /(жь ж2) = Ж1Ж21п(ж1 + х\) -* ех1г.
1.11. /(жьж2) = х\х\F-Х1 -ж2)-+ех1г.
1.12. /(жьж2) = е2г>+3х2(8х\ - Ьхххг + Зж2) -+ ех!г.
1.13. /(жь ж2) = е^-^^б - 2Ж1 + ж2) -+ ех1г.
1.14. /(жьж2,ж3) = Ж1Ж2ж3G -Х\- 2ж2 - Зж3) -+ ех1г.
1
1.15. /(х\, ж2) = / (I2 + ж2^ + Х\J дЛ, -+ гшп
-1
(задача о полиномах Лежандра второй степени).
§ 2. Конечномерные гладкие задачи с равенствами 23
1
[ 3 2 2
^
-1
(задача о полиномах Лежандра третьей степени).
1.17. Найти экстремумы неявно заданной функции двух переменных
Хт, — {{Х1,х2), если
Р(Х\, Х2, Жз) = Х\ + Х2 + Жз — Х\Хт, — Х2Хт, + 2Ж1 + 2Ж2 + 2Жз — 2 = 0.
§ 2. Конечномерные гладкие задачи
с равенствами
В этом параграфе даются необходимые и достаточные условия экс-
экстремума в гладкой конечномерной задаче с ограничениями типа равенств.
2.1. Постановка задачи
Пусть /{•. К" -+ К, г = 0,1,...,т, — функции п переменных.
Считаем, что все функции /,■ обладают определенной гладкостью. Гладкой
конечномерной экстремальной задачей с ограничениями типа равенств
называется следующая задача:
/о(а!) -> ех1г; /,•(*) = 0, * = 1,..., т. (Р)
2.2. Необходимые и достаточные условия экстремума
2.2.1. Принцип Лагранжа
Сформулируем необходимое условие экстремума I порядка в гладкой
конечномерной задаче с ограничениями типа равенств — принцип
Лагранжа.
Теорема. Пусть х € 1осех1гР — точка локального экстремума в за-
задаче (Р), а функции /,-, г = 0,1,...,т, непрерывно дифференцируемы
в окрестности точки х (условие гладкости). Тогда существует ненулевой
вектор множителей Лагранжа А = (Ао, А1,..., Ат) € Кт+1, А ф 0, такой,
т
что для функции Лагранжа задачи (Р) А(х) = 5^ А,/,(а:) выполняется
условие стационарности
Это соотношение называется условием стационарности. Точки, удо-
удовлетворяющие условию стационарности, называются стационарными.
24
Глава 1. Экстремальные задачи
Доказательство проведем от противного. Предположим, что условие
стационарности не выполняется. Это означает, что векторы
/0Щ ^А ,- = 0,1,...,™,
дх\ ' дхп )'
линейно независимы. Поэтому
ранг матрицы А =
\
дхп
равен
ш+1. Тогда по теореме о ранге матрицы (см. [15, с. 71]) существует
матрица М порядка (тп + 1) х (тп + 1) с определителем, отличным
ит нуля. Допустим для определенности, что этой матрицей является
матрица, составленная из первых столбцов матрицы А:
дЫх) ЭЫх\ \
дхх
V дх,
дх
т+1
Не ограничивая общности, считаем, что /о(#) = 0. Действительно, если
/о(ж) Ф 0, то следует рассмотреть функцию }о(х) = Мх) ~ М*) и для
нее будет выполняться условие /о(#) = /о(^) - /о(#) = 0, а условия
стационарности и точки экстремума для функций /о и /о одинаковы.
Для вектора х = (хь...,хт+1) положим Р(х) = (Ро(х),...,Рт(х)) =
(/о(*,*т+2,■•■,*«),■•■,/т(*,хт+г,...,хп)). Тогда функция Р отобража-
ет некоторую окрестность точки х = (^ь... ,^т+1) € Кт+1 в Кт+1
и является (в силу условий гладкости теоремы) непрерывно дифферен-
дифференцируемым отображением в этой окрестности, Р(х) = 0. Кроме того,
якобиан отображения Р в точке х отличен от нуля, т. е.
\
•=0,1,..,го
По теореме об обратной функции в конечномерных пространствах
(см. следующий пункт) существует обратное отображение .Р некоторой
окрестности точки г/ = 0 в окрестность точки х такое, что Р~1($ = 0) = х
и \Р~1(у) - 2?(й)| ^ ^|2/ - г/| О ^-^г/) - *К *1»| с некоторой кон-
константой К > 0. В частности, для достаточно малого по модулю е
определен вектор х(е):— Р~1(е,0,... ,0), для которого \х(е) - х\ ^ -йГ|е|.
Это означает, что Р(х(е)) = (е,0,...,0), что равносильно равенствам
/о(ж(е), жт+2,..., хп) = е, /,-(г(е), жт+2,..., &„) = 0, г = 1,..., т. Таким
образом, для вектора х(е) = (х^е),...,хть\(е),хт+2,■ ■ ■,хп) выполня-
§ 2. Конечномерные гладкие задачи с равенствами 25
ются условия
/о(а:(е)) = е, /((х{е)) = О, г = 1,..., т, A)
и при этом
\х(е) -х\^ К\е\. B)
Из соотношений A)-B) следует, что вектор ж не доставляет в задаче
экстремума, ибо вблизи его существуют допустимые векторы х(е), на
которых функционал /о принимает значения как большие так и меньшие
чем /о (ж) (напомним, что /о(&) = 0). Получили противоречие с тем,
что ж € 1осехгг Р. Таким образом, наше предположение (противного)
неверно и тем самым теорема доказана. ■
2.2.2. Конечномерная теорема об обратной функции.
Теорема Вейерштрасса
Теорема (конечномерная теорема об обратной функции). [19, т. 1,
с. 455.] Пусть Р: Л -* Кп — непрерывно дифференцируемое отображение
некоторой окрестности V С Кп точки ж в Кп, Р(х) = у и якобиан отобра-
отображения Р в точке х отличен от нуля I йе1 Р'(&) = йе11 —-—- I ф 0 1.
Тогда существует обратное отображение Р~1 некоторой окрестности V
точки у в окрестность точки ж такое, что Р~1(у) = х и
\р-1(у)-р~1(у)\^к\у-у\ чуеу
с некоторой константой К > 0.
Пусть /: Кп —* К — функция п переменных. При исследовании
вопроса о достижении функцией п переменных экстремума часто ис-
используется следующая теорема.
Теорема Вейерштрасса. [19, т. 1, с. 235.] Непрерывная функция на непу-
непустом ограниченном замкнутом подмножестве конечномерного пространства
(компакте) достигает своих абсолютных максимума и минимума.
Выделим простое следствие из этой теоремы, которое часто будем
использовать.
Следствие. Если функция / непрерывна на Кп и Шп /(ж) = +оо
|х|-«о
( Ит /(х) = — оо), то она достигает своего абсолютного минимума
|х|-»оо
(максимума) на любом замкнутом подмножестве из Кп.
Напомним, что множество А в метрическом пространстве назы-
называется компактом, если из всякой последовательности элементов А
можно выбрать сходящуюся к элементу из А подпоследовательность или
(равносильное определение) если из всякого покрытия А открытыми
множествами можно выбрать конечное подпокрытие. Ограниченное и
замкнутое множество конечномерного пространства является компактом.
26 Глава 1. Экстремальные задачи
2,2.3. Необходимое условие экстремума II порядка
Сформулируем необходимое условие минимума II порядка в гладкой
конечномерной задаче с ограничениями типа равенств.
Теорема. Пусть х € 1оспипР — точка локального минимума в зада-
задаче (Р), функции /,-, г = О,1,... ,т, дважды непрерывно дифференцируемы
в окрестности точки х (условие гладкости), ёппИп ^ {/{(&),...,/„(&)} =
т (условие регулярности). Тогда существует множитель Лагранжа
А = A, Аь..., Ат) € Кт+1 такой, что для функции Лагранжа задачи
т
(Р) А(х) = /о(ж) + ^З к/г(х) выполняются условия стационарности:
1=1
А'(х) = 0
и неотрицательной определенности матрицы вторых производных:
)^0 V к: (//(ж),к) = 0, 1 = 1,...,го.
Мы сформулировали необходимое условие минимума. Необходимое
условие максимума формулируется аналогично, за исключением того,
что множитель Лагранжа А = (—1, Аь..., Ат) € Кт+1 и соответственно
т
функция Лагранжа А(х) - -/о(а;) + 53 ЬМХ)-
1=1
2.2.4. Достаточное условие экстремума II порядка
Сформулируем достаточное условие минимума II порядка в гладкой
конечномерной задаче с ограничениями типа равенств.
Теорема. Пусть функции /,-, г = 0,1,..., т, дважды непрерывно диф-
дифференцируемы в окрестности точки х (условие гладкости), (ШпНп {/{(&),
• ■ ■ > /т(*)} = т (условие регулярности), существует множитель Лагран-
Лагранжа А = A, Ах,..., Ат) € Кт+1 такой, что для функции Лагранжа задачи (Р)
т
А(х) — /о(х) + 53 ^г/г(х) выполняются условия стационарности:
Л'(ж) = О
и положительной определенности матрицы вторых производных:
(А"(х)к,к) >0 V кфЪ; (//($), Л) = О, г=1,...,т.
Тогда х € 1осгшп Р — точка локального минимума в задаче (Р).
' Шг означает «линейная оболочка».
§ 2. Конечномерные гладкие задачи с равенствами 27
Мы сформулировали достаточное условие минимума. Достаточное
условие максимума формулируется аналогично, за исключением того,
что множитель Лагранжа А = (-1, Аь..., Ат) € Ет+1 и соответственно
функция Лагранжа А(х) = -/о(х) +
1=1
2.3. Правило решения
Для решения гладкой конечномерной задачи с ограничениями типа
равенств следует:
1) Составить функцию Лагранжа
{=0
2) Выписать необходимое условие экстремума I порядка — условие
стационарности функции Лагранжа:
1=0
3) Найти точки х, удовлетворяющие условию стационарности (эти
точки называются стационарными). При этом следует отдельно рассмот-
рассмотреть случаи: а) Ао = 0, Ь) Ао = 1 (или любой положительной константе),
с) Ао = — 1 (или любой отрицательной константе). В случае а) стационар-
стационарные точки могут доставлять и минимум, и максимум в задаче. В случае
Ь) стационарные точки могут доставлять минимум в задаче. В случае с)
стационарные точки могут доставлять максимум в задаче.
4) Найти решение среди стационарных точек или доказать, что
его нет. При этом можно пытаться воспользоваться непосредственной
проверкой или перейти к исследованию условий экстремума II порядка
в каждой стационарной точке.
Выписать матрицу вторых производных Л"(#) и пространство Ь —
{Л €КП !(//(*),/*)= 0, г=1,...,ш}.
Проверить выполнение достаточных условий экстремума — положи-
положительную определенность матрицы вторых производных:
(А"(х)Н,к) >0 V НеЬ, кфЪ.
Если это условие положительности выполняется, то точка х доставляет
в случае Ь) локальный минимум в задаче (х € 1остшР); в случае с)
локальный максимум в задаче (х € 1 остахР).
28 Глава 1. Экстремальные задачи
5) Если не выполняются достаточные условия экстремума, то надо
проверить выполнение необходимого условия экстремума — неотрица-
неотрицательную определенность матрицы вторых производных:
(А"(х)Н,Н) ^0 УЛ61.
Если это условие неотрицательности не выполняется, то точка х не до-
доставляет в случае Ь) локальный минимум в задаче (х & 1осгшпР);
в случае с) локальный максимум в задаче (х % 1остахР).
2.4. Примеры
Пример 1. 4а;! + Зх2 -»• ех1г; х\ + х\ = \.
Решение. Функция Лагранжа
Л = А0Dа;1 + Зх2) + Цх\ + х\- 1).
Необходимое условие локального экстремума:
А' _ о *=> Г Л,, = 0, Г 4А0 + 2Ххг = 0,
Л "° ^^ \Л12 = 0, ^ \ ЗА0 + 2Хх2 = 0.
Если Ао = 0, то А ф 0. Тогда из предыдущих уравнений вытекает, что
Х\ = х2 = 0, но эта точка не является допустимой. Полагаем Ао = -1.
Тогда Хх — —, х2 = —. Подставляя Х1,х2 в ограничение х\ + х\ = 1,
получаем, что
4 9 2 5
_ + ^=,1^25 = 4А 2^А = ±-.
/4 3\ / 4 3\
Соответственно имеем две стационарные точки 1-,-1,1—-,—-I.
По теореме Вейерштрасса (в силу компактности единичной окружно-
окружности) существуют решения задач на максимум и минимум. Рассматривая
значения функционала в стационарных точках, получаем: ,
€ аЪзтах, 8тах = 5.
- 1 еаЬзтт, 5ты = -5.
И)
D-1)
Пример 2. (Ах, х) —» ех1г; (х, х) = 1.
(а; € К", А = (о-ч)} ■__1 — симметричная матрица).
Решение. Существование решения задач на минимум и на максимум
следует по теореме Вейерштрасса, поскольку сфера 5" = {а; € Кп |
\х\2 = (х,х) = 1} компактна.
§ 2. Конечномерные гладкие задачи с равенствами 29
Функция Лагранжа Л = Х0{Ах, х) + Х({х, х) - 1).
Необходимое условие локального экстремума:
Л' = 0 <=> Х0Ах + Хх = 0.
Если Ад = 0, то А ф 0. Тогда из условия стационарности х = 0,
но эта точка не является допустимой. Полагаем Ао = — 1. Тогда Ах = Хх.
Таким образом, стационарные точки — собственные вектора матрицы А.
Домножив соотношение Ах = Хх на х, получим, что (Ах, х) =
Х{х, х) — X. Значит, решение задачи на минимум — собственный вектор
матрицы А, соответствующий наименьшему собственному значению,
решение задачи на максимум — собственный вектор матрицы А,
соответствующий наибольшему собственному значению.
2.5. Задача Аполлония
Древнегреческим ученым Аполлонием (Ш-Н век до н. э.) в книге
«Конические сечения» решается задача о проведении из некоторой точки
к эллипсу самого длинного и самого короткого отрезка. При этом он
решает даже более общую задачу, определяя все проходящие через эту
точку отрезки, перпендикулярные к эллипсу. Решим задачу Аполлония
с помощью метода Лагранжа неопределенных множителей.
Формализованно задача записывается следующим образом:
/о(а;ь х2) ~ (хх - СО2 + (х2 - бJ -* ехгг;
(Х\ \ 2 /Ж9Х2
) + ( ) -1=0 (а! > а2 > 0)
(здесь рассматривается эквивалентная задача об экстремуме квадрата
расстояния).
Функция Лагранжа
Необходимое условие локального экстремума — условие стационар-
стационарности:
А.,. =0^ А0(а;< - &) + А Ц = 0, * = 1,2.
Если Ао = 0, то А ф 0, так как не все множители Лагранжа нули.
Тогда Х\ = х2 = 0, но эта точка не лежит на эллипсе.
30 Глава 1. Экстремальные задачи
* 2
Полагаем Ао = 1. Тогда ж,- = ' ' , г = 1,2. Подставляя эти
а\ + А
значения x^ в уравнение эллипса, получаем
Относительно А это алгебраическое уравнение четвертой степени.
Поэтому число действительных корней уравнения не более четырех, и,
значит, число стационарных точек задачи не более четырех. Каждому
корню А соответствует своя стационарная точка х. График функции
схематически изображен на рис. 3. Если <р@) = —^ -\—^ > 1, то точка
лежит вне эллипса. Этот случай и изображен на рисунках 3 и 4.
Эллипс — ограниченное и замкнутое (т.е. компактное) множество.
По теореме Вейерштрасса решение задач на минимум и максимум
существует. Для полного решения задачи надо решить уравнение A),
получить А,-, найти соответствующие точки х(\$, подставить эти точки
в /о и найти наименьшее и наибольшее из полученных значений
функционала.
Х{ Х(
Условия стационраности х, — & + А^ = О -ФФ> & — Х{ = Х^, г = 1,2,
имеют очевидный геометрический смысл: вектор { — х пропорциона-
пропорционален вектору-градиенту функции /1 в точке х, т.е. лежит на нормали
к эллипсу. Этот факт был впервые установлен Аполлонием. Выведем
из полученных нами соотношений уравнение кривой, «разделяющей» те
точки {, из которых можно провести две нормали, от точек, из ко-
которых можно провести четыре нормали. Очевидно, что это разделение
происходит для А, удовлетворяющих соотношению A), для которых
2„2
Обозначим а\ + X = А^пх) ' , тогда из соотношения B) можно
найти, что а\ + А = -А^а-гJ^- Из последних двух уравнений, вычитая
а\ - а?
из первого второе, найдем, что А = ———-=———. Подставляя
(ЬJ/3 + FаJ/3
вначале в уравнение A) а\ + Х, а\ + \, а затем и А, получаем уравнение
разделяющей кривой:
2/3 Л
' = А
§ 2. Конечномерные гладкие задачи с равенствами
31
-0,1
Рис. 4
(а\-.
Рис. 5
!\2
Это уравнение астроиды. Вне астроиды каждая точка имеет две нор-
нормали к эллипсу, внутри нее — четыре, на самой астроиде — три
(за исключением вершин, где имеются две нормали (рис.4)).
Докажем, что касательная к астроиде перпендикулярна к эллипсу
в точке ее пересечения с эллипсом (рис. 5). Обозначим точку на астроиде
через {. Пусть х — точка на эллипсе такая, что вектор х — { перпендику-
32 Глава 1. Экстремальные задачи
лярен к эллипсу. Для доказательства утверждения достаточно показать,
что вектор х — % перпендикулярен нормали п к астроиде в точке {.
„2
п _М_ с ( ^а' с
По доказанному выше Х{ = —= , и, значит, х — { = I -» $1,
а{ + А \а1 + А
6«2 Л / АС, Л& \ „ ., о» ,
-= ?2 1 — I з Г'—г • Нормалью к астроиде Fа1) +
а2+ X / \ а|+А а2 + А /
(С2а2J = (а1 ~ агJ в точке { является вектор пропорциональный
градиенту функции </(&,&) = Fа1J/3 + (8а2J/3, т.е. вектор п =
(^1 а/ )Сг а2 )• Возьмем скалярное произведение векторов ж — { и п:
а|+А а^ + Х а\ + Х а^ + Х
(подставим значения а% + X, выраженные через А и (&а*J'3)
АF«2J/3 =_А + А = 0
Скалярное произведение векторов равно нулю, следовательно, вектора
х - % и п перпендикулярны.
2.6. Задачи
2.1. х\+х\ -+ех1г; Зж1
2.2. еЖ1а:2 -+ ех!г; ж^ж
2.3. Ж1 + х2 —»• ех1;г; 5ж2
2.4. ж^ + 12ж!Ж2 + 2х\ -+ ех1г; 4ж2 + х\ = 25.
2.5. Жл + а;2 + Жз —*■ ех1г; Ж1 + х2 + х-*, — 1.
2.6. а?! + 2^2 + Зж3 -+ ех1г; ж2 + х\ + ж2 = 1.
2.7. ж2 + х\ + х\ -+ ех!г; х\ + Х2 + х3 = 1, х^ + х2 - ж3 = -.
2.8. 2ж2 - 6х1 - 6x2 - Зж3 —> ех1г; а?! -ж2 + а;з = 0, 5а;!
2.9. #1 + ж2 + х3 -+ ех1г; Жл + х2 - х3 = 1, х\ + х\ + х\ = 1.
2.10. х\х2 + х2хз -+ ех(;г; х\ + х2 = 2, а;2 + ж3 = 2.
2.11. Ж1Ж2Ж3 —+ ех1г; х\ + х\+х\ = 1, Ж1 + х2 + х^ = 0.
§ 3. Конечномерные гладкие задачи с равенствами и неравенствами 33
2.12. х\ + х\ + х\ -+ ех1г; х\ + (х2 - ЗJ + (а;3 - 4J = 1.
2.13.
2.14.
Х\&2 Жз
ххх\х\
—> ехгг;
—»• ех!г;
XI-
х\-
^х2-
ЬЖ, -
Ь23 =
, ~2 _
ЬЖз -
2.15. Найти минимум линейной функции /(х) = (а,х), а,а; € К", на
единичном шаре (х, х) = 1.
2.16. Найти расстояние от точки ж € К" до гиперплоскости (а, х) — Ь,
а е К", 6€К.
2.17. Найти расстояние от точки ж € К" до прямой х = а1 + 6, а, Ь € К".
2.18. Найти максимальную площадь прямоугольника со сторонами, па-
х2 х2
раллельными осям координат, вписанного в эллипс -4 + -| = 1.
а\ а\
2.19. Найти максимальный объем прямоугольного параллелепипеда со
сторонами, параллельными осям координат, вписанного в эллип-
х2 х2 х2 —____
С0ВД 4 + 4 + «1 = 1' | БИБЛИОТЕКА \
2.20. Решить задачу Аполлония для параболы.
2.21. Решить задачу Аполлония для гиперболы.
§3. Конечномерные гладкие задачи
с равенствами и неравенствами
В этом параграфе даются необходимые и достаточные условия
экстремума в гладкой конечномерной задаче с ограничениями типа
равенств и неравенств.
3.1. Постановка задачи
Пусть /<: К" —>■ К, г = 0,1,... ,т, — функции п переменных, ото-
отображающие пространство К" в К. Считаем, что все функции /; обладают
определенной гладкостью. Гладкой конечномерной экстремальной задачей
с ограничениями типа равенств и неравенств называется следующая задача
в К":
/о(а;) -»• пнл; /,-(ж) ^ 0, г = 1,..., т,
}ЛХ) = 0, I = Л1 + 1,. .. , П1. \г)
В задачах, где имеются ограничения типа неравенств, важно, рас-
рассматриваемая задача на минимум или максимум. Для определенности
мы будем рассматривать задачи на минимум. | ВИКЛИПТЯЧС 1
34 Глава 1. Экстремальные задачи
3.2. Необходимые и достаточные условия экстремума
3.2.1. Принцип Лагранжа
Сформулируем необходимое условие экстремума I порядка в гладкой
конечномерной задаче с ограничениями типа равенств и неравенств —
принцип Лагранжа.
Теорема. Пусть х € 1оспнп Р — точка локального минимума в зада-
задаче (Р), а функции /;,г = 0,1,...,т, непрерывно дифференцируемы в окрест-
окрестности точки х (условие гладкости). Тогда существует ненулевой вектор
множителей Лагранжа А = (Ао, А^ ..., Ат) € Кт+1, А ф О, такой, что для
т
функции Лагранжа задачи (/*) Л(а;) = ]С-^/<(а;) выполняются условия:
1=0
а) стационарности:
°Х> 1=0
Ь) дополняющей нежесткости: А;/;(ж) = 0, 1=1,... ,т';
с) неотрицательности: А; ^ 0, г —■ 0,1,..., т'.
Доказательство этой теоремы в более общем случае см. ниже.
Точки, удовлетворяющие необходимым условиям локального экстре-
экстремума, называются критическими. В задаче на максимум Ао ^ 0.
Отметим, что в задаче (Р) с ограничениями типа равенств и нера-
неравенств ограничения типа равенств можно было бы не писать, заменив
любое из равенств /(х) = 0 ■» 0 ^ /(х) < 0 двумя неравенствами
/(х) ^ 0, -/(х) ^ 0.
Упражнение. Докажите, что при такой замене ограничения типа
равенства двумя неравенствами, принцип Лагранжа в обеих задачах дает
одни и те же критические точки.
3.2.2. Необходимое условие экстремума II порядка
Сформулируем необходимое условие минимума II порядка в гладкой
конечномерной задаче с ограничениями типа равенств и неравенств.
Теорема. Пусть х € 1остш Р — точка локального минимума в за-
задаче (Р), функции /;, г = 0,...,т, дважды непрерывно дифференциру-
дифференцируемы в некоторой окрестности точки х (условие гладкости), векторы
^),..., {'т(х) — линейно независимы (условие регулярности).
§ 3. Конечномерные гладкие задачи с равенствами и неравенствами 35
Тогда существует множитель Лагранжа А = (Ао,Аь... ,Ат) е Кт+1
такой, что для функции Лагранжа задачи (Р)
выполняются условия экстремума I порядка:
а) стационарности:
ахз ,-=о
Ь) дополняющей нежесткости:
А,Л(ж) = 0, <=1,...,т';
с) неотрицательности:
А;^0, * = 0,1,...,т';
2/
тах
(ж, А)Л, к) ^ 0 V к е К,
где 21Г := {Л € К" | (//(*),Л) < 0, г = 0,1,... ,т', <//(А),А> = 0, г =
т' + 1,...,т} — конус допустимых вариаций, а С — совокупность
множителей Лагранжа А, для которых выполнены условия а)-с).
Доказательство этой теоремы см. ниже.
Мы сформулировали необходимое условие минимума. Необходимое
условие максимума формулируется аналогично, за исключением того,
что множитель Лагранжа А = (-1, Аь..., Ат) и соответственно в конусе
допустимых вариаций (/о(ж),/г) ^ 0.
3.2.3. Достаточное условие экстремума II порядка
Сформулируем достаточное условие минимума II порядка в гладкой
конечномерной задаче с ограничениями типа равенств и неравенств.
Теорема. Пусть функции /<, г = 0,...,т, дважды непрерывно диф-
дифференцируемы в некоторой окрестности точки А (условие гладкости),
векторы }'т,+1{х),... ,}'т{х) — линейно независимы (условие регулярно-
регулярности), существует множитель Лагранжа А = (Ао,..., Ат) € Кт+1 с Ао = 1
такой, что для функции Лагранжа задачи (Р)
выполняются условия экстремума I порядка:
36 Глава !. Экстремальные задачи
а) стационарности:
Ь) дополняющей нежесткости:
Л,/<(
с) неотрицательности:
тах (Лм(ж, А)/г, к) ^ а||/г||2 V /г € К
с некоторой положительной константой а, где К:= {/г€К"|(//(^),/г)<0,
г = 0,1,..., т', {//(ж), /г) = 0, г = т' + 1,..., т} — конус допустимых
вариаций, а С — совокупность множителей Лагранжа А, для которых
выполнены условия а)-с) с Ао = 1.
Тогда А € 1осгшп Р — точка локального минимума в задаче (Р).
Доказательство этой теоремы см. [ГТ, с. 124].
Достаточное условие максимума формулируется аналогично, за ис-
исключением того, что множитель Лагранжа А = (— 1, Ал,..., Ат).
3.3. Правило решения
Для решения гладкой конечномерной задачи с ограничениями типа
равенств и неравенств следует:
т
1) Составить функцию Лагранжа А(х) = ]Р А*/<(а;).
1=0
2) Выписать необходимое условие экстремума I порядка:
а) стационарности:
Ь) дополняющей нежесткости:
А,-/.-(А) = 0, г = 1,...,го
с) неотрицательности:
А; ^ 0, г = 1,... ,т.
§ 3. Конечномерные гладкие задачи с равенствами и неравенствами 37
3) Найти точки х, удовлетворяющие условиям а)-с) (эти точки
называются критическими).
При этом следует отдельно рассмотреть случаи
а) А0 = 0;
Ь) Ао = 1 (или любой положительной константе);
с) Ао = -1 (или любой отрицательной константе).
В случае а) критические точки могут доставлять и минимум, и макси-
максимум в задаче. В случае Ь) критические точки могут доставлять минимум
в задаче. В случае с) критические точки могут доставлять максимум
в задаче.
При нахождении критических точек в условиях дополняющей не-
нежесткости А{/;(ж) = 0 для каждого г надо рассматривать два случая:
Л, = 0 и А< Ф 0.
4) Исследовать на локальный и абсолютный экстремум найденные
критические точки или, если их нет, найти 5пид и 5шах и указать
последовательности допустимых точек, на которых эти абсолютные
экстремумы достигаются.
При этом можно пытаться воспользоваться непосредственной про-
проверкой или перейти к исследованию условий экстремума II порядка в
каждой критической точке. Отметим, что проверка выполнения необхо-
необходимых или достаточных условий экстремума в задаче с ограничениями
типа равенств и неравенств — задача непростая. Поэтому, как правило,
мы будем при исследовании экстремума использовать непосредственную
проверку, сравнивая значение исследуемой функции в критической точке
с ее значениями в близких допустимых точках.
3.4. Примеры
Пример 1.
хх + х2 + а;3 —*■ т'ш; 2х\ — х2 + х^ ^ 5, а^ + х2 + х^ = 3.
Решение. Функция Лагранжа
Л = Х0(х\ +х\+ х\) + ХгB^1 - Х2 + Жз - 5) + А2(Ж1 +Х2+Х] - 3).
Необходимые условия локального минимума:
а) стационарности:
АХ1 = 0 4=> 2А0Ж! + 2Ал + А2 = 0,
Г АХ1 = 0, Г 2ХоХ1 + 2А1 + А2 = 0,
Л' = 0 <=> < ЛЖ2 = 0, <=> <^ 2Хох2 - Хг + Х2 = 0,
I АХ} =0, I 2А0ж3 + А! + А2 = 0;
Ь) дополняющей нежесткости:
х2 + Х]-5) = 0;
38 Глава 1. Экстремальные задачи
с) неотрицательности:
Ао > О, А! ^ 0.
Если Ао = 0, то из уравнений пункта а) выводим, что А1 = А2 = 0 —
все множители Лагранжа — нули, а этого быть не может.
Поэтому Ао ф 0, полагаем Ао = -.
Предположим \\ф§, тогда в силу условия Ь) 1х\ — х2 + хт, — 5 = 0.
Выразим Хх,Х2,хз из условия а) через Аь А2: Х\ = -2А!-А2, ж2 = А1-А2,
хт, = — А[ — А2, и подставив в уравнения х\ + Х2 + х->, = 3, 1х\ — х2 + хз = 5,
получим, что
Г - 2А! - А2 + А! - А2 - А! - А2 = 3, ( - 2Хг - ЗА2 = 3,
\ - 4АХ - 2А2 - А! + А2 - А1 - А2 = 5, \ - 6\г - 2А2 = 5,
9
откуда Ах = —- < 0 — противоречие с условием неотрицательности Ь).
Значит, в случае \\ ф 0 критических точек нет.
Пусть А! = 0. Тогда х\ = х2 = а;3 = -А2. Подставляя ж,- = -А2
в равенство х\ + х2 + х^ = 3, получаем, что -ЗА2 = ЗО-А2 = -1=^а;1 =
хг = хъ — 1 — единственная критическая точка.
Функция }(х) = х\ + х\ + х\ —*■ оо при \х\ —» оо, значит по след-
следствию из теоремы Вейерштрасса решение задачи существует, а в силу
единственности критической точки решением может быть только она.
Итак, х = A,1,1) € аЬ$тт, 5т1п = 3.
Пример 2. Приведение квадратичной формы к главным осям.
д
Пусть А = (яу)(. .=1 — симметричная матрица (Оу = ау,) и ф(а;) =
л
Е«
•,.7=1
Х] = {Лж, ж) — соответствующая ей квадратичная форма.
Теорема. В пространстве К" существует ортонормированный базис
/ь • • • > /п. в котором квадратичная форма С} имеет представление
1=1
В базисе /ь. .-,/„ матрица формы ^ диагональна. Направления
векторов /ь...,/п называются главными осями формы С}, а переход
к базису /ь ..., /п называется приведением формы к главным осям.
Доказательство. Если ф = 0, то А! = ... = А„ = 0, /ь..,/„ —
любая ортонормированная система.
§ 3. Конечномерные гладкие задачи с равенствами и неравенствами 39
Пусть С? ^ О, тогда ф принимает положительные или отрицательные
значения. Для определенности считаем, что ф принимает отрицательные
значения. Рассмотрим первую экстремальную задачу
(Ах, х) —»тт; (х, х) ^ 1. (Ру)
Если ф принимает только неотрицательные значения, то надо рассма-
рассматривать задачу на максимум.
Решение ж = /г задачи (Ру) по теореме Вейерштрасса существует,
так как шар В = {ж € К" | (х,х) ^ 1} является компактом в К",
а функция (Ах,х) непрерывна. Функция Лагранжа задачи (Р{) Л =
Х0(Ах, х) + А ({ж, х) - 1) .
Необходимые условия минимума:
а) стационарности: Ах = О «=> Х0А^ + Х/1 = 0;
Ь) дополняющей нежесткости: А({/ь /1) — 1) = 0;
с) неотрицательности: Ао ^ 0, А ^ 0.
Если Ао = 0, то А ф 0 и из пункта а) выводим, что Д = 0, но это
противоречит условию Ь).
Поэтому Ао ф 0, полагаем Ао = 1. Тогда из а) А}\ = — АД.
Умножая последнее равенство скалярно на /ь получим, что (.А/1,/1) =
-Ц/ъ/г} = Зтш < 0. Отсюда А > 0 и по условию Ь) {/ь/0 = 1. Таким
образом, /1 — собственный вектор матрицы А, А}\ = А^ (А! = —А),
1Д1 = 1, 5пш1 = Аь А! — минимальное собственное значение матрицы А.
Обозначим Ь\ = {х € К" | (х, }\) = 0} — подпространство в К".
Если С}{х) = 0 V х € Ь\, то А2 = ... = А„ = 0, /г, • • •, Д — любая
ортонормированная система из Ь^.
Пусть <Э ^ 0 на Ь\. Тогда ^ на 2^! принимает положительные или
отрицательные значения. Для определенности теперь считаем, что ф
принимает на Ь\ положительные значения. Рассмотрим вторую задачу
(Ах, х) -> тах; (х, х) < 1, (х, /,) = 0. (Р2)
Решение х = /2 задачи (Р2) по теореме Вейерштрасса существует, так
как сечение шара Б плоскостью Ь^ является по-прежнему компактом.
Функция Лагранжа Л = Хй(Ах, х) + \((х, х) - \) + 2ц(х, /1).
Необходимые условия максимума:
а) стационарности: Ах = 0 «=> А0-4/2 + А/2 + ц}х = 0;
Ь) дополняющей нежесткости: А((/2,/2) - 1) = 0;
с) неотрицательности: Ао ^0 (задача на максимум!), А ^ 0.
Если Ао = 0, то из пункта а) выводим, что А/2 + ^Д = 0. В силу
линейной "независимости векторов /1 и /2 следует, что А = (I = 0 — все
множители Лагранжа — нули, а этого быть не может.
Поэтому Ао Ф 0, полагаем Ао = -1. Тогда из а) А/2 = А/2 +М/1-
Умножая последнее равенство скалярно на /1 и учитывая ортогональ-
ортогональность векторов Д и /2, получим, что (А/2,/1) = А(/2,/1) +м(//) 2 '
40 Глава 1. Экстремальные задачи
/О !/==1М- Отсюда р = (АЬ,/!) = (/2, А/г) = {/г^/д = 0. Умно-
жая полученное равенство А/2 = ^/г скалярно на /2, получим, что
(А/2, /г) - Ц/г,/г) = ■З'тах > 0. Отсюда А > 0 и по условию Ь)
(/2) /т) = 1- Таким образом, /2 — собственный вектор матрицы А,
А/2 = ^2/2 (М = А), |/2| = 1, векторы /1 и /2 ортогональны.
Далее поступаем подобным образом. Вводим подпространство Ь2 =
{х € К" | (х, /г) = 0, (х,/2) = 0}. Если <?(ж) = 0 V х € Ь2, то
Аз = ... = А„ = 0, /з,..-,/п — любая ортонормированная система
из 2^2 • Пусть B^0 на 2/2 • Тогда ф на 2/2 принимает положительные или
отрицательные значения. Вновь рассматриваем задачу на минимум или
максимум:
{Ах, х) -> еххг; (х, х) ^ 1, (х, /0 = {х, /2) = 0. (Р3)
Решая эту задачу, получаем единичный вектор /з такой, что -А/з =
/з ортогонально /\ ш /2-
Поступая аналогично, в итоге придем к ортонормированному ба-
базису /\,-..,/п из собственных векторов матрицы А с собственны-
п
ми числами А1,...,А„. При этом для вектора х = 5Г(а;>/>)/> имеем
1=1
** = Х>> П)*П = Ё А,-<аг, /,)/,■ и
1=1 1=1
п
)
1=1 7=1 1=1
3.5. Задачи
3.1. х\хгхт, —> еххг; ж^ + х\ + х\ ^ 1.
п
3.2. тах ж] —»• ехгг; ^3 х) ^ 1 •
7=1
3.3. Е^-; ^]^
7=1 7=1
3.4. е*1""*2 - а?! - а;2 ->■ ехгг; а?! + ж2 ^ 1, Х\^0, х2^0.
3.5. а^ + а;2 -»• ехгг; ж^ + а;^ ^ 1, а?! ^0, а;2 ^ 0.
3.6. а?! + х1 + х\ —»ех!г; а?! + а;2 + а;3 ^ 12, а?! ^ 0, а;2 ^ 0, а;3 ^ 0.
3.7. х\ + Ах\ + х\ —»• ехгг; ат^атг + атз ^ 12, а?! ^ 0, а;2 ^ 0, а;3 ^ 0.
3.8. а?! + а;? + а;з-^ ехгг; а^ +а;2 +а;з ^ 1, х^0, хг +х2 - а;3 = -.
3.9. 2а?1 + 2а?1 + 4а;2 - За;3 -> еххг; 8а?! - За;2 + За;3 ^ 40,
—2а?1 + Х2 ~ хз = ~3, а;2 ^ 0.
§4. Выпуклые задачи 41
ЗЛО. 2х\ + 2а;! + 4х2 - Зх3 -> ехгт; &хг - Зх2 + Зх3 = 40,
3.11. За;1 — Па^ — За;2 — а;3 —*■ ех!г; Ху — 1х2 + За;3 +7^0,
5х\ + 2ж2 — а;3 ^ 2, а;3 ^ 0.
3.12. За;2 - 11а;! - За;2 - х3 —> ех!г; Ху - 1х2 + За;3 + 7 ^ 0,
5ху + 2ж2 — а;3 ^ 2, а;3 ^ 0.
3.13. а;1а;3-2а;2 —> ех1г; 2а;1-а;2-За;3 ^ 10, а;2 ^ 0, За;14-2а;24-а;3 = 6.
3.14. а;!а;2а;3 —» ех!г; а;3 ^1, а;! ^ 1, а;2 ^1, а;^ 4-^ + ^з = 8.
3.15. Доказать неравенство для средних степенных
п п
/Е1а:7|Рч1/р /Е1Ж71*\1/«
^ ) й[^ ) , 0<Р^оо,
\ т 1 \ т I
путем решения экстремальной задачи
7=1 7=1
3.16. Доказать неравенство между средним арифметическим и средним
геометрическим:
^) ^ ■/=1,...,т.
7=1 У т
§ 4. Выпуклые задачи
Пусть в этом пункте X — линейное нормированное пространство
(определение линейного нормированного пространства см. в §5), для
простоты понимания можно считать, что X = К" — конечномерное
пространство.
4.1. Элементы выпуклого анализа. Субдифференциал
Напомним определение выпуклого множества. Множество А С X
называется выпуклым, если для любых двух точек п\ и ат из А и любого
числа I € @, 1) элемент Ь^ + A - 1)а2 € А.
Пусть С:= {с1,...,ст} С X — некоторое конечное подмножество.
Элемент V = ]Р 2,-с,-, 2,- ^ 0, г = 1,..., т, ]Р 2,- = 1, называется выпуклой
{=1 {=1
комбинацией С.
42 Глава 1. Экстремальные задачи
Совокупность всех выпуклых комбинаций конечных подмножеств
множества С называется выпуклой оболочкой С и обозначается сопуС
(иногда со С).
Можно легко показать, что множество сошС совпадает с пересе-
пересечением всех выпуклых множеств, содержащих С (иногда это свойство
берут за определение выпуклой оболочки).
Выпуклая оболочка конечного числа точек называется выпуклым
многогранником.
Пусть задана функция (функционал) /: X —* К := К Ы {—оо} Ы {+оо}.
Множество
еР1/ = {(а, х) е К х X \ а > /(х)}
в пространстве К х X называется надграфиком функции /.
• Функция / называется выпуклой, если надграфик / — выпуклое
множество.
• Функция / называется замкнутой, если надграфик / — замкнутое
множество.
• Функция / называется собственной, если /(ж) > -оо V х и / ^ +оо.
Мы будем изучать выпуклые собственные функции. Для краткости
будем называть их просто «выпуклые» функции.
Из определения выпуклого множества сразу следует, что функция
выпукла тогда и только тогда, когда выполнено неравенство Иенсена:
\/хьх2еХ, V * € @, 1).
Ясно, что сумма двух выпуклых функций является функцией вы-
выпуклой. Но суперпозиция двух выпуклых функций не всегда является
выпуклой функцией. Попробуйте привести пример!
Выпуклость многих классических функций одной переменной сразу
вытекает из следующей теоремы.
Теорема 1. [Р, с. 42.] Пусть функция /: К —*• К дважды непрерывно
дифференцируема (/ € 1?2(К)). Тогда она выпукла тогда и только тогда,
когда ее вторая производная неотрицательна (/"(х) > О V х € К).
Приведем несколько примеров выпуклых функций, выпуклость ко-
которых сразу следует из теоремы 1 и определения выпуклой функции.
1. /(ж) = ем, а€К.
2. /(х) = \хГ,р>1.
Выпуклость функций из примеров 1-2 сразу следует из теоремы 1
и определения выпуклой функции.
3. Аффинная функция }{х) = (а, х) +Ъ, а € К", Ь € К, в многомерном
случае (/: К" -»• К).
§ 4. Выпуклые задачи 43
Аффинная функция является выпуклой по неравенству Иенсена.
Выпуклость функций нескольких переменных можно определять
также из следующего многомерного обобщения теоремы 1.
Теорема 1. [Р, с. 42.] Пусть функция /: К" —» К дважды непрерывно
дифференцируема (/ € 1>2(КП)). Тогда она выпукла тогда и только тогда,
когда ее матрица вторых производных [гессиан) всюду неотрицательно
определена (}"{х) = ( ^ ) ^ О V х € К" ).
4. Квадратичная функция С}(х) = (Ах, х), где А — симметричная
матрица, является выпуклой тогда и только тогда, когда матрица А
неотрицательно определена.
Это сразу вытекает из теоремы 2.
Выпуклыми функциями многих переменных (функционалами) явля-
являются также следующие функции:
5. Функция нормы
|,...,|а:„|}, р = +оо.
6. Индикаторная функция выпуклого множества А С X
Щх)={
_ / о, хеа,
+оо, х & А.
7. Функция Минковского выпуклого множества А С X
{О, аГхх ЕА V а > О,
+оо, а~1х&А V а > О,
тт{а | а > 0, а-1а; € .4}, иначе.
Функция Минковского означает наименьшее число, в которое надо
уменьшить вектор х, чтобы он попал в множество А.
8. Опорная функция непустого множества А С X
$А(х*) = тах (х*, х).
х€А
Дадим определение важного понятия выпуклого анализа — поня-
понятия субдифференциала функции, обобщающего для выпуклых функций
понятие производной в гладком анализе.
Субдифференциалом выпуклой функции / в точке х называется следу-
следующее множество в сопряженном пространстве X*:
0/D) = {х* еХ*\(х-х, х*) ^ /(ж) - /(А) V х € Х).
44
Глава 1. Экстремальные задачи
Напомним, что сопряженным пространством X* называется прост-
пространство линейных непрерывных функционалов на X. В случае X = К"
сопряженное пространство (К")* = К".
Из определения сразу вытекает, что субдифференциал — выпуклое
множество в X*. Легко доказать, что оно замкнуто. Субдифференциал
дифференцируемой функции совпадает с ее производной.
Для функции одной переменной субдифференциал д/(х) — это
совокупность угловых коэффициентов к, при которых прямые у = кх+Ь,
проходящие через точку (х, / (ж)), лежат под графиком функции у = / (х).
Пример. /(ж) = \х\ (см. рис.6).
Рис.6
Для субдифференциала суммы функций имеет место теорема анало-
гачная теореме о производной суммы функций.
Теорема Моро—Рокафеллара [5]. Пусть /1 и /г — выпуклые функции
на X. Существует точка х0, в которой функция }\ конечна (|/1(а:о)| < оо),
а функция /2 непрерывна (/ € С(Х(,)). Тогда
/2)И = 0/1 (*) + Э/2(Х) V X.
При доказательстве необходимых условий экстремума в гладкой
задаче с равенствами и неравенствами нам понадобится следующая
теорема о субдифференциале максимума.
Теорема Дубовицкого—Милютина [5]. Пусть /1 и /г — выпуклые
функции, непрерывные в точке х, /г(х) = /г(^)- Тогда
вшах{/1,/2}D) = сопу@/,(А) и 0Д(А)).
Важным примером выпуклой функции является сублинейная функ-
функция. Функция р называется сублинейной, если ее надграфик является
выпуклым конусом с вершиной в нуле.
§ 4. Выпуклые задачи 45
Из неравенства Иенсена следует, что собственная функция является
сублинейной тогда и только тогда, когда
а) р(Хх) = \р(х) V А > О, V х € X;
Ь) р(х1 + х2) ^р(х1)+р(х2) Ухих2еХ.
Сформулируем теорему Моро—Рокафеллара и теорему Дубовицко-
го—Милютина для сублинейных функций.
Теорема Моро—Рокафеллара. Пусть Р\,Рг — сублинейные функции,
функция р\ непрерывна, функция р2 замкнута. Тогда в точке х = О
Теорема Дубовицкого—Милютина. Пусть Р\,р2 — непрерывные субли-
сублинейные функции. Тогда
дтах{рьр2}@) = сопу(др1@) Ы др2(О)).
4.2. Теоремы отделимости
При выводе необходимых условий экстремума (принципа Лагранжа)
в выпуклых задачах и в задачах с равенствами и неравенствами мы
будем использовать свойство отделимости непересекающихся выпуклых
множеств.
Определение 1. Множества 1 и В из пространства X называют-
называются отделимыми, если существует линейный непрерывный функционал
А € X*, А ф О, для которого
шГ (А, а) ^ шр{А, 6).
°ел ь&в
Из определения следует, что множества являются отделимыми, если
можно провести гиперплоскость Я = {х € X \ (А,х) — с}, с € К,
так что одно из множеств лежит в одном замкнутом полупространстве
Я+ = {х € X | (А,х) ^ с}, а другое — в другом замкнутом полупро-
полупространстве Я_ = {х € X | (А,х) ^ с}.
Определение 2. Множества А ж В называются строго отделимыми,
если существует линейный непрерывный функционал А € X*, для
которого
Ш1"{А, а) > кир{А, Ъ).
Приведем результаты об отделимости в конечномерном случае.
Теорема 1 (первая теорема отделимости в конечномерном простран-
пространстве). Пусть А и В — непустые выпуклые множества в К", А П В = 0.
Тогда множества А и В отделимы.
г-6 Глава 1. Экстремальные задачи
Теорема 2 (вторая теорема отделимости в конечномерном простран-
пространстве). Пусть А — непустое выпуклое замкнутое множество <? К", Ь @ А.
Тогда точку Ь можно строго отделить от множества А,
Доказательство теорем 1, 2 см. [ГТ, с. 20].
Упражнение. Если в теореме 2 вместо точки Ь взять множество В,
то теорема не будет верна. Привести пример.
Сформулируем результаты об отделимости в случае нормированных
пространств.
Теорема 1' (первая теорема отделимости в нормированном простран-
пространстве). Пусть А и В — непустые выпуклые множества в X, т1А Ф 0,
ш{ А П В = 0. Тогда множества А и В отделимы.
Теорема 2' (вторая теорема отделимости в нормированном простран-
пространстве). Пусть А — непустое выпуклое замкнутое множество в X, Ь & А.
Тогда точку Ь можно строго отделить от множества А.
Доказательство теорем 1', 2' см. [АТФ, с. 124].
4.3. Задачи без ограничений
Пусть /: X —» К — выпуклая функция, отображающая нормиро-
нормированное пространство X в расширенную прямую. Выпуклой задачей без
ограничений называется следующая экстремальная задача:
/(а)-ишп. (Р)
Теорема (аналог теоремы Ферма). Для того чтобы точка А доставляла
в выпуклой задаче без ограничений (Р) абсолютный минимум (& € аЪяшпР),
необходимо и достаточно, чтобы выполнялось соотношение
0 €
Доказательство.
х € аЬкпшгР ■& /(ж) - /(ж) > 0 = {0,х-х)
Поскольку из выпуклости функции / не следует, вообще говоря,
выпуклость функции -/, то существенно, что рассматривается задача
на минимум а не на максимум.
4.4. Задачи с ограничением
Пусть /: X —» К — выпуклая функция, отображающая нормиро-
нормированное пространство X в расширенную прямую, Б С X — выпуклое
§ 4. Выпуклые задачи 47
множество. Выпуклой задачей с ограничением (или просто выпуклой зада-
задачей) называется следующая экстремальная задача:
/(ж) -> тт; ж € Я. (Р)
Теорема. Пусть ж € 1оспйпР — доставляет локальный минимум
в выпуклой задаче (Р). Тогда ж € аЪшцпР — доставляет абсолютный
минимум в этой задаче.
Доказательство. Пусть ж € 1осттР. Это означает, что существует
окрестность V точки ж, такая, что
/(ж) < /(ж) V ж € V П Б. (*)
Возьмем произвольную точку х & Б. Тогда, поскольку ж и ж из I?,
то х = A-а)ж+аж € V П В при достаточно малом а > 0. Следовательно,
(*)
/(ж) < /(ж) = /(A - а)х + ах) < (по неравенству Иенсена) A - а)/(ж) +
а/(ж), откуда а/(ж) < а/(ж) <» /(ж) < /(ж) V ж € I). Значит, ж
доставляет абсолютный минимум в задаче (Р). ш
Из теоремы следует, что в выпуклой задаче локальный минимум
является и абсолютным (глобальным). Поэтому в дальнейшем в выпуклых
задачах, говоря «минимум», имеем в виду абсолютный минимум.
4.5. Задача выпуклого программирования
Пусть /,•: X —» К, г — 0,1,..., гп, — выпуклые функции, отображаю-
отображающие линейное нормированное пространство X в расширенную прямую,
А С X — выпуклое множество. Задачей выпуклого программирования
называется следующая экстремальная задача:
/о(ж) -> ппп; /;(ж) < 0, г = 1,..., гга, ж € А. (Р)
Точка ж называется допустимой в задаче (Р), если ж € А и выпол-
выполняются все заданные ограничения типа неравенств.
Упражнение. Докажите, что задача выпуклого программирования
является выпуклой задачей, т. е., что множество допустимых элементов
в этой задаче является выпуклым множеством.
При проверке достаточных условий минимума в задаче выпуклого
программирования будет использоваться некоторое условие регулярности
множества допустимых элементов — условие Слейтера. Множество
допустимых элементов в задаче (Р) удовлетворяет условию Слейтера,
если существует точка х € А, для которой /,(ж) < 0, г — 1,... ,т.
48 Глава 1. Экстремальные задачи
Теорема Куна—Таккера.
1. Если х € аЬзтш Р — решение задачи выпуклого программирования, то
найдется ненулевой вектор множителей Лагранжа А = (Ао, А^..., Ат) €
т
КтИ, такой, что для функции Лагранжа А(х) — ][}А;/,(а:) выполняются
1=0
условия:
а) принцип минимума для функции Лагранжа
ттЛ(а:) =
х€А
Ь) дополняющей нежесткости:
с) неотрицательности:
А,- > 0, г = 0,1,...,т.
2. Если для допустимой точки х выполнены условия а)—с) и Ао Ф 0, то
х € аЬзттР.
3. Если для допустимой точки х выполнены условия а)—с) и множество
допустимых элементов удовлетворяет условию Слейтера, то х € аЬзгшпР.
Доказательство. Пусть ж € аЬзгшпР. Не ограничивая общности,
считаем, что /о(ж) = 0 — иначе введем новую функцию /о(ж) =
/о(а;) - /о(ж). Положим
В={Ь = (Ь0,Ьи...,Ьт)е-Кт+1\ЗхеА: /{(х)^Ь{, • = 0,1,...,»»}.
Покажем, что В — непустое выпуклое множество. Действительно,
неотрицательный октант К^+1 С В, т. е. любой вектор с неотрицательны-
неотрицательными компонентами принадлежит В, ибо в определении множества В мож-
можно положить х — х. Докажем выпуклость множества В. Пусть точки Ь
и Ь' принадлежат множеству В. Надо доказать, что а6+A -а)Ь' € В V а €
@, 1). Поскольку точки Ь, Ь' € В, то по определению множества В су-
существуют х,х' € А такие, что }{{х) ^ 6,-, /((ж') ^ Ь\, г = 0,1,... ,т.
Положим ха = ах + A - а)х'. Тогда жа € -4, поскольку .4 — выпукло,
а ввиду выпуклости функций /,-, г = 0,1,..., т, по неравенству Иенсена
/;(а;а) = /;(аа: + A - а)*') ^ аЛ(в) + A - а)Д(а;') ^ аб, + A - аN,',
т. е. точка аб + A — а)Ь' € 5.
Обозначим С = {с = (со,0,...,0) € Кт+1 | со < 0} — открытый луч
в пространстве Кт+1. Ясно, что С — непустое выпуклое множество.
Покажем, что С П В = 0. Действительно, если бы существовала точка
с € С П В, то ввиду определения множества В отсюда следовало
бы, что имеется элемент х € А, для которого выполняются неравенства:
§ 4. Выпуклые задачи 49
/0(ж) ^ со < О, /;(ж) < О, г = 1,..., га. Но из этих неравенств следует, что
для допустимой точки ж /0(ж) < /0(ж) = 0, т. е. ж ^ аЬкгшпР. Получили
противоречие с условием теоремы ж € аЬзпгшР. Значит С П В = 0.
По первой теореме отделимости в конечномерном пространстве
множества В я С можно отделить, т.е. существует вектор А = (Ао,Аь
..., Ат) ф О, для которого
= аир Аосо ^ 0 .
Таким образом,
т
^2А<6< >о у ьев . (*)
1=0
Из неравенства (*) будут выведены условия неотрицательности,
дополняющей нежесткости и принцип минимума.
1. Условие неотрицательности. Поскольку, как мы уже говорили, лю-
любой вектор с неотрицательными компонентами принадлежит В, то вектор
@,..., 0,1,0,..., 0) € В, где единица стоит на г-ом месте (счет начинаем
с нуля). Подставив эту точку в неравенство (*), получим, что А,' ^ 0.
Условие дополняющей нежесткости. Нетрудно видеть, что точка
@,..., 0, /,•(&), 0,..., 0) € В. Действительно, в определении множества В
возьмем х = ж, тогда х € А и нужные неравенства выполняются. Под-
Подставив эту точку в неравенство (*), имеем А,/,(ж) ^ 0. Если А;/,(ж) > 0,
то (так как по уже доказанному условию неотрицательности А,' ^ 0)
/,-(ж) > 0 — это противоречит допустимости точки ж. Значит, А,/,(ж) = 0.
Принцип минимума. Возьмем точку х 6 А, тогда точка (/о(ж),
}\(х),...,}т(х)) € В. Значит по неравенству (*)
А(х) = X) \№) > 0. =
1^0 1=0
так как, не ограничивая общности, положили /о(ж) = 0 и по уже дока-
доказанному условию дополняющей нежесткости А,/,(ж) =0, г — 1,...,гга.
Таким образом, принцип минимума для функции Лагранжа доказан.
2. Пусть для допустимой точки х выполнены условия а)—с) и Ао ф 0.
Положим Ао = 1. Тогда для любой допустимой точки х будет выполняться
неравенство
/о(*> = /о(*>+Х^ А«/«(*) = л(*) < ^ч*) - мх)+Т, х*№) < /»(*)
1=1 1=1
(в последней сумме все слагаемые А,/,(а;) неположительны). Неравенство
/о(ж) ^ ^(а1) для любой допустимой точки х означает, что ж € аЬкгшпР.
50 Глава 1. Экстремальные задачи
3. Пусть для допустимой точки А выполнены условия а)—с) и мно-
множество допустимых элементов удовлетворяет условию Слейтера. Пред-
Предположим, что при этом Ао = 0. Так как вектор А ф 0, то в силу условия
неотрицательности существует хотя бы одно А^- > 0, ]■ € {1,...,т}.
Следовательно,
т с) т
А(х) = 2^ А,/,(ж) ^ \]}]{х) < 0 = 2^ А,/,(#):
1=1 1 = 1
Но это полученное неравенство противоречит условию а). Значит, наше
предположение, что Ао = 0 неверно. Поэтому Ао Ф 0 и по доказанному
п. 2 ± € аЬкгшп Р.
Теорема Куна—Таккера полностью доказана. ■
Из теоремы Куна—Таккера можно вывести достаточные условия
абсолютного минимума в выпуклой задаче с неравенствами без ограни-
ограничения типа включения. Рассмотрим задачу
/о(х) -> 1шп; /,-(а;) ^ 0, г = 1,..., т. (Р')
Теорема. Пусть /,■: X —» К, г — 0,... ,гга, — выпуклые функции, х —
допустимая точка в задаче (Р') (& € Ор1), для функции Лагранжа
т
А(ж) = 5Г А,-/,-(ат) с множителем Лагранжа Ао > 0 в точке х выполняются
1=0
условия:
а) условие стационарности функции Лагранжа: 0 € дА(А);
Ь) дополняющей нежесткости: А,-/,(ж) = 0, г = 1,..., т;
с) неотрицательности: А; ^ 0, % = 1,..., т.
Тогда ж€ аЬягшпР'.
Доказательство. Поскольку /,: X —» К, г = 0,... ,тп, — выпуклые
т
функции, то функция Лагранжа Л(ж) = Х}А(/|(а;) с неотрицательны-
{=0
ми множителями Лагранжа является выпуклой функцией. По аналогу
теоремы Ферма для выпуклых функций условие 0 € дА(х) является
необходимым и достаточным условием абсолютного минимума функции
Лагранжа в точке ж. Значит, условие стационарности функции Лагранжа
в настоящей теореме равносильно принципу минимума для функции
Лагранжа в теореме Куна—Таккера. Таким образом, для нашей задачи
выполняются соотношения а)-с) теоремы Куна—Таккера с множите-
множителем Лагранжа Ао ф 0. По п. 2 теоремы Куна—Таккера следует, что
ж € аЬшшпР'. ■
Легко видеть, что теорема остается верной и для задач с ограниче-
ограничениями типа равенств и неравенств, если функции, задающие равенства,
§4. Выпуклые задачи 51
являются аффинными. (В этом случае, как мы говорили об этом в п. 3.2
равенство /(ж) = 0 -» 0 ^ /(ж) ^ 0 заменяется двумя неравенствами
/(ж) ^ 0, —/(ж) ^ 0. Из аффинности функции / следует выпуклость
функций /и -/.)
Пример.
/(жь ж2) = х\ + ххх2 + ж2 + 3|Ж! + ж2 - 2| -> шш.
Решение. Функция /(ж) является выпуклой функцией как сумма
двух выпуклых функций. Действительно, функция д(х) = х\ + ж;ж2 + х\
выпукла по Теореме 2 п. 4.1, так как по критерию Сильвестра матрица
вторых производных
о
положительно определена и не зависит от х. Очевидно, что функция
к{хх, Х2} = \х\ + Х2 — 2|, являющаяся модулем линейной функции также
является выпуклой функцией.
Необходимое и достаточное условие экстремума в выпуклой задаче
без ограничений:
0 е д/(х) = дд(х) + Ъдк{х) A)
(использовали теорему Моро—Рокафеллара о субдифференциале сум-
суммы функций). Для дифференцируемой функции ее субдифференциал
совпадает с производной. Поэтому дд(х) = Bжл + &2,хг + 2х2).
Найдем дк(х) в точке недифференцируемости функции к, т.е.
при Х\ + &2 — 2 — 0. По определению субдифференциала
(х-х,а) ^Н(х)~Н(х) V же К2 <=>
а2Ж2^|ж1 + ж2-2|-|ж1+Ж2-2| V жьж2. B)
Полагая в неравенстве B) Ж2 = 0, получим, что щх1 ^ ^л-21+Сл, откуда
вытекает, что |ал| ^ 1. Полагая х± — -Х2, получим, что (а,2 - а1)х2 ^ С2,
откуда вытекает, что ^ = аг. Таким образом, а = (а,а), \а\ ^ 1.
При таких значениях а в точках Жл, Х2 таких, что ж; + ж2 - 2 = 0
неравенство B) будет выполняться: а(жл+ж2 —2) ^ |жл + ж2 —2| V Жл,Ж2-
Поэтому
Г A,1), жл + ж2 - 2 > 0,
дН(х)=<(а,а),\а\^1, х1+х2-2 = 0,
1(-1,-1), Жл+ж2-2<0.
Значит
Bжл + ж2 + 3, жл + 2ж2 +3), жл + ж2 - 2 > 0,
Bх1 +Х2+ 3«. Х1 + 2х2 + За), |а| ^ 1, Жл + ж2 - 2 = 0,
Bжл + ж2 - 3, Ж] + 2ж2 - 3), жл + ж2 - 2 < 0.
52 Глава 1. Экстремальные задачи
Следовательно, соотношение A) запишется в виде
\2ХХ+ 22 + 3 = 0,
< при х1 + х2 - 2 > 0, (г)
[ хх + 2х2 + 3 = 0,
{2а;! + х2 + За = 0,
при XI +22-2 = 0, (Н<1) (п)
х1 + 2х2 + За = 0,
{2хх + х2 - 3 = 0,
при х\ + х2 - 2 < 0. (ггг)
а?! + 2ж2 - 3 = О,
В случае (г) нет критических точек, так как из уравнений системы
следует, что Х\ + х2 = — 2 — противоречие с условием Х\ + х2 — 2 > 0.
В случае (ггг) также нет критических точек, так как из уравнений системы
следует, что х\ + х2 = 2 — противоречие с условием х\ + х2 -2 < 0.
В случае (гг) система из трех уравнений с тремя неизвестными имеет
единственное решение &1 = х2 = \, а = — 1.
Таким образом, 5тт = 3, при х\ = х2 — 1.
4.6. Задачи, упражнения
В задачах 4.1-4.4 выяснить, при каких значениях параметра функ-
функции являются выпуклыми:
4.1. }(х) = ах1 +Ьх + с.
4.2. /(а;) = ае2
4.3. /(г1,2;2) = (|г1р) + |г2р)I/Р (р > 0).
4.4. /(хих2) = Онж? + га^а;!^ + а22х\.
В задачах 4.5-4.6 выяснить, являются ли выпуклыми функции:
4.5. /(ж) = ж1пж + A - ж) 1пA - ж).
4.6. /(ж) = 1ШП {а;1 +^2 | Х\ + Ж2 = ж}.
4.7. /(аО = 2|а:-1| + М
В задачах 4.8-4.15 вычислить субдифференциалы выпуклых функ-
функций в точке х — 0:
4.о. $ ух) — гпах^ж, О/,
4.10. /(ж1,..., хп) = |ж| := ( У): "
§ 5. Элементы функционального анализа 53
4.11. /К...1а;„) = Ё \х,\.
4.12. /(хи...,хп) = тах \х}\.
У=1,..,п
4.13. }{х\,.. .,хп) = тах ж,-.
4.14. /(жь...,а:„) = тах{0,(о)а:)} (а Е К").
4.15. /: X —+ К, /(ж) = ||х|| (X — нормированное пространство).
4.16. Доказать, что любая выпуклая функция, конечная на всей прямой,
непрерывна.
4.17. Доказать, что не существует выпуклой ограниченной функции,
определенной на всей прямой и отличной от константы.
Решить выпуклые задачи 4.18-4.21:
4.18. /(хих2) = х\- ХхХч +х\ + 3\х1 -х2-2\-+ тшп.
4.19. /(хих2) -х\+х\ +4тах{а;1, хт) -+ тт.
4.20. /(хих2) = х\+х\ +2у/(х{ -а.1J + (х2 - агJ -+тт.
4.21. /(хих2) = х\ + х\ +2а\х\ +х2 - 1| -+ тт (а > 0).
§ 5. Элементы функционального анализа
5.1. Нормированные и банаховы пространства
5.1.1. Определение пространств
Непустое множество X элементов х,у,г,... называется линейным
(векторным) пространством, если
а) для любых элементов х,у Е X однозначно определен элемент
из X, называемый их суммой и обозначаемый х + у,
Ь) для любого числа А Е К и элемента х однозначно определен
элемент, называемый произведением числа А на элемент х и обо-
обозначаемый Хх.
Эти операции должны удовлетворять следующим условиям:
I. Г. х + у = у + х — коммутативность.
2°. (х + у) + 2, = х + (у + г) — ассоциативность.
3°. Существует элемент 0 такой, что х + 0 = х V жЕХ.
Элемент 0 называется нулевым элементом.
4°. Для любого элемента х существует элемент,
обозначаемый через —х, такой, что х + (—х) = 0.
II. 1°. 1-х = х.
2°. афх) = ар(х).
III. 1°. (а + р)х = ах + рх.
2°. а(х + у) - ах + ау.
54 Глава 1. Экстремальные задачи
Линейное пространство X называется нормированным, если на X
определен функционал || • ||: X -+ К, называемый нормой и удовлетворя-
удовлетворяющий условиям:
а) \\х\\^0 V х€Хп\\х\\ = 0&х = 0;
Ь) ||аг|| = |а|-|И| V а е К, V х € X;
с) Цая+аг2||<||ая11 + ||а:2|| Чхих2еХ.
Линейное нормированное пространство иногда будем называть для
краткости нормированным пространством. Иногда, чтобы подчеркнуть,
что норма задана именно на X, мы пишем \\х\\х- Две нормы на X \\х\\1
и \\х\\2 называются эквивалентными, если существуют положительные
константы С{ и С^ такие, что
Сх\\х\\х ^ \\х\\г < С^хЬ.
Всякое нормированное пространство становится метрическим, если
в нем ввести расстояние й(х\,Х2) = ||#1 — Х2\\. В метрическом простран-
пространстве естественным образом вводятся понятия открытых и замкнутых
множеств, сходимость.
Последовательность точек {жп}г^=1 метрического пространства на-
называется фундаментальной, если она удовлетворяет критерию Коши, т. е.
если для любого е > 0 существует ^е такое, что й(жп,,г„,) < е для всех
пип2 > ДГс.
Метрическое пространство называется полным, если любая фунда-
фундаментальная последовательность сходится.
Полное относительно введенного расстояния метрическое простран-
пространство называется банаховым пространством.
Отметим, что всякое конечномерное нормированное пространство
является банаховым. Бесконечномерное нормированное пространство
не обязано быть банаховым.
5.1.2. Произведение пространств
Пусть X и У — линейные нормированные пространства. Декартово
произведение X х У можно превратить в линейное нормированное
пространство, введя норму
Легко проверить, что все аксиомы нормы выполняются.
Отметим очевидное утверждение: декартово произведение банаховых
пространств банахово.
5.1.3. Примеры банаховых пространств
1. Конечномерное пространство К", состоящее из векторов х =
(хи... ,хп) с нормой
.7=1
§ 5. Элементы функционального анализа 55
Эту норму иногда называют евклидовой нормой, а расстояние, вводимое
с помощью этой нормы, называют евклидовым расстоянием.
2. Конечномерное пространство 1р, 1 ^ р ^ оо, состоящее из векто-
векторов X = (Х1,. . . , Х„) С НОРМОЙ
11*11». = ,
тах{|а;1|,...,|а;„|}, р = оо.
Отметим, что в конечномерном пространстве все нормы эквива-
эквивалентны.
3. Бесконечномерное пространство 1г, состоящее из последователь-
последовательностей х = {хп}™=1 (иногда пишем, х = (хь... ,х„,...)), для которых
2^ х„ < оо, с нормой
п=1
\\х\\и =
4. Пространство С([го, ^]):= С([^о, ^],К) непрерывных на отрезке
^] функций х(-) с нормой
Обобщением этого пространства является пространство С(К, К")
непрерывных вектор-функций ж(-): 1Г -+ К", заданных на компакте К,
с нормой
ГсД
5. Пространство С1^, ^]):= ^'([^0, *1],К) непрерывно дифферен-
дифференцируемых на отрезке [2о> ^1] функций х(-) с нормой
Обобщением этого пространства является пространство СГ(К, К )
г раз непрерывно дифференцируемых вектор-функций х(-): К -+ К",
заданных на компакте К с нормой
= тах {\\х(-)\\С{к), \\х(-)\\с{к), • • •, Н*(г
56 Глава 1. Экстремальные задачи
5.1.4. Сопряженное пространство, оператор
Совокупность X* всех линейных непрерывных функционалов на
нормированном пространстве X образует сопряженное к X пространство.
Оно является банаховым пространством относительно нормы
\\х*\\х> ■= тах (х*,х),
где (х*,х) означает действие функционала х* на элемент х.
Пусть X и У — нормированные пространства. Через Ь(Х, У)
обозначим пространство линейных непрерывных операторов из X в У.
Пусть Л е Ь(Х,У). Тогда можно определить сопряженный оператор
А*: У* -+ X* такой, что
(А*у*,х) = (у*,Ах) УгЕХ
Для линейного непрерывного функционала на произведении про-
пространств имеет место следующая очевидная
Лемма. Всякий функционал А е (X х У)* однозначно представляется
в виде
гдех* еГ, / ё Г.
5.2. Определения производных
Для вещественных функций одного вещественного переменного два
определения — существование конечного предела
A)
л-.о Н
и возможность асимптотического разложения при Н —+ О
' о(Л) B)
— приводят к одному и тому же понятию дифференцируемости. Но уже
для функций двух и большего числа переменных существует несколько
различных подходов к понятию дифференцируемости (гладкости). Опре-
Определение A) ведет к понятиям производной по направлению, вариации
по Лагранжу и производной Гато. Определение B) ведет к понятиям
производной Фреше и строгой дифференцируемости.
Пусть далее в этом пункте X, У, 2 — линейные нормированные
пространства. Как правило (если это не оговорено иначе), /: X -+ У —
отображение пространства X или некоторой окрестности точки х Е X
в пространство У '.
2) Но вполне содержателен пример, когда X = К™, У = К™. Элемент из 1(Х, V)
определяется в этом случае матрицей размера пхт.
§5. Элементы функционального анализа 57
5.2.1. Производная по направлению
Будем говорить, что отображение / имеет в точке х производную
по направлению к, если существует предел справа
Нх + АЛ) - /(ж)
который обозначается <5+/(ж, Л). Плюс в индексе здесь указывает на то,
что берется именно предел справа.
5.2.2. Вариация по Лагранжу
Если отображение / имеет в точке ж производную по всем напра-
направлениям и 6+/(х,к) = -<5+/(ж, -к) =: 6/(х,к) V к е X, то говорят, что
отображение / имеет в точке х вариацию по Лагранжу. При этом ото-
отображение к —+ 6/(х, к) называют вариацией по Лагранжу. Таким образом,
вариация по Лагранжу
)
А—>0 А
5.2.3. Производная 1кто
Если оператор вариации по Лагранжу 6/(х, ■): X —+ У линеен и не-
непрерывен по к (<5/(ж,■) е Ь(Х,У)), то говорят, что / дифференцируемо
по Гото в точке ж, а оператор 6/(х, ■) называется производной Гато
отображения / в точке А и обозначается }'с{&).
Отсюда следует, что если отображение / дифференцируемо по Гато
в точке ж, то для любого фиксированного к имеет место разложение
где ||г(М)||у = о(|А|) при А - 0.
Отметим, что отображение, дифференцируемое по Гато в точке ж,
не обязано быть непрерывным в этой точке (см. Пример4, п. 5.2.8).
5.2,4. Производная Фреше
Отображение / называют дифференцируемым по Фреше в точке х
и пишут / е О(х), если существуют линейный непрерывный оператор
/'(ж): X —»• У и отображение г: X —»• У такие, что
/(* +А) =/(А)+ /'(*)[*]+ г(А). (*)
где ||г(А)||у = о(||А||х) при ||А||х -+ 0. Оператор /'(ж) называется
производной Фреше. Это разложение можно кратко записать так:
58 Глава 1. Экстремальные задачи
понимая о(к) как элемент пространства V, для которого ||о(Л)|| = о(||А||)
при |!Л|| —* 0. Через /'(ж)[Л] обозначено значение отображения /'(ж)
на элементе к.
Из разложения (*) следует, что функция, дифференцируемая по Фре-
ше, непрерывна в точке дифференцируемости, а также дифференцируема
в этой точке по Гато. Уже в двумерном случае эти два понятия раз-
различаются: из дифференцируемости функции по Гато не следует ее
дифференцируемость по Фреше (см. Пример 4, п. 5.2.8). Аналогично
из дифференцируемости по Гато по определению вытекает существо-
существование вариации по Лагранжу. И снова (уже в двумерном случае) эти
понятия различны. Отметим, что производная Фреше линейного опера-
оператора совпадает с самим оператором.
Если в каждой точке х открытого множества II отображение / Е О{х),
а отображение х —► /'(х) непрерывно, то пишем / е С1 A7).
На языке е-<5 определение дифференцируемости по Фреше ото-
отображения / в точке х формулируется так: существует оператор
/'(ж) е Ь(Х,У) такой, что для любого е > 0 найдется <5 > 0, при
котором для любого ||Л|| < <5 выполняется неравенство
Из разложения (*) следует, что производная Фреше определена одно-
однозначно, ибо равенство Л1Л — К2к = о (Л) для линейных непрерывных
операторов Л] и Лг возможно лишь при Л1 = А2.
5.2.5. Строгая дифференцируемость
Во многих задачах конечномерного и бесконечномерного анализа
дифференцируемости по Фреше в точке недостаточно для получения
содержательного результата. Это побуждает к следующему усилению
дифференцируемости в точке.
Пусть отображение / дифференцируемо по Фреше в точке ж.
Оно называется строго дифференцируемым в точке ж (при этом пишут
/ е 51>(ж)), если для любого е > 0 найдется такое <5 > 0, что для
всех Ж) и хг, удовлетворяющих неравенствам \\х1 -ж|| < <5, \\х2 -х\\ < 6,
выполнено неравенство
Ц/^О - /(х2) - }\х)[ху - х2\\\у ^ е\\х! - х2\\х.
Из определения следует, что функция, строго дифференцируемая по Фре-
Фреше в точке, непрерывна в некоторой окрестности этой точки.
Ниже будет показано, что если производная Фреше (даже производ-
производная Гато) отображения непрерывна в точке, то отображение будет строго
дифференцируемо в этой точке.
§ 5. Элементы функционального анализа 59
5.2.6. Частные производные
Пусть X, У, 2 — нормированные пространства. Рассмотрим ото-
отображение /: X хУ -+ 2, (ж, у) е X х У. Если отображение х —► /(х,у)
дифференцируемо в точке х по Фреше, то его производная называется
частной производной по х отображения / в точке (ж,#) и обозначается
/'х(х,у) или —Хп ■ Аналогично определяется частная производная
ах
5.2.7. Производные высших норядков
Дадим теперь определение второй производной Фреше. Если ото-
отображение /: X —► У дифференцируемо в каждой точке х Е X, то
определено отображение х —► /'(х) пространства X в пространство
Ь(Х,У). Поскольку Ь(Х,У) также является нормированным простран-
пространством, то можно ставить вопрос о существовании второй производной
отображения /
/"(*) = (/')'(*) еЦх,цх,У)).
Для вектора Н\ е X оператор /"(х)^] е Ь{Х,У). Возьмем вектор
Ь.1 е X, тоща определено отображение /"'(х)\к\,Нт\ = }"{х)[Н\\[Н2\^У'.
Таким образом, определено билинейное (линейное по каждому аргумен-
аргументу) отображение /"(ж): X х X -»• У.
Аналогично определяются производные высших порядков.
Теорема (о смешанных производных). [АТФ, с. 156.] Если отображе-
отображение / Е В1 (х) дважды дифференцируемо в точке х, то
Замечание. Можно считать, что отображения определены не на всем
пространстве, а в окрестности рассматриваемых точек.
5.2.8. Контрпримеры на дифференцируемость
Приведем несколько контрпримеров, показывающих, что введенные
понятия дифференцируемое™ действительно различны.
Пример 1. Непрерывная функция не имеет в фиксированной точке
производной ни по какому направлению:
Г х 8Ш -, х ф О,
/: К-К, /(аг)= < х' х = 0.
(Л 2 = 0,
60 Глава 1. Экстремальные задачи
На прямой К имеются с точностью до умножения на положительную
константу два направления: Л; = 1 и К^ = — 1. Однако пределы по обоим
направлениям не существуют. Действительно, предел
А-.+0
Аап{ 1
= ДЩ = ШП 81П -
А-»+0 А А-»+0 А
не существует. В силу четности функции / не существует также предел
6+ /(х, Л2) и по направлению Ь^ = -1.
Пример 2. Непрерывная функция имеет в фиксированной точке про-
производную по всем направлениям, но не имеет в этой точке вариации
по Лагранжу:
/: К -♦ К, /(ж) = \х\, 4 = 0.
Как и в примере 1 на прямой К имеются с точностью до умножения
на положительную константу два направления: ^ = I и Лг = —1.
Пределы по обоим направлениям существуют:
А-.+0
4=0
|ЛА,| |А|
= Шп —— = Цт — = 1.
А-»+0 А А-*+0 А
Но предел
А-+0
и-о А-+0 А
не существует. Следовательно, отображение / не имеет в точке х = О
вариации по Лагранжу.
Отметим, что если х Ф 0, то <5/(ж, к) = /'(х)[к] = ащпж ■ к.
Пример 3. Отображение имеет в фиксированной точке вариацию по Ла-
Лагранжу, непрерывно в этой точке, но не имеет в этой точке производной
Гато.
Определим отображение в полярных координатах х = (а;ьа;2) =
(г сок <р, г $т <р) по формуле:
/:К2->К, /(ж) = гсо8 3у>, # = 0.
Вычислим вариацию по Лагранжу данного отображения в точке
1 = 0. Возьмем произвольное направление к = (гса&а, г^та). Тогда
. „„/D +АЛ)-/D)
А—О
4=0
. А^совЗа
= ит = I сов За.
а-*о А
§5. Элементы функционального анализа
61
Покажем, что вариация по Лагранжу 6{(х,к) не является линейным
оператором по Н. Действительно, возьмем два вектора Н\ = A,0) =
(со$0,8т0) {1= 1, а = 0)ик2 = @,1) = Гсо8-,8т-) {I = 1, а = тг/2).
Тогда Ь-1 +Н2 = A,1) = Г\/2сов-,\/7ъ\п-Л. Однако 6}(х,Нх + Н2) =
1
Пример 4. Отображение / имеет в фиксированной точке производную
Гато, но не имеет в этой точке производной Фреше:
/: К2 -> К, /(ж) =
| х — Ж2 д. > О
О, в остальных случаях,
= @,0).
Рис. 7
0
Рис. 8
Поскольку
/(ж + Аи) - /B) /(Аи)
, й) = Нт = Нт = 0 для любого
' А-0 А А-,0 А
Н, то производная Гато существует и /с(^) = 0. С другой стороны,
функция / разрывна в точке х — @,0), а функция, дифференцируемая
по Фреше, должна быть непрерывна в точке дифференцируемое™.
Пример 5. Функция имеет в фиксированной точке производную Фреше,
но не строго дифференцируема в этой точке:
/: К -> К,
■{
ж , ж рационально, х = О
О, иррационально,
Выписанная функция одной (!) переменной дифференцируема в точ-
точке х — 0. Значит она дифференцируема по Фреше в этой точке. С другой
стороны, функция имеет разрывы в любой окрестности нуля, а стро-
строго дифференцируемая функция должна быть непрерывна в некоторой
окрестности х.
62 Глава 1. Экстремальные задачи
5.3. Некоторые теоремы дифференциального исчисления
в нормированных пространствах
Приведем несколько теорем, наиболее часто используемых для
решения экстремальных задач.
5.3.1. Теорема о суперпозиции
Теорема. Пусть Х,У,2 — линейные нормированные пространства,
<р: X -* У, "ф: У -* 2, (р(х) = у, / = "ф о <р: X -* 2 — суперпозиция
отображений <р и "ф. Тогда, если отображение "ф дифференцируемо по Фреше
в точке у, а отображение (рве точке х имеет вариацию по Лагранжу
(дифференцируемо по Гато, дифференцируемо по Фреше), то отображение /
обладает в точке х тем же свойством, что и отображение <р, и при этом
соответственно
А) «5/(ж, К) = ^'(у)[бф, Н)\ УНЕ X.
в) 1№) = 'Ф'(у)°<р'с(я)-
С) /'D) = у'(у) о ^(*) («.
/)) Если отображения ■ф Е ЗБ(у) и (р Е 8О(х) строго дифференцируемы
в точках у и х, соответственно, то отображение / Е 8О{х) также
строго дифференцируемо в точке х.
Доказательство. А) Вариация по Лагранжу. Вычислим вариацию
по Лагранжу отображения Я/(ж, Ъ). По определению
А-»0
(По определению производной Фреше отображения ■ф в точке у вытекает,
что "ф{у + Н) = "ф(у) + ^'(у)^] + о(Н). Перепишем это разложение в виде
{) Ш 'Ш ] ) = <р(х + ХН), у = {)
1/>(у)[у(х + АД) -
= 1ип
(Из определения вариации по Лагранжу отображения <р в точке х
вытекает, что <р(х + Хк) - <р(х) = Х6<р(х,к) + о(Х).)
о(Х6<р(х, к) + о(Х)) _
А-.0 А
Ь, к)] + Шп ——- = ■
А^О А
§ 5. Элементы функционального анализа 63
что и доказывает формулу для вариации по Лагранжу суперпозиции
отображений.
В) Производная по Гато. Если отображение <р дифференцируемо
по Гато в точке х, то по определению производной по Гато оператор
^е(ж)[/1] = 6<р(х,к) Е Ь(Х,У). Тогда по уже доказанному п. А) оператор
«/(*,*) = $'(у)[6ц>(х,Н)) = 1>'(у)ШЩЪ}) 6 Ь(Х,2). Это означает, что
отображение / дифференцируемо по Гато в точке х и производная
по Гато /е(ж) = -ф'(у) о <р'в(х).
С) Производная по Фреше. Так как отображение <р Е В(х), а ото-
отображение 1р Е 1)(у), то из определения дифференцируемости по Фреше
для любых е\,е<1 > 0, найдутся такие 6иб2 > 0, что из неравенств
\\х - х\\ < 6\, \\у - у\\ < Й2, следуют неравенства
\\ф) - <р(х) - <р'{А)[х - х}\\у < е,||а - х\\х, A)
\Ш - Ш ~ 1>'(У)[У ~ У)\\2 < е2||» - у\\у. B)
По неравенству треугольника для норм следует, что для элемента у = (р(х)
выполняется неравенство
\\у-у\\ = \\ф)-<р(Щ^\\<р'(Щх-х}\\+е1\\х-х\\^
< \\<р'{&)\\ ■ \\х - х\\ + е1\\х - х\\ < (\\<р'(х)\\ + Е1)\\х - х\\ < 62 C)
при \\х-х\\ < 6:=тт< *——,6{ >, и, значит, при \\х-х\\ < 6
аля элементов у = <р{х) и х справедливы неравенства A)—C). Тогда
(вычтем и добавим ^'(у)[^(ж) - <р(х)])
(по неравенству треугольника для норм)
- <р(*)]\\
к
е2Щх) - у{Щ + \\4>'(у)\\ ■ \\ф) - <р(х) - <р'($)[х - х]
)
е2(\\<р'(х)\\ + ех)\\х - х\\ + №($)Ы\* " *Н =
= (е2\\<р'(х)\\ + е2е1 + е,|№'@)||)||* - х\\ < е\\х - х\\.
64 Глава ]. Экстремальные задачи
Это и означает, что отображение / 6 О(&) и /'B) = -ф'(у) о <р'(х).
Действительно, для любого е > 0 подберем 61,62 > 0 так, чтобы
выполнялось неравенство е2||^'B)|| + е2е\ + Е^ф'(у)\\ < е. По этим е1)е2
найдем 6и62 > 0, так, чтобы имели место соотношения A)-C). По 6\
и #2 выбирается 6.
I)) Строгая дифференцируемость. Так как отображение <р Е ЗВ(х),
а отображение "ф 6 8О(у), то по определению строгой дифференцируе-
мости для любых Е\,Ег > 0, найдутся такие 61,62 > 0, что из неравенств
\\х{ - х\\ < 6и \\т - у\\ < 62, г ■= 1,2, следуют неравенства
\\<р(х{) - ф2) ~ <р'(&)[щ ~ х2]\\г ^ Е1\\хг - х2\\х, D)
ЫУх) ~ ^Ы - $ШУ1 ~ У2)\\2 ^ е2||р, - У2\\у. E)
Из соотношения D) по неравенству треугольника для норм следует, что
для элементов у< = <р(х^
-х2}\\+е1\\х1-х2\\ ^ (\\<р'(х)\\ +е1)\\х1-х2\\. F)
Полагая в соотношении D) х\ — x^, х2 = х, имеем также
<р'{х)[Х1 - 4]|| ^ е,||^ -х\\, г = 1,2.
Отсюда по неравенству треугольника для норм следует, что для элементов
у^ = (р(х^ выполняются неравенства
, г = 1,2, G)
при ||аг» — ж|| <й:=тт< ,6\ >. Следовательно, при ||ж;-
для у1 = (р(х{) и Х{ справедливы неравенства D)—G).
Тогда
(вычтем и добавим ^>'
(по неравенству треугольника для норм)
\
§ 5. Элементы функционального анализа 65
~ <Р(Х2)\\ + Ы'(Ш ■ \\<Р(Х1) - <Р(Х2) - <Р'(*)[Х1 ~ Х2]\\ <
- х2\\ + \\1>\у)Ы\^ - х2\\ =
е2е, + е,|№'@)||)||аг, - х2\\ < е||а:, - х2\\.
Это и означает, что отображение / 6 8Б(х). Действительно, для любого
е > 0 подберем еь ег > 0 так, чтобы выполнялось неравенство е2||у'(#)|| +
е2е\ + е1\\$'(§)\\ < е. По этим еье2 найдем 61}62 > 0, так, чтобы имели
место соотношения D)-G). По 61 и 62 выбирается 6.
Теорема полностью доказана. ■
Замечание. Теорема о суперпозиции не имеет места для производной
Гато.
Доказательство. Пусть (р: К2 -+ К2, (р(х) — (^1(ж1,ж2
(х\,х2),А = 0, у(х) = $ = 0,
, в остальных случаях.
Функция <р дифференцируема по Фреше в точке х и даже строго
дифференцируема (проверьте!), функция 1р дифференцируема по Гато
в точке $ (см. Пример4, п. 5.2.8). С другой стороны, функция
0) в остальных случаях,
являющаяся суперпозицией отображений <р и "ф, не дифференцируема
по Гато в точке х (и даже не имеет в этой точке производных
по направлениям Н = A,1) иД = (-1,1)). ■
5.3.2. Формула Тейлора
Теорема. [АТФ, с. 159.] Пусть отображение / 6 Бп(х) п раз дифферен-
дифференцируемо по Фреше в точке А. Тогда имеет место разложение в ряд Тейлора
1(х+Н) = !{х) + Г{х)[Н] + \1"{х)[Н, Щ + ...+ -/п\х)[к, ...,к) + г(А),
2 п!
где ||г(Л)|| = о(||А|Г) при А -» 0.
66 Глава 1. Экстремальные задачи
5.3.3. Теорема о среднем
Хорошо известно, что для числовых функций одного переменного
справедлива теорема Лагранжа, называемая иногда также теоремой
о среднем значении или формулой конечных приращений:
Теорема Лагранжа. Если функция /: [о, Ь] —* К непрерывна на отрезке
[а, Ь] и дифференцируема в интервале (а, Ъ), то существует тонка
с Е (а, Ь) такая, что
Замечание 1. Формула (*) остается справедливой и для числовых
функций /(ж), аргумент которых принадлежит произвольному линейному
нормированному пространству. Дифференцируемость понимается в смы-
смысле Гато. (/: X —> К, X — линейное нормированное пространство,
Доказательство. Полагая <рA) := }{а + 1{Ь— а)), мы сводим доказа-
доказательство к случаю функции одной переменной:
!{Ъ) - /(а) = рA) - р@) = у\в) - /'(а + в(Ь - а))(Ь - а) = /'(с)(Ь - а),
где ве @, 1), с = а + в(Ъ- а) 6 (а, Ь). ш
Замечание 2. Для векторнозначных функций теорема Лагранжа не верна.
Доказательство. Пусть /: К —> К2, /(ж) = (шж,-созж). Тогда
/'(ж)[/1] = (со8ж,апа;)[Л] = (Л сев ж, Л яп ж), /I Е 8. В то же время
для любого с
/Bтг) - /@) = (япО, - соз 0) - (8Ш 2тг, - соз 2тг) = @,0) ф
Ф /'(е)[2тг - 0] = 2тг(со8с,8шс).
Так как со8 с и яп с ни для какого с одновременно в ноль не обращаются.
Значит, формула (*) для функции / не имеет места. ■
Отметим, что в анализе, как правило, используется не сама форму-
формула (*), а вытекающая из нее оценка
/(а)|< 8ир |/'(с)Н*-а|.
се(а,Ь)
Покажем, что в этом более слабом виде утверждение распространяется
уже на случай произвольных нормированных пространств. По традиции
оно сохраняет название «теорема о среднем», хотя, конечно, его следовало
бы назвать «теоремой об оценке конечного приращения».
3) Отрезок [а,Ь] = {х е X \х = а + г(Ь-а), 0 < г <С 1}.
4) Интервал (а. 6) = {х € X | х = а + <F - а), 0 < г < 1}.
8э. элементы функционального анализа о/
Теорема о среднем. Пусть X, У — линейные нормированные простран-
пространства, отображение /: X —* У дифференцируемо по Гато в каждой точке
отрезка [а, Ь]. Тогда
)/(а)||< вир ||/^(с)||-||*-а||-
сё(в,Ь)
Доказательство. По лемме Банаха (см. п. 5.4) для любого у Е У,
а значит, и для у = /(Ь) — /(а) найдется элемент у* Е У* такой, что
||»*|| = 1 и (у*,у) = ||У||, т.е. <зг*,/F) - /(а)) = ||/(Ь) - /(а)||.
Обозначим <рA) = (у*,/(а + <(Ь- а))). Поскольку у* — линейный
непрерывный функционал, а отображение / в каждой точке отрезка [а, Ь]
имеет производную Гато, то по теореме о суперпозиции, пользуясь тем,
что производная Гато линейного непрерывного функционала совпадает
с ним самим, получим
Ч>'$) = (У*, /о (« + *{Ъ - а)) [Ь-а]) ЧЬЕ [0, 1].
Из дифференцируемости функции ^следует ее непрерывность на отрезке
[О, 1], и, следовательно, к ней можно, применить формулу Лагранжа:
(р(\) - (р@) = (р'(в), в Е @, 1). Поэтому
||ЦЪ) - /(а)|| = (у*
<||/о(а + ^(Ь-а))||-ЦЬ-а||< шр ||/о(с)|| • ||Ь- а\\. ш
се(а,Ь)
Следствие 1. Пусть выполнены все условия теоремы о среднем (/ €
а, Ь]) и оператор А Е Ь(Х,У). Тогда
а)||< вир ||/^(с) - А|| • ||Ь- а\\.
с€(а,Ь)
Доказательство. Надо применить теорему о среднем к отображению
д(х) = !{х) - Л. .
Следствие 2. Пусть X, У — линейные нормированные пространства,
отображение Р: X —+ У дифференцируемо по Гато в некоторой окрест-
окрестности точки х, отображение х —» /о (ж) непрерывно в точке х. Тогда
отображение / строго дифференцируемо в точке х (а следовательно,
и дифференцируемо по Фреше в той же точке).
Доказательство. В силу непрерывности отображения х —* /о (ж)
в точке х для любого е > 0 найдется такое 6 > 0, что ||/о(ж)-/о(ж)|| < е
при ||ж - х\\ < 6.
68 Глава 1. Экстремальные задачи
В силу выпуклости шара В ~ В(х, 6) = {ж | ||ж- ж|| < 6} из условия
жьж2 Е В следует, что отрезок \х\, х2] & В. По следствию 1 теоремы
о среднем с Л = /о (ж) получаем
что означает строгую дифференцируемость отображения / в точке ж. ■
Следствие 2 показывает, что при проверке дифференцируемое™
конкретного функционала достаточно доказать существование произ-
производной Гато и проверить ее непрерывность. Это гарантирует строгую
дифференцируемость и тем более существование производной Фреше.
Следствие 3. Существование второй производной Фреше в точке
гарантирует строгую дифференцируемость отображения в этой точке
(/ 6 О2(х) =Ф / 6 8О{х)).
Доказательство. Покажем, что все условия для выполнения След-
Следствия 2 имеются. Действительно, из существования второй производной
Фреше в точке ж следует существование производной Фреше (и, следова-
следовательно, существование производной Гато) в некоторой окрестности этой
точки, а также непрерывность производной Фреше (и, следовательно,
непрерывность производной Гато) в точке ж. Тогда по Следствию 2
вытекает строгая дифференцируемость отображения в этой точке. ■
5.3.4. Теорема о полном дифференциале
Теорема. Пусть Х,У,2 — линейные нормированные пространства,
отображение Р: X х У —> 2 имеет в каждой точке (ж, у) из некоторой
окрестности точки (ж, #) 6 X х У частные производные Ех (ж, у) и Еу(х, у)
в смысле Гато, являющиеся непрерывными в точке (ж, #). Тогда Р 6 ^( #)
строго дифференцируемо в той же точке и при этом
Доказательство. В силу непрерывности отображений Ех(х,у) и
Ру (ж, у) в точке (ж, #) для любого е > 0 можно найти 8 > 0 такое, что для
о о
любой точки (ж, у) из «прямоугольной» окрестности V := В(х, 6)хВ(у, 6)
точки (ж, #) существуют частные производные Рх(х, у) и Ру(х, у) в смысле
Гато и выполняются неравенства
Легко видеть, что если точки (ж^з^), (х2,у2) лежат в V, то и точка
(х2)у1) 6 V и, более того, оба отрезка [{х1,у1),{х2,у1)}, [{х2,у{),{хъу2)]
§ 5. Элементы функционального анализа 69
содержатся в V в силу выпуклости множества V. Поэтому отображе-
отображения ж —+ Р{х,у\) и у —+ Р(х2,у) дифференцируемы по Гато: первое
отображение имеет производную Рх(х,У\) на отрезке [х\, х2], второе
Еу(х2,у) на [у\, у2]. Применяя следствие 1 теоремы о среднем к этим
отображениям, получаем в силу (*)
\\Р(хиУ1) - Р(Х2,У2) - РХ(Х,У)[Х1 - Х2] - РУ(
(вычтем и добавим Р(х2,у1))
= \\Р(хьу1)-Р(х2,у1)-Рх(х,$)[х1-х2] +
+ Р(Х2,У1) - Р(Х2,У2) - Ру(%,в)[У1 - Ъ]\\
(по неравенству треугольника для норм и Следствию 1 Теоремы о сред-
среднем)
< шах Ц^,^,»!)-1^,D,^I1 • 11*1-*2|| +
х€(х{,хг)
+ тах \\Ру(х2,у)-Ру(х,у)\\-\\У1-у2\\^
»6(УЫ
для любых {х\,у{),(х2,у2) Е V, что и означает строгую дифференциру-
емость отображения Р в точке (х, у) и дает явный вид производной
Фреше (и полного дифференциала) отображения от двух переменных. ■
5.4. Дополнительные сведения из алгебры
и функционального анализа
В этом пункте приводятся дополнительные сведения из алгебры
и функционального анализа, которые понадобятся для доказательства
теорем об условиях экстремума в гладких экстремальных задачах в нор-
нормированных пространствах.
Определение. Аннулятором А1 множества А линейного нормиро-
нормированного пространства X называется множество линейных непрерывных
функционалов х*, для которых (ж*, ж) = 0 для любого ж € А:
11:={ж*бГ|(ж',ж} = 0 Ужб А}.
Отметим, что аннулятор А1 всегда содержит нулевой элемент
(ж* = 0) сопряженного пространства X*.
Лемма о нетривиальности аннулятора. Пусть Ь — замкнутое соб-
собственное {Ь ф X) подпространство линейного нормированного простран-
пространства X. Тогда аннулятор Ь1 содержит ненулевой элемент х* 6 X*.
70 Глава 1. Экстремальные задачи
Доказательство. Поскольку Ь Ф X, то существует точка х $ Ь.
По второй теореме отделимости (о строгой отделимости точки, не при-
принадлежащей выпуклому замкнутому множеству) существует линейный
непрерывный функционал ж* Е X*, строго разделяющий точку х и под-
подпространство Ь (Ь — подпространство линейного пространства и, сле-
следовательно, выпукло)
$ир(х*,х) < (х*,х).
х^Ь
Из этого неравенства следует, что х* ф 0. Покажем, что х* Е Ь1, т.е.
(г*,ж} = 0УжЕ1. Действительно, если бы существовало ж0 Е Ь, для ко-
которого (ж*, ж0) ф 0, то поскольку ажо Е Ь для любого а Е К, было бы
8ир(ж*,ж) ^ 8ир{ж*,ажо) = +оо.
х^Ь абК
Это не так. Следовательно, (ж*,ж) = 0 V х Е Ь и, поэтому х* Е Ь1. ш
Далее нам понадобятся следующие две теоремы из функционального
анализа.
Теорема Банаха об открытости. [КФ, с. 262; ГТ, с. 109.] Пусть X, У —
банаховы пространства, Л — непрерывный линейный оператор из X в У,
являющийся эпиморфизмом (Л: X —+ У). Тогда образ каждого открытого
множества в X открыт в У.
Теорема Банаха об обратном операторе. [КФ, с. 213.] Пусть X, У —
банаховы пространства, Л — непрерывный линейный оператор из X в У,
являющийся эпиморфизмом и КегЛ = 0. Тогда существуют обратный
оператор Л: У —+ X, так же линейный и непрерывный.
Лемма Банаха. [ГТ, с. 109.] X — линейное нормированное простран-
пространство, жо Е X. Тогда существует линейный непрерывный функционал х* Е X*
такой, что \\х*\\ — 1, {ж*,ж0) = ||жо||.
Лемма Банаха является следствием из известной теоремы Хана—
Банаха о продолжении линейного функционала.
Лемма о правом обратном отображении. Пусть X, У — банаховы
пространства, Л — непрерывный линейный оператор из X в У, являющийся
эпиморфизмом. Тогда существуют отображение М: У —+ X (необязательно
непрерывное и необязательно линейное) и константа С > 0 такие, что
Ао М = 1У5\ \\Му\\^С\\у\\ ЧуЕГ.
Доказательство. Обозначим Вх := {ж Е X \ ||ж|| < 1} — открытый
шар в пространстве X радиуса 1. По теореме Банаха об открытости
5' Через 1у обозначается тождественный оператор на пространстве У.
§ 5. Элементы функционального анализа
71
образ открытого множества АВх открыт. Поскольку при линейном
отображении ноль переходит в ноль, то множество АВх содержит вну-
внутренней точкой ноль, и, следовательно, содержит какой-то открытый
шар с центром в нуле 6ВУ := {у Е У \ \\у\\ < 6}, т. е. для любого у Е 6ВУ
найдется х(у) такой, что Ах(у) = у, \\х(у)\\ < 1. Для любого у Е У обо-
||||
значим Му :=
\
отображения М имеем:
Тогда
6у
6
= ^ < 6 и из определения
2||»|| бу
_Ш II / бу ч
Лемма о замкнутости образа. Пусть X, У, 2 — банаховы прост-
пространства, А: X —> У', В: X —* 2 — линейные непрерывные операторы,
подпространство 1т А замкнуто в У, подпространство ВКетА замкнуто
в 2, С: X —у У х 2, Сх := (Ах, Вх). Тогда С — линейный непрерывный
оператор и подпространство 1т С замкнуто в У х 2.
Доказательство. Очевидно, что оператор С линеен и непрерывен.
Докажем замкнутость его образа. Замкнутое подпространство У ~1тА
банахового пространства У — банахово и по определению А: X -+ У —
эпиморфизм. По лемме о правом обратном отображении существуют
оператор М: У —+ X и константа К > 0 такие, что
= Ц, \\Му\\^К\\у\\
6 У.
Пусть точка (у, г) Е 1т С принадлежит замыканию образа опе-
оператора С. Это означает, что найдется последовательность {хп}п^1
такая, что у = ИтАх„ Е У, г = 1тВх„. Положим Нп:—М(Ах„-у),
2п:=В(х„ — Нп). Тогда по свойству оператора М, получим:
ИМ = \\М(Ахп - у)\\ < К\\Ахп - у\\ -> О,
А(хп - Нп) = Ахп - А(М(Ахп - у)) = Ахп - (Ахп - у) = у.
Поэтому, ВНп —+ 0 в силу непрерывности оператора В и г = Цт.гп =
ит В(хп — Н„) = 1т\Вх„, т. е. г принадлежит замыканию множества Е =
{^ = Вх | Ах = у}. Это множество, как легко видеть, является сдвигом
подпространства -ВКег.4, следовательно, замкнуто. Итак, г Е Е = Е. Это
означает, что существует х Е X: Ах = у, Вх = г, т.е. (у,г) 6 1тС ■
72 Глава 1. Экстремальные задачи
Лемма об аннуляторе ядра регулярного оператора. Пусть X, У —
банаховы пространства, А: X —+ У — линейный непрерывный эпиморфизм.
Тогда (КегЛ)-1 = 1тА*.
Доказательство.
А) Докажем, что 1т А* С (Кег А)-1. Возьмем ж* Е 1т А* •» ж* = А*у*.
Тогда
(ж*, х) = (Л*/, ж) = (у*, 4ж> = 0 Ужб Кег А.
Значит, ж* 6 (КегЛ), т.е. 1тЛ* С (КегЛ)х.
В) Докажем, что (КегЛ)х С 1тА*. Возьмем ж* 6 (КетАI, т.е.
(ж*, ж) = О V ж 6 Кег.4. Применим лемму о замкнутости образа для
пространств X, У, 2 = К и отображений Л, Вж := (ж*,ж). Усло-
Условия леммы выполняются: подпространство 1т-4 = У замкнуто в У,
подпространство ВКег.4 = (ж*, Кег А) = 0 замкнуто в 2 — К. По лем-
лемме о замкнутости образа подпространство 1т С = 1га (Л, ж*) замкнуто
вГх^ = УхК. Подпространство 1т (А, ж*) является собственным, так
как точка @,1) ^ 1т(Л, ж*) (если Лж = 0, то (ж*, ж) =0/1).
По лемме о нетривиальности аннулятора замкнутого собственного
подпространства существует ненулевой линейный непрерывный функ-
функционал (у*,Х) 6 Aт(А,х*))± Е (У х К)* = У* х К такой, что
({у*,\),(Ах,(х*,х)))=0 <=^ (у*,Ах)+\(х*,х) =
(А*у*,х) + А(ж*,ж) = 0 <=> (А*у* + Аж*,ж) = 0 V ж 6 X
А*у* + Аж* = 0.
Причем А Ф 0 (ибо иначе (у*,Лж) = 0УжбХ =*• у* = 0 —
противоречие). Тогда ж* = А*(-^-) 6 1тА*, т.е. (КегЛ)х С 1тА*. ш
Теорема об обратном отображении. Пусть X, 2 — банаховы про-
пространства, Р: X -+ 2, Р(х) - г. Если Е 6 ЗО(х) и Е'(х) является
эпиморфизмом, то существуют обратное отображение Е~1: УУ С 2 -+ X
некоторой окрестности IV точки г и константа К > 0 такие, что
Е~1(г) = х и
Е(Е-\г))=г, \\Р~\г) - Р~\г)\\ < К\\г - г\\ V г Е Ж
Теорема Люстерника. Пусть X, 2 — банаховы пространства, отобра-
отображение Е: X —+ 2, ЕЕ ЗТ)(х), оператор Е'(х) является эпиморфизмом.
Тогда существуют отображение (р: V С X -* X некоторой окрестности Л
точки х и число К > 0 такие, что
Е(х + <р(х)) = Р(х), ||^ж)||<
§ 5. Элементы функционального анализа 73
Доказательство этой теоремы основано на модифицированном ме-
методе Ньютона.
А) Не ограничивая общности, для краткости записи, считаем, что
х = 0 и Р(х) = 0. По лемме о правом обратном операторе для оператора
Р'(х)\ Х-+2 существуют обратное отображение М: 2 -+ X и константа
С > 1 (не ограничивая общности, можем считать ее большей единицы)
такие, что
Е'(х)оМ = 12, \\Мг\\^С\\г\\ У г Е 2,
Отображение Р Е 8О(х), поэтому для е = — существует 6 > 0 такое,
ЧТО
\\Р(х') - Р(х") - Р'(*)(х' - х")\\ < ^ Цх' - х"\\ A)
при || ж'|| < 6, || ж" || < 6. Из строгой дифференцируемое™ в точке х = 0
следует также непрерывность непрерывность Р в некоторой окрестности
нуля. Выберем 6' столь малым, чтобы ||х|| + С||2?1(а;)|| < - при ||х|| < 8'.
о
Для элемента х Е II := В @, ё') определим последовательность элемен-
элементов {$„} с помощью рекуррентного соотношения
B)
В) Докажем по индукции, что ||^„|| < 6 V п ^ 0. Действительно,
6
II Со II = 11^11 < —• При п = 1 из B) и леммы о правом обратном операторе
получаем оценку
||6 - х|| = \\МР(х)\\ < С|И*)||, C)
6
откуда по неравенству треугольника для норм Ц^Ц ^ ЦхЦ + СЦ^х)!! < -.
Пусть ||С|| < 6 при г = 0,1,...,к (к ^ 1). Выведем отсюда, что
Ц&+1Ц < б. Из соотношения B) следует, что ^+1 -& + МР(&) = 0.
Применяя к обеим частям этого равенства оператор Р'(х), получим
для г = 0,1,...,к
УЩЬ+1-Ь]+У{Щмр(Ы}=о<==>р'{&)[ь+1-ь}+р(Ь)=о, D)
откуда
(вычтем из Р(&) выражение -Р(&_1) + Р'{&)(& - 6-1) равное нулю в силу
соотношения D))
74 Глава 1. Экстремальные задачи
0I 1
^211& ~ ^*—111 ^ (аналогачно) ^||6-1 - 6-2II ^ • ■ •
=* 116+1-611 < ^116 ~*11 2 ^№11 < ^ • 6~, г = 1,...,*. E)
Отсюда в силу неравенства треугольника для норм получаем
116+111 = 116+1 ~ 6 + 6 ~ 6-1 + • • • + 6 ~ 6 + 611 <
< 116+1 -6.11 + 116 -6-111 + •■• + 116 -611 + Н61К
1 1\ б 6 с
Таким образом, мы получили, что ||6+1|| < ^> откуда по индукции
следует, что ||^„|| < 6 идя любого я^Ои неравенство E) выполняется
для всех элементов последовательности ^„.
С) Из неравенства E) следует, что
|16+т ~ 611 = 116+т ~ 6»+т-1 + 6+т-1 ~ 6+т-2 + • • • + 6+1 ~ 611 ^
< 116+т - 6+Ш-111 + Иб+ш-1 -6+т-2|| + -•• + 116+1 ~ 611 <
\ 1 1 \ «5 2 «5
г + ^ + ••• + — ) - < — ■ >0 при п -+ оо,
2"+"»-) ^ 2"+т~2 2" /2 2" 2
Т-е- {6)п^о — фундаментальная последовательность и, значит, она
сходится в силу банаховости X. Обозначим (р(х) = ит &, -х. Поскольку
п-*оо
116 - *Н = 116 - 6-1+6-1 - 6-2 + ••• +6 - 6 +6 - «II <
^ 116 - 6-111 + 116-1 - 6-211 + • • • + 116 - 611 + 116 - *\\ ^
2 116 - «
ТО
|Мх)|| = Шп ||6 - х|| ^ 2||6 - х|| ^ 1С
(положили по определению К = 7С) и
||х + р(х)|| ^ \\х\\ + \\<р(х)\\ ^ \\х\\ + 2С\\Р(х)\\ < б.
Отображение Р 6 8О(х), поэтому Р непрерывно в некоторой окрест-
окрестности х = 0, и, значит, что Р непрерывно в точке х + <р(х) = Шп ^„
п-*оо
и поэтому
р{х + <р(х)) = Шп -Р(б) = ~ ит -р''(^)F+1 - 6)= о=
п—>оо
§ 5. Элементы функционального анализа 75
Пусть X — линейное нормированное пространство, М — некоторое
его подмножество. Элемент к € М называется односторонним касатель-
касательным (полукасательным) вектором к множеству М в точке х Е X, если
существуют е > 0 и отображение г: [0, е\ —+ X, такие, что
а) х + *Л + г(*)еМУ 1<Е [0, е];
Ь) ||г({)|| - оA) при Ь -» +0.
Вектор Н называется касательным к множеству М в точке х, если
векторы Ни —Н являются односторонними касательными векторами к М
в х. Иными словами, элемент Н € X называется касательным вектором
к множеству М в точке х € М, если существуют е > 0 и отображение
г: [-е, е] -+ X, такие, что
а) х + 1Н + г(г) еМУ *е[-е,е];
Ь) ||г(*)|| = о@ при * -+ 0.
Множество всех касательных векторов к М в точке ж обозна-
обозначается Т&М, множество односторонних касательных векторов Т%М.
Очевидно, что Т±М и Т^М — конусы. Если множество Т±М является
подпространством в X, то оно называется касательным пространством
к множеству М в точке х.
Во многих случаях, в том числе и представляющих значительный
интерес для теории экстремальных задач, множество касательных век-
векторов может быть найдено при помощи такого следствия из теоремы
Люстерника.
Теорема (о касательном пространстве). Пусть Х,2 — банаховы
пространства, Р: X -* 2, Ре ЗБ(&), оператор Р'(&) — эпиморфизм,
множество М = {ж е X | Р(х) = Р(х)}. Тогда
ТйМ = КетР'(х).
Доказательство.
А) Докажем, что Т$М С Кег-Р"(х). Пусть Н € ТхМ, тогда существуют
е > 0 и отображение г: \-е, е] -* X, такие, что х + Ш + гA) € М V I €
[-е, е], ||г(<)|| = оA) при I -+ 0. При малых I
Р(х) = Р(х + «А + г(<)) = Р(х) + ЬР'(х)\Н] + оA).
Отсюда гР'(х)[Н] + оA) = 0и, значит, Р'(х)[Н] = 0, т. е. К е Кег^'(ж) =»
Т4М С Кег Р'(х).
В) Докажем, что КегУ(ж) С Т4М. Пусть Н е КегУ(ж). Поло-
Положим г(^) = у;(ж + <Л), где (р — отображение, построенное в теореме
Люстерника. Тогда
Р(х + 1Н + г@) й=Р(х + 1Н + <р(х + Щ) = Р(х) <=>х + Ш + гA) е М,
76 Глава 1. Экстремальные задачи
- Е(х) = 1
+ Щ\\ < К\\Р(х + Ш) -
= К\\1Р'(А)[К] + о(<)|| = К\\о(Щ = 01
г. е. Н е Т±М =» Кег Р'(х) С
Таким образом, Т$М ~ КетР'(х).
5.5. Задачи
Найти производные Фреше следующих отображений.
В задачах 5.1-5.6: Я — гильбертово пространство.
5.2. /: Я-+К, /(ж)= (ж,ж).
5.3. /: Я -» К, /(ж) - ||ж|| = У^)".
5.6. /: Я\{0}-»Я, 1(х) = ~.
ы
5.7. /: К2 —+ К2, /(ж(,Ж2) = (ж1Ж2,ж2 + ж2,), ж = A,2).
1
5.8. /: С([0, 1])-+К, /(ж(-)) = I хгA)й1.
о
1
5.9. /: С([0, 1]) -, К, /(ж(-)) = /
\
о
1
5.10. /: С([0, 1])-+К, /(ж(-)) = ( [х2A)>
о
5.11. /: С([0, 1]) -» К, /(*(•)) - ж@).
5.13. /: С([0, 1]) -» С([0, 1]), /(ж(-)) = ж(-)жA).
5.14. /: С([0, 1])-+К, /(ж(-)) = яшж@).
5.15. /: С([0, 1])->К, /(ж(-)) = 5шж@)со5жA).
5.16. /: С([0, 1]) -> К, /(ж(-)) = жA)а:@) D(<) > 0 V 0 < < < 1).
5.17. /: С([0, 1])-+К, /(с
§6. Гладкая задача без ограничений 77
В задачах 5.18-5.20 указать точки, где функции /: К™ -+ К не диф-
дифференцируемы по Фреше.
5.18. Пх)
5.19. /(ж) = шах |ж,-|.
5.20. /(ж) = ЕИ1-
§ 6. Гладкая задача без ограничений
В этом параграфе даются необходимые и достаточные условия
экстремума функционалов в нормированных пространствах.
6.1. Постановка задачи
Пусть /: X —+ К — отображение линейного нормированного про-
пространства X во множество действительных чисел (в этом случае обычно
говорим функционал на пространстве X), обладающее некоторой глад-
гладкостью, т. е. определенными свойствами дифференцируемости. Гладкой
задачей без ограничений называется задача об отыскании экстремумов
этого функционала:
/(ж) -+ ех1г.
6.2. Необходимые условия I порядка
Теорема 1 (аналог теоремы Ферма в нормированных пространствах).
Пусть х € 1осех1г/ — точка локального экстремума функционала /
и функционал / дифференцируем по Фреше (имеет вариацию по Лагранжу)
в точке х. Тогда
/'(ж) = 0 (й/(х, Л) = 0 V К е X).
Доказательство. Возьмем произвольный, но фиксированный эле-
элемент Н € X. Рассмотрим функцию <р(Х) = /(ж + Аи). Поскольку
х € 1осех1г/, то 0 € 1осех1г^ — локальный экстремум функции <р.
По теореме Ферма для функций одной переменной у'д(О) = 0. По опре-
определению вариации по Лагранжу это эквивалентно тому, что й/(ж, Н) — 0.
В силу произвольности Н Я/(ж, Ь) = 0 V Н € X.
Если функционал / дифференцируем по Фреше в точке ж, то в этой
точке он имеет вариацию по Лагранжу и }'(х)[Н] = й/(ж,Н). Поскольку
из уже доказанного следует, что эта вариация 6/(х, •) = 0, то и /'(ж) = 0
в силу определения дифференцируемости по Фреше. ■
78 Глава 1. Экстремальные задачи
6.3. Необходимые и достаточные условия II порядка
Теорема 2. Пусть функционал / € -О2 (х) дважды дифференцируем
в точке х.
Необходимые условия экстремума: если & € 1остгп(тах)/, то
/'(*) = о, /"(а)[л, л] > о (/"(*) [а, а] < о) V к е х.
Достаточные условия экстремума: если /'(ж) = 0 к
й/7к некотором а > 0, то х € 1остш(тах) /.
Доказательство. По формуле Тейлора
}{х + Н) = /(*) + /'(*) [А] + ^/"(*)[Л,Л] +г(Л), г(/1) =
Докажем теорему для случая минимума. Случай максимума аналогичен.
Необходимость. Поскольку х € 1осшп/, то во-первых по теореме
Ферма /'B) = 0, во-вторых /(^ + А/1)-/(^) ^ 0 при достаточно малых А.
Поэтому в силу формулы Тейлора
/(* + А/1) - }(х) = у/"(*)[А, А] + г(АА) > 0 (г(АА) = о(|А|2))
при малых А. Разделим обе части последнего неравенства на А2 и устре-
г(АЛ)
мим А к нулю. Поскольку — ► 0, то отсюда
А
/"D)[А,А]>0 V НеХ.
Достаточность. Так как /'(ж) = 0, то по формуле Тейлора в силу
заданного условия /"D)[Л, Л] ^ «ЦАЦ2 имеем:
/D + Н) - 1{х) = ± /"(*)[А, А] +г(А) ^ | ЦАЦ2 +г(А) ^ О
при достаточно малых А, так как г(Н) — о(||/1||2). Следовательно,
ж € 1оспйп/. ■
Условие (*) называется условием строгой положительности {отрица-
{отрицательности) второй производной Фреше функционала /.
Отметим, что в конечномерных пространствах условие положитель-
положительной определенности симметричной матрицы А гарантирует строгую
положительность матрицы А (и, значит, является достаточным условием
минимума в стационарной точке). В бесконечномерных пространствах
это не так.
§ 6. Гладкая задача без ограничений 79
Пример 1. В бесконечномерных пространствах условие положитель-
положительной определенности отображения не гарантирует строгой положительно-
положительности отображения.
00 Д
Второй дифференциал / в нуле /"(О)[Л,Л] = 2^]— > О V й ф О
п=1 и
и, следовательно, является положительно определенным. Но вместе
с тем второй дифференциал отображения / в нуле не является строго
положительным. Действительно, неравенство /"(х)[Л,Л] > а||Л||2 V Н
не может выполняться ни для какой константы а > 0, поскольку
на последовательности векторов {ж™} = е„, тг = 1,2,... (е„ — 71-й
^1 I 1 1|2
базисный вектор пространства 12), }"{х)\кп,Ъ.п] — — ^ а||/1„||2.
п
Пример 2. В бесконечномерных пространствах условие равенства
нулю первой производной и положительной определенности второй
производной не гарантируют локального экстремума отображения.
-+ 1ГШ1.
Точка А = 0 является стационарной. Действительно,
-^-4х1кп =*./'@) = 0.
оо д
Второй дифференциал отображения / в нуле /"@)[Л, Л] = 2 ^ —| > О
п=1 и
V к Ф 0 и, следовательно, является положительно определенным,
но вместе с тем как легко видеть не является строго положи-
положительным. В задаче на минимум точка х — 0 B 1осгшп/, посколь-
р
ку на последовательности векторов {ж™} = —, п — 1,2,... (е„ —
/1-й базисный вектор пространства ^)> /(ж™) — ~ 4 ^ ^
71" 71
при п > 1, а сама последовательность •! — >—+^ = 0в пространстве
у п >
При 71 -+ +00.
80 Глава 1. Экстремальные задачи
§ 7. Гладкая задача с равенствами
7.1. Постановка задачи
Пусть Х,У — линейные нормированные пространства. Функционал
/: X -+ К и отображение Р: X -* У обладают определенной глад-
гладкостью. Гладкой экстремальной задачей с ограничениями типа равенств
в нормированных пространствах называется следующая задача:
/(ж) -+ ех1г; Р(х) = 0. (Р)
Отметим, что отображение типа равенства в бесконечномерных
пространствах может содержать в себе как конечное, так и бесконечное
число равенств.
7.2. Необходимые условия I порядка
Теорема (правило множителей Лагранжа). Пусть х € 1осехсгР —
точка локального экстремума в задаче (Р), Х,У — банаховы пространства
(условие банаховости), функционал / и отображение Р е ЗБ(х) — строго
дифференцируемы в точке х (условие гладкости), 1т Р'(х) — замкнутое
подпространство в У (ослабленное условие регулярности). Тогда суще-
существуют множители Лагранжа Ао € К и функционал у* € У* неравные одно-
одновременно нулю, (Ао, у*) Ф 0, и такие, что для функции Лагранжа задачи (Р)
выполняется условие стационарности:
Л'(х) =
Доказательство. Определим отображение
Т(х) := (/(*) - /D), Р(х)), Я1-КхГ.
Очевидно, что отображение Т € 8Б(х) и производная Фреше Т'{х) —
(/'(х), Р'(х)): Х->КхУ.
Возможно одно из двух: образ 1т Р\х) совпадает или не совпадает
со всем пространством К х У.
А) Вырожденный случай: 1т Т\х) ф К х У. К отображению ^'(х)
применим лемму о замкнутости образа. Условия леммы выполняются.
Действительно, подпространство 1тР'(х) замкнуто по условию. Под-
Подпространство /'(КетР'(х)) также замкнуто. (Множество /'(КегР'(х))
§ 7. Гладкая задача с равенствами 81
является подпространством в К. Но в К имеются всего два подпро-
подпространства: 0 и К. И оба они замкнутые. Значит, в любом случае
подпространство {'(КетР'(х)) замкнуто в К.) По лемме о замкнутости
образа подпространство 1т Т'(х) замкнуто в К х У. Так как оно не со-
совпадает с К х У, то 1т Т'{х) — собственное замкнутое подпространство
в К х У. По лемме о нетривиальности аннулятора существуют число Ао
и функционал у* 6 У*, не равные нулю одновременно и такие, что,
(Ао,?*) € Aт^D))\ Значит,
((\0,у*),1тГ\х)) = О <=Ф ((Ао,2/*),^'(х)[/1]) = 0 V А € X
((Ао,/), ((/'(*),А), *■'(*)[*])) = 0 V К € X
<А0/'(х), А) + (у*, Р'(х)[Н]) = 0 V К € X.
А это и есть условие стационарности.
В) Невырожденный случай: 1т Т' (х) — Кх У. По теореме об обратном
отображении существуют отображение Т~х: УУ С К х У —+ X некоторой
окрестности Ж точки (а,у) ((а,у) = @,0)) и константа К > 0 такие,
Положим х(е) = Т '(е,0) для достаточно малого по модулю е. Тогда
Т{х(е)) = (е,0) <=^ /(я:(е)) - /D) = е, ^(я:(е)) = 0,
\\х(е) - х\\ = Н^М) - «|| < ЛГ||(е>0)|| = К\е\.
Из этих соотношений следует, что вектор х не доставляет в задаче
экстремума, ибо вблизи его существуют допустимые векторы х(е), на ко-
которых функционал / принимает значения как большие так и меньшие
чем /(ж). Получили противоречие с тем, что х е 1осех1гР. Таким
образом, невырожденный случай невозможен, и тем самым теорема
доказана. ■
Замечание. Если в условиях теоремы выполнено условие регулярности
отображения Р в точке х, т.е. 1т^'(ж) = У, то множитель Ао ф 0, к,
следовательно, можем считать его равным единице: Ао = 1.
Действительно, если Ао = 0, то у* ф 0 в силу того, что множители Ла-
гранжа одновременно в ноль не обращаются. Поэтому условие стационар-
стационарности приобретает вид: {у*,Р'(х)[Н]) ~ 0 V К € X & (у*, У) = 0 «• у* = 0.
Получили противоречие.
82 Глава 1. Экстремальные задачи
7.3. Необходимые условия II порядка
Теорема. Пусть х Е 1оашп Р — тонка локального минимума в зада-
задаче (Р), X, У — банаховы пространства (условие банаховости), функци-
функционал / и отображение Р имеют в точке х вторые производные Фреше
(/,Р Е О2{х)) (условие гладкости), 1тР'(х) — У (условие регулярно-
регулярности). Тогда существует множитель Лагранжа — функционал у* Е У* та-
такой, что для функции Лагранжа с множителем Лагранжа Ао = 1 задачи (Р)
А(х) = /(х)+(у*,Р(х))
выполняются условия стационарности:
А!(х) = 0 ( & /'B) + (*"(*)) V - 0) A)
и неотрицательности:
]^0 V НЕКетР'(х). B)
Доказательство. Напомним, что по Замечанию к Следствию 2
п. 5.3.3 существование второй производной Фреше в точке гарантирует
строгую дифференцируемость отображения в этой точке.
Поэтому условие стационарности A) с множителем Лагранжа Ао = 1
вытекает из правила множителей Лагранжа для гладкой задачи с равен-
равенствами и замечания к нему (см. предыдущий пункт).
Докажем условие неотрицательности. Возьмем Н Е КетР'(х). Тог-
Тогда по теореме о касательном пространстве Кег-Р'(^) = Т&М, где М —
{х е X | Р(х) - Р(х) ~ О}. Следовательно, Н 6 ТАМ и, значит,
существуют е > 0 и отображение г: [—е; е] —* X такие, что Р(& +
1Н + г(Ь)) = 0 V I 6 [-е; е] и \\г(Щ — о{1) при I —* 0. Таким образом,
х + 1Н + г(Ь) — допустимый элемент в задаче (Р) при I Е [~е; е] и, так
как х Е 1осттР, то /($) ^ /(^ + Нь + г(<)). Поэтому по определению
функции Л и по формуле Тейлора
/D) < Цх + Ш + г{1)) = 1{х + 1Н + т{1)) + (у*,Р(х + 1Н +
(добавим и вычтем (у*,Р(х + Ш + гA))))
- {у*,Р(х + 1Н + г{1))) = А(х + 1Н + г (г)) - (у*,Р(х + 1Н
^2
-I1
Отсюда
§ 7. Гладкая задача с равенствами 83
при малых I. Разделим обе части последнего неравенства на I2 и устре-
устремим I к нулю. Получим
7.4. Достаточные условия II порядка
Теорема. Пусть выполняются условия теоремы о необходимых условиях
II порядка (банаховость, гладкость, регулярность, стационарность для
функции Лагранжа Л(ж) = /(ж) + (у*,Р(х)) с множителем Ао = 1) и для
некоторого а > 0 выполнятся условие строгой положительности:
А"(х)[Н,Н] ^ а\\Н\\2 V Л 6 КетР'(х).
Тогда х Е 1осттР — точка локального минимума в задаче (Р).
Доказательство. По лемме о правом обратном отображении к ото-
отображению Р'(х): Х^+У существуют отображение М: У —* X и константа
С > 0 такие, что,
Р1 {х) оМ = 1у, \\Му\\ < С\\у\\ V у 6 У
Возьмем х + Н — допустимый элемент в задаче (Р(х + К) = 0). Поло-
Положим Н2 := М(Р'(х)[Н\) и обозначим Н{ := К - Н2. Тогда Р'(х)[Ь,х] =
РЧх^Н - Н2] = Р'(х)[Н] - Р'(х)М{Р'(х)[Н)) = Р'(х)[Н) - Р^хЩ = 0.
Значит, К\ Е Кег^(^). По формуле Тейлора
0 = Р(х + Н) = Р(х) + РЧЩН] + ^Р"(х)[к, к] + о(\\к\\2)
Отсюда существует 6 > 0 такое, что
\\Р'(х)[к}\\ = 1-\\р"(х)[к,к}\\ +о(\\к\\2) < ^ЦЩ2 V ЦАЦ < 6
с некоторой константой Сх > 0. Поэтому \\к2\\ =
С||^D)[й]|| < ССШ2 < ССх6\\к\\ = е||А|| при е = СС,6 и \\к\\ - \\к2
11*111 = Ни - Ы < ИЛИ + ИМ1 «• A - е)||й|| < ||А1|| < A + е)||й||.
Вновь по формуле Тейлора
/D + к) = А(х + к)= А(х) + А'(х)[к] + ^Л"(*)[й, к] + о(\\к\\2) =
84 Глава 1. Экстремальные задачи
Отсюда, обозначая В := ||Л"(^)||, имеем
/D + К) - /D) = ^А"[й, + йг.Й! + й2] + 2
- 2В\Ы\ ■ \ы\ -
1 - еJ - Щ\ + е)е - Ве2) + о{\\Н\\2) > О
при достаточно малых е > 0 (при е = 0 множитель в круглых скобках
равен а > 0). Из последнего соотношения следует, что х 6 1осгшпР. ■
§ 8. Гладкая задача с равенствами
и неравенствами
8.1. Постановка задачи
Пусть X, У — линейные нормированные пространства. Отображе-
Отображение Р: X —» У, функционалы /;: X —* К, г = 0,1,...,т, обладают
некоторой гладкостью. Гладкой экстремальной задачей с ограничениями
типа равенств и неравенств в нормированных пространствах называется
следующая задача:
/о(ж)->гшп; /,(ж)<0, *=1,...)т, Р(х) = 0. (Р)
8.2. Необходимые условия I порядка
Теорема (правило множителей Лагранжа). Пусть х 6 1осттР —
точка локального минимума в задаче (Р), X, У — банаховы пространства
(условие банаховости), отображения Р,/,• 6 8О(х), г = 0,1,...,т, —
строго дифференцируемы в точке х (условие гладкости), 1тР'(х) —
замкнутое подпространство в У (ослабленное условие регулярности).
Тогда существуют множители Лагранжа — вектор А = (Ао, Аь..., Ат) 6
Кт+1 и функционал у* & У* не равные одновременно нулю, (А, у*) ф 0,
и такие, что для функции Лагранжа задачи (Р)
»=0
выполняются условия:
а) стационарности:
А'D) = 0
§ 8. Гладкая задача с равенствами и неравенствами 85
1=0
Ь) дополняющей нежесткости:
с) неотрицательности:
А* > 0, г = 0,1,...,т.
Доказательство. Можно считать, что /о (ж) = 0, иначе рассмотрим
функцию /о(ж) = /0(ж) - /о(ж). Если /,(ж) ф 0 при 1 < г < т, то
отбросим эти ограничения, поскольку для локального экстремума огра-
ограничения и (ж) < 0 несущественны и полагаем А; = 0. Таким образом,
можно считать, что условия дополняющей нежесткости уже выполнены.
А) Вырожденный случай. \тР'(х) ф У. Тогда 1тР'(х) есть за-
замкнутое собственное подпространство У. По лемме о нетривиально-
нетривиальности аннулятора замкнутого собственного подпространства существует
ненулевой функционал у* 6 AтР'(ж)) С У*. Это означает, что
(у*,у) = 0 V у Е 1т*1'(ж) о (у*,Р'(хЩ) = 0 V Н 6 X о (*"(*))*»* = 0.
Остается положить А, = 0, г = 0,1,... ,т, и приходим к утверждению
теоремы.
В) Невырожденный случай. 1тР'(ж) = У, т.е. оператор .Р'(ж) ото-
отображает пространство X на все У. Положим для 0^&^т
Ак = {П\{!\{х),К)<0, г = к,к+1,...,т, У(ж)[й] = 0}.
Очевидно, что Ао С Ах С ... С Ат.
Лемма 1 (основная). Ао — пустое множество.
Доказательство. Предположим противное, т.е. Аоф 0. Тогда суще-
существует вектор К Е Кег.Р'(ж), для которого (/,'(ж),/1) < 0, г = 0,1,...,т.
По теореме о касательном пространстве КетР'(х) = Т%М, где М = {ж 6
X | .Р(ж) = Р(х) = О}. Значит, существует отображение г: [—е, е] —* X
(е > 0) такое, что ||г(*)|| = оA),
(Ь))=0 У*б[-е,е]. A)
При малых I > 0 имеем неравенства
ЛD + <й + г(*)) =/<(*)+ <</!(*),Л)+ о(*)< 0, г = 0,1,...,т. A4)
86 Глава 1. Экстремальные задачи
Соотношения A) и A,), г = 1,...,т, означают, что при малых
I > 0 элемент х + 1Н + г{1) допустимый в задаче (Р). Но при этом
неравенство Aо) (?о(х + 1к + г(г)) < 0 при малых I > 0) противоречит
тому, что х Е 1оспшгР. ■
С) Лемма 2. Если Ат есть пустое множество, то для задачи (/*)
верен принцип Лагранжа.
Доказательство. Если Ат = {кЕХ\ {^(х),Н)<0, Р'{х)\Щ = 0} = 0,
то {^(х),Н) — 0 V к Е КетР'(х) (действительно, если бы существовало
к: (/;(*),й> > 0, Р'(х)[Н] = 0, то </;(*),-Л) < 0, *"(Щ-Щ = 0 =*
-Ь, е Ат =» Ат ф 0 — противоречие), т.е. /^(ж) 6 (Кег^'(ж)). Так
как по лемме об аннуляторе ядра регулярного оператора (Кег^'(ж)) =
1т(Р'(х))*, то {'т(х) Е 1т(Р'(х))* и, значит, существует у* Е У*, для
которого /^D) + (*"(*)) V = 0.
Получили условие стационарности функции Лагранжа Л(ж) с Ао =
• • • — Ат_1 = 0, Ат = 1. ■
Таким образом, из пп. В) и С) вытекает, что либо принцип Лагранжа
уже обоснован (Ат — 0), либо
3 5 к, 0 < к < т: Ак = 0, Ак+1 ф0. B)
ХУ) Лемма 3. Если выполнены соотношения B), то К — 0 является
решением следующей задачи:
(/^),Л)->пшг; (//D),й)<0, г = к+1,...,т, Р1(х)[Н) = 0. (?)
Доказательство. Предположим, что утверждение леммы неверно.
Тогда найдется такой элемент т], что {!'к(х),г]) <,0, (/.'(ж),7/) < 0,
г — к+ 1,..., тп, ^'(^[т/] = 0. Пусть 4 — элемент, принадлежащий Ак+Х,
т.е. (//(а),0 <0, г = к+ 1,...,тп, Р'(х)[%] = 0. Тогда при малом Ь>0
элемент т] + ^ принадлежит Ак в противоречии с B). ■
Е) Завершение доказательства. Применим к задаче (Р) теорему
Куна—Таккера, учтя при этом, что условие Слейтера для этой задачи
выполнено (из-за непустоты Ак+Х). По этой теореме найдутся неотри-
неотрицательные числа \к = 1, А&4_1,... ,Ат, такие, что Выполняются условия
дополняющей нежесткости А,-/,-($) = 0, г = к + 1,..., т, и для функции
~ ~ т
Лагранжа задачи (Р) А(к) — ^2 \^}1(х),к) в точке к = 0 выполнен
§ 8. Гладкая задача с равенствами и неравенствами 87
принцип минимума:
шш Л(Л) = Л(Л) = 0 <=» Л(Л) = ^2 А<(/<(*)> Л) ^ Л(Л) =
т
4),О> = О V К Е КегУ(я).
т
Из последнего соотношения вытекает, что А(Н) = X) А,-(//(А),Л) = О
для любого Л 6 Кег^'(^) (действительно, если бы существовало
К Е КегУ(а): Л(Л) > 0, то -К Е КетР'(х), Л(-Л) < 0 = А(Н) - проти-
т
воречит принципу минимума), т. е. ^ Л;/,'($) 6 (Кег^(ж)) . Поскольку
•=*
по лемме об аннуляторе ядра регулярного оператора (К^'())
1т (^(х))*, то существует у* ЕУ*, для которого
Это и есть условие стационарности функции Лагранжа Л (ж), если
положить Ао = ... = АА_! =0. ■
Замечание. Из доказательства теоремы следует, что если 1т Р1 (х) = У
(т.е. если & регулярно в ж) и существует элемент Н Е КетР'(х), для
которого (/'(&),Л) < 0, г —- 1,...,пг, ■&■ Аг ф 0 (назовем это условие
аналогом условия Слейтера), то Ао ф 0 и, следовательно, можем полагать
Ао= 1.
Приведем еще одно доказательство правила множителей Лагранжа в
задаче с ограничениями типа равенств и неравенств в нормированных
пространствах с использованием элементов выпуклого анализа.
Доказательство. Как и в предыдущем случае, не ограничивая
общности, считаем, что /;($)= 0, г = 0,1,...,т. Будем рассматривать
основной невырожденный случай: 1т^'(ж) = У. Рассмотрим задачу без
ограничений
<р(Н):= тах (//(ж),Л) + 6КегР'(х)(к) -> тт, •
г—0,1,...,т
где 6А(-) — индикаторная функция выпуклого множества А.
Лемма. Вектор К = 0 доставляет абсолютный минимум функции (р
(Ь, = 0 Е аЬзтш <р).
88 Глава 1. Экстремальные задачи
Доказательство. Доказательство леммы проведем от противного.
Предположим, что 0 ^ аЬзппп (р. Тогда 5аЬ8тш < 0. Следовательно,
существует вектор Н Е Кег^(ж), для которого тах (/,'B),Л) < 0 «■
»'=01т
) < 0, г = 0,...,т. Поскольку 1тР'(х) = У, то по теореме
о касательном пространстве Ь, Е КетР'(х) = ТХМ, где М = {х \ Р(х) —
Р(х) = О}. Тогда по определению касательного вектора существует
отображение г: [-е, е] —* X такое, что Р(х + ЬН + г(Ь)) = 0 V I Е [-е, е\,
||г(*)|| = о{1). Поэтому П{х + Ш + г@) = /,•(*) + (№)& + г(*)) +
о(\\Ш + г(Ь)\\) = Ь(/'4(х),Н) + о{1) < 0 при малых (>0, г = 0,1,..., т.
Таким образом, вектор х + Ш + г(Ь) является допустимым элементом
в задаче (Р), но при этом /о(& + ЬН + г(Ь)) < 0 = /о(^)- Получаем
противоречие с тем, что х Е 1осгшпР. ■
Вектор Н = 0 доставляет абсолютный минимум выпуклой функции <р,
следовательно, по аналогу теоремы Ферма для минимума выпуклой
функции 0 Е д(р{К). По теореме Моро—Рокафеллара субдифференпиал
суммы функций равен сумме субдифференциалов, значит,
0 Е д<р{-) = д . тах Шх), •) + дЖегУ (&)(■).
По теореме Дубовицкого—Милютина субдифференциал максимума фун-
функций равен выпуклой оболочке субдифференциалов, следовательно,
д тах (/,'(ж),-) = сопу {/о(^),•■• ,/т(^)}- По определению субдиф-
ференпиала функции дбКетР'(х)@) = {Н*ЕХ* \ (Л*,Л>< бКетР'(Щк)-
6КетР'(х)@) V Н Е X} 0€Ке4Р'<:8) {й* | (Н*,Н) < 6КегВ*(&)(Н) V к} =
(КетР'(х)) — 1т (Р'(х)) (по лемме об аннуляторе ядра регулярного
оператора). Таким образом, 0 Е сопу {/о(^),• • •, /т(^)} + 1т (
Значит, существует вектор А Е Кт+1 такой, что ^,Х{ ~ 1, А; ^ 0,
и функционал у* Е У*, для которых ^ л»//(^) + (Р'(&)) У* - 0- ■
8.3. Необходимые условия II порядка
Теорема. Пусть х Е 1оспплР — точка локального минимума в зада-
задаче (Р), X, У — банаховы пространства (условие банаховости), функци-
функционалы /{, г = 0,1,...,т, и отображение Р — дважды дифференциру-
дифференцируемы по Фреше в некоторой окрестности точки х (условие гладкости),
1тР'(х) = У (условие регулярности). Тогда
тах Ахх(х, А, у*)[Н, Н]^0 V К Е К,
§ 8. Гладкая задача с равенствами и неравенствами 89
где А(х,\у*) = Е Ъ№) +
1=0
К := {к Е X | (/?(*), й) < 0, г = 0,1,... ,т, ?{&)[Н] = 0}
— конус допустимых вариаций, а
х Г*
V = 0;
(=0
= О, г= 1,...,т; А,- ^ 0, г = 0,1,...,т,
1=0
Множество С — совокупность наборов (А,у*), для которых выполнены
условия а)-с) правила множителей Латранжа для задач с равенствами
т
и неравенствами и У] А, = 1.
1=0
Доказательство основано на лемме о минимаксе и теореме Лю-
стерника. Непустота множества С следует из теоремы о необходимых
условиях экстремума I порядка в гладкой экстремальной задаче с огра-
ограничениями типа равенств и неравенств в нормированных пространствах.
Лемма 1 (о минимаксе). Пусть X, У — банаховы пространства,
А 6 Ь(Х, У) — линейный непрерывный оператор из X на пространство У,
АХ = У, х\ Е X* — функционалы на X, г = 1,... ,п, такие, что
тах (х*,х) ^0 V ж 6 КегЛ; (*)
г=1,...,п
положим 8(а, у):= тш тах (о< + (х*,ж)) для векторов а Е К™, у Е У.
х: Ах+у=01—\,...,п
Тогда
а) величина 8(а, у) имеет двойственное представление
8(а,у) = зС(а,у):= тах^ ( ^ А,а,- + (у*,у)),
где зС(а,у) — опорная функция множества С'.— \{^,У*) Е К™ х У"
п п -.
У2\,х*(+А*у* =0, А,-^0, г= 1,...,п, ЕА,- = П в точке (а, у);
1-1 !=1 '
Ь) минимум в определении 8(а, у) и максимум в зС(а, у) достигаются.
90 Глава 1. Экстремальные задачи
Доказательство. Нетрудно видеть, что следующие три задачи экви-
эквивалентны:
(р{х):= тах {а,- + (ж*, ж)} + 6Му(х) -» М, (Р))
1 = 1,.. ;П
где Му:= {ж \ Ах + у = 0}, (=* ^(Р) = 5(а,у)).
тах К + 6} -> М; { Е М(у), (Р2)
1 = 1,...,П
где М(у):= {{= F,...,6.)е К" | Эж 6Х: & = (ж?,ж>, Ах+у = 0};
с->М; а, + &<с, 1= 1,...,п, (
Здесь Му, М(у) — аффинные многообразия соответственно в X и К™.
Возьмем элемент х для которого Лж + У = 0. Тогда Му — х + КегЛ,
и, следовательно, М(^) = {^ | ^ = (ж*, ж) + (ж*, Л), Л 6 КегЛ}. Возьмем
произвольный вектор ^ 6 М(у). Тогда ^ = (ж*, ж) + (ж*, Л), где Н Е КегЛ.
По условию леммы найдется г'о 6 {1,...,п} такое, что (ж*0,/1) ^ 0
и, значит, тах {а,+&} > а,-„ + (а:? ,г>+(ж* ,Л> > а,0 + (ж^,ж) > тт {аг+
»—1,...,п х=1,...,п
(ж*, ж)} =: С V ^ 6 М(у) Таким образом, значения задачи (Р2), а вместе
с этим и значения задач (Р\), (Рз) ограничены снизу. Задача (Рз) —
задача линейного программирования, значит по теореме существования
в (Рз) решение существует и, следовательно, в остальных задачах решение
также существует. Обозначим решение в задаче (Р^ через х.
Поскольку х 6 Аг§ Рх, то (так как <р — выпуклая функция) х 6
аЬзгшп <р. Отсюда 0 Е д<р(х) и по теореме Моро—Рокафеллара (д(/+д) =
01 + дд)
0 Е д( тах {а* + (ж^ж)}) + дFМу(х)) . A)
По теореме Дубовицкого—Милютина, если /(ж) =д(&), то 9тах{/,^}|г =
соп\{д]\&1)дд\&). Для наших функций это означает, что
;ж,*, \{ > 0, г = 1,...,п,
Вычислим субдифференциал второго слагаемого:
дFМу(х)) = {х* | (ж*, ж - ж) ^ 6Му(х) - 6Му(х) V ж Е X} =
(ж — допустимый элемент в задаче (р), следовательно, ж 6 Му и, значит,
<5Му(ж) = 0)
= {х* | (ж*,ж-ж) ^йМу(ж) V жбХ} = {ж* | (ж*,ж-ж) ^0У х Е Му} =
§ 8. Гладкая задача с равенствами и неравенствами 91
(поскольку х Е Му := {ж | Ах + у = 0}, то условие х Е Му равносильно
условию Л = х - х Е КегЛ)
= {х* | (ж*, К) = 0 V к Е КегЛ} = (КегЛ) = 1тЛ*.
Тогда из соотношения A) следует, что существует вектор А = (Аь..., А„)
и функционал у* ЕУ*, для которых выполняется равенство:
Х{ = 1. B)
1=1 1=1
При этом, если А,- > 0, то по теореме Дубовицкого—Милютина, а; +
(х*,х) = 8(а,у). Далее имеем
8(а,у) = ^2 ^ Х> (
1=1
п
1=1 1=1 1=1
п
С другой стороны, если (А, у*) Е С, то Е А«ж«* + &*У* = 0 и для любого
ж такого, что Лж + у = 0 будет выполнено
п п п
А^й^ 4~ \У ) У) ^ / Л{й1 — \у , Лж) — / А^й| — (Л у , ж) :=
!=1 1=1 ! = 1
( )
1-1 1=1 1=1
Тогда
тах (а,- + (х*,х)) У^ А,- = тах (а; + (ж,*, ж)).
1=1
,-«ч + {у*,у) < тт гаах (а,- + (ж;,ж)) = 5(а,у),
Т^ х:Ах+у=0{=\,...,п
(п ч п
X) А,а; + (У*, У> ) = Е А^а<-
V» ,— 1=1 У 1=1 .
92 Глава 1. Экстремальные задачи
Введем обозначения: х\:= //(ж), Л:= Р'{х), щ:— -$"(&)[к,к], г =
0,1,...,т, у:= -Р"(х)[к,к], где к Е К — некоторый фиксированный
вектор.
В лемме п. 8.3, использованной при доказательстве необходимых
условий I порядка в задачах с равенствами и неравенствами, было дока-
доказано, что вектор к = 0 доставляет абсолютный минимум функционалу <р,
тЯе<р(к):= тах (/,'(ж),к) + 6КетР'(х)(к). Значит, тах (//(&), й>> О
1-0,1,...,гп 1=0,1,...,т
для любого к 6 К&тР'(х). Следовательно, условие A) леммы о минимак-
се выполняется. По этой лемме существует элемент ^ = %(к), Л^ + у= О,
для которого
/ \ 1 /
. тах (<ц + (х*,0) = тах ( ^ А,-а,- + {у*, у) ) = ~ тах ( ^
=1) тах кхх(х,\у*)[к,к). B)
По формуле Тейлора в силу условий Е'(х)[к] = 0иА^ + у = 0
, к] + о{12) = 12{А$ + у) + о{12) = оA2).
По теореме Люстерника существует отображение <р: V -+ X некоторой
окрестность точки х такое, что
Р(х + ф)) = О, ||^(Ж)|| ^ К\\Р(х)\\ V х Е V.
Полагая гA) := (р(х +Ьк + Ь2%), получим, что при малых I
1к + 12$ + г(Ь)) = Е(х + 1к+12$ + <р(х + *к + <2^)) = О,
Не ограничивая общности, считаем, что /;(&) = 0, г = 0,1,...,т.
Рассмотрим задачу:
тах их) -+ тш; Р(х) = 0. (Р1)
1=0,1,.. .,т
Лемма 2. х 6 1осттР'.
Доказательство. Проведем доказательство леммы от противного.
Предположим, что точка х & 1осттР'. Тогда для любого 6 > 0 суще-
§8. Гладкая задача с равенствами и неравенствами 93
ствуетточка х = хF) такая, что ||ж-#|| < йи тах /Дж) < тах },(&) =
!=0,...,т !=0,...,т
0#/((г)<0,! = 0,...,т, Р(х) = 0. Значит, точка х является допусти-
допустимой в задаче Р и /о(ж) < 0 = /о(&)- Следовательно, точка х @ 1осгшпР —
противоречие с условием теоремы. Поэтому наше предположение, что
точка х B 1осгшпР' неверно и, значит, х 6 1осгшпР'. ■
По лемме 2 при малых I > 0
0= тах /;(&) < тах
г—0,1,...,т !=0,1,...,
= тах
V . тах
1=0,1,...,
= тах \
>=0,1,...,т [_
), Ш
,Л] + о(
= 12 тах
^- тах Ахх(х,Х,у*)[Н,к)
2 (А,у*)€Х;
Разделим обе части неравенства на — и устремим I нулю. Получим
тах Ахх(х, А, у*){к,к] ^ 0 для любого вектора к 6 К. ш
8.4. Достаточные условия II порядка
Теорема. Пусть выполняются условия теоремы о необходимых услови-
условиях второго порядка (банаховость, гладкость, регулярность), множество
Сф 0 к для некоторого а > 0 выполняется условие строгой положитель-
положительности:
тах Ахх(х,Х,у*)[Н,к]^а\\к\\2
для любого к, принадлежащего конусу допустимых вариаций К. Тогда
х 6 1осттР — точка локального минимума в задаче (Р).
Доказательство. Не ограничивая общности, считаем, что /*(&) = 0,
г = 0,1,..., т. Покажем, что существует 6 > 0 такое, что условия
A)
94 Глава 1. Экстремальные задачи
противоречивы при \\к\\ < 6, к Ф 0. Из этого сразу будет следовать,
что точка х Е 1осгшпР. Действительно, пусть вектор к удовлетворяет
условию A) и \\к\\ < 6г. Тогда по формуле Тейлора
и{х + к)= /,D) + (//D), к) + У?(&)[Н, к) + п(к), \\п(к)\\ = 0
Р(х + к)= Г(&) + Р\х)[к} + 1-Р"(Щк, к] + г(к), \\г(к)\\ = о(\\к\\2).
Введем обозначения: ж*:=/,'(ж), Л:= Р'(х), }{х)~ тах /,(ж), а, :—
!=0,1,...,т
-}"(х)[к, к]+п(к), у.= -Р"(х)[к, к]+г(к). Тогда в силу соотношений (I)
разложения перепишутся в виде
&(х + к) = {х*,к}+а{ <0, г = 0,1,...,т, Ак + у = 0. B)
Откуда
(гГ.ЛК^кК^НЛН2, ||ЛА|| = ||у|| < Сг||Л||2. C)
По лемме Хоффмана расстояние от вектора к до конуса допустимых
вариаций К оценивается по формуле
C)
1 = 0
Поэтому вектор к можно представить в виде суммы векторов к = Н1-\-к2,
где к{ е К, а вектор Й2 допускает оценку \\к2\\ < Сз||й||2. Пусть 62
выбрано так, чтобы из условия \\к\\ ^ 62 следовало бы неравенство
Сз||Л.|| ^ - (достаточно положить (#2 = ^—)• Тогда
2 \ 2Сз /
||А|| - Сз||Л||2 ^
и, значит,
1|Л2||<Сз||Л||2<4Сз||Л,||2. • D)
По лемме о компактности множества С вытекает, что если (А, у*) Е С,
т° НУ*II ^ С*4- Пусть й3 настолько мало, что из условия \\к\\ < й3 следует
неравенство
./||Г"|| -^ . 1Г-111 • (->)
Обозначим С5 := тах ||Л:„(А,А,у*)||. Если (А,у*) Е С, то по опре-
определению множества С выполняются условия: А; ^ 0, г = 0,1,...,т,
§ 8. Гладкая задача с равенствами и неравенствами 95
гот т
Е^> = 1» Е^«(ЖЬЖ) + (■&*У*Iх) = О О ^2\(х1,х) + (у*,Ах) — 0 для
>=0 !=0 >=0
т
любого х Е X. Отсюда ЕА;(ж*,ж) = 0 для любого ж Е КегЛ. Значит,
*=о
тах (ж*,ж) ^ 0 для любого ж Е КегЛ. Следовательно, применима
!—0,1,...,т
лемма о минимаксе. По этой лемме
A) „ B)
0> тах Ь(х-\-к) = тах {(ж;,/1)
Лг+»=0|=--0,1,...,т
= тах
\ .=0
+ (У*,г(к))) 2- тах Ахх(х,Х, у*)[Кх
\
га^ --...--чш-^и 2"-'""" 4'
4-^1Ы12>о,
если только из неравенства \\Ъ\\ < 6 ^ гшп{#1,#2)^з} следует неравенство
"тН^п! ^ 403^511*^111 4~ "О3О511^х|| ■О — ^ 4Сз^511^ 1II ~Ь оСзОзН^п! )
4 4
которое всегда будет выполняться при достаточно малых кх, а в си-
силу неравенства \\к\\ ^ 2||/г.х|| и при достаточно малых к. Получили
противоречие: 0 ^ тах /,-(ж + к) > 0. ■
Лемма (о замкнутости). Пусть X — банахово пространство, Ь, Ь С
X — подпространства в X, причем Ь — замкнутое подпространство, а
подпространство Ь1 конечной размерности (дхтЬ1 < +оо). Тогда сумма
Ь + Ь' — замкнутое подпространство.
Доказательство. Достаточно доказать, что сумма Ь+Мпа для любого
вектора а Е X будет замкнутым подпространством (тогда аналогично
подпространства Ь + Ип{ах,а2},... ,1т{ах,... ,а„} также будут замкну-
замкнутыми).
Если вектор а Е Ь, то подпространство Ь + Цп а = Ь замкнуто.
96 Глава 1. Экстремальные задачи
Если вектор а B Ь, то по II теореме об отделимости точка а и подпро-
подпространство Ь (выпуклое замкнутое множество) строго отделимы. Значит,
существует функционал ж* Е X* такой, что вир (ж*, ж) < (ж*, а). Из этого
неравенства вытекает, что ж'ё!1 — аннулятору подпространства Ь.
(Если бы существовало жо е Ь, для которого (ж*, ж0) ф 0, то посколь-
поскольку ах0 е Ь для любого а е К, было бы тах (ж*, ж) ^ тах (ж*, ахо) = +оо.
Это не так. Следовательно, (ж*, ж) = О V ж е Ь и, поэтому ж* е Ь.)
Не ограничивая общности, считаем, что (ж*, а) = 1 (этого мы
можем добиться, умножая функционал ж* на какое-то положительное
число). Пусть точка г принадлежит замыканию множества Ь + 1ш а
(г с Ь + Ипа), т.е. точка г является предельной точкой множества
Ь + Ипа. Следовательно, существуют последовательности ^„ Е Ь, А„ с К
такие, что &, + А„а =:гп —► 2. Тогда в силу непрерывности функционала
ж* (ж*,2„) -> (ж*, г) =:А. С другой стороны, {х*,гп) = (ж*,&, + А„а) =
(ж*,^„) + А„(ж*,а) = А„ (здесь (х*,{„) = 0, так как ж* е Ь1, а ^„ е Ь).
Значит, А„ —> А и, следовательно, ^„ = г„ — А„а —+ 2 — Ха =:% Е1 (в силу
замкнутости Ь). Отсюда гп = ^„ + А„а —> ^ + Аа = 2 Е Ь + 1ша. Таким
образом, множество Ь + 1т а — замкнуто. ■
Лемма (о компактности С). Пусть X, У — банаховы пространства,
оператор А е Ь{Х, У), ЛХ = У, функционалы ж* е X*, г = 1,..., п. Тогда
множество С := {(А, у*) е К" х Г* Х^ ^ + ЛУ = °, А; ^ 0, г =
1,..., п, ^2 А, = 1 ^ является компактом.
1=1 •*
Доказательство. Рассмотрим симплекс Е := {А е К™ | А, ^ О,
г = 1,..., п, ^2 А; = 1} и отображение у>: К™ —> X* такое, уг(А) := 52 А,-ж^.
1=1 ' 1=1
Очевидно, что симплекс Е — компакт, а отображение <р непрерывно. То-
Тогда множество <р(Е,) С X* — компакт (образ компакта при непрерывном
отображении является компактом). Возьмем точку (А, у*) с С. Это озна-
означает по определению множества С, что (р(Х) + А*у* = 0. Следовательно,
множество у(Е) С 1гпЛ*. По лемме об аннуляторе ядра регулярного
оператора 1тЛ* = (КегЛ). Множество (КегЛ) замкнуто (аннулятор
всегда замкнут), значит, и множество 1тЛ* замкнуто и, следователь-
следовательно, является банаховым пространством. Отметим, что КегЛ* = {0}.
(Действительно, если К* е КегЛ*, то А*Н* = 0. Это означает, что
(А*Н*,х) = 0 для любого ж е X, следовательно, (й*,Лж) = 0 для любого
ж с X. Поскольку ЛХ = У, то отсюда следует, что Н* = 0). По теореме
Банаха об обратном операторе для линейного непрерывного оператора
Л*: У* —► 1тЛ* С X* существует линейный непрерывный обратный опе-
оператор Л*'1: 1тЛ* —► У*. Образ компакта при непрерывном отображении
§8. Гладкая задача с равенствами и неравенствами 97
является компактом, поэтому А*~х<р(Т,) ~ компакт. Но тогда и множе-
множество {(А,у*) е С} = {(\,А*~1(р(\)) | А е И} также является компактом. ■
Лемма (о двойственности для задачи о кратчайшем расстоянии).
Пусть X — линейное нормированное пространство, К С X — непустое
выпуклое подмножество. Тогда
Л(х,К,Х)= хир {(х*,х)-зК(х*)},
1И1<1
где А(х,К,Х) — щГ{||ж — у\\ \ у 6 К} — расстояние от элемента х до
множества К.
Доказательство. Напомним некоторые сведения из выпуклого ана-
анализа. Опорной функцией множества К С X называется функция
аК(х*) = хир (ж*, х), конволюцией двух функций / и д называется функ-
х€К
ция (/ фр)(ж) = М (/(«!) + д(х2)), сопряженной функцией к функ-
ху+хг-х
ции / называется функция /*(ж") = 5ир((ж*,ж) - /(ж)), индикаторной
х
функцией множества К называется функция 6К(х) = \ ' а „'
К +00, Ж ^ И.,
имеет место формула (/ ф д)* = /* + 9* ■
Обозначим ^(ж):= ||ж||. Тогда
а(х,К,Х) = М\\х- х2\\ = М(\\х - ж2|
хг€К Хг
"=Ф М (\\Х1\\
Тоща по формуле взятия сопряженной функции от конволюции
а*(;К,Х)(Х*) = №®6К)*(Х*)=^(Х*) + FК)*(Х*) =
(по определению сопряженной функции)
= 8ир((ж*,ж) - ||ж||) +«ир((ж*,ж) - 6К(х)) —
{Н 51;р
Функция ж —+ й(х, К, X) является непрерывной, выпуклой (в силу
выпуклости К) и, следовательно, замкнута. Тогда по теореме Фенхеля—
Моро (/ = Г)
а(х,К,Х) = а(х,К,Х)** ^%ир((ж*,ж) - <5(ВХ*)(ж*) - зК(х*)) =
X*
— хир ((ж*, ж) - зК(х*)). ш
98 Глава 1. Экстремальные задачи
Лемма (о сопряженном конусе). Пусть X, У — банаховы простран-
пространства, оператор А Е Ь(Х,У), АХ = У, функционалы ж* Е X*, г — 1,... , га,
конус К:= {х Е X \ (ж,*, ж) ^0, г = 1,..., га, Ах = 0}. Тогда сопряженный
конус к конусу К представим в виде
+ЛУ = 0, А^О, г=1,...,га, у* 6 Г*}.
Доказательство. По определению сопряженного множества К* =
{жо Е X* | (жо,ж) ^ О V ж Е К}. Пусть х*0 Е К*. Если ж 6 КегЛ,
то либо существует г Е {1,...,га} такое, что (ж*,ж) > 0 и тогда
тах (ж,*,ж) > 0; либо (ж*,ж) ^ 0, г = 1,...,га, значит, ж Е К и
тогда по определению сопряженного множества (х1,х) ^ 0. Таким обра-
образом, в любом случае тах (ж*, ж) ^ 0 V ж Е КегЛ. Следовательно, точка
ж = 0 Е аЬ$тт( тах (ж,*, ж) + йКегЛ(ж)). По аналогу теоремы Ферма
для выпуклых функций
0 Е а(. тах (ж*,ж) + ЖегЛ(ж))|а.=0 = схт\{х*0,х\,... ,ж*} + 1тЛ*.
п
Значит, существует пара (А, у*) Е К™+1 х У* такая, что ^ А;ж,* + Л*у* = 0,
;=о
п п
А; ^ 0, г = 0,1,... ,га, ^ А; = 1. Если Ао = 0, то ^ Л«ж* + Л<У = 0 и
>=0 !=1
" \ * У*
можно прийти к противоречию. Если А0^0,тож0 + Х/—ж,- +Л —=0.и
!=1 Ао Ад
Лемма (Хоффмана). Пусть X, У — банаховы пространства, оператор
А Е Ь(Х,У), АХ = У, функционалы х\ Е X*, г = 1,...,га, конус
К :— {ж Е X | (ж*,ж) ^0, г = 1,...,га, Лж = 0}. Тогда существует
константа С > 0 такая, что
а(н,к,х)^<
Доказательство. Положим Ь = Нп {ж*,..., ж*} + 1т Л*. По лемме об
аннуляторе ядра сюрьективного оператора 1т Л* — (КегЛ) — замкнуто
(аннулятор всегда замкнут). Тогда 1тЛ* — замкнут и, следовательно
по лемме о замкнутости Ь — замкнутое подпространство и тем самым
банахово пространство.
п
Обозначим Л! (А, у*) = ^А,-ж,* +Л*у*. Тогда оператор Л! Е Ь(Кп х
У*,Ь). Поскольку А\: К™ х У* ^5 Ь, то по лемме о правом обратном
§ 9. Элементы общей теории поля 99
отображении существуют оператор М: Ь -+ К™ х У* и константа С > О
такие, что
т.е. если ||ж*|| < 1 и Мх* — (Х,у"), то
Отсюда следует, что |А,-| < С, \\у*\\ < С.
По лемме (о двойственности для задачи о кратчайшем расстоянии)
а(х,К,Х)= вир {(х*,х)-зК(х*)} = вир {(х*,х) - &ир{х*,Н)\ =
|М|<1 |к-||<1 1 Ь^К >
(поскольку К* = {х* Е X* \ {х\ К) > О V НЕЕ}, то -К* = {х* Е X*
\х*,Н) <0У НЕ К})
= вир \(х*,х) - ( °' Х* % "**> 1 = вир {{я:*,я:) | -х* Е К*} =
(яо лемме о сопряженном конусе)
= вир \{х\
1МК1 I
\х)
\х* +ЛУ,х\| 0 < \ < С, ||р*|
§9. Элементы общей теории поля
Рассмотрим гладкую экстремальную конечномерную задачу с огра-
ограничениями типа равенств
/(ж)-итшг; Р(х) = 0. (Р)
Здесь /: К™ -+ К, Р: К™ -+ Кт. Функции {,Р обладают определенной
гладкостью. Стандартным возмущением задачи (Р) называется серия
задач с параметром Ъ Е Кт
/(ж) -> т!п; ^(ж) = Ь. (Щ
100 Глава 1. Экстремальные задачи
Теорема (о поле в конечномерных задачах с равенствами). Пусть
функции },Р Е С2 (К™) дважды непрерывно дифференцируемы (условие
гладкости), 1тР'(х) — Кт (условие регулярности), существует вектор
множителей Лагранжа у Е Кт, такой, что для функции Лагранжа
А(х,у) — /(ж) + (у,Р(х)} задачи (Р) с множителем Лагранжа с \й — 1
выполняется необходимое условие экстремума 1 порядка — условие стацио-
стационарности:
Ах(х,у) = 0
и достаточное условие экстремума II порядка — условие положительности:
Ахх(х, у)[Н, К] > 0 V Н Е КегУ (ж), НфО,
Тогда существуют функции ж: V —► К™ и у: V —► Кт, х — х(Ъ), у = у(Ь),
определенные в некоторой окрестности нуля II С О@, Кт), для которых
ж@) = х, з/@) = у; система уравнений
выполняется в этой окрестности тогда и только тогда, когда х = х(Ь),
У = у(Ь); причем х(Ъ) Е 1осттРб для любого Ъ е 17.
Доказательство. Введем отображение Ф: К™ х Кт ->■ К™ х Кт, дей-
действующее по формуле Ъ(х,у):=(Ах(х,у),Р(х)) = A\х) + {у,Р'(х)),Р(х)).
Тогда Ф(*,у) = (Ах,Р(х)) = @,0). Покажем, что отображение Ф удо-
удовлетворяет условиям теоремы об обратной функции в точке (&,у).
Условие гладкости Ф Е С1 в некоторой окрестности точки (х, у) выпол-
выполняется в силу заданного условия гладкости на функции },Р. Якобиан
отображения йе1Ф'(ж, у) ф 0. Действительно:
+ ({у,Р'(х)},0)=(Ахх[х] + {
Если (ж, у) Е КегФ'(ж,у), то Р' (х) [ж] = 0 и
Ахх[х] + (у,Р'(Щ = 0. A)
Умножая это векторное равенство на ж, получим
Ахх[х,х] + (у,Р'(х)[х]) = Ахх[х,х] = 0.
Отсюда в силу условия положительности ж = 0. Поэтому из равенства A)
{у,Р'(х)} — 0. Из условия регулярности 1тпР'(х) = Кт следует линей-
линейная независимость строк матрицы Р'(х). Следовательно, из равенства
{у, Р'(ж)) = 0 вытекает, что у = 0. Таким образом, КегФ'(ж, у) = 0.
Значит, якобиан йе1Ф'(ж,у) ф 0.
Ответы к задачам главы 1 101
По теореме об обратной функции для отображения Ф существует
прообраз точек из некоторой окрестности точки @,0). В том числе
существует прообраз точек вида @,6) при Ь Е II Е О@). Значит,
существуют непрерывные в точке 6 = 0 функции ж: V —► К™ и у: V -+
Кт, ж = жF), у = у(Ь), ж@) = х, 3/@) = у, определенные в некоторой
окрестности нуля V Е О@, Кт), для которых
Ф(жF),г,F)) = @,6) «• Л*(жF),3,F)) = 0, Р(х(Ь)) = 0.
В конечномерном случае положительность матрицы Р'(х) эквивалентна
ее строгой положительности. Значит, существует константа /3 > 0 такая,
что Ахх(х,у)[Н,Н] > р\\Щ2 Для любого К Е КетР'(х). Отображение
Р'(х(Ъ)) является непрерывным отображением от 6. Поэтому
Ахх(х,у)[Н,к] > ^||Й||2 V Л Е КегУ(жF)).
Отображение Ахх(х(Ь),у(Ь)) является непрерывным отображением от 6.
Следовательно,
Ранг непрерывной матрицы локально постоянен, значит 1т^'(жF)) =
Кт. Таким образом, при Н Е Кег Р' (жF))
Ахх(х(Ь),у(Ь))[Н,к] = Ахх(х,у)[Н,Н] +
- Ахх(х,у))[НМ > ^\\Щ2 - ^\\П\\2 = ^\\Н\\2.
Поэтому в точке жF) выполняются достаточные условия минимума для
точки жF). Следовательно, жF) Е 1осгшпРб. ■
Аналогично доказывается и бесконечномерный вариант этой тео-
теоремы.
Поле экстремалей, которое строится далее при доказательстве до-
достаточных условий экстремума в вариационном исчислении, будет по-
построено таким же образом. Только в качестве возмущающего параметра
в вариационном исчислении берутся краевые условия на правом конце.
Ответы к задачам главы 1
1.1. E,2) Е 1остт, 5пцп = -оо, 5тах = +оо.
1.2. B,3) # 1осехгг, 5,^ = -оо, 5тах = +оо.
1.3. (-4,14) Е аЬктт, 5т1п = -52, 5тах = +оо.
5
1.4. ( ~ з> ~з' 0 е аЬ5т1п'
102 Глава 1. Экстремальные задачи
1.5. (-, -1, -) й 1осех1г, 5^ = -оо, 5тах = +оо.
1.6. A,1) 6 1остт, @,0) ^ 1осех1г, 5,™ = -оо, 8тах = +оо.
1.7. A,1) 6 1остах, @,0), @,3), C,0) ^ 1осех1г, 8^ = -оо, 8^ = +оо.
1.8. @,0) 0 1осех1г, 5щш = -оо, 5тах = +оо.
1.9. (±^,±1) еаЬвтт, ^ = -1^, @,0) 6 1остах, (±^,о),(О,±1) <2
1осех1г, ^тах = +ОО.
1.10. (~,~) 6 1ос1шп, (~,~) 6 Юстах,(±1,0),@,±1) 0
\-\/2е у2е'/ ^у2е •\/2е/
1осех1г, ^тш = -оо, 8тт = +оо.
1.11. B,3) 6 1остах, @,ж2) 6 1остах при х2 Е (-оо; 0) и F,+оо),
@,ж2) 6 1остт при 0 < х2 < 6, @,0), @,6), (жь0) ^ ЬсеДг^й =
-оо, 5тах = +оо.
1.12. @,0) 6 аЬвтт, 8^ = 0, ( - -, -~) ^ 1осех1г, 5тах = +оо.
1.13. A, -2) ^ 1осех1г, 5,^ = -оо, 5тах = +оо.
1.14. A,1,1) 6 1остах, (жь0,а:з), (ж1,ж2,О) ^ 1осех1г, 5,^ = -оо,
^ +О
= +ОО.
, 1 8
1.15. 11 - - б аЬ&шп, 8^ = —.
, 3^ 8
1.16. Г-уЕ аЬвтщ, 5,^ = —.
1.17. (-З-л/6,-З-л/6) еаЬяшп, 8,^ = -4-2\/б, (-3 + \/б,-3 + \/б) 6
аЬвтах, 5тах = -4 + 2\/б.
2.1. (^7>^) е аЬвтт, 5,^ = —, 8так = +оо.
2.2. (-, -) е аЬвтах, 5,^ = е1/4, 5щш = 0.
2.3. (~^>-~^) е аЬвтт, 5,^ = -\^, ^- ~^,^) е аЬвтах,
2.4. B,-3), (-2,3) 6 аЬишп, 8^ = -50, (-,4), ( - -,-4) 6 аЬзтах,
^тах = Ю6-.
4
2.5. у-, -, -) е аЬвпип, 5,^ = -, 5тах = +оо.
( 1 2
аЬвгшп, 5
/3 3 1\
и'8'4/
/-33 229
1 ^ ) « )
98
3
VI'
аЬ81
и
Ответы к
задачам
=] Е аЬвтах, 5тах
аЬвтт, 5
11
~ 32'
главы 1
'тах = +00.
1071
1
л/п'
= +оо.
2
\/14'
103
3 Ь
1 ^/14/
2.6.
2.8. (, ,) ,
2.9. (з>з'з) еаЬш1ах> 8™*= у @,0,-1) еаЬвгшп, 81гйа =
2.10. (-1,1,1) 6 аЬвтт, 5,™ = 0, A,1,1) 6 аЬвтах, 5тах = 2.
1 2 \ / 1 2 1 \ / 2 1 1
1 1 2\/1 2 1\/2 1 1 х
аовшах, лщш = Ь
ЬтЯх = •—•
2.12. (°, у, у) еаЬзтах, 5тах = 36, (о, у, у) еаЬапт, 5т1п = 16.
2.13. (-, -, -) Е 1остах, (*,0,1 -1) Е 1остт при I Е @, 1), (*,0,1 -1) Е
1остах при I Е (-оо, 0) и A, +оо), @,0,1), A,0,0), (*, 1 - *,0) ^
1ОсеХ1Г V *, Зщах = +ОО, 5тт = -ОО.
2Л4 (^'±^'^)'(-^'±^'-^) 6 аЬ5тах' 8- =
1 1 1 \ / 1 ! 1 \ ^ •
^'^'-^'(-^'^'Л) 6аЬ51ШП' ^ =
стационарные точки (ж1,0,жз), х\+х\— 1, (жьЖ2,0), Ж! +Ж2 = 1
$ 1осех1г V (жьж2,ж3) Е К3.
2.15.
2.16.
а
~н
ж = :
6 аЬ8ГП1П , ^„ш
Ь - (а, ж
Х + п \а\2
1
(а, ж) -Ь|
|а|
N 1/2
/ 1 \ 1/2
2.17. 5т1п = Пх - Ь\2 - 7-п(*,х - ЪJ\ .
2.18. Стороны прямоугольника: щ^,п2\/2, площадь 2а\аг.
7а\ 2а% 2аз 8
2.19. Стороны параллелепипеда: —т=, —т=, —=, объем
V3 V3 /3
—т=, —т=, —=, объем у=
V3 V3 \/3 3\/3
104 Глава 1. Экстремальные задачи
3 1 (-± ±±\ (±
. .. .. Л' Л''
( - —?=,—т=>—7= ) е аЬзтш,
71'
м г2__1 1л (-±л ^
= ^=, (*,0,0), @,*,0), @,0,
1осех1г V
||
3.2. @,..., 0) 6 аЬвтт, 8^ = 0, (±п/4,..., ±п~1/4) 6 аЬвтах, 5^ =
л/п, критические точки @,..., 0, ±тп~1/А,..., ±т" 1//4) (и их всевоз-
всевозможные перестановки координат), тп = 1,.,., п.
3.3. @,...,0)еаЬв1шп, 5^ = 0, (±7Г1/2,...,±тГ1/2)еаЬвтах, 5^=1,
критические точки @,..,, 0, ±т~1/'2,..., ±т'1^2) (и их всевозмож-
всевозможные перестановки координат), т = 1,..., п.
3.4. @,1) 6 аЬзтт, 5т1п = е~\ @,1) 6 аЬвтах, 5тах = е - 1, @,0) г
1осех1г.
3.5. @,0) 6 аЬхтт, 8^ = 0, (—, -) 6 аЬвтах, 8^ = -.
3.6. @,0,0) 6 аЬвтт, 5^ = 0, A2,0,0), @,12,0), @,0,12) 6 аЬяпах,
5тах = 144, D,4,4), @,6,6), F,0,6), F,6,0) - критические точки
в задаче на максимум.
3.7. @,0,0)баЬ5пип, 5^ = 0, @,12,0) 6 аЬвтах, 5тах = 576,
(Т'Т'Т)' (Т'Т'°)' @,у,|), F,0,6), A2,0,0), @,0,12)-
критические точки в задаче на максимум.
11 1ч 1 / 1 1\ /-3 3 К
'б'-б) 6аЬ5т1П' 5т'п = й' (°'4'-4)' (в'8'4)
, -, -^ 6 10СтаХ, ^тах = +ОО.
3.9. (-2,0,7NаЬвшт, 5^ = -17, 5тах =+оо.
3.10. ( - -, 0,20) 6 аЬзтш, 5^ = -52,5, 5тах = +оо.
3.11. A6,257,592) ^ 1осех1г, 8^ = -оо, 8тт = +оо.
3.12. @,1,0) 6 аЬктт, 8т[в = 0, 5тах = +оо.
/2 174 24\
3.13. (^-,—,-у] 6 1остт, 5пйп = -оо> A,0,3) 6 1остах,
, (-1,6,-3)
Ответы к задачам главы 1
105
3.14.
(у/6,1,1), A, \/б, 1), A,1, \/б) 6 аЬвпнп, 5^
о ЛГ
з'У з' V з У саЬ5гаах> 5шах=: з V з'
/ И Г7\
{1осех1г.
I)- С1'
Да.
Да.
4.1.
4.2.
4.3.
4.4.
4.5.
4.6.
4.7.
4.8.
4.9.
4.10.
4.11.
4.12. \у =
а > 0, Ь > 0.
р> 1.
0, <*22 ^ 0, апа22 - «12 ^ 0.
(-3, ж<0,
[-3,-1], Ж = 0,
-1, 0<ж<1,
[-1,3], х=1,
3, К ж.
тах
4.13. \у =
2'
,1
4.14. [О, а].
4.15. В* = {х* 6 X* | \\х*\\х, < 1}.
4.18. A,-1) 6 аЬхпип, 5тш = 3.
4.19. (-1,-1) е аЫтпп, 5т;п = -2.
4.20. а\ + а] < 1 =Ф- (аьа2) 6 аЬвтт, 5т1п = а\ + а\; а\ + а] > 1 =>
аЬ5пип'
5.1.
106 Глава 1. Экстремальные задачи
11*11 '
5.4. }'(х)[Н\ — 3(х, Ь,)\\х\\.
х(х,Н)
5.5. 7(&Ш = №\\ + -~^тг-
\\х\\
К {х, К)х
5.7. /'
5.8. /'(*(■
5.9. /'(*(■;
5.10. 1'Ш-
5.11. /'(*(■))[*(')] = Л@).
5.12. Г
5.13. /'
5.14. /'
5.15. /'
5.16. /'D(-
5.17.
5.18. ж = 0.
5.19. {ж = (ж1,...,ж„)||а:,-| = \х}-\ для некоторых г
5.20. {х- (х1,,..,х„)\х1 -х2 ■ ,,,-хп = 0}.
Глава 2
Линейное программирование
В линейном программировании изучаются задачи об экстремуме
линейной функции нескольких переменных при ограничениях типа
равенств и неравенств, задаваемых также линейными функциями.
Рождение линейного программирования принято отсчитывать от ра-
работы Л. В. Канторовича 1939 года об оптимизации раскроя листов фанеры
для самолетов и распределения ограниченных ресурсов в более общих
проблемах, где впервые было показано, что многие задачи экономики
формализуются как задачи об экстремуме линейной функции при линей-
линейных ограничениях. Канторович для рассмотренного им класса задач ввел
двойственные переменные, дал им содержательную экономическую ин-
интерпретацию и описал алгоритм решения двойственной задачи близкий
по духу к симплекс-методу.
Через несколько лет (около 1947 года) интерес к подобным задачам
возник у американских математиков. Этот интерес был вызван пробле-
проблемами, связанными с экономикой и военно-промышленным комплексом.
Из числа экономистов, пропагандировавших среди математиков данный
класс задач, следует прежде всего назвать Т. Купманса. Он же ввел
термин «линейное программирование» (Нпеаг рго§гатгшп§). Впослед-
Впоследствии Канторовичу и Купмансу была присуждена Нобелевская премия
по экономике за 1975 год. Слово «программирование» заимствовано
из зарубежной литературы и в данном случае означает не что иное, как
«планирование».
Симплекс-метод был разработан Д.Данцигом. Общая теория была
построена коллективом математиков, среди которых следует отметить
так же Куна, Таккера, Гурвица и Дж. фон Неймана.
В этой главе рассматриваются постановки задач линейного програм-
программирования, правило решения задач в канонической форме по симплекс-
методу, приводятся с решениями примеры. Вводится понятие двойствен-
двойственности, проводится обоснование симплекс-метода, дается ряд методов
нахождения первоначальной крайней точки. Рассматриваются наиболее
известные типы задач линейного программирования — транспортные
задачи и задачи о назначении.
108 Глава 2. Линейное программирование
§1. Симплекс-метод
1.1. Постановки задач. Геометрическая интерпретация
Задачей линейного программирования в канонической форме называется
задача нахождения максимума линейной функции от п переменных
ж = (хи...,хп)
/(ж) = С\Х\ + С2Х2 + ■■■ + СпХп,
удовлетворяющей системе тп линейных неравенств
и ограничениями неотрицательности х^ > 0, з = 1,...,п. Поскольку
уравнения системы можно умножать на —1, то считаем, что в задаче
линейного программирования в канонической форме Ь,- ^ 0, г = 1,,.., т.
В дальнейшем мы, как правило, будем использовать векторно-
матричную запись:
(с, ж) —* тах; Ах = Ь, ж ^ 0. (Р*)
Здесь ж = (жь...,ж„) е К" - неизвестная переменная, задан-
заданные вектора с = (си...,сп) е К" и Ь = (Ьи ... ,Ът) е Кт, (с, ж) :=
— скалярное произведение векторов с и ж, А = {а|},^1,...>т =
— заданная матрица со столбцами а3 =
3 = 1,..., п, размеров их п.
Функция / называется целевой функцией, вектор с — вектором
стоимости, вектор Ъ — вектором ограничений, матрица А — матрицей
условий.
Обозначим 5р — численное значение задачи (Р), Ат§Р — множество
решений задачи (Р), т.е. множество допустимых точек ж е К™, для
которых (с, х) = 8Р.
Задачей линейного программирования в общей форме назовем задачу
(с, ж) -+ гшп; Ах ^ Ь. (Р)
Иногда задачи линейного программирования рассматриваются приве-
приведенными к нормальной форме
(с, ж) —» тах; Ах < Ь, ж ^ 0. (Р„)
§ 1. Симплекс-метод 109
Каноническая форма более удобна при описании алгоритмов ре-
решения, задачи в общей и нормальной формах часто используются при
рассмотрении проблем существования решений и двойственности. Двой-
Двойственные задачи для задач в нормальной форме приобретают наиболее
симметричный вид.
Сведение различных форм задач друг к другу
Задачи в различных формах легко сводятся друг к другу путем введе-
введения дополнительных координат и изменением матрицы А. Все получен-
полученные формы одной задачи одновременно: а) имеют пустое или непустое
множество допустимых точек; Ь) имеют или не имеют конечное решение.
Например, если дана задача в нормальной форме, то ее можно
свести к задаче в канонической форме путем введения дополнительных
координат х = (хп+1,..., хп+т):
(с, х) —* шах; Ах + 1х = Ь, х ^ 0, х ^ 0.
Здесь I — единичная матрица размеров т х тп,
В качестве упражнений попробуйте самостоятельно свести другие
формы задач линейного программирования друг к другу.
Упражнения
1. Свести задачу в канонической форме к задаче в нормальной
форме.
2. Свести задачу в канонической форме к задаче в общей форме.
3. Свести задачу в общей форме к задаче в нормальной форме.
4. Свести задачу в общей форме к задаче в канонической форме.
5. Свести задачу в нормальной форме к задаче в общей форме.
Геометрическая интерпретация. Рассмотрим более подробно задачу
линейного программирования в канонической форме. Через 1)(Рк)
будем обозначать множество допустимых точек в задаче (Р*) A)(Рь) :=
{х с К™ | Ах = Ь, х ^ 0}). Множество 1)(Р*) является Выпуклым
Многогранником В Пространстве К^. Линии уровня функционала (с, ж)
являются гиперплоскостями. Нетрудно видеть, что экстремум линейной
функции (если он существует) достигается в крайней (угловой) точке
выпуклого многогранника.
Напомним, что точка Л выпуклого множества Б называется крайней
(угловой), если не существует точек йь <12 е О, Л\ф Аг, и числа I е @, 1)
таких, что Л = Ы{ + A — 0^2- У многогранников крайние точки —
вершины. Имеет место следующая
Теорема Минковского. Выпуклый компакт в К™ является выпуклой
оболочкой своих крайних точек К
'' Бесконечномерный аналог этой теоремы: вьгауклый компакт в нормированном (и даже
локально-выпуклом линейном топологическом) пространстве является выпуклой
оболочкой своих крайних точек был доказан Крейном и Мильманом. Его называют
теоремой Крейна—Мильмана,
ПО Глава 2. Линейное программирование
Число крайних точек множества В, задаваемого в виде конечно-
конечного числа линейных равенств и неравенств, является конечным. Таким
образом, для решения задачи линейного программирования (если оно
существует), достаточно перебрать значения функции (с, ж) во всех
крайних точках множества В. Но нахождение всех этих крайних точек
и перебор значений функции (с, ж) — операция довольно трудоем-
трудоемкая. Описываемый ниже симплекс-метод решения задачи линейного
программирования позволяет, начиная с некоторой исходной крайней
точки, переходить к другой по направлению наибольшего возрастания
функции (с,х). Свое название симплекс-метод получил из-за вида мно-
множества допустимых элементов, которое в простейших задачах имеет вид
симплексов (отрезка, треугольника и т. д.)
Задача (Р*) называется невырожденной, если любая крайняя точка
множества В{Рь) содержит ровно т положительных координат.
Пусть ж — крайняя точка в невырожденной задаче с положительными
координатами (для определенности первыми) Ж(,.,. ,жт. Тогда вектор х
можно представить в виде ж = (хь, ж„), где хъ = (жь..., хт) — базисный
вектор, ж,- > 0, г = 1,...,т, ж„ = @,... ,0) е К"~т — небазисный
вектор. Аналогично матрицу А можно представить в виде А = (Аь,Ап),
Будет доказано в п. 3.2, что матрица А& невырожденная, то есть ее
определитель отличен от нуля.
1.2. Правило решения задач по симплекс-методу
Для решения невырожденной задачи линейного программирования
следует:
1. Привести задачу к задаче в канонической форме (Р*).
2. Отыскать крайнюю точку ж = (ж()... ,жт,0,,,. ,0), ж; > 0,
г = 1, ...,т, множества допустимых элементов Х)(Р^). Методы нахо-
нахождения начальной крайней точки будут описаны ниже в § 4.
3. Построить симплексную таблицу для начальной крайней точки ж.
Пояснения к построению таблицы:
В таблице тп + 4 строки и п + 4 столбца.
В первом столбце, начиная с третьего по тп + 2-е место, нахо-
находятся базисные векторы а',...,ат, соответствующие положительным
координатам начальной крайней точки ж = (жь ..., жт, 0,..., 0).
Во втором столбце на аналогичных местах стоят значения с,- вектора с
с теми же номерами, что и столбцы а3.
Последний столбец заполняется при исследовании симплексной
таблицы.
В первой строке, начиная с четвертого столбца, стоят элементы
СЬ... ,Сп.
Вторая строка, начиная с третьего столбца, — векторы Ь,а ,... ,ап.
Под ними — разложения этих векторов по базису а',...,ат. Яс-
§ 1. Симплекс-метод 111
т
но, что Ъ = ^2 а' X; о Ах = Ь. То есть разложением вектора Ъ
1=1
является вектор х^ ненулевых координат крайней точки х. Предпо-
Предположим, что вектора а3, _/ = 1,...,п, имеют следующее разложение
т
по базису а1,...,ат: а3 = ХХЖ>\? ° а* — А^ о А = АЬХ, где
X = {жу}»=1,...,т — матрица разложений векторов а1,...,а™ по базису
а1,...,ат, состоящая из столбцов х1,...,хп. Тогда X = А^1А, то есть
неизвестные векторы-столбцы х3 отыскиваются с помощью обратной
матрицы: х3 = А^1а3. Очевидно, что при г = 1,... ,ш разложения век-
0 \
торов а' тривиальны: а* = а*, то есть в этом случае х3 =
1
V 0 )
= е3
(е3 — вектор-столбец канонического базиса).
В предпоследней строке г в столбце под вектором Ъ (хь) запишем
го = {съ,хъ). Тогда %о — значение функционала в начальной крайней
точке х. Под векторами а3, $ = 1,...,п, запишем %$ = {сь,х3}, то есть
г = (ги..., гп) = сьХ. Очевидно, что г$ = с^ при з — 1,..., т.
В последней строке Д, начиная с четвертого столбца, записывается
разность между элементами предпоследней строки и элементами первой
строки: Д = г - с ■«■ Д; = г, - с*, г = 1,.., ,п.
базис
а1
а'0
ат
г
Д
с
°<о
Ь(хь)
ХХ
(Ч, хь)
а>
1
0
0
С1
0
ат
0
0
1
Ст
0
Ст+1
ат+1
%1т+1
хцт+1
Хтт+1
{сь,хт+1}
Ат+1
СА
аА
хт]0
{сь,х3°}
А*
Сп
а"
х1п
хцп
Хтп
{сь,х")
д„
1
*т
4. Исследовать симплексную таблицу.
а) Если Д ^ 0, то крайняя точка х — решение задачи (х е Аг§Р*).
Ь) Если для некоторого $ ^ < 0 и ^ < 0, то значение задачи
= +оо;
112 Глава 2. Линейное программирование
с) Пусть в строке Д имеются отрицательные числа, а соответствую-
соответствующие столбцы х3 содержат положительные числа.
Предположим, что гшп Д,- = Д,-о < 0. Ясно, что т + \ ^ Уо ^ п.
Столбец, соответствующий индексу ./о называется разрешающим столб-
столбцом. Если гшп Д,- достигается на нескольких значениях _/, то в качестве
разрешающего столбца выбираем столбец с любым таким индексом. Обо-
Г хг 1
значим Ь{ := < х^0 > 0 > > 0. Эти значения ^ ставим соответствен-
хПп
но в последнем столбце симплексной таблицы. Пусть ^0 = пип и > 0.
Строка вектора а'0 называется разрешающей. Если тт^ достигается
на нескольких значениях г, то в качестве разрешающей строки выбираем
любую такую строку. Элемент х^а называется разрешающим элементам
симплексной таблицы.
Далее необходимо из числа базисных векторов исключить вектор а10,
вместо него взять вектор а-'0. Значение функционала на новой крайней
точке х' с новыми базисными векторами а1,... ,а'°~1,ал, а*0+1, ...,ат,
возрастет на величину -^0Д,0.
5. Построить новую симплексную таблицу для нового базиса а\...,
а19~\а:'0,а">+\...,ат, т.е. фактически разложить векторы Ь,а1,...,ап,
по новому базису. Укажем без обоснования (оно будет приведено
в п. 3.3) способ построения новой симплексной таблицы по предыдущей.
Элементы таблицы х'ц, лежащие под векторами Ь,а1,... ,ап, и не лежа-
лежащие в разрешающей строке старой симплексной таблицы, вычисляются
по правилу прямоугольника:
х1. -г
Х1 — х,
ХЧЗо
из числа Хц вычесть произведение х^ на жу0, деленное на ж,0_,0. Яс-
Ясно, что в разрешаюшем столбце новой симплексной таблицы х'-^ = 1,
остальные элементы равны нулю (ж^0 =0, г Ф г0, г = 1,...,т). Эле-
Элементы разрешающей строки новой таблицы вычисляются путем деления
элементов разрешающей строки старой таблицы на величину ж,0^0:
Далее необходимо вновь исследовать симплексную таблицу, т.е.
вернуться к п. 4 и так далее, пока не придем к решению задачи.
Отметим, что симплекс-метод позволяет решать точно так же и вы-
вырожденные задачи линейного программирования. Число положительных
§ 1. Симплекс-метод 113
координат крайней точки в таких задачах может быть меньше т, но чи-
число базисных векторов всегда равняется рангу матрицы А, величина 1^
может оказаться равной нулю.
Теоретически в вырожденных задачах возможно зацикливание, когда
через несколько этапов приходим к уже рассмотренной ранее крайней
точке и это возврашение может происходить бесконечное число раз. При
этом значение целевой функции не меняется и, значит, 2,-0 = 0. Перейти
от вырожденной задачи к невырожденной можно путем сколь угодно
малого изменения начальных данных задачи.
1.3. Примеры
Производственная задача
Одним из важнейших экономических прототипов математической
модели данной задачи является производственная задача. Пусть на пред-
предприятии имеются производственные ресурсы (сырье) т типов в объемах
Ь],...,Ьт. Предприятие производит продукцию п видов. На производ-
производство единицы продукции з~го вида (з — 1,..., п) требуется использовать
ресурс каждого г-го типа в объеме а\. Прибыль от реализации единицы
продукции з -го вида равна с,-. Следовательно, при изготовлении х$ еди-
единиц продукции каждого вида прибыль предприятия составит величину
л
^2 С}Х$. Надо найти план производства (х1,..., ж„) такой, чтобы прибыль
предприятия была максимальной. Равенства а}х1 + а\х2 -\ + а"хп = Ь{
будут означать, что весь ресурс каждого г-го типа израсходован полно-
полностью. Если ресурсы могут быть израсходованы неполностью, то план про-
извоцства должен удовлетворять неравенствам а}х\+а}х2-\ \-а?х„ ^ Ь,-,
,: ■-- ,... ,т. Можно так же рассматривать смешанную производственную
задачу, в которой часть ресурсов должна быть израсходована полностью,
а часть может быть израсходована частично.
Задача на минимакс
Приведем задачу, не являющуюся задачей линейного программиро-
программирования, но путем замены переменных сводящуюся к задаче линейного
программирования.
Пусть /(ж) = тах{2)(ж),... ,^(ж)} — функция п переменных
х = (ж],... ,ж„) является максимумом линейных функций. Здесь 1(х) =
(с3, ж) - Л3 — линейные функции, ж, с* 6 К™, Л3 & К, 5 = 1,..., к, А —
матрица т х п, Ь 6 Кт. Рассмотрим следующую задачу
/ (ж) —> пйп; Ах = Ь, ж ^ 0. (Р)
В отличие от задачи линейного программирования функция /(ж) не явля-
является линейной. Покажем, что задача (Р) эквивалентна задаче линейного
114
Глава 2. Линейное программирование
программирования
ж„+1-итпп; 1в(х)^.хп+и з=1,...,к, Ах = Ь, х ^ 0. (Р')
Действительно, если ж 6 Ат§Р, то (ж,ж„+1 := /(ж)) 6 Аг§Р'. (Если
допустить, что вектор (х, /(ж)) ^ Аг^Р', то существует вектор ж 6 -О(Р)
такой, что /(ж) < /(ж) =» ж ^ Аг^Р — противоречие.)
С другой стороны, если (х,хп+\) & Аг^Р', то ж 6 Аг^Р. (Если
допустить, что А $ Аг§Р, то существует вектор ж Е О{Р) такой, что
/(ж) < /(ж). Значит, вектор (ж,/(ж) 6 Я(Р') и ж^ < ж„+, =» (ж,ж„+!) ^
АР' — противоречие.)
Пример 1. Решить невырожденную задачу линейного программиро-
программирования в канонической форме
х2 + ж3 - ж4 -+ тах; ж,-
г = 1, 2,3,4,
- Ж2
+х2
ж4 = 3,
с заданной начальной крайней точкой ж = @,0,1,3).
Решение. Базисные векторы а3 = A,0) и а4 = @,1). Составим
первую симплексную таблицу:
базис
а3
а4
2
д
с
1
-1
хъ
1
3
-2
2
а1
1
2
-1
-3
1
а2
-1
1
-2
-3
1
а3
1
0
1
0
-1
а4
0
1
_1
0
3
Из таблицы видно, что в качестве разрешающего столбца можно
взять столбцы а1 и а2. Возьмем для определенности столбец а . Тогда
I = 3, разрешающая строка а4. Заменяем в базисе вектор а4 на вектор а~
и для нового базиса строим вторую симплексную таблицу:
базис
а3
а2
2
д
с
1
1
ж&
4
3
7
2
а1
3
2
5
3
1
а2
0
1
1
0
1
а3
1
0
1
0
-1
а4
1
1
2
3
§ 1. Симплекс-метод 115
Вектор Д ^ 0, поэтому точка х = @,3,4,0) является решением
задачи и 8тах = 7.
Если бы в качестве разрешающего столбца в первой симплексной
таблице взяли столбец а1, то пришли бы к той же точке @,3,4,0),
но за большее число шагов.
Пример 2. Решить задачу линейного программирования
Х\ + Х2 + жз + ж4 + Ж5 + же —+ тах; Х{ ^ 0, г — 1,..., 6,
х\ + Ж2 + 2жз + Зж4 + бжб = 9,
Х2 + Жз + Ж4 + Жб = 3,
Жз 4- ж4 — Ж5 4~ 2ж^ — 1,
ж4 + ж6 = 1,
с заданной начальной крайней точкой ж = A,2,0,0,1,1).
Решение. Базисные векторы а1 = A,0,0,0), а2 = A,1,0,0),
а5 = @,0,-1,0) и а6 = F,1,2,1). Матрица
1 1 0
Аь ~ ' 0 0 -1
0 0 0
не является единичной, поэтому найдем для нее обратную матрицу.
Для этого записываем рядом две матрицы: нашу матрицу Аь и еди-
единичную. Далее сводим матрицу Аь к единичной путем элементарных
преобразований строк. Полученная в результате преобразований ма-
матрица на месте единичной матрицы и является обратной к нашей
матрице Аь.
Напомним, что элементарными преобразованиями матрицы являются:
а) перестановка двух строк;
Ь) умножение строки на число отличное от нуля и
с) прибавление к одной строке другой строки, умноженной на любое
число.
'11 0 6 1 0 0 0\ /10 0 5 1-1 0 0ч
01 0101001 @10 10 1 00
00-1 2 0 0 1 0 I "Ч 0 0 1 -2 0 0-10
,0 0 0 10 0 0 1/ \0 0 0 10 0 0
10 0 0 1-1 0 -5\ /10 0 0 1-1-0-5'
010 10 1 0 0| [01000 1 0-1
0 0 1-20 0-1 0 ~Ч 00100 0-1 2
,0 0 0 10 0 0 1/ \0 0 0 1 0 0 0 1,
116
Глава 2. Линейное программирование
На первом этапе мы умножили третью строку на -1, из первой строки
вычли вторую. На втором этапе из первой строки вычли четвертую,
умноженную на 5. На третьем этапе из второй строки вычли четвертую,
а к третьей строке прибавили удвоенную четвертую.
Таким образом, получили, что
Далее находим разложения векторов а3, а4 по базису а1, а2, а5, а
хъ =
'1 -1 0 -5
0 10-1
0 0-12
,0001
а;1 а4 =
1-1 0-5
0 10-1
0 0-12
.0001
Разложением вектора Ь является вектор A,2,1,1) ненулевых координат
крайней точки. Составим первую симплексную таблицу:
базис
а1
а2
а5
а6
2
д
с
1
1
1
1
хь
1
2
1
1
5
1
а1
1
0
0
0
1
0
1
а2
0
1
0
0
1
0
1
а3
1
1
-1
0
1
0
1
а4
-3
0
1
1
-1
-2
1
а5
0
0
1
0
1
0
1
а6
0
0
0
1
1
0
1
1
1
Разрешающий столбец а4. В качестве разрешающей строки можно взять
строки а5 и а6. Возьмем для определенности строку а6. Тогда I = 1,
разрешающая строка а . Заменяем в базисе вектор а на вектор а4 и для
§ 1. Симплекс-метод
нового базиса строим вторую симплексную таблицу:
117
базис
а1
а2
а5
а4
2
д
с
1
1
1
1
хъ
4
2
0
1
7
1
а1
1
0
0
0
1
0
1
а2
0
1
0
0
1
0
1
а3
1
1
-1
0
1
0
1
а4
0
0
0
1
1
0
1
а5
0
0
1
0
1
0
1
а6
3
0
-1
1
3
2
1
Вектор Д ^ 0, поэтому точка ж = D,2,0,1,0,0) является решением
задачи и б^щ = 7. Полученная крайняя точка содержит только три
положительные координаты. Значит, решенная нами задача является
вырожденной.
1.4. Задачи
Задачи линейного программирования в канонической форме с за-
заданной первоначальной крайней точтсой.
Х\ + Х2 + хт, —+ тах; ж,- ^ 0, г = 1,2,3,
1.1. —х\ +Х2 + ж3 = 2,
3x1 - х2 + хъ = 0, ж0 =@,1,1).
1.2.
1.3.
1.4.
1.5.
1.6.
+ Ж2 + Зжз + Х4 ~~* гпах;
+ 2ж2 + 5а?з — ж4 = 4,
— Ж2 — жз + 2ж4 = 1,
+ жг + 4ж3 - 5ж4 -+ тах;
+ Ж2 - Жз + Ж4 = 4,
+ Ж9 + жз — ж4 = 4
+ жг + ж3 + ж4 -+ тах;
+ Зж2 + жз + 2ж4 = 5,
- жз + ж4 = 1,
жг^0, г =1,2,3,4,
ж0 = @,0,1,1).
ж,-^0, г =1,2,3,4,
го =A,0,0,1)-
ж,-^0, г =1,2,3,4,
хо= @,1,0,1).
+ 352+ жз + Х4 + Ж5 —+ тах; ж,-^ 0, г=1,...,5,
+ Зж2 + 5ж3 + 7ж4 + 9ж5 = 19,
- ж2 + ж4 + 2ж5 = 2, жо= @,0,1,2,0).
Ж1 + ж2 + жз + ж4 —+ тах;
Ж1 + «2 + Ж3 + Зж4 = 3,
Х\ + Х2 — Жз + Ж4 = 1,
Ж1 - Ж2 + Жз + Щ = 1,
^О, 1=1,2,3,4,
= @,0,0,1).
118 Глава 2. Линейное программирование
Х\ + 2ж2 + 2ж3 + ж4 + 6ж5 —+ тах; ж; ^ О, г = 1,..., 5,
_ х1 +3ж2 + 3ж3+ ж4+9ж5 = 18,
" Ж+5ж +2ж + 8ж 13
ж3+ ж5 = 3, жо = (О,1,2,О,1).
хх - ж2 + Щ + ж4 - ж5 - х6 -+ тах; ж; ^ О, г = 1,..., 6,
. _ 2ж! + ж2 + «з + Зж4 + Зж5 + 2ж6 = 7,
х1 -хъ + ж5 - ж6 = -2,
ж2 + ж3 + ж4+ Ж5+2ж6 = 5, х0- @,0,2,0,1,1).
хх + х2+ ж3 + Зж4 - ж5 - 2ж6 + х7 -+ тах;
Ж! + 2ж2 + Зж6 + х7 = 8,
1.9. Ж!+Зж2+2ж3 +2ж6+3ж7=15,
ж2 + Зж3 + 2ж4 + 2ж5 - Зж6 + Зж7 = 11,
ж3 + Зж4 + х5 - 2ж6 + ж7 = 5,
ж^О, 1=1,....7, жо= A,0,0,1,0,1,4).
§2. Двойственность
в линейном программировании
2.1. Элементы выпуклого анализа.
Преобразование Лежандра
Пусть /: К™ -+ К — некоторая функция. Преобразованием Лежандра
функции / (или сопряженной функцией к /) называется функция
Из определения /* видно, что /* — верхняя грань семейства
аффинных функций (ж,у) — /(ж). Ее надграфик является выпуклым
множеством (как пересечение выпуклых множеств — полупространств).
Следовательно, /* — выпуклая функция. Из определения сопряженной
функции следует неравенство Юнга:
Функция /**(ж) := зир {{ж,у) — /*(у)}, являющаяся сопряженной
у
к /*, называется второй сопряженной к /.
В теории двойственности для задач линейного программирования
важной является следующая теорема выпуклого анализа.
Теорема Фенхеля—Моро. [Гл. 6, п. 0.3.] Собственная функция совпа-
совпадает со своей второй сопряженной (/(ж) = /**(ж)) тогда и только тогда,
когда она выпукла и замкнута (т. е. когда ее надграфик ер1 / — выпуклое
и замкнутое множество).
§ 2. Двойственность в линейном программировании 119
2.2. Примеры
Пример 1. Найти первую и вторую сопряженные (в смысле Лежандра)
функции к функции /(ж) = ах2 + Ъх + с в зависимости от значений
параметров а, Ь, с.
Решение. По определению сопряженной функции
1*{у) = 8ир {(ж, у) - /(ж)} = ялр {ху - ах2 -Ъх-с) =
X X
= 8ир { -ах2 + (у - Ъ)х -с}.
■> ( у-ъ\2
Если а > 0, то парабола -аж + (у - Ъ)х - с — -а( ж — 1 +
(У-ЪJ (у - ЪJ у-Ъ
— с достигает своего максимума с при ж = ——.
4а 4а 2а
Поэтому
Найдем вторую сопряженную к /. По определению
Г» := вир {{х, у) - Г (У)} = ^др/жу - ~г^~ + Л =
У У (. ^а )
Г (у-Ъ-2ахJ 2 Ч
= вир^ - — — + ах1 + Ъх + с }.
у I 4а ^
(у-Ъ- 2ахJ ,
Парабола и(у) := - -1 1- ах + Ъх + с достигает своего макси-
мума при у = Ъ + 2ах. Следовательно,
у I
** ( (У-Ъ- 2ажJ 2 1 2
Г (х) = 8ир4 -— — + ах1 + Ъх + с > = ах + Ъх + с.
I 4а ]
Если а = 0, то функция (у - Ъ)х - с -+ +оо, если у фЪ, при ж -+ +оо
или ж —+ —оо. Поэтому
1 1
Найдем вторую сопряженную к /. Нетрудно видеть, что
120 Глава 2. Линейное программирование
Если а < 0, то парабола -ах2 + (у- Ъ)х - с. с осями, направленными
вверх, стремится к +оо при х -+ +оо. Значит, }*{у) = +оо. Найдем
вторую сопряженную к /. Нетрудно видеть, что
/**(ж) := вир {(х,у) - /*(р)} = вир {ху - (+оо)} = -оо.
У У
Пример 2. Найти первую и вторую сопряженные (в смысле Лежандра)
функции к функции /(ж) = ех.
Решение. По определению сопряженной функции
/*(у)=8ир{(ж,у>-/(ж)} ~тр{ху-ех} = $ирд(х),
X XX
где д(х) := ху- ех. Найдем максимум функции д(х). Имеем д'(х) =
у-ех = 0&х = \пу при у > 0. Поскольку д"(х) = -ех < 0, то по
достаточному условию экстремума гладкой функции при у > 0 в этой
точке будет достигаться максимум этой функции. Подставляя х = Ыу
в д(х), находим, что зир д{х) = у\пу - у.
х
Если у = 0, то очевидно, что вир д(х) = §щ>{-ех} — 0. Если у < 0,
X X
то д(х) —у +оо при х -+ -оо. Таким образом,
у = 0,
у<0.
Найдем вторую сопряженную к /. По определению
уу
Г*{х) := вир {(х, у) - !*{у)} = вир { ху - { 0, у = О Л =
» » I I +оо, ^ < о;
= тах{вир{жу- |/1пу+ у},0}.
»>о
Нетрудно видеть, что функция и(у) := ху — уЪгу + у достигает своего
максимума при у > 0 в точке обращения в нуль своей производной.
Д е йствите льно,
и\у) — х- Ь\у - 1 + 1 = х - \куу = 0 <&■ у = ех,
и"{у) = -- < 0 при у > 0.
Подставляя это значение у в выражение для /**(ж), получаем
у},0} = тах{е*,0} = е*.
§2. Двойственность в линейном программировании 121
Равенство /**(ж) = /(ж) = ех следует также непосредственно из тео-
теоремы Фенхеля—Моро, поскольку функция ех является выпуклой и замк-
замкнутой.
2.3. Вывод двойственных задач
2.3.1. Вывод задачи двойственной к задаче в общей форме
Рассмотрим задачу линейного программирования в общей форме
(с, ж) -> тт; Ах ^ Ь. (Р)
Обозначим через 8(Ь) :— тГ{(с, ж) | Ах ^ Ь} — 5-функцию зада-
задачи (Р), рассматривая аргумент Ь как параметр в задаче (Р).
Определение. Двойственной задачей к задаче линейного программиро-
программирования в общей форме называется задача нахождения второй сопряженной
(в смысле Лежандра) функции 8**(Ь) для 5 -функции задачи (Р).
Для нахождения второй сопряженной необходимо найти вначале
первую сопряженную функцию к функции 8(Ь):
8*(у) = ыр{{у,Ъ) - 8(Ь)} = 81ф{<у,Ь> - тГ{<с,ж> | Ах ^ Ь}} =
ъ ь х
= $ир{{у,Ь)-{с,х) \ Ах ^Ь} = < х =
ь,х . I. +со, иначе
= ($ир{{А*у-с,х)}, г/^0, =Г0, А*у = с, у ^ О,
~ I +оо, иначе ~ I +00. иначе-
Найдем сопряженную в смысле Лежандра функцию к функции 8*(у),
т. е. вторую сопряженную к функции 8(Ь):
8**(Ь) = ыр{{у,Ь) - 8*(у)} = *ир{{у,Ъ) \ А*у = с, у ^ 0}.
У У
Таким образом, двойственной задачей к задаче линейного програм-
программирования в общей форме является следующая задача:
<&,»>-> шах; А*у = с, у^О. (Р")
Для задачи линейного программирования в нормальной форме:
(с, ж) —> шах; Ах ^ Ь, ж > О, (Р„)
выпишем без доказательства двойственную задачу (попробуйте сделать
это самостоятельно):
<Ь,р>->тш; А*у>с, у > 0. (Р**)
122 Глава 2. Линейное программирование
Как мы видим, двойственная задача в этом случае обладает определен-
определенной симметрией по отношению к исходной. Элементы бис меняются
местами, максимум меняется на минимум, матрица А меняется на транс-
транспонированную, и матричное неравенство меняет знак.
2.3.2. Вывод задачи двойственной к двойственной задаче
для задачи линейного программирования в общей форме
Покажем, что понятие «двойственности» введено правильно, т. е.
двойственная задача к двойственной является исходной задачей.
{Ь,у) -^тах; А*у = с, у^О. (Р**)
Для того, чтобы вывести двойственную задачу к задаче (Р**) надо вначале
свести ее к задаче линейного программирования в общей форме, для
которой уже известна двойственная задача.
Вначале сведем задачу на минимум. Затем заменим равенство А*у = с
на два неравенства с ^ А*у ^ с О А*у ^ с, -А*у ^ -с. Получим
эквивалентную задачу линейного программировании в обшей форме:
Двойственная к ней будет следующая задача:
{(с, -с, 0), (ж1, ж2, ж3)} -> тах;
(А - А I) I х2 I = -Ь, ж1 ^0, ж2 ^ 0, ж3 < 0.
Перепишем эту задачу в виде
(с, ж1 - ж2) -> тах; А(х1 - ж2) + ж3 = -Ь, ж1 < 0, ж2 < 0, ж3 ^ 0.
Равенство А(х1 - ж2) + ж3 = -Ь эквивалентно неравенству А(х[ - ж2) >
-Ь, поскольку ж3 ^ 0. Обозначим ж = ж2-ж1, тогда ограничений на знак
ж уже не будет. Задача перепишется в виде
— (с, ж) —» тах; — Ах ^ —Ь.
Заменяя тах на тт и умножая матричное неравенство на -1, придем
к задаче
(с, ж) —» тт; Ах ^ Ь, (Р)
являющейся двойственной к задаче (Р**), которая совпадает с исходной
задачей (Р).
Таким образом, мы убедились, что термин «двойственная задача»
используется правильно.
§2. Двойственность в линейном программировании 123
2.3.3. Вывод задачи двойственной к задаче в канонической форме
Задачу линейного профаммирования в канонической форме
(с, х) —* тах; Ах = Ь, х ^ О, (Р*)
сведем к задаче на минимум:
(—с, х) —+ тт; Ах = Ь, х ^ О, (Р')
при этом 5^ — -8р.
Обозначим через 8(Ь) := Ш{(-с,х) \ Ах = Ь, х ^ 0} — ^-функцию
задачи (Р'), рассматривая аргумент Ь как параметр в задаче (Р1).
Найдем первую сопряженную функцию к функции 8(Ь):
8*(Ь*) = тр{(Ъ*,Ь) -8(Ъ)}=$щ>{{Ъ*,Ъ) -Ы{{-с,х) \Ах = Ь, ж^0}} =
ъ ъ х
= ;шр{ F*, 6) + (с, х)\ Ах = Ь, х ^ 0} = зир{ {Ь*, Ах) + {с,х) | х ^ 0} =
Ь,х х
А*Ь* + с ^ 0,
иначе.
Найдем сопряженную в смысле Лежандра функцию к функции 8*(Ь*),
т. е. вторую сопряженную к функции 8(Ь):
8**(Ь) = шр{{Ь*,Ь)-8*(Ь*)} =$ир{{Ъ*,Ъ) \ А*Ь* + с^0} =>
=> 8Р>> = -8**(Ь) = Ы{(-Ь*,Ь) | А*Ь* + с ^ 0}.
Полагая у = -Ь*, получаем 8Р~ = тГ{(г/,Ь) | -Л*г/ + с ^ О}, и, следова-
следовательно, имеем следующую двойственную задачу
а*у > с (р;*)
2.3.4. Упражнения
1. Вывести двойственную задачу для задачи линейного профамми-
профаммирования в нормальной форме с помощью преобразования Лежандра.
2. Вывести двойственную задачу для задачи линейного профам-
профаммирования в нормальной форме путем сведения ее к общей задаче
линейного профаммирования.
3. Вывести двойственную задачу для задачи линейного профам-
профаммирования в канонической форме путем сведения ее к общей задаче
линейного профаммирования.
4. Показать, что для задачи (с, х) —* тт; Ах = Ь, х ^ 0, двойствен-
двойственной является задача (у, Ь) —» тах; А*у ^ с.
124 Глава 2. Линейное программирование
§ 3. Обоснование симплекс-метода
3.1. Теоремы существования, двойственности,
критерий решения
Приведем три теоремы, ифающие важную роль при обосновании
симплекс-метода.
Рассмотрим задачу линейного профаммирования в общей форме
(с, ж) —» тт; Ах ^ Ь, (Р)
где с,ж Е К", Ь Е К™, матрица размеров га х п А = (а|)<=11.,^т =
а\ ••• а?\ . /а{\
I со столбцами а3 = I ... I , ] = 1,..., п.
а\п ••• <&/ \а1)
Обозначим 8р — численное значение задачи (Р), АщР — множество
решений задачи (Р), т.е. множество допустимых точек ж Е К", для
которых (с, ж) = 8Р.
Теорема существования. Если численное значение задачи (Р) конечно
(\8р\ < +со), то ее решение существует (Аг§Р Ф 0).
Доказательство. Отметим сразу, что поскольку численное значе-
значение задачи конечно, то множество допустимых элементов непусто
B?(Р) ф 0). Рассмотрим множество
К := {(а,г) Е К х К™ | Зж: (с,ж) < а, Ах ^ г}.
Ясно, что К — выпуклый конус.
Напомним два определения из выпуклого анализа.
Пусть С :— {с1,...,ст} С К" — некоторое конечное подмноже-
т
ство. Элемент к = ^Ь^, и ^ 0, г — \,...,га, называется конической
1=1
комбинацией С.
Выпуклая коническая оболочка конечного числа точек называется
конечнопорожденньш конусом.
Лемма 1. Конус К — конечнопорожденный.
Доказательство леммы 1. Покажем, что К = сопе{±^ь... ,±^„,
Щ,щ,... ,»?т}> где ^- = (С],а[,... ,От), ] — 1,...,п, щ — A,0, ...,0),
Вложение сопе{±^1(... ,±^„,^о,-. ■ ,»?т} С К, следует из того, что
все образующие конуса лежат в К. Действительно, полагая ж = ±е,-
§ 3. Обоснование симплекс-метода 125
(еь...,е„ — канонический базис в К") в определении конуса К, мы
получим,, что ±^ Е К, з = 1,..., га; для векторов тц надо взять ж = 0.
Обратно, если вектор (а,г) = (а,2Ь... ,гт) Е К, то существует
ж = (ж1,...,ж„) Е К", для которого (с,ж) ^ а, Ах ^ 2. Значит для
некоторых /?о > 0,..., /Зт > 0 выполняются соотношения
{с,х) + /30 = а, Ах + /3 = г (/3 = (/Зи...,рт)
Но это как раз и означает, что
1 1=0
п п
Поскольку ^2хз^з = 12\хз\№пхг€з), то (а,г) 6 сопе{±^,.
Г=1 3 = 1
Лемма 2 (о замкнутости конечнопорожденного конуса). Конечнопо-
рожденный конус замкнут.
Доказательство. Доказательство проведем индукцией по числу тп по-
порождающих точек. Если тп = 1, то конус К = {ж Е К" | ж = Ис\, Ь ^ 0} —
полупрямая, очевидно, замкнутая. Пусть теорема верна для конусов, по-
порожденных тп-1 точкой, тп > 2, и пусть заданы тп точек йь..., кт. Если
конус К = сопе {ку,..., кт} содержит векторы —к\,..., — кт, то К — ко-
конечномерное подпространство, т. е. замкнутое множество. В противном
случае существует вектор (пусть это будет -&„,), который не принадлежит
К (-кт & К). Обозначим К' := сопе {к\,..., кт-^}. По предположению
индукции конус К' замкнут и К = {к \ к = к' + 1кт, к' 6 К1, I > 0}.
Пусть {кп :— к'п + ^"*;т}пеN _— последовательность векторов из К,
сходящаяся к к Е К" (кп —> к). Из последовательности {Ь"} выберем
сходящуюся подпоследовательность {^"'} —* I ^ 0. Имеются две воз-
возможности: либо г конечное число, либо I = +со. В первом случае
получим, что числа к'щ = к -1щкт-^к- 1кт 6 К' (в силу замкнутости
конуса К1), т. е. к Е К и, следовательно, К замкнуто. Во втором случае,
к1"' к"'
деля кщ на <"■', имеем: \- кт = > 0 при г —> со ({&"'} — сходя-
1п> 1п'
к1"'
+со). Откуда
что невозможно так как —кт@К'.
к
шаяся последовательность, {Ь"'} —» +со). Откуда —— сходится к — кт,
126 Глава 2. Линейное программирование
Поскольку 8Р — гшп {а | Эзж: (с,ж) = а, Ах ^ Ь} =: а, то су-
существуют последовательности {ж*} и {а*}, ац -» а при й —* +со,
для которых (с,ж*) = а*, .Аж* ^ Ь (это означает, что последовательность
точек (ак,Ь) Е К — замкнутому по лемме 2 множеству. Поэтому пре-
предельная точка (а, Ь) Е К. Тогда по определению множества К существует
точка & такая, что (с,&) ^ а — 8Р, Ах ^ Ь. Это означает, что & Е АщР.
Теорема существования доказана. ■
Вернемся к задаче линейного программирования в общей форме.
В п.2.3 мы обозначили через 8(Ь) := шГ {(с,ж) | Ах ^ Ь} ~ ^-функцию
задачи (Р), рассматривая аргумент Ь как параметр в задаче (Р).
Лемма 3. 8 — выпуклая замкнутая функция.
Доказательство леммы легко выводится из соотношения ер18 — К,
где К — выпуклый замкнутый конус, рассмотренный при доказательстве
теоремы существования. ■
Лемма 4. Пусть /: К"-»К — выпуклая замкнутая функция и суще-
существует точка 2ц такая, что /(^о) = —со. Тогда /(г) = —со V г Е йот/.
Напомним, что двойственной задачей к задаче линейного програм-
программирования в общей форме является следующая задача:
<&,»>-> шах; А*у=с, у^О. (Р")
Теорема двойственности. Для пары двойственных задач линейного про-
программирования (Р) и (Р**) имеет место следующая альтернатива: или зна-
значение одной из задач конечно (и тогда конечно значение другой и оба значения
совпадают), или множество допустимых элементов в одной из задач пусто
(и тогда другая задача либо несовместна, либо имеет бесконечное значение).
Доказательство. 1) Пусть \8(Ь)\ < со, тогда поскольку по лемме 3
5 — выпуклая замкнутая функция, то по лемме 4 8(г) > -со V г 6 К™.
По теореме Фенхеля—Моро п.2.1 8**(Ь) = 8(Ь). Это означает, что
конечно значение двойственной задачи и оба значения совпадают.
2) Пусть БР = 0 (<ФФ- 8(Ь) — +со), тогда либо а) существует точка 20
такая, что 5B0) = -со, тогда 8* = +со, следовательно, 8** = -со,
т.е. Бр- — 0 (это означает, что множество допустимых элементов
в двойственной задаче пусто), либо Ь) 8(г) > -со V г 6 К™, тогда
по теореме Фенхеля—Моро 8**(Ь) = 8(Ь) = +со (это означает, что
двойственная задача имеет бесконечное значение). ■
Критерий решения. Пусть &, $ — допустимые элементы в задачах (Р)
и (Р**) соответственно (& Е -О(Р), У 6 2?(Р**)). Тогда точки х,^
являются решениями в задачах (Р) и (Р**) соответственно (ж Е АщР,
$ Е Агв Р**) тогда и только тогда, когда
(с, ж) = {у,Ь).
§ 3. Обоснование симплекс-метода 127
Доказательство. Необходимость. Пусть у 6 АщР**, тогда у 6 Б(Р**)
и (у,Ь) = 8р... Аналогично, ж 6 Ах%Р, тогда у 6 1>(Р**) и (с, ж) = $>.
Значение задачи (Р) при этом конечно (|5р| < +оо). Значит по теореме
двойственности значение двойственной задачи также конечно и оба
значения совпадают (8Р = 8Р..). Следовательно, (с,ж) = (у,Ь).
Достаточность. Пусть ж 6 #(Р), у 6 О(Р**) и (с,ж) = (г?,Ь).
Возьмем произвольные допустимые элементы ж 6 Х>(Р), 2/ 6 1>(Р**). Это
означает, что Ах ^. Ь, А* у = с, г/ ^ 0. В силу этих условий на ж и г/
имеем
Из этого соотношения вытекает, что (с, х) > (#, 6) = (с, ж) V х 6 ()
Это означает, что жбАгзР. Аналогично доказывается, что уЕАх%Р**. т
3.2. Свойства множества допустимых точек
Рассмотрим задачу линейного программирования в канонической
форме
(с, х) —» тах; Ах = Ь, х > 0.
Предложение 1. Пусть х = (х!,... ,Х4, 0,...,0) 6 К", х,- > 0,
г = 1,...,й, — допустимая точка в задаче (Р*) (х Е 2?(Р*)). Тогда
точка х является крайней точкой множества допустимых элементов
О(Рк) тогда и только тогда, когда столбцы а1,..., о* матрицы А линейно
независимы.
Доказательство. Необходимость. Пусть х — крайняя точка. До-
Докажем, что тогда столбцы о1,.-,»* — линейно независимы. Доказа-
Доказательство будем вести от противного. Допустим противное, что столбцы
а1,..., о* — линейно зависимы. Тогда существует ненулевой набор мно-
жителей А1,...,А* такой, что Х)^«а< = 0- Значит АХ = 0 для вектора
г"=1
А = (Аь..., А*,0,...,0) 6 К". Поэтому точка хB) := х + IX Е Ор,. при
малых I как больше, так и меньше нуля. Это означает, что точка х
не является крайней. Получили противоречие. Значит, наше допущение,
что столбцы о1,...,о* линейно зависимы — неверно. То есть столбцы
о1,..., о* линейно независимы.
Достаточность. Пусть столбцы, соответствующие положительным
координатам точки х линейно независимы. Для определенности будем
считать, что это столбцы о1,..., о*. Докажем, что тогда х — крайняя
точка. Доказательство вновь будем вести от противного. Допустим
противное, что х не является крайней точкой. Тогда существуют точки
у, 6 О(Рк) и 2 6 О(Рк), У Ф 2, отличные от х и число I 6 @, 1)
такие, что х = 1у + A - 1)г. Из этого равенства и условий х =
(хь...,х*,0,...,0), х,- > 0, г = 1,...,к, у,г > 0 следует, что у -
(У1,---,Ук,0,...,0), г = BЬ...,2*,0,...,0). А из условий Ау = Ь «•
128 Глава 2. Линейное программирование
* = Ь, Аг = Ъ ■& Х]2«а< = ь следует, что ^2(у{ - 2,)о' = 0.
«=1 «=1 >"=1
Это означает, что столбцы о1,...,о* линейно зависимы. Получили
противоречие. Значит, наше допущение, что х не является крайней
точкой — неверно. То есть х является крайней точкой.
Поскольку количество линейно независимых столбцов не может
превышать количества строк матрицы А, то крайняя точка содержит
не более га положительных элементов. ■
Предложение 2. Пусть (Р*) — невырожденная задача линейного про-
программирования в канонической форме, х = (х1)...,хъ,0,...,0) 6 К",
х,- > 0, г = 1,..., к, — допустимая точка в задаче (Р*) (х 6 1>(Р*)). Тогда
а) к > га; Ь) точка х является крайней точкой множества допустимых
элементов О(Рк) тогда и только тогда, когда к = га.
Доказательство, а) Доказательство будем вести от противного. До-
Допустим противное, что существует допустимая точка, у которой менее га
положительных координат. Для определенности пусть^это первые к коор-
координат (к < га). Рассмотрим множество Б = {у 6 К* | Ау = Ь, у > 0}, где
А := {о1,..., о*} — матрица, состоящая из первых к столбцов исходной
матрицы А. Отметим, что множество Б нетгусто. Пусть у — край-
крайняя точка множества Б (докажите самостоятельно ее существование).
У нее число положительных координат I (I ^ к < га) будет меньше то
и соответствующие столбцы матрицы А по предложению 1 линейно
независимы. Тогда вновь по предложению 1 точка 1 = (Л,0,...,0)ЕК*
будет крайней точкой множества БA\), причем число положительных
координат I у нее меньше га. Это противоречит невырожденности задачи.
Значит, наше допущение, что существует допустимая точка, у которой
имеется менее га положительных координат, неверно. То есть к > то.
Ь) Необходимость непосредственно следует из определения невыро-
невырожденной задачи (в невырожденной задаче любая крайняя точка имеет
ровно га положительных координат).
Достаточность. Пусть х = (хь... ,хт,0,... ,0) 6 Б^, х{ > 0,
г = 1,... ,га — допустимая точка в задаче (Р*). Докажем, что тогда х —
крайняя точка. Доказательство будем вести от противного. Предположим
противное, что точка х не является крайней. Тогда по предложению 1
столбцы а1,... ,ат матрицы А линейно зависимы. Это означает, что су-
т
шествует ненулевой набор множителей А^..., Ат такой, что ^2 А^о* = 0.
1 = 1
Значит АХ = 0 для вектора А = (Аь..., Ат,0,... ,0) 6 Кп. Поэтому
А(х + г\) = Ах + 1АХ = Ах = Ъ V I, а вектор х + 2А > 0 при малых I как
больше, так и меньше нуля, т. е. х + #А Е Бр,.. Поскольку х,- + #А,- > 0 при
Ь = 0, то увеличивая \1\, придем к случаю, когда еще одна координата
вектора х +1Х обратится а ноль, а все остальные по—прежнему больше
или равняются нулю. Таким образом, при некотором I допустимая точка
§ 3. Обоснование симплекс-метода 129
х+1\ будет иметь менее т положительных координат. Это противоречит
пункту а) данного предложения. Получили противоречие. Значит, наше
предположение, что точка х не является крайней — неверно. То есть х
является крайней точкой. ■
3.3. Доказательство симплекс-метода
Рассмотрим невырожденную задачу линейного программирования
в канонической форме
(с, х) —> тах; Ах = Ь, х > 0. (Рк)
Напомним, что двойственной к ней является следующая задача:
(Ь,г/)-тт; А* у > с. (Рк**)
При изложении правила решения задачи в канонической форме мы
пользовались фактами, которые были даны там без обоснования. Сейчас
мы их докажем, оформив утверждение в виде теоремы.
Теорема. Пусть х = (хь...,хт, 0,...,0) 6 К", х,- > 0, г = 1,...,т —
крайняя точка множества допустимых элементов #(Р*). Тогда:
а) если Д > 0, то вектор х — решение задачи (Рк), а вектор
у := сьА^1 — решение двойственной задачи (Рк*);
Ь) если для некоторого у А^ < 0 и х* <С 0, то значение задачи
Зр, = +оо;
с) если не выполнены условия пп. а) и Ъ), то точка х' является
новой крайней точкой множества допустимых элементов И(Рк), значение
функционала при этом возрастет на величину —^0Д^0, а разложение
векторов х', о1,..., о" производится согласно симплекс-методу.
Доказательство. Напомним, что по предложению 1 йе1Аъ Ф 0, т.е.
матрица А/, обратима.
а) Пусть Д > 0. Преобразуем это условие с учетом определения
векторов г := сьХ, у := сьА^1 -» уАь = сь и матрицы X (АЬХ = А):
Д>0<»г-с>0<»2>с<» сьХ > с <» уАьХ ~^с&уА^с& А*у > с.
Значит, у является допустимым вектором в задаче (Рк**) двойствен-
двойственной к задаче (Рк)- Кроме того в силу условия Аъхь = Ь
(с,х) = (сь,хь) = {уАь,хь) = (А*ьу,хь) = (у,Аьхь) = {у,Ь}.
По критерию решения п. 3.1 х — решение в задаче (Рк), а у — решение
в двойственной задаче (Р").
Ь) Положим хA) := х - Цх>, 0) + 1е^ (еь..., е„ — канонический
базис в К"). Тогда хA) = (хь - ^,0) + 1е.$ > 0 V I > 0 в силу условия
130 Глава 2. Линейное программирование
х-7 ^ 0 и АхA) = Ах- ЬАъх} + 1Ае^ = Ь - 1а3 + Ьо) = Ь. Значит, хA) —
допустимый элемент для любого I % 0, при этом
(с,х{1)) = {с,х- 1{х3',0) + Щ) = (с,х) - Цсь,х3') + Цс, е5) =
= (с,х) - Ц- + Щ = (с, х) - Цг, - с;) =
= (с, х) - *А,- —► +со при I —> +со.
с) Предположим, что не выполнены условия пп. а) и Ь) теоремы.
Тогда для некоторого ]й такого, что т + 1 ^ ^о ^ п> выполнено условие
Д^о < 0 и величина
Возьмем х' := х - ^„(х-^О) + **0 ел-0. Докажем, что вектор х' является
новой крайней точкой в задаче {Рн)- Покажем вначале, что он является
допустимым вектором. Как и в пункте Ь) выводим, что Ах' = 6. Имеем
х- = хг - гкх{к = х,- —Х{к > 0 при г = 1,..., т;
х
х\ = 0 при г = га+ 1,... ,п,
Таким образом, х' ^ 0, и значит, вектор х' является допустимым
в невырожденной задаче (Р*). По построению у вектора х' по сравнению
с вектором х добавилась одна положительная Уо-я координата, а какие-
то обратились в ноль. Поскольку по предложению 2а) у допустимой
точки число положительных координат не менее га, то в ноль может
обратиться только одна координата (это х^о-я координата обратилась
в ноль). Значит, у вектора х' имеется ровно га положительных координат
на местах 1,..., г'о -1, г'о+1,..., га, ]0. Следовательно, по предложению 2Ь)
х' — крайняя точка. (Отметим, что в невырожденной задаче число
положительных компонент у крайней точки может уменьшаться.)
Выписанные формулы означают, что в новой симплексной таблице
столбец х' вычисляется согласно указанному методу построения сим-
симплексной таблицы. Покажем, что и остальные столбцы х'3 в новой
симплексной таблице строятся по этому же способу. Для этого вычи-
вычислим координаты Х;у разложения столбцов а3, ] = 1,..., п, матрицы А
по базису о1,..., а1'0, ак, ак+\..., а™.
В старом базисе мы имели следующие разложения:
жц + а'°х,оУ, ] = 1,..., п. A)
1=1
§4. Методы нахождения начальной крайней точки 131
т
В частности при ] = ]0 ак = ^ а{х(к + а{°хкк.
Поскольку х^0 Ф 0, то выразим о'0 из последнего уравнения
«5^*0
и подставим в соотношение A). Получим разложения по базису о',...,
т , т } ч
Таким образом,
XI
т / \
,-=1 V х>оЛ / х«оЛ
' * ^ «о, г = 1,..., т, => х-Л =0, г
■ЧЗа
§ 4. Методы нахождения
начальной крайней точки
4.1. Переход к решению двойственной задачи
Рассмотрим метод решения задач линейного программирования пу-
путем перехода к двойственной задаче и решения полученной двойственной
задачи. При этом строка Д последней симплекс-таблицы даст нам ре-
решение исходной задачи.
Пусть нам дана следующая задача линейного программирования:
<&,»>-> ппп; А*у^с, у>0. (Р)
Двойственной для нее является задача в нормальной форме
(с, х) -> тах; Ах ^ Ь, х > 0. (Р**)
132 Глава 2. Линейное программирование
Сведем эту задачу к эквивалентной задаче в канонической форме
путем добавления неотрицательных (искусственных) переменных ж =
(х„+1,... ,хп+т) и единичной матрицы /:
(с, х) —► тах; Ах + 1х = Ь, х > 0, ж > О -<=>•
-<=>• (с, ж) —► тах; .4х = 6, ж > О
(с=(с,0), х=(х,ж), 1=А1). (Р)
Задачу (Р) с вектором Ь > 0 можно решить симплекс-методом, взяв
в качестве исходной крайней точки точку @,... ,0,&!,... ,Ьт) 6 К"+т.
Эта точка будет крайней по Предложению 1 п. 3.2, поскольку столбцы
единичной матрицы /, соответствующие положительным координатам
этой точки, линейно независимы. _
Пусть вектор х = (х,ж) является решением задачи (Р) (х 6 Аг^Р).
Тогда соответственно х является решением задачи (Р**) (х 6 Агё-Р**)-
А по теореме п. 3.3 вектор у := сьА^1 является решением задачи,
двойственной к задаче в канонической форме Р:
(Ь,у)-^тт; Ту^с ( & (* )у > (^) & А*у > с, у >
То есть у является решением исходной задачи (Р). При этом
8-р = 8Р, а из разложения АЪХ = А -«■ X = А^1А -«■ X = А^1А,
X = А^11 — А^ получим, что вектор
у =
Таким образом, часть строки Д последней симплекс-таблицы, лежа-
лежащей под разложениями векторов искусственных переменных, дает нам
решение исходной задачи (Р).
Пример. Решить задачу линейного программирования путем перехода
к двойственной задаче. Пусть необходимо решить следующую задачу:
4г/1 + 2г/2 -> ппп; у{ > 0, г - 1,2,
Ь1+ 3/2 > 15,
Згд + 4г/2 > 27, (Р)
Ух + 5г/2 > 20.
Решение. Двойственной для данной задачи линейного программи-
программирования будет следующая задача в нормальной форме (выведите это
самостоятельно):
15а?! + 27x2 + 20ж3 -> тах; х{ > 0, г = 1,2,3,
§ 4. Методы нахождения начальной крайней точки
133
4х2
2.
Сведем эту задачу к задаче в канонической форме путем добавления
неотрицательных (искусственных) переменных х\, и х5 и заменяя
неравенства равенствами:
+ 27ж2 + 20ж3 -> шах;
0, г = 1,..., 5,
=4,
= 2.
Х\ + 4а?2 + 5а?з
В выписанной задаче линейного программирования в каноничес-
канонической форме в качестве первоначальной крайней точки возьмем точ-
точку х = @,0,0,4,2). Эта точка будет крайней по Предложению 1 п. 3.2,
поскольку столбцы единичной матрицы, соответствующие положитель-
положительным координатам этой точки, линейно независимы. Тогда базисными
векторами будут векторы о4 = A,0), о5 = @,1).
Составим первую симплексную таблицу для задачи в канонической
форме (Р):
базис
а4
а5
2
Д
С
0
0
хь
4
2
0
15
а1
9
1
0
-15
27
а2
3
4
0
-27
20
а3
1
5
0
-20
0
а4
1
0
0
0
0
а5
0
1
0
0
4
3
1
2
В первой симплексной таблице разрешающий столбец о , разрешаю-
разрешающая строка о5, разрешающий элемент симплексной таблицы 4. Заменяем
в базисе вектор искусственных переменных о5 на вектор о и для нового
базиса строим вторую симплексную таблицу:
базис
а4
а2
2
Д
С
0
27
5
2
1
2
27
2
15
а1
33
4
1
4
27
4
33
4
27
а2
0
1
27
0
20
а3
и
4
5
4
135
4
55
4
0
а4
1
0
0
0
0
а5
_ 3
" 4
1
4
27
4
27
4
10
33
2
134 Глава 2. Линейное программирование
Во второй симплексной таблице разрешающий столбец о1, разре-
разрешающая строка о4, разрешающий элемент симплексной таблицы —.
Заменяем в базисе вектор искусственных переменных о4 на вектор а1
и для нового базиса строим третью симплексную таблицу:
базис
а1
а2
2
Д
С
15
27
хь
10
33
14
33
16
15
а1
1
0
15
0
27
а2
0
1
27
0
20
а3
1
3
4
3
31
11
0
а4
4
33
1
33
1
1
0
а5
1
11
3
11
6
6
1
Вектор Д > 0, поэтому точка х = (—,—,0,0,0) является реше-
решением двойственной задачи с добавленными искусственными перемен-
— /10 14 \
ными (Р), а вектор х = (—, —,0] является решением задачи (Р**)
и 8р = 8р» = 16.
В последней симплекс-таблице под разложениями векторов искус-
искусственных переменных стоят числа 1, 6, являющиеся значениями решения
исходной задачи (Р), т. е. вектор $ = A,6) является решением задачи (Р)
и 8Р = 16.
4.2. Метод искусственного базиса
Метод добавления искусственных переменных используется для
отыскания начальной крайней точки в задаче линейного программиро-
программирования в канонической форме
(с, х) —* тах; Ах = Ь, х > 0.
(А)
Не ограничивая общности, можем считать, что все координаты вектора 6
неотрицательны. Если это не так, например, 6,- < 0, то умножим обе
части 3-го уравнения на -1. Поэтому далее считаем, что Ь ^ 0.
Рассмотрим вспомогательную задачу, добавляя искусственные пере-
переменные х = (хп+1,..., хп+т) и единичную матрицу /,
тах; Ах + 1х = Ь, х > 0, х > 0.
(Р)
1=1
Поскольку значение задачи 5^ ^ 0 и множество допустимых элемен-
элементов Б(Р) Ф 0 (х :- @,...,0,Ьи...,Ьт) 6 О(Р)), то значение задачи
§ 4. Методы нахождения начальной крайней точки 135
конечно (\8р\ < +со). По теореме существования п.3.1 решение в за-
задаче (Р) существует. Причем, если в исходной задаче (Рк) множество
допустимых элементов непусто A>(Р*) Ф 0), то значение задачи 5р = О,
а решением задачи (Р) будет крайняя точка, у которой все искус-
искусственные переменные равны нулю. Задачу (Р) можно решить симплекс-
методом, взяв в качестве исходной крайней точки точку х. Эта точка
будет крайней по Предложению 1 п. 3.2, поскольку столбцы единичной
матрицы /, соответствующие базисным координатам точки х, линейно
независимы.
При решении задачи (Р) симплекс-методом могут возникнуть три
исхода:
1) Не все искусственные переменные равны нулю. Это означает, что
исходная задача (Рк) не имеет допустимых элементов.
Действительно, если не все искусственные переменные равны нулю,
то 5р < 0. Предположим, что исходная задача (Р*) имеет допустимые
элементы, например, х°. Но тогда 8-р < 0 = (@, -1),(ж°,0)) — проти-
противоречие. Значит, наше предположение, что исходная задача (Р*) имеет
допустимые элементы, неверно.
2) Все искусственные переменные равны нулю и среди базисных век-
векторов нет векторов, соответствующих искусственным переменным. Это
означает, что решением в задаче (Р) будет х = (х, 0) — крайняя точ-
точка множества #(Р). Точка х будет крайней точкой множества Х>(Р*)
по Предложению 1, поскольку столбцы матрицы А, соответствующие
базисным координатам, линейно независимы.
Далее, взяв в качестве первоначальной крайней точки точку х, можем
приступать ко второму этапу — решению задачи (Р*) по симплекс-методу
с найденной крайней точкой. Таким образом, мы имеем двуэтапный
метод решения задачи (Р*).
3) Все искусственные переменные равны нулю и среди базисных векторов
есть вектора, соответствующие искусственным переменным. В этом
случае надо исключить из числа базисных вектора, соответствующие
искусственным переменным.
Пусть, например, в последней таблице имеется строка с искус-
искусственной переменной ж„+,0. Будем считать эту строку разрешающей.
В качестве разрешающего столбца возьмем столбец о-70, ]'о ^ п, та-
такой, что хп+г0H Ф 0. Столбец Ь новой симплексной таблицы при этом
не изменится (по правилу прямоугольника X} = х; = Х{,
х
так как ж„+,-0 = 0), только вместо переменной хп+^ будет стоять пе-
переменная Х]0. Значение функционала (с,х) также не изменится. Этот
процесс закончится удалением всех базисных векторов, соответствующих
искусственным переменным, с заменой их на неискусственные, или
окажется, что хп+1а] = 0, ] = 1,... ,п. Так как Х{$ — г-я координата
разложения вектора а? по базисному вектору о1, то тогда все векторы а3,
136 Глава 2. Линейное программирование
3 = \,...,п, включая вектор Ь, можно разложить по базисным без
вектора о"+1°. Значит, го-я строка исходной системы уравнений является
линейно зависимой от остальных строк и на втором этапе можем про-
просто вычеркнуть из симплексной таблицы го-ю строку, содержащую эту
искусственную переменную, и начать второй этап с меньшим числом
базисных векторов.
Таким образом, двуэтапный симплекс-метод позволяет для любой
задачи линейного программирования в канонической форме:
1) обнаружить, что исходная задача не имеет допустимых элементов,
или
2) найти первоначальную крайнюю точку в задаче (Р) и решить
задачу по симплекс-методу, или
3) исключить линейно зависимые равенства и решить задачу по сим-
симплекс-методу с найденной крайней точкой, имеющей менее тп
положительных элементов.
Замечание. Вместо такого двуэтапного решения задачи (Р*) можно
решать следующую задачу (ее принято называть М-задачей)
(с, (ж,х)) —> тах; Ах + 1х = Ь, х > 0, х > О,
где с = (с,-М,..., —М) 6 К"+т, М — положительное число. Нетрудно
показать, что при любом достаточно большом М первые п координат
полученного решения определяют решение в (Р*), а искусственные
переменные равны нулю.
4.3. Примеры
Пример 1, Решить методом искусственного базиса задачу:
Ху + 2х2 + Зж3 - х4 —► тах; ж,- > 0, * = 1,2,3,4,
Х\
2ж,
ж.
+ 2ж2+ ж-
+ Х2 + 5ж;
+ 2ж2 + Зж-
) + ж4 = 10,
» =20,
( =15.
Рассмотрим вспомогательную задачу, добавляя искусственные пере-
переменные х$,Х(,:
-х5 - х6 —> тах; ж,- > 0, г = 1,..., 6,
XI + 2х2 + ж3 + ж4 = 10,
2ж,+ ж2 + 5ж3 +ж5 =20,
х\ + 2х2 + Зж3 + ж6 = 15.
§ 4. Методы нахождения начальной крайней точки
137
Исходная крайняя точка х = @,0,0,10,20,15). Базисные векторы
а4 = A,0,0), а5 = @,1,0), а6 = @,0,1).
Составим первую симплексную таблицу для вспомогательной задачи:
базис
а4
а5
а6
2
Д
С
0
-1
_ ^
хь
10
20
15
-35
0
а1
1
2
1
-3
-3
0
а2
2
1
2
-3
-3
0
а3
1
5
3
-8
-8
0
а4
1
0
0
0
0
-1
а5
0
1
0
-1
0
-1
а6
0
0
1
-1
0
1
10
4
5
Из таблицы видно, что разрешающим столбцом является столбец а3,
разрешающая строка о5. Заменяем в базисе вектор о5 на вектор о3 и для
нового базиса строим вторую симплексную таблицу:
базис
а4
а3
а6
2
Д
С
0
0
-1
хь
6
4
3
-3
0
а1
3
5
2
5
_ ^
5
1
5
1
5
0
а2
9
5
1
5
7
5
7
5
7
5
0
а3
0
1
0
0
0
0
а4
1
0
0
0
0
-1
а5
1
5
1
5
3
5
3
5
8
5
-1
а6
0
0
1
-1
0
10
3
20
15
7
Из таблицы видно, что разрешающим столбцом является столбец а2,
разрешающая строка о . Заменяем в базисе вектор о6 на вектор о2 и для
нового базиса строим третью симплексную таблицу:
базис
а4
а3
а2
2
д
с
0
0
0
хь
15
7
25
7
15
7
0
0
а1
6
7
3
7
1
7
0
0
0
а2
0
0
1
0
0
0
а3
0
1
0
0
0
0
а4
1
0
0
0
0
-1
а5
4
7
2
7
3
7
0
1
-1
а6
9
7
1
7
5
7
0
1
1
138
Глава 2. Линейное программирование
15 25 15
Вектор Д > 0, поэтому точка ж = (О, —,—,-=-,0,0] является
решением вспомогательной задачи и 5тах = 0.
Перейдем к решению основной задачи. Составим первую симплекс-
/ 15 25 15\
ную таблицу для начальной крайней точки ж= @, —,—,— ). Разложе-
Разложения векторов ж, а1 по базису о4, о ,о2 берем из последней симплексной
таблицы:
базис
а4
а3
а2
2
д
с
-1
3
2
15
7
25
7
15
7
90
7
1
а1
6
7
3
7
1
7
1
7
6
7
2
а2
0
0
1
2
0
3
а3
0
1
0
3
0
-1
1
0
0
-1
0
5
2
25
3
Разрешающим столбцом является столбец о1, разрешающая строка о4.
Заменяем в базисе вектор о4 на вектор о1 и для нового базиса строим
вторую симплексную таблицу:
базис
а1
а3
а2
2
д
с
1
3
2
хь
5
2
5
2
5
2
15
1
а1
1
0
0
1
0
2
а2
0
0
1
2
0
3
а3
0
1
0
3
0
-1
а4
7
6
1
2
1
6
0
1
Вектор Д > 0, поэтому точка ж = (-,-,-,0] является решением
исходной задачи и 8тах = 15.
Пример 2. Решить методом искусственного базиса задачу:
Х\ - 2х2 + ж3 -+ шах; ж,- > 0, г = 1,2,3,
Ж] + ж2 + Жз = 5,
2ж,+ ж2 =3,
-2а?1 + 2ж2 = 4.
§ 4. Методы нахождения начальной крайней точки
139
Решение. Рассмотрим вспомогательную задачу, добавляя искусствен-
искусственные переменные Х4,х$:
-ж4 - ж5 —► тах; ж,-> О, »=1,...,5,
XI + Ж2+Ж3 =5,
2Ж1+ Ж2 +Ж4 =3,
-2ж] +2ж2 +ж5 = 4.
Исходная крайняя точка ж = @,0,5,3,4). Базисные векторы о3 = A,0,0),
а4 = @,1,0), а5 = @,0,1).
Составим первую симплексную таблицу для вспомогательной задачи:
базис
а3
а4
а5
2
д
с
0
-1
-1
хь
5
3
4
-7
0
а1
1
2
-2
0
0
0
а2
1
1
2
-3
-3
0
а3
1
0
0
0
0
-1
а4
0
1
0
-1
0
-1
а5
0
0
1
-1
0
1
5
3
2
Разрешающий столбец о2, разрешающая строка о5. Заменяем в ба-
е вектор а5 на ве
симплексную таблицу:
зисе вектор а5 на вектор о2 и для нового базиса строим вторую
базис
а3
а4
а2
2
д
с
0
-1
0
хь
3
1
2
-1
0
а1
2
3
-1
-3
-3
0
а2
0
0
1
0
0
0
а3
1
0
0
0
0
-1
а4
0
1
0
-1
0
1
а5
1
2
1
2
1
2
1
2
3
2
3
2
1
5
Во второй симплексной таблице разрешающий столбец о , разре-
разрешающая строка о4. Заменяем в базисе вектор искусственных перемен-
переменных о4 на вектор о1 и для нового базиса строим третью симплексную
140
таблицу:
Глава 2. Линейное программирование
базис
а3
а1
а2
2
д
с
0
0
0
7
3
1
3
7
3
0
0
а1
0
1
0
0
0
0
а2
0
0
1
0
0
0
а3
1
0
0
0
0
-1
а4
2
3
1
3
1
3
0
1
-1
а5
1
6
1
6
1
3
0
1
1
Вектор Д > 0, поэтому точка х = (^> ^> ^>0,0) является решением
вспомогательной задачи с добавленными искусственными переменными,
и ^шах = 0.
Перейдем к решению основной задачи. Составим первую симплекс-
/1 7 7\
ную таблицу для начальной крайней точки х = ( -, -, - ). Разложения
вектора х по базису о , о1, о2 берем из последней симплексной таблицы:
базис
а3
а1
а2
2
д
с
1
1
-2
хь
7
3
1
3
7
3
-2
1
а1
0
1
0
1
0
_2
а2
0
0
1
-2
0
1
а3
1
0
0
1
0
1
Вектор Д > 0, поэтому точка х = (г,-,-) является решением
исходной задачи и 5тах = — 2.
Заметим, что на самом деле исходная задача тривиально решается,
так как мы имеем систему из трех линейных уравнений с тремя неш-
/1 7 7\
вестными. И эта система имеет единственное решение х = I -, -, - I.
Пример 3. Решить, вводя искусственные переменные задачу:
2X1 + х2 + Зж3 + 5ж4 -> шах; ж,- > 0, г = 1,2,3,4,
§4. Методы нахождения начальной крайней точки 141
2ж, + Зж2 + ж3 + 2ж4 ^ 30,
4ж] + 2ж2 + жз + 2ж4 ^ 40,
х\ + 2ж2 + Зжз + ж4 ^ 25.
Добавив неотрицательные переменные Ж5,Жб,ж7, получим задачу
в канонической форме:
2ж] + ж2 + Зжз + 5ж4 —* тах; ж,-> 0, г=1,...,7,
7х\ + Зж2 + жз + 2ж4 + ж5 = 30,
4а; 1 + 2ж2 + ж3 + 2ж4 + ж6 = 40,
х\ + 2ж2 + Зжз + ж4 + Ж7 = 25.
Исходная крайняя точка ж = @,0,0,0,30,40,25). Базисные векторы
а5 = A,0,0), а6 = @,1,0), а7 = @,0,1).
Составим первую симплексную таблицу:
базис
а5
а6
а7
2
д
с
0
0
0
хь
30
40
25
0
2
а1
2
4
1
0
-2
1
а2
3
2
2
0
-1
3
а3
1
1
3
0
5
а4
2
2
1
0
-5
0
а5
1
0
0
0
0
0
а6
0
1
0
0
0
0
а7
0
0
1
0
0
15
20
25
В первой симплексной таблице разрешающим столбцом является
столбец о4, Разрешающая строка о5, 1= 15. Заменяем в базисе вектор о5
на вектор о4 и для нового базиса строим вторую симплексную таблицу.
базис
а4
а6
а7
2
д
с
5
0
0
хь
15
10
10
75
2
а1
1
2
0
5
3
1
а2
3
2
_ 1
1
2
15
2
13
2
3
а3
1
2
0
5
2
5
2
1
2
5
а4
1
0
0
5
0
0
а5
1
2
_ 1
1
2
5
2
5
2
0
а6
0
1
0
0
0
0
а7
0
0
1
0
0
30
4
Во второй симплексной таблице разрешающий столбец о3, разреша-
разрешающая строка о7, I — 4. Заменяем в базисе вектор о7 на вектор о и для
142
Глава 2. Линейное программирование
нового базиса строим третью симплексную таблицу для базиса а4, а6, а :
базис
а4
а6
а3
2
д
с
5
0
3
хь
13
10
4
77
2
а1
1
2
0
5
3
1
а2
7
5
-1
1
5
38
5
33
5
3
а3
0
0
1
3
0
5
а4
1
0
0
5
0
0
а5
3
5
-1
1
5
12
5
12
5
0
а6
0
1
0
0
0
0
а7
1
5
0
2
5
1
5
1
5
1
Вектор Д > 0, поэтому крайняя точка ж = @,0,4,13,0,10,0) является
решением расширенной задачи, а решением исходной задачи является
точка ж = @,0,4,13), 8^ = 11.
4.4. Задачи
Задачи линейного программирования в канонической форме с не-
незаданной первоначальной крайней точкой. Решить методом искус-
искусственного базиса.
Х\ + 4ж2 + ж3 —► шах; х, > 0, г = 1,2,3,
4.1. х\ - х2 + а?з = 3,
2х1 - 5х2 - ж3 = 0.
х1 - 10ж2 +- хз -+ шах; х, > 0, г = 1,2,3,
4.2. ^ - 5,5ж2-7ссз = -13,
Ж] - 14,5ж2 + 7а?з = 15.
х\ + 2х2 + Зжз - 4х4 -•■ шах;
4.3. а?1 + х2- XI + х4 = 2,
х\ + Их2 + 10ж3 - 10ж4 = 24.
х1 - 5ж2 - ж3 + ж4 -> тах; ж,-
4.4. ж, + Зж2 + Зж3 + ж4 = 3,
2ж, + ж3 - ж4 = 4.
4.5.
Ж] + ж2 + ж3 + ж4->пгах;
4Ж] + 2жг + 5ж3 - ж4 = 5,
5ж, + Зж2 + 6ж3 - 2ж4 = 5,
ЗЖ] + 2ж2 + 4жз - ж4 = 4.
0, г = 1,2, 3, 4,
г = 1,2,3,4,
0, =1,2,3,4,
§ э. хранспортная задача 143
Х\ + Шж2 - Жз + 5ж4 —* тах; ж* > О, г = 1,2,3,4,
а?! + 2ж2 - ж3 - ж4 = 1,
' • -х{ + 2ж2 + Зж3 + ж4 = 2,
хг + 5ж2 + ж3 - ж4 = 5.
а?1 + 2ж2 + Зжз + 4ж4 + 5ж5 —»тах; ж; > О, г = I,..., 5,
ж2 + ж3 - 2ж4 + 7ж5 = 2,
' ' 6ж1 + жз - 2ж4 + 7ж5 = 2,
ж, + ж2 - 2ж4 + 7х5 = 2.
а?1 + ж2 - а?з + ж4 - 2ж5 -»тах; ж, > 0, г = 1,..., 5,
Зж1 + ж2 + жз + ж4 - 2ж5 = 10,
' ' 6ж] + ж2 + 2жз + Зж4 - 4ж5 = 20,
Юж! +х2 + Зжз + 6ж4 - 7ж5 = 30.
Ж1 - 4ж2 + жз + ж4 + ж5 + ж6 -»■ тах; ж^> 0, г = 1,... ,6,
4 9 14ж, - 14ж2 + 12ж3 + 5ж4 + 6ж5 + Зж6 = 8,
Х\ — Ж2 + 2жз + Ж, =0,
1бж1 - 1бж2 + 8жз + 7ж4 + 4ж5 + 5ж6 = 12.
§ 5. Транспортная задача
Важный частный случай задач линейного программирования —
транспортные задачи. Это математические модели разнообразных при-
прикладных задач по оптимизации перевозок. В этом параграфе мы приведем
постановку транспортной задачи, методы отыскания исходной крайней
точки, решение задачи методом потенциалов, двойственную к транс-
транспортной задаче, обоснование метода потенциалов, задачу о назначении,
примеры.
5.1. Постановка задачи
Транспортной задачей по критерию стоимости называется следующая
задача о минимизации стоимости перевозок.
Пусть в пунктах отправления А\,..., Ат сосредоточено соответствен-
соответственно О1,...,от единиц некоторого однородного груза. Этот груз следует
перевезти в п пунктов назначения Ви... ,Вп, причем в каждый из них
надлежит завезти соответственно Ь\,... ,Ьп единиц груза. Стоимость
перевозки единицы груза из пункта А{ в пункт В^ равна с,.,-.
Обозначая через х^ количество единиц груза, предназначенного
к отправке из пункта А{ в пункт Б,-, получим задачу нахождения плана
перевозок, при котором общая стоимость окажется минимальной:
т
(с, ж) : = ]Г ]Г сужу -> 1шп;
144
Глава 2. Линейное программирование
X,;,■ = О;, 1 = 1,..., ТО,
(Р)
(а)
,п.
1=1
В матричном виде ограничения задачи (а)-(Ь) имеют вид:
/ Х\\ \
хи
/ 1 1
О О
1 О О
О 1 1
О О
О О
О \
О
0
1
0
0 ..
0 ..
1 ..
. 0
. 0
. 0
0
1
0
0 ..
0 ..
1 ..
. 0 ..
. 0 ..
. 0 ..
. 1
. 1
. 0
1 ...
0 ...
1 ...
1
0
0
\ 0 0 ... 10 0
О О
1/
х21
х22
х2п
Хт\
Хт2
(Ь)
а2
План перевозок и стоимость перевозок представляются в виде векторов
аг=(агч-, г- 1,...,т, з - 1,...,п), с= (с,.,-, г~1,...,т, з = 1, ...,п)
соответственно, или матриц X = {агу}|=1,...,т , С = {^}%-\у..)т ■
1 = \,...,п ]-Х,...,п
Уравнения (а) означают, что из пункта отправления А^ весь груз
вывезен в пункты назначения (потребления). Уравнения (Ь) означают, что
количество груза, завезенного в пункт В^ со всех пунктов отправления,
соответствует требуемому.
Естественно считать, что общий запас груза на всех пунктах отпра-
отправления равен суммарной потребности всех пунктов назначения, т. е.
В этом случае говорят, что имеется замкнутая модель транспортной
задачи.
Если суммарные запасы отправителей больше суммарной потребно-
т п
ста пунктов назначения, т. е. ^ а« > X) ^ > то равенства (а) заменяются
»=1 ;=1
неравенствами
п
/]
3=1
г = 1, ...,т,
§ 5. Транспортная задача 145
а условие (Ь) остается без изменений. В этом случае вводится фиктивный
т п
пункт назначения Вп+1 с требуемой величиной завоза Ьп+\ = X) а« ~ Х)^'
1 = 1 ] = \
и нулевыми стоимостями перевозок в этот пункт. Добавляя новые
неотрицательные переменные х%п+\, г = 1,..., га, приходим к замкнутой
модели транспортной задачи с ограничениями в виде равенств (а)-(Ь).
Если суммарные запасы отправителей меньше суммарных запросов
т п
пунктов назначения, т. е. ^ <Ч < ^2 ^, то равенства (Ь) заменяются
.'=1 ] = \
неравенствами
т
1=1
а условие (а) остается без изменений. В этом случае вводится фиктивный
п
пункт отправления Ат+\ с требуемой величиной вывоза От+\ = Х)^' ~
ТВ
X) О; и нулевыми стоимостями перевозок из этого пункта. Добавляя
1=1
новые неотрицательные переменные хт+\^, ^ = 1,...,п, приходим
к замкнутой модели транспортной задачи с ограничениями в виде
равенств (а)-(Ь).
5.2. Особенности задачи
Транспортная задача является задачей линейного программирова-
программирования и может быть решена симплекс-методом, который значительно
упрощается в виду простого строения системы ограничений (а)-(Ь).
Этот упрощенный метод мы и опишем ниже. Предварительно дока-
докажем некоторые утверждения, имеющие место для транспортных задач.
Лемма 1. Для любой транспортной задачи существует допустимый
план перевозок (Др ф 0).
Доказательство. Положим х^ = ~гг, тогда уравнения (а) будут
выполняться:
п
Аналогично показывается выполнение уравнений (Ь). Значит хц —
допустимый план перевозок. ■
Отметим, что поскольку значение задачи ограничено снизу нулем
и допустимый план перевозок имеется по лемме 1, то в задаче (Р)
146 Глава 2. Линейное программирование
по теореме существования решения п.3.1 (\8р\ < +сс => АщР ф 0)
оптимальный план существует.
Лемма 2. Ранг системы ограничений (а)-(Ь) равен т + п- 1.
Доказательство. Если сложить первые га строк матрицы ограниче-
ограничений А и вычесть из них последние п строк, то получим нулевую строку.
Следовательно, ранг матрицы А меньше тп + п.
С другой стороны, располагая га - 1 строку матрицы А (начиная
со второй), под п последними строками, получим треугольную матрицу
из тп + п— 1 строк, ранг которой равен количеству уравнений (тп+п— 1).
Таким образом, ранг матрицы А равен га + га - 1. ■
По предложению 1 п. 3.2 (столбцы матрицы ограничений, соот-
соответствующие положительным координатам крайней точки, линейно
независимы) и лемме 2 (количество линейно-независимых столбцов
не превышает тп + п — 1) крайняя точка в задаче может иметь не более
га + га - 1 положительных координат.
Лемма 3. Любые тп + п— \ строк матрицы А линейно независимы.
Доказательство. Любая строка матрицы А (для определенности
возьмем строку из системы уравнений (а)) равна сумме всех строк
системы уравнений (Ь) минус сумма всех строк уравнений (а) без этой
строки, то есть является линейной комбинацией оставшихся га + п — 1
строк. А так как ранг матрицы А равен га + га — 1, то оставшиеся строки
линейно независимы. ■
Отметим, что не любые га + га — 1 столбцов матрицы А являются
линейно независимыми (приведите пример!).
5.3. Методы нахождения начальной крайней точки
Рассмотрим замкнутую модель транспортной задачи.
1. Метод «северо-западного угла». Назначим максимально возможную
перевозку из пункта отправления А\ в пункт назначения В\. То есть
заполняем верхний левый элемент матрицы X первоначальной крайней
точки. При этом либо пункт отправления А\, либо пункт назначения В[,
либо оба эти пункта окажутся полностью обслуженными.
Если пункт отправления Ау оказался полностью обслуженным, то
в дальнейшем при нахождении первоначального плана перевозок вы-
выводим из рассмотрения первую строку матрицы X и рассматриваем
только оставшуюся часть матрицы. Если пункт назначения В] оказал-
оказался полностью обслуженным, то аналогично выводим первый столбец
из дальнейшего рассмотрения. Если же и пункт отправления, и пункт
назначения оказались полностью обслуженными (так может случиться
§ 5. Транспортная задача 147
только в вырожденной задаче), то вывести из рассмотрения следует
или первый столбец, или первую строку матрицы X. Условимся для
определенности выводить из рассмотрения первый столбец матрицы.
В этом случае в число базисных элементов на следующем этапе введем
элемент с нулевым значением перевозки, стоящий в северо-западном
углу оставшейся части матрицы X, т.е. в базис войдет второй элемент
в строке, считая вычеркиваемый элемент первым.
Эту процедуру продолжаем до тех пор, пока все пункты отправления
и пункты назначения не будут обслужены. Последней перевозкой будет
перевозка из пункта отправления Ат в пункт назначения Вп.
На каждом шаге обслуживается один из пунктов отправления или
назначения, а на последнем шаге обслуживаются и последний пункт
отправления и последний пункт назначения. Поэтому число базисных
элементов будет ровно т + п — 1. Найденный план будет допустимым
планом перевозок, содержащим не более т + п — 1 положительных
координат и являющийся (как будет показано ниже) крайней точкой
множества допустимых элементов.
Отметим, что данный метод нахождения первоначальной крайней
точки не учитывает стоимости перевозок. Поэтому начальный план
может оказаться далеко не оптимальным. Приведем другие методы
нахождения начальной точки, учитывающие стоимости перевозок.
2. Минимум по матрице. Выберем в платежной матрице С мини-
минимальный элемент. Пусть гшп су = с;0,- . Назначим максимально воз-
можную перевозку из пункта отправления А^ в пункт назначения В^.
Если минимальная стоимость перевозки достигается на нескольких эле-
элементах, то выбираем любой из них. Тем самым пункт отправления А{0
или пункт назначения Б,о (или оба пункта одновременно) будет об-
обслужен. А в платежной матрице соответствующая строка или столбец
выводятся из дальнейшего рассмотрения. Если и пункт отправления,
и пункт назначения одновременно обслужились, то для определенности
как и в п. 1 будем выводить из рассмотрения столбец матрицы X.
В оставшейся части платежной матрицы вновь ищется минимальный
элемент и процедура повторяется до тех пор, пока первоначальный план
перевозок не будет получен.
Найденный план будет допустимым планом перевозок, содержащим
не более т + п — I положительных координат с числом базисных
элементов т+п— 1 и являющийся крайней точкой множества допустимых
элементов.
3. Минимум по строке. Выберем в первой строке платежной матри-
матрицы С минимальный по величине элемент. Предположим пйп сц = сц0.
з
Назначим максимально возможную перевозку из пункта отправления А\
в пункт назначения В^о. Если минимум достигается на нескольких эле-
элементах, то выбираем любой из них. Тем самым пункт отправления А±
или назначения Бу0 (или оба пункта одновременно) будет обслужен.
148 Глава 2. Линейное программирование
А в платежной матрице первая строка или соответствующий столбец
выводятся из дальнейшего рассмотрения.
В первой строке оставшейся части матрицы вновь ищется минималь-
минимальный элемент и процедура повторяется до тех пор пока первоначальный
план перевозок не будет получен (первой строкой может оказаться вновь
первая строка исходной матрицы без какого-то элемента или вторая
строка исходной матрицы без какого-то элемента).
В итоге получаем крайнюю точку множества допустимых элементов
задачи.
4. Минимум по столбцу. Выберем в первом столбце платежной ма-
матрицы С минимальный элемент. Предположим тт Сц = с,-01. Назначим
максимально возможную перевозку из пункта отправления А^ в пункт
назначения В\. Если минимум достигается на нескольких элементах, то
выбираем любой из них. Тем самым пункт отправления А{0 или пункт
назначения В\ будет обслужен. А в платежной матрице соответствующая
строка или первый столбец выводятся из дальнейшего рассмотрения.
В первом столбце оставшейся части платежной матрицы вновь
ищется минимальный элемент и процедура повторяется до тех пор пока
первоначальный план перевозок не будет получен (первым столбцом
может оказаться вновь первый столбец исходной матрицы без какого-то
элемента или второй столбец исходной матрицы без какого-то элемента).
В итоге получаем первоначальную крайнюю точку.
Лемма 4. Описанные выше методы нахождения первоначального плана
перевозок, приводят к первоначальной крайней точке множества допусти-
допустимых элементов.
Доказательство. По предложению 1 достаточно доказать, что соот-
соответствующие базисным элементам столбцы матрицы А линейно незави-
независимы.
Отметим, что описанные методы нахождения первоначального плана
перевозок содержат общий элемент действия: на каждом этапе мы
выводим из рассмотрения либо столбец, либо строку матрицы X.
Доказательство можно провести индукцией по числу тп + п = к.
Пусть тп + п = 2 — минимально возможное число. Матрица А состоит
из единственного элемента и утверждение очевидно. Предположим, что
для тп + п = к получаемые этим методом столбцы линейно независимы.
Докажем соответствующее утверждение для тп+п = к+\. Не ограничивая
общности, считаем, что на первом этапе выводится из рассмотрения
первая строка или первый столбец (в противном случае мы можем строки
или столбцы переобозначить и поменять местами).
Если мы выводим из рассмотрения первую строку матрицы, то
это означает, что первый пункт отправления А\ обслужен полностью,
хп — базисный элемент, а все элементы х^ = 0, ] = 2,...,п. Первое
ограничение уравнений (а) выполнено, в матрице ограничений А можно
§ 5. Транспортная задача
149
убрать первую строку и первые п столбцов. Получилась меньшая матрица
размера (тп - 1 + п) х (тп - 1)га, а для нее по предположению индукции
соответствующие столбцы являются линейно независимыми. Добавление
столбца с единицей на первом месте (и еще на одном из последних п
мест) к тп + п — 2 столбцам, расширенным и начинающимся с нуля
образует систему тп + п — 1 линейно независимых столбцов.
Если мы выводим из рассмотрения первый столбец матрицы, то
это означает, что первый пункт назначения обслужен полностью, хц —
базисный элемент, а все элементы хц = 0, г = 2,...,тп. Первое
ограничение уравнений (о) выполнено, в матрице ограничений А можно
убрать тп + 1-ю строку и соответствующие тп столбцов. Получилась
подобная меньшая матрица размера (тп + п - 1) х (п - \)тп, а для
нее по предположению индукции соответствующие столбцы являются
линейно независимыми. Добавление столбца с единицей на тп + 1 -м
месте (и еще на одном из первых тп мест) к тп + п — 2 линейно
независимым столбцам, расширенным и имеющим на тп + 1 -м месте
нули образует систему из тп + п — 1 линейно независимых столбцов.
Индукция закончена. к
Примеры нахождения начальной крайней точки
Пример 1. Метод «Северо-западного угла».
Зададим транспортную задачу в виде платежной матрицы.
а2
«3
= 10
= 80
= 20
г>1 =40
2
4
6
15
1
3
2
Ь3=42
5
4
7
Ь4= 13
11
2
8
Построим по методу «Северо-западного угла» первоначальный план
перевозок. Назначим максимально возможную перевозку равную 10 из
пункта отправления ^1 в пункт назначения В\. То есть заполняем
верхний левый элемент матрицы X первоначального плана перевозок.
При этом из пункта отправления А\ весь груз окажется вывезенным. В
пункт назначения В\ остается привести 30 единиц груза. В дальнейшем
при нахождении первоначального плана перевозок выводим из рассмо-
рассмотрения первую строку матрицы 3 х 4 и рассматриваем только оставшуюся
матрицу 2x4.
Назначим максимально возможную перевозку равную 30 из пункта
отправления ^2 в пункт назначения В\. То есть заполняем верхний
левый элемент оставшейся матрицы X. При этом пункт назначения Вх
окажется полностью обслуженным. В пункте отправления Аг останется
50 единиц груза. Выводим из рассмотрения первый столбец матрицы
2 х 4 и рассматриваем только оставшуюся матрицу 2x3.
150
Глава 2. Линейное программирование
Назначим максимально возможную перевозку равную 15 из пункта
отправления А2 в пункт назначения В2. То есть заполняем верхний
левый элемент оставшейся матрицы 2x3. При этом пункт назначения В-%
окажется полностью обслуженным. В пункте отправления А2 останется
35 единиц груза. Выводим из рассмотрения первый столбец матрицы
2 х 3 и рассматриваем только оставшуюся матрицу 2x2.
Назначим максимально возможную перевозку равную 35 из пункта
отправления А2 в пункт назначения В$. То есть заполняем верхний левый
элемент матрицы 2x2. При из пункта отправления А2 весь груз оказался
вывезенным. В пункт назначения В$ остается привезти 7 единиц груза,
которые привозятся из пункта отправления А$. После этого в пункте
отправления А$ остается 13 единиц груза, который перевозится в пункт
назначения В+.
а2
«3
= 10
= 80
= 20
&! =40
10
30
0
4 =
15
0
15
0
Ь3 = 42
0
35
7
Ь4= 13
0
0
13
Для краткости в матрице плана перевозок не пишем нулевые значения
небазисных перевозок. Число ненулевых элементов в плане перевозок
т + га-1=4 + 3-1=6. Значение функционала (с, х1) = 2 • 10 + 4 • 30 +
3-15+ 4-35+ 7-7+ 8-13 = 478.
Пример 2. Метод «Минимума по матрице».
Рассмотрим транспортную задачу из примера 1. Выберем в платежной
матрице С минимальный элемент. Им является стоимость с\2 = 1.
Назначим максимально возможную перевозку равную 10 из пункта
отправления А\ в пункт назначения В2. При этом из пункта отправления
А\ весь груз окажется вывезенным. В платежной матрице первая строка
выводится из дальнейшего рассмотрения.
В оставшейся части платежной матрицы 2x4 вновь ищется ми-
минимальный элемент. Минимальная стоимость перевозки достигается на
двух элементах су± = с2ц = 2. Выбираем любой из них. Для опреде-
определенности с32. Назначим максимально возможную перевозку равную 5
из пункта отправления А$ в пункт назначения В2. При этом пункт
назначения В2 окажется полностью обслуженным. В платежной матрице
2x4 второй столбец выводится из дальнейшего рассмотрения.
О! = 10
а2 = 80
о3 = 20
Ь{ =40
0
40
0
Ь2 = 15
10
0
5
Ьз = 42
0
27
15
Ь4= 13
0
13
0
§ 5. Транспортная задача 151
В оставшейся части платежной матрицы 2x3 вновь ищется мини-
минимальный элемент. Им является стоимость с24 = 2. Назначим максималь-
максимально возможную перевозку равную 13 из пункта отправления А2 в пункт
назначения В4- При этом пункт назначения В4 окажется полностью
обслуженным. В платежной матрице последний столбец выводится из
дальнейшего рассмотрения.
В оставшейся части платежной матрицы 2x2 вновь ищется ми-
минимальный элемент. Минимальная стоимость перевозки достигается на
двух элементах с2\ = с2$ = 4. Выбираем любой из них. Для опреде-
определенности с2\. Назначим максимально возможную перевозку равную 40
из пункта отправления А2 в пункт назначения В\. При этом пункт
назначения В\ окажется полностью обслуженным. В платежной матрице
первый столбец выводится из дальнейшего рассмотрения.
Остается привезти 42 единицы груза в пункт назначения В$. Остав-
Оставшиеся 27 единиц груза в пункте отправления А2 и 15 единиц груза в
пункте отправления А$ остается привезти в пункт назначения В$-
Значение функционала (с,х2) = 1-10 + 2-5 + 2-13 + 4-40+4-27+7-15 =
419. Метод «Минимума по матрице», учитывающий стоимости перевозок
в данном примере оказался более эффективным по сравнению с методом
«Северо-западного угла».
5.4. Метод потенциалов
Сформулируем правило решения транспортной задачи методом по-
потенциалов (обоснование этого метода будет дано в п. 5.7).
1. Привести задачу к замкнутой модели (см. п. 5.1).
2. Найти первоначальный план перевозок х, являющийся крайней
точкой множества допустимых элементов.
3. Исследование плана перевозок х. Для найденного плана х построить
матрицу С = {сц}Ы1,...,т, сц '•= Щ + ь,, определяя т + п потенциалов
;=1,..,п
и;,»; из системы т + п - 1 уравнений:
щ + V] — Ч] для базисных индексов г,].
Эти уравнения линейно независимы (это следует из линейной незави-
независимости столбцов, соответствующих базисным элементам), поэтому для
однозначного определения потенциалов щ,у; положим заранее один
из потенциалов заданной величине, например, положим «1 = 0.
Замечание. Элементы с,^ матрицы С не зависят от первоначального
выбора щ.
Действительно. Предположим, что вместо первоначального потен-
потенциала щ мы бы взяли потенциал й\ = щ + Ь. Тогда Ъ\ = «1 — I и все
щ = щ +1, V] = V] — I при базисных г, ], поскольку щ + «^ = с^^ при
базисных г, з. Таким образом, сумма щ + Ъ}; = щ +1 + «;- -1 = щ + «;- = с^-
не зависит от выбора первоначального потенциала щ.
152 Глава 2. Линейное программирование
4. Провести исследование матрицы Д := С - С.
Если Д > 0, то исследуемый план х является решением задачи (Р),
а потенциалы и,-,«^ являются решением двойственной задачи.
Если среди элементов матрицы Д есть отрицательные, то выберем
наименьший элемент. Пусть, например, Д,оуо = ш Ду < 0.
и
5. Построить новый план перевозок, являющийся крайней точкой
множества допустимых элементов.
Положим х'^ = I, х'^ = х^ ± I для базисных индексов %,з, где I —
некоторая положительная величина (не изменяя остальные небазисные
компоненты ж,у равные нулю) так, чтобы х'ц по-прежнему были нео-
неотрицательны, но одна из базисных компонент обратилась бы в ноль.
Вектор матрицы А, соответствующий этой компоненте, выводим из чи-
числа базисных, а вектор матрицы А, соответствующий переменной ж,-адо,
вводим в число базисных векторов. Далее вновь начинаем исследование
полученной крайней точки х', т. е. возвращаемся к п. 3.
В невырожденной задаче в ноль может обратиться только одна
из компонент вектора х. В вырожденной задаче в ноль может обратиться
несколько компонент. В этом случае из числа базисных векторов ис-
исключается любой вектор с нулевым значением, как правило исключается
вектор с наибольшей стоимостью перевозок.
5.5. Примеры транспортных задач
Пример 1.
2хп + 2х12 + 4хц + 8ж14 + 4х21 + 5ж22 + 7ж2з + 6ж24 +
4 9 » им;
*„+*м+*,)+*14=14,
«21 + *22 + Ж23 + Х24 = 18,
Хц^О, 1=1,2,3, ] = 1,2,3,4.
Решение. Поскольку суммарные запасы груза на всех пунктах
отправления меньше суммарных запросов пунктов назначения, т. е.
3 4
^2 о,- = 48 < ^2 Ъ] = 52, то надо привести задачу к замкнутой модели.
Введем фиктивный пункт отправления Ац с требуемой величиной выво-
4 3
за 04 = ^2 Ь3-, — ^2 п{ = 4 и нулевыми стоимостями перевозок из этого
§ 5. Транспортная задача 153
лункта. Зададим транспортную задачу в виде платежной матрицы:
О! = 14
о2 = 18
О2 = 16
а4 = 4
&! = 22
2
4
6
0
Ь2 = 2
2
5
3
0
Ьз= 17
4
7
4
0
Ь4 = П
8
6
9
0
Построим по методу «Северо-западного угла» первоначальное распреде-
распределение:
О2 =
&2 -
&4
= 14
= 18
= 16
= 4
= 22
14
8
Ь2
'•у
2
Ьз= 17
8
9
Ь4 = П
7
4
Для краткости в матрице плана перевозок не пишем нулевые значения
небазисных перевозок. Значение функционала равно 225. Число ненуле-
ненулевых элементов в первоначальном плане перевозок т+п — 1 = 4+4—1 = 7.
Это позволяет сразу перейти к исследованию на оптимальность найден-
найденного плана. Построим матрицу С2':
И2 = 2
мз=-1
и4=-Ю
»1 = 2
2
4
1
-8
«2 = 3
3
5
2
_П
«3 = 5
5
7
4
«4= 10
10
12
9
0
В матрице Д = С — С =
0
0
5
8
_ 2
0
1
7
-1
0
0
5
_2
-6
0
0
минимальный элемент
Д24 = гшп Д- = -6 < 0. Добавляя в первоначальный план распределе-
ния на место нулевого небазисного элемента х24 величину I, получим
В матрице С базисные элементы будем выделять полужирным шрифтом.
154 Глава 2. Линейное программирование
второй план возможных перевозок:
14
8
2
8-*
9 + 1
г
1-1
4
14
8
2
1
16
7
4
Величина 1 = 1. Значение функционала = 183. Построим матрицу С:
«1=0
И2=2
из = — 1
щ = -4
«1 = 2
2
4
1
_2
«2 = 3
3
5
2
_ 2
«з = 5
5
7
4
1
«4 = 4
4
6
3
0
В матрице Д = С - С =
0
0
5
2
-1
0
1
1
-1
0
0
4
0
6
0
минимальные элементы
Д12 = Дв = А4з = гшп Д,-,- = -1 < 0. Во множество базисных элементов
включим элемент х^ с наименьшей стоимостью перевозок. Добавляя
в первоначальный план распределения на место нулевого небазисного
элемента ж4з величину I, получим третий план возможных перевозок:
14
8
2
1 -*
16
7 + *
4-*
14
8
2
16
1
8
3
Величина I — 1. Значение функционала = 182. Построим матрицу С:
и, =0
И2=2
«3 = 0
м4 = -4
«1 = 2
2
4
2
-2
«2 = 3
3
5
3
-1
«3 = 4
4
6
4
0
«4 = 4
4
6
4
0
§ 5. Транспортная задача
155
В матрице Д = С — С =
минимальный элемент
'О -1 О
О 0 10
4 0 0 5
,2 10 0,
Дп = ш Д^ = -1 < 0. Добавляя в первоначальный план распределения
на место нулевого небазисного элемента Х\г величину Ь, получим
четвертый план возможных перевозок:
14 -1
8 + 1
1
2-1
16
1
8
3
12
10
2
16
1
8
3
Величина I = 2. Значение функционала = 180. Построим матрицу С:
И2 = 2
«3 = 0
«4 = -4
«, = 2
2
4
2
_2
«2=2
2
4
2
_2
«3 = 4
4
6
4
0
«4 = 4
4
6
4
0
@ 0 0 4
0, то найденный четвертый
2 2 0 0
тиан перевозок является оптимальным и суммарная стоимость 180.
Пример 2.
хп + 2хп + Зг
шш;
?1
= 5,
\ + «23 +
, + а?24 + ;
1=1,2,3, ; = 1,2,3,4.
= 3,
Решение. Поскольку суммарные запасы отправителей равны суммар-
3 4
ным запросам потребителей, т.е. ]Г)а* = 53^' = 12, то данная задача
*=1 3=1
является замкнутой моделью транспортной задачи.
156 Глава 2. Линейное программирование
Зададим задачу виде платежной матрицы:
а, = 3
О2 = 4
оз = 5
&1=2
1
4
0
&2 = 3
2
3
2
Ьз = 4
3
2
2
Ь4 = 3
4
0
1
Построим по методу «Северо-западного угла» первоначальное распреде-
распределение:
в1=3
а2 = 4
аз = 5
2
Ь2 = 3
1
2
Ь3 = 4
2
2
Ь4 = 3
3
Для краткости в матрице плана перевозок не пишем нулевые значения
небазисных перевозок. Значение функционала равно 21. Число ненуле-
ненулевых элементов в первоначальном плане перевозок тп+п— 1 = 3+4—1 = 6.
Это позволяет сразу перейти к исследованию на оптимальность найден-
найденного плана. Построим матрицу С:
«1 = 0
42 = 1
из = 1
«1 = 1
1
2
2
«2 = 2
2
3
3
«3=1
1
2
2
«4 = 0
0
1
1
минимальный элемент
' О О 2 4Ч
2 0 0-1
\-2 -1 0 0/
= гшп Ду = -2 < 0. Добавляя в первоначальный план распределения
В матрице А ~ С - С =
на место нулевого небазисного элемента
план возможных перевозок:
величину Ь, получим второй
2-1
г
1+*
2-1
2 + 1
2-1
3
0
2
3
4
0
3
Величина I = 2. Из трех обнулявшихся базисных элементов в базисе
оставили два элемента с наименьшими стоимостями перевозок. Значение
§ 5. Транспортная задача
функционала равно 17. Построим матрицу С:
157
«1 = 0
о2 = -1
«з = -1
«1 = 1
1
0
0
«2 = 2
2
1
1
«з = 3
3
2
2
«4 = 2
2
1
1
_ /О О О 2\
В матрице Д = С - С = [ 4 2 О -II минимальный элемент
\О 1 О О/
Д24 = ш Ду = — 1 < 0. Добавляя в первоначальный план распреде-
распределения на место нулевого небазисного элемента ж24 величину I, получим
третий план возможных перевозок:
0
2
3
4-*
0+1
1
0
2
3
1
3
3
Величина I = 3. Значение функционала = 14. Построим матрицу С:
щ=0
«2 = -1
вз=-1
«1 = 1
1
0
0
«2 = 2
2
1
1
«з = 3
3
2
2
«4 = 1
1
0
0
все элементы неотрицатель-
_ /0 0 0 3'
В матрице Д = С - С = ( 4 2 0 0
\0 1 0 1/
ны. Значит найденный третий план перевозок является оптимальным
и суммарная стоимость всех перевозок равняется 14.
5х
Пример 3.
2х2\
тш;
«11 + «12 + «13+ «14 = 19,
«21 + «22 + «23 + «24 = 7,
«31 + «32 + «33 + «34 = П,
«41 + «42 + «43 + «44 = 15,
«И + «21 + «31 + «41 = 9,
«12 + «22 + «32 + «42 = 17,
«13 + «23 + «33 + «43 = 15,
«!4 + «24 + «34 + «44 = 11,
г,3 = 1,2,3,4.
158
Глава 2. Линейное программирование
Решение. Представим задачу замкнутого типа в стандартной
форме:
О! = 19
а2 = 7
а2= 11
о4= 15
б! =9
5
2
9
1
&2 = 17
4
7
7
6
6з = 15
13
6
11
1
Ь4= И
9
8
7
1
Построим по методу «Северо-западного угла» первоначальный план:
О! = 19
О2 = 7
а2= 11
а4- 15
&!-9
9
&2= 17
10
7
63 = 15
0
11
4
64 = П
11
Для краткости в матрице плана перевозок не пишем нулевые значения
небазисных перевозок. Значение функционала равно 270. Число эле-
элементов в базисе т + п - 1 =4 + 4-1 = 7. Один базисный элемент
оказался нулевым. Это означает, что задача является вырожденной. Пе-
Перейдем к исследованию на оптимальность найденного плана. Построим
матрицу С:
и, =0
И2 = 3
и3 = 8
щ = —2
«1-5
5
8
13
3
«2 = 4
4
7
12
2
«з = 3
3
6
11
1
«4=3
3
6
11
1
В матрице А = С - С =
0
-6
-4
-2
0
0
-5
4
10
0
0
0
6
2
-4
0
минимальный элемент
Д21 = тт А,^ = -6 < 0. Добавляя в первоначальный план распределения
на место нулевого небазисного элемента х2у величину I, получим Второй
план возможных перевозок:
§ 5. Транспортная задача
159
9-*
1
10 + 1
1-1
0
11
4
11
2
7
17
0
11
4
11
Величина 1 = 1. Значение функционала = 228. Построим матрицу С:
и, =0
и2 = -3
и3 = 2
м4 = -8
«1 = 5
5
2
7
-3
«2 = 4
4
1
6
-4
«з = 9
9
6
11
1
«4 = 9
9
6
и
1
'0040
0 6 0 2
2 10-4
,4 10 0 0
А34 = шт Д^ = —4 < 0. Третий план перевозок:
В матрице А = С - С =
минимальный элемент
2
7
17
0
11 — *
4 + *
г
11 — *
2
7
17
0
15
11
0
Величина * = 11. В этом случае обнуляются сразу два базисных эле-
элемента. Оставим из них в базисе элемент ж44 с наименьшей стоимостью
перевозок. Значение функционала равно 184. Построим матрицу С:
«1=0
и2 = -3
Щ = -2
щ = -8
«1 = 5
5
2
3
-3
«2 = 4
4
1
2
-4
«з = 9
9
6
7
1
«4 = 9
9
6
7
1
Матрица А = С - С —
0
0
6
4
0
6
5
10
4
0
4
0
0
2
0
0
0. Значит третий план
перевозок является оптимальным и стоимость всех перевозок равна 184.
160 Глава 2. Линейное программирование
5.6. Задача двойственная к транспортной задаче
Рассмотрим транспортную задачу:
х^^О, *= 1,...,т, ; = 1,...,п,
(а)
(Ь)
т г»
(т г» ч
^2<1г = 1>2Ъ] — М). Двойственной к ней будет
■=1 7=1 '
(см п. 2.5) задача
■=1 .7=1
(о, и) + (Ь, V) :- 2_^ й{Щ + 2_^ Ъ]У, -> тах;
1=1 3=1
в которой двойственными переменными являются потенциалы и
В матричном виде ограничения задачи (Р**) имеют вид:
/10... 0 10... 0\ / сп \
1 0 ... 0 0 1 ... 0
1
0
0
0
0
0
0 ...
1 ...
1 ...
1 ...
0 ...
0 ...
0
0
0
0
1
1
0
1
0
0
1
0
0 ...
0 ...
1 ...
0 ...
0 ...
1 ...
1
0
0
1
0
0
\ 0 0 ... 1 0 0 ... 1 /
щ
ит
Щ
с-п
с22
С2т»
§ 5. Транспортная задача 161
Матрица ограничений является транспонированной по отношению к ма-
матрице ограничений исходной транспортной задачи (Р).
5.7. Обоснование метода потенциалов решения
транспортной задачи
Теорема. Крайняя точка х является решением в невырожденной транс-
транспортной задаче (Р) тогда и только тогда, когда вектор А > 0.
Доказательство. Достаточность. Пусть А > 0. Это означает, что
для точки х найдены потенциалы щ,ь^ такие, что А^ := сц - с^ = с,.,-
(щ + V]) > 0, г = 1,..., т, з — 1,..., п, причем щ + у}- = сц для базис-
базисных г,з (множество базисных индексов обозначим В). Следовательно,
Щ + V] ^ сц, г = 1,..., т, з = 1,..., п. Таким образом, условие А ^ 0
равносильно тому, что вектор (и,«) является допустимым в двойственной
задаче (Р**).
С другой стороны, поскольку а?у = 0 при (г,з) & В, то
М* + V■)X^^.
Разбивая последнюю сумму на две и учитывая условия (а) и (Ь),
продолжим последнее равенство
т п
1=1 ;'-1 ]
т
^Г ща{ + ]Р У]Ь, = (а, и) + (Ь, »>.
' Отсюда по критерию решения п. 3.1 х — решение в прямой, зада-
задаче (Р), а (и, V) — решение в двойственной задаче (Р**).
Необходимость. Пусть х — оптимальный план. Докажем, что тогда
А ^ 0. Проведем доказательство от противного. Допустим, что это
условие не выполняется, т. е. существует А>мо < 0. Поскольку Д,^ = 0
для (г,з) 6 -В, то (г<ь.7о) й В. Возьмем достаточно малое I > 0 так, чтобы
х + 1 ^ 0, где вектор 1 = {2,у} выбирается по методу потенциалов,
г,з 6 В,
г = Ч, 3 = Зо,
иначе.
162 Става 2. Линейное программирование
Условия (а)-(Ь) допустимости вектора х + Ь в задаче (Р) равносильны
условиям:
1=1 У-1
Поскольку с,у — Ду + с,^ = Ду' + (м< +»,-), то
т п
(с, х+1)- (с, х) = (с, *} = X! X! (Лч + (щ + в>))'« =
»=1 7=1
т т» т т» п
«=1 ; = 1 1=1 У=1 У = 1 1=1
Последние два слагаемых в этой сумме равняются нулю в силу соот-
соотношения (*). Слагаемые Ду^у = 0 при {%,]) Ф (го,3о), так как в этом
произведении один из сомножителей равен нулю: Ду = 0 при (г,]) 6 В,
1ц = 0 при (г,]) & В, (г,]) ф (ц,3о)- Таким образом,
(с,х+г)-(с,х) =Акк1кк <0,
значит, х не является оптимальным планом. Получили противоречие.
Следовательно, наше допущение, что существует Д,оуо < 0 неверно и,
если х — оптимальный план, то обязательно Д ^ 0. ■
5.8. Задача о назначении. Пример
Пусть некоторая фирма нанимает т служащих на п вакантных
мест. Известно, что при назначении г-го служащего на ]-е место фирма
получит су прибыли. На какие должности кого надо назначить, чтобы
общая прибыль фирмы после назначений была наибольшей?
Таким образом, задача о назначении является частным случаем
транспортной задачи о максимуме функционала, когда о^ = Ь^ = 1,
г = ],...,т, з = 1,...,п:
т п
(с,х) :=^2^2^х^-
<=1 1 = 1
>=1 3=1
Задачи о назначении также решаются методом потенциалов, предва-
предварительно перейдя от задачи на максимум к задаче на минимум
т п
-<С. х) = X! X! ~ЪзХЦ ->■ ПШ1.
§ 5. Транспортная задача
163
Поэтому, если в платежной матрице задачи о назначении стоимости
были Су, то при решении методом потенциалов берутся стоимости —сц.
Пример.
5жп + 4ж,2 + 7ж13
^И +Ж12 + Ж13 = 1,
Зж2з
11ж32 + 2ж33 ->■ тах;
хц ^0, г,з = 1,2,3.
Решение. Задачу о назначении можно задать в виде платежной
матрицы, не указывая величины а{,Ь^, поскольку они равны 1:
5
6
8
4
7
11
7
3
2
Перейдем от задачи на максимум к задаче на минимум, при этом
в платежной матрице стоимости поменяют свой знак:
-6
-8
-4
-7
-11
-7
-3
_2
Построим по методу «Северо-западного угла» первоначальное рас-
распределение. Два нулевых элемента будем считать базисными, чтобы
число элементов в базисе было тп + п — 1 =3+3—1 = 5. Выберем их
так, чтобы они имели минимальные стоимости:
1
0
1
0
1
Значение функционала равно —14. Построим матрицу С:
И,=0
«2 = 1
«з = -3
_д
-4
-8
«2 = -8
-8
-7
-11
«з = 1
1
2
-2
164 Глава 2. Линейное программирование
В матрице А = С - С =
минимальный элемент
' 0 4 -8Л
-2 0 -5
\ О О О/
Ап = гшп А,-,' = -8 < 0. Добавляя в начальный план распределения
на место нулевого небазисного элемента хц величину *, получим второй
план:
\-1
0 + Ь
1
0
1
\-1
0
1
1
0
1
Величина 4=1. Из двух обнулявшихся базисных элементов в базисе
оставили элемент с наименьшей стоимостью. Значение функционала
равно -22. Построим матрицу С:
и, = 0
И2=1
из = —3
_д
— 4
-8
«2 = -8
о
о
-11
Щ = —7
-7
-6
-10
_ / 0 4 0\
В матрице А — С — С — I — 2 0 3| минимальный элемент
V 0 0 8/
А21 = ш Дц = —2 < 0. Добавляя во второй план распределения
на место нулевого небазисного элемента Ж21 величину I, получим третий
план распределения должностей:
0
1 -*
1-*
о + г
1
0
1
0
1
1
Величина I = 1. Из двух обнулявшихся базисных элементов в базисе
оставили элемент с наименьшей стоимостью. Значение функционала
равно -24. Построим матрицу С:
щ
И2 =
Из =
= 0
_^
-5
-6
-8
«2
= -8
-8
-9
-11
= -7
-7
-8
-10
§ 5. Транспортная задача 165
_ /0 4 0\
В матрице Д = С - С = I 0 2 5] все элементы неотрицательны.
\0 0 8/
Значит найденное распределение является оптимальным и значение
исходной задачи равняется 24.
5.9. Задачи
5.1. 2жц + Зжп + 4жв + Ж14 + Зж21 + 4ж22 + 2ж2з
5ж41 + 2ж42 + 8ж4з + 2ж44 -*• ппп;
Зц + Ъ\2 + ХЦ + Хи = 7, ХП + Ж21 + Хц = 11,
321 + »22 + Ж23 + 324 = 8, Ж12 + Ж22 + 332 = 2,
ХЦ + Ж32 + ЖЗЗ + Ж34 = 5, Ж13 + Ж23 + 333 = 6,
«41 + «42 + «43 + «44 ~ 6, Хи + Ж24 + Ж34 = 7,
Яц>0, %,] = 1,2,3,4.
5.2. Жц + Зжп + 10Ж13 + 6жи + 7Ж21 + 2ж22 + 5Ж23 + 8Ж24 + 5Ж31 + 2ж32
2жзз + 9жз4 + 2ж41 + х42 + Зж4з + 4ж44 -*• гшп;
хц + хц + хц + хи = 6, хп + х21 + хц + х41 = 14,
321 + «22 + «23 + Ж24 = 18, ХП + Х22 + Ж32 + 342 = И,
331 + «32 + 333 + 334 = 14, Зп + Ж23 + 333 + 343 = 8,
341 + 342 + 343 + 344 = Ю, Ж}4 + Ж24 + Ж34 + З44 = 15,
жо>0, г,; = 1,2,3,4.
5.3. 4жц + Зжп + Зж13 + 6ж21 + 4ж22 + 5ж2з + 5жз1 + 4жз2 + бжзз + 6
9ж42 + Юж4з -+ пгш;
Х\\ + Х\2 + ЖK ^8, с
3 +3 +Ж ^ 17 3,1+Ж21+Ж31 + Ж41= 5,
з + з + ж 2 7 Хп + Хп + Ж32 + Ж42 = 5П'
! 313 + Ж23 + ЖЗЗ + 343 = 1О
жо->0, г, = 1,2,3,4, ; = 1,2,3.
5.4. 2жц + бЖп + 2Ж13 + Ж14 + 2Ж15 + 9з2_1 + 4Ж22 + ЗЖ23 + 4Ж24 + ЗЖ25
8жзз + 2жз4 + 5жз5 -+ пйп;
Зц+Ж12 + Ж13 + Ж14 + Ж15 = 13, ЖB + Ж22 + 332 = 7,
321 + 322 + 323 + 324 + 325 = И, Ж(з + Ж23 + 333 = 14,
331 + 332 + 333 + 334 + 335 = 27, ХЫ + 324 + 334 = 9,
315 + 325 + 335= 6,
Жу^О, 1 = 1,2,3, ; = 1,2,3,4,5.
166 Глава 2. Линейное программирование
Ответы к задачам главы 2
1.1. A,3,0) 6 Ащ; 5ШИ = 4.
1.2. @, 3, 0, 2), B, 1, 0, 0) е А1В Р; Злах = 5.
1.3. @,4,0,0)еАгё; 8тах = 4.
1.4. B,0,3,0)еА1в; $„,« = 5.
1.5. E,3,0,0)еА1в; 5шах = 8.
1.6. A,1,1,0) е Лад; ^пшх = 3.
1.7. E,0,3,4,0) ЕАщ; 5,^ = 15.
1.8. A,2,3,0,0,0) ЕАщ; Зш№ = 2.
1.9. E,0,4,1,0,1,0) еАг§; 5^=10.
4.1. E,2,0) е Ейг, E,2,0) 6 Ащ; 8тах = 13.
4.2. A,0,2) еЕхгг; 8тах = +оо, (A,-10,1), A +10*,*,2+^*)}
9
3 н 1 -+ +оо при 2 —* +оо.
4.3. (о.-т-Д^) бЕх1г, D,0,2,0) е Ахв;
4.5. @,1,1,2) е Езйг, A,2,0,3) е Ащ; 8а
4.6. 2? = 0 =Ф- ^щах = -оо.
^ч
4.7. @,0,0,0, у) е Ехгг; 8тах = +оо,
(A,2,3,4,5), @,0,0,*,? + ^*)) у
4.8. @,0,10,0,0), A0,0,0,0,10) е Агё; 8тях = -10.
4.9. (О, О, О, I, О, I) е Езйг, (О, О, О, I, О, I) 6 Ащ; 8^ = 2.
5.1. жц = 4, Ж]4 = 3, ж2[ = 2, ж23 = 6, ж3] = 5, ж42 = 2, ж44 = 4;
<? ■ — 46
5.2. жц = 6, ж22 = 11, ж24 = 7, ж31 — 6, ж33 = 8, ж41 = 2, ж44 = 8;
5.3. хц - 8, ж22 = 15, ж23 = 2, хъх = 5; 81т = 114.
5.4. жц = 10, ж13 = 3, ж23 = 11, хц = 5, ж32 = 7, ж34 = 9, ж35 = 6;
5тш=146.
10+ 38*
► +оо при * -> +оо.
Глава 3
Вариационное исчисление
Началу появления вариационного исчисления дала толчок работа
И. Бернулли 1696 года «Новая задача, к решению которой приглашаются
математики», в которой поставлена задача о брахистохроне. В вертикаль-
вертикальной плоскости даны две точки А и В. Определить путь АМВ, спускаясь
по которому под действием собственной тяжести тело М, начав двигаться
из точки А, дойдет до точки В за кратчайшее время. Вводя в плоско-
плоскости систему координат так, чтобы ось I была горизонтальна, а ось х
вертикальна, и пользуясь законом Галилея о скорости тела, падающего
вниз под действием силы тяжести, можно выписать формализованную
постановку задачи:
Здесь и далее точка над функцией (хA)) означает производную этой
функции по г.
Поставленная задача была решена самим И. Бернулли, а также
Я. Бернулли, Лейбницем, Лопиталем и Ньютоном. Решение Лейбница
было основано на аппроксимации кривых ломаными. Развитая за-
затем в работах Эйлера, эта идея заложила основы прямых методов
в вариационном исчислении. Выписанная выше задача об экстремуме
интегрального функционала при заданных условиях на концах, явля-
является простейшей задачей вариационного исчисления, к рассмотрению
которых мы сейчас и перейдем.
В третьей главе приводятся также и другие элементарные задачи
вариационного исчисления: задача Больца, изопериметрическая задача.
Все они являются частными случаями более общей задачи Лагранжа. Как
частные случаи задачи Лагранжа рассматриваются задача с подвижными
концами и задача со старшими производными.
168 Глава 3. Вариационное исчисление
§ 1. Простейшая задача
вариационного исчисления
1.1. Постановка задачи
Простейшей задачей вариационного исчисления называется следующая
экстремальная задача в пространстве С ([#о, *1 ],К.):
.7(ж(-)) = IЬ{1,хA),Щ) Л-^ ехИг, хЦ0) = х0, х(и) = хх. (Р)
к
Здесь Ь = Ц1,х,х) — функция трех переменных, называемая инте-
грантом. Отрезок [Ц, 1\] предполагается фиксированным и конечным,
#о < г\. Экстремум в задаче рассматривается среди непрерывно диф-
дифференцируемых функций х € С1([^о, *1],К), удовлетворяющих условиям
на концах, или краевым условиям: ж(#о) = жо, хA\) = Ж[. Такие функции
называются допустимыми.
Определение. Говорим, что допустимая функция & доставляет слабый
локальный минимум в задаче (Р), и пишем ж е Мостт'*Р, если
существует 6 > 0 такое, что ^(x(^)} ^ ^(%(^)) Для любой допустимой
функции х (х е #(Р)), для которой ||ж(-) - ж(-)||С1([М1]J> < 6.
Наряду со слабым экстремумом в классическом вариационном ис-
исчислении также изучается сильный экстремум. При этом расширяется
класс функций, среди которых рассматривается задача. Сильный мини-
минимум ищется в более широком пространстве, чем С1([10, ^]), а имен-
именно, в пространстве кусочно-дифференцируемых функций РС1([10, гг]).
Строгое определение сильного экстремума будет дано в главе 5 п. I.
Однако, как правило, функции, доставляющие абсолютный (гло-
(глобальный) экстремум в С1 или РС1, доставляют абсолютный экстремум
и среди более широкого класса функций — всех абсолютно непрерывных
функций, на которых функционал 1 определен.
1.2. Вывод уравнения Эйлера с помощью
основной леммы вариационного исчисления
Теорема. Пусть функция х доставляет слабый локальный экстремум
в задаче (Р) (& € Мосех1гР), функции Ь,Ьх,Ьх — непрерывны как
'* \Уеак — слабый.
2> Напомним, что !Ы!с1([<„,<1]) := тах{Ы\с([10,11])А\у\\с([10,11])}, где 1М1с([*0,*1]) :=
§ 1. Простейшая задача вариационного исчисления 169
функции трех переменных, Ьх Е С'([$о, Ъг])- Тогда функция х удовлетворяет
уравнению Эйлера
Здесь ЬхA) := -—Ь(г,х,х) , аналогачно ЬхA) := —Щ,х,х) г^щ.
ах *=*(<> ах *=Ф
Выписанное дифференциальное уравнение второго порядка было впер-
впервые (в 1744 году) выведено Эйлером. Он, аппроксимируя кривые
ломаными, вывел уравнение, которому были должны удовлетворять
экстремали. Впоследствии Лагранж назвал его уравнением Эйлера. Сам
Лагранж выводил это уравнение (в 1759 году), варьируя кривую, подо-
подозреваемую на экстремум. Выделил из приращения функционала главную
линейную часть, которые называл вариациями, и воспользовался тем, что
в точке экстремума вариация должна обращаться в нуль. Метод вариа-
вариации, предложенный Лагранжем, стал общепринятым. Этим методом мы
и выведем далее уравнение Эйлера.
Функции, удовлетворяющие уравнению Эйлера задачи (Р), назы-
называются экстремалями. Множество экстремалей обозначаем Е(Р). До-
Допустимые функции (класса С1 с заданными граничными условиями),
удовлетворяющие уравнению Эйлера, называются допустимыми экстре-
экстремалями. Множество допустимых экстремалей обозначаем БЕ(Р).
Доказательство. Возьмем произвольную, но фиксированную функ-
функцию Л е Со([#(ъ ^]K'- Поскольку х 6 МосехйР, то функция одного
переменного
«1
<р(\) := ./(ж(-) + АЛ(-)) = [
имеет экстремум при А = 0. Положим Р(г, А) = Ь(г,х(г) + \НA),хA) +
АЛB)). Из условий гладкости, наложенных на Ь,х,Н, следует, что
функция <р дифференцируема в нуле. (Действительно, функции Р п Р\
непрерывны в некотором прямоугольнике [1о, ^^] х [—Ао,Ад], и, значит
по известной теореме из анализа можно дифференцировать под знаком
интеграла.) Но тогда по теореме Ферма <р'@) — 0. Дифференцируя
функцию <р и полагая А = 0, получаем
= 0 V Л
' Со'([*о, <!]):= {*(■) е С'([<о, <1» ! М<о) = А(<1) = о}.
170 Глава 3. Вариационное исчисление
Проинтегрируем по частям первое слагаемое в соотношении A) для Л Е
Со([^О) 1\]) (здесь мы пользуемся условием теоремы, что Ь± Е С'([#о, 1\\))'-
1 и
/ Ь±К сН = 11±йН = Ь*{1)Щ) |' - IЛ 0Ь± = - / (^
Свободные члены при интегрировании по частям равняются нулю, так
как Л(*о) = Л(^) = 0. Тогда соотношение A) перепишется в виде
= о V л е сй([*о, *!])■ B)
Основная лемма вариационного исчисления (лемма Лагранжа).
Пусть функция а непрерывна на отрезке [1о, ^] (а Е С"([#о, *]]) м
«1
в(*)А(«) Л = 0 V Л е ^([«о, *!])•
«о
а(*) = 0.
Доказательство леммы. Предположим о(т) Ф 0 в некоторой точке
т Е (*о> ^)- Для определенности, пусть а(т) > 0. Тогда в силу непрерыв-
непрерывности функция аA) > 0 и в некоторой окрестности точки т, например,
отрезке [т0, т{\ С [*о, *\]-
Пусть Л Е Со'([#о, ^]) — положительная в этой окрестности функция
и равная нулю вне ее, типа «шапочки», например,
- / С ~ т°J(*" Т1J> * е [т0, -л],
Тогда Л Е Со([*<ь *1]) — допустимая в лемме функция, но
I о(*)л(*) сн > о,
«о
что противоречит условию леммы. Лемма Лагранжа доказана.
По лемме Лагранжа из соотношения B) вытекает уравнение Эй-
Эйлера. ■
§ 1. Простейшая задача вариационного исчисления 171
1.3. Вывод уравнения Эйлера
с помощью леммы Дюбуа-Реймона
В этом пункте мы выведем уравнение Эйлера для меньших условий
гладкостей, наложенных на интегрант Ь. При выводе уравнения Эйлера
вместо леммы Лагранжа будем использовать лемму Дюбуа-Реймона.
Теорема. Пусть функция 3: доставляет слабый локальный экстремум
в задаче (Р) (ж е МосехггР), функции Ь,ЬХ,ЬХ — непрерывны в некоторой
окрестности расширенного графика Г±х^ (Ь,ЬХ,ЬХ € С{О{Г^))). Тогда
Ьх — непрерывно дифференцируемая функция (Ьх е С1(Цо, ^^])) и функция
х удовлетворяет уравнению Эйлера
(ль
Доказательство. Возьмем произвольную, но фиксированную фун-
функцию Н б Со(Цо, ^]). Поскольку & е \у]осех1гР, то функция одного
переменного
(р(Х) := 1{х{-) + ХЩ) = [ Щ Щ + АА(«), Щ + АА(*)) Л
имеет экстремум при А = 0. Положим РA, А) = ЬA,хA) +
АЛ(^)). Из условий гладкости, наложенных на Ь,х,Н, следует, что
функция <р дифференцируема в нуле. (Действительно, функции Р и Е\
непрерывны в некотором прямоугольнике [#о, 1\] х [-Ао, Ао], и, значит
по известной теореме из анализа можно дифференцировать под знаком
интеграла.) Но тогда по теореме Ферма <^'@) = 0. Дифференцируя
функцию <р и полагая А = 0, получаем
= Г(ЬЯA)Щ + Щ1)Щ) Л = 0 V Л е ^([«о, к])- A)
Здесь мы не можем, как в предыдущем случае, брать второй интеграл
по частям, поскольку не задана дифференцируемость функции ЬхЦ)-
Уравнение A) означает, что вариация по Лагранжу функционала 3
равна нулю:
ЩЦ-),Н(-))=0 V К е С10ф0, *,]).
1
172 Глава 3. Вариационное исчисление
Лемма Дюбуа-Реймона. Пусть функции ай,а\ € С(\1й, 1\\) и
((ах{1)К{1) + во(*)А(*)) М = О V К б
«о
функция а, б С'([*0) М) м выполняется дифференциальное уравнение
а
а^) + аоB) = О V 2 б [2(ь ^] (аналог уравнения Эйлера).
(хЬ
Из леммы Дюбуа-Реймона и соотношения A) следует утверждение
теоремы.
Доказательство леммы. Возьмем функцию р € С1(Ц0, 1\]) такую,
что
Она существует, так как рA) — айA) — дифференциальное уравнение
1-го порядка, решение которого определено с точностью до константы,
а выбором константы можно удовлетворить второе условие. Тогда для
любой функции Н Е Сд([#о, 1\]) по условию леммы должно выполняться
равенство
«1 1 1
= (а^Щ)И+ЩрA) *'- I р(Ь)ЩеИ= I (а1A)-рA))Щ<И= 0. B)
*0
*
*
Возьмем функцию й(#) = / (а^т) — р(т)) йт. Тогда к — а\ — р и
«о
к б ^([^о, *11)- Действительно, равенство й(^0) = 0 а!едует из определе-
определения функции к, равенство Щ\) = 0 вытекает в силу выбора функции р:
«1
Щ\) ~ \ (а1@ - Р^)) (И = 0. Значит для функции к должно выпол-
няться равенство B), то есть (аг - рJ ш = 0. Отсюда следует, что
ахA) = рA). Таким образом а, б С\[1а, 1{[) и - — а^) + ао{1) = 0.
Лемма Дюбуа-Реймона, а вместе с ней и теорема доказаны. ■
§ 1. Простейшая задача вариационного исчисления 173
1.4. Векторный случай
Мы сформулировали теорему для одномерной задачи вариационного
исчисления. Аналогично ставится векторная задача и формулируются
необходимые условия экстремума.
Пусть хA) — (х]A),... ,х„(Ь)) — п-мерная вектор-функция, инте-
грант Ь = Ц1,х\,... ,ж„,жь... ,ж„) — функция 1п + 1 переменного.
Рассмотрим задачу в пространстве С1 ([го, ^],К) х ... х С1 ([го, ^],К)
«1
/
ехсг;
Необходимые условия экстремума в простейшей векторной задаче состоят
из системы уравнений Эйлера
Доказательство теоремы в векторном случае тривиально редуцируется
к одномерному случаю.
1.5. Интегралы уравнения Эйлера
Если интегрант Ь — ЬA, ж, ж) не зависит явно от одной из перемен-
переменных, то уравнение Эйлера сводится к более простым уравнениям.
1. Если интегрант Ь = ЬA,х) не зависит явно от ж, то имеет место
интеграл импульса
Ьх{Ь) — сошс.
2. Если интегрант Ь = Ь(х,х) не зависит явно от I, то имеет
место интеграл энергии (оба названия интегралов взяты из классической
механики)
Для доказательства интеграла энергии достаточно продифференцировать
последнее равенство по 4 и воспользоваться уравнением Эйлера:
Ь Ь Ь Ь' 0 (
х—Ьх - Ьхх - Ьх'х = 0
И
х
-х( - —Ь± + Ьх) = 0.
Замечание. Отметим, что при выводе интеграла энергии мы ис-
использовали дополнительное предположение о существовании второй
производной ж. Интеграл энергии имеет также лишнюю экстремаль
хA) = сопя;.
174 Глава 3. Вариационное исчисление
1.6. Примеры
Пример 1.
1
= I х2 (И -> шш; ж@) = 0, жA) = 1.
о
Уравнение Эйлера: ж = О.
Общее решение: ж = С\1 + Сг. Из начальных условий находим
единственную допустимую экстремаль: х = I.
Докажем,' что она доставляет абсолютный минимум в задаче, т. е.
х = I Е аЬяшп. Для этого надо показать, что ^(x(■)) > /($(•)) для
любой допустимой функции ж, или, что то же самое, ./(ж + Л) > ^(x)
для любой функции Л 6 Со ([0, 1]). Действительно,
1 111
Г . . 2 Г л2 / • • Г -2
1{х + Л) — ^(ж) = / (& + Л) <й— /ж сИ = 2 I хН (И + /Л <й ^
У У У У
О 0 0 0
1 1 1
>2у хкй1-21 хШ-2хЪ ^-21 хАЛ-0.
0 0 0
Таким образом, разность всегда неотрицательна, то есть имеем абсолют-
абсолютный минимум.
Пример 2.
.7(ж()) = /(ж2 - ж2) <й -у ш; ж@) = ж Г—) = 0.
о
Уравнение Эйлера: ж + ж = 0.
Общее решение: ж = С1$тЬ + С2С0&Ь. Из начальных условий на-
находим единственную допустимую экстремаль: х = 0. Покажем, что она
не доставляет локального минимума, т. е. ж (? Мосгшп.
1 22
Рассмотрим последовательность функций х„И) = — зт —. Очевидно,
п 3
что ж„ — допустимые функции и ж„ —► ^ в метрике пространства
С1 ([0, 1]), но при этом
о
Получили, что значение функционала на ж„ меньше, чем на х, значит х
не доставляет слабого локального минимума. Из этого примера видно,
что уравнение Эйлера — необходимое, но не достаточное условие
экстремума.
§ 1. Простейшая задача вариационного исчисления 175
1.7. Задачи
1.1. Г ж2 <Я -> ехИ; ж@) = 1, жA) = 0.
о
1
1.2. / (ж2 - х) ЛЬ -> ех1г; ж@) = жA) = 0.
о
1
1.3. / (ж2 + 1Х) ЛЬ -> ех{г; ж@) = жA) = 0.
о
1
1.4. /(ж2 - *2ж) <И -> ехег; ж@) = жA) = 0.
о
е
1.5. [ И2 <11 -» ех1г; жA) = 0, ж(е) = 1.
1
I
1.6. /A+«)ж2Л-^ех1г; ж@) = 0, жA) = 1.
о
3
1.7. /V - 1)ж2 Л1 -> ех1г; жB) = 0, жC) = 1.
2
1
1.8. / ж2ж2 <и -> еЯг, ж@) = 1, жA) = у/2.
о
4/3
1.9. I ^ <И - ех1г; ж@) = 1, ж(-) = 1-.
о
1
1.10. I ехх2 <И -» ех1г; ж@) = 0, жA)=1п4.
о
1
1.11. Лж2 + жж + 12*ж) <И -у ех1г; ж@) = жA) = 0.
о
1
1.12. I A2х2 + 12ж2) сИ -> ех{г; ж@) = 0, ■ жA) = 1.
176
Глава 3. Вариационное исчисление
1.13. /(ж2 + ж2) <й -> ехсг; ж(-1) = жA) = 1.
— 1
1
1.14. [(х2 + х2+4х$Ы)сН->ех1г, ж@) = -1, жA) = 0.
о
1
1.15. [(х2 + х2+4хсЫ)<И->ех1т; ж@) = жA) = 0.
о
т/2
1.16. I (А2 - х2) Л1 -> ехтт; ж@) = 1, х(-\ = 0.
о
ж/2
1.17. /(ж2-ж2+4жсо8г)<й->ех1г; ж(О) = жГ-)=О.
о
ж/2
1.18. Мж2 - х2 - 4жкт«) <й -»■ ех1г; ж@) = х{^Л = 0.
о
1/2 . _
Г \/{ + х2 /1\ л/3
1.19. /- -Д-»ех1г; ж@) = 1, ж(-) = —-.
о
1.20. /- -Д-^езаг; ж(- ) = —-, жA) = 1.
} х \2/ 2
1/2
То
1.21. I х^/Т+ИгсН -> ех1г; ж(-Т0) = х(Т0) = {
(задача о минимальной поверхности вращения).
«1
Г
1.22. /
I + х2
• ехсг; ж(*0) = х0, ж(^) = хх (ж0 > 0, а?! > О
(задача о брахистохроне).
1.23. [
ехсг; ж@) = 0, х(Т0) = ^ (Л > 0)
(задача о стрельбе).
§ 2. Задача Больца 177
§ 2. Задача Больца
2.1. Постановка задачи
Задачей Больца называется следующая экстремальная задача без
ограничений в пространстве С1([10, 1у]):
В(х(-)) = IЬ (I, х{1), х{1)) <И +1 (ж(*0), ж(*0) -> ех1г. (Р)
«о
Здесь Ь — ЬA%х,х) — функция трех, а I = 1(хA0),хA1)) — функция
двух переменных. Задача Больца — элементарная задача вариационного
исчисления. Функционал В называется функционалом Больца, функ-
функция I — терминантом. Любые функции класса С1([1й, 1Х\) являются
допустимыми в задаче.
Определение. Говорим, что допустимая функция х доставляет слабый
локальный минимум в задаче (Р), и пишем х 6 МосгшпР, если существует
6 > 0 такое, что В(х()) > В(ж()) для любой допустимой функции ж,
для которой ||ж(-) - 20НсЧ[*о,*1]) < Я-
2.2. Необходимое условие экстремума
Теорема. Пусть функция ж доставляет слабый локальный экстремум
в задаче (Р) (х 6 \у1осех1т Р), функции Ь,ЬХ,Ь% — непрерывны в некоторой
окрестности расширенного графика 1\^ (Ь,Ьх,Ьх Е С(О(Р^))), функ-
функция I — непрерывно дифференцируема в окрестности точки (ж(^о),ж(^))
(I 6 С1 (О(^(^о),ж(^)))). Тогда Ьх — непрерывно дифференцируемая функ-
функция AХ 6 С]([*о, ^])) и выполнены
а) уравнение Эйлера
Ь) условия трансверсальности
) (
Доказательство. Возьмем произвольную, но фиксированную фун-
функцию Л 6 С'([<0)*1]). Поскольку ж 6 1осех<хР, то функция одного
переменного
«1
= [ Ь{1,хA) + Щ1)М*) + Щ*)) <П+1(Що) + АА(*0),*(*1)
178 Глава 3. Вариационное исчисление
имеет экстремум при А = 0. Но тогда по теореме Ферма <^'@) = 0.
Дифференцируя функцию (р и полагая А = 0, получаем
л
УЛбС1^, *,]). A)
Равенство A) выполняется для любой функции Л 6 С1(Ц0, 1{]), а значит
И ДДЯ ФУНКЦИЙ Л 6 Со ([г0, ^]) Следовательно, из A) вытекает, что
«1
[
Отсюда по лемме Дюбуа-Реймона функция Ь± 6 С^^о, ^]) и выполня-
выполняется дифференциальное уравнение
— уравнение Эйлера.
Для завершения доказательства теоремы осталось вывести условия
трансверсальности. Проинтегрируем по частям первый интеграл в со-
соотношении A) (оно стало возможным в силу доказанного включения
«1 «1
[щ1)щм = 1
Подставляя полученное выражение в соотношение A) и учитывая уже
доказанное уравнение Эйлера, получим
) = 0 V Л е с1([*о, *1])- B)
Подставляя в B) последовательно кA) = 1-1\ и НA) = * — *о •. придем
к условиям трансверсальности Ь±Цй) = 1х{и) и ^±(й±) = - 1Х$)- Тем самым
теорема полностью доказана
§ 2. Задача Больца 179
2.3. Многомерный случай
Мы сформулировали теорему для одномерной задачи Больца клас-
классического вариационного исчисления. Совершенно аналогично ставится
векторная задача Больца и формулируются необходимые условия экстре-
экстремума.
Пусть хA) = (х1(г),...,х„A)) — п-мерная вектор-функция, инте-
грант Ь = ЬA,хи... ,хп,±\,...,ж„) — функция 2га+1 переменного, тер-
минант I - 1{х1(Ьо),... ,хпAй),ххA{),... ,агп(*1)) — функция 2га перемен-
ньк. Рассмотрим задачу в пространстве С1ф0, ^], К) х... х С1(\г0, ^], Щ
/ ь(г,хи...,хп,хи...,хп)<и +
«о
(() () () )) ех1г.
Укажем на необходимые изменения при формулировке условий
экстремума для векторного случая.
Необходимые условия экстремума в векторной задаче Больца состоят
из системы п уравнений Эйлера
и системы 2га условий трансверсальности
, га.
Доказательство теоремы в векторном случае тривиально редуцирует-
редуцируется к одномерному случаю. Действительно, фиксируем у вектор-функции
ж() = ((ж^),... ,хп()) все компоненты кроме Х{(). Тогда функционал
Больца будет зависеть только от одной функции Х{(): В(ж,()) = Б((ж[('),
... ,ж,_1(),ж,(),ж,+ 1(),... ,ж„()). А для одномерного случая необходи-
необходимые условия экстремума — уравнение Эйлера и условия трансверсаль-
трансверсальности по ж,() — уже доказаны.
Каждое уравнение Эйлера — дифференциальное уравнение второго
порядка — содержит при интегрировании две константы. Всего — 2га
констант интегрирования. Для их нахождения у нас есть 2га уравнений —
условий трансверсальности. В таком случае, когда количество неизвест-
неизвестных совпадает с количеством уравнений для их нахождения, мы говорим
о полноте набора условий для нахождения экстремали.
Как правило, во всех наших задачах мы имеем полный набор условий
для определения неизвестных.
180 Глава 3. Вариационное исчисление
2.4. Пример
1
В(х()) = [(х2 -х)(И+ ж2A) -> ехи\
о
Необходимые условия:
а) уравнение Эйлера
—Ьх + Ьх = 0 <^=> 2х + 1 - О;
Ь) условия трансверсальности
Ы0) = 1.Щ, Ь*(\) = -1,A) ^=> х@) = 0, жA) = -жA).
г2
Общее решение уравнения Эйлера: х = \-С\1+Сг. Из условий
трансверсальности находим, что С\ = 0, С2 = -. Таким образом,
имеется единственная допустимая экстремаль х = — . Покажем, что
4
она доставляет абсолютный минимум в задаче. Действительно, если
АбС^О, 1]), то
В(х+к)-В(х) = [2хк(И+ [к2сИ- I Пш+2х{\Щ\)+Н2(\).
О 0 0
Интегрируя по частям и учитывая, что функция х удовлетворяет урав-
уравнению Эйлера 2х + 1 = 0 и условиям трансверсальности ж@) = 0,х(\) —
1
-жA), а также отбрасывая неотрицательные члены к2 (И и Л2A),
получим
(х(-) + Л()) - В (&(•)) = 24(*)Л(')[ - /B*(«) + ОМ') * +
о
1
+ / А2(«) Л + 2жA)ЛA) + Л2A) > 2DA) + *A))йA) - 22@)Л@) = 0.
§2. Задача Больца 181
Ъ-12
Таким образом, х = е аЪзтт.
4
= в(х)= [ (---+г-\шЛ = A1-ъ1\\\- =
/ Ч 4 4/ 4 \6 4 / 1о 4
12 3
Очевидно, что 5гоах = +оо. Действительно, возьмем последователь-
последовательность функций хп{1) = п, тогда Я(а:„(-)) = -га + п2 -+ +оо при п -+ оо.
2.5. Задачи Больца
1
0
1
2.2. />(а;2+а;2)^-2а;A)8п1-+ех1г.
о
2.3. [(х2 +х2- Ах $т*) <й + 2а:2@) + 2а:Gг) - а;2(тг) -> ех1г.
о
2.4. А(а;2 - а:2) ш + а:2@) - а:2 {^Л + 4а: {^Л -> ех1г.
0
2.5. /(а;2 - а:2 - 2а:) й* - 2а:2@) - а:2 Г|) -> ех1г.
о
1
о
е-1
2.7. / (I + 1)х2 й1 + 2а:@) (х(е - 1) + ]) -> ех1г.
о
2
2.8. / *2а;2 й« - 2а:A) + а:2B) -+ ех1г.
1
е
2.9. / 20а;2 + хх) &1 + За:2A) - а;2(е) - 4а:(е) -* езйг.
1
3
2.10. / 4а;2а:2 й1 + а:4@) - 8а:C) -> ех1г.
ех1г.
182 Глава 3. Вариационное исчисление
1
2.11. / ехх2 <И + 4ех{0) + 32е~*A) -> езйг.
о
1
2.12. [ ем(х2
2.12. [ ем(х2 + 2х2)(И + 2хA)(х@) + 1) -> ехгг.
о
§ 3. Задача с подвижными концами
3.1. Постановка задачи
Задачей с подвижными концами называется следующая экстремальная
задача в пространстве С1 (А) х К2:
ПО = / /(«,', *) * + 'о («о, *(к), «1, х(П)) -> ехгг; (Р)
(,-(<о,я!(<о),<1,я!(<1))=О, » = 1,...,т, A)
где ^ = (а;(-),*о,*1), А — заданный конечный отрезок, *0)*1 € Д, Ц < 1\.
Частным случаем является задача, в которой один из концов или
даже оба закреплены.
Элемент ^ = (х(-),Ц,1{) называется допустимым, если х € С1 (А),
1о,1\ € Д, Ц < *ь и выполняются условия A) на концах.
Определение. Говорим, что допустимый элемент ^ = (ж(-), <о, ^1)
доставляет слабый локальный минимум в задаче (Р), и пишем ^ €
\у1ост1пР, если существует 6 > 0 такое, что ^(%) > 7(^) для любого
допустимого элемента ^= (а;(-),@,*1), для которого \\х(-) — х(-)\\сц&) <6,
\10-10\<6, |<1-<,|<«.
3.2. Необходимые условия экстремума
Теорема. Пусть элемент % — (х(-), 1ц, ^) доставляет слабый локальный
экстремум в задаче (Р) (^ е \у1осехггР), функции Ь,ЬХ,ЬА — непрерывны
в некоторой окрестности расширенного графика 1\~ :— {(*,хA),хA)) \
I € Д} {Ь,ЬХ,Ь± € С(О(Г^))), функции Ц — непрерывно дифференциру-
дифференцируемы в окрестности точки (*о,^(^о),*1,ж(*1)) (к € С1(<0, ^(<оM <ь ^(^1))) >
* = 0,1,..., т. Тогда существует ненулевой вектор множителей Лагранжа
§ 3. Задача с подвижными концами 183
А = (Ао> ■ ■ ■) Ат) € Кт+1, Л ф О, такой, что для функции Лагранжа
{х(-),1а,11) = I \0;A,х,х
выполнены условия:
а) стационарности по х — уравнение Эйлера для интегранта
Ь = \а]{1,х,х)
--1А{1) + ьхA) = о угед^ ~^Ш^^Ш = 0;
т
Ь) трансверсальности по х для терминанта I = ^2\&Aо,
с) стационарности по подвижным концам (выписывается только для
подвижных концов отрезка интегрирования):
Ак = 0 <=> -Ло/(*о) + к + 1хAо)М*о) = О,
А*, = 0 <=> АоМ) + &, + Ц*,)*(*1) = 0.
Необходимые условия экстремума в задаче с подвижными концами
непосредственно будут вытекать из необходимых условий экстремума
в задаче Лагранжа п. 6.2.
3.3. Пример
т
1(х(-),Т)= 1(х2 - х + 1) Ш -> ех1г; х@) = 0.
о
Решение. Функция Лагранжа:
т
А(х(-),Т)= I Х0(х2 -х+1)<11 + А[а;@).
о
Необходимые условия:
а) уравнение Эйлера для интегранта Ь = А0(А — х + 1)
А
I* +Ьх 0 <> -2Х0х - Ао = 0;
ах
184 Глава 3. Вариационное исчисление
Ь) трансверсальность по х для терминанта I =
-МО) = 4@), Ь±{Т) = -1Х(Т) <=> 2Л0г@) == Ль 2Л0г(Г) = 0;
с) стационарность по Т (выписываем только для подвижного конца
отрезка интегрирования)
Ат = 0 <=> Х0(х2(Т) - х(Т) + 1) = 0.
Если Ло = 0, то из Ь) следует, что Л1 = 0 — все множители Лагранжа
оказались нулями. Если Ло ф 0, то положим Ло = 1. Тогда условия а)-с)
преобразуются к виду
-2х - 1 = 0, х(Т) = 0, х(Т) = 1.
I2
Из первого уравнения следует, что х = — —- + С\1 + С2- Поскольку
х@) = 0, то С2 = 0. Неизвестные С\,Т определяются из условий
{Т
~'2+Сх ~°'
Т2
_[_ /~* Т1 1
4~ ;
Отсюда находим, что Т = 2, С\ = 1.
Таким образом, в задаче имеется единственный допустимый экстре-
экстремальный элемент | = (ж(-),Т) = (- —+1,2\.
Покажем, что ^ не доставляет локального экстремума, т. е. что
в любой его окрестности существует другой допустимый элемент, на ко-
котором значение функционала 3 в точке ^ как больше, так и меньше
значения функционала 3 в точке ^. Действительно, возьмем элемент
= (*(•),Г) =(-- + «,Г). Тогда
при Т > Т и ,7(^) < 7(^) при Т < Т, поскольку под знаком интеграла
стоит неотрицательная функция.
§ 3. Задача с подвижными концами 185
Найдем абсолютный минимум в задаче. Возьмем последовательность
п
элементов &, = (х„(-),Т„) = A,п); тогда ^(%п) = B-1)й1 -> -оо
о
при п —+ +оо, т.е. ^шш = —оо. Если вместо исходной задачи с
подвижным правым концом Г рассмотреть задачу с фиксированным
концом Г = Го, то нетрудно вывести, что функция, доставляющая
абсолютный минимум в новой задаче, существует (ее легко найти,
решая задачу с фиксированным Го) и абсолютный минимум в задаче
будет конечным для каждого фиксированного Го- При этом значение
абсолютного минимума будет стремиться к — оо при Го —+ +оо.
Найдем абсолютный максимум в задаче. Возьмем последовательность
элементов &, = (хп(-),Тп) = (п1,1); тогда
1
^(xп(^),Т)= /(п2 - п1 + 1) й1 -> +оо
о
при п -+ +оо, т. е. 5тах = +оо.
3.4. Задачи с подвижными концами
1
3.1. I х2й1- 2е2A) -> ех1г; х@) = 0.
о
1
3.2. Пх2 +х)й1-> ех1г; х{1) = 0.
о
т
3.3. / а;2 М -> ех1г; ж@) = О, Г + х(Т) + ] = 0.
о
г
3.4. / х дЛ, -> еххг; х@) = 0, (Г - 1)а:2(Г) + 2=0.
о
т
3.5. / а;3 й1 -> ех1г; ж@) = 0, Г + а;(Г) = 1.
о
т
3.6. Ма;2 + х) <И -> ех1г; а;@) = 1.
о
3.7. ({х2 - х2) <И -* ех1г; х@) = 1.
186 Глава 3. Вариационное исчисление
тг/4
3.8. / (х2 -х2 + 4х сок I) <й -> ехгг; х@) = 0.
о
1
3.9. / (х2 + х2) <И - х2(\) -> ехгг; х@) = 1.
о
т
3.10. / (х2 + х2) <И -> ех1г; х(Т)+Т-1-0.
о
1 .
/ \/1 + х2
3.11. / ш -> ех1г; х@) = 1.
^ х
о
т
3.12. I + Ж-<й-> ех1г; х@) = 1, ж(Г) = Г-1.
3 х
о
То
3.13. / х\/\ + х2 (И -> ех1г; а;(Г0) = ^.
о
§ 4. Изопериметрическая задача
4.1. Постановка задачи
Изопериметрической задачей в вариационном исчислении называется
следующая экстремальная задача в пространстве С1([1а, ^]):
х()) = / и\^,Щ,Щ) & -> ехгг; (Р)
где «!,...,«„, — заданные числа (а8- е К).
Отрезок [*0, *1] является фиксированным и конечным, 20 < Ч- Огра-
Ограничения вида A) называются изопериметрическими. Экстремум в задаче
рассматривается среди функций х е С^фо, *11), удовлетворяющих изо-
периметрическим условиям (!) и условиям B) на концах; такие функции
называются допустимыми.
§4. Изопериметрическая задача 187
Определение. Говорим, что допустимая функция х доставляет слабый
локальный минимум в задаче (Р), и пишем х Е МоспипР, если существует
6 > О такое, что ,7о(а;(-)) > ^о(x(•)) для любой допустимой функции а;,
для которой ||а;(-) - я(-I1с'(К,,*,]) < *•
4.2. Необходимое условие экстремума
Теорема. Пусть функция х доставляет слабый локальный экстремум
в задаче (Р) (х е ЫосеПтР), функции /,-, /«, /й, г = 0,1,..., т, — неирг-
рывны в некоторой окрестности расширенного графика Г$-. (/;,/и:,/м €
()).
существует вектор множителей Лагранжа Л = (Ло,..., Лт) Е
т
Кт+1, Л Ф 0, такой, что для лагранжиана Ь = ^Лг/;B,а;,а;) выполняется
условие гладкости Ь± € ^'([^О) *1]) м выполнено уравнение Эйлера
= 0 V
Доказательство. Выпишем вариацию по Лагранжу функционала
*1
7(а;) = / /(*, а;, а;) <И, найденную нами при выводе необходимых условий
в простейшей задаче вариационного исчисления (п. 1.3)
Со1 (
Рассмотрим следующее линейное отображение -4 функционального
пространства Со([*о, *1]) в конечномерное пространство Кт+1(Л:
Со([*о, *1]) -+ Кт+1), действующее по формуле
АН=
Возможны два случая:
1) 1т А Ф Кт+1, т. е. А — отображение на часть пространства Кт+1
(вырожденный случай);
2) 1тА — Кт+1, т.е. А — отображение на все пространство Кт+1
(невырожденный случай).
1) Вырожденный случай. Пусть 1т А ф Кт+1. Образ линейного про-
пространства при линейном отображении является подпространством. Зна-
Значит, в этом случае 1т А есть подпространство в Кт+1 размерности ^ тп.
188 Глава 3. Вариационное исчисление
Погрузим его в какое-нибудь подпространство размерности т (гипер-
(гиперплоскость). Следовательно, найдутся числа Ао,...,Ат, не все равные
нулю и такие, что
т т
]Г Л,-*; = 0 V 2е1тА<=>^2 \{6^(х, Л) = 0 V Ъ. е Со([*о, «1])-
!=0 1=0
Откуда из явного вида для 8^(х, к) имеем
* = 0 V Л € сЪ([10, к])-
Л
Тогда из леммы Дюбуа-Реймона следует, что для лагранжиана Ь =
т ^^
^2^г/{(^,х,х) выполняется условие гладкости 1ч € С1 ([го, *1]) и вьшол-
!=0
нено уравнение Эйлера
= 0 V * €
2) Невырожденный случай. Пусть 1т А = Кт+1. Покажем, что не-
невырожденный случай невозможен. Тем самым теорема будет полностью
доказана.
Возьмем е0 = A,0,... ,0), ..., ет = @, ...,0,1) — канонический
базис в Кт+1. Поскольку образ отображения А 1т А = Кт+1, то
существуют функции й,- е Со([2о, *|]) такие, что АН] — е,-, ] = 0,1,..., т,
то есть 6^(А, НЛ = 8^ ( &,■ = < ' • 7 •' — символ Кронекера ).
V I "> г г з )
Рассмотрим функцию Р: Кт+1 -+ Кт+1, действующую по формуле
р{р) = (л (*+X /у»/), • ■ •. л» (*
Нетрудно проверить, что в силу заданных условий гладкости функций /;
построенная функция Р непрерывно дифференцируема в некоторой
окрестности точки $ = 0 и Р($) = (Щх),..., 1т(х)) = (а0, аи...,ат) =
а («о := ^(х)). Поскольку якобиан отображения Р не равен нулю
как определитель единичной матрицы (Р'@) = {йЩ&Л]))™-^ = I —
единичная матрица), то по теореме об обратной функции существует
обратное отображение Р'1 некоторой окрестности точки а в окрестность
§ 4. Изопериметрическая задача 189
точки $ = Р~1(а) = 0 такое, что
\Р"](а)\ ^ К\а - а\
с некоторой константой К > 0.
Возьмем а = а(е) = (а0 + е, аь... ,ат) при достаточно малом е
и обозначим /3(е) = ^(«(е)). Тогда Р(/3(е)) = а(е), т.е.
Л (*(■)
РАе)кА-))= «о
т
Р№йА-) 1= °ч>
7=0
при этом
Получилось, что в любой окрестности экстремальной функции х
в пространстве С1([*о, *1]) существует допустимая функция (а именно
т
х(-) + ^2/3](е)к](-)), на которой значение функционала может быть
7=0
и больше (при е > 0), и меньше (при е < 0) чем на х. Пришли
к противоречию, что х не доставляет локального экстремума. Таким
образом, случай 2) невозможен. ■
4.3. Пример
^(x(■)) = / а;2й*-+ех1г, хА1 = 0, х@) = 0,
о о
1.2
Решение. Лагранжиан 1у = Хцх + \\Х.
Необходимое условие — уравнение Эйлера
А
-—Ьх + Ьх = 0 ^=^ -2Л0* + Л, = 0.
от
Если Ло = 0, то Ах = 0 — все множители Лагранжа — нули.
Этого не может быть. Положим Ло = 1/2. Тогда х = \\. Общее решение:
х = С122+С22+Сз- Неизвестные константы С\,С2,Сз находим из условий
на концах и изопериметрических условий:
а:@) = 0 => Съ = 0;
я;A) = 1=^С1 + С2= 1;
1 1
/Г СС
х<И = 0^ / (С/ + С21)А1 = 0 => у + — = 0.
190 Глава 3. Вариационное исчисление
Отсюда С\ = 3, Сп — —2. Таким образом, в задаче имеется един-
единственная допустимая экстремаль х — Ъ1" — 21.
Покажем с помощью непосредственной проверки, что найденная
функция х доставляет абсолютный минимум в задаче. Возьмем функцию
к Е С1 ([0, 1]) такую, что х + к допустимая. Для этого надо взять
1
функцию к, для которой к@) = к{\) = 0 и / кй1 = 0. Тогда
о
1 1 1
= [(х+кJси- [х2си = 2 [ хк<и+ [ к2<и^2 Iхк<и.
0
О 0 0 0
Интегрируя по частям с учетом условий на к, получим
1 1 1
/л • 1 Г - [
"" Ух о У ~ У
0 0
Таким образом, разность всегда неотрицательна, то есть имеем абсолют-
абсолютный минимум.
1
■^гат = / х й1 = I F1 - 2У й1 = — ^— + 41
о
= 12-12+4 = 4.
Очевидно, что 5^^ = +оо. Действительно, возьмем последователь-
последовательность допустимых функций хпA) = хA) + п5т2ж{, тогда ./(а;„(-)) —+ +оо
при п —► оо.
4.4. Задача Дидоны
Одними из первых задач на отыскание наибольших и наименьших
величин являлись изопериметрические задачи о нахождении замкну-
замкнутой кривой, имеющей заданную длину и охватывающую наибольшую
площадь, и о нахождении пространственной замкнутой поверхности,
имеющей заданную площадь и охватывающей наибольший объем. Еще
до Аристотеля (IV век до н. э.) было известно, что среди изопериметри-
ческих (имеющих равную длину) кривых наиболее вместимой является
окружность, а среди изопифанных (имеющих равную площадь) поверх-
поверхностей — сфера.
Изопериметрическая задача содержится также в легенде о царице
Дидоне. Описываемые события легенда относит к 825 году до н. э.
Финикийская царица Дидона и с ней небольшая часть жителей горо-
города Тира, спасаясь от преследований, покинули родной город и в поисках
счастья отправились на кораблях на запад вдоль берегов Средиземного
§4. Изопериметрическая задача 191
моря. Выбрав на африканском побережье удобное место (нынешний Ту-
Тунисский залив), Дидона и ее спутники решили основать здесь город. Эта
идея не понравилась местным жителям, но все же финикийской царице
удалось уговорить их предводителя Ярба, и он простодушно и неосторож-
неосторожно согласился уступить Дидоне клочок земли, «который можно окружить
бычьей шкурой». Хитрая финикиянка, разрезав шкуру на тонкие ремни,
связала их в один длинный ремень и, окружив им значительную тер-
территорию, заложила на ней город Карфаген. В память об этой истории
карфагенская цитадель получила название Бирса (шкура).
Из истории город Карфаген помнится нам еще войнами с Римом
за обладание господством на Средиземном море (Пунические войны,
III-II век до н.э.), которые завершились взятием римлянами Карфагена
и его разрушением.
Мы видим, что Дидона «решала» классическую изопериметрическую
задачу о наибольшей вместимости. Естественно считать, что Дидона
хотела сохранить выход к морю. Тогда мы получаем первую задачу
Дидоны. Среди всех кривых длины I с концами на фиксированной
прямой (прямолинейный берег), найти ту, которая ограничивает фигуру
наибольшей площади. Формализованная задача имеет вид:
т т
I хй1-> тах; I л/] + х2 А1 = I, х(-Т) = х(Т) = О
-т -т
(здесь Т — подвижный конец). Эта задача относится к типу задач
Лагранжа (см. § 6).
Давайте решим вторую задачу Дидоны, в которой оба конца кривой
закреплены на прямой. Формализованная вторая задача Дидоны имеет
вид:
-»о
/
х А1 -> тах; / V1 + х2 А1 - I, х(-Т0) = х(Т0) = О
-То
(здесь То — фиксировано). Это — задача, укладывающаяся в схему
изопериметрических задач п. 4.1. Приведем ее решение с помощью
вариационного исчисления.
Лагранжиан Ь = \ох + А у 1 + х2.
Необходимое условие — уравнение Эйлера
й й \х
+ Ао = 0.
Если Ао = 0, то А ф 0 (не все множители Лагранжа — нули) и значит
х = сот1. Тогда из условий на концах и изопериметрического условия
следует, что х = О, I = 2Т0.
192 Глава 3. Вариационное исчисление
Если Ло ф О, то положим Ло = 1. Тогда из уравнения Эйлера
й Хх , о
вытекает, что = 1. проинтегрировав по I это уравнение,
«* VI + а;2
А±
получим ■ = I + С\. Выразим из последнего уравнения х:
*+с.
Проинтегрировав по I полученное уравнение, имеем: х + Сг =
— A + С\J <^ (* + С1J + (а; + С2J = Л2. Это уравнение окружности.
Из условий на концах х(-гЩ = х(Т0) следует, что С\ = 0, т.е.
*2 + (а: + С2J = Л2.
Неизвестные константы Сг,Л определяются единственным образом
(Л с точностью до знака) из условия х(Тц) = 0 и изопериметрического
условия.
При 2Го < I ^ яТй имеется единственная (с точностью до знака)
экстремаль, являющаяся дугой длины I окружности, проходящей через
точки (±Г0,0), с центром на оси х. Поскольку у нас задача на максимум,
то мы выбираем экстремаль, лежащую в верхней полуплоскости. При
I < 2Го в задаче нет допустимых функций, при I > тгГо нет допустимых
экстремалей. Можно показать, что в этом случае решением будет
полуокружность радиуса Го> «поднятая» на высоту (I - жТ0)/2 вместе
с двумя вертикальными отрезками этой длины.
4.5. Изонериметрические задачи
1 1
4.1. / х2 А1 ~* ехгг; 1хй1 = Ъ, ж@) = 1, хA) = 0.
о о
1 1
4.2. I х2 (И -* ехгг; I 1хш = 0, а;@) = 0, х{\) = 1.
о о
1 1 1
4.3. I х2 А1 -* ехгг; [хА1=1, Ма;й* = 0, а;@) = хA) = 0.
0 0 0
•к тг
4.4. х2A1-> ех1г; / хсо&Ш = -, х@) = 1, х(ж) = -1.
§5. Задача со старшими производными 193
4.5. I ±2А1-> ех1г; I х $т1 А1 = О, х@) - О, х(ж) = 1.
о о
1 1
4.6. I ±2А1-> ехгг; I хе~г А1 = е, х@) = 2е + 1, хA) = 2.
о о
4.7. 1{х2+х2)й1-^^х; [хе*<И=(-^-, х@) = 0, а:A) = е.
0 о
2 2
4.8. / *2а;2й* -> ех1г; [гх<И=-, хA) = 1, а;B) = 2.
1 1
1 1
4.9. I х2(II-* ех1т; 1х2А1=\, х(О) = хA) = О.
о о
тг/2 тг/2
.10. I {х2 -х2)й1->а&г, 1х5т1А1=\, х@) = хСЛ = 0.
о о
/а;-\/1 + ж2й* -+ ех1г; I
^
х(~Т0) = х(Т0) = 0.
1 1
/(х\ + Хт) А1 —> ех1г; / Х\Х? А1 — 0,
о о
#1@) = а;2@) = О, Ж1(])=1, а;2A) =-3.
§ 5. Задача со старшими производными
5.1. Постановка задачи
Задачей со старшими производными в вариационном исчислении
называется следующая экстремальная задача в пространстве С"([20, *1]):
(Р)
х(к)A5) = хщ, * = 0,1,...,п-1, > = 0,1. (I)
Здесь интегрант Ь = ЬA, х, х,..., а;'"') — функция п + 2 перемен-
переменных. Отрезок [2о, М является фиксированным и конечным, 2о < 1\-
194 Глава 3. Вариационное исчисление
Экстремум в задаче рассматривается среди функций х € С"([2о, г\\),
удовлетворяющих условиям на концах A); такие функции называются
допустимыми.
Определение. Говорим, что допустимая функция х доставляет слабый
локальный минимум в задаче (Р), и пишем х Е \у1оспцпР, если существует
6 > О такое, что ^(x(■)) ^ ^(x(■)) для любой допустимой функции х, для
которой \\х(-) - Ц-)\\сН[иЛ]M) < 6-
5.2. Необходимое условие экстремума
Теорема. Пусть функция х доставляет слабый локальный экстремум
в задаче (Р) (х Е \у1осехтгР), функции Ь,Ьх,Ьх,. ■ ■ ,Ьх(п) — непрерывны
в некоторой окрестности расширенного графика Г$-^п) ', (Ь,ЬХ, ■ ■ ■ ,ЬХ(*)
е С(О(Г^ Л(П)))), 1х{к) € Скф0,и\), к = 1, ...,га. Тогда выполнено
уравнение Эйлера—Пуассона
(-1)*4^ч(<) = 0 V
*=о 1
При п = 1 уравнение Эйлера—Пуассона совпадает с уравнением
Эйлера. При п = 2 уравнение Эйлера—Пуассона выглядит следующим
образом:
а2 а
—2±(<)--Х*(«)+Х,(<) = 0.
Доказательство. Будем выводить уравнение Эйлера-Пуассона ме-
методом вариаций. Вычислим вариацию по Лагранжу функционала 3'.
Возьмем произвольную, но фиксированную функцию Н Е С^([1о, 21]).
Поскольку х € \у1осех1гР, то функция одного переменного
<р(Х) := 3{% + ХН) = [Щ,х+ХН,х + ХН,...,х(п) + ХН{п))А1
и
имеет экстремум при Л = 0. Но тогда по теореме Ферма <р'@) — 0.
Дифференцируя функцию <р и полагая Л = 0, получаем
= 0 V Н € С^ф0,^}). A)
*к..*"> {(,@,() С)) ] К,,,]}
Су([«о,«,]) = {Л € С"([«о,«1]) | Л<*>Aо) = АD)(<1) = 0, к = 0,1... .,п- 1}.
61(&,Щ = / ( 5^Хв(»(«)ЛD)(«) 1
§5. Задача со старшими производными 195
Проинтегрируем по частям к раз каждое слагаемое в соотношении A):
11х^П(к)й1 = /х.ийЛ**-1) = ЬхъA)к{к-1)A)^ - Г Н(к-1)й1хщ =
(свободные члены интегрирования по частям равны нулю, поскольку
Ь. е С^([*о, *1]) и, значит, &<*>(*„) = *»(*>(*,) = 0, к = 0,1,..., п - 1)
Тогда соотношение A) перепишется в виде
( $^*] = 0 V А €
Отсюда по основной лемме вариационного исчисления (лемме Лаг-
ранжа8') п. 1.2 следует выполнение уравнения Эйлера—Пуассона. ■
5.3. Вывод уравнения Эйлера—Пуассона с помощью
леммы Дюбуа-Реймона
В этом пункте мы выведем уравнение Эйлера—Пуассона для мень-
меньших условий гладкостей, наложенных на интегрант Ь. Вместо леммы
Лагранжа будем использовать обобшенную лемму Дюбуа-Реймона.
Теорема. Пусть функция х доставляет слабый локальный экстре-
экстремум в задаче (Р) (х € \у1осех1г-Р), функции Ь,Ьх,Ьх,...,Ьх(,) —
непрерывны в некоторой окрестности расширенного графика Г±х 4(»),
(Ь,Ьх,...,Ьх(п) € С(О(ГХХ 4(.)))). Тогда функции 1Х^, -—1ц.)+Ьх^),
ш,
л ( а. , \
-—( ——Ь,(.) + Ь (.-о 1 +Ья(.-2),... непрерывно дифференцируемы на
ах \ аъ /
отрезке [*о, 1\] и выполнено уравнение
&((&(&
'в формулировке леммы Лагранжа вместо пространства Сд([<о, 1г]) можно было
взять пространство С^([1о, 1\]), а при доказательстве соответственно взять функцию
О, ^ & [то, ту
196 Глава 3. Вариационное исчисление
Если Ьхю е Скф0,1]]), к = 1,...,п, то полученное уравнение
совпадает с уравнением Эйлера—Пуассона.
Доказательство. Возьмем произвольную, но фиксированную функ-
функцию Л € Софо, г\]). Поскольку & е ^1осех1гР, то функция одного
переменного <р(Х) := Цх + ХН)= ( Щ х + ХН, х + АЛ,..., х{п) + АЛ(п)) А1
«о
имеет экстремум при А —- 0. Но тогда по теореме Ферма <р'@) = 0.
Дифференцируя функцию <р и полагая А = 0, получаем
5^4»ЛD))Л = О V Л € Соп([*о, Ш A)
и *=° У
Здесь мы не можем, как в предыдущем случае, брать интегралы по
частям, поскольку не задана дифференцируемость функций Ьх&).
Обобщенная лемма Дюбуа-Реймона. Пусть а&() € С([10, (\\) и
(^(*)) Л €
А А ( А \
Тогда функции а„, - — а„ + о„_!, - — ( - — а„ + а„_( 1 + а„_2,... непре-
непрерывно дифференцируемы на отрезке [1о, г\] и выполнено уравнение (аналог
уравнения Эйлера—Пуассона)
Из обобщенной леммы Дюбуа-Реймона и соотношения A) следует
утверждение теоремы. ■
Доказательство леммы. Рассмотрим следующую систему из п ли-
линейных дифференциальных уравнений:
Г -Ро + «о = 0, B)
X-Рк ~Рк-\ + ак = 0, к=1,...,п-1. ^'
Эта система легко решается с помощью последовательного интегриро-
интегрирования уравнений, начиная с первого. При этом непрерывно дифферен-
дифференцируемая функция рп-\ определена с точностью до многочлена степени
§5. Задача со старшими производными 197
п-). Подберем этот многочлен таким образом, чтобы для функции рп-\
выполнялись условия
C)
Рассмотрим функцию Ь., определяемую по формуле
Из определения функции к вытекает, что ъ№ = ап — рп-\ и И Aо) =
к = 0,1,...,п — 1. Кроме того в силу условий C) Л^(^) = 0, к
0,1,. ..,п- 1. Значит, Ъ. е С^{\Ц, 1\\). Тогда для Ь. по условию леммы
0= [
(подставим из системы B) ак = рк +Рь-\ и соотношение а„ = р„_
=Я Е
=0 *=1
Из
полученного равенства 0 = / (Л*"*J й* следует, что Л*"* = 0. Отсюда
'о
а„ = рп-1- Поскольку из системы B) вытекает, что все функции рь
непрерывно дифференцируемы, то а„ = р„_у е С]([1о,г{]). Выразим
рп-2 из последнего уравнения системы: рп-г = — р\-\ +ап-1 — ~^п + йп-1
(отсюда вновь следует, что —ап + а„_] € С1 ([<о> *1])) и подставим в
предпоследнее. Проводя эту процедуру для рп~г, ■■ ■ ,Ро> придем в итоге
к непрерывной дифференцируемости остальных, указанных в лемме
Функций и справедливости дифференциального уравнения. ■
198 Глава 3. Вариационное исчисление
5.4. Пример
1
•7(*(•)) = [ х2й1-> ех1г; х@) = х@) = х(\) = О, х(\) = 1.
о
Решение. Интефант: Ь = х2.
Необходимое условие — уравнение Эйлера—Пуассона
ь ь± +ьх = 0 <=> жD) = 0.
Общее решение уравнения Эйлера—Пуассона: х = С\1Ъ + С222 + С32 + С$.
Неизвестные константы С], С2, Сз, Сл, находим из условий на концах
х@) = 0 => С4 = 0; ж@) = 0 => С3 = 0;
A) = 0, Г С, + С2 = 0, ^. Г С, = 1,
A) = 1, \ЗС,+2С2 = 1, ^^ \С2 = -1.
Таким образом, единственная допустимая экстремаль х — I —I.
Покажем с помощью непосредственной проверки, что функция х
доставляет абсолютный минимум в задаче. Возьмем функцию к Е
С2([0, 1]) такую, чтобы функция х + к была допустимой. Для этого надо
взять функцию к, для которой к@) = кA) — к@) = кA) = 0. Тогда
1 1111
/л ^ ,, К% " 2 /х2 /-Д- /-2 С ■,■■
У У У У У
0 0 0 0 0
Дважды интефируя по частям с учетом условий на к, получим
1 1
1{х + к)- .7B) ^ 2 ГЫк = 2хк -2 1 х{У)кй1 =
о о
1 1
/1 />
а(^)йь — —Ог^Ъ л. 7 I
о У
= 0.
Таким образом, разность всегда неотрицательна, то есть имеем абсолют-
абсолютный минимум
1 I I
^ [х2<И= [F1-2J<И= [C612-241 + 4)<11= №3-1212+41
= 4.
Очевидно, что 8тах = +оо. Действительно, возьмем последователь-
последовательность допустимых функций хпA) = ж(г)+га22(г-1J, тогда 1{хп(-)} -+ +оо
пои п —+ сю.
§5. Задача со старшими производными 199
5.5. Задачи со старшими производными
.1. Г х2 <И -> ейг; х@) = х@) = х{\) = О, х(\) = ).
о
1
5.2. /(х2 - 48ж)й1 -> ех1г; х@) = 1, х@) --4, х()) = хA) = 0.
о
1
5.3. [(х2-241х)<И->ех1г, х@) = х@) = 0, ж(]) = ^, жA) = 1.
о
} 2 2
/ (х - х ) <И -> ех1г; ж@) = 0, ж(О) = 1,
5
о
т
I (х2 +Ах2)й1->ехХт; ж@) = -1, а;@) = 0,
.5. У
5
о
т/2
5.6. / (х2 - х2) еИ -+ ех1г; ж@) = х@) = 1,
о
1
[(х2 + х2) <И -> ейг; х@) = 1, ж@) = О,
5
о
1
5
о
.8. I е~*х2 Л1 -> ех1г; х@) = 0, ж(О) = 1, х(\) - е, а;A) = 2е.
о
е
5.9. 1{1 + \Iх2 <И -> ейг; хA) = 0, жA) = 1, х(е) = е, х(е) = 2.
1
1
/(жC)J й* -> ех1г; ж@) = х@) = х@) = О,
о
яг(]) = 1, я!(]) = 3, гA) = 6.
1
,, [{{х(Ъ)J + х2)й1-^^г, х@) = г@) = О, ±@) = 1,
.11. У
5
о
200 Глава 3. Вариационное исчисление
§ 6. Задача Лагранжа
Все задачи, изученные нами в предыдущих пунктах, являются
частными случаями или могут быть сведены к задаче (мы сформулируем
ее чуть позже), поставленной Лагранжем в сочинении «Аналитическая
механика» в 1788 году. Для ее решения Лагранж использовал метод
неопределенных множителей, который впоследствии стали называть
методом множителей Лагранжа. Впрочем этот метод не был им аккуратно
обоснован, и понадобилось более ста лет для того, чтобы придать
рассуждениям Лагранжа вид строго доказанной теоремы.
6.1. Постановка задачи
Задачей Лагранжа называется следующая экстремальная задача
-Во(^) —+ шт; ^г@ ^ 0) г = 1,..., т ,
где ^ = (ж(-),*0,*1), х(-) е С1 (А,К"), <0,*1 € А, *о < к, А — заданный
конечный отрезок,
Условие A), называемое дифференциальной связью, может быть на-
наложено не на все координаты вектор-функции ж(-) = (хх(-),... ,ж„(-)),
а только на некоторые, для определенности на первые & координат:
ХгA) - 9?:(*,а;(<)) =0, г = 1,... ,к. Обозначим далее х — (ха,хр), где
%а — (^1,-.- ,хк), хр = (хк+1,...,х„). Если дифференциальная связь
отсутствует, то к = 0 и х = хр.
Поскольку вместо ха в функции /,-($, х, х) можно подставить из A)
равное ему выражение <рA,х), то в дальнейшем считаем, что /,• =
}гA,х,хр).
Частным случаем задачи (Р) является задача, в которой один
из концов го или 1\ — подвижный, а другой закреплен или оба конца
отрезка интегрирования [2о, *1] фиксированы.
Элемент ^, для которого выполнены все указанные условия и огра-
ограничения задачи, называется допустимым.
Определение. Говорим, что допустимый элемент ^ = (х(),го,к)
доставляет слабый локальный минимум в задаче Лагранжа (Р), и пишем
^ € \у1осппп.Р, если существует 6 > 0 такое, что Во(() ^ Ва(%) ДЛЯ любого
допустимого элемента ^ = (ж(-),2о,*1), для которого ||^-^||с'(Д)хк2 < 8 <$
(\\х(-) - Ж(-)||С1(Д) < б, 1*0 - *о| < б, 1*1 - < 11 < б).
§ 6. Задача Лагранжа 201
6.2. Необходимые условия экстремума
Теорема Эйлера—Лагранжа. Пусть элемент ^ = (&(•)> *о>*0 доставля-
доставляет слабый локальный минимум в задаче Лагранжа (Р) (^ € чЛоспппР),
функции /,■,/,>,/« непрерывны в некоторой окрестности расширенно-
расширенного графика Гц := {(«,*(*), 4A)) | I е Д} (Д,Д„/й € С(О(Г#4))),
г = 0,1,...,т, функции <р,<рх непрерывны в некоторой окрестности
графика ГА := {A,хA)) | * € Д} (у,у>* е С(О(Г4))), функции 1{ непре-
непрерывно дифференцируемы в некоторой окрестности точки B0, х(&о),$[, аК^))
(/; бС^О^о,^),*!,^)))), » = 0,1,...,т (условие гладкости).
Тогда найдутся множители Лагранжа (Х,р) € Кт+1хС1(Д,К'!), Л Ф 0,
такие, что для функции Лагранжа
'» т т
где /(^,М/з) = Х)^7»(*,М/з)» ' = X)М(*о,а:(«о),*1,а:(«1)) - /яерим-
нант, выполнены условия:
а) стационарности по ж(-) — уравнение Эйлера для лагранжиана
Щ х, х) = /(*, ж, ж^) + р(жа - у)(*, ж))
Г Р(О Р()^х () + Л () = 0,
Ь) трансверсальности по х
с) стационарности по подвижным концам (выписывается только для
подвижных концов отрезка интегрирования)
Л,о = 0 ^ -/(<0) + 1и + 1х{1о)х(г0) = 0,
а*, = о ^=^ /(«0 + /(, + /,(*,)*(«!) = 0;
й) дополняющей нежесткости
ХгВ{ф = О, г = 1,...,т';
е) неотрицательности
Л,- > 0, г = 0,1,... ,т'.
202 Глава 3. Вариационное исчисление
Доказательство теоремы Эйлера—Лагранжа основано на правиле
множителей Лагранжа для гладких задач с ограничениями типа равенств
и неравенств в нормированных пространствах (глава 1, п. 8.2). Поскольку
равенство В{ = 0 можно заменить двумя неравенствами В{ ^ 0, —В^ ^ 0,
то в дальнейшем для простоты записи считаем, что у нас имеются только
ограничения типа неравенств и гп = т.
Покажем, что все условия теоремы о правиле множителей Лагранжа
в полученной задаче
В0(О -+ пап; В<($ < 0, « = 1,..., т, Р($ = 0. (Р)
выполняются. Здесь X = С'(Д,К") х К2, У = С(Д,К*). Это банаховы
пространства — условие банаховости выполняется.
Из непрерывной дифференцируемости функций в теореме Эйлера—
Лагранжа следует, что функционалы В^. X —+ К, г = 0,1,..., гп, и ото-
отображение Р: X -+ У,
РЦ) = Р(х(), «о, «О = ха{1) - <рA, х{1)),
строго дифференцируемы в точке ^ — условие гладкости выполняется.
Ослабленное условие регулярности — условие замкнутости образа
оператора -Р'(О выполняется, так как 1т^'(^) = У — С(Д,К*) —
замкнутое пространство. Действительно,
- !рХа
а система линейных дифференциальных уравнений с непрерывными
коэффициентами
A)
имеет решение для любого у() € С(Д,К*), определенное на всем
отрезке Д, с любым граничным условием в форме Коши Ъ,($о) = у.
Все условия теоремы главы 1 п. 8.2 выполняются. Согласно этой те-
теореме существуют вектор Л = (Ло, Ль..., Лт) е Кт+1 и функционал у* е
У* не равные одновременно нулю и такие, что для функции Лагранжа
= I /(*, х, хр) М + (у*, хаA) - ср(I, хA))) + 1(г0, х{10),1и хAг))
выполняются условия:
а') стационарности Л^ = 0 <=^> Ах = 0 (<»■ АХа =0, АХ/) = 0),
Х(о = 0, %, =0;
Ь') дополняющей нежесткости: Л,В;(^) = 0, г = 1,..., т;
с') неотрицательности: Л; > 0, г = 0,1,..., т.
§ 6. Задача Лагранжа 203
Покажем, что из уравнения АХа — 0 следует существование функции
и
р € С1(А,Кк) такой, что {у*,у(-)) = I р{1)уA)й1 V у € С(Д,К*)
к
и для которой выполняются условия а)-Ь) теоремы Эйлера—Лагранжа.
Тогда Л = Л и теорема будет доказана. Уравнения Эйлера и условия
трансверсальности по Хр будут вытекать из условия стационарности
функции Лагранжа Л по Хр. Они вьшодятся как и для задачи Больца.
Распишем условие стационарности А по 1„:
АХа=0 <=^ АХа[Н]=О ЧкеС](А,К
+ (у*, Щ - <рХаA)ПA)) = 0.
Отсюда в силу соотношения A)
(У,У(-)) = - У ЛвйЛ - 1Ха(кI - /;„(,,)/»(*,) V у € С(Д), У7еК*. B)
Определим функцию р из условий:
По теореме существования и единственности решения задачи Коши для
линейной неоднородной системы [АТФ, с. 191] функция р € С1(Д,К*)
определяется нашими условиями однозначно. Тогда уравнение Эйлера
по ха и условие стационарности по ха в точке 1\ будет выполняться.
В силу соотношений C) и A) имеем:
г, к
^ = ](ръ +рь) <и =
*! ^о г,
= / AхЛ-р<РхЛ +ру +№>) й* = I
'о
1
Находя из последнего соотношения / /ХаНй1 и подставляя полученное
к
выражение в B), получим
204 Глава 3. Вариационное исчисление
у € с(д, к*),
Поскольку функция у(-) и вектор 7 огфеделяются независимо, то зна-
значение функционала (у*,у(-)} не зависит от у, и, значит, коэффициент
при 7 должен обращаться в ноль. Откуда следует, что
'о
Таким образом, А = Л. Теорема полностью доказана. ■
6.3. Примеры
1 1
Пример 1. ^(x(■)) = I ±2<Й -> ех1г; / хШ = 0, а;A) = 1.
о о
Решение. Выписанная задача не является изопериметрической зада-
задачей, поскольку не задано граничное условие функции х{-) в нуле. Задачу
надо решать как задачу Латранжа.
1
Функция Лагранжа: Л = / (А0а;2 + А^) <М, + Х2 (хA) - 1).
о
Необходимые условия:
а) уравнение Эйлера для лагранжиана Ь = \$х2 + А^
а
~—ЬА + Ьх = 0 ^=> -2\0х + Хх = 0;
м
Ь) трансверсальность по х для терминанта / = А2(а;A) — 1)
Щ0) = /«(о), -М1) = -4A) ^ 2А0а:@) = 0, 2А0а:A) = -А2;
Если Ао = 0, то из а) А1 = 0, а из Ь) А2 = 0 — все множители
Лагранжа — нули. Этого не может быть. Положим Ао = 1/2. Тогда
х = Х\. Общее решение: х = С]12 + С2г + С}. Неизвестные константы
Сх,С2,Сз находим из условия трансверсальности ±@) = 0, условия
на конце в единице и изопериметрического условия:
х@) =
§6. Задача Лагранжа 205
[х<и =
Отсюда С\ — 3/2, С3 = -1/2. Таким образом, в задаче имеется
3*2-1
единственная допустимая экстремаль х = .
Покажем с помощью непосредственной проверки, что функция х
доставляет абсолютный минимум в задаче. Возьмем функцию к е
С ([0, 1]) такую, чтобы х + к была допустимой функцией. Для этого
. надо взять функцию к, для которой йA) = 0 и / к<й = 0. Тогда
о
1
= [(х + кJй1- (х2(И = 2 [хк<И+ [к2<й ^ 2 / хкй1.
Интегрируя по частям с учетом условий на к и условия трансверсальности
#@) = 0, получим
1 1 1
1(х + к)- 1(х) ^ 2 I Ык = 2хк - 2 / хк & = -6 I к 01 = 0.
0 0 0
Таким образом, разность всегда неотрицательна, то есть имеем
абсолютный минимум.
Очевидно, что ^щ^ = +оо. Действительно, возьмем последователь-
последовательность допустимых функций хпA) = хA) + п$\п2жг, тогда
1
^(xп(•)) = I (^(*) + п2тгсоз2и) А1 —► +оо при п —► +оо.
О
Пример 2.
ех!г; х@) = ±@) = 0,
/■
о
Решение. Выписанная задача не является задачей со старшими
производными, поскольку не задано значение производной функции х(-)
в единице. Задачу надо свести к задаче Лагранжа, вводя вместо функции х
206 Глава 3. Вариационное исчисление
вектор-функцию (х1,х2), и обозначения: х\ = х, х2 — х. Тогда исходная
задача сведется к задаче Лагранжа:
х2 М -> ех1г; х1 = х2, ^(О) = О, х2@) = О, х{A) = 1.
о
Функция Лафанжа:
1
Л = /(А0±2 +р(Щх1 - х2)) <И + А^О) + А2а;2@) + А3(а;1A) - 1).
о
Необходимые условия:
а) система уравнений Эйлера для лафанжиана Ь = \цх2 +р(х\ — х2)
а
-—Ьх2 + 1^х2 = 0 <^^ -2А0ж2 -р = 0;
(ль
Ь) трансверсальность по х для терминанта / — Л^^О) +
= Аь рA) = -А3,
2А0±2@) = А2, 2А0а:2A) = 0;
с) неотрицательность
Если Ао = 0, то из а) следует, что р = 0, а из Ь) А1 — А2 =
Аз = 0 — все множители Лагранжа — нули. Этого не может быть.
Положим Ао = 1/2. Тогда из а) х\ — 0 <=> х^ = 0. Общее решение:
х = С^ + С212 +С^ + С^. Неизвестные константы С\,С2,С$,Са находим
из условия трансверсальности ±2A) = 0<^а;A) = 0и условий на концах:
а;@) - 0 =* С4 = 0,
а;@) = 0 => Съ = 0,
A) = 1, _ Г С, + С2 = 1,
/1\ /Л "^ ? \ (\{~* _1_ ОС* (
Таким образом, в задаче имеется единственная допустимая экстре-
• ---■ «з е
маль. х =. 1- 3—.
2 2
§ 6. Задача Лагранжа 207
Покажем с помощью непосредственной проверки, что функция х
доставляет абсолютный минимум в задаче. Возьмем функцию к Е
С2([0, 1]) такую, чтобы х + к была допустимой функцией. Для этого
надо взять функцию к, для которой к@) = кA) — к@) = 0. Тогда для
1
функционала ^(x(■)) = I х2 <М имеем
о
1 1111
С •• гч2 /"-2 Г ••■• /у2 ^ Г л;
1 (х-\-к) — 1 (х) = / (х+к) М- 1х й1 = 2 I хк(М+ I к <й ^ 2 / хп
К К Уу У У У У
Интегрируя дважды по частям с учетом условий на функцию к и условия
трансверсальности жA) = 0, получим
' -2 Iх(Ъ)кй1 = -2&(ъ)П *+2 I
Таким образом разность всегда неотрицательна, то есть имеем
абсолютный минимум.
= 1'х<и,= [(-31 + 3J<И = 9 /(*2-
1
Т
о
Найдем абсолютный максимум в задаче. Возьмем последовательность
допустимых функций х„A) = хA) +п12A - ]); тогда
1
= /
- 2)J <И —>■ +оо при п —> +оо,
т. е. 5тах = +оо.
6.4. Вывод уравнения Эйлера—Пуассона
из теоремы Эйлера—Лагранжа
Вернемся к задаче со старшими производными:
{1,хA),х{1),Щ,...,х(п\1))М^^г, (Р)
= я!у> к = 0,1,...,п-1> з =0,1. A)
208 Глава 3. Вариационное исчисление
Теорема. Пусть х € \у1осех1гР, функции Ь,ЬХ, Ьх,...,Ьх(л — не-
непрерывны в некоторой окрестности расширенного графика Г&-±^). Тогда
Ьх(к) € Ск([1о, 1х\), к = 1,..., п, и выполнено уравнение Эйлера—Пуассона
1>1)*;=Л«(*) = 0 V *€[*„, *1].
*=о аг
Доказательство. Приведем задачу со старшими производными к за-
задаче Лагранжа, сделав замену переменных хк = х^к~1\ к = 1,..., п,
*1
/ 1,A,хиХ2,...,х„,х„)(И-кааг, хк=хк+1, к = 1,...,п-1,
МЬ) = хк-ц, к=1,...,п, ^ = 0,1. (Р')
Здесь переменной является вектор-функция (хх,... ,хп). Поскольку
функция х доставляет локальный экстремум в задаче со старшими про-
производными (Р), то вектор-функция (х\,... ,хп) доставляет локальный
экстремум в задаче Лагранжа {Р'). Выпишем согласно теореме Эйлера—
Лагранжа необходимые условия стационарности для лагранжиана
п-1
Ь = \0Щ, хиХ2,...,хп,хп) + ^2 рк(хк - хк+1).
к=1
Терминальную часть функции Лагранжа, а также остальные необходи-
необходимые условия экстремума, не играющие существенной роли в задаче
с закрепленными концами и фиксированным отрезком интегрирования,
не выписываем. Система уравнений Эйлера:
Р1 + 0а.1 = 0,
и —
к =],... ,п й~ ~
' ТГ^оАг. + Ао^а;„ ~ Рп-1 — О.
аъ
Если Ао = О, то из системы уравнений Эйлера следует, что рп-.\ = ... =
Р\ = 0. Все множители Лагранжа — нули. Пусть Ао ф 0. Положим Ао = 1.
Выразим р„_1 из последнего уравнения и подставим в предпоследнее;
проводя эту процедуру для р„_2,... ,р\, придем в итоге к уравнению
Эйлера—Пуассона. ■
§ 6. Задача Лагранжа
6.5. Задачи Лагранжа
<й->ех1г;
209
6.1. /±2<й->ех1г; /\х<И = 0, ж@)=1.
о о
т т
6.2. Г х2 <И -> ех1г; ГхМ=1, х@) = 3.
о о
г г
6.3. /±2 <# -> ех1г; I хМ=-, х(Т) = 1.
о о
6.4. / х2й1 -+ ех1г; хзтШ = 1, х@) = 0.
о о
1 1
6.5. [ х М-+ех1т; ( у/\ + х2 <й = |, жA) = 0.
о о
1
6.6. /ж2<й->ех1г; ж@) = ±A) = О, ±(О) = 1.
о
е
6.7. А2ж2й* -> ех1г; жA) = -], ж(е) = жA) = е.
1
7Г
6.8. /(ж2 - а;2) <й ->■ ех1г; ж@) = а;(тг) = 0, а;(тг) = 1.
о
1
6.9. [(х2 +х2)<И->ех1т; х@) = 0, жA) = зЫ, х(]) =
о
т/2
6.10. /(ж2 - х2) А1 ->■ ех1г; ж@) = ±@) = 0, ж(|) = 1.
о
г
6.11. Т->ех1г; /'х2М = 1, ж@) = ж@) = 0, ж(Т)=].
о
1
6.12. ±A)->ех1г; [х2М=4, х@) = х@) = х{\) = 0.
210 Глава 3. Вариационное исчисление
Ответы к задачам главы 3
1.1. 1 — 1€ аЫпип; Зщт — 1; б'щах = +оо.
е I
1.2. 1- - € аЪзтп; 8тах = +оо.
4 4
$-1 1
1.3. ■ € аЪзтт; 5,™ = --гт; 5тах = +оо.
12 1о1)
1.4. е аЬзтт; 5,пах = +оо.
1.5. 1п2 е аЪзтт; 5,пш = 1; ^щ^ = +оо.
1.6. \ е аЬзтт; 5ПЩ, = 1; ^тах = +оо.
2
аЬзтт; 5тах = +оо.
1.8. л/Г+Т е аЬзппп; ^щах = +оо.
(I — 2J
1.9. — е з1г1оспип; ^щщ = -оо; 5тах = +оо, (* - 1) ^1осех1г.
4
1.10. 21п(« + 1) е аЬзппп; ^пшх = +<х>.
1.11. *3 - I е аЬзтт; 5тах = +оо.
1.12. *3 е аЬзтт; 5тш = 3; ^тах = +оо.
сЫ
1.13. -— е аЬзтт; 8тах = +оо.
сЫ
1.14. (I - 1)сЬг е аЬзтт; 5тах = +оо.
Ь
38Ь2
1.15. (* - 1)зЬг е аЬзтпг; 8,^ = —-—; 5тах = +оо.
1.16. соз2 е аЬзтт; 5тщ = 0; 8тах — +оо.
1.17. (* - — 1 зт* е аЬзтт; 5тш = -—; ^т^ = +оо.
1.18. 2соз2 € аЬзтт; Зт^ = +оо.
1.19. VI - I2 е аЬзтт; ^тах =+оо.
1.20. л/2« - «2 е аЬзтт; 5,^ = +оо.
1.21. Допустимые экстремали — цепные линии вида СсЬ —, где кон-
О
станта С отыскивается из условия на конце С сп —- = ^. Причем
О
при — > а имеются две допустимые экстремали, при — = «
Го Го
имеется одна допустимая экстремаль, при — < а допустимых экс-
Го
тремалей нет, где а определяется из системы уравнений а = зпг,
т — сЙ1т, 8тах - +оо. Подробное исследование задачи содержится
в книге [ИТ, с. 427].
Ответы к задачам главы 3 211
1.22. Экстремаль записывается в параметрической форме следующим
а2 а2
образом: х = —A - созт), I — — (т - апт) + с. Константы а и
с однозначно отыскиваются из начальных условий. Допустимая
экстремаль доставляет аЪзппп, Зщ^ = +оо. Исследование задачи
содержится в книге [АТФ, с. 113].
1.23. Экстремали, удовлетворяющие начальному условию х@) = 0, име-
1+С2 2
ют вид хA, С) = С1 + ———-I . Константа С отыскивается из
граничного условия х(Та) = (. Уравнение огибающей этого се-
I2
мейства имеет вид х = Ъ. (в баллистике эта кривая носит
4п
Т2
наименование кривой безопасности). Причем при ( > — - Н име-
4п
ются две допустимые экстремали, при ^ = К имеется одна
То
допустимая экстремаль, при ^ < К допустимых экстремалей
Ап
нет. В случае двух экстремалей верхняя (в осях I, -х), нося-
носящая название навесной, не дает локального экстремума, нижняя
{настильная) дает сильный минимум. 8т!1Х — +оо.
*2 + 3
2.1. — ^1осехгг; 5^ = -оо (х„A) = п); 5тах = +оо.
2.2. сЬ* € аЬзгшп; б'щах = +оо.
2.3. е1 + зт1 € аЬзтш; 8тах = +оо.
2.4. зга* + соз* ^ 1осех1г; 5тш = -оо {хпA) = п); 8тах = +оо.
2.5. соз« - 1 ^ 1осех1г; 8^ = -оо {хпA) = п); 8тж = +оо.
2.6. @,0) 0 1осехгг; 8^ = -оо (х„A) = (п,-п)); 8тт = +оо (хпA) =
К»))-
2.7. 1п(* + 1) - 1 е аЬвппп; ^тах = +оо.
б/4*3
2.8. - + - е аЬзтт; 5щах
ь 2,
2.9. 1п I + 1 е аЬзтт; 5тах = +оо.
2.10. Допустимые экстремали: у/Г+1, |/ ^; 5тах = +оо.
2.11. 21п(« + 1) е аЬзгшп; 5тах = +оо.
2.12. —; е аЬзтш; ^щ^ = +оо.
е3 + 1
3.1. 0 ^ юсехгг; 5тш = -оо (^п(*) = гй); 8тзх = +оо.
12-\
3.2. е аЬзтш; 8^^ = +оо.
212 Глава 3. Вариационное исчисление
3.3. (х = -21, Т = 1) е аЪзпнп; 5тш = 4; 5тах = +оо.
3.4. (х = ±41, Т = - ] е аЪзпнп; б^ = 8; 5тах = +оо.
3.5. (ж = О, Г = 1) 01осех1г; 5т1п = -оо; 5,^ = +оо.
3.6. (х=---1 + 1,Т = 2) $ 1осехСг, 5^ = -оо (х„Ц) = 1 -*, Тп = п),
8тах = +оо.
3.7. зт I + сок I € аЬзшп; б^х = +оо.
3.8. И м зЬ* е аЬзтт; Зо^ — +оо.
3.9. е1 е аЬзтт; 5тах = +оо.
3.10. ^=:2зЬТс11*, где Т единственное решение уравнения &к2Т + Т = 1.
3.11. \/\ + 21 - I2 € аЬзтт; б^ = +оо.
3.12. х = л/1 + 21 - 1г, Т = 2; 5,^ = +оо.
I
3.13. Допустимые экстремали — цепные линии вида Сек —, где кон-
С
т
станта С отыскивается из условия на конце Сек—■ = %. Причем
О
при — > а имеются две допустимые экстремали, при — = а
То То
имеется одна допустимая экстремаль, при — < а допустимых экс-
То
тремалей нет, где а определяется из системы уравнений а = зЬт,
т = с1кт; 5тах = +оо.
4.1. Ъ12 - М + 1 е аЬзтш; 8^ = 4; 5тах = +оо.
5*3 - 3*
4.2. —-— е аЬзппп; 8^ = 6; б^ = +оо.
4.3. 60*3 - 96<2 + 36« е аЬзтт; 8^ = 192; 5тах = +оо.
4.4. соз* е аЬзтт; 5тш = —; 5тах = +оо.
I - 2 зт I
4.5. е аЬзтш; 8тах = +оо.
ж
4.6. 261"' - * + 1 е аЬзтп; 5тш = 2е2 + 2е - 3; 5тах = +оо.
4.7. *е* € аЬзтт; 8тах = +оо.
7
4.8. * е аЬзтт; 5га;п = -; ^тах = +оо.
4.9. ±ч/2зтЬг2, й е ^ ±%/2зттг* е аЪзтт; 5п,1П = ж2; Зтш = +оо.
8
4.10. -*соз«; 5тах = +оо.
ж
( 1 То\
4.11. Допустимые экстремали — цепные линии вида ±С (сп — — сп — 1,
V С С /
гр
где константа С > 0 отыскивается из условия 2Сзп — = /. Причем
С
Ответы к задачам главы 3 213
при / > 2Т0 имеются две допустимые экстремали, при / = 2То
имеется одна допустимая экстремаль х = О, при / < 2Т0 допустимых
экстремалей нет, 8тгх = +оо.
4.12. C12 -21,312 -Ы),(-312 + А1,-312) ?1осех1г, 5тш = -оо, 8тгх = +оо.
5.1. -2«3 + ЗЬ2 е аЪзтт; 8т^ = 132; 5^ = +оо.
5.2. I4 - 4*3 + б*2 - 4* + 1 е аЬзтт; З^ = +оо.
*5 + З*3 - 2*2
5.3. — е аЬзтю; 5тах = +оо.
5.4. зЬ< е аЬзтт; 5тах = +оо.
5.5. — сЬ^соз^ Е аЬзтт; 5тах = +оо.
5.6. I + соз2 е аЬзтт; 5,^» = +оо.
5.7. сЬ* е аЬзтт; 5тах = +оо.
5.8. *ег € аЬзтт; 5тах = +оо.
5.9. 1Ы1 е аЬзппп; ^цщ, = е; 5^,, = +оо.
5.10. *3 е аЬзтт; 5га1п = 36; 5тах = +оо.
за 2
5.11. зЬ* е аЬзпип; 5т1п = -—; 5тах = +оо.
5*3 -154 + 8
6.1. е аЬ8тш; Дщах = +оо.
о
6.2. (« = 3, Т = -) е аЬзтю; ^тш = 0, (А = 3«2 - 6* + 3, Т = 1) 0
1осех1г; 8тах = +оо.
6.3. (х - 1, Г = Л е аЬзтт; 5тт = 0, (А = *2, Г = 1) ^ 1осех1г;
^тах = +00.
2
6.4. —И + зт2) € аЬзпнп; 8тах = +оо.
Зтг
I г ""
6.5. -VI - V € аЬзтт; 5тш = —,
4
6.6. +1 € аЪзпнп; ^щщ, = 1; 8тях = +оо.
6.7. (I + е)Ш - I е аЬзтт; 5тах = +оо.
6.8. * = -соз* ^ 1осех1г; 5т1п = -оо
соз« (зЬ (ж - I) + зт^ ^; 8тах = +оо.
зЬ2
6.9. зЬг е аЬзтт; 5т1п = -—; 5тах = +оо.
6.10. ] - соз2 е аЬзтт; б^х = +оо.
/ *2 - \
6.11. \± = —,Т = \\ € аЬзтт; 5т!п = 1; 8тах = +оо.
6.12. -*3 +12 е аЬзтт; ^щщ = -1, *3 - «2 е аЬзтах; 5тах = 1.
Глава 4
Задачи оптимального управления
В этой главе рассматриваются задачи оптимального управления.
Приводятся формулировка и доказательство принципа максимума Пон-
трягина в общем случае, доказательство принципа максимума в частном
случае для задачи со свободным концом. Решаются простейшая задача
о быстродействии, аэродинамическая задача Ньютона и ряд других задач
оптимального управления.
В пятидесятых годах потребности прикладных дисциплин (техники,
экономики и др.) стимулировали постановку и рассмотрение нового
класса экстремальных задач, получивших название задач оптимального
управления. Необходимое условие экстремума для задач этого клас-
класса — «Принцип максимума», — сформулированное Л. С. Понтрягиным
в 1956 году, было доказано и развито впоследствии им, его учени-
учениками и сотрудниками. Важно отметить, что это условие имеет су-
существенно иную форму в сравнении с классическими уравнениями
Эйлера и Лагранжа: в качестве обязательного условия в решении зада-
задачи оптимального управления входит решение вспомогательной задачи
на максимум (отсюда и название — «принцип максимума»). За разра-
разработку теории оптимального управления Понтрягану и его сотрудникам
В.Г.Болтянскому, Р. В.Гамкрелидзе и Е.Ф.Мищенко в 1962 году была
присуждена Ленинская премия.
Понтрятин рассматривал задачу на максимум, мы же для единообра-
единообразия с прошлым материалом будем рассматривать задачу на минимум,
называя соответствующее условие условием оптимальности, и формули-
формулировать необходимые условия в лагранжевой форме.
В отличие от задачи Лагранжа в задаче оптимального управления
вводится управление и появляется дополнительное ограничение типа
включения на управление: и Е С\ Множество V определяет возможности
человека влиять на происходящий процесс.
§ 1. Принцип максимума Понтрягина в общем случае 215
§ 1. Принцип максимума Понтрягина
в общем случае
1.1. Постановка задачи
Задачей оптимального управления (в понтрягинской форме) будем
называть следующую задачу:
ЩО -> тш; Вф < 0, % = \,..., т,
Д@ = 0, * = т'+1,...,т, (Р)
хЦ)-<рA,хЦ),иу))=0 V 1ЕТ, A)
иA) е V V * е Д, B)
где ^ = (*(.),!!(•), «о, «О, х € РС^Д.К"), и € Р^Д.ГI», «о,*! € Д,
2о < *ь Д — заданный конечный отрезок, XI С Кг — произвольное
множество, Г С Д — множество точек непрерывности управления и,
г = 0, ],...,т.
Вектор-функция а; = (жь..., ж„) называется фазовой переменной, век-
тор-функция и = («!,...,«г) называется управлением. Ограничение A),
являющееся дифференциальным уравнением, называется дифференциаль-
дифференциальным ограничением. Оно должно выполняться во всех точках непрерывно-
непрерывности управления и. В отличии от задачи Лагранжа имеется ограничение B)
типа включения, которое должно выполняться во всех точках I € Д,
а фазовая переменная х = (XI,..., хп) может иметь меньшую гладкость.
Частным случаем задачи оптимального управления (Р) является задача,
в которой один из концов или даже оба закреплены.
Элемент ^, для которого выполнены все указанные условия и огра-
ограничения задачи, называется допустимым или еще говорят допустимым
управляемым процессом.
Допустимый управляемый процесс ^ = (^(•))й(-),*0Д1) называется
(локально) оптимальным (или еще говорят оптимальным в сильном смысле
процессом), если существует 6 > 0 такое, что -Во(^) ^ Д)(О для любого
допустимого управляемого процесса ^ = (ж(-),и(-)L0,41), для которого
\\Х(-) - *(-)Нс(Д) < б, 1*0 - <о| < «. 1*1 " <М < «•
^ Здесь РС(Д,К") — пространство кусочно-непрерывных на отрезке Д вектор-
функций, соответственно РС1(Д, К") — пространство непрерывных вектор-функций,
имеющих кусочно-непрерывную производную.
Напомним, что кусочно-непрерывной функцией называется функция, имеющая не более
конечного числа разрывов первого рода (в точках разрывов существуют конечные
пределы слева и справа).
216 Глава 4. Задачи оптимального управления
1.2. Формулировка теоремы
Теорема. Пусть ^ = (^х(-),й(-)Iо,11) — оптимальный (в сильном
смысле) процесс в задаче оптимального управления (Р); функции /;,
г = 0,1,..., т, <р и их частные производные по х непрерывны в некоторой
окрестности множества {B, жB)) | I € Д}, декартово умноженного на I/,
а функции 2;, г = 0,1,..., т, непрерывно дифференцируемы в окрестности
точки Bо,жBо),2ьжB1)) (условие гладкости).
Тогда найдутся множители Лагранжа (Х,р) € Кт+1 х РС1(А,И"),
А Ф 0, такие, что для функции Лагранжа
т т
где /(*,х,и) = ^2ХфA,ж,и), I = ^ А,-^(*о>а;(*0),*ьж(*1)) — терминант,
« = 0 !=0
выполнены условия:
а) стационарность по х — уравнение Эйлера для лагранжиана
Щ х, х, и) = /(*, ж, и) + р(ж - 9?(*, х, и))
^ Хж(«) = 0 V I € Г «=^ -р(«) + /,(*) - р(<)&(<) = 0;
Ь) трансверсальность по х
с) оптимальность по и
тт {/(«,*(<), и) - р(«)у(«,*(<),«)} = /(«) ~Р(«)^(«) V * е Г;
с1) стационарность по подвижным концам (выписывается только для
подвижных концов отрезка интегрирования)
*, = 0 <=>• -/(*о) + Г(о + 4(<о)г(*0) = 0,
*, = 0 ^ /(*,) + г(, + Ц,)^) = 0;
е) дополняющая нежесткость
@ = 0, 1=1,...,т';
§ 1. Принцип максимума Понтрягина в общем случае 217
неотрицательность
Покажем, что утверждение теоремы находится в полном соответствии
с принципом Лагранжа, о котором в книге неоднократно шла речь. Дей-
Действительно, функция Лагранжа Л = Л(ж(),и(-),*0,*1) является функцией
трех аргументов: фазовой переменной ж(-), управления и(), концов
отрезка интегрирования *о>*1- Согласно общему принципу Лагранжа,
надо рассмотреть задачи о минимуме функции Лагранжа, в которых
фиксированы все аргументы, кроме одного, и выписать необходимые
условия минимума функции Лагранжа:
О)
Л(ж(-), и(-), «о, *0 -» тш; (п)
(ш)
Задача A) является задачей Больца, необходимые условия экстремума
в которой — уравнение Эйлера и условия трансверсальности. Задача (п)
является элементарной задачей оптимального управления. Минимум
интеграла достигается, если подынтегральная функция достигает своего
минимума по выбору возможных управлений — это и есть условие
оптимальности по управлению. Задача (ш) является задачей нахождения
минимума функции двух переменных, необходимые условия экстремума
в которой — теорема Ферма — равенство нулю в точке минимума
частных производных по 20 и 1\.
1.3. Доказательство
А) Игольчатые вариации, пакет иголок. Проварьируем процесс ^,
включив его в конечно-параметрическое семейство, определяемое па-
пакетом иголок (набором игольчатых вариаций управления и). Для это-
этого фиксируем натуральное число И, наборы: точек т = (Т1,...,т)у),
Г1 ^ 72 ^ • • • ^ Ту, управлений V — («!,..., VN), длин а = («!,..., ар^)
(ту еТ, V] е 17, «_,- ^ 0, ] — 1,... ,./У). Управление
где А, = [т1-^-])\а\-а1, т,- - (Я - ;)|а|), |<х| := у/а\ + ... + а%, на-
назовем игольчатой вариацией управления и, определяемой пакетом иголок
(т,г/,а). Некоторые точки т,-, могут совпадать. Однако полуинтерва-
полуинтервалы Др имеющие длины а^, устроены так, что они не пересекаются
и при малом а лежат во множестве Т.
218 Глава 4. Задачи оптимального управления
Функция жB;2о,а;о,а), являющаяся решением уравнения
х = <рA,х,иа), хA0) = х0, A)
называется игольчатой вариацией функции х, определяемой точкой Bо, хо)
и пакетом иголок (т,ь,а) с фиксированными наборами гиг;. Ниже мы
покажем, что если точка Bо,^о) находится в окрестности точки (*о, &о)
(хо := хAц)), то при малом а решение дифференциального уравнения
действительно существует и определено на всем отрезке Д.
В) Теорема существования. Лемма об игольчатой вариации.
Теорема. Предположим, что задача Коши
х = Р{1, х), хAй) = х0 («о е 1Ш Д),
имеет решение х е С^Д,!*"). При этом Р — функция непрерывная и не-
непрерывно дифференцируемая по х в некоторой окрестности С траектории
А = {(*,*(*)) I * € Д}, Д — конечный отрезок.
ТЪгда найдется С' С О — окрестность траектории Г$ такая, что
для любой точки (<0, а?о) € О' существует единственное решение х(-;10,х0)
задачи Коши, определенное на отрезке А, при этом функция хA;1о,хо)
непрерывно дифференцируема во множестве А х С' и
где 0B,2о) — фундаментальная система решений уравнения:
^(Мо) = -^(*, жB))Г2B,20), ^(*о,*о) = I (единичная матрица).
Э'го классическая теорема о существовании и непрерывно дифференциру-
дифференцируемой зависимости решения дифференциального уравнения от начальных
данных [АТФ, с. 195-204].
Лемма об игольчатой вариации. Пусть наборы г и V в пакете
иголок (т,у,а) фиксированы. Тогда существует е > 0, такое, что если
О < \а\ < е, |жо-жо| < е, |*о-*о| < е, то всеотрезки Д,- С Г и, кроме того,
функция хA\ 2о, х0> а) — решение уравнения A) — определена на отрезке А,
непрерывно дифференцируема в некоторой окрестности точки A\,1о,хо,О),
при этом \\х(-; 10, х0, а) - *(-)||С(д,к») ~* ° при (*°> ж°'") ~* (*°> *0' °) и
B)
C)
где Г2D) := Г2(<, <о) — фундаментальная система решений уравнения:
йа\ = шМ\п(п. ши\ = т.
§ 1. Принцип максимума Понтрягина в общем случае 219
Наметим путь доказательства леммы. Если управление и — непре-
непрерывная функция, то утверждения леммы сразу вытекают из теоремы
о существовании и непрерывно дифференцируемой зависимости реше-
решения дифференциального уравнения от начальных данных. Если же й
кусочно непрерывна, то нужно применить теорему несколько раз на ка-
каждом участке непрерывности.
С) Редукция к конечномерной задаче. Снова фиксируем N, наборы г
и V. Обозначим г :— (г1;20, х0, «ь ■ ■ 2я
= I /, (*, хA; «о, х0, а), иаA)) А1 + г,(<0, хо,1и хAх; 10, х0, а))
и рассмотрим конечномерную задачу с ограничениями типа равенств и
неравенств
В0(г)->тт; Щг) < 0, г = 1,... ,т, Щг) = 0, г = т + ],... ,т,
а}> 0 («• -а} < 0), ; = 1,..., N. (РТ,„)
В силу леммы об игольчатой вариации функции Д- непрерывно диф-
дифференцируемы в некоторой окрестности точки г — {1\,Ц, х0,0) и элемент
(ж(-;*о,а;о,«),*О)*1) —» (^(ОДоДО в метрике пространства С(Д,К") х К2
при г —♦ г. А так как элемент ^ доставляет локальный минимум в зада-
задаче (Р), то точка г е 1осттРГ]В. Значит, к задаче (-Рг,») применим принцип
Лагранжа для конечномерных задач с равенствами и неравенствами. Со-
Согласно ему найдутся множители Лагранжа Ао,..., Ат, ци..., ц^, не все
равные нулю (А; = Х,(т, V), /^- = /^(т,г/)) и такие, что для функции
Лагранжа задачи (-Рг,»)
Л = ^ ЛД-(г) - ^3 №4 =
гг
1=0
'I
= /
I
I
т т
где /A,х,и) = ^А.'/Д^^и), /(*о,а;о,*ьЖц) = ЕА.гДго,^,*!,^). вы-
«=0 «=0
полнены условия:
• стационарность: Лг = 0;
• дополняющая нежесткость: А;Д(г) = 0 (о- А;В,(^) = 0),
1') 0 1ЛГ
неотрицательность: А; ^ 0, г = 0,1,...,тп О- /), /*у ^ 0,
220 Глава 4. Задачи оптимального управления
О) Преобразование необходимых условий конечномерной задачи. Обо-
Обозначим р — решение дифференциального уравнения
Р + Р<Рх = /х (а)
с краевым условием
Существование и единственность решения уравнения (а) с краевым
условием (Ь() следует из теоремы существования и единственности ре-
решения задачи Коши для линейных систем [АТФ, с. 191]. Из определений
функции р и определения функции 1} следует, что
й
— (рп) = рп+рй = Дп - р<рхп +р<рхп = Д п.
Отсюда с учетом граничного условия Щ1о) = I имеем
Распишем условия стационарности функции Лагранжа Л в точке г,
учитывая лемму о приращении функционала (см. ниже § 2) и формулы
из леммы об игольчатой вариации:
Шх*о(Ь «о, *о, 0) Л + 40 + 1Х1хХо01-Л, х0,0) =
>
40 = 0; (Ьо)
иA)хиA; «о, 40,0) Л + 4„ + 4,а:@(*,; *0, *о, 0) =
■о
§ 1. Принцип максимума Понтрягина в общем случае 221
- ~Ш - / Л(«)"(«)^о) Л + к -
(=} -/(*о) + 1Х1щШ(г0) + р(Ш(к) + к -
= -Ш + Р(к)*(*о) + к '= -Ш + к + кЧ*о) = 0; (<1о)
Л,, (г) = /(«,) + %, + ?„*(*,) = 0. (й,)
Очевидно, что А # О, ибо иначе из определений /,! и у следовало
бы, что р = 0, а из соотношений (с^») тогда следовало бы, что /л = 0.
А множитель Лагранжа (А,/л) ф 0. Умножением на положительную
константу нормируем вектор А так, чтобы |А| — 1.
Итак, получили: для точек т\,...,тн € Т, управлений V],...,г/# е I/,
существует вектор А = (Ао, Аь..., Ат), |А| = 1, такой, что выполня-
выполняются соотношения а)-() принципа максимума Понтрягина с условием
оптимальности с) для конечного числа точек ту и управлений г/у.
Е) Окончание доказательства. Рассмотрим в пространстве К"*1
подмножества -йГ(т,г;), т е Т, V е II, сферы К - {А е Кт+1 | |А| = 1},
состоящие из тех векторов А, для которых выполняются утверждения
а)—г) теоремы о принципе максимума Понтрягина, причем в п. с) взято
I = т, и = V. Сфера К является компактом, множества К(т,у) С К
замкнуты, конечное пересечение р| -Кг,,»,- Ф ® ■
Лемма о центрированной системе. Пусть К — компакт, {
система замкнутых подмножеств К, любая конечная подсистема которой
имеет непустое пересечение {центрированная система). Тогда пересечение
всех множеств системы {Ка}а€л непусто ( (~) Ка ф 0).
аеА
Доказательство. Обозначим Оа — дополнение к Ка в К @а: =
К \ Ка). Тогда Оа открыто в К. Если П Ка = 0, то ^) Оа = [^ (К \
а€Л а€А а€Л
Ка) = К \ р| Ка = К, т. е. {Оа}а^А есть открытое покрытие компакта
аеЛ
К. По определению компакта из любого открытого покрытия можно
выделить конечное подпокрытие, т.е. можно найти аи... ,ац>, такие,
что Ц) Оау = К. Но тогда П *а, = П(^ \ Ощ) - К \ ^ Оа. = 0 -
противоречие с центрированностью системы. Значит, пересечение всех
множеств системы Р) Ка ф 0. и
По лемме о центрированной системе все множества К(т,у) име-
имеют непустое пересечение. Значит, существуют ненулевой вектор А =
222 Глава 4. Задачи оптимального управления
(Ао,. •., Ат), |А| = 1 и функция р е РС1(А,Кп) такие, что выполняются
утверждения теоремы а)-г) с условием оптимальности, выполняющимся
для любых т а Т, V €.17. ■
Замечание. Принцип максимума доказан нами в пространстве
РС'(Д, К") х РС(А, Кг) х К2. Небольшие изменения доказательства по-
позволяют обосновать его в пространстве РГ^Д, К") х ^^(Д, Кг) х К2.
1.4. Пример
4
В(х(-)) = 1{х2 +х)(И-> ех1г; \х\ < 1, а;@) = 0.
о
Решение. Приведем задачу к виду задач оптимального управления,
введя управление и:
4
Пи2 + х) й1 -> ех1г; х = и, и е [-1, 1], а;@) = 0.
о
Функция Лагранжа:
4
Л = / (А0(и2 + х) +р(х - и)) й1 + А,а;(О).
о
Необходимые условия:
а) уравнение Эйлера для лагранжиана Ь = А0(и2 + х) + р(х - и)
й
--М + Ьх = 0 <=> -р + Ао = 0;
аг
Ь) трансверсальность по х для терминанта ^ = А(а;(О)
МО) = Цо), -М4) = -1,D) ^=^ р@) = А,, р(А) = 0;
с) оптимальность по и
1шп {А0и2 - ри} = Аой2 - рй;
ое[-1,1]
A) неотрицательность
Ао ^ 0 в задаче на минимум,
Ао ^ 0 в задаче на максимум.
Если Ао = 0, то из а) р = 0 и из Ь) р — \\ = 0 — все множители
Лагранжа оказались нулями.
§ 1. Принцип максимума Понтрягина в общем случае
223
В задаче на минимум положим Ао = 1. Тогда из а) р = 1 и из Ь)
р = I — 4. Из условия с) следует, что
и —
вщпр,
Р
Г
-1, 0<*<2,
«=> х =
- - 2, 2
4.
Интегрируя, получаем
--21 + С2, 2
4.
Из начального условия х@) = 0 выводим, что С\ = 0, а из условия
непрерывности в точке 1 — 2 имеем -2= 1-4 + С2О-С2= 1. Таким
образом,
( -«, 0 < * ^ 2,
х= < I2
Докажем с помощью непосредственной проверки, что функция х
доставляет абсолютный минимум в задаче. Возьмем функцию к Е
РС1([0, 4]) такую, чтобы х + к была допустимой в задаче. Для этого
надо взять функцию к, для которой \х +к\ ^ 1, к@) = 0. Имеем
в(х + к)- в(х) = I {{& + кJ + х + к) ш - [ф2
о о
4 4 4 4.4
= 2 I хк(И+ I к<И+ I Н2й1^> 2 I Ык + I кй1.
0 0 0 0 0
Интегрируя по частям в первом интеграле с учетом условий к@) = 0,
жD) = 0, получим
4 4
В(х + к)- В(х) ^ 2хк + [(-2$ + \)кй1 = I\-2х + 1)Л<Й.
о о
Подставляя в последний интеграл найденную функцию х и разбивая
отрезок интегрирования на два, имеем
2 4 2
[(-2А+1)к(И+ [(-2х- + \)кй1= [кМ^О,
224 Глава 4. Задачи оптимального управления
ибо кA) ^ 0 при I е [0, 2], так как к@) = 0, и к ^ 0 при * € [О, 2]
(т. е. функция к возрастает на отрезке [0, 2] и, следовательно, неотрица-
неотрицательна) . Итак, х Е аЪзгшп.
4 2
= [(х2 + х)<И= /A-
Л
В задаче на максимум положим Ао = — 1. Тогда из а) р = — 1 и
из Ь) р = 4 — I. Из условия с)
пйп {-и2 - ри} = -и2 - рй
следует, что
п — х — 5)§пр = з%п D — 2) — 1, 0 ^ I < 4.
Интефируя, получаем ^ = 4 + С. Из начального условия х@) — 0
вытекает, что С = 0. Таким образом, ж = 2.
Докажем с помощью непосредственной проверки, что функция х
доставляет абсолютный максимум в задаче. Возьмем функцию к €
РС'([0, 4]) такую, чтобы х + к бьша допустимой в задаче. Для этого надо
взять функцию к, для которой |^ + к\ ^ 1 (О- |1 + к\ ^ 1 О- — 2 ^ к ^ 0),
к@) = 0. Как и при проверке экстремали на минимум имеем
кй1.
В(х + к) - В(х) = 2 I хНй1+ I Н2 й1+ I к(И= 1{2 + к)кй1+ I
Оба интеграла неположительны, поскольку в первом интеграле к < 0,
а 2 + к ^ 0, а во втором интеграле к ^ 0, так как к@) = 0 и к ^ 0
(т.е. функция к убывает). Следовательно,
В(х + к)- В(х) < 0,
т. е. х = I Е аЬзтах;
§ 2. Принцип максимума в частном случае 225
То, что х = I € аЪзтах можно было бы получить и без непо-
непосредственной проверки из условия самой задачи. Разобьем исходный
4
функционал на два интеграла. Максимум / х2 <й при \х\ < 1 достигает-
о
4
ся на |±| = 1, а максимум / х<& при \х\ < 1, ж@) = 0, достигается при
о
наибольшем возрастании функции х, т.е. при х = 1 (о- х = 2).
§ 2. Формулировка и доказательство
принципа максимума Понтрягина
для задачи со свободным концом
Приведем формулировку и доказательство принципа максимума
Понтрягина для следующего частного случая задачи оптимального управ-
управления — задачи со свободным концом и закрепленным временем (концы
отрезка интегрирования 2о>*1 фиксированы):
(Р)
хA) - <р(г, хA), и(<)) =0 V * € Т, и(<) € V V * € [<о, к], я?(«о) = *о,
где фазовая переменная х € РС1([1а, *1],К"), управление и €
РС([20, <)], К.г), II С Кг — произвольное множество, Г С [*о, *1] —
множество точек непрерывности управления и(-).
Теорема. Пусть (х(-), й(-)) — оптимальный управляемый процесс в зада-
задаче оптимального управления (Р) ((&,&) Е з1г1осттР), функции /,<р непре-
непрерывны в некоторой окрестности множества Г$ = {D,жD)) | I Е [*0) ^Ь
декартово умноженного на II, частные производные (по Фреше) /х,<Рх
определены на этом множестве и непрерывны в точках множества
Г&й = {(*, ^(*)> *@) I * ^ [*о, *1]}. о функция I дифференцируема (по Фреше)
в точке хAх) (I е О(хA}))).
Тогда выполняется условие оптимальности по и:
!{1,Щ,и) -рA)<рA,Щ,и) ^ /(<) -рA)фA) V * € Т, V и € V, A)
гйе р — единственное решение дифференциального уравнения
-2(«)+ /«(*)-!>(*)&(<) = о угет B)
с краевым условием
'() C)
226
Глава 4. Задачи оптимального управления
Отметим, что принцип оптимальности A) с условиями B)-C) может
быть выведен из необходимых условий оптимальности в общей задаче
оптимального управления, множитель Лагранжа Ао при функционале В
оказывается равным единице, а условие трансверсальности по хAо)
не существенно.
Доказательство. Единственность решения уравнения B) с краевым
условием C) следует из теоремы существования и единственности
решения задачи Коши для линейных систем [АТФ, с. 191].
А) Игольчатые вариации. Зафиксируем точку т & Т, управление
V е II и такое малое число а > 0, что отрезок [т-а,т]сГ.
Управление
, <€[т-а,т),
назовем элементарной игольчатой вариацией управления и (рис. 9).
, X
*, *
Рис. 10
Пусть ха(-) — решение уравнения хA) — <р({,хA),иаA)) с началь-
начальным условием хA0) = ж0. По локальной теореме существования решения
дифференциального уравнения [АТФ, с. 186-189] функция ха определе-
определена при малых а в некоторой окрестности точки 2о> но из леммы 1,
формулируемой ниже, следует, что на самом деле вектор-функция ха
определяется единственным образом на всем отрезке [20, *1]- Посколь-
Поскольку при I е [1ъ,т - а) управление иа{1) = йA), то на полуинтервале
[го, т - а) функции ха и х, являющиеся решениями одного и того же
дифференциального уравнения, совпадают (см. рис. 10). Функция ха на-
называется элементарной игольчатой вариацией функции х, а пара (ха, иа) —
элементарной игольчатой вариацией процесса (х, и). Тройку (г, V, а), опре-
определяющую эту вариацию, будем называть элементарной иголкой.
В) Лемма 1 (о свойствах элементарной игольчатой вариации). Пусть
в элементарной иголке (г, V, а) точка т € Т и управление V Е V фикси-
фиксированы. Тогда существует число е > 0 такое, что для любого а Е [0, е\
отрезок [т — а, т] С Т, а функция ха — игольчатая вариация функции —
х определена на всем отрезке [2о, ^\\\ при этом при а —+ +0
§ 2. Принцип максимума в частном случае 227
1) функция ха(-) -+ ж(-) в метрике пространства С([20,1\], К");
х }.\ _ х(.\
2) функция — > у(-) в метрике пространства С([т, *1],К"),
где функция у кусочно дифференцируема на отрезке [т, ^] и удовлетворяет
дифференциальному уравнению
у(г) = <Р*Ш*) УгеМ^пг D)
с начальным условием
у(т) = ч>(т,х(т),ю)-ф(т). E)
Доказательство леммы 1. Существование функции жа следует из
теоремы существования решения обыкновенного дифференциального
уравнения, а сходимости функций следуют соответственно из теорем
0 непрерывной и непрерывно дифференцируемой зависимости решения
от начальных данных. Строгое доказательство этих утверждений мы здесь
не приводим, отсылая к книге АТФ, с. 89-91.
Докажем, что функция у кусочно дифференцируема на отрезке
1Т> *1Ь удовлетворяет начальному условию E) и дифференциальному
уравнению D). Восстанавливая значение функций ха и х в точке
1 € [г, ^] через их производные и учитывая то, что эти функции
удовлетворяют дифференциальному уравнению х = <рA, х, и), имеем
I
уН) = Ьт —— — = 1ип / —— — Ав =
а-»+о а а-^+о^ а
I
- Шп / —-——
а->+оу а
г
I
- Цш / — —
зе[т-а,т]
т
I
а
I
= <р(т,х(т),ь)-ф(т)+ / фх(з)у(з)<1з. F)
При переходе к пределу в первом интеграле мы воспользовались теоре-
теоремой о среднем для определенных интегралов2*, а во втором интеграле
2' Подынтегральная функция непрерывна.
228 Глава 4. Задачи оптимального управления
мы вначале воспользовались дифференцируемостью по Фреше отобра-
отображения <р: С([20, *1], К") -* Сфо, *1], К") в точке х(-) 3\ а потом перешли
к пределу под знаком интеграла4*. При этом
||о(жа - х)\\с(\т,1,],к») ,. \\о(ха - х)\\с \\ха - х\\с
11т —!—= пт — — = О-|||Л|с = О-
а->-Ю а а->+0 \\Ха — Х\\с «
Подставляя в полученное уравнение F) значение I — т, получаем на-
начальное условие E) для функции у в точке г, а продифференцировав
уравнение по 2, получим, что функция у удовлетворяет дифференциачь-
иому уравнению D). ■
С) Лемма 2 (о приращении функционала). Пусть в элементарной
иголке (т,у,а) точка т € Т и управление V Е II фиксированы, В (а) :=
В(ха{-), иа('))- Тогда функция В дифференцируема справа в нуле и
В'(+0) — /(т,х(т),у) - /(г) -р(т)((р(т,а;(т),г/) - ф{т)).
Доказательство леммы 2. Используя теорему о среднем для опреде-
определенных интегралов, правило перехода к пределу под знаком интеграла,
дифференцируемость по Фреше и лемму 1, получим
В\Щ = Я
а-»+о а . а-»+о а
а~*+0 а \7 х ' / а->+0 а
«о
- Нт -
а->+0 а
1 , ,+ тпГ
1е\т-а;т] а-^+0^ а
г
3'Дифферешщруемость следует из заданных условий гладкости функции <р.
^Подынтегральная функция сходится в метрике пространства С([т, 1\],И.п) к функ-
функции у.
§ 3. Избранные задачи оптимального управления 229
Выражая /х из уравнения B), учитывая уравнение D), и начальное
условие E) для у(т), имеем
11ху<и^ I (р + рфх)у<и= (ру+ру)<и= —(ру)<и =
т т т т
= Р(*1)у(к) -Р(т)у(т) = р^уЦ^-р^^Цт)^) - <р(т)).
Подставляя найденное значение / /хуА1 в выражение для В'(+0),
г
получим искомое представление.
^) Завершение доказательства. Из леммы 1 следует, что если
а Е [0, г], то (ха,иа) — допустимый управляемый процесс и ха(-)
равномерно стремится к ж(-). Поскольку (х, й) — оптимальный процесс,
то при малых а > О
В(ха, иа) ^ В(х, и) <=^ В(а) ^ В@).
Отсюда по лемме 2 В'(+0) ^ 0, и из выражения для В'(+0) вытекает,
что
/(г,Цт),V) -р(т)<р(т,Цт),V) ^ /(г) -р{т)ф{т) УтЕГ, V V € СГ,
т.е. выполняется соотношение A). Теорема полностью доказана. ■
§ 3. Избранные задачи оптимального управления
3.1. Простейшая задача о быстродействии
Рассмотрим задачу о наибыстрейшей остановке лифта в шахте, во-
вошедшую во многие монографии по оптимальному управлению. Лифт
управляется под воздействием внешней силы, которая может изменяться
в заданных пределах, регулируемых человеком. Предположим, что воз-
возможности действующей силы, а следовательно, и ускорения, ограничены
какой-то величиной, например, ускорение может изменяться от -1
до +1. Требуется за кратчайшее время Т остановить (х(Т) = 0) лифт,
для определенности в начале координат (х(Т) = 0). Нетрудно видеть,
что задача может быть формализована следующим образом:
Г-*гшп; |г|<1, а;@)=6, *@) = 6. х(Т) = х(Т) = 0.
Аналогично формализуется задача о машине, движущейся прямоли-
прямолинейно без трения по горизонтальной дороге. Машина может двигаться
в любую сторону с ускорением, не превышающем единицу. Требуется
остановить машину в определенном месте за кратчайшее время.
230 Глава 4. Задачи оптимального управления
Решение. Приведем задачу к виду задач оптимального управле-
управления, вводя вместо функции х вектор-функцию {х,\, х2), управление и
и обозначения: х±=х, х2 = х, и — х,
Г->тш; Х1 = х2, ±2 = и, ие[-1,1],
*1@)=&, *2@) = &, яя(Г) = х2(Т) = 0.
Функция Лагранжа:
т
Л = У (Ы<)(*1 - Ж2) +Р2(*)(Ъ - и)) И +
о
+ А0Г + А^О) - 6) + Л2(я2@) - 6) + Азг^Г) + А4а;2(Г).
Необходимые условия:
а) система уравнений Эйлера для лагранжиана Ь = р1A)(±1 - х2)
*2 - и)
Ь) трансверсальность по х идя терминанта I = А0Г + Хх(х1@) -
6) + А3х,(Г) + А4а;2(Г)
= -А3,
() () = А2, р2(Г) = -А4;
с) оптимальность по и (не зависящие от и слагаемые не выписываем)
шш { - й(«)«} = -й(*)*(*) ^ в(<) = ( г ,
«е[-1,1] г пк> * ^\>\> V; \ любое из [-1, 1], р2(«) = 0;
с1) стационарность по Г
Лт = 0 <=> Ао + А3±!(Г) + А4а:2(Г) = 0;
е) неотрицательность
Ао^О.
Учитывая то, что из начального условия следует х^(Т) = 0, а из Ь)
А4 = -р2(Т), получаем, что с1) равносильно условию Ао = р2(Т)й(Т).
Поэтому если Ао = 0, то р2(Т) = 0 либо и (Г) = 0, но тогда из с)
вновь р2(Т) = 0. При этом р2 не может быть тождественным нулем,
ибо иначе все множители Лагранжа были бы нулями. Значит, из а)
§ 3. Избранные задачи оптимального управления
231
р2A) = СA - Г), а тогда из с) следует, что йA) = 1 или м(*) = -1.
Множество начальных условий, соответствующих таким управлениям,
описывается уравнением
Действительно, пусть йA) = 1 <* х2A) = \*Щ °х2(г) = 1-Т*1Щ- \1A) =
(I - ТJ/2 => & = Й/2 ^ 0 =$• & = -у/Щ (ПРИ извлечении квадратного
корня берем знак минус, поскольку & = 22@) = -Т < 0, при этом
минимальное время движения Т = -^2 > 0). В случае йA) = -1
аналогично получаем, что & = -\/~^ь ^1^0. Ниже покажем, что
найденное время движения действительно доставляет минимум в задаче.
Таким образом, в нашей задаче в этих случаях минимум достигается при
А0=0.
= -1
Рис. 12
Если же & Ф уF)> то Ао Ф 0, и мы полагаем Ао = 1. Тогда из с1)
вытекает, что \рг{Т)\ = 1 и функция р2 меняет свой знак в интервале
@, Т) (случай, когда функция р2 не меняет свой знак в интервале
@, Т) и й{1) = ±1, уже был рассмотрен при Ао = 0). Т.е. имеются две
возможности (см. рис. 11):
р+Ц) = С{1 - Т) + 1; р2 (<) = СA - Т) - 1.
Этим возможностям в силу Ь) соответствуют такие управления:
+ _ Г-1, <К«<т, __ Г 1, 0<<<т,
и - I 1, т<1^Т, и ~ 1-1, т<«<Г.
232 Глава 4. Задачи оптимального управления
Рассмотрим траектории, соответствующие оптимальным управлени-
управлениям и+ и и" на плоскости (х\,х2), называемой фазовой плоскостью
(см. рис. 12).
Для тех значений I, для которых иB) = 1, имеем
I2 х2
х2 = 1 =>• ж, = ж2 = * + С' => а = - + С'1 + С" = у + С.
Таким образом, фазовая траектория, соответствующая этим значе-
х\
ниям I, является куском параболы х\ = — + С. Направление движения
по такой параболе определяется из условия возрастания х2, так как
в этом случае х2 = 1- Аналогично получаем, что для тех значений I, для
х\
которых иB) = — 1, фазовая траектория — кусок параболы х\ = — —' + С,
а направление движения определяется из условия убывания х2, так как
±2 = — 1.
Укажем теперь то место на фазовой плоскости (х1,х2), где долж-
должно совершаться переключение управления. В искомую точку @,0)
(ж^Г) = х2(Т) = 0) мы должны попасть не более чем с одним
переключением, двигаясь по фазовой траектории по разрешенному
направлению. Совокупность начальных условий, соответствующих упра-
управлениям и+ и и~, описывается неравенствами & > уF) (для и+)
и 6 < уF) (для и~). Переключения совершаются на кривой & = <р(%\).
При этом, как нетрудно видеть, для каждого начального условия имеется
единственная фазовая кривая, приводящая в точку @,0).
Поскольку всегда \х2\ = 1 на оптимальной траектории, то х2 = |2| + С
и, значит, время движения Т = Уат х2 (вариация функции х2). Одна-
Однако проще находить оптимальное время Т, строя функцию ж(-) класса
РС ([2о, ^^}), удовлетворяющую необходимым условиям экстремума и на-
начальным условиям. В примере 2 пункта 3.3 будет приведено решение
одной из конкретных задач быстродействия.
Покажем, что построенная таким образом оптимальная траекто-
траектория, начинающаяся в точке (^1,^2), доставляет решение задаче. Пусть
этой траектории соответствует управление й (для определенности й~),
функция х и время Т. Предположим, что имеется некоторый другой до-
допустимый управляемый процесс (х,и,Т), Т ^ Г. Доопределим функцию
ж(-) нулем на отрезке [Т, Т].
Воспользуемся следующей формулой восстановления функции по ее
га-й производной
§ 3. Избранные задачи оптимального управления 233
По этой формуле при п = 2 в силу условий на левом конце
функции а; и ж в точке г можно представить в виде
т
х(т) == / (г - 8Щз) Аз + &т + 6-
о
Поскольку Цв) = 1 ^ х(з) для любого я е [О, т], то
т
Цт) - х(т) = Г(т-в)A- х(з))Аз > О,
о
причем равенство здесь возможно только, если во всех точках непрерыв-
непрерывности х(з) = 1, а тогда хA) — х(ь) для любого I € 10, г].
Воспользуемся другой формулой восстановления функции по ее п-й
производной
т
1
По этой формуле при п = 2в силу условий на правом конце функции х
и ж в точке I = г можно представить в виде
т
х(т) = I (з- т)х(з) Аз.
т
Поскольку х(з) = -1 < х(з) для любого я е [г, Т], то
т
Цт) - х(т) - I (з - т)(-1 - Цз))Лз < О,
7"
причем равенство и здесь возможно только, если х(з) = — 1, а тогда
жB) = жB) для любого * € [г, Т].
Таким образом, имеем, что х(т) — ж(г) и, следовательно, жB) =
ж(«) V * е [О, Т]. Отсюда Т = Т.
3.2. Аэродинамическая задача Ньютона
Задача Ньютона — это задача о сопротивлении движению тела
вращения в «редкой» среде. Необходимо выбрать форму тела вращения
так, чтобы сопротивление движению было минимально.
234
Глава 4. Задачи оптимального управления
История задачи
В 1687 году вышли «Математические начала натуральной философии»
Ньютона. В седьмом разделе, озаглавленном «О движении жидкостей
и сопротивлении брошенных тел», Ньютон рассматривает задачу о со-
сопротивлении шара и цилиндра в «редкой» среде. Затем в «Поучении»,
при исследовании сопротивления усеченного конуса, Ньютон делает
следующее утверждение.
Пусть ОИЕС — неко-
некоторая кривая (рис. 13). Из
произвольной точки ЛГ кри-
кривой опустим перпендикуляр
на ось АВ и из задан-
заданной точки С проведем пря-
прямую, параллельную каса-
касательной к кривой в точ-
точке N. Эта прямая пересе-
пересечет ось АВ в точке Р. То-
Тогда если имеет место про-
Рис. 13
порция
СР АВР■ВС1'
то тело получающееся вращением кривой ИИ ЕС около оси АВ, будет
испытывать наименьшее сопротивление в вышеупомянутой редкой среде
среди других тел такой же длины и ширины.
Ньютон не дал объяснения тому, как он пришел к этому резуль-
результату. Опубликованные в наше время материалы Ньютона показывают,
что он владел элементами многих конструкций, которые потом были
использованы при создании вариационного исчисления.
Но, как будет видно в дальнейшем, задача Ньютона относится
даже собственно не к вариационному исчислению, а к оптимальному
управлению, теория которого начала разрабатываться только в середине
этого века.
Формализация задачи
Сопротивление движущегося тела зависит от законов сопротивления
среды. Ньютон представлял себе среду состоящей из неподвижных частиц
фиксированной массы т, являющихся абсолютно упругими шарами. Мы
также будем придерживаться этого предположения.
Пусть тело вращения вокруг оси х движется в направлении, обратном
оси х в описанной выше среде со скоростью V (рис. 14). Элемент Аг
на оси г при вращении вокруг Ох описывает кольцо Лег. Этому
кольцу соответствует пояс ЛТ, на теле вращения. За время А1 этот пояс
«вытеснит» объем (IV = 2эггйгг/<й, где 2%гАг — площадь йа. При
р р
этом слой столкнется с N — —ЛУ = —2тггйгу(И частицами, где р —
ш т
плотность среды. Предположим, что участок йв наклонен к оси г под
углом (р.
§ 3. Избранные задачи оптимального управления
235
Тогда одна частица, уда-
ударившись о слой получит при-
приращение импульса, равное
т(г/2 - щ) — -2тпусо8<р ■ п,
\щ\ = }щ\ =- V, п — единичный
вектор нормали к ЛТ,. По тре-
третьему закону Ньютона, тело
получит приращение импульса
2тпусо8<рп. За время <й таких
приращений будет N, а так
как в силу симметрии ком-
компоненты пг вектора — п, т.е.
ортогональные оси вращения,
сократятся, то суммарное при-
приращение импульса будет на-
направлено вдоль оси х и модуль
его будет равен
Рис. 14
2рЖГУAгсИ , 2 2
И2тпу сок <р соя <р = 2тг/со5 <р = Арпь гсоз <рйгт.
т
В силу второго закона Ньютона это приращение равно АР йЬ,
следовательно йР — Аржу2г соз2 <рйг, где к = Арггк. Просуммировав йР
по всем поясам йТ. (т. е. по всем элементам йг), получим
Ч-
гйг
\
СО8 <р =
\
Таким образом, заменив г на I и Я на То,
задачу:
Ах
получаем экстремальную
1
тш; я?@) = 0, х(Т0) =
Очевидно, что нижняя грань интеграла равна 0. Действительно,
'—г= ^ 0 при I е [0, То], и выбрав ломаную хA) так, чтобы \хA)\
1 + х
был очень большим, получим сколь угодно малый интеграл. Получается
противоречие, т. е. чем более зазубрен профиль на теле, тем меньше
сопротивление. Дело в том, что в формализации неявно использовалась
монотонность профиля, так как только в этом случае частица сталкива-
сталкивается с телом один раз. Таким образом к условию задачи нужно добавить
требование х ^ 0. Форма тела вращения задается функцией х{1) такой,
236 Глава 4. Задачи оптимального управления
что ж@) = 0, х(То) — ( (^ ~ заданное число). Для того, чтобы столкно-
столкновение частицы среды учитывать только один раз, налагаем условие и ^ 0.
Формализованно задача оптимального управления выписывается
следующим образом:
То
/ г -> тшп; х = и, и > 0, ж@) = 0, х(Т0) - {.
^ 1 _(_ и
о
Функция Лагранжа
То
Л =
о
Необходимые условия:
а) уравнение Эйлера: — р = 0 (о- р = сопят);
Ь) трансверсальность по х: р@) = А1; р(Т0) = — <
с) оптимальность по и:
и^и >- 1 + И 1 1 + И
й) неотрицательность: Ао ^ 0.
Если Ао = 0, то р Ф 0 (если р = 0, то из Ь) следует, что Ах = А2 = 0 —
все множители Лагранжа — нули). Минимум в соотношении с) конечен
только, если р < 0, при этом и = 0, т. е. х = 0. Из условия ж@) = 0
вытекает, что х = 0, тогда ^ = 0.
Пусть Ао ф 0. Положим Ао = 1. Тогда для достижения минимума в с)
необходимо, чтобы р < 0 (если р ^ 0, то функция Ь{1,и) := ■——^ — ри
монотонно убывает с возрастанием и и не достигает минимума). Если
йB) > 0, то Ьи — 0. И из с) управление йA) должно находиться
из уравнения
При малых значениях I > 0 производная Х/„B, и) > 0 для любого и ^ 0.
Значит, ттХ/(*, и) = Х(*, 0). Таким образом, и = < -'т ^ . ^ ™ .
Момент излома управления г характеризуется уравнениями
2й(т)т г
§ 3. Избранные задачи оптимального управления
237
(второе уравнение в B) Ь(т — О,0) =
Ь{т,и(т)) — условие совпадения
минимумов в точке т). Подста-
Подставив р из первого уравнения соотно-
соотношения B) во второе, находим, что
и2(г) = 1. Отсюда и(т) = I (ибо
и ^ 0), и тогда снова из первого
уравнения B) получаем равенство
г = —2р.
После излома оптимальное ре-
решение удовлетворяет соотноше-
соотношению A), из которого следует, что
2и
Щи)
— ри
Рис. 15
их их <И
Ах
Но —-— = и 3
аЬ аи аъ аи
это соотношение с учетом равенства х(т) — 0, й(т) = 1, получаем
параметрические уравнения искомой оптимальной кривой:
аЧ р / 1 з\
и— = — ( — +2и + 3и 1. Интегрируя
аи 2 V и /
Константа р определяется из начального условия ж(Т0) = ^. Эту кривую
называют кривой Ньютона.
Покажем, что х доставляет абсолютный минимум в задаче. В силу
оптимальности по и для любой допустимой функции х е РС'([0, ТО]),
яг(О) = 0, х(Т0) = {,
х\1)
-10 ^0
Интегрируя это соотношение и учитывая, что / хA) <М = хA) й1 = ^,
получаем
То Т„
1А1
Значит, ж е
Сопоставим полученное решение с решением, полученным Ньюто-
Ньютоном. Обозначим МЫ - I, ВМ = х, ВС = г, угол БСР = <р. Тогда
238 Глава 4. Задачи оптимального управления
из построения Ньютона имеем
— = 1ё V = ±(<) =>• -ВР = тх, СР2 = ВС2 + ВР2 = (ж2 + 1)г2.
.ВС?
Таким образом, из пропорции Ньютона
МЫ СР3 I т3(х2 + 1K/2 х1 т
СР АВРВС2 (х2 + 1)^2г Атхт2 (х2 + IJ А
Но это — не что иное, как соотношение A), в которое подставлено
значение ро = -г/2. Отметим еще, что «затупленность» кривой и условие
на скачок в точке С = г (угол там равен 135°) были по существу
предусмотрены Ньютоном в его «Поучении» об усеченном конусе.
3.3. Примеры задач оптимального управления
Пример 1.
2, х@) = ж@) = жB) = 0.
Решение. Эту задачу можно свести к задаче оптимального управле-
управления, вводя вместо функции х вектор-функцию A1,12) и управление и
и обозначения: хг = х, Х2 = х, и = х. Тогда наша задача сведется
к задаче оптимального управления:
/■
2
ех!г; ±1 = х2, х2 = и,
о
и € [-2, 2], 1,@) = 32@) = х2B) = 0.
Функция Лагранжа*
2
А= (\ох1+р1(Щх1-х2)+р2A)(х2-и))<11 + \1х1@) + \2х2@) + \3х2B).
о
Необходимые условия:
а) система уравнений Эйлера для лагранжиана Ь =
(х1~х2)+р2A)\х2-и)
= 0 I ^ Л \ й(*) = Аоу - С* + С;
§ 3. Избранные задачи оптимального управления 239
Ь) трансверсальность по х для терминанта I = А1ж1@) + Х2х2@) +
B)
Ы°) = 1„@), Ь±1B) = -1Х1{2) <=> р,@) - А,, р,B) = 0,
Ы°) = «„@), -М2) = -1,2B) •<=>• й@) = А2, р2B) = -А3;
с) оптимальность по и
об[-2,2] [любое из [-2, 2],
й) неогридательность
Ао > 0 в задаче на минимум,
Ао ^ 0 в задаче на максимум.
Если Ао = 0, то из а) следует, что рг = С и из Ь) рг = 0. Поэтому из а)
р2 = С' Ф 0, иначе все множители Лагранжа оказались бы нулями. Значит
из с) и = 2 или и = —2, т. е. х = 2 или ж = —2, откуда а; ■= 42 + А{1 + А-г
или а; = — I2 + В^ + В2. В обоих случаях не существует функции такого
вида, удовлетворяющей условиям на концах ж@) — ж@) = жB) = 0.
Полагаем Ао = I в задаче на минимум. Тогда из а) р\A) = 1+С и из Ь)
(I - 2J
Р1A) = I - 2, далее из а) следует, что р2(г) = + С". Получили,
что р2A) — парабола с ветвями, направленными вниз и вершиной на оси
1 = 2, следовательно, р2A) или не меняет свой знак на отрезке [0, 2], или
меняет его с минуса на плюс в некоторой точке г Е @, 2). И, значит,
из с) оптимальное управление й на всем отрезке тождественно равняется
двум или минус двум или меняет свое значение с минус двух на плюс
два в некоторой точке г. Но как мы уже выяснили в первых двух
случаях функций, удовлетворяющих начальным условиям нет. Осталось
рассмотреть случай
2 <К«<
Интегрируя это равенство, находим, что
• _ (-21 +Си 0<*<т,
I 21 + С2, т < I < 2.
Из условий на концах ж@) = хB) — О
■21, 0 < * < г,
«-4, г<*<2.
Поскольку функция должнабыть непрерывной в точке г, то — 2т = 2т—4,
откуда г = 1. Интегрируя еще раз, получаем
"? - « + С2, 1 < * < 2.
240
Глава 4. Задачи оптимального управления
Из начального условия ж@) = 0 О- С) = 0 и условия непрерывности
в точке т = 1: —1 = 1 — 4 + СгО-Сг = 2 находим допустимую экстремаль
х~и-и + 2, к*<2.
Докажем с помощью непосредственной проверки, что функция х
доставляет абсолютный минимум в задаче. Возьмем функцию К €
РС ([О,2]) такую, чтобы х + К была допустимой в задаче. Для этого
надо взять функцию К, для которой \х + К\ < 2, й@) = й@) = кB) = 0.
Имеем для функционала
2
^(x(■)) ~ I
~ I хй1
о
2 2
- I\х + П)й1- IхйЬ= I Пш = - 1р2Ъ,ш=- IКйр2.
0 0 0 0
Интегрируя по частям дважды с учетом условий й@) = й@) — НB) — 0,
Р2B) — 0, получим
2 2
} ■ ■ 2 } ■
й) — ^(ж) = / /ф2 от — йрг = / п,ар2 =
^ о ^
2 2
■ 2 С- Г
— ЛР2 "" / Ь,Р2 Ш = — I I
о У У
2 <и.
о о
Разбивая отрезок интегрирования на два и учитывая, что
имеем
3{х
1 I
Л) - ./(А) = - / Кр2й1- I Кр2й1 ^ 0.
Таким образом, х € аЬзтхп.
При этом
= [хй1 = I-I1 ш + [(I2 - 41 + 2)А1 =
1 8
§3. Избранные задачи оптимального управления 241
Ясно, что при решении задачи на максимум —ж (Е аЬктах, 5тах = 2,
так как функционал 1{х) является нечетной функцией относительно х,
а множество допустимых функций симметрично относительно нуля.
Пример 2.
Т-ишп; -1<ж<3, х@) = 1, х(Т) = -1, ж@) = х(Т) = 0.
Решение. Приведем задачу к виду задач оптимального управле-
управления, вводя вместо функции х вектор-функцию (ж1,ж2), управление и
и обозначения: х\ = х, Х2 = ж, и = ж,
Т->тт; х]~х2, х2 = и, ие[-1,3\,
Ж!@) = 1, Х1(Т) = -\, х2@) = х2(Т) = 0.
Функция Лагранжа:
+ А0Т + А1(ж1@)- 1) + А2ж2@) + А3(ж1(Т) + 1) + А4ж2(Т).
Необходимые условия:
а) система уравнений Эйлера для лагранжиана Ь = р\{Ь)(±) - х2) +
р2Ц){х2 - и)
Л
й
Ь) трансверсальность по ж для терминанта I = Х0Т + А^ж^О) - 1) +
А2ж2@) + А3(ж,(Т) + 1) + А4ж2(Т)
= Аь Р1(Т) = -А3,
() Рг(О) = А2) р2(Т) = -А4;
с) оптимальность по и
{Р2Ц)} р2Ц){) > й(<) = <^ 3, р2(<) > 0,
и€!-1-3] I любое из [-1, 3], р2Ц) = 0;
й) стационарность по Т: АТ(Т) = 0 <^=Ф> Ао +Азж^Т) + А4ж2(Т) = 0;
е) неотрицательность: Ао ^ 0.
Учитывая то, что из начального условия следует х\(Т) = 0, а из Ь)
А4 = -р2(Т), получаем, что с1) равноси.чьно условию Ао = р2(Т)й(Т).
242 Глава 4. Задачи оптимального управления
Поэтому если Ао = 0, то Рг{Т) = 0 либо й(Т) — О, но отсюда из с)
вновь р2{Т) = 0. При этом р2 не может быть тождественным нулем,
ибо иначе все множители Лагранжа были бы нулями. Значит, из а)
р2{Ь) = С{1 -Т), С Ф 0, а тогда из с) следует, что й{1) = -1 или й{1) = 3,
т.е. & ~ -1 или & = Ъ, откуда х = - — + А^ + А2 или х = 3— + В^ + В2.
В обоих случаях не существует функции такого вида, удовлетворяющей
условиям на концах ж@) = 1, х(Т) = -1, ж@) = х(Т) = 0. Таким
образом, в случае Ао = 0 нет допустимых экстремалей.
Полагаем Ао = 1. В силу условий п. а) р2 — линейная функция,
не тождественно равная нулю. Значит р2 может менять свой знак
на отрезке [0, Т] не более одного раза. Причем, если функция р2
не меняет свой знак на [0, Т], то и(<) = — 1 или йЦ) = 3. В обоих случаях
мы уже проверили, что нет допустимых экстремалей.
Поэтому р2 меняет знак на [0, Т] ровно один раз в некоторой точке
т € @, 2). Получаем две возможности:
Первый случай невозможен, так как тогда параболы с заданными
условиями на концах не пересекаются. Интегрируя второе равенство,
находим, что
х ~ \ Ъ1 + С2, т <1^Т.
Из условий на концах ж@) = х{Т) = 0 имеем
-«, 0 < I < т,
Поскольку х б РС2([0, Т]), то функция х должна быть непрерывной
ЗТ
в точке т, поэтому -т = 3(т - Т), откуда т — —. Отсюда
Ь2 ЪТ
\-С, О < I < —,
2 ' 4
3(* - ТJ ЗТ
2 + ' Т ^ ^
Из начальных условий ж@) = 1, х(Т) = — 1 следует, что С = 1, Х> = —1,
ЗТ 9Т2 ЗТ2
а из условия непрерывности в точке т = —: 1- 1 = 1
находим, что Т = ——. Таким образом, имеется единственная допустимая
§ 3. Избранные задачи оптимального управления
243
экстремаль
X = <
—2+1,
Аналогично тому, как это бьшо сделано в простейшей задаче быстро-
быстродействия, можно показать, что х € аЬхтш, т. е. найденное значение
~. 4
Т = —у= доставляет абсолютный минимум в задаче.
уЗ
3.4. Задачи оптимального управления
3.1. / х 8ШI ЛЬ —> ех(г; \х\ < 1, ж(-тг) = ж(тг) = 0.
7т/4
3.2. / жШ1Ш->ех1г; |ж| < 1, ж@) = 0.
о
4
3.3. / (ж2 + х) ЛЬ ->■ ех1г; |±| < 1, жD) = 0.
о
2
3.4. / х <И -л ех(г; |ж| < 2, ж@) + жB) = 0, ж@) = 0.
о
4
3.5. хМ-> ех(г; |ж| < 2, ж@) + жD) = 0, ж@) = жD) = 0.
о
3.6. Т-ипт; \х\ < 2, ж(-1) = 1, ж(Т) =-1, ж(-1) = ж(Т) = 0.
3.7. Т -> шш; -3 < х < 1, х@) = 3, ж(Т) = -5, ж@) = ж(Т) = 0.
3.8. Т-+шт; 0 < х < 1, ж@)=|ь ж@) = &, х(Т) = х(Т) = 0.
2
3.9. [\х\(И-+тт; х ^ -2, ж@) = 0, жB) = -1, жB) =-2.
о
2
3.10. / \х\ ЛЬ -► шт; ж < 2, ж@) = 0, жB) = 1, хB) = 2.
о
1
3.11. / х ЛЬ -► тт; ж < 24, ж@) = 11, хA) = х(\) = 0.
244
Глава 4. Задачи оптимального управления
3.12. I х2 <И -> шп; х ^ 6, ж@) = ж@) = 0, жB) = 17.
1
3.13. Г
х2
3.13. Гх2<И-*гтп; \х\ < 1, ж@) = ж@) = 0,
о
~.
3.14.
±|) Л - ех(г;
Ответы к задачам главы 4
3.1. х =
-7Г
7Г
'1'
7Г 7Г
— < Ь < —, € аЬхгшл, 5тт = -4, -ж
7Г 7Г
= 4.
7Г
-I, О < < < -,
3.2. ж=^ я- ж тг^ аЬхтш; —ж б аЬзтах.
" 4^^7?'
3.3.
т; 4 - I € аЫ>тах.
-4,
2 4 4
3.4. х-1 - 2 € аЬшип; 5тш = --, -х е аЬзтах; 5тах = -.
-г2,
0<<<1,
3.5. х = < (< - 2J - 2, 1 < < < 3, € аЬхтт; -ж € аЬхтах.
12
з-6-
3.7.
41,°'
ЗГ
— + 3,
€ аЬхтт;
Ответы к задачам главы 4 245
3.8. Допустимые экстремали существуют при 6 ^ —, 6 < 0;
+ 26 Л ) ,. -,, 6-26
Лх=\ («
26 V 1 2 ' Г^^Т' ^2 ^2
аЬхтт.
39 Ж-/°' , 0<<<1'
3.10. х = | °' _ 1J) 1 ^ ^ з', ; т-
{ 1
1, 0<*<-,
2 2 е аЬхпйп.
Т.
3.13. х =< з
3.14. 161 < 1 => х = | б аЬхтт; ||| > 1 =>
(с, °<^^'
ж = < , 2 € аЬхтт, где константа С
отыскивается из граничного условия на правом конце:
кивается из граничного условия на правом конце
СсЬ (!--!)= 6 5тах = 4-оо (хпЦ) = пЦ - 1) 4- 0-
Глава 5
Условия второго порядка
в вариационном исчислении
В этой главе даны необходимые и достаточные условия экстрему-
экстремума в простейшей задаче вариационного исчисления. Это классические
условия — условия Лежандра, Якоби, Вейерштрасса и другие. При-
Причем эти условия будут выведены как следствия принципа максимума.
Условие Вейерштрасса будет также выведено без принципа максимума
с помощью игольчатых вариаций. При выводе достаточных условий
в простейшей задаче вариационного исчисления будет строиться поле
экстремалей, выводиться основная формула Вейерштрасса. Формулиру-
Формулируется и доказывается отдельно теорема о необходимых и достаточных
условиях экстремума в простейшей задаче вариационного исчисления с
квадратичным функционалом. Аналогичные необходимые и достаточные
условия экстремума могут быть получены и в других задачах (Больца,
изопериметрической задаче, задаче со старшими производными).
§ 1. Простейшая задача
вариационного исчисления
Рассмотрим простейшую задачу вариационного исчисления (для
определенности задачу на минимум)
(Р)
1.1. Сильный и слабый экстремум
Задачу (Р) мы рассматривали на слабый экстремум. Иногда чтобы
подчеркнуть, что задача рассматривается на слабый экстремум, мы будем
писать Р(РГ). Множество допустимых элементов в задаче на слабый экс-
экстремум 1?(Р(РГ)) составляют непрерывно дифференцируемые функции
класса С'([<о, 1\]) с заданными условиями на концах.
§ 1. Простейшая задача вариационного исчисления 247
Напомним, что функция х 6 Х>(Р(РГ)) доставляет слабый локальный
минимум в задаче (Р) (х € \у1осттР), если она доставляет локальный
минимум в пространстве С'([<о, ^]), т.е. если существует 6 > О такое,
что 1{х) ^ Л(х) для любой функции х € Х>(Р(РГ)), для которой
N0 - *(-)Нсч[*.,«1]) < 6-
Наряду со слабым экстремумом простейшую задачу вариационного
исчисления будем рассматривать на сильный экстремум РE) (буква
8 — начальная буква слова йгощ» — сильный). Множество допустимых
элементов в задаче на сильный экстремум Х>(РE)) составляют кусочно-
дифференцируемые функции класса РС'([<о, ^^]) с заданными условиями
на концах.
Функция х 6 Х>(РE)) доставляет сильный локальный минимум в за-
задаче (Р) (х 6 ййосттР), если она доставляет локальный мини-
минимум в пространстве С(Ц0, <]]), т.е. если существует 6 > О такое,
что ^{x) ^ 3{&) для любой функции х 6 Л(Р(8)), для которой
Так как множество функций, среди которых доставляется сильный
экстремум, шире, чем для слабого экстремума, то если функция х 6
С1 ([*<>> ^^]) доставляет сильный, то она доставляет и слабый экстремум.
Поэтому для функций х 6 С'([<о, ^1]) необходимое условие слабого
экстремума является необходимым условием сильного, а достаточное
условие сильного экстремума является достаточным условием слабого.
1.2. Пример слабого, но не сильного экстремума
Приведем пример задачи, в которой допустимая экстремаль доста-
доставляет слабый локальный минимум, но не доставляет сильного локального
минимума
1
I х сН -► шГ; х@) = 0, хA) = 1.
о
Необходимое условие слабого, а значит и сильного экстремума —
уравнение Эйлера:
Ь± + Ьх = 0 <=> — Зх2 = 0 «=> Зх2 = С <=> х = сот!.
Общее решение уравнения Эйлера: х = С\1 + Сг- Из условий на концах
находим, что С\ — 1, С2 = 0. Таким образом, имеется единственная
допустимая экстремаль х = I. Покажем, что она доставляет слабый
локальный минимум в задаче {А € \у1осгшп). Действительно, если
248 Глава 5. Условия второго порядка в вариационном исчислении
1
Л 6 Со ([0,1]), то для функционала 1{х) = / ж3 Л1
имеем
1 1 1
1{х + к) - Л{х) = /A + ЛK <й - ( I3 <й = / Л2C + Л) <й. (*)
Отсюда видно, что если \\Щ\ < 3, то 3 + Щ) > 0 и, значит, Л(х + Л) ^
./(ж), т. е. ^ € ш1остт.
Покажем, что х не доставляет сильного локального минимума
(х $ хМосгпш). Рассмотрим последовательность функций Л„ (п > 1)
такую, что
-у^, <€ [О, -1,
М«) =
0,
Тогда
Легко понять, что Л„ € РСо([О, 1]) и ||Лп||с([о,1]) ~* 0 ПРИ и —»• оо.
Положим хп = х+Нп. Получим последовательность допустимых (в задаче
на сильный экстремум) функций хп, хп{-) —► ж(-) в метрике пространства
С([0, 1]), для которых в силу (*)
1/п
= [к2пC + кп)<и= ГпC-
1/2
= 3-
6 4
_1
п п\А
-оо,
при п —► оо, т. е. функция ж не доставляет сильного локального минимума
(х $ ййосгшп), более того ЗапЛишп ~ ~°°-
Ниже в п. 1.4.3 в лемме о скруглении углов покажем, что функция
класса С1, доставляющая абсолютный слабый экстремум, доставляет
и сильный, т. е. 5ягаьяпшР =
§ 1. Простейшая задача вариационного исчисления 249
В нашей задаче можно было построить последовательность допу-
допустимых функций хп класса С1 такую, что ^{xп) —► — оо, т.е. сгладить
функции хп.
1.3. Условия Лежандра, Якоби, Вейерштрасса
Рассмотрим простейшую задачу вариационного исчисления, для
определенности задачу на минимум
'(*(•)) = [Ь{1,хA),хA))А1-+М; хA0) = х0, хЦ,) = ц. (Р)
к
Пусть х 6 С'([<о, ^^]) — некоторая фиксированная допустимая
(ж(<0) = х0, х(Ь\) = х\) экстремаль (т.е. х удовлетворяет уравнению
Эйлера). Далее предполагаем, что интегрант Ь по меньшей мере дважды
непрерывно дифференцируем в некоторой окрестности расширенного
графика Глё (Ь € с\о{Г±ё))).
Возьмем функцию к е Со'([<о, ^^]■ Пусть х е \у1оспбпР, тогда
функция одного переменного
«1
= $
имеет минимум при А = 0. Из условий, наложенных на гладкость
функции Ь следует, что функция <р(\) дважды дифференцируема в ну-
нуле. Поэтому по необходимому условию минимума первого порядка
(по теореме Ферма) <р'@) = 0, т. е.
Л = 0 V Н € С^о, к})- A)
В главе 3 п. 1.3 было показано, что из соотношения A) следует уравнение
Эйлера — необходимое условие минимума в простейшей задаче.
По необходимому условию минимума второго порядка для функции
одной переменной <р"@) ^ 0, т. е.
/@) = [
Л > 0
B)
250 Глава 5. Условия второго порядка в вариационном исчислении
Из соотношения B) выводятся условия второго порядка минимума
для простейшей задачи вариационного исчисления. Важную роль играет
коэффициент Ьхх{1) при к2.
Говорим, что на экстремали х выполнено условие Лежандра, если
Ъц{1) ^ 0 V I € [^о, ^] и усиленное условие Лежандра, если Ьх±{1) > 0
V *€[*„, *,].
В векторном случае х = (жь... ,хп) € Сгф0, <)],К"),
— матрицы размера тахта. Отметим, что матрица Ьхх{1) является
транспонированной к матрице ЬХх{1) и (Ьххк,Н) = (Н,Ь*ХХН) — (к,ЬххН).
Условие ЬХХ(Ц ^ 0 означает неотрицательную определенность ма-
матрицы, условие ЬххA) > 0 — положительную определенность матрицы.
Соотношение B) можно переписать в виде
1\
[ {(Ьххк, к) + 2Aххк,н) + (ьххн, л)) <й ^ о
B)
Пусть далее ЬХХ,ЬХХ,ЪХХ € С\Ц0, ^],К) и выполнено усиленное
условие Лежандра.
й~
Уравнение Эйлера по к Ь^) + ЬкA) = 0 для интегранта Ь~
1A,к,к) •=Ьхх{1)к2(Ц+ 2ЬХХA)ЩЩ + Ьхх{1)к2{1), т.е. уравнение
--{ЪХХ{1)Щ + ЪХХ{1)Щ)) + 1ХХ{1)Щ + ЬХХ{1)Щ = 0
называется уравнением Якоби для исходной задачи на экстремали х.
Точка т называется сопряженной к точке Ьо, если для решения
уравнения Якоби Л(-) с начальными данными Л(^о) == 0, кЦо) — 1,
функция к в точке т обращается в ноль (к(т) = 0). Говорят, что
на х выполнено условие Якоби, если в интервале (<о, 1\) нет точек,
сопряженных с 1й, тл усиленное условие Якоби, если в полуинтервале
A0, ^\] нет точек, сопряженных с 10.
Уравнение Якоби — линейное дифференциальное уравнение второго
порядка, которое (из-за усиленного условия Лежандра) можно разрешить
относительно второй производной.
§ 1. Простейшая задача вариационного исчисления
251
Для вектор-функций х = [х\,...,хп) ищется фундаментальная си-
система решений уравнения Якоби — матрица Н{1) = (й'B) ... Л"@) —
'*}(*) ... Л?(*)
| с начальными условиями НA0) = О (нулевая мат-
рица), НA0) = I (единичная матрица) или йе1ЙA0) ф 0. Вектор-столбцы
к' — I ... 1 — решения системы уравнений Якоби.
\к)
Пусть /: К" -+ К — дифференцируемая функция п переменных.
Функцию
е(х,х') := !(х') -!(х) -Г{х){х -х)
назовем функцией Вейерштрасса функции /_. Геометрический смысл
функций Е таков: Е(х,х') — разность в точке х' между значением /
и значением аффинной функции, касательной к графику / в точке х.
Отсюда ясно, что если / выпукла, то Е(х,х') ^ 0. Можно показать, что
верно и обратное
Г(х)(х'-х)
Пусть Ь — интегрант простейшей задачи вариационного исчисления.
Функция
ЕA, х, х, и) := Ь^, х, и) — Ь{1, х, х) — Ь±^, х, х)(и — х)
называется функцией Вейерштрасса интегранта Ь. Таким образом,
ЕA,х,х,и) — функция Вейерштрасса функции х —> Щ,х,х), где 1,х
играют роль параметров. Говорят, что на экстремали х выполнено условие
Вейерштрасса, если
еA,х,х,и) = Щх,и)-Щх,х)-1ч(Щ11-хJ 0\/ и € К" V * 6 [*0> ^1
Геометрический смысл условия Вейерштрасса на экстремали х:
для любого фиксированного I € [<о> 1\\ график функции Ь = Ь{х) =
252 Глава 5. Условия второго порядка в вариационном исчислении
ЬA,хA),х) (как функции от х) лежит выше касательной к кривой Ь
в точке хA).
Если функция Ь{х) выпуклая по х для любых I, х, то условие
Вейерштрасса выполняется на любой экстремали х.
1.4. Необходимые и достаточные условия слабого
и сильного экстремума
Рассмотрим простейшую задачу вариационного исчисления для век-
вектор-функций х = (х\,... ,хп) (для определенности задачу на минимум)
^(x(■)) =
М;
= х0,
= хх.
(Р)
1.4.1. Игольчатые вариации. Условие Вейерштрасса
Понятие сильного экстремума ввел в вариационное исчисление Вей-
Вейерштрасс. Для доказательства необходимого условия сильного минимума
Вейерштрасс употребил специальные вариации экстремальной функции
х вида х\A) = хA) + к\A), где А > О,
- АД(«; г, 0 =
О,
*е[т-А,т],
* # [т - А, т
6 К").
О т-Х
1гх
т-Л
т+\/Л
Рис. 17
Производная вариации Н\{1) имеет вид, изображенный на рис. 17
(для удобства изображения взято п = 1, | > 0). При малом А она не-
несколько напоминает иголку, в связи с чем подобные вариации называют
§ 1. Простейшая задача вариационного исчисления 253
«игольчатыми». Такие вариации приспособлены к исследованию задач
на сильный экстремум. Игольчатые вариации несколько иного вида
использовались при доказательстве принципа максимума Понтрягина.
Очевидно, что жд() —> ж() в метрике пространства С([Ь0, ^],К")
при А —> 0.
С помощью игольчатых вариаций докажем условие Вейерштрас-
са — необходимое условие сильного минимума в простейшей задаче
вариационного исчисления на классе кусочно-гладких функций.
Теорема. Пусть функция ж б С1([*о, ^],К") доставляет сильный ло-
локальный минимум в задаче (Р) (ж € кЫостдп Р), и интегрант Ь не-
непрерывно дифференцируем в некоторой окрестности расширенного графика
Г,к = {(«,*(<),*(<)) | * 6 [*„, «1]}(ХЕ &{О{Г^))).
Тогда на ж выполняется условие Вейерштрасса
Е(т,Цт),Цт),Цт) + {) :=Ь(т,±(т),Цт) + $-Ь(т,&(т),А(т)) -
- &±(т,х{т),х{т)) >0 V !<ЕК", V т€[«о, М-
Нетрудно видеть, что выписанное условие Вейерштрасса является
тем же самым, что и в п. 1.3:
V пей", V *€[<о, *1],
где I = т, и = ж(т) + |.
Доказательство. Возьмем точку т 6 (<о, ^) П Т (случаи т = 10,1\
доказываются предельными переходами т —> 10, т —> 1\ в неравенстве).
Рассмотрим выписанную выше игольчатую вариацию жЛ(<) = х{1) 4- Н\{1)
функции ж. При достаточно малых А ^ 0 отрезок [т - А, т + л/А] С Т,
функция жд допустима в задаче на сильный экстремум (жд € П(Р(8))):
жЛ <Е РС\[10, *,]), хх(и) = Щ) + АЛ(*,-) = х{, г = 0,1. Очевидно, что
функция жд(-) —> ж(-) в метрике пространства С(Цо, ^^]) при А —> 0.
Поскольку ж 6 хШосгшпР, то функция одного переменного <р(\) =
^(xx) — ^(x + Н\) имеет минимум при А = 0, т.е. <р(\) ^ у@).
Отсюда следует, что если производная справа в нуле <р'(+0) существует,
то 1р'(+0) ^ 0. Вычислим <р'(+0). Поскольку функции хA) и жЛ(<)
совпадают при I 6 [<о, т — ^] и ( Е [т + л/А, I]] то, разбивая отрезок
интегрирования [10, I]] на четыре отрезка, имеем
А~>+0 Л А-*+0
- Нга { [(Щхх,хх)-Щх,Ь))<И= Ит |
А~>+0 А У V / А->+0 А
«О 1
254 Глава 5. Условия второго порядка в вариационном исчислении
г+\/Л
+ Шп - / (Щ хх, хх) - Щ х, &)) <# =: .7, + Зг-
А—*-гО А ^ \ /
По теореме о среднем для определенных интегралов .7} —+ Ь(т, х(т), х(т) +
|) - Ё(т) при А -+ 0.
Из условий гладкости, наложенных на интегрант Ь, вытекает
дифференцируемость по Фреше отображения Ь: С1([т, т + л/А],К") —>
С([т, т + л/А],К"), действующего по формуле Ь(х(-)) = Ь{1,хA),хA)).
По определению дифференцируемости по Фреше
Цхх)-Цх) = Ц
где ||г(ЛЛ)(-)|1с([гг+^]) = °A1ла('I1сЧ[гг+^])) = °№)> так как
Поэтому
г+у/Х
Зг = Нт -
А->+о А
т+у/Х
+/ +
= Нт - ( Ьх({\-A-т){у/\)A1+ Нт - /
X—^-^0 А ^ X—^+0 А ,/
Шп - / г(Ад) <И =: Ах + А2 + А3.
А—»+0 А ^
Используя теорему о среднем для определенных интегралов, найдем
величины АиА2,А^:
А~>-0 ]
т+у/\
- Нт -1=
А~>+0 -^Л У
т
а2 = -дн
§ 1. Простейшая задача вариационного исчисления
т+у/Х т+\/Х
о(у/\)
255
■ 0 => А-х = 0.
В итоге, Зг = -к(т){ и <р'(+0) = Цт,Цт),&(т) + €)-1{т)-1±(тН > 0.
Нетрудно видеть, что выписанное условие Вейерштрасса является тем же
самым, что и в формулировке теоремы, где I = т, и — &(т) +1. Условие
Вейерштрасса доказано. ■
В задаче на максимум условие Вейерштрасса меняет свой знак.
Ниже условие Вейерштрасса будет выведено из принципа максимума
Понтрягина.
1.4.2. Игольчатые вариации. Аналог условия Вейерштрасса.
Для доказательства необходимого условия сильного минимума рас-
рассмотрим специальные вариации экстремальной функции &. Пусть точка
т 6 [*0, *1 ] и произвольные числа (_,г} > 0 фиксированы. Положим
= *(*) +Ад(*),вде А^О,
ЛЛ(«) =
■ |Л + A - тI
|А - (< - т)т
0,
\ *
1, *
1
е[г
-А,
т +
-А,
г],
А|1
т +
г-А
Рис. 18
256 Глава 5. Условия второго порядка в вариационном исчислении
Для доказательства необходимого условия сильного минимума (условия
Вейерштрасса) Вейерштрасс использовал такие вариации с г} — |л/А.
Производная вариации Н\{1) имеет вид, изображенный на рис. 18. При
малом А производная функции Лд несколько напоминает иголку, в связи
с чем подобные вариации называют «игольчатыми». Такие вариации
приспособлены к исследованию задач на сильный экстремум. Игольчатые
вариации несколько иного вида использовались при доказательстве
принципа максимума Понтрягина.
Теорема Пусть функция ж Е РС'([<о, ^^]) доставляет сильный ло-
локальный минимум в задаче (Р) (ж Е зМостт Р), интегрант Ь непре-
непрерывен в некоторой окрестности множества расширенного графика Г^
{Ь Е С(О(Г^))), Т С [<о, 1\\ — множество точек непрерывности функ-
функции х. Тогда на х выполняется условие
т)Цт, Цт), Цт) + О+СЦт, Цт), Цт) -т,)-(С + п)Цт, Цт), Цт)) > О
Доказательство. Возьмем точку т Е (<о, ^\) П Т (случаи т = 1й,1х до-
доказываются предельными переходами т —> 1й, т —> ^ в неравенстве G)).
Рассмотрим выписанную выше игольчатую вариацию х\A) = хA) + Н\A)
функции х. При достаточно малых А ^ 0 отрезок \т - X т + — С Т,
I п 1
функция жд допустима в задаче на сильный экстремум (жЛ Е
жЛ Е РС!([^о, ^]), жд(^) = х(и) + Лд(*,-) = x^, г - 0,1. Очевидно, что
функция жд(-) —> ж(-) в метрике пространства С([<0, ^]) при А —> 0.
Поскольку ж Е хЙоспппР, то функция одного переменного <р(\) =
^(x\) = ^(x + Лд) имеет минимум при А — 0, т.е. <р(Х) ^ <р@)-
Отсюда следует, что если производная справа в нуле у'(+0) существует,
то <р'(+0) ^ 0. Вычислим 1р\+0). Поскольку функции хA) и жЛ(<)
совпадают при I Е [<о, т - \\ и I Е г н ,1Л то, разбивая отрезок
интегрирования [<о, 1\\ на четыре отрезка, имеем
А-»+0 А А~>+0
Нт - / (ьA,хх,хх) -ЬA,х, ее)) <й =
А—* Н" 0 А у »■ '
(итегралы на промежутках интегрирования [<о, т — А], \т -\ , 1А
обращаются в ноль)
§ 1. Простейшая задача вариационного исчисления 257
х~+о\ ] \ у> л> '*' ч V л-ч-о А
т-Х ^"*~
(по теореме о среднем для определенных интегралов)
= Цт,Цт), Цт) + О - Цт) + - Ыт,х(т), Цт) - т?) - Цт)) > О
7/\ /
(умножим обе части неравенства на г/)
^ т}Цт,Цт),Цт) + 0+ Щт,Цт),Цт) - т?) - (| + т,)Цт) > О
V |, т/ > О, V т 6 Т. ш
Геометрический смысл условия G) на экстремали х: для любого
фиксированного < ЕГ точка (хA),Ь^,Щ),*(<))) лежит ниже любой
хорды с концами по разные стороны от х графика функции Ь — Ь(х) —
Щ,ЦЬ),х) (как функции от х).
Действительно,
(первое соотношение — это просто тождество, проверяемое сложением
дробей, второе соотношение получается, если разделить обе части
условия G) на ^ + т/).
Для выпуклой функции Ь(х) условие G) будет выполняться на
любой функции х 6 РС1([1о, ^^])■
Если Ь — дифференцируемая в точке х функция, то из условия G)
вытекает условие Вейерштрасса.
1.4.3. Необходимые условия сильного экстремума.
Теорема 1. Пусть функция х 6 С1 (^0, ^^],Кп) доставляет сильный
лдкальный минимум в задаче (Р) (ж б хЫосттР), интегрант Ь непрерывно
дифференцируем в некоторой окрестности расширенного графика Г$% (Ь Е
С1 (О(Г^))). Тогда на х выполняется уравнение Эйлера и удовлетворяется
условие Вейерштрасса
Е{1,х,х,и) = Ц1,х,и)-Ц1,х,х)-Щ1)(и-х) ^ОУ и € К", V < 6 [1о,1х\.
258 Глава 5. Условия второго порядка в вариационном исчислении
Если при этом существует Ьц{1) V I <Е [^о> 1\]> т° выполняется также
условие Лежандра: 2цЦ) ^ О V I € [<0> ^]-
Доказательство. Формализуем задачу (Р) как задачу оптимального
управления
и
I Ц1,х,и)й1 —у шГ; х = и, хA0) = х0, хA\) — хх. (Р1)
к
Условие х € зМостшР равносильно тому, что пара (х,й), где
йA) = х{1), является оптимальным процессом в задаче оптимального
управления (Р1). Поэтому согласно принципу максимума Понтрягана
найдутся множители Лагранжа АО,АЬА2 и р(-) 6 РСх([1й, 1Х\), А ф О,
и такие, что для функции Лагранжа задачи [Р')
/ (ХоЦ13х,и) +рЦ)(х - и))
А-
«о
выполняются условия:
Л ~.
а) уравнение Эйлера: -— рЦ) + \йЬхA) = О V I € [<о,
Ь) трансверсальности по х: рA0) = Аь р(^) = -А2;
с) оптимальности по и:
с!) неотрицательности: Ао ^ 0.
Если Ао = 0, то из с) (поскольку минимум конечен и равен -рA)хA))
вытекает, что рA) = 0, тогда из Ь) — что все множители Лагранжа
нули. Значит, Ао ф 0. Полагаем в задаче на минимум Ао = 1. Тог-
Тогда из с) по необходимому условию I порядка минимума функции
/(и) = ЬA,хA),и) - р{1)и следует, что /'(и) = 0 «■ Ьх{1) = р{1), а по
необходимому условию II порядка ЬцA) ^ 0 V I € [^о ^]- Подставляя
р = Ь± в условие стационарности по х, получаем уравнение Эйлера.
Условие оптимальности по и при Ао = 1 и р = Ьх
ЬA,Щ.и) -1±{1)и ^ ЬA,Щ,х{1)) -1±{1)х{1) V и е К", V * 6 [*0, ^]
есть не что иное, как условие Вейерштрасса. ■
§ 1. Простейшая задача вариационного исчисления 259
1.4.4. Лемма о округленны углов
Лемма. Пусть функция х 6 РСх{\10, ^],К"), интегрант Ь 6 С(К2п+1).
д д {}
{
Тогда существует последовательность гладких функций
С1([10,11],К"), хкA0) = хA0), хкA{) — хAу), такая, что хк(-)
в метрике пространства С([1о, ^]), и Ит Л(хк) = Л(х).
кюо
6
ж(-)
к-юо
Доказательство. Для простоты записи проведем доказательство для
п = 1. Возьмем функцию
О,
Щ > 1.
-1
-1/2
1/2
Рис. 19
Она непрерывна, а ее производная при < = 0 имеет скачок вели-
величины -1, |А(*)| ^ 1/4, |А(*)| < 1/2. Пусть т% 6 (^,/1), * = 1,...,то, -
точки разрыва производной х и А,- = ж(т; + 0) - ж (г,- - 0) — ее скач-
скачки в этих точках. Функция Л*(-,т;) = -Л(&(- - т,)), график которой
получается из графика функции Н преобразованиями подобия и сдви-
сдвига, также непрерывна, и ее производная непрерывна, кроме точки т*,
где она по-прежнему имеет скачок -1, кроме того |Л*(<, т,-)| < \/{Щ,
т
Тогда функция ж^(<) = хA) + ^ А,Лй(^, п) непрерывна вместе со сво-
1=1
ей производной на отрезке [10,1\], причем хк{1) = хA) вне отрезков
[г,- - \/к, т{ + \/к]. В частности, для достаточно больших к эти отрезки
не перекрываются, хкAй) = хЦ0), хкA{) = хA\),
\хкA)-хЦ)\ =
1=1
■ 0 при к —► +оо,
Д
7
260 Глава 5. Условия второго порядка в вариационном исчислении
Г А . А-1
На компакте < A,х,х) \ 10 < < < 1\, \х-хA)\ < —-, \х — ж(*)| < — >,
*• 4гео 2 '
непрерывная функция Ь ограничена: \ЬA,х,х)\ < М. Поэтому
Щхк,хк)<И- У Щх,х)<И
а1
Шт
при к > «о
и, следовательно, ^(x|.) —*■ ^{x) при к —*■ +оо. ■
Следствие. Абсолютный экстремум в задаче (Р) на сильный и слабый
экстремум совпадают: 581ГаЬ5ттР =
Для локальных экстремумов это может быть не так (см. п. 1.2).
1.4.5. Необходимые условия слабого экстремума
Теорема 2. Пусть функция х 6 С2([<0, ^],К") доставляет слабый
локальный минимум в задаче (Р) (х Е \у1остшР), интегрант Ь трижды
непрерывно дифференцируем в некоторой окрестности расширенного гра-
графика Гы (Ь € С (О(Г±-.))). Тогда на х выполняется уравнение Эйлера,
условие Лежандра и, если на экстремали х выполнено усиленное условие
Лежандра (Ьц{1) > 0 V I 6 [<<ь 1\\), то выполняется и условие Якоби,
т.е. на интервале (<о, 1\) нет сопряженных точек.
В задаче на максимум условие Лежандра меняет свой знак.
Доказательство. Для простоты записи проведем доказательство для
п= 1.
1) Вывод уравнения Эйлера и условия Лежандра. Поскольку функ-
функция х 6 \у1осгатР, то для любой функции Н € С^фо, ^]) функция
уз(А) = ^{x{^) + АЛ(-)) имеет локальный минимум в нуле. Тогда по не-
необходимому условию минимума функции одного переменного <р'@) = 0
и <р"@) ^ 0. В главе 3 п. 1.3 было показано, что первое условие равно-
равносильно выполнению уравнения Эйлера на функции х. Второе условие
эквивалентно неотрицательности функционала
*1
= [
) ХХ(){1)) <Я ^ 0
V к е с10([10, и]).
§ 1. Простейшая задача вариационного исчисления
261
Из неотрицательности и вида функционала К следует, что функция
= 0 доставляет абсолютный минимум (слабый) в задаче
К(Щ)) = I (Ъцк2 + 2Ьххкк + Ьххк2) ЛЬ -> М; кA0) = Щ) = 0. (Р")
По следствию из леммы о скруглении углов функция к = 0 доставляет
в задаче (Р") и сильный минимум. Тогда в силу теоремы 1 о необходимых
условиях сильного минимума в задаче (Р") на к выполняется условие
Лежандра для интегранта
т.е. Ьдд(^) ^ 0 <» Ъц($) > 0 V * € [*о> *!]- Таким образом, условие
Лежандра в задаче (Р) выполнено.
2) Вывод условия Якоби. Предположим противное, что условие Якоби
не выполнено, т. е. существует точка т € (<о> ^) и нетривиальное (к ^ 0)
решение к € С^о, г\\) уравнения Якоби, для которого Що) — к(т) = 0.
Отметим, что из нетривиальности решения к однородного линейного
дифференциального уравнения второго порядка с условием к(т) = 0
вытекает, что к(т) ф 0. Положим Щ) — < „^ '' °~^ ^ ' Так как
функция к удовлетворяет уравнению Якоби, то после интегрирования
по частям получим
к{Ц))=1"BЙ
'о
г
= / [1м
т
■к + 2Ьххкк + Ь
.к2 + гххкп+гх
к+гххк)кл1+
хк2^ Л1 =
<и =
т
/ \2х±к + ьххк
т
+ /( -—
к
Таким образом, К(к) = 0, а это означает, что к € аЬхгшпР" (наряду
с функцией к = 0). Проводя рассуждения, аналогичные проведенным
в теореме 1, получим, что найдется функция р € РС1([1о, ^]) такая, что
262 Глава 5. Условия второго порядка в вариационном исчислении
для лагранжиана квадратичной задачи ЪA, к, к) = Ьцк2 + 2Ь^хкк + Ьххк2
на экстремали к выполняется уравнение
Поскольку кA) = О при I > т, то р(т + 0) = 0 и в силу непрерывности
функции р
0 = р(т-0) = 21ц{т)к{т - 0) = 2Ьц(т)к(т) = 0,
откуда к(т) = 0 (ибо Ьц{т) Ф 0 из-за усиленного условия Лежандра).
Мы пришли к противоречию с условием к(т) ф 0. Таким образом,
предположение противного неверно и условие Якоби выполнено. ■
1.4.6. Поле экстремалей
Рассмотрим простейшую задачу вариационного исчисления
Цх(-)) = / ЬA,хA),Щ) <й ->шГ; хA0) = х0, хAх) = хх. (Р)
к
Полем экстремалей в задаче (Р) называется множество (иногда
говорят «семейство») экстремалей {ж(-,А)}, ж(-,-) 6 С1([10, ^] х Л,К"),
с параметром А б Л б О(К") (о А — некоторое открытое множество
в пространстве К"). (Напомним, что экстремаль — это функция,
удовлетворяющая уравнению Эйлера.)
Если для поля экстремалей существует точка (^*,ж*) такая, что
ж(<*,А) = ж, для всех А Е Л, то это поле называется центральным полем
экстремалей, а точка (<*,ж*.) называется центром поля экстрема/гей.
Пусть х — допустимая экстремаль в задаче (Р) (т.е. экстремаль
с заданными в задаче граничными условиями). Говорим, что экстремаль
х включена в поле экстремалей {ж(-,А)}, если х(-) = х(-,Х) при некото-
некотором А б Л. Говорим, что экстремаль х, включенная в поле экстремалей,
окружена полем экстремалей, если существует окрестность С графика
Г± такая, что для любой точки (т, ^) из этой окрестности имеется
единственная экстремаль семейства, проходящая через эту точку; причем
функция А: С —* К", А = А(т,^), должна быть класса С1 (С). Единствен-
Единственность экстремали, проходящей через точку (г, ^), означает, что по точке
(г, ^) Е С значение А = А(т, ^) отыскивается единственным образом.
Функция и: С -> К", и(т,Л = —хA,\(т,(,)) =: х(т,Х(т,П) на-
ах 1=т
зывается функцией наклона поля. Отметим, что на экстремали х функция
наклона поля иA, хA)) = х{1) совпадает с производной функции х{1).
§ 1. Простейшая задача вариационного исчисления 263
Пример (гармонический осциллятор).
ч
/
(ж2 - х2) <й -> лип; хA0) = х{1х) = О @ < 10 < 1\ < ж).
Уравнение Эйлера х + х = 0. Экстремали этого функционала имеют
вид хA) = С^$т^ + Сгсок^. Допустимая экстремаль хA) = 0. Совокуп-
Совокупность экстремалей хA,Х) = Айп^ есть центральное поле экстремалей
с центром в точке @,0), включающее, в частности, экстремаль х при
А = 0, покрывающее полосу 0 < I < ж.
Найдем экстремаль поля, проходящую через точку (т, ^) @ < т < ж):
х(т,Х) ={& Аш1Т = ^<» А = -Д— =>ж(г,А(т,^)) = -Д— $Ш. Функция
Л
81ПТ 81ПГ
наклона поля и(т, ^) = —хA, А(т,
л
1=т &1 8Ш Т
*=г
Построение центрального поля экстремалей
Теорема. Пусть х € С2([1о, ^],К") — допустимая экстремаль в зада-
задаче (Р) (х (Е ОЕ(Р)), интегрант Ь трижды непрерывно дифференцируем
в некоторой окрестности расширенного графика Г^ (Ь € С3 (О(Г^))),
на х выполнены усиленные условия Лежандра и Якоби. Тогда х можно
окружить центральным полем экстремалей.
Доказательство. Распишем уравнение Эйлера
-—ЬхA,х,х) +ЪхA,х,х) = 0 <=$■ Ьцх + Ь^х + Ьц - Ьх — 0. A)
Так как выполнено усиленное условие Лежандра, то есть неравенство
1чх{1) > 0 V I € [^о, *1], то в силу непрерывности функции Ьц
(напомним, что Ь € С3) найдется такое V € О(Г^), что ЬцA,х,х) >
0 V (<, х,х) б V'. Значит, в Области V уравнение Эйлера A) равносильно
системе, разрешенной относительно производных
где Ф(*, х, у) := Ь^,х, у) [ЬхA, х, у) - ЬцA,х, у) - ЬАхA, х, у)у).
В силу заданной гладкости интегранта Ь функция Ф непрерывно
дифференцируема в окрестности V'. Тогда по теореме существования
и непрерывно дифференцируемой зависимости решения от начальных
данных (Гл. 4, п. 1.3) найдутся такие е > 0 и 6 > 0, что
а) решение х продолжимо на отрезок [10 - е, 1\ + е];
264 Глава 5. Условия второго порядка в вариационном исчислении
Ь) для любого А е Л:= {А 6 К" | |А| < 6} на отрезке [10 - е,1г + е]
определено решение х(-,Х) уравнения Эйлера с начальными данными
ж(г„, А) = ж(<*), ж(<„, А) = ж(<*) + А, где I* — некоторая точка интервала
(*о -е, г0)-
При этом функция х{1,\) непрерывно дифференцируема как функ-
функция двух переменных (ж(-,-) 6 С'([*о — е,Ь\ + е\ х Л,К")). Значит,
множество экстремалей {ж(-,А)}, А 6 Л, является полем экстремалей
(даже центральным). В силу единственности решения дифференциаль-
дифференциального уравнения ж(-,А) = х при А = 0, т.е. экстремаль х включена в
поле экстремалей {ж(-,А)}. Покажем, что экстремаль хA), при I 6 {10,1Х]
окружена этим центральным полем экстремалей. Положим
дХ
тогда
д
~дх
д / д
А=--0
А=0
А=0
д
,3 =
Поскольку ж(<, А) — экстремаль для любого А, |А| < 6. то, дифферен-
дифференцируя уравнение Эйлера A) по А и меняя порядок дифференцирования
в первом слагаемом, получим
0= -^(-
' 9
А=о хх дХ"
- д
= 0
Значит, матрица Я(-,<*) удовлетворяет уравнению Якоби с начальны-
начальными условиями Я(<„,<„) = 0, Я(<*,<*) = /. Пусть НA,1$) — матричное
решение уравнения Якоби с условиями НAо,1$) = 0, Я(<о,^о) = I-
Поскольку выполнено усиленное условие Якоби, то не существует не-
нетривиального решения к уравнения Якоби, удовлетворяющего условиям
Що) = Н(т) = 0, 10 < т < 1Х. Таким образом, усиленное условие Якоби
равносильно невырожденности матрицы НA,1о) при любом I Е (<о, 1\\.
§ 1. Простейшая задача вариационного исчисления 265
Но тогда снова в силу глобальной теоремы существования и непре-
непрерывной зависимости решения от начальных данных [АТФ, с. 195] при
достаточной близости I* к 1$ матрица НA, <*) будет невырожденной для
любого I б [<о, 1\\-
Рассмотрим функцию Ф: Кп+1 —*■ Кп+1, действующую по формуле
Ф(т,А) = (т,х(т,Х)), для т 6 A0-е,1\ + е), А б Л. Функция Ф
переводит точки (г,А) в точки (т,|), где | = х(т,А). При этом
$A,0) = A,хA,0)) = Ц,хA)) и якобиан1'
ск*Ф' . _, = йе1 ( ... _. _,.„,)= й<*ххA,0) = йе1Н0;,и) ф О
при I б [<о, ^]- По теореме об обратной функции (для каждой фикси-
фиксированной точки I Е [<о> 1\]) существуют функция Ф~' и число 6 > О
(зависящие от I) такие, что Ф~'(г,|) = (г, А) для любой точки (т,|), для
которой \1-т\ < 6, \Щ)-{\ < 6, и Ф(г, А) = (г, ж(г, А)) = (г,|). Обратная
функция сопоставляет точке (г, |) точку (г, А) единственным образом.
Поэтому существует единственное А = А(г,|) (зависящее от I) такое,
что х(т, Х(т, |)) = |. Значит, экстремаль ж(-,А) действительно проходит
через точку (г, |) и она из поля экстремалей определяется единственным
образом.
В силу компактности графика Г& = {A,х{Ь)) 6 К"+1 | I б [<о> *\]}
(из любого открытого покрытия компакта можно выбрать конечное
подпокрытие) можно найти одно 60, такое, что для любой точки (г,|),
для которой т 6 [<(ъ ^]> \х(т) - || < <$о> существует (и, как нетрудно
понять, единственное) А = А(г,|) (не зависящее от I) при котором
х(т, А(т, |)) = |. При этом гладкость функции А такая же, как гладкость
поля {ж(-,А)}, т.е. С1. ■
Замечание. Пусть х = 0 является допустимой экстремалью в за-
задаче (Р). В условиях предыдущей теоремы для окружения ее цен-
центральным полем экстремалей достаточно взять семейство функций
ж(,А) = Я(-,г*)А, где и < 1й настолько близко к 10, что матрица
*) невырождена при <о ^ I ^ ^ь Это поле покрывает всю полосу
<<,. Кроме того
х(т, А) = | 4* Н(т, *Ф)А = | 4* А = А(т, I) = Я (г, 1,){ 6 С1.
1>Для отображения /: К" -♦ К", /(хь...,х„) = (/1(хи...,хп),.. .,/„(хь.. .,х„)),
(9/1 9/1
9х; 9хя
дх{ " Л
266 Глава 5. Условия второго порядка в вариационном исчислении
Функция наклона поля и(т,|) = —хA, А(т,|)) = Й(т, <*)А(т,А =
0.1
1=т
5-функция и ее дифференциал
Пусть х(-, А) — дважды непрерывно дифференцируемое центральное
поле экстремалей с центром (<*, ж„), окружающее допустимую экстремаль
ж(-), и интегрант Ь — трижды непрерывно дифференцируем в некоторой
окрестности расширенного графика Г^ (Ь 6 С3(О(Г^))). Функция
I,
называется 5-фунщией центрального поля х(-,Х). Найдем дифференциал
5-функции. Он понадобится нам для вывода основной формулы Вейер-
штрасса при доказательстве достаточных условий сильного экстремума.
Для нахождения частных производных 8-функции нам понадобятся не-
некоторые соотношения. Имеем по определению поля и функции наклона
поля
Дифференцируя обе части этого тождества по т, получим
х(т,\(т,О) + хх(т,\(тЛ))\т(т,0 = 0 =>
=> -хх\т = х(т,Х(т,О) =и(т,0 (т)
(и(т, |) — функция наклона поля). Дифференцируя обе части тождества
по |, получим
(I — единичная матрица). Поскольку (<*, ж*) — центр поля, то ж(<*. А) =
ж*, и, значит, выполняется следующее соотношение
д8
Найдем —, дифференцируя по г интеграл с переменным верхним
от
пределом, и используя непрерывность х\, вытекающую из того, что
х(-, А) 6 С2. Имеем
§ 1. Простейшая задача вариационного исчисления 267
, х (I, А(г, О), х (I, А(г, |)) ) хх (*, А(г, *)) Ат(г,
+ / (Ьххх\т + Ьххх\т) <# = Ь(т,{, и)+ I Ьххх\т <И + / Ь± йхх\т =
I, и и
- Цт,|,и) + ЬхХхК + I у ~ -тЬх + Ьх)ххК <И =
и
(Т)^] Ъ (г, |, и(т, О) - Ък (г, |, „(г, О) п(т, О-
При выводе мы воспользовались тем, что функции ж(-, А) — экстремали,
т. е. удовлетворяют уравнению Эйлера.
^ 98
Формула для — выводится аналогично. Дифференцируя по |,
°€
получим
т т т
— = / (Ьххх\{ + 1лх\\[) <й = / Ьххх\( й1+ Ьх йххХ( =
и
Таким образом, имеет место следующая формула для дифференциала
функции 5:
88 Э8
'я> дт д{ Я
Основная формула Вейерштрасса
В частности, для функции х б РС'([<0, ^],К") формула для диффе-
дифференциала функции 5 примет вид:
268 Глава 5. Условия второго порядка в вариационном исчислении
В таком виде мы ей и будем пользоваться в дальнейшем. Отметим также,
что, поскольку иA,хA)) = хA), то
B)
Поэтому
и и «1
./(ж) = AA)<И = [Щ1,Щ) = 5D1,ая) - 8Ц0,х0) = Iй8A,х{1)).
Следовательно, по формуле A)
«1
1
./(ж) - ^(x) = I 1A, хA), хA)) <И- I Л8A, хA)) =
к
«о
( )) Л =
к
Эту формулу называют основной формулой Вейерштрасса.
1.4.7. Достаточные условия слабого экстремума
Теорема 3. Пусть функция х Е С2([^о, ^1],К") — допустимая экс-
экстремаль в задаче (Р), интегрант Ь трижды непрерывно дифференцируем
в некоторой окрестности расширенного графика Г^ (Ь б С3(О(Г^))),
на х выполнены усиленные условия Лежандра и Якоби. Тогда х доставляет
слабый локальный минимум (х Е МосттР) [АТФ, с. 377].
1.4.8. Достаточные условия сильного экстремума
Теорема 4. Пусть функция х б С2(\1$, 1\\,К") — допустимая экстре-
экстремаль в задаче (Р), интегрант Ь 6 С3(У х К"), где V С К"+1 — некоторая
окрестность графика Г&, на х выполнены усиленные условия Лежандра
и Якоби, интегрант Ь является выпуклым по х на V. Тогда х доставляет
сильный локальный минимум (х Е 81г1осгшпР).
Доказательство. Условия теоремы позволяют (см. п. 1.4.5) окру-
окружить х центральным полем экстремалей ж(-,А), покрывающим не-
некоторую окрестность V С V графика Г±. Пусть х 6 РСх([1й,1\\) —
§ 1. Простейшая задача вариационного исчисления 269
произвольная допустимая функция, график Гх которой расположен
в этой окрестности. Тогда по основной формуле Вейерштрасса п. 1.4.6
«1
к
Из выпуклости интегранта следует (см. п. 1.3), что если точка (I, х) 6 V,
то ЕA,х,и,х) ^ 0 для любых (и,ж) б К" х К".
к
Таким образом, / Е{1,хA),и{1,хA)),хA))д,1 ^0 и, значит, ./(ж) ^
«о
^{x), т.е. функция х доставляет сильный минимум. ■
1.4.9. Квадратичный функционал
Рассмотрим задачу простейшую задачу вариационного исчисления с
квадратичным функционалом для вектор-функций ж(-) = (ж^),..., х„())
^(x(■)) = [{{Ах,х) + 2{Сх,х) + (Вх,х)) (И -+ Ы;
к
хA0)=х0, хA^)-хи 1 (Р1)
на слабый и сильный экстремум. Здесь АA),ВA),СA) — матрицы
порядка п х п, А,В — симметричные матрицы2'.
Теорема 5. Пусть в задаче (Р1) матрицы А и С непрерывно диф-
дифференцируемы, а В непрерывна; выполнено усиленное условие Лежандра.
Тогда, если выполнено усиленное условие Якоби, то допустимая экстремаль
существует, единственна и доставляет абсолютный минимум. Если же
не выполнено условие Якоби, то значение задачи равно — оо (^ь^ат = — оо).
Заметим, что по лемме о скруглении углов абсолютный минимум
и сильный, и слабый совпадают.
Доказательство. Отметим вначале, что для квадратичных функцио-
функционалов имеет место равенство
3'(х)[Ъ\ + ^"(х)[Н, к].
'Квадратичную относительно 2га-мерного вектора Н = (х,у) (х € К", у € К")
форму на пространстве К можно представить через симметрическую матрицу М
) {)
ру р р р
размера 2п х 2п в виде ф(й) = {МН,Н). Тогда матрицу М можно записать в виде
(А С* \
„ и ) ' где матриды А и В являются симметрическими, а матрица С
не обязана быть симметрической. Значит, квадратичная форма запишется в виде
(Ву, у) = (Ах, х) + 2(Сх, у) + (Ву, у).
270 Глава 5. Условия второго порядка в вариационном исчислении
Если х — допустимая экстремаль в задаче, то 3' (х) [к] — 0 V Ь, 6
Со([<о, ^]) (это соотношение, как было доказано ранее, эквивалент-
эквивалентно уравнению Эйлера). Поскольку для квадратичных функционалов
-У(х)[к,к] = ./(/г), то на экстремали х выполняется соотношение
з(х + н) = з(х) + цн) У не с1(К *1]). (*)
Предположим выполнено усиленное условие Якоби. Обозначим НA,1о),
Я(^,<1) — матричные решения уравнения Эйлера (совпадающего для
квадратичной задачи с уравнением Якоби), удовлетворяющие крае-
краевым условиям НA0,1а) — 0, НA0,10) = /, Н{1и1х) — 0, НAЪ1Х) = I.
Из усиленного условия Якоби вытекает, что матрицы НA,10) и Н(Ь,Ь{)
невырождены для I 6 (<о> 1\\ и \и, 1\) соответственно. Положим
Тогда Яо(*о) = 7' ЩЬ) = °. Я1^о) = 0, Я,(*!) = /, и, значит,
х{1) = ЩA)х0 + Н\{1)х1 — допустимая экстремаль в задаче (Р1). Эта
экстремаль единственна, поскольку если существовала другая допустимая
экстремаль х, то функция к = х - х была бы нетривиальным решением
уравнения Якоби с граничными условиями /г(<0) = Щ\) = 0, а это
противоречит усиленному условию Якоби.
Экстремаль х можно (см. теорему о построении центрального поля
экстремалей) окружить центральным полем экстремалей, покрывающем
полосу <о ^ I ^ ^1 с функцией наклона поля и(т, |). Возьмем произволь-
произвольную допустимую функцию х Е С'^о, ^^])^ Тогда по основной формуле
Вейерштрасса
Цх) - Цх) = I ЕA, хA), иA, хA)), хA)) Л =
к
«1
=-- / [ЬA,х,х) - Ц1,х,иA,х)) - {Щ1,х,иA,х)),х- иA,ж)})<й =
к
(для квадратичной функции Ь(х) - Ь(и) - Ь'(и)(х - и) = (-Ь"(и)(х - и),
(х-и)))
= / (-1цA,х,и)(х - и),х - и) <И = I (А(Щх-и),х-и)<Ы ^ 0,
§ 1. Простейшая задача вариационного исчисления 271
ибо А{1) — положительно определенная матрица по усиленному условию
Лежандра. Значит, функция х б аЬлптР'.
Предположим, что не выполнено условие Якоби. Тогда функция
к = О (? аЬхгшпР" не доставляет абсолютный минимум в задаче
«1
1
^(ц■)) = Г((ан,н) + 2(сн,н)
Л(*о) = Л(*0 = О (Р")
(если йеОе аЫхгйпР", то по теореме о необходимых условиях слабого
минимума выполнено условие Якоби). Значит, ЗаЬзтшя" ^ ^- Поэтому
существует функция Ь, е ^([^о, ^]) такая, что 3(Щ < 0. Но тогда в силу
соотношения (*) 3{х + А/г) = ./(ж) + ^(XН) = 1{х) + \21(Н) -► -оо при
А -► +оо, т. е. 5аЬ5т|пр, = -оо. ■
1.5. Правило решения
Для решения простейшей задачи классического вариационного ис-
исчисления с использованием необходимых и достаточных условий экстре-
экстремума следует:
1. Найти допустимые экстремали, т.е. допустимые функции, удо-
удовлетворяющие необходимым условиям экстремума I порядка. Для этого
надо
а) Выписать необходимое условие экстремума I порядка — уравнение
Эйлера:
Л
- —1« + 1* = 0.
ох
Ь) Найти решения этого уравнения (они называются «экстремаля-
«экстремалями»),
с) Найти решения уравнения Эйлера, удовлетворяющие заданным
условиям на концах (они называются «допустимыми экстремалями»).
2. Проверка необходимых и достаточных условий экстремума II по-
порядка.
а) Проверить выполнение условия Лежандра:
Если ЬцA) ^ О V I б [<о> ^1] (выполнено условие Лежандра), то
значит, выполнено необходимое условие слабого (а, следовательно,
и сильного) минимума.
Если Ьц{1) < О V I 6 [<0) ^] (выполнено условие Лежандра), то
значит, выполнено необходимое условие слабого (а, следовательно,
и сильного) максимума.
Если же величина Ьц(Ь) знакопеременна на отрезке [10, Ьх\ (не вы-
выполнено условие Лежандра), то значит, не выполнено необходимое
условие слабого (а, следовательно, и сильного) экстремума. В этом
случае найденная допустимая экстремаль не доставляет слабого, и тем
более, сильного экстремума.
272 Глава 5. Условия второго порядка в вариационном исчислении
Если 2цA) > О V I 6 [10, ^] или 2цA) < О V I 6 [10, Ь] (выполнено
усиленное условие Лежандра), то значит, выполнено необходимое усло-
условие слабого и сильного минимума, соответственно максимума. В этом
случае переходим к исследованию условия Якоби.
Ь) Проверить выполнение условия Якоби:
1>1) Выписать интегрант квадратичного функционала
1A, Н, к) := 1цA)Н2A) + 21^A)НA)ПA) + 1ХХA)Н2A).
Ьг) Выписать уравнение Якоби на экстремали х, т.е. уравнение
Эйлера для интегранта 1,A, К, К):
и решить его с начальными данными НAо) = О, Що) = 13\
Ьз) Найти сопряженные точки т, т. е. нули найденного решения кA)
уравнения Якоби при 1>10.
Ъ^) Проверить выполнение условия Якоби:
Если в интервале Aо, 1\) нет точек, сопряженных с 1о (выполнено
условие Якоби), то значит, выполнено необходимое условие слабого
(а, следовательно, и сильного) экстремума.
Если же в интервале (<0, и) есть сопряженные точки (не выполнено
условие Якоби), то значит, не выполнено необходимое условие слабого
(а, следовательно, и сильного) экстремума. В этом случае найденная
допустимая экстремаль не доставляет слабого, и тем более, сильного
экстремума.
Если в полуинтервале (<о, ^] нет точек, сопряженных с 1^ (выполнено
усиленное условие Якоби), то значит, выполнено достаточное условие
слабого экстремума. Следовательно (напомним, что уже выполнено
усиленное условие Лежандра), найденная экстремаль доставляет слабый
локальный минимум (если ЪцA) > О V I 6 Цо, ^]) или максимум (если
^^@ [, .])
Проверка на сильный экстремум.
с) Если интегрант Ь является выпуклым по х при всех фиксиро-
фиксированных (и г, рассматриваемых в качестве параметра, то х доставляет
'Для вектор-функций х(-) = (х1(-),...,х„(-)) ищется фундаментальная система ре-
/*}(*) ... Л?(*)\
I
шений уравнения Якоби — матрица Н(г) = [к (г) ■. ■ Л (<) 1 =
с начальными условиями НA$) = 0 (нулевая матрица), Я(*о) = / (единичная матрица)
( К(-) \
или де(Я(*о) ф 0. Веклвр-сголбцы й'(-) = I ... I — решения системы уравнений
Якоби. Сопрялсенными точками будут точки т — нули уравнения йеХН(т) = 0.
§ 1. Простейшая задача вариационного исчисления 273
сильный минимум в задаче. Аналогично, если интегрант Ь является
вогнутым по ж, то ж доставляет сильный максимум в задаче.
с!) Если интегрант Ь не является ни выпуклым, ни вогнутым, то
следует проверить выполнение необходимого условия сильного экстре-
экстремума — условия Вейерштрасса:
8A, х, х, и) = Ц1, х, и) - ЬA, х, х) - ЬхA)(и - х) ^ О
V и 6 К, V * 6 [*о, *1]
в задаче на минимум (Е ^ 0 в задаче на максимум).
Если не выполнено условие Вейерштрасса, то в этом случае найден-
найденная допустимая экстремаль не доставляет сильного экстремума.
1.6. Примеры
Пример 1.
Исследуем с помощью условий второго порядка задачу, рассмотрен-
рассмотренную нами в п. 1.2:
1
1{х(-)) = I хгА1-+ М; х@) = О, хA) = 1.
о
Мы выяснили ранее, что имеется единственная допустимая экстремаль
х = I, доставляющая слабый локальный минимум в задаче и не доста-
доставляющая сильного. При этом нами была построена последовательность
допустимых (в задаче на сильный экстремум) функций хп Е РС ([<о, 1;\]),
х„(-) —► ж(-) в Сф0, ^]), для которой ^(xп(■)) —► -оо при п —► оо.
Поскольку Ъц(Ь) — 6хA) = 6 > О V I 6 [О, 1], то выполняется
усиленное условие Лежандра.
Выпишем уравнение Якоби, которое является уравнением Эйлера
по к
"!*(*) + М«) = О
для интегранта Ь — ЪцЪ? + 2Ь±хкн + ЬХХН2 = 6к2:
Л .
12/г = 0 «=* /г = 0.
а1
Общее решение уравнения Якоби: Ь, = С\I + С%. Начальным условиям
Н@) = О, Н@) = 1, удовлетворяет функция Щ) = I. Эта функция
не имеет нулей в полуинтервале @, 1]. Значит, сопряженных точек
нет, и стало быть выполнено усиленное условие Якоби. По теореме 3
выполнено достаточное условие слабого локального минимума, значит
х 6 \у1осгшп.
274 Глава 5. Условия второго порядка в вариационном исчислении
Поскольку функция Ь = ж3 не выпукла по х, то достаточное условие
сильного минимума не выполняется. Проверим необходимое условие
сильного минимума — условие Вейерштрасса:
ЕA, х, х, и) = Щ, х, и) - ЬA, х, х) - ЬхЩи ~х) =
= и - х - Ъх(и - х) = и3 - 1 - 3(и - 1) ^ 0 (?)
V и 6 К, V * 6 [0, 1].
Оно не выполняется. Так как не выполняется необходимое условие, то
функция х не доставляет сильного локального минимума.
Пример 2.
Исследуем с помощью условий второго порядка задачу, рассмотрен-
рассмотренную нами в главе 3 п. 1.6 (пример 2):
Зтг/2
/(а:(-)) = I (х2 - х2) <Й -+ Ы; х@) = а: (у) = 0.
о
Уравнение Эйлера:
х + х = 0.
Мы выяснили ранее, что имеется единственная допустимая экс-
экстремаль х = 0, не доставляющая даже слабого локального минимума
в задаче. При этом нами была построена последовательность допусти-
1 И
мых функций хпA) = — ил —, ж„(-) —► х(-) в С1 ([0, 1]), для которых
^(xп(■))<^ = ^^x(■))п
Поскольку ЬаA) = 2 > 0 V I 6 [0, Зтг/2], то выполняется усиленное
условие Лежандра.
Выпишем уравнение Якоби, которое является уравнением Эйлера
по Ь,
Л
для интегранта
-~ — . 2 — • — 2 '7 2
Ь, 4- /г = О ■<=>• /г = С1 8Ш * 4- Сг сох I.
Начальным условиям /г@) = О, Н@) = 1, удовлетворяет функция НA) =
$т1. Эта функция в интервале @, Зтт/2) обращается в ноль в точке
т = тг. Таким образом, в интервале @, Зтг/2) имеется сопряженная
точка, и стало быть не выполнено необходимое условие Якоби слабого
локального минимума, значит допустимая экстремаль ж(-) не доставляет
в задаче слабый минимум, и тем более не доставляет сильный минимум.
§ 1. Простейшая задача вариационного исчисления 275
Если воспользоваться теоремой 5 о необходимых и достаточных
условиях экстремума в простейшей задаче вариационного исчисления
с квадратичным функционалом, то из того, что не выполнено условие
Якоби, будет следовать, что абсолютный минимум в задача равен -оо.
Уравнение Эйлера совпало с уравнением Якоби. Это не случайно.
Так бывает, если интегрант исходной задачи является квадратичной
функцией от ж, ж.
Пример 3 (простейшая векторная задача вариационного исчисления,
в которой допустимая экстремаль единственна и доставляет сильный
экстремум).
1
^(x(■)) = ^(x^(■),x2(■)) = 1(х\ + х\ + 2х1Х2)<И - Ы;
Условие экстремума I порядка — система уравнений Эйлера:
! ^ж| а;1.
Х2=ХЬ 1 !
Последнему дифференциальному уравнению 4-ого порядка соответствует
характеристическое уравнение к4 = 1. Его корни й12 = ±1, &з,4 = ^г-
Поэтому общее решение дифференциального уравнения х\ = С^Ы +
С2сЫ + Сз8\п1; + С4СО81;. Тогда х2 = х,\ =
Начальные условия:
() 8т1, .^_п п _ ,
х2(\) = С^Ь 1 - С3 яп 1 = - яп 1, С1 ~ "' °3 ~
Единственная допустимая экстремаль Х\ = хт<, х2 = — %т1.
Условия экстремума II порядка.
УсловиеЛежандра. 2ц = (~м' Ъ^ ) = (I !П .
Эта матрица положительно определена, следовательно, выполняется
усиленное условие Лежандра.
Условие Якоби.
276 Глава 5. Условия второго порядка в вариационном исчислении
Квадратичный интегрант
!(*, й, к) = (Так, к)
г
= 2/»1 + 2к\ + АНХН2 = 2Ц1, й, к).
Отметим, что для квадратичного функционала всегда Ъ — 2Ь.
Система уравнений Якоби (система уравнений Эйлера для квадра-
квадратичного интегранта Ь):
Ищем фундаментальную систему решений уравнения Якоби — матрицу
Я@ = (й!(*)й2(*)) = [?)[') ?]['Л такую, что Я@) = 0 (нулевая
)
\л2(г; «2 и) У
матрица), Н@) = I (единичная матрица).
Для вектора *(*)=
, должны выполняться гра-
ничные условия
4 = 0 _ _ 1
=>■ С2 = Са = О, С1 = Сз = —.
1 2
. Й2@) = С1 - Сз = О,
■ Аналогично находим: П2(I) =
Сопряженные точки являются корнями уравнения
- 8штJ = 0 <^=Ф> хЬт йпт = 0
= кж, к б N.
На полуинтервале @, I] нет сопряженных точек, следовательно, вы-
выполняется усиленное условие Якоби. По теореме 3 п. 1.4.6 вектор
А = (±1, &2) = (Ш1<, - 8Ш*) 6
§ 1. Простейшая задача вариационного исчисления 277
Условие Вейерштрасса — необходимое условие сильного минимума —
выполняется:
ЕA, х, х, и) := Щ, х, и) ~ Щ, х, х) - (Ь^, х, х), и - х) =
2 2 ' 2 • 2 л X ' ' л
= И[ + «2 + 2Ж(Ж2 — X] — Х2 — 2х,\Х2 — 2X1A1) — х{) — 2х2\П2 — Х2) =
= (и, ~ххJ + {и2 ~х2J ^0 V («ьи2) Е К2, V I 6 [0, 1].
Выпуклость интегранта по х. Функция ЬA,х,х) = х\ + х\ + 2х\х2
выпукла по х, так как Ьц — положительно определенная матрица для
любых (г,ж) 6 К3. По теореме 4 п. 1.4.7 вектор х = (хих2) 6 кМоспип.
(Отметим, что из условия выпуклости интегранта Ь по х следует
выполнение условия Вейерштрасса.)
Если воспользоваться теоремой 5 п. 1.4.8 для квадратичных функ-
функционалов, то можно было бы, проверив усиленные условия Лежандра
и Вейерштрасса, сразу сказать, что х = (ж[,ж2) € аЫтт (и слабый,
и сильный).
' 1 1
5аЬ$тт = ^(x) = / B СО82 I - 2 8Ш2 <) <И = 2 \ СОХ 21 Л1 = 81П 21 = ЯЛ 2.
= ^(x) = / B СО82 I - 2 8Ш2 <) <И = 2 /
о
о
1.7. Задачи
т/2
1.1. I (х2 -х2 + 4гсо8г)<й->ех1г; х@) = х(*-\ = 0.
о
Згг/2
1.2. Г (х2-х2-4х$Ш)(И->е)аг, х@) = ^{~) = 0-
о
1.3. I (х2 + Ъх2)е21<И -> ехСг; х@) = 1, хA) = е.
о
1
1.4. [ (х2 - х)е21 & -» ехсг; х@) = 0, жA) = е.
о
1
/Я"
$)пх<и -> ех1г; ж@) = 0, жA) = -.
о
1.6. / сжхА1 -» ех1г; ж@) = 0, х{\) = п.
278 Глава 5. Условия второго порядка в вариационном исчислении
Та
1.7. I же* <й -> ех1г; ж@) = 0, х(Т0) = {.
о
1
1.8. I х2е± <И -> ех1г; х@) = 0, хA) - 2.
о
1
1.9. 1(хъ + 4х2)<И-+суХг, ж@) = 0, жA) = -1.
о
3/2
1.10. /(ж3 + 2х) дЛ -* ех(г; х@) = 0, ж ^-) = 1.
о
То
1.11. I (х5 + 5х) <И-+ехгт; х@) = 0, х(Т0) = {■
о
1
.12. I (I - х2J <И-> еЯг, х@) = 0, жA) = |.
§ 2. Задача Больца
Рассмотрим задачу Больца для вектор-функций ж(-) = (Ж] (•),..., ж„(-))
1(хЦ0),хЦ,)) ^ тт. (Р)
к
2.1. Сильный и слабый экстремум
Напомним, что функция х € С'([<0, ^])К") доставляет слабый ло-
локальный минимум в задаче (Р) (х € \у1оспипР), если она доставляет
локальный минимуме пространстве С'([<о, ^],К"), т.е. если существует
6 > 0 такое, что В(х) ^ В(х) для любой функции ж € С'A<0, ^])>
для которой ||ж(-) - *(-)||с'([<о,*,],к») < ^-Наряду со слабым экстремумом
в задаче Больца как и в простейшей задаче классического вариа-
вариационного исчисления рассматривается понятие сильного экстремума.
Функция ж € РС1 ([Ьо, ^^],Кп) доставляет сильный локальный минимум
(ж 6 81г1осгшпР), если она доставляет локальный минимум в простран-
пространстве С([<о, ^]) К"), т.е. если существует 6 > 0 такое, что В(х) > В(х) для
любой функции ж е РС1(Ц0^1],Кп), для которой ||ж(-) - Ц-ЩсфМ,^)
< 6.Так как множество функций, среди которых доставляется силь-
§ 2. Задача Больца 279
ный экстремум, шире, чем для слабого экстремума, то если функция
х € С1([Ьо, ^^],Кп) доставляет сильный, то она доставляет и слабый экс-
экстремум. Поэтому для функций х € С!([<о, ^],К") необходимое условие
слабого экстремума является необходимым условием сильного, а до-
достаточное условие сильного экстремума является достаточным условием
слабого. В этом разделе будут сформулированы и доказаны необходимые
и достаточные условия слабого и сильного экстремума в задаче Больца,
а также рассмотрена задача Больца с квадратичным функционалом. До-
Доказательства условий II порядка в задаче Больца во многом аналогичны
доказательствам условий II порядка в простейшей задаче классического
вариационного исчисления. Поэтому они будут проведены более кратко.
2.2. Условия экстремума II порядка
2.2.1. Необходимые условия слабого экстремума
Теорема. Пусть функция х € С2([<о> ^]>К") доставляет слабый ло-
локальный минимум в задаче (Р) (х (Е \у1осгшпР), интегрант Ь трижды
непрерывно дифференцируем в некоторой окрестности расширенного графи-
графика Гхх (Ь € СЪ{О(ГХХ))). Тогда на х выполняются
а) уравнение Эйлера:
-^Щ1) + 1х(г) = ъ V ^е[^о,^^]
и условия трансверсальности:
Ъ) условие Лежандра: Ь±х{1) > О V < € [<о, ^^]',
с) если на х выполнено усиленное условие Лежандра, то выполняется и
условие Якоби;
й) если выполняются усиленное условие Лежандра и усиленное условие
Якоби, то для любого вектора (Ло,^) € К2" решение уравнения Якоби Л(-)
с краевыми условиями Л(<0) = Ло, Н{г{) = Ль существует, единственно
0, где Р(Н)~ {1ХХН + 1ххк,
Доказательство. Необходимость а) была установлена нами ранее в
главе 3 п. 2.2. Далее очевидно, что если х доставляет слабый локальный
минимум в задаче (Р), то функция х доставляет слабый локальный
минимум в простейшей задаче вариационного исчисления:
I
шш; хAа) — х0, х{1х) = хь
280 Глава 5. Условия второго порядка в вариационном исчислении
и, значит, в соответствии с теоремой 2 из п. 1.4.4 выполнены условия
Ь-с).
Докажем утверждение с1). Покажем вначале, что решение уравнения
Якоби с краевыми условиями кAо) = ко, кA\) = к\, существует и
единственно.
Докажем существование. Из усиленного условия Лежандра (ЬХХЦ) >
0 V I (Е [<о> ^]) вытекает, что матрица Ьхх положительно определена и,
значит, невырождена и обратима. Поэтому уравнение Якоби
- — Aххк + Ьххк) + Ьххк + Ьххк = 0 <=>■ Ьц{1)к + АЦ)к + СЦ)к = 0
представляет собой систему из п дифференциальных уравнений второго
порядка с непрерывными коэффициентами, которую в силу обратимости
матрицы Ьц можно разрешить относительно старших производных. По
известной из теории дифференциальных уравнений теореме существова-
существования и единственности (см., например, АТФ стр. 191) существуют фунда-
фундаментальные матрицы решений уравнения Якоби НA,10) и Я(<, Ь\) с крае-
краевыми условиями Я(<о,^о) = 0, Я(<о,^о) = I, и НAХ,11) = 0, Я^,^) = /.
Из усиленного условия Якоби (на полуинтервале (<0, <1] нет сопряжен-
сопряженных точек) вытекает, что матрицы НA,10) и 11A,1^ невырождены для
Ь € (<о, ^] и [<о, ^) соответственно. Положим Щ(Ь) = Я^,^)^^,^)
и Их{1) = Н(^О)Н-1ЦЬ^). Тогда Н0Ц0) = I, Н0Цг) = 0, Щ&) = 0,
^1(^1) = I, и, значит, функция к{Ь;Но,Н\) = Щ(г)Н0 + Н^)^ является
решением уравнения Якоби с краевыми условиями Л(^о;Ло,Л1) = Ло,
кAйНо,Н\) = к\.
Докажем единственность. Действительно, предположим, что суще-
существует другое решение уравнения Якоби Л(-) с теми же краевыми усло-
условиями. Тогда функция Л(-) = к{-;ко,к\) - к{-) является нетривиальным
решением уравнения Якоби с граничными условиями кAо) — к{1\) = 0
и, следовательно, 1\ — точка сопряженная с 1$, а это противоречит
усиленному условию Якоби.
Поскольку & е \у1оспнпБ, то по необходимому условию II порядка
локального минимума функционала В
В"(Щк, к\ = [ (фцк, к) + 2{1ххк, к) + Aххк, к)) Л1 +
к
+1"Dо,*1)[(Ао, АОДАо,*!)] = К{к) + <?(Л) ^ 0 V к € С1 ([«о, *:})
(Ао.-А(«о). *1 :=*(«!))■ ,(*)
Пусть далее Л(-) — решение уравнения Якоби с краевыми условиями
кA0) = к0, кA\) = к\. Тогда
к (к) = 1{ьххк + 1ххк, лк) + [{1ххк + ьххк, к)<и =
= I ((
§2. Задача Больца 281
Aххн,к) + Aххк,н) + {1ххк,
к
= (- — Aххк+1ххн)+1ххк+1ххп,н\<и+Aххк+1ххп,н)
^. \ да /
'о
(в последнем интеграле подынтегральное выражение равно 0, так как
функция к удовлетворяет уравнению Якоби). Подставляя в неравен-
неравенство (*) вместо К{к) равное ему Р(к), получим, что (Р + Я)(к) > 0. ■
Замечание. Если в определение оператора Р подставить вместо к
построенное при доказательстве теоремы решение уравнения Якоби
Л(-;Ло,Л[), то получим, что
= {^(«^(Яо^ОАо + Я,^)^) +Х4я(«1)А1,А1> -
- A±±A0)(Н0Ц0)к0 + ЩЦо)^) + ихЦо)ко,Но) = Р(ко,к1).
Значит, Р также как и ^ является квадратичной формой.
2.2.2. Достаточные условия сильного экстремума
Теорема. Пусть функция А € С2([<0) ^^], К") — допустимая экстремаль
в задаче (Р), интегрант X Е С3G х К"), где V С К"+1 - некоторая
окрестность графика, на х выполнены усиленные условия Лежандра и
Якоби, интегрант Ъ является выпуклым по х на V, квадратичная форма
Р' + <? (см. п. 2.2.1) положительно определена. Тогда & доставляет сильный
локальный минимум в задаче (Р) (А € ййоспипР).
Доказательство. Обозначим х0 := *(<о)> *1 •— *(^)- По теореме
существования и непрерывной зависимости решения от начальных
данных для любого е > 0 существует 6 = 6(е) > 0 такое, что для
любой точки (хо, х{) € В((хо,Х1),6) существует единственное решение
уравнения Эйлера х(-;хо,х\) с начальными условиями хA0\х0,х\) =
х0, хA1,хо,х{) = хх и \\х(-;хо,хх) - х(-)\\сц[ц^\) < е. При этом не
ограничивая общности, будем считать, что 6 < е.
Возьмем произвольную функцию х € РС1(\10, 1\\) (х0 := ж(<0),
х1 := ж(<[)), для которой ||ж(-) - г(-I1с([*о,*1]) < 6- ТогДа точка (хо,хх) €
В((х0, *1),<5) и для нее, как было сказано выше, существует решение
уравнения Эйлера х(-\хо,х\) с начальными условиями ж(<0;ж0,хх) = х0,
хAйхо,Х1) = хх и \\х(-;хо,Х1) - х^Цс!^^ <е.
Окружим экстремаль х(-;хо,Х1) центральным полем экстремалей
(см. п. 1.4.5). Это можно сделать, так как из условия выполнения
282 Глава 5. Условия второго порядка в вариационном исчислении
усиленных условий Лежандра и Якоби на экстремали х усиленные
условия Лежандра и Якоби в силу условий гладкости будут выполнены и
в некоторой окрестности расширенного графика Г^. Тогда
В(х(-)) = Цх(-)) + 1(хЦ0),!(«,)) = Цх(-)) - Цх(-гх0,
+ ^(x(■■,xо,x1))+^(xо,x1) = ^(x(■)) - 3{х{-;хо,Х1)) + Ф(хо,х1),
где
Ф(хо,х1):= ^(x(■■,xо,x^))+^(xо,x^) =
*1
= / 1A,хA,хо,Х1),хA,хо,
— функция двух переменных х0 и х\. Из построения следует, что
\\х(-) - Х^Х^Х^с^^) = \\х(-) - &(■) + &(■) - х(;\Хъ,Хх)\\с < \\х(-) -
х(-)\\с + \\х(-)-х(-;хо,Х1)\\с < 6 + е < 2е. В п. 1.4.7 было показано, что по
основной формуле Вейерштрасса для экстремали х(-;хо,х{) и функции
ж(-) близких в метрике пространства С([<о, 1\\ в силу выпуклости
интегрант Ь является выпуклым по х
- Цх{-,хо,Х1)) = Ге<и > о.
Покажем, что функция Ф(жо, х\) имеет локальный минимум в точке
(жо,^), т.е., что Ф(жо,ж1) ^ Ф(жо,Ж!) = В(х(-)). Тем самым теорема
будет доказана.
Найдем первую производную функции Ф(жо,ж1). При доказательстве
необходимых условий экстремума I порядка в задаче Больца (Гл. 3 п. 2.2)
было найдено, что
в\х(-))[н{-)\ =
На экстремали ж(-, жо, Ж1) выражение под знаком интеграла тождественно
равно нулю, следовательно,
§2. Задача Больца 283
Из полученной формулы для В'(ж(-,а;о,а;1))[Л(-)] следует, что на экс-
экстремали ж(-,жо,Ж1)) производная Б'(ж(-,жо,а;1))[Л()] как функционал от
Л(-) зависит только от кAо),кA\) — значений функции Л(-) в точках
<о,^ь На допустимой экстремали х выражения в скобках обращаются в
ноль в силу условий трансверсальности, поэтому
В'(х(-))[к(-)] = О V к € С1 ([«о, Ы) <=>>
+
= В'(х(-,хо,х1)) = В1 (&(■)) =0.
Вьшишем вторую производную функционала Больца:
В"(*(-))[А(-), А(-)] = / ($ЯЯА, А> + 2<2ЯЯА, Л) + A„Н, к)) Л
V Л
При доказательстве необходимых условий слабого экстремума II порядка
в задаче Больца в предыдущей теореме было доказано, что существует
единственное решение уравнения Якоби Л(-) = к(-;ко,Н\) с краевыми
условиями Л(<о) = Ао, Ъ,{1\) = Ь,\ и дано его представление. Тогда
= I (<^**А,А> + (ХХЯА, А> + (ХЯЯА,А> + {Ь
к
+ {ГВ1а:1А1,А1)+2{/а:1а:оАо)А1) + {4оа:0Ао)Ао>= /
к
(функция к(-;ко,к1) удовлетворяет уравнению Якоби, поэтому выра-
выражение под знаком интеграла тождественно равно нулю). Вследствие
положительной определенности Р + С} по достаточному условию мини-
минимума функции нескольких переменных (*о»*1) € кклшпФ. Значит, если
точка (хо,хг) лежит в малой окрестности точки (жо,:^), то
Таким образом, если ||е(-)"~*('I1с([*о^р») < 6, то В(х) > В(х) и, значит,
функция х
284 Глава 5. Условия второго порядка в вариационном исчислении
2.2.3. Квадратичный функционал
Рассмотрим задачу Больца с квадратичным функционалом для
вектор-функций ж(-) = (ж^-),..., ж„(-))
х,х) + 2{Схх) + (Вх,х)) <1Ь +
Щх,х)
+ 2{ухих0) + фхо,хо) + {а,хх) + (Ь,хо\ ->• тш, (Р1)
на слабый и сильный экстремум. Здесь х0 = ж(<0), х\ = х{Ь\), А{Ь),
В(Ь), С(Ь), а,/6,7 — матрицы порядка пхп, А,В,а,@ — симметричные
матрицы, векторы а, Ь е К". Для квадратичного функционала матрицы
Ри^, введенные в п. 2.2.1, примут вид:
1=2(Ак+Ск,к)
где Н{1) := ЩA)Но + Я)D)Ль Щ,Н\ — решения уравнения Якоби с
краевыми условиями, ЩA$) = I, Яо(^) = О, Я,(<0) = О, Я^) = /,
Теорема. Пусть в задаче (Р1) матрицы А и С непрерывно дифферен-
дифференцируемы, а В непрерывна; выполнено усиленное условие Лежандра. Тогда,
если выполнено усиленное условие Якоби, матрица Р + Ц неотрицательно
определена и существует допустимая экстремаль, то она доставляет
абсолютный минимум. Если же не выполнено условие Якоби или выполнено
усиленное условие Якоби, а матрица Р + ф не является неотрицательно
определенной, то значение задачи равно —оо ("^д^зщщ = —об).
Доказательство. Пусть выполнено усиленное условие Якоби. Возь-
Возьмем произвольную функцию х е С'1([<0) ^]). Обозначим х0 := хA0),
Хх := х(Ь\). Как уже отмечалось при исследовании простейшей зада-
задачи вариационного исчисления с квадратичным функционалом (п. 1.4.8)
уравнение Якоби для квадратичного функционала совпадает с уравне-
уравнением Эйлера и при выполнении усиленного условия Якоби для любых
хо,х1 6 К" существует и единственно решение уравнения Эйлера (Яко-
(Якоби) х(-;х(),х1), для которого хA;о;хо,Х1) = х0, х^Ь^х^^хх) = х\. Это
решение можно записать в виде ж(-; х0, х\) — Но(-)хо + Н\(-)х\. Действи-
Действительно, для него х^х^Х]) — Н0Ц0)х0 + Н1^0)х1 — х0, ж^ьЖо,^) =
^Ожо + Я^Ож! = хх.
§ 2. Задача Больца 285
Представим функционал В в следующем виде:
В{х{-)) = Цх(-)) + 1{хо,хх) = 1(х{-)) - 1{х{-,х
+ ^(x(■■,xо,хг)) + 1(х0,хх) = ^{x(■)) - ^(x(■■,х0,хг)) + Ф(ж0,хх),
где Ф(жо,ж1) :=Б(ж(-;жо,ж1)) = 3(х(-;хо,х1)) + 1(хо,х{) — функция двух
переменных ж0 и ж,. В п. 1.4.8 было показано, что по основной формуле
Вейерштрасса для экстремали х(-;хо,Х1)
- ^(x(■, хо, х:)) = [ е <и > о.
Пусть х — допустимая экстремаль. Покажем, что функция двух
переменных Ф(жо,ж1) имеет глобальный минимум в точке (#0,^1) (&0:=
хA0), х\ := Щ{)). В п. 2.2.2 было показано, что
Ф'Dо,*1)[(Ао,А1)] = 0 V Ао,*! € К".
Вторая производная функции Ф(жо,ж1), выписанная в п. 2.2.2, в точке
(&о,*1) на функции Н(-;хо,Х1):= Я0(-)А0 + Н^-)^ будет иметь вид:
Следовательно, по Теореме 2 Гл. I п. 4.1 функция Ф(ж0,х\) является
выпуклой и ее минимум в точке (#0,^1) является глобальным. Итак,
доказано, что в точке (&0; #1) функция имеет глобальный минимум. Тогда
Ф(хо,Х1) ^ Ф(хо,Х1)= В(х(-;хо,А1)) = В(х(-)) V хо,х1 еК" и, значит,
В{х{-)) > В{х{-)) Уже С\[1й, и]) =» х е ШгЪхттР.
Предположим теперь, что не выполнено условие Якоби или вы-
выполнено усиленное условие Якоби, а матрица Р + ф не является
неотрицательно определенной. Тогда функция к = 0 $? аЬзтшР" не
доставляет абсолютный минимум в задаче
= [((Ак,к)+2(Ск,к) + (ВА,А>)
к
+ (аНиЪ) +2GА1)А0> + (/ЗА0,Ао> -> ш; (Р")
(если Л = 0 € аЬзттР", то по теореме о необходимых условиях слабого
минимума выполнено условие Якоби и, если выполнено усиленное усло-
условие Якоби, то матрица Р + Ц является неотрицательно определенной).
Значит, 5а58т}пР.. < 0. Поэтому существует функция к е С([<0, ^])
286 Глава 5. Условия второго порядка в вариационном исчислении
такая, что В(Н) < 0. Но тогда В(ХН) = Х2В(Ь) + А«я, Нх) + (Ъ, Но)) -> -оо
при А -» +оо, т. е. 5аЪ8тк1Р, = -оо. ■
Замечание. Если в задаче (Р*) терминальная часть функционала
Больца не содержит линейных по Но, Нх слагаемых и вьшолнено усилен-
усиленное условие Якоби, то множество допустимых экстремалей непусто. Оно
содержит функцию х = 0.
Действительно, функция х = О удовлетворяет уравнению Эйлера,
которое для квадратичного функционала является однородным. В условия
трансверсальности
,(<о) = Ьк), „ / 2АA0)Щ0) + 2С*хA0) = 2^A^ + 2{3хAо),
(«) * 2)) *() 2() *(
вместо произвольной экстремали ж(-) подставим экстремаль вида
х(-; х0, ц) = Н0(-)х0 + Н1{-)хх:
Г 2А{1й)(Щ1й)хй + Щ^хЛ + 2С*х0 = 27х{ + 2/Зх0,
\() = -2ахх - 27%.
Относительно х0 и х\ получили однородную систему линейных уравне-
уравнений, которая, как известно из линейной алгебры, всегда имеет решение,
среди которых имеется решение х0 = х\ =0. Следовательно, функция
х = 0 будет являться допустимой экстремалью, возможно не един-
единственной.
2.3. Пример
1
/ (А2 -х2)<И + х2@) - х2(\) + 4жA) -> ехСг.
о
Условия экстремума I порядка:
а) уравнение Эйлера:
Л
— Ьх + Ьх = О <=> х + х = 0 ■<=>• х =
ах
- с2 аил 0;
Ь) условия трансверсальности:
Г 1*@) = Цо), (х@) = х@),
\() 1 \ {\) A) - 2
(х@) =
\ Х{\) =
1 — *-2>
Сх сох 1 - Сх 8Ш1 = Су йп 1 + С2 сох 1 - 2
§2. Задача Больца 287
Единственная допустимая экстремаль х =.
81П 1
Условия экстремума II порядка.
Условие Лежандра. Ьц = 2 > 0 — выполняется усиленное условие
Лежандра в задаче на минимум.
Условие Якоби. Поскольку Ь±х = Ьх± = О, Ьхх = 2, то квадратичный
интегрант
I = ЬцП2 + 2ЬХ±НН + ЬХХП2 = 2П2 - 2П2.
Уравнение Якоби (уравнение Эйлера для интегранта Ь)
а_
Ищем решения уравнения Якоби Щ{€), Н\{Ь) с краевыми условиями
Я0@) = 1, ЯоA) = 0, #1@) = 0, Нх(\) = 1. Находим, что ЩA) =
5ШA - <) ч 8Ш< / . ч СО8A - <) • ,, СО8<\
—V—-, ^(<) = — (ЯоО = Ц--, Н,A) = -—). Нули
Ш11 . яп1 V 8Ш1 ЯП 1/
функции Н\A) = -—- — точки т = кж, й € N. являются сопряженными
51П 1
точками. На полуинтервале @, 1] нет сопряженных точек, следовательно,
выполняется усиленное условие Якоби.
Квадратичная форма Р + ф (задана на К2):
Р = ЕХХA)(ЩA)ПО + Щ^Н: - Ьц(О)(Щ(О)Ьо +Я1@)/г1)/г0 =
2 2
М B1)/ B1)/
М1 + Bс1§1)/11 + Bс1§1)/го гг
ЯП 1 Ч 81П 1
-2/8т1
^-2/8т1 2с1ё 1 - 2
Поскольку с1еЫ! = 2с1§1 + 2 > 0, с1е1^412 = с!е1(Р + Я) - 4с1§21 - 4 -
4
2 = —8 < 0, то по критерию Сильвестра (см. Гл. 1, п. 1.2.3) квадра-
квадратичная форма матрица Р + ф не является неотрицательно определенной.
Не выполняется необходимое условие слабого локального миниму-
минимума — неотрицательность квадратичной формы Р + С%. Следовательно,
х & \у1оспш1 и тем более х $ Яг1остт.
По теореме об условиях экстремума для квадратичного функцио-
функционала, если выполнено усиленное условие Якоби, матрица Р + Ц не
является неотрицательно определенной, то значение задачи равно —оо
288 Глава 5. Условия второго порядка в вариационном исчислении
Покажем, что 5аь5тах — +00- Возьмем последовательность функций
хп{€) = книга*. Тогда ж„@) = хп(\) = 0 и, следовательно,
1 1
В(хп{-))= I {х2п-х2п)М = I (тг2п2
о о
1 1
2 Г
У
1— са&2жп1 ж2п2—1
М = ► +оо при п -»+оо.
Ответы к задачам главы 5
1.1. \Л ) яп* € аЪашп; 5тах = +оо.
1.2. <со$< ^ \у1осех1г; 5тш = -оо; 5тах = +оо.
1.3. е* 6 аЬхгшп; ^щах = +оо.
1.4. <е2"' е аЫтах; 5тш = -оо.
1.5. 5шш = -1, — Е аЬзтах; 5,^ = 1.
1.6. к1 6 аЬхтш; 5тт = ~1; ^щах ="■ 1-
1.7. — >-2=>^= — € \у1остш, ^ Йг1ост1п; — < -2 =$• х е \у1остах,
^о То То
$ ййостах; — = -2 => х $ \у1осех1г; 5^,^ = -оо; 5тах = +оо.
^о
1.8. 21 € \у1остт; 5шах = +оо.
1.9. —I 6 \у1остш, ^ ййосгшп; 5,^ = -оо; 5тах = +оо.
/2 \3/2
1.10. ^-П # \у1осех1г; 5т1п = -оо; 5тах = +оо.
1.11. | > -Т05/4 => х - -Ш + СM/4 - С5/4) € \у1ос1шп, # 81г1ос1шп;к | <
5 5
—То'4 => -х 6 ростах, ^ ййостах, где константа С отыскивает-
отыскивается из граничного условия на правом конце: -((*+С) '4-С '4) = |||;
йг1осех1г; ||| < ~Т0' => допустимых экстремалей нет; ,!?,„„ = -оо;
5тах = +00.
1 1 .
1.12. ||| > —■=. =» х = |* € шостт, ^ хМостт; ||| < —= =» х €
I (I2 -1J,
\у1остах, ^ 51г1остах; 5пш, = \ /С2 _ ^ \е\ -^ ь ^п^ = +0°-
Список литературы
[1] [АГТ] Алексеев В. М., Танеев Э.М., Тихомиров В. М. Сборник задач
по оптимизации. М.: Наука, 1984.
[2] [АТФ] Алексеев В.М., Тихомиров В.М., Фомин СВ. Оптимальное
управление. М.: Наука, 1979.
[3] Габасов Р., Кириллова Ф. М. Методы оптимизации. Минск. Изд-во
БГУ, 1981.
[4] [ГТ] Галеев Э.М., Тихомиров В.М. Краткий курс теории экстре-
экстремальных задач. М.: Изд-во МГУ, 1989.
[5] Галеев Э. М., Тихомиров В.М. Оптимизация: теория, примеры,
задачи. М.: Эдиториал УРСС, 2000.
[6] Галеев Э. М., Кушниренко А. Г., Тихомиров В. М. Сборник задач по
оптимальному управлению. М.: Изд-во МГУ, 1980.
[7] Галеев Э. М. Классическое вариационное исчисление, оптимальное
управление. М.: Изд-во МГГА, 1995.
[8] Галеев Э. М. Линейное программирование. М.: Изд-во МГГА, 1995.
[9] Галеев Э.М. Экстремальные задачи. М.: Изд-во МГГА, 1996.
[10] Гантмахер Ф. Р. Теория матриц. М.: Наука, 1988.
[11] Демидович Б. П., Марон И. А. Основы вычислительной математики.
М.: Наука, 1966.
[12] Заславский Ю.Л. Сборник задач по линейному программирова-
программированию. М.: Наука, 1969.
[13] Иоффе А. Д., Тихомиров В.М. Теория экстремальных задач. М.: На-
Наука, 1974.
[14] Карманов В. Г. Математическое программирование. М.: Наука,
1980.
[15] Курош А. Г. Курс высшей алгебры. М.: Наука, 1975.
[16] Магарил-Ильяев ГГ., Тихомиров В.М. Выпуклый анализ и его
приложения. М.: Эдиториал УРСС, 2000.
[17] [Р] Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973.
[18] Саульев В. К. Прикладная и вычислительная математика. Вып. 3.
Изд-во МАИ, 1971.
[19] Фихтенгольц Г.М. Курс дифференциального и интегрального ис-
исчисления, тт. 1, 2. М.: Наука, 1969.
Список обозначений
аЫтт (аЫтах) — абсолютный, т.е. глобальный минимум (максимум)
в задаче
1остш Aостах, 1осех1г) — локальный минимум (максимум, экстремум)
5щт (^тах), иногда, чтобы подчеркнуть глобальность экстремума 5а58тщ
(■^аЫтах)' — численное значение абсолютного минимума (макси-
(максимума) задачи
(Р) — нумерация (обозначение) задачи
Аг§ Р — множество решений задачи (Р)
8р — численное значение задачи (Р)
О{Р), иногда Ир, — множество допустимых элементов в задаче (Р)
Х>(ж) — множество функций дифференцируемых в точке х
Х> (ж) — множество функций к раз дифференцируемых в точке ж (к > 1)
{а, Ь) — скалярное произведение векторов а и Ь
Нп{«ь..., ат} — линейная оболочка векторов а\,...,ат
I — единичная матрица
{ж | А(х)} — множество элементов х, обладающих свойством А(х)
X* — пространство сопряженное с X
(ж*, х) — значение линейного функционала х* на элементе х
Ь{Х, У) — пространство линейных непрерывных отображений из прос-
пространства X в пространство У
Ьх — аннулятор множества Ь
А* — оператор, сопряженный с оператором А, (А*у*, х) = {у*, Ах)
ж(-) — обозначение, которым подчеркивается, что ж(-) является элемен-
элементом функционального пространства
Сфо, ^],К) — пространство непрерывных на отрезке [<0, ^] функций
х(-)\ К -> К" с нормой ||ж(-)||0 = таХF[М1] \х(Ь)\
С(К,Кп) — пространство непрерывных вектор-функций ж(-): К —► К",
заданных на компакте К с нормой ||ж(-)||0 = тах^к |*(<)|
С (К, К") — пространство г раз непрерывно дифференцируемых вектор-
функций ж(-): К —у К", заданных на компакте К с нормой ||ж(-)||г =
()
К:=Ки {-оо} С1 {+оо} — расширенная числовая прямая
сопеС, иногда со С, — линейная оболочка множества С
Список обозначений 291
сопуС — выпуклая оболочка множества С
йот / — эффективное множество функции /
ер1 / — надграфик функции /
6А(х) — индикаторная функция выпуклого множества А
зА(у) — опорная функция множества А
д/(х) — субдифференциал выпуклой функции / в точке х
6^/(х,Н) — производная по направлению Л отображения / в точке х
6/(х, •) — вариация по Лагранжу отображения / в точке х
/с(ж) — производная Гато отображения / в точке х
/'(ж)[Л] — действие производной (Фреше) /'(*) на элемент Л
5Х>(ж) — множество отображений строго дифференцируемых в точке х
гр о <р — суперпозиция отображений <р и гр, (гр ° <р)(х) =
о
В(х, 6) — открытый шар радиуса 6 с центром в точке х
Т±М — множество всех касательных векторов к множеству М в точке х
Т^М — множество односторонних касательных векторов к множеству
М в точке х
хь (Аь) — базисный вектор (матрица) в линейном программировании
хп (Ап) — небазисный вектор (матрица)
/* — сопряженная (в смысле Лежандра) функция к функции /
/** — вторая сопряженная функция к функции /
Р** — двойственная задача к задаче Р
Е(Р) — множество экстремалей в задаче (Р)
БЕ^Р) — множество допустимых экстремалей в задаче (Р)
\у1осгшп (\у1остах, \у1осех(г) — слабый локальный минимум (максимум,
экстремум)
ййоспйп (йг1остах, йг1осех1г) — сильный локальный минимум (макси-
(максимум, экстремум)
РС(А, К") — пространство кусочно-непрерывных на отрезке А вектор-
функций
РС1(Д,К") — пространство кусочно-дифференцируемых на отрезке А
вектор-функций
с1 ([*о, и]) = {*(•) € с1 (Цо,«,]) | л(*о) = а(«0 = °}
Гц := {(Ь,х{Ь)) | I е Цо, и]} — график функции х
Г±ь :— {(<,ж(<),А(<)) | I б Цо, 1\]} — расширенный график функции х
О(А) — (открытая) окрестность множества А
Предметный указатель
аннулятор множества 69
В
вариация по Лагранжу 56, 57, 77,
169, 187
вектор базисный ПО, 133
— касательный 75
— небазисный ПО
— ограничений 108
— стоимости 108
выпуклая комбинация 41
— оболочка 42
выпуклый многогранник 42
д
дифференцируемость по Гато 66
Фреше 58, 77
— строгая 56, 58, 68
задача Аполлония 29
— Больца 167, 177, 179
— выпуклая без ограничений 46
с ограничением 47
— выпуклого программирования
47
— гладкая бесконечномерная без
ограничений 77
с равенствами 80
— — — — — и неравенствами
84
— — конечномерная без огра-
ограничений 8
с равенствами 23
— — — — — и неравенствами
33
— Дидоны 190, 191
— изопериметрическая 167, 186,
190, 246
— Лагранжа 167, 200
— линейного программирования
в канонической форме 108,
109, 117, 123
— — — — нормальной форме
108, 121, 123
общей форме 108
двойственная 121
невырожденная ПО, 114,
128
— на минимакс 113
— Ньютона аэродинамическая
214, 233
— о брахистохроне 167, 176
— — быстродействии 214, 229,
232
минимальной поверхности
вращения 176
назначении 107, 162
— — полиномах Лежандра вто-
второй степени 22
третьей степени 23
стрельбе 176
— оптимального управления
214, 215
— производственная 113
— простейшая вариационного
исчисления 168, 246, 247
— с подвижными концами 167,
182, 185
— со старшими производными
167, 193, 199
— транспортная 107, 143
двойственная 160
, замкнутая модель 144, 145,
155
Предметный указатель
293
И
иголка элементарная 226
иголок пакет 217
игольчатая вариация управления
217
элементарная 226
функции 218, 255
элементарная 226
интеграл импульса 173
— энергии 173
интегрант 168, 171
искусственные переменные 132,
134, 135
К
конус допустимых вариаций 35,
89
— конечнопорожденный 124
критерий Коши 54
— решения 124, 126
— Сильвестра 13
Л
лагранжиан 187-189
лемма Банаха 67, 70
— Дюбуа-Реймона 171, 172
обобщенная 196
— Лагранжа 170, 171
— о замкнутости 95
— — — конечнопорожденного
конуса 125
образа 71
компактности 96
— — нетривиальности аннуля-
тора 69, 72
правом обратном 70, 71
приращении функционала
228
— — свойствах элементарной
игольчатой вариации 226
скруглении углов 259
— — центрированной системе
221
— о минимаксе 89
— об аннуляторе ядра регуляр-
регулярного оператора 72, 88
игольчатой вариации 219
— основная КВИ 170
М
матрица базисная 135, 152
— небазисная 155
— определенная неотрицательно
11
неположительно 17
отрицательно 19—21
положительно 11
метод искусственного базиса 134
— «Минимума по матрице» 147
— «Минимума по столбцу» 148
— «Минимума по строке» 147
— Ньютона 13-15
— потенциалов 143, 151, 162
— «Северо-западного угла» 146,
153
минимум (максимум) 6, 47
— (максимум) абсолютный 290
— (максимум) глобальный 168
— (максимум) слабый 177
минор главный 13
последовательный 13, 16
многогранник выпуклый 109.
124
множества отделимые 45
— строго отделимые 45
множество выпуклое 41, 42
— решений задачи 7, 108
множители Лагранжа 23, 26, 27,
35, 80
н
надграфик функции 42
неравенство для средних 41
— Иенсена 42
— Юнга 118
нормы эквивалентные 54
294
Предметный указатель
О
оболочка выпуклая 88
ограничение дифференциальное
215
— изопериметрическое 186
— на концах 186
П
поле экстремалей 246, 262, 263
центральное 262
поля центр 266
— экстремалей центр 262
последовательность фундамен-
фундаментальная 54
правило прямоугольника 112,
135
преобразование Лежандра 118
принцип Лагранжа 7, 23, 34, 45
— максимума Понтрягина 214,
215, 221, 225, 253
производная высшего порядка
59
— Гато 56, 57
— по направлению 56, 57
— Фреше 56-58
— частная 18, 59
пространство банахово 53, 54
— касательное 75
— линейное 53
— метрическое 25, 54
— нормированное 41, 53, 54
— полное 54
— сопряженное 43, 44, 56
процесс допустимый 215
— оптимальный 215
теорема Банаха об обратном опе-
операторе 70
открытости 70
— Вейерштрасса 25, 28
— двойственности 126
— Дубовицкого—Милютина 44
— Крейна—Мильмана ПО
— Куна—Таккера 48, 50
— Лагранжа 66
— Люстерника 72, 75
— Минковского 109
— Моро—Рокафеллара 44
— о касательном пространстве
75
поле в конечномерных за-
задачах с равенствами 100
полном дифференциале 68
— — смешанных производных
59
среднем 66, 67
суперпозиции 62
— об обратной функции 24, 25
обратном отображении 81
— отделимости вторая 46
первая 45, 46
— существования 124, 126, 218
— Фенхеля—Моро 118, 121
— Ферма 8, 9
— Эйлера—Лагранжа 201, 202
терминант 177, 179
точка крайняя (угловая) 109
— критическая 34, 37
— локального минимума 7, 8
— (максимума) 8
— сопряженная 250
— стационарная 16, 23
симплекс-метод 107, 108, ПО,
112, 129
субдифференциал 41, 43, 44
5-функция 121, 123, 266
управление 215
уравнение Эйлера 169
— Эйлера—Пуассона 194, 198,
208
С Л* Л*. Л*.
Предметный указатель
295
условие Вейерштрасса 246, 249,
251
— дополняющей нежесткости
34,49
— Лежандра 250
усиленное 250
— на концах (краевые) 168
— неотрицательности 13, 28, 49
— оптимальности 214
— Слейтера 47
— стационарности 23
по подвижным концам 183
— строгой положительности 11,
78
— трансверсальности 178
— Якоби 250, 261
усиленное 250, 260
Ф
фазовая переменная 215
— плоскость 232
— траектория 232
формализация 6
формула Вейерштрасса основная
246, 266, 268
— Тейлора 9, 65
функционал Больца 177, 179
функция аффинная 42, 118, 251
— Вейерштрасса 251
интегранта 251
— выпуклая 42
— замкнутая 42
— индикаторная 43
— квадратичная 43
— кусочно-непрерывная 215
— Лагранжа 27-29
— Минковского 43
— наклона поля 262
— опорная 43
— собственная 42
— сопряженная 118
вторая 118
— сублинейная 44
— целевая 108, 113
численное значение задачи
7, 124
экстремаль включена в поле
262
экстремаль 169
— допустимая 169
экстремум 6, 8
Об авторе
Галеев Эльфат Михайлович, доктор физи-
физико-математических наук, профессор кафед-
кафедры общих проблем управления механико-
математического факультета Московского го-
государственного университета им. М. В. Ломо-
Ломоносова. Автор более 85 научных работ, в том
числе ряда монографий по теории экстре-
экстремальных задач. Научные интересы: теория
приближений, теория экстремальных задач.
Оглавление
Предисловие 3
Введение 6
Глава 1. Экстремальные задачи 8
§ 1. Конечномерные задачи без ограничений 8
1.1. Постановка задачи 8
1.2. Необходимые и достаточные условия экстремума 8
1.2.1. Функции одной переменной 8
1.2.2. Функции нескольких переменных 11
1.2.3. Критерий Сильвестра 13
1.2.4. Метод Ньютона (метод касательных) 13
1.3. Правило решения 16
1.4. Примеры 17
1.5. Задачи, упражнения 22
§ 2. Конечномерные гладкие задачи с равенствами 23
2.1. Постановка задачи 23
2.2. Необходимые и достаточные условия экстремума 23
2.2.1. Принцип Лагранжа 23
2.2.2. Конечномерная теорема об обратной функции.
Теорема Вейерштрасса 25
2.2.3. Необходимое условие экстремума II порядка 26
2.2.4. Достаточное условие экстремума II порядка 26
2.3. Правило решения 27
2.4. Примеры 28
2.5. Задача Аполлония 29
2.6. Задачи 32
§ 3. Конечномерные гладкие задачи с равенствами
и неравенствами 33
3.1. Постановка задачи 33
3.2. Необходимые и достаточные условия экстремума 34
3.2.1. Принцип Лагранжа 34
3.2.2. Необходимое условие экстремума II порядка 34
3.2.3. Достаточное условие экстремума II порядка 35
3.3. Правило решения 36
3.4. Примеры 37
3.5. Задачи 40
298 Оглавление
§4. Выпуклые задачи 41
4.1. Элементы выпуклого анализа. Субдифференциал 41
4.2. Теоремы отделимости 45
4.3. Задачи без ограничений 46
4.4. Задачи с ограничением 46
4.5. Задача выпуклого программирования 47
4.6. Задачи, упражнения 52
§ 5. Элементы функционального анализа 53
5.1. Нормированные и банаховы пространства 53
5.1.1. Определение пространств 53
5.1.2. Произведение пространств 54
5.1.3. Примеры банаховых пространств 54
5.1.4. Сопряженное пространство, оператор 56
5.2. Определения производных 56
5.2.1. Производная по направлению 57
5.2.2. Вариация по Лагранжу 57
5.2.3. Производная Гато 57
5.2.4. Производная Фреше 57
5.2.5. Строгая дифференцируемость 58
5.2.6. Частные производные 59
5.2.7. Производные высших порядков 59
5.2.8. Контрпримеры на дифференцируемость 59
5.3. Некоторые теоремы дифференциального исчисления
в нормированных пространствах 62
5.3.1. Теорема о суперпозиции 62
5.3.2. Формула Тейлора 65
5.3.3. Теорема о среднем 66
5.3.4. Теорема о полном дифференциале 68
5.4. Дополнительные сведения из алгебры
и функционального анализа 69
5.5. Задачи 76
§6. Гладкая задача без ограничений 77
6.1. Постановка задачи 77
6.2. Необходимые условия I порядка 77
6.3. Необходимые и достаточные условия II порядка 78
§ 7. Гладкая задача с равенствами 80
7.1. Постановка задачи 80
7.2. Необходимые условия I порядка 80
7.3. Необходимые условия II порядка 82
7.4. Достаточные условия II порядка 83
§ 8. Гладкая задача с равенствами и неравенствами 84
8.1. Постановка задачи 84
8.2. Необходимые условия I порядка 84
Оглавление 299
8.3. Необходимые условия II порядка 88
8.4. Достаточные условия II порядка 93
§9. Элементы общей теории поля 99
Ответы к задачам главы 1 101
Глава 2. Линейное программирование 107
§ 1. Симплекс-метод 108
1.1. Постановки задач. Геометрическая интерпретация .... 108
1.2. Правило решения задач по симплекс-методу ПО
1.3. Примеры 113
1.4. Задачи 117
§ 2. Двойственность в линейном программировании 118
2.1. Элементы выпуклого анализа.
Преобразование Лежандра 118
2.2. Примеры 119
2.3. Вывод двойственных задач 121
2.3.1. Вывод задачи двойственной к задаче в общей форме . . 121
2.3.2. Вывод задачи двойственной к двойственной задаче
для задачи линейного программирования
в общей форме 122
2.3.3. Вывод задачи двойственной к задаче
в канонической форме 123
2.3.4. Упражнения 123
§3. Обоснование симплекс-метода 124
3.1. Теоремы существования, двойственности,
критерий решения 124
3.2. Свойства множества допустимых точек 127
3.3. Доказательство симплекс-метода 129
§ 4. Методы нахождения начальной крайней точки 131
4.1. Переход к решению двойственной задачи 131
4.2. Метод искусственного базиса 134
4.3. Примеры 136
4.4. Задачи 142
§ 5. Транспортная задача 143
5.1. Постановка задачи 143
5.2. Особенности задачи 145
5.3. Методы нахождения начальной крайней точки 146
5.4. Метод потенциалов 151
5.5. Примеры транспортных задач 152
5.6. Задача двойственная к транспортной задаче 160
5.7. Обоснование метода потенциалов решения
транспортной задачи 161
300 Оглавление
5.8. Задача о назначении. Пример 162
5.9. Задачи 165
Ответы к задачам главы 2 166
Глава 3. Вариационное исчисление 167
§ 1. Простейшая задача вариационного исчисления 168
1.1. Постановка задачи 168
1.2. Вывод уравнения Эйлера с помощью основной леммы
вариационного исчисления 168
1.3. Вывод уравнения Эйлера с помощью
леммы Дюбуа-Реймона 171
1.4. Векторный случай 173
1.5. Интегралы уравнения Эйлера 173
1.6. Примеры 174
1.7. Задачи 175
§2. Задача Больца 177
2.1. Постановка задачи 177
2.2. Необходимое условие экстремума 177
2.3. Многомерный случай 179
2.4. Пример 180
2.5. Задачи Больца 181
§3. Задача с подвижными концами 182
3.1. Постановка задачи 182
3.2. Необходимые условия экстремума 182
3.3. Пример 183
3.4. Задачи с подвижными концами 185
§4. Изопериметрическая задача 186
4.1. Постановка задачи 186
4.2. Необходимое условие экстремума 187
4.3. Пример 189
4.4. Задача Дидоны 190
4.5. Изопериметрические задачи 192
§5. Задача со старшими производными 193
5.1. Постановка задачи 193
5.2. Необходимое условие экстремума 194
5.3. Вывод уравнения Эйлера—Пуассона с помощью
леммы Дюбуа-Реймона 195
5.4. Пример 198
5.5. Задачи со старшими производными • • • • 199
§ 6. Задача Лагранжа 200
6.1. Постановка задачи 200
Оглавление 301
6.2. Необходимые условия экстремума 201
6.3. Примеры 204
6.4. Вывод уравнения Эйлера—Пуассона из теоремы
Эйлера—Лагранжа 207
6.5. Задачи Лагранжа 209
Ответы к задачам главы 3 210
Глава 4. Задачи оптимального управления 214
§ 1. Принцип максимума Понтрягина в общем случае 215
1.1. Постановка задачи 215
1.2. Формулировка теоремы 216
1.3. Доказательство 217
1.4. Пример 222
§ 2. Формулировка и доказательство принципа максимума
Понтрягина для задачи со свободным концом 225
§ 3. Избранные задачи оптимального управления 229
3.1. Простейшая задача о быстродействии 229
3.2. Аэродинамическая задача Ньютона 233
3.3. Примеры задач оптимального управления 238
3.4. Задачи оптимального управления 243
Ответы к задачам главы 4 244
Глава 5. Условия второго порядка в вариационном исчислении .... 246
§1. Простейшая задача вариационного исчисления 246
1.1. Сильный и слабый экстремум 246
1.2. Пример слабого, но не сильного экстремума 247
1.3. Условия Лежандра, Якоби, Вейерштрасса 249
1.4. Необходимые и достаточные условия слабого
и сильного экстремума 252
1.4.1. Игольчатые вариации. Условие Вейерштрасса 252
1.4.2. Игольчатые вариации. Аналог условия Вейерштрасса. . . 255
1.4.3. Необходимые условия сильного экстремума 257
1.4.4. Лемма о скруглении углов 259
1.4.5. Необходимые условия слабого экстремума 260
1.4.6. Поле экстремалей 262
1.4.7. Достаточные условия слабого экстремума 268
1.4.8. Достаточные условия сильного экстремума 268
1.4.9. Квадратичный функционал 269
1.5. Правило решения 271
1.6. Примеры 273
1.7. Задачи 277
302 Оглавление
§2. Задача Болыда 278
2.1. Сильный и слабый экстремум 278
2.2. Условия экстремума II порядка 279
2.2.1. Необходимые условия слабого экстремума 279
2.2.2. Достаточные условия сильного экстремума 281
2.2.3. Квадратичный функционал 284
2.3. Пример 286
Ответы к задачам главы 5 288
Список литературы 289
Список обозначений 290
Предметный указатель 292
Об авторе . 296