Author: Галеев Э.М.  

Tags: математика  

ISBN: 5-87597-024-3

Year: 1996

Text
                    МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ I
имени М.ВЛОМОНОСОВА
Механико-математический факультет
Э.М. Галеев
КУРС ЛЕКЦИЙ
ПО ВАРИАЦИОННОМУ
ИСЧИСЛЕНИЮ
И ОПТИМАЛЬНОМУ
УПРАВЛЕНИЮ
Москва 1996

Галеев Э.М. Курс лекции по вариационному исчислению и оптималь- ному управлению. В курсе лекций излагаются элементы функционального и выпуклого анализа, задачи без ограничении, выпуклые задачи, гладкие задачи с ограничениями типа равенств и неравенств для числовых функций п переменных и в норми- рованных пространствах. Рассматриваются задачи линей- ного программирования, их решение по симплекс-методу. Вводится понятие двойственности, дается ряд методов на- хождения первоначальной крайней точки. Полученные на- выки применяются к некоторым наиболее известным типам задач линейного программирования — транспортным за- дачам и задачам о назначении. Рассматриваются также следующие разделы теории экстремальных задач: класси- ческое вариационное исчисление, оптимальное управление, необходимые и достаточные условия экстремума в класси- ческом вариационном исчислении. Приведены примеры, ил- люстрирующие решение излагаемых типов задач. В помощь преподавателям, проводящим семинарские за- нятия, после теоретической части приводятся задачи для решения на семинарах, контрольных и домашнего задания. Рецензент: д.ф.-м.н., проф. В. М. Тихомиров 1702070000- 08 Г ЗШ7(ОЗ) — 96 Без объявл. ISBN 5-87597-024-3 © Галеев Э.М., 1966 г. © Издательство механико-матема- тического факультета МГУ, 1996г.
Оглавление Предисловие............................................. 6 1 Экстремальные задачи 8 1 Элементы функционального анализа.................... 9 1.1 Производная по направлению, вариация по.Ла- гранжу, производная Гато 9 1.2 Производная Фреше, строгая дифференцируемость. 10 1.3 Частные производные, производные высших.по- рядков 11 1.4 Основные теоремы.............................. 12 1.5 Контрпримеры на дифференцируемость..... 13 2 Задачи без ограничений............................. 15 2.1 Экстремумы функций одной переменной...... 15 2.2 Экстремумы функций нескольких переменных и функционалов.......................... 17 2.3 Теорема Вейерштрасса................... 19 2.4 Пример................................. 19 3 Гладкая конечномерная задача с равенствами ........ 20 3.1 Постановка задачи............................. 20 3.2 Правило множителей Лагранжа. Примеры....... 20 3.3 Задача Аполлония.............................. 23 4 Гладкая задача с равенствами и неравенствами ...... 25 4.1 Постановка задачи............................. 25 4.2 Правило множителей Лагранжа. Пример........ 25 4.3 Бесконечномерный случай....................... 27 4.4 Приведение квадратичной формы к главным осям. 28 5 Выпуклые задачи.................................... 31 5.1 Элементы выпуклого анализа. Суб дифференциал. 31 5.2 Теоремы отделимости........................... 32 5.3 Задачи без ограничений........................ 33 5.4 Задачи с ограничением......................... 33 5.5 Задача выпуклого программирования............. 34 3
2 Линейное программирование 37 1 Симплекс-метод........................................ 37 1.1 Элементы линейной алгебры. Постановки задач. . 37 1.2 Правило решения задач по симплекс-методу. ... 39 1.3 Примеры.......................................... 42 2 Двойственность в линейном программировании....... 46 2.1 Преобразование Лежандра.......................... 46 2.2 Примеры.......................................... 47 2.3 Задача двойственная к задаче в общей форме . . 49 2.4 Задача двойственная к двойственной задаче ... 50 2.5 Задача двойственная к задаче в канонической форме 51 3 Обоснование симплекс-метода........................... 52 3.1 Теоремы существования, двойственности, крите- рий решения............................................ 52 3.2 Свойства множества допустимых точек.............. 55 3.3 Доказательство симплекс-метода................... 57 4 Методы нахождения начальной крайней точки........ 60 4.1 Переход к решению двойственной задачи....... 60 4.2 Метод искусственного базиса...................... 63 4.3 Примеры.......................................... 64 5 Транспортная задача. . 70 5.1 Постановка задачи. . 70 5.2 Особенности задачи............................... 72 5.3 Методы нахождения начальной крайней точки. . 73 5.4 Метод потенциалов................................ 75 5.5 Примеры транспортных задач....................... 76 5.6 Задача двойственная к транспортной задаче. ... 83 5.7 Обоснование метода потенциалов решения тран- спортной задачи........................................ 84 5.8 Задача о назначении. Пример...................... 85 3 Классическое вариационное исчисление 88 1 Простейшая задача КВИ................................. 89 1.1 Постановка задачи................................ 89 1.2 Вывод уравнения Эйлера с помощью основной леммы вариационного исчисления........................ 90 1.3 Вывод уравнения Эйлера с помощью леммы Дю- буа-Реймона..................................... 92 1.4 Многомерный случай............................... 94 1.5 Интегралы уравнения Эйлера....................... 94 1.6 Примеры.......................................... 95 2 Задача Больца......................................... 98 4
2.1 Постановка задачи......................... 98 2.2 Необходимое условие экстремума............ 98 2.3 Многомерный случай........................100 2.4 . Пример................................. 101 3 Изопериметрическая задача.......................103 3.1 Постановка задачи.........................103 3.2 Необходимое условие экстремума............103 3.3 Пример................................... 107 3.4 Задача Дидоны............................ 108 4 Задача с подвижными концами.................... 111 4.1 Постановка задачи.........................111 4.2 Необходимые условия экстремума............111 4.3 Пример....................................112 5 Задача Лагранжа.................................115 5.1 Постановка задачи.........................115 5.2 Необходимые условия экстремума............116 5.3 Доказательство теоремы Эйлера-Лагранжа. ... 117 5.4 Примеры.................................. 119 6 Задача со старшими производными ................124 6.1 Постановка задачи.........................124 6.2 Необходимое условие экстремума............124 6.3 Пример....................................126 4 Задачи оптимального управления 128 1 Постановка задачи...............................129 2 Принцип максимума Понтрягина....................130 3 Пример..........................................131 4 Принцип максимума в частном случае..............133 5 Простейшая задача о быстродействии..............136 6 Аэродинамическая задача Ньютона.................140 7 Примеры задач оптимального управления...........142 5 Условия первого и второго порядка в КВ И 148 1 Сильный и слабый экстремум......................148 2 Пример слабого, но не сильного экстремума.......149 3 Условия Лежандра, Якоби, Вейерштрасса...........150 4 Условия экстремума 2 порядка в КВИ..............152 5 Примеры.........................................156 Литература 159 5
Предисловие Задачи на отыскание наибольших и наименьших величин являются ак- туальными на протяжении всей истории развития человечества. Осо- бенное значение они приобретают в настоящее время, когда возра- стает важность в наиболее эффективном использовании природных бо- гатств, людских ресурсов, материальных и финансовых средств. Все это приводит к необходимости отыскивать наилучшее, или как гово- рят, оптимальное решение того или иного вопроса. В настоящем курсе рассматриваются следующие разделы теории экстремальных задач: задачи без ограничений, гладкие задачи с огра- ничениями типа равенств и неравенств, линейное программирование, классическое вариационное исчисление, оптимальное управление, не- обходимые и достаточные условия экстремума в классическом вариа- ционном исчислении. При изучении требуется знание основ математического анализа и линейной алгебры, изучаемых на первых двух курсах технических и педагогических вузов, университетов. Предполагается, что чита- тели знакомы с элементарными приемами дифференцирования и ин- тегрирования функций, умеют решать простейшие дифференциаль- ные уравнения, знакомы с элементарными навыками работы с матри- цами (умножением, транспонированием, нахождением обратной). Все остальные используемые в курсе математические понятия подробно определяются. В первой главе приводятся элементы функционального анализа. Рассматриваются задачи без ограничений, гладкие задачи с ограниче- ниями типа равенств, с ограничениями типа равенств и неравенств для числовых функций п переменных и в нормированных пространствах. Для каждого типа задач приводятся решения соответствующих при- меров. Большое внимание уделяется выпуклым задачам. Даются эле- менты выпуклого анализа, причем выпуклый анализ в зависимости от уровня математической подготовки читателя может рассматриваться как в конечномерных пространствах, так и в линейных нормирован- 6
ных пространствах. Вторая глава посвящена линейному программированию. В ней вначале даются постановки задач линейного программирования, пра- вило решения задач по си мп леке-метод у, приводятся с решениями при- меры. Вводится понятие двойственности, затем проводится строгое обоснование симплекс-метода, дается ряд методов нахождения перво- начальной крайней точки. Полученные навыки применяются к неко- торым наиболее известным типам задач линейного программирования — транспортным задачам и задачам о назначении. В третьей главе приводятся элементарные задачи классического вариационного исчисления: простейшая задача, задача Больца, изо- периметрическая задача. Все эти задачи являются частным случаем более общей задачи Лагранжа. Как частный случай задачи Лагранжа рассматриваются задача с подвижными концами и задача со старшими производными. В четвертой главе рассматриваются задачи оптимального управле- ния. Приводится формулировка принципа максимума Понтрягина в общем случае, доказательство для задачи со свободным концом. Ре- шаются простейшая задача о быстродействии, задача Ньютона и ряд других задач оптимального управления. В последней пятой главе даны необходимые и достаточные условия экстремума в простейшей задаче классического вариационного исчи- сления. При написании пособия автором использован материал из книг, приведенных в списке использованной литературы. В их числе есть книги, написанные ранее самим автором (и в соавторстве с В.М.Тихо- мировым и др.), а также ряд известных монографий по данной тема- тике других авторов. Большинство примеров, приведенных в пособии, заимствовано из указанных монографий. Однако в некоторых из них для упрощения задачи могут быть изменены исходные данные или ци- фровой материал. Основная часть материала в течении многих лет читалась авто- ром на курсах по методам оптимизации, линейному программирова- нию, оптимальному управлению и вариационному исчислению в Мо- сковском государственном университете. Курс был разработан це- лым рядом профессоров и преподавателей механико-математического факультета МГУ, среди которых хотелось бы выделить В.М.Алексее- ва, В.М.Тихомирова, С.В.Фомина. Автор благодарит В.М.Тихомирова, у которого учился оптималь- ному управлению и вариационному исчислению и который внес наи- больший вклад в разработку этого курса. 7
Глава 1 Экстремальные задачи Теорию задач на отыскание наибольших и наименьших величин назы- вают теорией экстремальных задач. Слово maximum по латыни означает ”наибольшее”, слово minimum — ’’наименьшее”. Оба этих понятия объединяются словом ’’экстре- мум” (от латинского extremum, означающего ”крайнее”). Запись за- дачи f(x) —> extr означает, что мы должны решить задачу и на мини- мум, и на максимум. При этом следует отыскать не только абсолют- ные (глобальные) экстремумы , но и локальные . Задачу на максимум всегда можно свести к задаче на минимум, заменив задачу f(x) —> max задачей f(x) —> min, где f(x) = —/(ж), и наоборот. Поскольку мы за- ранее не всегда знаем, достигается экстремум или нет, то вместо min пишем inf (инфимум), а вместо max пишем sup (супремум). Абсолютный минимум (максимум) задачи — точку х называем ре- шением задачи и пишем х € absmin (absmax). Величина /(f), где х — решение задачи, называется численным значением задачи и обозна- чается Smin или Smax, если экстремум не достигается, то мы должны указать последовательность точек хп, на которой значение функции f(xn) стремится к величинам Sinf и S8Up. Теория экстремальных задач дает необходимые условия, которым должно удовлетворять решение задачи. Выписывая эти необходимые условия экстремума, мы находим некоторое множество точек, удовле- творяющее этим условиям. Это множество точек (мы называем их стационарными, или критическими, или экстремальными) возможно шире, чем множество абсолютных и даже локальных экстремумов. По- этому далее надо с каждой такой точкой разобраться, доставляет она экстремум (и какой) или нет. Одним из важнейших принципов решения задач с ограничениями является принцип Лагранжа снятия ограничений. Ниже он будет до- казан для некоторых конкретных типов задач. Сфера применимости принципа Лагранжа достаточно широка. Иногда нельзя к задаче при- менить имеющуюся теорему, однако этот принцип, примененный без обоснования, тем не менее может привести к решению. 8 L ---------------
Два (1) (2) Но не- 1 Элементы функционального анализа Для вещественных функций одного вещественного переменного определения — существование конечного предела Нт Л£+М-/(£) h—>0 h и возможность асимптотического разложения при h —> О — приводят к одному и тому же понятию дифференцируемости, уже для функций двух и большего числа переменных существует сколько различных подходов к понятию дифференцируемости (гладко- сти). Определение (1) ведет к понятиям производной по направлению, вариации по Лагранжу и производной Гато. Определение (2) ведет к понятиям производной Фреше и строгой дифференцируемости. Пусть далее в этом пункте X, У, Z — линейные нормированные про- странства. Через L(X, У) будем обозначать пространство линейных непрерывных операторов из X в У. Как правило (если это не огово- рено иначе), f : X —> У — отображение пространства X или некоторой окрестности точки х Е X в пространство У. 1.1 Производная по направлению, вариация по Ла- гранжу, производная Гато. Будем говорить, что отображение f имеет в точке х производную по направлению h, если существует • л-н-о А ' Если отображение f имеет в точке х производную по всем направле- ниям и 6+f(x,h) — — J+f(-/-ff/i) =: Jf(r,ft) V h Е X, то говорят, что отображение f имеет в точке х вариацию по Лагранжу. При этом отображение h —> <5/(i, h) называют вариацией по Лагранжу. Если оператор 6f (x, •): X —> У линеен и непрерывен по h (6f(x, •) Е £(Х,УП, то говорят, что f дифференцируемо по Гато в точке х, а оператор 5/(i, •) называется производной Гато отображения f в точке х и обозначается fr(x). Таким образом, если f дифференциру- емо по Гато в точке г, то для любого фиксированного h имеет место разложение f(x + АЛ) = f(x) 4- Л/г(f)[Л] + г(Л, А), где ||г(Л, А)||у = о(|А|) при А -> 0. 9
1.2 Производная Фреше, строгая дифференцируе- мость. Отображение / называют дифференцируемым по Фреше в точке х и пишут f € &(&)> если существуют линейный непрерывный оператор /'(£): X —> У и отображение г: X —> У такие, что f(x + Л) = /(£) + f'(x)[h] + г(Л), ||г(Л)||у = о(||Л||х) при \\h\\x -> 0. Оператор /'(i) называется производной Фреше. Это соотношение можно кратко записать так: понимая о(Л) как элемент пространства У, для которого ||о(Л)|| = о(||Л||) при ||Л|| —> 0. Через /'(я)[Л] обозначено значение отображе- ния «Л(я) на элементе Л. Ясно, что из дифференцируемости по Фреше отображения f в точке х следует дифференцируемость f в точке х по Гато. Уже в двумерном случае эти два понятия различаются. На языке е-6 определение дифференцируемости по Фреше отобра- жения f в точке х формулируется так: существует оператор f(x) 6 £(Х,У) такой, что для любого е > 0 найдется 6 > 0, при котором для любого ||Л|| < 6 выполняется неравенство ||/(i + A)-/(i) -/WJIIy <е||Л||х. Во многих задачах конечномерного и бесконечномерного анализа дифференцируемости по Фреше в точке недостаточно для получения содержательного результата. Это побуждает к следующему усилению дифференцируемости в точке. Пусть отображение f дифференцируемо по Фреше в точке х. Оно называется строго дифференцируемым в точке х (при этом пишут f G SD(x))i если для любого е > 0 найдется такое S > 0, что для всех и Х2, удовлетворяющих неравенствам ||xi - х|| < J, ||®2 ~ х|| < 6, выполнено неравенство Н/(аг1) - /(«2) - /(*)[*1 - *г]||у < е||«1 - Мх • Если /: R." -»• Rm — дифференцируемое в точке х отображение ко- нечномерного пространства Rn или некоторой окрестности точки х в пространство Rm, то производная Фреше — матрица, составленная из частных производных Эта матрица называется матрицей Якоби. Если т = п, то ее опреде- литель называется якобианом отображения f в точке х. 10
1.3 Частные производные, производные высших по- рядков. Рассмотрим отображение F.X х Y -> X, (i, у) € X х У. Если ото- бражение х —> F(xi у) дифференцируемо в точке х по Фреше, то его производная называется частной производной по х отображения F в точке (х,у) и обозначается F^{xyy) или . Аналогично опре- их .. dFy(x,y) деляется частная производная по у Гу(х,у) = — Дадим теперь определение второй производной функции несколь- ких переменных. Пусть f : Rn —> R — функция непрерывно дифферен- цируемая в некоторой окрестности точки х = (ii,..., хп). Говорят, что функция f дважды дифференцируема в точке i, если существует квадратичная форма Q, такая, что f(x + Л) = f(x) + лад + |<Э(Л) + г(Л), г(Л) = о(|Л|2). £ Квадратичная форма определяется симметрической матрицей, со- fd*f(x)\n ставленной из частных производных I -т——— 1 \dxidxj J ij=1 Возвратимся к случаю нормированных пространств. Если отобра- жение f:X —> У дифференцируемо в каждой точке х G X, то опреде- лено отображение х —> f'(x) пространства X в пространство £(Х,У). Поскольку ЦХ, У) также является нормированным пространством, то можно ставить вопрос о существовании второй производной Л*) = (/')'(*) е L(X,L(X,Y)). Для hi 6 X оператор /"(£)[/*i] Е £(Х, У). Возьмем Лг 6 X, тогда определено /"(я)[Л1, Л2] = /z/(i)[Ai][A2] 6 У. Таким образом, опреде- лено линейное по каждому аргументу отображение /"(i): X х X У. Аналогично определяются производные высших порядков. Теорема (о смешанных производных). [АТФ, с. 156] Если отобра- жение f Е D2(x) дважды дифференцируемо в точке х, то ладх. Л2] = f"&)[h2, А1] V hi, h2 G X. Замечание. Можно считать, что отображения определены (диф- ференцируемы) не на всем пространстве, а в окрестности рассматри- ваемых точек. 11
1.4 Основные теоремы дифференциального исчи- сления в нормированных пространствах. Приведем несколько теорем, наиболее часто используемых для реше- ния экстремальных задач. Теорема о суперпозиции. [АГТ, с. 25] Пусть X У, Z, = У, f — ip ° </>' X —> Z — суперпозиция отображений <р и ip. Тогда, если ip дифференцируемо по Фреше в точке у, а <р в точке х дифференцируемо по Фреше (дифференцируемо по Гато, имеет вари- ацию по Лагранжу), то f обладает в точке х тем же свойством, что и <р, и при этом соответственно /'(«) = ^'(у) °V’'(i)> /г(г) =’/''(у) °¥’г(£)> Sf(x, h) = A)] V he X. Если ip € SD(y) строго дифференцируемо в у, а 6 SD(x) строго дифференцируемо в х, то f G SD(x) строго дифференцируемо в х. Теорема о суперпозиции не имеет, вообще говоря, места, если ip дифференцируемо лишь по Гато. Формула Тейлора. [АТФ, с. 159] Пусть отображение f € Dn(x) п раз дифференцируемо по Фреше в точке х. Тогда имеет место разложение в ряд Тейлора f(x + Л) = /(f) + /'(f)(A] + |/"(*)[Л,Л] + •..+ l/<")(f)[h,...,Л] + Г(Л), а 71! где ||г(Л)|| = о(||Л||п) npuh—^O. Теорема о полном дифференциале. [АГТ, с. 29] Пусть ото- бражение F:X х У —> Z имеет в каждой точке (х,у) из некоторой окрестности точки (х,у) 6 X х У частные производные Fx(x,y) и Fy(x,y) 6 смысле Гато. Если отображения (х,у) -> Fx(x,y) и (х,у) —> Fy(x,y) непрерывны в точке (х,у), то F Е SD(x,y) строго дифференцируемо в той же точке и при этом F\x, , rj] = Fx(x, $)[£] + Fy(x, j/M 12
1.5 Контрпримеры на дифференцируемость. Приведем несколько контрпримеров, показывающих, что введенные в п.п. 1.1-1.2 понятия дифференцируемости действительно различны. Пример 1. Непрерывная функция не имеет в фиксированной точке производной ни по какому направлению: f : R -> R, f(x) = х sin —, х = 0. х Пример 2. Непрерывная функция имеет в фиксированной точке производную по всем направлениям, но не имеет в этой точке вари- ации по Лагранжу: /:R—>R, /(х) = |х|, х = 0. Пример 3. Отображение имеет в фиксированной точке вари- ацию по Лагранжу, непрерывно в этой точке, но не имеет в этой точке производной Гато. Определим отображение в полярных координатах х = (х1,хг) = (г cos <р, г sin <р) по формуле: /: R2 —> R, f(x) = rcos3^>, х = 0. (Нетрудно проверить, что вариация по Лагранжу 6f(x, h) не явля- ется линейным оператором по А.) Пример 4. Отображение имеет в фиксированной точке произ- водную Гато, но не имеет в этой точке производной Фреше: f : R2 -> R, f{x) = ( !’ = «!> «1 > 0> £ = (0,0). v [0, в остальных случаях, (Производная Гато /'(х, h) = 0, отображение разрывно в точке х = (0,0). Функция, дифференцируемая по Фреше, непрерывна в точке дифференцируемости (легко следует из определения).) Пример 5. Функция имеет в фиксированной точке производную Фреше, но не строго дифференцируема в этой точке: /: R -> R, /(») = ( *’’ Х Рационально, . = 0 [0, иррационально, (Эта функция имеет разрывы в любой окрестности нуля, а строго дифференцируемая функция непрерывна в некоторой окрестности х.) 13
Задачи. Найти производные Фреше следующих отображений. В задачах 1-4 Н — гильбертово пространство. 1. f:H -> R, f(x) = {а,х), а£Н. 2. f:H-+R, f(x) = {x,x}. 3. f-.H^R, f(x) = \\x\\ = y/^). 4. /:Я\{0}->Я, /(г) = рр В задачах 5-14 X = С([0, 1]) — пространство непрерывных на от- резке функций [0, 1]. 5. /:X->R, /(*(•)) = fx3(t)dt. о /1 \ 3 6. f:X^R,f(z())==lfx(t)dt] . \о / /1 \ 3 7. f :X-+R, . 8. f-.X^R, /(«(•)) = x(0). 9. f:X-*R, /«)) = z(0)x(lj. 10. f-.X-^X, f(x( ))=x( )x(l). 11. f; X -> R, f(x( )) = sin ®(0). 12. f:X-¥R, f(x(-)) = sina:(0)cosa:(l). 13. f : X -> R, /(«(•)) = jc(1)*(°) (£(/) > О V 0 < t < 1). 14. /: X R, f(x( )) = (sin^O))008**1). В задачах 15-17 указать точки, где функции /: Rn —> R не диффе- ренцируемы по Фреше. 15. 16. 17. /п \1/2 /(«) = (Е®?) \»=1 / f(x) = шах Ы. 1<»<л t=l 14
2 Задачи без ограничений В этом пункте даются необходимые и достаточные условия экстре- мума функций одной и нескольких переменных, а также функционалов в нормированных пространствах. Доказательство условий экстремума проводится в наиболее общем случае — в нормированных простран- ствах. 2.1 Экстремумы функций одной переменной. Пусть /: R —> R — функция одного действительного переменного. Рассмотрим задачу об отыскании экстремумов этой функции f(x) —> extr. Теорема 1 (Ферма). Если х 6 locextr/ — точка локального экс- тремума функции f и функция f G D(x) дифференцируема в точке х, то /'(*) = 0. Доказательство теоремы Ферма проходится сейчас в школе и здесь его мы не повторяем. Теорема Ферма дает необходимое условие I порядка для существования локального экстремума. Сформулируем условия I—II порядка. Теорема 2. Пусть функция f Е П2(х) дважды дифференцируема в точке х. Необходимые условия экстремума: если х 6 locmin (max) f — точ- ка локального минимума (максимума) функции f, то /'(£) = о, f"(x)>0 (/"(*)< °) Достаточные условия экстремума: если /'(*)=о, т>о (л^)<о), то х Е locmin (max) f — точка локального минимума (максимума) функции f. Доказательства теорем 1,2 будут даны в п. 2.2 для более общего случая. 15
В одномерном случае можно дать почти исчерпывающий анализ вопроса о том, является данная точка х локальным экстремумом или нет. Теорема 3. Пусть функция f 6 Dn(x) п раз дифференцируема в точке х. Необходимые условия экстремума: если х Е locmin (max) f — точ- ка локального минимума (максимума) функции f, то либо f'(x) — ... = f(n\x) = 0, либо fl(x) = ... = f2m~1\i) = o, /2m)(i)>o (/<2m>(«)<о) (1) при некотором 2 < 2m < п. Достаточные условия экстремума: если выполняется условие (1), то х 6 locmin (max) У — точка локального минимума (максимума) функции f. Доказательство. Пусть для определенности х 6 locmin/. По формуле Тейлора f(x + Л) = У2 + r(h), -> 0 при h -> 0. к: пп fc=0 Необходимость при п = 1 следует из теоремы Ферма. Пусть да- лее п > 1. Тогда либо /'(£) = ... = f^n\x) = 0, либо ff(x) = ... = /О-1) (ж) = 0, fW(x) 0, I < п. Возможно одно из двух: I — нечетно или I — четно. В первом случае положим р(£) = f(x + £ € R. То- гда ¥>(£) = f(x) + £ + r(\/^) (4j^T -> 0 при { -> о) — дифференцируемая в нуле функция. Поскольку х 6 locmin/, то 0 € locmin^. Отсюда по теореме Ферма у>'(0) = = 0. Проти- воречие показывает, что I должно быть четным: I = 2m. Поэтому из формулы Тейлора и условия х 6 locmin / имеем: f(x + h) - f(x) = + П(Л) > 0 -> 0 при Л -» о). Так как f(2m\x) / 0, то отсюда f(2m\x) > 0. Достаточность. Пусть ff(x) = ... = /(2m~1)(i) = 0, f2m(x) 0. Тогда по формуле Тейлора /(* + Л) - /(*) = + ГИЛ)> 0 при Л -> 0. Поскольку /^2m)(i) > 0, то f(x + h) — f(x) > 0 при достаточно малых h, т. е. х G locmin/. 16
2.2 Экстремумы функций нескольких переменных и функционалов. Пусть f:X -> R — отображение линейного нормированного простран- ства X во множество действительных чисел (в этом случае обычно го- ворим функционал на пространстве X), обладающее некоторой глад- костью, т. е. определенными свойствами дифференцируемости. Глад- кой задачей без ограничений называется задача об отыскании экстре- мумов этого функционала: f(x) —> extr. Теорема 1 (аналог теоремы Ферма в нормированных простран- ствах). Пусть х € locextr/ — точка локального экстремума функци- онала f и функционал f дифференцируем по Фреше (имеет вариацию по Лагранжу) в точке х. Тогда Л*) = 0 (<*/(£, А) = О VAGX). Доказательство. Возьмем произвольный, но фиксированный эле- мент h € X. Рассмотрим функцию у>(А) = f(x + АЛ). Поскольку х е locextr /, то 0 6 locextr <р — локальный экстремум функции <р. По теореме Ферма для функций одной переменной (0) = 0. По опреде- лению вариации по Лагранжу это эквивалентно тому, что 6f(x, h) — 0. В силу произвольности h 6f(x, h) = 0 V h 6 X. Если функционал f дифференцируем по Фреше в точке ж, то в этой точке он имеет вариацию по Лагранжу и /'(£)[Л] = Sf(x, h). По- скольку из уже доказанного следует, что эта вариация 6f(xt •) = 0, то и/'(£) = 0. Из теоремы 1 следует, что если точка х доставляет локальный экс- тремум дифференцируемой в точке х функции нескольких перемен- ных: /: Rn —> R, то все частные производные функции f в этой точке х обращаются в нуль, т. е. т = О^^ = ..1 = Жо. a?i хп Теорема 2. Пусть функционал f G D?(x) дважды дифференцируем в точке х. Необходимые условия экстремума: если х € locmin (max)/, то f'(x) = 0, f"(х)[Л, h] > 0 (/"(^)[А, Л] < 0) V h £ X. Достаточные условия экстремума: если = 0 и /"(;в)[Л, Л] > а||Л||2 (/"(£)[Л,Л] < -<*ЦЛЦ2) VA GX (1) при некотором а > 0, то х 6 locmin (max) /. 17
Доказательство. По формуле Тейлора (п. 1.4) f (£ + Л) = f(x) + f (х)[Л] + |/"(*)[*. А] + г(А), г(Л) = о(||Л||2). А Докажем теорему для минимума. Случаи максимума аналогичен. Необходимость. Поскольку х 6 locmin /, то во-первых по теореме Ферма f(x) = 0, во-вторых f(x 4-АЛ) — f(x) > 0 при достаточно малых Л. Поэтому в силу формулы Тейлора f(x 4- АЛ) - f(x) = — f"(£)[Л, Л] + г(АЛ) > 0 (г(АЛ) = о(|А|2)) при малых А. Разделим обе части последнего неравенства на А2 и устремим А к нулю. Поскольку г(АЛ)/А2 —> 0, то отсюда /"(ж)[Л, Л] > О V heX. Достаточность. Так как f(x) = 0, то по формуле Тейлора в силу заданного условия /"(я)[Л,Л] > а||Л||2 имеем: /(х + Л) — /(х) = Л] + r(h) > £||Л||2 + г(Л) > О при достаточно малых Л. Следовательно, х € locmin/. Неотрицательная определенность второй производной для функции нескольких переменных означает неотрицательную определенность ма- . р2/(х)\" , 'П трицы А = (дауД j=1 = {Ah,h)>0 V Л 6 R." <=> J2a<ihihi-° V Л = (Ль.. ,,ЛП) G Rn. »,J=1 Условие (1) называется условием строгой положительности (от- рицательности) второй производной Фреше функционала /. Отметим, что в конечномерных пространствах условие положи- тельной определенности матрицы А, т. е. условие (АЛ, Л) >0 V Л 6 R", Л 0, гарантирует строгую положительность матрицы А (и, значит, является достаточным условием минимума в стационарной точке). В бесконечномерных пространствах это не так [АТФ, с. 242]. Положительная и отрицательная определенности матрицы устана- вливаются с помощью критерия Сильвестра. Теорема (критерий Сильвестра). [АГТ, с. 219] Матрица А по- ложительно определена тогда и только тогда, когда все ее глав- ные миноры положительны, т. е. det А* > 0, к = 1,...,п (А* = и отрицательно определена тогда и только тогда, когда (-l)*det Ak > 0, k = 1,... ,п. 18
2.3 Теорема Вейерштрасса. Пусть /: Rn —> R — функция п переменных. При исследовании во- проса о достижении функцией экстремума часто используется следу- ющая теорема. Теорема Вейерштрасса. Непрерывная функция на непустом ог- раниченном замкнутом подмножестве конечномерного пространст- ва (компакте) достигает своих абсолютных максимума и минимума. Выделим простое следствие из этой теоремы, которое часто будем использовать. Следствие. Если функция f непрерывна на Rn и lim f(x) = +оо |г(->оо ( lim f(x) = —оо), то она достигает своего абсолютного минимума Х|х|->оо (максимума) на любом замкнутом подмножестве из R”. Напомним, что множество А в метрическом пространств называ- ется компактом, если из всякой последовательности элементов из А можно выбрать сходящуюся к элементу из А подпоследовательность или (равносильное определение) если из всякого покрытия А откры- тыми множествами можно выбрать конечное подпокрытие. Ограни- ченное и замкнутое подмножество конечномерного пространства явля- ется компактом. 2.4 Пример. f(x) = f(xi,x2) = xf - а51®2 + ~ 2a?i + -> extr. Необходимое условие I порядка экстремума гладкой функции: РМ - л - о - f 2®1 - - 2 = 0; /(х)-° \-xi + 2x2+l = 0. Решая эту систему уравнений, находим единственную стационарную точку х = (fi, Х2) = (1,0). Для проверки условий II порядка выписы- ваем матрицу вторых производных: (d2f(x)\2 =(2 -1\ Эта матрица по критерию Сильвестра положительно определена. По достаточному условию экстремума функции нескольких переменных точка (1,0) € locmin/. Поскольку lim f(x) — +00, то по следствию |г|->оо из теоремы Вейерштрасса (1,0) 6 absmin/, a Smax = +00. 1 1 Задачи без ограничений см. после п. 4.4 19
3 Гладкая конечномерная задача с равен- ствами 3.1 Постановка задачи. Пусть /»•: Rn —> R, г = 0,1,..., т, — функции п переменных, отобра- жающие пространство Rn в R. Конечномерной экстремальной зада- чей с ограничениями типа равенств называется следующая задача в Rn: /о(*) extr; fi(x) = 0, i = 1,..., т. (з) Считаем, что все функции обладают определенной гладкостью. 3.2 Правило множителей Лагранжа. Примеры. Теорема. Пусть х Е locextr з — точка локального экстремума в за- даче (з), а функции fit i = 0,1,..., m, непрерывно дифференцируемы в окрестности точки х (условие гладкости). Тогда существует не- нулевой вектор множителей Лагранжа А = (Ao, Ai,..., Am) 6 Rm+1, А 0, такой, что для функции Лагранжа задачи (з) т Л(я,А) = £А,Л(г) »=0 выполняется условие стационарности ЛГ(£,А) = О <=> =0, j = <=> £AJ/(i) = 0. eta, т-т 3 >=о Доказательство проведем от противного. Предположим, что условие стационарности не выполняется. Это означает, что векторы f{(x) = ..., Z- ), i = 0,1,..., m, линейно независимы. Поэтому (dfo(£) df0(x) \ dxi дхп I • • • ........ I ра- dfm f dfm(x) dxi dxn / вен m+ 1. Тогда по теореме о ранге матрицы существует матрица М порядка (m + 1) х (m + 1) с определителем, отличным от нуля. Допустим для определенности, что этой матрицей является матрица, 20
составленная из первых столбцов матрицы А: / dfo(x) dxi \ dxi dxm+i dfm(£) = det M / 0. He ограничивая общности, считаем, что fo(x) = 0. Действительно, если fo(x) 0, то следует рассмотреть функцию /0(®) = /о(я) - /о(£) и для нее будет fQ(x) = 0. Положим F(x) = (F0(x), •*, Fm(x)) = ДЛЯ Вектора X = (®i, . . ., Zm+i)’ Функция F отображает некоторую окрестность точки х = (£1,... ,®т+1) Е Rm+1 в Rm+1 и является (в силу условий гладко- сти теоремы) непрерывно дифференцируемым отображением в этой окрестности, F(x) = 0. Кроме того, якобиан отображения F в точке х отличен от нуля, т. е. det (= det М 0 . По теореме об обратной функции в конечномерных пространствах су- ществует обратное отображение F’1 некоторой окрестности нуля в окрестность точки х такое, что F“1(0) = х и |F“1(j/) — £| < К|у| с некоторой константой К > 0. В частности, для достаточно ма- лого по модулю е определен вектор я(е) = F^^O,.. .,0). Тогда F(x(e)) = (€,0,. ..,0), т. е. /о(х(е)) = е, Л(а?(е)) = 0, :=l,...,m, (1) для вектора х(е) = (п(е),..., ffm+ifc), ®m+2> • • • > хп) и при этом |£(е) - г| < К|е| <=> |х(е) - х| < К|е|. (2) Из соотношений (1)—(2) следует, что вектор х не доставляет в задаче экстремума, ибо вблизи его существуют допустимые векторы x(e)t на которых функционал /Ь принимает значения как большие так и мень- шие чем fo(x) (напомним, что fo(x) = 0). Получили противоречие с тем, что х 6 locextr з. Таким образом, наше предположение (против- ного) неверно и тем самым теорема доказана. Замечание. В правиле множителей Лагранжа для задач с ограни- чениями типа равенств можно, вообще говоря, не обращать внимание на тип экстремума и, убедившись, что Ао / 0 полагать Ао любой от- личной от нуля константой. Для задач, где присутствуют неравенства и включения, знак Ао оказывается существен. 21
Примеры. Пример 1. 4xi 4- Зж2 -> extr; ж2 + х% = 1. Решение. Функция Лагранжа А = Ао(4ж1 + Зж2) 4- А(ж2 4- х% - 1). Необходимое условие локального экстремума: А®! — 0 4Ао 4~ 2Аж$ — О, Ах3 = 0 <=> ЗАо 4“ 2Аж2 — О- Если Ао = 0, то А 0. Тогда из предыдущих уравнений вытекает, что Xi = ж2 = 0, но эта точка не является допустимой. Полагаем Ao = —1. Тогда Xi = 2/А, Х2 = 3/(2А). Подставляя ят2 в ограничение Xi 4- х% = 1, получаем, что 4/А2 4- 9/(4А2) = 1 <=> 25 = 4А2 <=> А = ±5/2. Соответственно имеем две стационарные точки (4/5,3/5), (—4/5, —3/5). По теореме Вейерштрасса существуют решения задач на максимум и минимум. Рассматривая значения функционала в стационарных точ- ках, получаем: (4/5,3/5) Е absmax, Smax = 5? (—4/5,—3/5) 6 absmin, Smin = —5. Пример 2. {Ax, x) —> extr; (ж, x) = 1 (iER”, A = (a<j)?.=1 — симметричная матрица). Решение. Существование решения задач на минимум и на макси- мум следует по теореме Вейерштрасса, поскольку сфера Sn-1 = {х Е R” | |х|2 = {х,х) = 1} компактна. Функция Лагранжа А = Ао(Аж, х) 4- А((ж, х) — 1). Необходимое условие локального экстремума: Аг = 0 4=> АоАж 4- Хх = 0. Если Ао = 0, то А 0. Тогда из условия стационарности х — 0, но эта точка не является допустимой. Полагаем Ао = — 1. Тогда Ах = Аж. Таким образом, стационарные точки — собственные вектора матрицы А. Домножив соотношение Ах = Хх на ж, получим, что (Аж, ж) = А(ж, ж) = А. Значит, решение задачи на минимум — собственный век- тор матрицы А, соответствующий наименьшему собственному значе- нию, решение задачи на максимум — собственный вектор матрицы А, соответствующий наибольшему собственному значению. 22
3.3 Задача Аполлония. Древнегреческим ученым Аполлонием (Ш-П век до н. э.) в книге ’’Ко- нические сечения” решается задача о проведении из некоторой точки к эллипсу самого длинного и самого короткого отрезка. При этом он решает даже более общую задачу, определяя все проходящие через эту точку отрезки, перпендикулярные к эллипсу. Решим задачу Аполло- ния с помощью метода Лагранжа неопределенных множителей. Формализованно задача записывается следующим образом: /Ь(®1, *г) = («1 - 6)2 + («2 -6)2 extr; ®2) = (®i/ei)2 + (®2/в2)2 -1 = 0 (<ц > а2 > 0). Функция Лагранжа А = Ao((«i - 6)2 + (ж2 - &)2) + A((a?i/ai)2 + (яг/аг)2) • Необходимое условие локального экстремума AXi = 0 <=> А0(я, - &) + Xxija% = 0, i = 1,2. Если Ао = 0, то А / 0, так как не все множители Лагранжа нули. Тогда xi = ж2 = 0, но эта точка не лежит на эллипсе. Полагаем Ао = 1. Тогда Xi = £,a2/(a2 + A), i = 1,2. Подставляя эти значения Xi в уравнение эллипса, получаем Число стационарных точек задачи (т. е. точек, соответствующих тем А, которые удовлетворяют уравнению (1)) не более четырех (см. рис. 1). Неравенство ^(0) = £2/a2 + f2/ai > 1 показывает, что у?(А) изображена для точки (fi, &), лежащей вне эллипса. Эллипс — ограниченное и замкнутое множество. По теореме Вей- ерштрасса решение задач на минимум и максимум существует. Для полного решения задачи надо решить уравнение (1), получить А,-, найти соответствующие точки ж(А,), подставить эти точки в /о и найти наименьшее и наибольшее из полученных значений функцио- нала. Соотношения ж, - 6 + Аж,/а2 = 0 <=> £, — ж,- = Аж,/а2, i = 1,2, имеют очевидный геометрический смысл: вектор £—ж пропорционален вектору-градиенту функции /1 в точке ж, т. е. лежит на нормали к 23
эллипсу. Этот факт был впервые установлен Аполлонием. Выведем из полученных нами соотношении уравнение кривой, ”раз- деляющей” те точки £, из которых можно провести две нормали, от точек, из которых можно провести четыре нормали. Очевидно, что это разделение происходит для А, удовлетворяющих соотношению (1), для которых //д\ _ 2£lql______^2а2 _ q д р / 2 2\ Л " М + А)3 («2 + Л)3 “ 0’ АЕ 2 ’ 2 Обозначим а2 + Л = A(fiai)2/3, тогда из (2) а| + А = — A({2®2)2^3- Из последних двух соотношений найдем, что А = (af — ai)2^3 + (&в2)2/3). Подставляя aJ+A, a|+A и А в (1), получаем уравнение разделяющей кривой {^)2l3+{M2l3=^-a^. Это уравнение астроиды. Вне астроиды каждая точка имеет две нор- мали к эллипсу, внутри нее — четыре, на самой астроиде — три (за исключением вершин, где имеются две нормали (рис. 2)). 2 23адачи с ограничениями типа равенств см. после п. 4.4 24
4 Гладкая задача с равенствами и нера- венствами 4,1 Постановка задачи. Пусть fi- Rn -> R> i = 0,1,..., m, — функции n переменных. Конеч- номерной экстремальной задачей с ограничениями типа равенств и неравенств называется следующая задача в Rn: /о(х) inf’ /»(х) - 0’ i = 1,..., m', fi(x) = 0, i = т' + 1,..., т. (з) Далее считаем, что все функции fi обладают определенной гладко- стью. В задачах, где имеются ограничения типа неравенств, важно, рассматриваемая задача на инфимум или супремум. Для определенно- сти мы будем рассматривать задачи на инфимум. 4,2 Правило множителей Лагранжа. Пример. Теорема. Пусть х € locmin з — точка локального минимума в за- даче (з), а функции fa, i = 0,1,..., т, непрерывно дифференцируемы в окрестности точки х (условие гладкости). Тогда существует нену- левой вектор множителей Лагранжа А = (Ao, Ai,..., Am) € Rm+1, А т О такой, что для функции Лагранжа задачи (з) Л(х, А) = Xifi(x) ’ i=0 выполняются условия: а) стационарности A,(f,A) = 0 <=> ЭЛ(Ж,А) = 0, j = 1,... ,п <=> £ A,/'(z) = 0; OXj J »=0 б) дополняющей нежесткости Xifi(x) — 0, i = 1,..., m'; в) неотрицательности Xi >0, i = 0,1,. . .,m'. Доказательство этой теоремы в более общем случае см. [АГТ, с. 51]. Точки, удовлетворяющие необходимым условиям локального экс- тремума, называются критическими. В задаче на супремум Ао < 0. 25
Пример. xl + xl + xl inf; 2xi — x2 4- x3 < 5, Xi + x2 4- x3 = 3. Функция Лагранжа A — Ao(®i + x% 4- x|) 4- Ai(2xi — x2 4- x3 — 5) + A2(xi 4- #2 + "" 3)* Необходимые условия локального минимума: а) стационарности А®! = 0 <=> 2Aqxi 4“ 2Ai 4- Аз — О, ЛХ2 = 0 <=> 2Aqx2 — Ai 4" Аз = О, Лдуз = 0 <=> 2Aqx3 4- Ai 4- Аз = 0; б) дополняющей нежесткости Ai (2xi — х2 4- х3 — 5) = 0; в) неотрицательности Ао >0, Аг > 0. Если Ао = 0, то из уравнений пункта а) выводим, что Ai = A3 = 0 — все множители Лагранжа — нули, а этого быть не может. Поэтому Ао / 0, полагаем Ао = 1/2. Предположим Ai 0, тогда в силу условия б) 2xi — х2 4- х3 — 5 = 0. Выражая xi, х2, х3 из условия а) через Ai, Аз и подставляя в уравнения х\ 4- х2 4- хз — 3, 2xi — Х2 4- хз — 5 = 0, получим, что Ai = —9/14 < 0 — противоречие с условием неотрицательности в). Пусть Ai = 0. Тогда xi = х2 = х3 = 1 — единственная критическая точка. Функция /(х) = Xi 4- sj 4- Х3 —> оо при |х| —> оо, значит по след- ствию из теоремы Вейерштрасса решение задачи существует, а в силу единственности критической точки решением может быть только она. Итак, х = (1,1,1) 6 absmin, Smin = 3. 26
4.3 Бесконечномерный случаи. Пусть X, У — линейные нормированные пространства. Отображение р.% _> у, функционалы fi*.X -> R, i = 0, Гладкой экс- тремальной задачей с ограничениями типа равенств и неравенств в нормированных пространствах называется следующая задача: /о(®) —>inf; fi(x) < О, i = 1,.. .,m, F(x) = 0. (з) Теорема (правило множителей Лагранжа). Пусть х 6 locmina — точка локального минимума в задаче (з), Х,У — банаховы про- странства (условие банаховости), отображения F,fi 6 SD(x), i = q । — строго дифференцируемы в точке х (условие гладко- сти), ImF'(f) — замкнутое подпространство в У (ослабленное усло- вие регулярности). Тогда существуют множители Лагранжа — век- тор X = (Ао, Ai,..., Am) G Rm+1 и функционал у* G У* не равные од- новременно нулю, (А, у*) 0, и такие, что для функции Лагранжа задачи (з) т ' A(x,A)/)=^Wi(®) + <y*,F(a:)> :=0 выполняются условия: а) стационарности м*, а, Л = о *=> £ А,/а*)[Л] + (у*. ПЭД = 0 V А € X :=0 т <=» £AJ/(i)+(FWy*=0; 1=0 б) дополняющей нежесткости Xififx) = 0, i = 1,..., т\ в) неотрицательности Xi > 0) г = 0,1,.. .,т. Доказательство этой теоремы см. [АГТ, с. 51]. Отметим, что в формулировке правила множителей Лагранжа для конечномерной теоремы нет требования о замкнутости подпростран- ства ImF'(i). Это так потому, что подпространство конечномерного пространства всегда замкнуто. 27
4.4 Приведение квадратичной формы к главным осям. Пусть А = (a<j)? .=1 — симметричная матрица (atJ = а,,-) и Q(x) = n У2 a.jXjXj = (Аж, ж) — соответствующая ей квадратичная форма. м=1 Теорема. В пространстве Rn существует ортонормированный базис fif-jfn, в котором квадратичная форма Q имеет предста- вление »=1 В базисе fa,...9fn матрица формы Q диагональна. Направления векторов /1,..., fn называются главными осями формы Q, а переход к базису fat..., fn называется приведением формы к главным осям. ]\окяагюелъС'ТЬъ. Если Q = 0, то Ai = ... = Ап = 0, /1,..., fn — любая ортонормированная система. Пусть Q =£ 0, тогда Q принимает положительные или отрицатель- ные значения. Для определенности считаем, что Q принимает отрица- тельные значения. Рассмотрим первую экстремальную задачу (Аж, х) —> min; {х,х)<1. (зх) Если Q принимает только неотрицательные значения, то надо рассма- тривать задачу на максимум. Решение ж = fa задачи (31) по теореме Вейерштрасса существует, так как сфера S = {ж 6 R” | (ж, ж) = 1} является компактом в R”, а функция (Аж,ж) непрерывна. Функция Лагранжа задачи (зх) А = Ао(Аж, ж) + А((ж, ж) - 1). Необходимые условия локального минимума: а) стационарности: А® = 0 <=> AoA/i + Xfa = О, б) дополняющей нежесткости: A((/i, Д) — 1) = 0; в) неотрицательности: Ао > 0, А > 0. Если Ао = 0, то А 0 и из пункта а) выводим, что fa = 0, но это противоречит условию б). Поэтому Ао 0, полагаем Ао = 1. Тогда из a) A fa = — Xfa. Умно- жая последнее равенство скалярно на Д, получим, что {Afa,fa) = -А(Д,Д) = 'S'min < 0- Значит, А > 0 И ПО условию б) (fat fa) = 1. Таким образом, fa — собственный вектор матрицы A, Afa = Xifa (Ai = —А), |Д1 = 1, Smin = Ai, Ai - минимальное собственное значение матрицы А. Обозначим Li = {ж в R" | (ж, Д) = 0} — подпространство в Rn. Если ф(ж) = 0 V ж € Li, то Аг = ... = Хп =0, Д, • •, fn — любая ортонормированная система из L\. 28
Пусть Q 0 на L±. Тогда Q на L\ принимает положительные или отрицательные значения. Для определенности теперь считаем, что Q принимает на L\ положительные значения. Рассмотрим вторую задачу {Ах.х) -> шах; (ж,х) < 1, (ж, А) = 0. (32) Решение х = А задачи (32) по теореме Вейерштрасса существует, так как сечение сферы S плоскостью L\ является по-прежнему ком- пактом. Функция Лагранжа А = А0(Аж, х) + А((ж, х) - 1) 4- 2д(ж, fa). Необходимые условия локального максимума: а) стационарности: А* = 0 <=> АоАА + А А + дА = 0, б) дополняющей нежесткости: А((А, A) — 1) = 0; ^в) неотрицательности: Ао < 0 (задача на максимум!), А > 0. Если Ао = 0, то из пункта а) выводим, что А А + дА = 0. В силу линейной независимости векторов А и А следует, что А = д = 0 — все множители Лагранжа — нули, а этого быть не может. Поэтому Ао / 0, полагаем Ао = — 1. Тогда из а) А А = А А + ДА- Умножая последнее равенство скалярно на А и учитывая ортогональ- ность векторов А и А, получим, что (АА, А) = ЧА, А) + м(А>А) = = Р О = Я </э. А1/1> = Д о = ц. Умно- жая полученное равенство А А = А А скалярно на А» получим, что ИА, А) = Л(А>А) = Smax > 0. Значит, А > 0 и по условию б) (A, А) == 1 Таким образом, А — собственный вектор матрицы А, А А = Аг А (Аг = А), векторы А и А ортогональны. Далее поступаем подобным образом. Вводим подпространство L2 = {х е Rn | (ж, А) = 0> (ж, А) = 0}- Если Q(x) = 0 V х Е L?, то Аз = ... — Ап = 0, — любая ортонормированная система из £г • Пусть Q ф 0 на L2. Тогда Q на £2 принимает положительные или отрицательные значения. Вновь рассматриваем задачу на мини- мум или максимум: (Аж, х) —> extr; (ж, ж) < 1, (ж, А) = (я, А) = 0- (Зз) Решая эту задачу, получаем единичный вектор А такой,что А А = Аз А, А ортогонально А и А- Поступая аналогично, в итоге придем к ортонормированному ба- зису А > • • • > fn из собственных векторов матрицы А с собственными п числами Ai,...,An. При этом для вектора ж = 52(Ж>А)А имеем »=1 Ах = Е -М*. fi)fi и :=1 <?(*) = (Ах, х) = ( £ Xi(x, fijfi^x, fMi) = £ А,(г, fi)2. »=i j=i «=1 29
Задачи. В следующих задачах найти критические точки, проверить их на экс- тремальность, а также найти все локальные и глобальные минимумы и максимумы. Задачи 1-5 — задачи без ограничений. ч 50 20 1. Ч------1----> extr. а?1 х2 2. xf — х% — 4xi + 6x2 —> extr. 3. 5xJ 4- 4xiX2 4- х| — 16xi — 12x2 —> extr. 4. Xj 4- х| 4- х| — xiX2 + xi — 2хз -4 extr. 5. 3xiX2 — xjx2 — xix% -4 extr. Задачи 6- 10 — задачи с ограничениями типа равенств. 6. х? + х| -4 extr; 3xi 4- 4х2 = 1. 7. е®1*2 -4 extr; хх 4-^X2 = 1- 8. 5xJ 4- 4xiX2 + х| -4 extr; xi + x2 = l. 9. xix|x| -4 extr; Xi 4- x2 4- X3 = 1. 10. X1X2X3 -4 extr; xj + x| + x| = 1, Xi 4- x2 4- X3 = 1. Задачи 11- 15 — задачи с ограничениями типа равенств и нера- венств. 11. xi "4 extr; 12 xi — 1- i=l :=1 12. 2xi 4“ 2xi 4- 4x2 ~ Зхз -4 extr; 8x1 — 3x2 4- Зхз < 40, —2xi 4- X2 — X3 = —3, X2 > 0. 13. 2x| 4- 2xi + 4x2 - 3x3 -4 extr; 8x1 - 3x2 4- Зхз = 40, —2xi 4" X2 — X3 < —3, X2 > 0. 14. еГ1“Гз — xi — X2 —> extr; xi 4- x2 < 1, xi >0, x2 > 0. 15. 3xi — llxi — Зхз — X3 -> extr; xi — 7x2 4- Зхз 4- 7 < 0, 5xi 4- 2x2 - хз < 2, хз > 0. 30
5 Выпуклые задачи Пусть в этом пункте X — линейное нормированное пространство, для простоты понимания можно считать, что X = Rn — конечномерное пространство. 5.1 Элементы выпуклого анализа. Субдифферен- циал. Напомним определение выпуклого множества. Множество А С X на- зывается выпуклым, если для любых двух точек ai и а2 из А и любого числа t 6 (0, 1) элемент tai 4- (1 — t)a2 € А. _ Пусть задана функция (функционал) f : X —> R := R U {—оо} U {+оо}. Множество epi / = {(a,x) е R х X | a > /(x)} в пространстве R х X называется надграфиком функции /. Функция / называется выпуклой, если надграфик / — выпуклое множество. Функция / называется собственной, если /(х) > —оо V х и / 4-оо. Мы будем изучать выпуклые собственные функции. Для краткости будем называть их просто ” выпуклые” функции. Из определения выпуклого множества сразу следует, что функция выпукла тогда и только тогда, когда выполнено неравенство Йенсена: f(txi + (1 - /)х2) < tf(xi) 4- (1 - t)/(x2) V хь х2 е X, V t е (0, 1). Субдифференциалом выпуклой функции f в точке х называется сле- дующее множество в сопряженном пространстве X*: 3/(х) = {У £ X* | (х - х, у) < f(x) - /(х) V х е X). Напомним, что сопряженным пространством X* называется прост- ранство линейных непрерывных функционалов на X. В случае X = Rn сопряженное пространство (Rn)* = Rn. Из определения сразу вытекает, что субдифференциал — выпуклое множество в X*. Легко доказать, что оно замкнуто. Субдифферен- циал дифференцируемой функции совпадает с ее производной. Возьмем для примера функцию /(х) = |х|. Тогда для нее _ f sign г, х/0, 31
5.2 Теоремы отделимости. При выводе необходимых условий экстремума (принципа Лагранжа) в выпуклых задачах и в задачах с равенствами и неравенствами не- обходимо пользоваться свойством отделимости непересекающихся вы- пуклых множеств. Определение 1. Множества А и В из пространства X называ- ются отделимыми, если существует линейный непрерывный функцио- нал А 6 X*, А О, для которого inf (А, а) > sup (А, Ь). ЬёВ Из определения следует, что множества являются отделимыми, если можно провести гиперплоскость Н = {х 6 X | (А,х) = с}, с 6 R» так что одно из множеств лежит в одном (замкнутом) полупространстве Н± = {ж 6 X | (А, х) > с}, а другое — в другом Я_ = {ж 6 X | (А,%) < с}. Определение 2. Множества А и В называются строго отдели- мыми, если существует линейный непрерывный функционал А 6 X*, для которого inf (А, а) > sup {А, Ь). а^А ьев Приведем результаты об отделимости в конечномерном случае. Теорема 1 (первая теорема отделимости в конечномерном случае). Пусть А и В — непустые выпуклые множества в Rn, А А В = 0- Тогда множества А и В отделимы. Теорема 2 (вторая теорема отделимости в конечномерном случае). Пусть А — непустое выпуклое замкнутое множество в Rn, b & А. Тогда точку b можно строго отделить от множества А. Доказательство этих теорем см. [ГТ, с. 20]. В случае нормированных пространств в первой теореме отделимо’ сти надо наложить дополнительное условие: одно из множеств, напри- мер А, должно быть открытым, либо требовать, чтобы внутренность множества должна быть непуста (int А 0) и (int А) А В = 0- Од- нако совсем обойтись без существования внутренних точек хотя бы у одного из множеств нельзя. Формулировка второй теоремы отдели- мости остается без изменений. 32
5.3 Задачи без ограничений. Выпуклой задачей без ограничений называется следующая экстремаль- ная задача: f(x) -> inf. (з) Здесь /: X —> R — выпуклая функция, отображающая простран- ство X в расширенную прямую. Теорема (аналог теоремы Ферма). Для того чтобы точка х до- ставляла в выпуклой задаче без ограничений (з) абсолютный мини- мум (х € absmina), необходимо и достаточно, чтобы выполнялось соотношение О е df(x). Доказательство, х 6 аЬэтшзЧ^ f(x) — f(x) > 0 = (0, х — х) V х Е X&0Edf(x). Поскольку из выпуклости функции f не следует, вообще говоря, выпуклость функции —то существенно, что рассматривается задача минимизации, а не максимизации. 5.4 Задачи с ограничением. Выпуклой задачей с ограничением (или просто выпуклой задачей) на- зывается следующая экстремальная задача: f(x) -4 inf; х € В. (з) Здесь /: X —> R — выпуклая функция, отображающая простран- ство X в расширенную прямую, В С X — выпуклое множество. Теорема. Пусть х 6 locminз — доставляет локальный минимум- в выпуклой задаче (з). Тогда х 6 absmin3 — доставляет абсолютный минимум в этой задаче. Доказательство. Пусть х 6 locminз. Это означает, что суще- ствует окрестность U точки ж, такая, что —оо < f(x) < f(x) V ж Е U П В. Возьмем произвольную точку х € В. Тогда х = (1 — а)х 4- as Е ипв при достаточно малом а > 0. Следовательно, по неравенству Йенсена f(x) < f(x) < (1 - a)f(x) 4- а/(ж), откуда af(x) < otf(x) /(*) $ f(x) У х 6 В. Значит, х доставляет абсолютный минимум в задаче (з). Из теоремы следует, что в выпуклой задаче локальный минимум является и абсолютным (глобальным). Поэтому в дальнейшем в вы- пуклых задачах, говоря ’’минимум”, имеем в виду абсолютный мини- мум. 33
5.5 Задача выпуклого программирования. Задачей выпуклого программирования называется следующая экстре- мальная задача: /о(я) —> inf; fi(x) < 0, i = 1,..., m, х G А. (з) Здесь fi:X —> R, i = 0,1,..., m, — выпуклые функции, отобража- ющие пространство X в расширенную прямую, А С X — выпуклое множество. Точка х называется допустимой в задаче (з), если х 6 А и выпол- няются все заданные ограничения типа неравенств. Упражнение. Докажите, что задача выпуклого программирова- ния является выпуклой задачей, т. е., что множество допустимых эле- ментов в этой задаче является выпуклым множеством. Теорема Куна-Таккера. 1. Если х G absmins — решение задачи выпуклого программирования, то найдется ненулевой вектор множи- телей Лагранжа Л = (Ао, Ai,..., Am) 6 Rm+1, такой, что для функции т Лагранжа Л(я,А) = $2 ^ifi(x) выполняются условия: i=0 а) принцип минимума для функции Лагранжа minA(x, А) = Л(ж, А); б) дополняющей нежесткости: Xifi(x) =0, : = 1,..., m; в) неотрицательности: А,- > 0, г = 0,1,..., т. 2. Если для допустимой точки х выполнены условия а)-в) и Ао 0, то х 6 absmins. 3. Если для допустимой точки х выполнены условия а)-в) и выпол- нено условие Слейтера (т. е. существует точка х 6 А, для которой fi(x) <0, i = 1,..., т), то х 6 absmins. Доказательство. 1. Пусчь х G absmins. Не ограничивая общности, считаем, что fo(x) = 0 — иначе введем новую функцию /0(х) = fo(x) — fo(x). Положим В = {Ь = (6О,61,... ,bm) е Rm+1 I 3 X G А : fi(x) < bi, I0.1,... ,m}. (1) 34
А) В — непустое выпуклое множество. Действительно, R™+1 С q т. е. любой вектор с неотрицательными компонентами принадле- жит В, ибо в (1) можно положить х = х. Докажем его выпуклость. Пусть b и bf принадлежат В. Надо доказать, что а6+(1—а)Ь' 6 В V а 6 (О, 1)- Поскольку точки 6,6' 6 В, то по определению множества В су- ществуют х,х' е Л такие, что fi(x) < bif Л(я') < i - Положим ха = алг + (1 -а)я'. Тогда ха £ А, поскольку А — выпукло, а ввиду выпуклости функций fa, i = 0,1,..., m, по неравенству Йенсена ft(za) = fi(ax + С1 ~ а)х') < <*fi(x) + (1 ~ <*)fi(xf) < abi + (1 - т. е. точка ab 4- (1 - а)Ы £ В. Обозначим С = {с = (со, 0,..., 0) 6 Rm+1 | со < 0). Б) С — непустое выпуклое множество и С А В = 0. Действи- тельно, если бы существовала точка с G С АВ, то ввиду определения (1) отсюда следовало бы, что имеется элемент х £ А, для которого выпол- няются неравенства: fo(x) < с0 < О, fi(x) < 0, i = 1,..., т. Но из этих неравенств следует, что fo(x) < fv(x) = 0, т.е. х £ absmina. Получили противоречие с условием теоремы х £ absmina. Значит С А В = 0. По первой теореме отделимости в конечномерном случае множества В и С можно отделить, т. е. существует вектор А = (Ао, Ai,..., Am) / 0, для которого т т inf > Xibi > sup > A*Ci = sup Аосо > 0 . beB^i "c^ co<0 Таким образом, ^а,ь,->о v be в. »=0 (2) Из неравенства (2) будут выведены условия неотрицательности, допол- няющей нежесткости и принцип минимума. В) Множители Xi, г = 0,..., т, удовлетворяют условиям неотри- цательности. Действительно, поскольку, как мы уже говорили, любой вектор с неотрицательными компонентами принадлежит В, то вектор (0,...,0,1,0,...,0) € В, где единица стоит на i-ом месте. Подставив эту точку в (2), получим, что Xi > 0. 35
Г) Множители At-, i = 1,...,тп, удовлетворяют условиям допол- няющей нежесткости, т. е. А^/Дх) =0, i = 1,... , m. Действительно, точка (0,... ,0,/Дх),0,... ,0) € В (в определении множества В бе- рем х = х). Тогда в силу неравенства (2) имеем Xifi(x) > 0. Бели > 0, то (так как А, > 0) fi(x) >0 — это противоречит допу- стимости точки х. Значит, Xifi(x) = 0. Д) Принцип минимума. Возьмем точку х € Л, тогда точка (/о (я), /1(х), < • •, /т(®)) € В. Отсюда по неравенству (2) т т А(®, А) = А,/,(х) > 0 = £а,/,(£), »=0 i=0 так как fo(x) = 0 и Xifi(x) = 0, i = 1,..., т. Таким образом, принцип минимума для функции Лагранжа доказан. 2. Пусть для допустимой точки х выполнены условия а)-в) и Ао / 0. Положим Ао = 1. Тогда для любой допустимой точки х будет выпол- няться неравенство т f0(x) 2 /©(£) + £a,A(z) d=f Л(х, А) < 1=1 а) _т_ в) < Л(х, А) /о(*) + £>Л(*) < /о(х). 1 = 1 Это означает, что х G absmins. 3. Пусть для допустимой точки х выполнены условия а)-в) и вы- полнено условие Слейтера. Предположим, что при этом Ао = 0. Так как вектор А / 0, то в силу условия неотрицательности существует Aj > 0, j 6 {1,..., m}. Следовательно, ш в% т Л(*,А) = £>/•(*) < Wi(*) < 0 2 £А,Л(г) = А(х, А). 1=1 1=1 Но это неравенство противоречит с условием а). Значит, наше пред- положение, что Ао = 0 неверно. Поэтому Ао 0 и по доказанному п. 2 х € absmins. Теорема Куна-Таккера полностью доказана. 36
Глава 2 Линейное программирование В линейном программировании изучаются задачи об экстремуме ли- нейной функции нескольких переменных при ограничениях типа ра- венств и неравенств, задаваемых также линейными функциями. Рождение линейного программирования принято отсчитывать от работы Л.В.Канторовича 1939 года, где впервые было показано, что многие задачи экономики формализуются как задачи об экстремуме линейной функции при линейных ограничениях. Канторович для рас- смотренного им класса задач ввел двойственные переменные, дал им содержательную экономическую интерпретацию и описал алгоритм решения двойственной задачи близкий по духу к симплекс-методу. Через несколько лет (около 1947 года) интерес к подобным задачам возник у американских математиков. Этот интерес был вызван про- блемами, связанными с экономикой и военно-промышленным комплек- сом. Из числа экономистов, пропагандировавших среди математиков данный класс задач, следует прежде всего назвать Т.Купманса. Он же ввел термин ’’линейное программирование” (linear programming). Впоследствие Канторовичу и Купмансу была присуждена Нобелевская премия по экономике за 1975 год. Симплекс-метод был разработан Д.Данцигом. Общая теория была построена коллективом математиков, среди которых хотелось бы от- метить так же Куна, Таккера, Гурвица и Дж. фон Неймана. 1 Симплекс-метод 1.1 Элементы линейной алгебры. Постановки задач. Общей задачей линейного программирования назовем задачу (с, х) -> min; Ах < Ь. (з) 37
Задачи линейного программирования рассматриваются, как пра- вило, приведенными к канонической (с, х) —> шах; Ах = Ь, х > 0, (з*) или к нормальной форме (с, х) —> шах; Ах <6, х > 0. (зп) Здесь х = (®1,..., хп) Е R” — неизвестная переменная, задан- ные вектора с = (сх,..., сп) € Rn и b = (&i,... ,bm) Е Rm, (с, х) := п 52 сзхз — скалярное произведение векторов сиг, А = {д4} J=1 m = >=1 /=Г,..’,П / а} ... а? \ / а1 \ I...........I — заданная матрица со столбцами = | ... I, \ aL ... а* / \ al„ / \ т m / \ т / j = 1,..., п,размеров т х п. Обозначим 5з — численное значение задачи (з), Arga — множество решений задачи (з), т. е. множество допустимых точек х Е R”, для которых (с, аг) = S3. Каноническая форма более удобна при описании алгоритмов реше- ния, задачи в общей и нормальной формах часто используются при рас- смотрении проблем существования решений и двойственности. Двой- ственные задачи для задач в нормальной форме приобретают наиболее симметричный вид. Задачи в различных формах легко сводятся друг к другу путем введения дополнительных координат и изменением матрицы А. На- пример, если дана задача в нормальной форме, то ее можно свести к задаче в канонической форме путем введения дополнительных коор- динат X = (хп4.1,..., ffn+m): (с, х) —> шах; Ах 4- 1х = 6, х > 0, х > 0. Здесь I — единичная матрица размеров т х т. В качестве упражнений попробуйте самостоятельно свести другие формы задач линейного программирования друг к другу. Рассмотрим более подробно задачу линейного программирования в канонической форме. Через Изк будем обозначать множество до- пустимых точек в задаче (з*) (Лзк := {z Е Rn | Ах = 6, х > 0}). Множество D3k является выпуклым многогранником в пространстве Rn. Нетрудно видеть, что экстремум линейной функции (если он су- ществует) достигается в крайней (угловой) точке выпуклого много- гранника. 38
Напомним, что точка d выпуклого множества D называется край- ней (угловой), если не существует точек di,d2 Е D, dx ± d2, и числа t 6 (0, 1) таких, что d = tdi + (1 — t)d2. У многогранников крайние точки — вершины. Имеет место следующая Теорема Крейна-Мильмана. Выпуклый компакт в Rn явля- ется выпуклой оболочкой своих крайних точек. Число крайних точек множества D, задаваемого в виде конечного числа линейных равенств и неравенств, является конечным. Таким образом, для решения задачи линейного программирования (если оно существует), достаточно перебрать значения функции (с, х) во всех крайних точках множества D. Но нахождение всех этих крайних то- чек и перебор значений функции (с, х) — операция довольно трудоем- кая. Описываемый ниже симплекс-метод решения задачи линейного программирования позволяет, начиная с некоторой исходной крайней точки, переходить к другой по направлению наибольшего возрастания функции (с,х). Задача (з*) называется невырожденной, если любая крайняя точка множества D^k содержит ровно т положительных координат. Пусть х — крайняя точка в невырожденной задаче с положитель- ными координатами (для определенности первыми) . ,хт. Тогда вектор х можно представить в виде х = (хь, хп)> где х& = (xi,..., хт) — базисный вектор, х, > О, г = хп = (0,... ,0) G Rn“m — небазисный вектор. Аналогично матрицу А можно представить в виде А = (Аь> Ап). Будет доказано в п. 3.2, что матрица Аь невырожденная, то есть ее определитель отличен от нуля. 1.2 Правило решения задач по симплекс-методу. Для решения невырожденной задачи линейного программирования сле- дует: 1. Привести задачу к задаче в канонической форме (з^). 2. Отыскать крайнюю точку х = (хъ..., хт, 0,..., 0), х, > 0, i = ..., m, множества допустимых элементов Изк. Методы нахождения начальной крайней точки будут описаны ниже в параграфе 4. 3. Построить симплексную таблицу для начальной крайней точки х. Пояснения к построению таблицы: В таблице т + 4 строки и п + 4 столбца. В первом столбце, начиная с третьего по т + 2-е место, находятся базисные векторы а1,..., ат, соответствующие положительным коор- динатам начальной крайней точки х = (xi, ..., xm, 0,..., 0). Во втором столбце на аналогичных местах стоят значения cj век- тора с с теми же номерами, что и столбцы <Р. 39
Последний столбец заполняется при исследовании симплексной та- блицы. В первой строке, начиная с четвертого столбца, стоят элементы сь...,сп. Вторая строка, начиная с третьего столбца, — векторы 6, а1,..., ап. Под ними — разложения этих векторов по базису а1,... ,ат. Ясно, т что b = 22 а*х<<=> Ах — Ъ- То есть разложением вектора b явля- i=i ется вектор хъ ненулевых координат крайней точки х. Предполо- жим, что вектора о7, j = 1,..., п, имеют следующее разложение по базису а3 = a'x*j а3 — Аъх3 <=> А = А&Х, где »=1 X = . >т — матрица разложений векторов а1,..., ап по базису j=l, . ,п а1,..., аш, состоящая из столбцов х1,..., хп. Тогда X = А^1 А} то есть неизвестные векторы-столбцы х3 отыскиваются с помощью обратной матрицы: х3 = А^1а3. Очевидно, что при i = 1,..., т разложения век- торов а' тривиальны: а* = а*, то есть в этом случае х3 = 1 = е3 \ О/ (е3 — вектор-столбец канонического базиса). В предпоследней строке z в столбце под вектором Ь (хъ) запишем 2о = (сб,хь). Тогда zq — значение функционала в начальной крайней точке х. Под векторами а3, j 1,..., п, запишем Zj = (сь, х3)> то есть z = (zi,..., zn) = сьХ. Очевидно, что Zj = Cj при j = 1,..., т. В последней строке А, начиная с четвертого столбца, записыва- ется разность между элементами предпоследней строки и элементами первой строки: А = z — с <=> А,- = zt- - с,, i = 1,..., п. С С1 СТП Ст 4-1 cjo cn t базис Ь (хь) а1 ат ат+1 а30 an а1 С1 Х1 1 0 zljo xln tl а»° с»о xio 0 0 xiojo xion ^io ат стп хт 0 1 хтт+1 xmja xmn tm Z (сь, Хъ) С1 (сь, Жт+1) (CbyX30) (cfr, xn) А 0 0 Дт4-1 Ajo An I 4. Исследовать симплексную таблицу. а) Если А > 0. то крайняя точка х — решение задачи (ж 6 Arg3*). 40
б) Если для некоторого j < 0 и х^ < 0, то значение задачи = +°°; в) Пусть в строке А имеются отрицательные числа, а соответству- ющие столбцы х-7 содержат положительные числа. Предположим, что min Aj = Aj0 < 0. Ясно, что т + 1 < jo < п Столбец, соответствующий индексу jo называется разрешающим столбцом. Если min Aj достигается на нескольких значениях j, то в качестве разрешающего столбца выбираем столбец с любым таким индексом. Обозначим ti := < —— | Xij0 > 0 > > 0. Эти значения /, ста- xijo J вим соответственно в последнем столбце симплексной таблицы. Пусть ti = min ti >0. Строка вектора а*° называется разрешающей. Если 0 « min/, достигается на нескольких значениях г, то в качестве разрешаю- щей строки выбираем любую такую строку. Элемент xtojo называется разрешающим элементом симплексной таблицы. Далее необходимо из числа базисных векторов исключить вектор а*°, вместо него взять вектор а70. Значение функционала на новой крайней точке х' с новыми базисными векторами а1,...,а’0”1,а70, а*о+1, ... ,аш, возрастет на величину —/,-оА7о. 5. Построить новую симплексную таблицу для нового базиса а1,..., а*0-1, а70, а*о+1,..., ат, т. е. фактически разложить векторы Ь, а1,..., ап, по новому базису. Укажем без обоснования (оно будет приведено в п. 3.3) способ построения новой симплексной таблицы по предыдущей. Элементы таблицы х~, лежащие под векторами Ь, а1,..., ап, и не ле- жащие в разрешающем столбце или разрешающей строке старой сим- плексной таблицы, вычисляются по правилу прямоугольника: х'. = Xi _ 2», х>. = х.. _ , i ± io> j ± jOt xiojo xiojo из числа Xij вычесть произведение XiQj на XijQf деленное на х^0. Ясно, что в разрешающем столбце новой симплексной таблицы zJoJo = 1, остальные элементы равны нулю = 0, i\ ф г’о, t = 1,...,т). Эле- менты разрешающей строки новой таблицы вычисляются путем деле- ния элементов разрешающей строки старой таблицы на a?tojo: п. — Х*о — Х'°Э А — 1 Ж*° ~ х- ' Xioj ~ х- • ’ ” 1’* *»ojo x«oJo Далее необходимо вновь исследовать симплексную таблицу, т. е. вернуться к п. 4 и так далее, пока не придем к решению задачи. Отметим, что симплекс-метод позволяет решать точно так же и вы- рожденные задачи линейного программирования. Число положитель- нЫх координат крайней точки в таких задачах может быть меньше 41
т, но число базисных векторов всегда равняется рангу матрицы А, величина может оказаться равной нулю. 1.3 Примеры. Пример 1. Решить невырожденную задачу линейного программиро- вания в канонической форме 2xi 4- х2 4- х3 — z4 —> max; х, >0, i = 1,2,3,4, xi — х2 4- хз = 1, 2xi + х2 4” х4 — 3. с заданной начальной крайней точкой х = (0,0,1,3). Решение. Базисные векторы а3 = (1,0) и а4 = (0,1). Составим первую симплексную таблицу с 2 1 1 -1 t базис Хь а1 а2 а3 а4 а3 1 1 1 -1 1 0 а4 -1 3 2 1 0 1 3 Z -2 -1 -2 1 -1 д -3 -3 0 0 Из таблицы видно, что в качестве разрешающего столбца можно взять столбцы а1 и а2. Возьмем для определенности столбец а2. Тогда t = 3, разрешающая строка а4. Заменяем в базисе вектор а4 на вектор а2 и для нового базиса строим вторую симплексную таблицу: с 2 1 1 -1 t базис Хь а1 а2 а3 а4 а3 1 4 3 0 1 1 а2 1 3 2 1 0 1 Z 7 5 1 1 2 А 3 0 0 3 Вектор А > 0, поэтому точка х = (0,3,4,0) является решением задачи и = 7. Если бы в качестве разрешающего столбца в первой симплексной таблице взяли столбец а1, то пришли бы к той же точке (0,3,4,0), но за большее число шагов. 42
Пример 2. Решить невырожденную задачу линейного программи- рования в канонической форме + ж2 + ж3 + ж4 + г5 + хб -> шах; > 0, i = 1,..., 6, + х2 4" 2®з 4- 3®4 4- 6^6 = 9, 4- + ац + = 3, + ®4 “ ^5 4- 2а?б = 4- Хб = 1, с заданной начальной крайней точкой х = (1,2,0,0,1,1). Решение. Базисные векторы а1 = (1,0,0,0), а2 = (1,1,0,0), а5 = (1 1 0 6\ 0 0 -1 2 I Не явля“ 0 0 0 1/ ется единичной, поэтому найдем для нее обратную матрицу. Для этого записываем рядом две матрицы: нашу матрицу Аь и единичную. Далее сводим матрицу Аь к единичной путем элементарных преобразований строк. Полученная в результате преобразований матрица на месте единичной матрицы и является обратной к нашей матрице Аь- Напомним, что элементарными преобразованиями матрицы явля- ются: а) перестановка двух строк, б) умножение строки на число от- личное от нуля и в) прибавление к одной строке другой строки, умно- женной на любое число. /1 1 0 6 1 0 0 0\ /1 0 0 5 1 -1 0 0\ 01010100] 10101 01 00] 00 -1 2 0 0 1 0 I I 0 0 1 -2 0 0 -1 0 I "* \0 0 0 1 0 0 0 1/ \0 0 0 1 0 0 0 1/ /10001-10 —5\ /1 0 0 0 1 -1 0 -5\ 010101 0 0 | 1 0 1 0 0 0 1 0 —1 1 0 0 1 -2 0 0 -1 О 1~*[ 0 0 1 0 0 О -1 2 Г \0 0 0 1 0 0 О 1 / \0 0 0 1 0 0 0 1/ На первом этапе мы умножили третью строку на -1, из первой строки вычли вторую. На втором этапе из первой строки вычли пятую, умно- женную на 5. На третьем этапе из второй строки вычли пятую, а к третьей строке прибавили удвоенную пятую. (1-10-5 0 10-1 0 0—12 0 0 0 1 43
Далее находим разложения векторов а3, а4 по базису а1, а2, а5, а6: (1 -1 0 —5\ /2\ / 1 \ ° 1 ° -1 I 4-1 1 I О 0 -1 2 I I 1 I “ I -1 Г ООО 1 / \о/ \ о / (1 -1 О —5\ /3\ /-3\ ° 1 ° -1 I Ч = I ° О О -1 2 I I 1 I I 1 I ООО 1 / \1/ \ 1 / Разложением вектора b является вектор (1,2,1,1) ненулевых координат крайней точки. Составим первую симплексную таблицу С 1 1 1 1 1 1 t базис Хь а2 а3 а4 а5 а® а1 1 1 1 0 1 -3 0 0 а2 1 2 0 1 1 0 0 0 а8 1 1 0 0 -1 1 1 0 1 аъ 1 1 0 0 0 1 0 1 1 —*• Z 5 1 1 1 -1 1 1 А 0 0 0 -2 0 0 Разрешающий столбец а4. В качестве разрешающей строки можно взять строки а5 и а6. Возьмем для определенности строку а6. Тогда t = 1, разрешающая строка а6. Заменяем в базисе вектор а6 на вектор а4 и для нового базиса строим вторую симплексную таблицу: с 1 1 1 1 1 1 t базис ХЬ а1 а2 а3 а4 а8 а6 а1 1 4 1 0 1 0 0 3 а2 1 2 0 1 1 0 0 0 а8 1 0 0 0 -1 0 1 -1 а4 1 1 0 0 0 1 0 1 Z 7 1 1 1 1 1 3 Д 0 0 0 ' 0 0 2 Вектор Д > О, поэтому точка х = (4,2,0,1,0,0) является решением задачи и Smax = 7. Полученная крайняя точка содержит только три положительные координаты. Значит, решенная нами задача является вырожденной. Бели бы мы в качестве разрешающей строки в первой симплексной таблицы выбрали бы строку а5, то получили бы во второй симплексной таблице, что tio = 0. 44
Задачи. Задачи линейного программирования в канонической форме с задан- ной первоначальной крайней точкой. 1. xi + Х2 + *з -> max; Xi > О, i = 1,2,3, —xi 4- х2 4- з?з = 2, 3x1 — х2 4- хз = 0, xq = (0,1,1). 2. 2xi 4- *2 4- Зхз 4- х4 -> max; х, >0, г = 1,2,3,4, xi 4- 2х2 4- 5х3 - х4 = 4, xi - х2 - хз 4-2х4 = 1, х0 = (0,0,1,1). 3. 6x1 4- х2 4-4х3 — 5х4 —> max; х, >0, г = 1,2,3,4, 3xi 4- х2 — хз 4- х4 = 4, 5xi 4- х2 4- хз - х4 = 4, х0 = (1,0,0,1). 4. xi 4- х2 4- хз 4- х4 —> max; х,- >0, i = 1,2,3,4, xi 4- Зх2 4- хз 4- 2х4 = 5, 2xi - хз 4- х4 = 1, хо = (0,1,0,1). 5. xi 4- х2 4- хз 4- х4 4- ^5 -> max; х, > 0, i = 1,..., 5, 2xi 4- Зх2 4- 5хз 4- 7х4 4- 9xs = 19, xi — х2 4- х4 4-2x5 = 2, х0 = (0,0,1,2,0). 6. xi 4-х2 4-хз 4-х4 —> max; х,- > 0, г= 1,2,3,4, 4- х2 4- хз 4- Зх4 = 3, *1 4- х2 - хз 4- я4 = 1, ~ х2 4- хз 4- х4 = 1, хо = (0,0,0,1). 7. xi 4- 2х2 4- 2хз 4- х4 4- 6x5 —> max; х, > 0, i = 1,..., 5, xi 4- Зх2 4* Зхз 4- х4 4- 9x5 = 18, xi 4- 5х2 4- 2х4 4- 8x5 = 13, хз 4- Х5 = 3, хо = (0,1,2,0,1). 8. xi - х2 4- хз 4- Х4 — х5 — хе -> max; xt- > 0, i — 1,..., 6, 2xi 4- х2 4- Х3 4- Зх4 4- ЗХ5 4- 2хв = 7, xi - хз 4- х5 — х6 = —2, х2 4“ Хз 4- х4 4- х$ 4- 2хб = 5, xq = (0,0,2,0,1,1). 9. xi 4- х2 4- Х3 4- Зх4 - х5 — 2хб 4- Х7 -> max; xi 4- 2х2 4- Зхб 4- хт = 8, xi 4- Зх2 4- 2хз 4“ 2хб 4* Зх? = 15, х2 4* Зхз 4- 2х4 4- 2x5 “ Зхв 4* Зху = 11, хз 4- Зх4 4- хз — 2хб 4- Х7 = 5, х, >0, г = 1,...,7, х0 = (1,0,0,1,0,1,4). 45
2 Двойственность в линейном програм- мировании 2.1 Элементы выпуклого анализа. Преобразование Лежандра. Напомним определение выпуклого множества и выпуклой функции. Множество А С Rn называется выпуклым, если для любых двух то- чек ai и 02 из А и любого числа t 6 [0, 1] элемент tai + (1 — t)a2 G А. Пусть задана функция /: Rn —> R := R U {—оо} U {+оо}. С каждой такой функцией f связываются два множества: dom/ := {х | f(x) < Н-оо) — эффективное множество и epi У := {(а, ж) 6 R х Rn | а > f(x)} — надграфик f. Функция f называется выпуклой, если надграфик f — выпуклое множество. Функция f называется замкнутой, если надграфик f — замкнутое множество. Функция f называется собственной, если f(x) > -оо V х и dom/ 0. Ясно, что сумма двух выпуклых функций является функцией вы- пуклой. Но суперпозиция двух выпуклых функций не всегда является выпуклой функцией. Попробуйтечхривести пример! Пусть /: Rn -> R — некоторая функция. Преобразованием Лежан- дра функции f (или сопряженной функцией к /) называется функция /*(!/) :=тах{(х,у)-/(а:)}. X Из определения f* видно, что /ж — верхняя грань семейства аф- финных функций. Бе надграфик является выпуклым множеством (как пересечение выпуклых множеств — полупространств). Следовательно, У* - выпуклая функция. Из определения сопряженной функции следует неравенство Юнга: (х,у} < f(x)+Vx,yeRn. Функция /**(х) := max {(ж, у) — /*(у)}, являющаяся сопряженной к /*, называется второй сопряженной к f. В теории двойственности для задач линейного программирования важной является следующая теорема выпуклого анализа. Теорема Фенхеля-Моро. [АГТ, с. 37] Собственная функция со- впадает со своей второй сопряженной тогда и только тогда, когда она выпукла и замкнута (т. е. когда ее надграфик — выпуклое и замкнутое множество). 46
2.2 Примеры. Пример 1- Найти первую и вторую сопряженные (в смысле Лежан- дра) функции к функции f(x) = ax2+bx+c в зависимости от значений параметров а, 6, с. Решение. По определению сопряженной функции /* (у) = шах{(х, у) — f(x)} = max{zj/ — ах2 — Ьх — с} = = шах{—ах2 + (у — Ь)х — с}. X Если а > 0, то парабола — ах2+(у— Ь)х—с = — a(z — 22^)2 + ^^—с достигает своего максимума --с при х = Поэтому Найдем вторую сопряженную к f. По определению /’*(х) := max {(х, у) - f*(у)} = max (ху - + с У у 4а ( (у — Ь — 2ах)2 2 г 1 = шах < —---------— + ах* + Ьх 4- с > . у [ 4а ) Парабола и(у) := — 4-ад:2 4-6 а: 4-с достигает своего максимума при при у = Ь 4* 2ах. Поэтому ч Г (у — Ь-2ах)2 о 1 9 f (х) = шах < ---------— + ах2 4- Ьх 4- с > = ах2 + Ьх + с. у [ 4а J Если а — 0, то функция (у — Ъ)х — с -> 4-оо, если у / 6, при х —> 4-оо или х —> — оо. Поэтому Г(у) = тах{(У-6)х-с}=|-^ Уу = Ьь’ Найдем вторую сопряженную к /. Нетрудно видеть, что Г'(х) := тах{(х,у) - /*(у)} = max |ху - { J = £ } = 6х + с. Если а < 0, то парабола —az24-(у — Ь)х-се осями, направленными вверх, стремится к 4-оо при х —> 4-оо. Поэтому /*(j/) = 4-оо. Найдем вторую сопряженную к /. Нетрудно видеть, что /**(z) := max {(аг, у) - Г (у)} = max{zy- (+оо)} = -оо. 47
Пример 2. Найти первую и вторую сопряженные (в смысле Ле- жандра) функции к функции f(x) = ех. Решение. По определению сопряженной функции /*(у) = max {(я, у) - f(x)} = max {ягу- ех] = max у (г), X XX где д(х) := ху — ех. Найдем максимум функции д(х). Имеем У (а?) = у — ех = 0 <=> х = In у. Нетрудно видеть, что при у > 0 в этой точке будет достигаться максимум этой функции. Подставляя х — In у в у (ж), находим, что шах д(х) = у In у — у. X Если у = 0, то очевидно, что max д(х) = тах{—ег) = 0. Если 37 1D у < 0, то д(х) —> +оо при х —> —оо. Таким образом, [ ylny- у, у > 0, f (у) = max{xy-exJ = < 0, у = 0, * I +оо, у < 0. Найдем вторую сопряженную к /. По определению Г Г ylny-у, у > О, 'I f**(x) := max{(x,y) - f*(y)} = max< xy - < 0, у = 0, > = y y I I +oo, у < 0 J = max{O,max{xy — ylny + y}}. y>o Нетрудно видеть, что функция u(y) := ху — ylny4-у достигает своего максимума при у > 0 в точке обращения в нуль своей производной: (ху- ylny + у)у = х - In у,- 1 + 1 = X -1пу = 0 <=> у = ех. Подставляя это значение у в выражение для получаем /**(ж) = max {max{zy— ylny + y},0} = max{ex,0} = ex. Равенство = f(x) = ex следует также непосредственно из теоремы Фенхеля-Моро, поскольку функция ех является выпуклой и замкнутой. 48
2 3 Вывод задачи двойственной к задаче в общей форме. Рассмотрим задачу линейного программирования в общей форме (с, х) —> min; Ах < Ь. (з) Обозначим через S(b) := min {(с, х) \ Ах <b} — S-функцию задачи (з), рассматривая аргумент b как параметр в задаче (з). Определение. Двойственной задачей к задаче линейного про- граммирования в общей форме называется задача нахождения второй сопряженной (в смысле Лежандра) функции S** (Ь) для S-функции за- дачи (з). Для нахождения второй сопряженной необходимо найти вначале первую сопряженную функцию к функции S(6): S*(y) = max {(у, b} — S(6)} = max {(у, b) — min{(c, x} I Ax < 6}} = b b x .. , , I л - Г max {(у, Их) - (c,x)}, у < О, = max {(у, 6)-(с, х) Лх<6}=^ г = -гор, иначе _ Г max {(Л*у - с,х) }, у < О, _ f 0, А* у = с, у < О, ~ 1 4-оо, иначе ( 4-оо, иначе. Найдем сопряженную в смысле Лежандра функцию к функции S*(y), т. е. вторую сопряженную к функции S(6): S**(6) = max {(у, b) - S*(y)} = max {(у, b) | Л*у = с, у < 0}. Таким образом, двойственной задачей к задаче линейного програм- мирования в общей форме является следующая задача: (6, У) max; Л* у = с, у < 0. (з**) Для задачи линейного программирования в нормальной форме: (с, х) —> max; Ах <6, х > 0, (зп) выпишем без доказательства двойственную задачу (попробуйте сде- лать это самостоятельно): (6, у) -> min; Л*у > с, у > 0. (з**) Как мы видим, двойственная задача в этом случае обладает опреде- ленной симметрией по отношению к исходной. Элементы b и с меня- ются местами, максимум меняется на минимум, матрица Л меняется _На транспонированную, и матричное неравенство меняет знак. 49
2.4 Вывод задачи двойственной к двойственной за- даче для задачи линейного программирования в общей форме. Покажем, что понятие ” двойственности” введено правильно, т. е. двойственная задача к двойственной является исходной задачей. Для того, чтобы вывести двойственную задачу к задаче (з**) надо вначале свести ее к задаче линейного программирования в общей форме, для которой уже известна двойственная задача. Во-первых, сведем задачу на минимум, во-вторых, заменим равен- ство А*у = с на два неравенства с < А*у < с О А* у < с, —А* у < —с. Получим эквивалентную задачу линейного программирования в общей форме: (А* \ / с \ —А* I у < I —с I . I / \ 0 / Двойственная к ней будет следующая задача: ((с, — с, 0), (ж1, ж2, ж3)) —> max; / х1 \ (А — А I) ( х2 I = —6, х1 <0, х2 < 0, х3 < 0. / / \х3 I Перепишем эту задачу в виде (с, ж1 — х2) —> max; A(xx — х2) + х3 = —6, х1 <0, х2 < 0, х3 < 0. Обозначая х — х2—х\ и учитывая, что равенство Afa:1 — х2) 4- х3 — — b эквивалентно неравенству А(хг — х2) > —bt поскольку х3 < 0, а огра- ничений на знак х уже не будет, получим —(с, х) —> max; —Ах > —Ь. Заменяя max на min и умножая матричное неравенство на — 1, придем к задаче, являющейся двойственной к задаче (з**), которая совпадает с исходной задачей (з) (с, х) —> min; Ах < Ь. Таким образом, мы убедились, что термин ’’двойственная задача” используется правильно. •Я* 50
2.5 Вывод задачи двойственной к задаче в канони- ческой форме. рассмотрим задачу линейного программирования в канонической форме (с, х) —> шах; Ах — Ь, х > 0. (з*) Сведем ее к задаче на минимум: (—с, х} —> min; Ах = 6, х > 0, (з') при этом Ззк = . Обозначим через S(b) := min {(—с, х) | Ах = Ь, х > 0} — S-функцию X задачи (з')> рассматривая аргумент Ъ как параметр в задаче (з'). Найдем первую сопряженную (в смысле Лежандра) функцию к функции 5(6): S*(6*) = max{(6*,6)~5(6)} = max{(6*, 6) —min{(—с,х) |Лх — 6, х > 0}} = Ь Ь х = max {(6*, 6)4- (с, х) | Ах = 6, х > 0} = max {(6*, Ах) 4-(с, х) | х > 0} = btX X ; । гп Г 0> А*Ь* +с<0, = max{(A b 4- с, х) х > 0} = < , “ х ' 1 “ J иначе. Найдем сопряженную в смысле Лежандра функцию к функции S*(6*), т. е. вторую сопряженную к функции 5(6): 5**(6) = тах{(6*,6) - 5*(6*)} = max{(6*,6) | А*6* 4-с <’О}. ь* ь* Следовательно, S3„ =-5**(6)=min{(-6*,6) | Л*6* 4-с < 0}. Полагая у = —6*, получаем S,** = min {{у, Ь) | — А*у 4- с < 0}, и, у следовательно, имеем следующую двойственную задачу (у, 6) -> min; А*у > с. (з^*) 51
3 Обоснование симплекс-метода 3.1 Теоремы существования, двойственности, кри- терий решения. Приведем три теоремы, играющие важную роль при обосновании симплекс-метода. Рассмотрим задачу линейного программирования в общей форме (с, х) —> min; Ах < 6, (з) /а} ... а? \ где с, ж 6 Rn, Ь 6 Rm, А = (aj)t=i, ..}т = 1...I — матрица i=1.." \<й ••• размеров т х п со столбцами о7 = (а],..., а^), j — 1,..., п. Обозначим S3 — численное значение задачи (з), Arg3 — множество решений задачи (з), т. е. множество допустимых точек х 6 Rn, для которых (с, х) = S3. Теорема существования. Если численное значение задачи (з) конечно (|5з| < +оо), то ее решение существ ует*( Arg з / 0). Доказательство. Отметим сразу, что поскольку численное зна- чение задачи конечно, то множество допустимых элементов непусто (£Ь уб 0). Рассмотрим множество К := {(a, z) Е R х Rm | 3 х : (с, х) < а, Ах < z}. Ясно, что К — выпуклый конус. Лемма 1. Конус К — конечнопорожденный. Напомним ряд сведений из выпуклого анализа. Пусть С := {ci,..., ст} С Rn — некоторое конечное подмноже- т т ство. Элемент v = ^2 *» > 0> t = 1,..., m, — 1, называется »=1 »=1 т выпуклой комбинацией С, а элемент k = J2 ^»с«> /» > О, г = 1,..., т, »=1 — конической комбинацией С, Совокупность всех выпуклых (кони- ческих) комбинаций конечных подмножеств множества С называется выпуклой (конической) оболочкой С и обозначается со С (cone С). Можно легко показать, что множество со С совпадает с пересече- нием всех выпуклых множеств, содержащих С (иногда это свойство берут за определение со С), а множество cone С совпадает с пересече- нием всех выпуклых конусов, содержащих С. Выпуклая оболочка конечного числа точек называется выпуклым многогранником, а выпуклая коническая оболочка конечного числа то- чек — конечнопорожденным конусом. 52
Доказательство. Покажем, что К = cone {±&,..., ±£n, rjQ) 91,.. „ } где с = ><&), 3 = - % = (1,0,...,0), ъ = ’ Вложение.cone {±&,..., ±&>, т)о,г)т} с К, следует из того, что все образующие конуса лежат в К. Действительно, полагая х = ±ej (ei, • • »еп — канонический базис в Rn) в определении конуса К, мЫ получим, что ±(j е К, j = для векторов т^надо взять г = 0. Обратно, если вектор (а, г) = (а, zi,..., zm) 6 К, то существует х — (a?i,. -,^n) 6 R”, для которого (с,х) < а, Ах < z. Значит для некоторых До > 0,..., Дт > о выполняются соотношения (с,х) + До = а, Ax + P = z (Д = (Д1,...,Дт)) <==> и п 52С3Х3 + ^0 = а, + & ~ Zi’ 1 = • • • >т- 7=1 ' 7 = 1 Но это как раз и означает, что п т ^х^+'£)0iT]i = (a, z). j=l :=0 Поскольку £ х& = Е k^K^signx/), то (a, z) 6 cone {±&,..., ±6,, 7=1 7 = 1 Лемма 2 (о замкнутости конечнопорожденного конуса). Конечно- порожденный конус замкнут. Доказательство леммы см. в ГТ, стр. 63. Поскольку S3 — inf{a | 3 х : (с, х) = а, Ах < Ь} := а, то су- ществуют последовательности {я*} и {а*}, а к —> а при k —> -Foo, для которых (с, Хк) = Qi к з Ах к < b (это означает, что последователь- ность (ofjt,6) 6 К — замкнутому по лемме 2 множеству. Поэтому предельная точка (а, Ь) 6 К. Тогда существует точка х такая, что (с, ж) < а = 5з, Ах < Ь. Это означает, что х 6 Args. Теорема суще- ствования доказана. Вернемся к задаче линейного программирования в общей форме. В п. 2.3 мы обозначили через S(b) := min{(c, х) | Ах < Ь} — S’-функцию задачи (з), рассматривая аргумент b как параметр в задаче (з). Лемма 3. S — выпуклая замкнутая функция. Доказательство леммы легко выводится из соотношения epi S = Кt гДе К — выпуклый замкнутый конус, рассмотренный при доказатель- с1Ъе теоремы существования. 53
Лемма 4. Пусть f \ Rn -> R — выпуклая замкнутая функция и су^ ществует точка zq такая, что f(zo) = —оо. Тогда f(z) — —оо V z £ dom/. Напомним, что двойственной задачей к задаче линейного програм- мирования в общей форме является следующая задача: (6, у) -> max; А*у = с, у < 0. (з**) Теорема двойственности. Для пары двойственных задач линей- ного программирования (з) и (з**) имеет место следующая альтерна- тива: или значение какой-нибудь из задач конечно (и тогда конечно значение второй и оба значения совпадают), или множество допу- стимых элементов в одной из задач пусто (и тогда другая задача либо несовместна, либо имеет бесконечное значение). Доказательство. 1) Пусть |5(6) | < оо, тогда по лемме 4 S(z) > —оо V z 6 Rm. По теореме Фенхеля-Моро п. 2.1 5**(6) = 5(6). Это озна- чает, что конечно значение двойственной задачи и оба значения совпаг- дают. 2) Пусть Дз = 0 (<=> 5(6) = -Foo), тогда либо а) существует точка zq такая, что 5(zq) = —оо, тогда 5* = -Foo, следовательно, 5** = —оо, т.е. D3** = 0 (это означает, что множество допустимых элементов в двойственной задаче пусто), либо б) S(z) > —оо V z € Rm, тогда по теореме Фенхеля-Моро 5** (6) = 5(6) = -Foo (это означает, что двойственная задача имеет бесконечное значение). Критерий решения. Пусть х — допустимый элемент в задаче (з) (х Е D3)- Тогда х является решением в задаче (з) (х Е Arga) то- гда и только тогда, когда существует допустимый в двойственной задаче элемент у (у Е D3**) такой, что выполняется равенство (с,х) = {у, Ь). Доказательство. Необходимость. Пусть х Е Arg3, т. е. (с, х) = S3. Значение задачи (з) при этом конечно (|5з| < -Foo). Значит по тео- реме двойственности значение двойственной задачи также конечно и оба значения совпадают (5з = 53**). Поскольку |53** | < -Foo, то по те- ореме существования существует решение в двойственной задаче у Е Arg3**, т. е. {у, 6) = 53**. Таким образом, (с, х) = S3 = 53** = (у, 6). Достаточность. Пусть у Е D3** и (с, х) = (у, 6). Возьмем произ- вольные допустимые элементы х Е D3, у Е D3**. Это означает, что Ах <Ь, А*у = с, у < 0. В силу этих условий на х и у имеем <С, х) = {А*у,х) = (у, Ах) > (у,Ь). 54
этого соотношения вытекает, что (с,х) > (у,Ь) = (с, х) V х 6 Дз- означает, что х 6 Arg3. Аналогично доказывается, что у 6 3,2 Свойства множества допустимых точек. рассмотрим задачу линейного программирования в канонической форме (с, х) —> max; Ах = 6, х > 0. (з&) Предложение 1. Пусть х = (xi,..., х*,0,...,0) 6 R”, х,- > 0, i = 1 — допустимая точка в задаче fa) (х 6 Взк)* Тогда точка х является крайней точкой множества допустимых элементов Dsk тогда и только тогда, когда столбцы а1,... ,ак матрицы А линейно независимы. Доказательство. Необходимость. Пусть х — крайняя точка. Докажем, что тогда столбцы а1,..., ак — линейно независимы. До- казательство будем вести от противного. Допустим противное, что столбцы о1,..., а* — линейно зависимы. Тогда существует ненуле- к вой набор множителей А1,...,А* такой, что = 0- Значит 1=1 АА = 0 для вектора А = (Ai,..., А*,0,...,0) 6 R”. Поэтому точка x(t) := х + /А Е Изк при малых t как больше, так и меньше нуля. Это означает, что точка х не является крайней. Получили противоречие. Значит, наше допущение, что столбцы а1,..., ак линейно зависимы — неверно. То есть столбцы а1,..., ак линейно независимы. Достаточность. Пусть столбцы, соответствующие положитель- ным координатам точки х линейно независимы. Для определенно- сти будем считать, что это столбцы а1,... ,ак. Докажем, что тогда х — крайняя точка. Доказательство вновь будем вести от против- ного. Допустим противное, что х не является крайней точкой. Тогда существуют точки у 6 D3k и z Е &3к> У £ z> отличные от х и чи- сло t G (0, 1) такие, что х = ty + (1 — t)z. Из этого равенства и условий х — (xi,..., х*,0,... , 0), Xi >0, г = 1,..., к, у, z > 0 сле- дует, что у = (i/i,... ,3/fcjO,... ,0), z = (xi,... tZk> 0,... ,0). А из усло- й л вий Ay = b & $3 У*а' ~ Az = b <=> J2 zia' “ b следует, что t=i »=i к Ufa - zAa* = 0. Это означает, что столбцы а1,... ,ак линейно за- *=1 висимы. Получили противоречие. Значит, наше допущение, что х не является крайней точкой — неверно. То есть х является крайней точ- кой. 55
Предложение 1 полностью доказано. Предложение 2. Пусть (зк) — невырожденная задача линейного программирования в канонической форме, х = (®i,..., xk, 0,..., 0) 6 Rn, Xi > 0, i = 1,..., k, — допустимая точка в задаче (зк) (г 6 &3kY Тогда а) к > т; б) точка х является крайней точкой множества допустимых элементов D^k тогда и только тогда, когда к = т. Доказательство, а) Доказательство будем вести от противного. Допустим противное, что существует допустимая точка, у которой менее т положительных координат. Для определенности пусть это первые к координат (к < т). Рассмотрим множество D = {у 6 R* | Ау — Ъ, у > 0}, где А := {а1,..., afe} — матрица, состоящая из первых к столбцов исходной матрицы А. Пусть у — крайняя точка множества D (докажите самостоятельно ее существование). У нее число положи- тельных координат I (I < к < т) будет меньше т и соответствующие столбцы матрицы А по предложению 1 линейно независимы. Тогда вновь по предложению 1 точка х = (у, 0,..., 0) 6 Rn будет крайней точкой множества £>зк, причем число положительных координат I у нее меньше т. Это противоречит невырожденности задачи. Значит, наше допущение, что существует допустимая точка, у которой име- ется менее тп положительных координат, неверно. То есть к >т. б) Необходимость непосредственно следует из определения невыро- жденной задачи (в невырожденной задаче любая крайняя точка имеет ровно т положительных координат). Достаточность. Пусть х = (a?i,..., хт, 0,..., 0) € Dzk, xi > 0, i = — допустимая точка в задаче (з*). Докажем, что тогда х крайняя точка. Доказательство будем вести от противного. Предполо- жим противное, что точка х не является крайней. Тогда по предложе- нию 1 столбцы а1,..., ат матрицы А линейно зависимы. Это означает, что существует ненулевой набор множителей Ai,...,Am такой, что т А,а* — 0. Значит ЛА = 0 для вектора А = (Ai,..., Am, 0,..., 0) G Rn. »=i Поэтому Л(х 4- / А) = Ах 4- tAX = Ах = b V t, а вектор х 4- tX > 0 при малых t как больше, так и меньше нуля, т. е. х 4- tX G D3k . Поскольку а^4- iX. > 0 при t = 0, то увеличивая |/|, придем к случаю, когда еще одна координата вектора х 4- tX обратится а ноль, а все остальные по-прежнему больше или равняются нулю. Таким образом, при неко- тором t допустимая точка х 4-/А будет иметь менее т положительных координат. Это противоречит пункту а) данного предложения. По- лучили противоречие. Значит, наше предположение, что точка х не является крайней — неверно. То есть х является крайней точкой. Предложение 2 полностью доказано. 56
3.3 Доказательство симплекс-метода. рассмотрим невырожденную задачу линейного программирования в канонической форме (с, х) max; Ах = 6, х > 0. (з&) Напомним, что двойственной к ней является следующая задача: (Ь} у) -> min; А*у > с. (з£*) При изучении правила решения задачи в канонической форме мы пользовались некоторыми фактами, которые были даны там без обо- снования. Сейчас мы их докажем, оформив утверждение в виде тео- ремы. Теорема. Пусть х — (xi,..., xmj 0,..., 0) 6 Rn, х» > 0, i = — крайняя точка множества допустимых элементов Dak. Тогда: а) если Д > 0, то вектор х — решение задачи (з^), вектор у = съА^г — решение двойственной задачи (зк*); б) если для некоторого j Aj < 0 и х^ < 0, то значение задачи S$k — 4"°о; в) если не выполнены условия п.п. а) и б), то точка х' явля- ет ся новой крайней точкой множества допустимых элементов Dsk> значение функционала при этом возрастет на величину —t^AjGf а разложение векторов х' 1а1,... уап производится согласно симплекс- методу. Доказательство, а) Напомним, что по Предложению 1 det Аь 0, т е. матрица Аь обратима. Поскольку из определения вектора у вытекает, что сь = уАь, а Д’ = Л& то z = сьХ = уАьА^А = уА = А* у. Следовательно, условие А — z — с — А^у — с > 0 равносильно условию А* У > с. Значит, у является допустимым вектором в задаче (з£*) двойственной к задаче (з*). Кроме того в силу условия Аьхъ = Ь (у,Ь) = (сьА^.Ь) = {(А^1)*сь,Ь)= {сь,А^Ъ) = (сь,хь) = (с,х). По критерию решения п. 3.1 х — решение в задаче (з*), а у — решение в Двойственной задаче (з£*). 57
б) Положим x(t) := х — t(x310) -F tej (ei,... ,en — канонический базис в Rn). Тогда x(t) = (хъ — tx3, 0) -F tej > 0 V t > 0 в силу условия x3< 0 и Ax(t) = Ах — tАъх3 + tAej = b — ta3 -F ta3 = b. Значит, x(t) — допустимый элемент для любого t > 0, при этом (с, x(t)} = (ctx - t(xJ, 0) + tej) = (с, x) — t{cb^) -F t(c, ej) = = (c, x) — tZj + tCj = (C, x) — t(Zj — Cj) = = (c, x) — t Aj —> -Foo при t —> -Foo. в) Предположим, что не выполнены условия п.п. а) и б) теоремы. Тогда для некоторого Jo такого, что m-Fl < jo < п, выполнено условие Aj0 < 0 и величина to := min | Xijo > о| = > 0. * 1 xijo J xiojo Возьмем х' := х — to(x3°, 0) -Ftoej0. Докажем, что вектор х' является новой крайней точкой в задаче (зь)* Покажем вначале, что он является допустимым вектором. Как и в пункте 6) выводим, что Ах1 = Ь, Так же имеем х\ = Xi — tQXij0 = Xi--^-Xij* > 0 при i = 1,..., m; xiojo x' = 0 при г = m -F 1,..., n, i £ jQ] x' = t0 = > 0 при i = jo- xiojo Таким образом, x' > 0, и значит, вектор х' является допустимым в невырожденной задаче (з&). По построению у вектора xz по сравне- нию с вектором х добавилась одна положительная jo-я координата, а какие-то возможно обратились в ноль. Поскольку по предложению 2а) у допустимой точки число положительных координат не менее т, то в ноль может обратиться только одна координата (это х'о-я коор- дината обратилась в ноль). Значит, у вектора х' имеется ровно тп положительных координат на местах 1,..., г‘о — 1, г’о +1» • • • > т, jo- Сле- довательно, по предложению 26) х' — крайняя точка. Отметим, что в невырожденной задаче число положительных компонент у крайней точки может уменьшаться. Выписанные формулы означают, что в новой симплексной таблице столбец х' вычисляется согласно указанному методу построения сим- плексной таблицы. Покажем, что и остальные столбцы х*3 в новой 58
симплексной таблице строятся по этому же способу. Для этого вычи- слим координаты разложения столбцов , j = 1,..., п, матрицы А по базису а1,..., а*0-1, а*0, а*о+1,..., ат. В старом базисе мы имели следующие разложения: т т а? = 52 a'Xii = 52 а'х*з + в*°г«0>> J = 1, • • •, n. (1) «=1 »=1 «#*0 В частности при j = jo т а>° = а‘хчо + а*°хш> Поскольку XiQj0 0, то выразим а*0 из последнего уравнения а‘° «#»0 Xiojo а3о xiojo и подставим в соотношение (1). Получим разложения по базису а1,.. а’о“1,а^°,а<о+1,...}ат: i=i ' Xi«i« j = l, x*ojo П. Таким образом, Xij — Xij xiojxijo xiojo , i zfz to, i = 1,..., m, => Xij0 = 0, io, / _ xioj *»ojo j = Теорема полностью доказана. 59
4 Методы нахождения начальной край- ней точки 4.1 Переход к решению двойственной задачи. Рассмотрим метод решения задач линейного программирования путем перехода к двойственной задаче и решения полученной двойственной задачи. При этом строка А последней симплекс-таблицьГ даст нам решение исходной задачи. Пусть нам дана следующая задача линейного программирования: (6, У) min; А* у > с, у > 0, (з) с вектором b > 0. Двойственной для нее является задача (с, х) -> max; Ах < Ь, х > 0. ’ (з*) Сведем эту задачу к задаче в канонической форме путем добавления неотрицательных (искусственных) переменных х = (xn+i,.... xn4.m) и единичной матрицы Г, (с, х) —> max; Ах + 1х = 6, х > 0, х > 0. (з') Задачу (э') можно решить симплекс-метод ом, взяв в качестве исходной крайней точки точку (0,..., 0,61,..., bm) 6 Rn+m. Эта точка будет крайней по предложению 1 п. 3.2, поскольку столбцы единичной ма- трицы /, соответствующие положительным координатам этой точки, линейно независимы. Пусть вектор х является решением задачи (з'). Тогда по теореме п. 3.3 в последней симплекс-таблице вектор А > 0. Предположим, что искусственные переменные у вектора х равны нулю, а для опреде- ленности пусть базисными векторами будут первые т векторов, т. е. х = (я:*,0,0) € Rm х Rn“m х Rm. Тогда (®ь,0) е Arg3*. Обозначим у := (уь ..., ут), у{ = Дп+i, i = 1,..., m. Тогда у > 0. По построению симплекс-таблицы и с учетом того, что сп+, = 0, имеем = Дп4-« = = zn+i = х ) = А^ Сп-н) У = ^bA^ . В силу неравенства Д > 0 и соотношения а? — Аьх^ <=> х^ = А^1^ = гз - с3 — {сь>~ С3 = (сь> - С3' > J • • • > п, <=> (сь, ХА) — с > 0 <=> сьА^ 1А > с <==> уА > с <=> А*у > с 60
(мы воспользовались формулой сопряжения для произведения матриц (ЛВ)* = В*Л*). Значит, у € &з- Кроме того, {у,Ъ) = {сьА^,Ь} = {(A^)*cb,b) = {сь, А^Ь) = {сь,хь) = (с, х), так как для вектора х выполняется уравнение Ах = b О Аьхь — Ь. Таким образом, по критерию решения п. 3.1 у G Arg3 — является решением двойственной к (з*) задаче, т. е. в задаче (з). Пример. Решить задачу линейного программирования путем перехода к двойственной задаче: 4yi 4- 2у2 -> min; у, >0, i = 1,2, 9j/i + У2 > 15, 3yi 4- 4г/2 > 27, (з) У1 + 5у2 > 20. Двойственной для данной задачи линейного программирования бу* дет следующая задача в нормальной форме (выведите это самостоя- тельно): 15a?i 4- 27x2 4- 20хз -> max; х,- >0, i = 1,2,3, 9xi 4* 3x2 4- X3 < 4, xi 4- 4х2 4- 5хз < 2. (3*) Сведем эту задачу к задаче в канонической форме путем добавле- ния неотрицательных (искусственных) переменных Х4, и 15 и заменяя матричное неравенство равенством: 15xi 4- 27х2 4- 20хз —> max; Xj > 0, i = 1,..., 5, 9xi 4- Зх2 4- х3 4- х4 = 4, Х14-4х24-5х3 4-х5 = 2. (3') Исходная крайняя точка х = (0,0,0,4,2). Базисные векторы а4 = (1,0), а5 = (0,1). Составим первую симплексную таблицу для задачи в канонической форме: 61
с 15 27 20 0 0 i базис Хь а1 а2 а3 а4 а5 а4 0 4 9 3 1 1 0 № а5 0 2 1 4 5 0 1 1/2 Z 0 0 0 0 0 0 д -15 -27 -20 0 0 В первой симплексной таблице разрешающий столбец а2, разреша- ющая строка а5. Заменяем в базисе вектор искусственных переменных а5 на вектор а2 и для нового базиса строим вторую симплексную та- блицу: С 15 27 20 0 0 t базис Хъ а1 а2 а3 а4 а8 а4 0 5/2 33/4 0 -11/4 1 -3/4 10/33 а2 27 1/2 1/4 1 5/4 0 1/4 2 Z 27/2 27/4 27 135/4 0 27/4 А -33/4 0 55/4 0 27/4 1 Во второй симплексной таблице разрешающий столбец а1, разреша- ющая строка а4. Заменяем в базисе вектор искусственных переменных а4 на вектор а1 и для нового базиса строим третью симплексную та- блицу: С 15 27 20 0 0 t базис хь а1 а2 а3 а4 а8 а1 15 10/33 1 0 -1/3 4/33 -1/11 а2 27 14/33 0 1 4/3 -1/33 3/11 Z 16 15 27 31 1 6 А 0 0 11 1 6 Вектор Д > О, поэтому точка х = (10/33,14/33,0,0,0) является решением двойственной задачи с добавленными искусственными пере- менными (з'), а вектор (10/33,14/33,0) является решением задачи (з*) и S3, = S3* = 16. В последней симплекс-таблице под разложениями векторов искус- ственных переменных стоят числа 1,6, являющиеся значениями реше- ния исходной задачи (з), т. е. вектор у = (1,6) является решением задачи (з) и S3 = 16. 62
4.2 Метод искусственного базиса. Метод добавления искусственных переменных используется для отыс- кания начальной крайней точки в задаче линейного программирования в канонической форме (с, х) —> шах; Ах = 6, х > 0. (з*) Не ограничивая общности, можем считать, что все координаты век- тора b неотрицательны. Если это не так, например, bj < 0, то умножим обе части j-oro уравнения на — 1. Поэтому далее считаем, что b > 0. Рассмотрим вспомогательную задачу, добавляя искусственные пе- ременные X = (Яп+1, • •, Sn+m) и единичную матрицу Z, т — xn+i —> max; Ах + lx = 6, х > 0, х > 0. (з') :=1 Ясно, что в задаче (з') S3i <0. Поэтому, если в исходной задаче (з*) множество допустимых элементов непусто (Взк # 0)> то значе- ние задачи S3r = 0, а решением задачи (з') будет крайняя точка х, у которой все искусственные переменные равны нулю. Задачу (з') можно решить симплекс-метод ом, взяв в качестве исходной крайней точки точку х = (0,..., 0,61,..., bm) Е Rn+m. Эта точка будет край- ней по предложению 1 п. 3.2, поскольку столбцы единичной матрицы I, соответствующие положительным координатам точки ж, линейно не- зависимы. Решением в (з') будет крайняя (для множества D3/) точка х, первые п координат которой будут начальной крайней (для множе- ства £>за) точкой для решения задачи (з*). Эта точка будет крайней по предложению 1, поскольку столбцы матрицы Л, соответствующие положительным координатам точки х, линейно независимы. Далее, зная исходную крайнюю точку в задаче (з*), можем присту- пать к ее решению по симплекс-методу. Замечание. Вместо такого двуэтапного решения задачи (з*) можно решать следующую задачу (ее принято называть М-задачей) (см, (х, х)) —» max; Ах 4- /х = 6, х > 0, х > 0, где см = (с, —Mt..., — М) Е Rn+m, М — положительное число. Не- трудно показать, что при любом достаточно большом М первые п координат полученного решения определяют решение в (з*), а искус- ственные переменные равны нулю. 63
4.3 Примеры. Пример 1. Решить методом искусственного базиса задачу: 4- 2х2 4- Зхз — —> max; Xi >0, i = 1,2, 3,4, xi 4- 2х2 + х3 + х4 = 10, 2xi + Х2 4- 5хз = 20, xi 4" 2x2 4" Зхз = 15. Рассмотрим вспомогательную задачу, добавляя искусственные пе- ременные а?5, Хб: —хь — хе —> max; х, > 0, i = 1,..., 6, £1 4- 2x2 4- хз 4- Х4 = 10, 2xi 4- хз 4- 5хз 4- х5 = 20, xi 4- 2х2 4- Зх3 4- хе = 15. Исходная крайняя точка х — (0, 0,0,10,20,15). Базисные векторы а4 = (1,0,0), а5 = (0,1,0), а6 = (0,0,1). Составим первую симплексную таблицу для вспомогательной за- Из таблицы видно, что разрешающим столбцом является столбец а3, разрешающая строка а5. Заменяем в базисе вектор а5 на вектор а3 и для нового базиса строим вторую симплексную таблицу: с 0 0 0 0 -1 -1 t базис хь а1 а2 а3 а4 as а6 0 6 3/5 9/5 0 1 -1/5 0 10/3 а3 0 4 2/5 1/5 1 0 1/5 0 20 а6 -1 3 -1/5 7/5 0 0 -3/5 1 15/7 Z -3 1/5 -7/5 0 0 3/5 -1 А 1/5 -7/5 0 0 8/5 0 t 64
Из таблицы видно, что разрешающим столбцом является столбец а2 разрешающая строка а6. Заменяем в базисе вектор а6 на вектор а2 и для нового базиса строим третью симплексную таблицу: С 0 0 0 0 — 1 -1 t базис хь а1 а2 а3 а4 а® а6 0 15/7 6/7 0 0 1 4/7 -9/7 а3 0 25/7 3/7 0 1 0 2/7 -1/7 0 15/7 -1/7 1 0 0 -3/7 5/7' Z 0 0 0 0 0 0 0 А 0 0 0 0 1 1 Вектор А > О, поэтому точка х = (0,15/7,25/7,15/7,0,0) является решением вспомогательной задачи и Smax = 0. Перейдем к решению основной задачи. Составим первую симплекс- ную таблицу для начальной крайней точки х = (0,15/7,25/7,15/7). Разложения векторов XjO1 по базису а4,а3,а2 берем из последней симплексной таблицы. с 1 2 3 -1 i базис Хь а1 а1 а3 а4 а4 -1 15/7 6/7 0 0 1 5/2 а3 3 25/7 3/7 0 1 0 25/3 а2 2 15/7 -1/7 1 0 0 Z 90/7 1/7 2 3 -1 А -6/7 0 0 0 t Разрешающим столбцом является столбец а1, разрешающая строка а4. Заменяем в базисе вектор а4 на вектор а1 и для нового базиса строим вторую симплексную таблицу: с 1 2 3 -1 t базис а1 а5 а3 а4 а1 1 5/2 1 0 0 7/6 а3 3 5/2 0 0 1 -1/2 а2 2 5/2 0 1 0 1/6 Z 15 1 2 3 0 А 0 0 0 1 Вектор А > 0, поэтому точка х = (5/2,5/2,5/2,0) является решением исходной задачи и Smax = 15. 65
Пример 2. Решить методом искусственного базиса задачу: xi - 2x2 + -> max; х, >0, «=1,2,3, *1 + *2 + = 5, 2xi + = 3, -2xi 4* 2х2 = 4. Решение. Рассмотрим вспомогательную задачу, добавляя искус- ственные переменные X4,xg: —Х4 — xs —> max; х,- > 0, i = 1,..., 5, Xi + ^2 + Хз — 5, 2X1 4“ Х2 4* а?4 =3, —2x1 + 2x2 4-^5 — 4. Исходная крайняя точка х = (0,0,5,3,4). Базисные векторы а3 г (1,0,0), а4 = (0,1,0), а5 = (0,0,1). Составим первую симплексную таблицу для вспомогательной за- дачи: с 0 0 0 -1 -1 t базис Хь а1 а2 а3 а4 а5 а3 0 5 1 1 1 0 0 5 а4 -1 3 2 1 0 1 0 3 а4 -1 4 -2 2 0 0 1 2 Z -7 0 -3 0 -1 -1 А 0 -3 0 0 0 t Разрешающий столбец а2, разрешающая строка а5. Заменяем в базисе вектор а5 на вектор а2 и для нового базиса строим вторую симплексную таблицу: С 0 0 0 -1 -1 t базис ХЪ а1 а2 а3 а4 а5 а3 0 3 2 0 1 0 -1/2 3/2 а4 -1 1 3 0 0 1 -1/2 1/3 а2 0 2 -1 1 0 0 1/2 Z -1 -3 0 0 -1 1/2 ' А -3 0 0 0 3/2 f Во второй симплексной таблице разрешающий столбец а1, разреша- ющая строка а4. Заменяем в базисе вектор искусственных переменных* а4 на вектор а1 и для нового базиса строим третью симплексную таг блипу: 66
Г— с 0 0 0 -1 — 1 t базис ~~ сг Xb а1 а1 а3 а4 а5 0 7/3 0 0 1 —2/3 -1/6 0 1/3 1 0 0 1/3 -1/6 (Г 0 7/3 0 1 0 1/3 1/3 Z 0 0 0 0 0 0 ~ Д~| 0 0 0 1 1 Вектор Д > О, поэтому точка х = (1/3,7/3,7/3,0,0) является ре- шением вспомогательной задачи с добавленными искусственными пе- ременными, И Smax — 0. Перейдем к решению основной задачи. Составим первую симплекс- ную таблицу для начальной крайней точки х = (1/3,7/3,7/3). Разло- жения вектора х по базису а3, а1, а2 берем из последней симплексной таблицы. с 1 -2 1 t базис ХЬ а1 а* а3 а3” ' 1 7/3 0 0 1 а1 1 1/3 1 0 0 -2 7/3 0 1 0 Z -2 1 -2 1 Д 0 0 0 Вектор Д > 0, поэтому точка х = (1/3,7/3,7/3) является решением исходной задачи и Smax = —2. Заметим, что на самом деле исходная задача тривиально решается, так как мы имеем систему из трех линейных уравнений с тремя неиз- вестными. Эта система имеет единственное решение х = (1/3,7/3,7/3). Пример 3. Решить, вводя искусственные переменные задачу: 2x1 + + Зхз + 5а?4 max; х,- > 0, : = 1,2,3,4, 2xi + 3x2 + + 2x4 < 30, 4xi + 2x2 + хз + 2x4 < 40, xi + 2x2 + Зхз + х4 < 25. Добавив неотрицательные переменные Xg,X6, Х7, получим задачу в Кан°нической форме: 2xi + Х2 + Зхз + 5x4 max; х, > 0, i = 1,..., 7 , 67
2a?i 4- 3x2 4" Хз + 2x4 4~ Х5 = 30, 4xi 4“ 2x2 + Хз 4- 2x4 + xg = 40, xi 4- 2x2 4" Зхз 4" Х4 4- Х7 = 25. Исходная крайняя точка х = (0,0,0,0,30,40,25). Базисные векторы а5 = (1,0,0), а6 = (0,1,0), а7 =(0,0,1). Составим первую симплексную таблицу: с 2 1 3 5 0 0 0 t базис хь а1 а2 а3 а4 а5 а6 а7 а5 0 30 2 3 1 2 1 0 0 15 а6 0 40 4 2 1 2 0 1 0 20 а7 0 25 1 2 3 1 0 0 1 25 Z 0 0 0 0 0 0 0 0 д -2 -1 -3 -5 0 0 0 В первой симплексной таблице разрешающим столбцом является столбец а4, Разрешающая строка a5, t = 15. Заменяем в базисе век- тор а5 на вектор а4 и для нового базиса строим вторую симплексную таблицу: с 2 1 3 5 0 0 0 t базис Хь а1 а2 а3 а4 а5 а6 а' а4 5 15 1 3/2 1/2 1 1/2 0 0 30 аь 0 10 2 -1 0 0 -1 1 0 0 10 0 1/2 5/2 0 -1/2 0 1 4 Z 75 5 15/2 5/2 5 5/2 0 0 д 3 13/2 -1/2 . 0 5/2 0 0 f Во второй симплексной таблице разрешающий столбец а3, разре- шающая строка a7, t = 4. Заменяем в базисе вектор а7 на вектор а3 и для нового базиса строим третью симплексную таблицу для базиса а4, а6, а3: с 2 1 3 5 0 0 0 t базис ХЬ а1 а2 а3 а4 а5 а' а4 5 13 1 7/5 0 1 3/5 0 -1/5 а® 0 10 2 -1 0 0 -1 1 0 а3 3 4 0 1/5 1 0 -1/5 0 2/5 Z 77 5 38/5 3 5 12/5 0 1/5 Д 3 33/5 0 0 12/5 0 1/5 Вектор Д > 0, поэтому крайняя точка х = (0,0,4,13,0,10,0) явля- ется решением расширенной задачи, а решением исходной задачи явля- ется точка х = (0,0,4,13), Smax = 77. 68
Задачи. Задачи линейного программирования в канонической форме с нега- данной первоначальной крайней точкой. Решить методом искусствен- ного базиса. 1. xi 4- 4х2 4- хз —> max; Xj> 0, i = 1,2,3, Xi - х2 + х3 = 3, 2xi — 5х2 - хз = 0. 2. xi — 10х2 4- хз —> max; х, >0, i = 1,2,3, xi - 5,5х2 — 7хз = —13, xi — 14, 5х2 4- 7хз = 15. 3. xi + 2х2 4- Зх3 — 4х4 -> max; xt- >0, i = 1,2,3,4, хх + Х2 - Хз + х4 = 2, xi 4- 14х2 + Юхз — 10x4 = 24. 4. xi — 5х2 — хз 4- х4 —> max; х, > 0, i == 1,2,3,4, xi 4" Зх2 4" Зхз 4- х4 = 3, 2xi 4* х3 — х4 = 4. 5. xi 4- х2 4- хз 4- х4 —> max; х, > 0, i = 1,..., 4, 4xi 4- 2х2 4- 5хз — х4 = 5, 5xi 4- Зх2 4- бхз — 2x4 = 5, 3xi 4- 2x2 + 4х3 — х4 = 4. 6. xi 4- Юх2 — хз 4- 5x4 -> max; х, > 0, i = 1,..., 4, xi + 2х2 - хз - х4 = 1, —Xi 4" 2х2 4" Зхз 4” х4 = 2, xi 4- 5х2 4- х3 — х4 = 5. 7. xi 4- 2x2 4- Зх3 4- 4х4 4- 5х5 -> max; х, > 0, i = 1,..., 5, х2 4" хз — 2x4 4" 7x5 = 2, 6x1 4- хз — 2x4 4" 7х5 = 2, xi 4- х2 — 2х4 4* 7x5 = 2. 8. Xi 4- х2 — х3 4- х4 — 2x5 —> max; xt- >0, i = 1, 2,3,4,5, 3xi 4- х2 4- х3 4- х4 - 2х5 = Ю, 6xi 4" х2 4- 2хз 4" 3x4 — 4xs = 20, lOxi 4- х2 4- Зх3 4- 6х4 — 7x5 = 30. 9. xi - 4х2 4- хз 4- х4 4- х5 4- хб -» max; х, > 0, г = 1,... ,6, 14xi — 14х2 4- 12хз 4- 5x4 4- 6x5 4- Зхв = 8, xi — х2 -Ь 2хз 4- Х5 =0, 16xi — 16х2 4- 8x3 4“ 7х4 4" 4x5 4“ 5хв = 12. 69
5 Транспортная задача. Важный частный случай задач линейного программирования — транс- портные задачи. Это математические модели разнообразных приклад- ных задач по оптимизации перевозок. Транспортные задачи реша- ются методом потенциалов, который является усовершенствованием симплекс-метода примененного к данному более узкому типу задач. В Данном разделе мы приведем постановку транспортной задачи, методы отыскания исходной крайней точки, двойственную к транспортной за- даче, обоснование метода потенциалов, примеры. 5.1 Постановка задачи. Транспортной задачей по критерию стоимости называется следую- щая задача о минимизации стоимости перевозок. Пусть на станциях отправления Ai,...,Am сосредоточено соответ- ственно ai,...,am единиц некоторого однородного груза. Этот груз следует перевезти в п пунктов назначения Bi,...,Bn, причем в каж- дый из них надлежит завезти соответственно 6i,...,6n единиц груза. Стоимость перевозки единицы груза из пункта А, в Bj равна . Обозначая через количество единиц груза, предназначенного к отправке из пункта Ai в пункт В/, получим задачу нахождения плана перевозок, при котором общая стоимость окажется минимальной: т п (с, х) := cijxij min; Xij > 0, i = 1,..., m, j = 1,..., n, (з) i=i j=i n =Oi, i= (1) j=i = bj, j = 1,(2) »=1 В матричном виде ограничения задачи (1)-(2) имеют вид: /1 1 ... 1 0 0 ... 0 ... 0 0 ... 0\ /хпу /«1 \ 0 0 ... 0 1 1 ... 1 ... 0 0 ... 0 £12 в2 0 0 ... 0 0 0 ... 0 ... 1 1 ... 1 £1п 1 0 ... 0 1 0 ... 0 ... 1 0 ... 0 61 0 1' ... 0 0 1 ... 0 ... 0 1 ... 0 Хт1 bi £щ2 <0 0 ... 1 0 0 ... 1 ... 0 0 ... 1) \ £mn г \ьп) 70
План перевозок и их стоимость представляются в виде векторов х = (Xij) i = j = с = (с,J, i = 1, j = 1, ...,n) соответственно, или матриц X = , С = {ctJ-. 7 = 1,...,n 7=1,...,п Уравнения (1) означают, что из пункта отправления Ai весь груз вывезен в пункты назначения. Уравнения (2) означают, что количе- ство груза, завезенного в пункт Bj со всех пунктов отправления, со- ответствует требуемому. Естественно считать, что общий запас груза на всех пунктах от- правления равен суммарной потребности всех пунктов назначения, т. е. i=l j=l в этом случае говорят, что имеется замкнутая модель транспортной задачи. Если суммарные запасы отправителей больше суммарных запасов т п потребителей, т. е. 22 ai > 22 то равенства (1) заменяются нера- i=l 7=1 венствами п 23Xii - « = i. • • •.п». (!')* >=1 а условие (2) остается без изменений. В этом случае вводится фиктив- ный пункт потребления Вп+1 с требуемой величиной завоза an+i = т п 22 а» “ 22 Ч и нулевыми стоимостями перевозок в этот пункт. Доба- »=1 7=1 вляя новые неотрицательные переменные a?in+i, i = 1,..., m, приходим к замкнутой модели транспортной задачи с ограничениями в виде ра- венств (1)-(2). Если суммарные запасы отправителей меньше суммарных запасов т п потребителей, т. е. 22 а» < 22 то равенства (2) заменяются нера- t = l 7 = 1 венствами т У? xij’ < • • • > n> (2Z) 1=1 а условие (1) остается без изменений. В этом случае вводится фиктив- ный пункт отправления Am+i с требуемой величиной вывоза = * rn * 22 ^7 ~22 и нулевыми стоимостями перевозок из этого пункта. До- >=i j=i бавляя новые неотрицательные переменные zm+i у, j = 1,..., п, прихо- дим к замкнутой модели транспортной задачи с ограничениями в виде Равенств (1)—(2). 71
5.2 Особенности задачи. Поставленная транспортная задача является задачей линейного про- граммирования и может быть решена симплекс-методом, который зна- чительно упрощается в виду простого строения системы ограничений (1)-(2). Этот упрощенный метод мы и опишем ниже. Предварительно до- кажем некоторые утверждения, имеющие место для транспортных за- дач. Лемма 1. Для любой транспортной задачи существует допусти- мый план. __ тт Доказательство. Нетрудно видеть, что если положить хц = М то уравнения (1)-(2) будут выполняться и значит — допустимый план перевозок. Поскольку значение задачи ограничено снизу нулем и допустимый план перевозок имеется по лемме 1, то в задаче (з) по теореме суще- ствования решения п. 3.1 (|5з| < +оо => Arg з ф 0) оптимальный план существует. Лемма 2. Ранг системы ограничений (1)-(2) равен т 4- п — 1. Доказательство. Если сложить первые т строк матрицы огра- ничений А и вычесть из них последние п строк, то получим нулевую строку. Следовательно, ранг матрицы А меньше т 4- п. С другой стороны, располагая т — 1 строку матрицы А^начиная со второй), под п последними строками, получим треугольную матрицу из т+п—1 строк, ранг которой равен количеству уравнений (тп+п—1). Таким образом, ранг матрицы А равен т 4- п — 1. По предложению 1 п. 3.2 (столбцы матрицы ограничений, соответ- ствующие положительным координатам крайней точки, линейно не- зависимы) и лемме 2 (количество линейно-независимых столбцов не превышает т 4- п — 1) крайняя точка в задаче может иметь не более т 4- п — 1 положительных координат. Лемма 3. Любые т 4- п — 1 строк матрицы А являются линейно независимыми. Доказательство. Любая строка матрицы А (для определенности возьмем строку из системы уравнений (1)) равна сумме всех строк уравнений (2) минус сумма всех строк уравнений (1) без э?ой строки, то есть является линейной комбинацией оставшихся т 1 строк. А так как ранг матрицы А равен m 4- п — 1, то оставшиеся строки линейно независимы. 72
5.3 Методы нахождения начальной крайней точки, рассмотрим замкнутую модель транспортной задачи. 1. Метод ” северо-западного угла”. Назначим максимально воз- можную перевозку из пункта отправления Ai в пункт назначения В\. То есть заполняем верхний левый элемент матрицы X первоначальной крайней точки. При этом либо пункт отправления Ai, либо пункт на- значения Bi , либо оба эти пункта окажутся полностью обслуженными. Если пункт отправления Ai оказался полностью обслуженным, то в дальнейшем при нахождении первоначального плана перевозок вы- водим из рассмотрения первую строку и рассматриваем только остав- шуюся часть матрицы X. Если пункт назначения В} оказался пол- ностью обслуженным, то аналогично выводим первый столбец. Если же и пункт отправления, и пункт назначения оказались полностью об- служенными, то выводим из рассмотрения и первый столбец, и пер- вую строку матрицы X (так может случиться только в вырожден- ной задаче). В этом случае в число базисных элементов включаем какой-нибудь один элемент с нулевым значением из этой строки или столбца. Давайте для определенности в базис включать второй эле- мент в строке, считая вычеркиваемый элемент первым. Эту процедуру продолжаем до тех пор, пока все пункты отправле- ния и пункты назначения не будут обслужены. Последней перевозкой будет перевозка из пункта отправления Ат в пункт назначения Вп. Найденный план будет допустимым планом перевозок, содержащим не более т + п — 1 положительных координат. На каждом шаге обслу- живается один из пунктов отправления или назначения (возможно и оба сразу), а на последнем шаге обслуживаются и последний пункт отправления и последний пункт назначения. Отметим, что данный метод нахождения первоначальной крайней точки не учитывает стоимости перевозок. Поэтому начальный план может оказаться далеко не оптимальным. Приведем другие методы нахождения начальной точки, учитывающие стоимости перевозок. 2. Минимум по матрице. Выберем в платежной матрице С мини- мальный элемент. Пусть mintj ctJ = CtOJO. Назначим максимально воз- можную перевозку из пункта отправления А,о в пункт назначения Bj0. Если минимальная стоимость перевозки достигается на нескольких элементах, то выбираем любой из них. Тем самым пункт отправления Ai0 или пункт назначения Bj0 (или оба пункта одновременно) будет об- служен. А в платежной матрице соответствующая строка или столбец (или оба одновременно) выводятся из дальнейшего рассмотрения. В оставшейся части платежной матрицы вновь ищется минималь- НЬ1Й элемент и процедура повторяется до тех пор, пока первоначальный 73
план перевозок не будет получен. Найденный план как и в методе ’’северо-западного угла” и по тем же причинам будет допустимым планом перевозок, содержащим не более m + п - 1 положительных координат. Если число положительных элементов найденного плана перевозок будет меньше, чем тп 4- п — 1, то дополняем множество базисных векто- ров до m + п — 1, включая в число базисных столбцов любые столбцы матрицы А. Как правило в число базисных включают вектора, для которых стоимость перевозок минимальна. Полученный план перевозок вновь будет крайней точкой множества допустимых элементов задачи. 3. Минимум по строке. Выберем в первой строке платежной ма- трицы С минимальный по величине элемент. Предположим minj cij = ciJo. Назначим максимально возможную перевозку из пункта отпра- вления Ai в пункт назначения Bj0. Если минимум достигается на не- скольких элементах, то выбираем любой из них. Тем самым пункт от- правления Ai или назначения Bj0 (iajivl оба пункта одновременно) будет обслужен. А в матрице первая строка или соответствующий столбец (или оба одновременно) выводятся из дальнейшего рассмотрения. В первой строке оставшейся части матрицы вновь ищется мини- мальный элемент и процедура повторяется до тех пор пока первонаг чальный план перевозок не будет получен (первой строкой может ока- заться вновь первая строка исходной матрицы без какого-то элемента или вторая строка исходной матрицы без какого-то элемента). Дополняя как описано выше при необходимости множество базис- ных векторов до т 4- п — 1, получаем крайнюю точку множества допу- < стимых элементов задачи. t 4. Минимум по столбцу. Выберем в первом столбце платежной ; матрицы С минимальный элемент. Предположим min, c,i = Cjoi. На- j значим максимально возможную перевозку из пункта отправления А»о в пункт назначения В\. Если минимум достигается на нескольких эле- ; ментах, то выбираем любой из них. Тем самым пункт отправления * Ai0 или назначения Bi (или оба пункта одновременно) будет обслу- жен. А в матрице соответствующая строка или первый столбец (или оба одновременно) выводятся из дальнейшего рассмотрения. 4 В первом столбце оставшейся части матрицы вновь ищется мини- мальный элемент и процедура повторяется до тех пор пока первонаг ' чальный план перевозок не будет получен (первым столбцом может 7 оказаться вновь первый столбец исходной матрицы без какого-то эле- мента или второй столбец исходной матрицы без какого-то элемента). Дополняя как описано выше при необходимости множество базис- ных векторов до т 4- п — 1, получаем первоначальную крайнюю точку. 74
5.4 Метод потенциалов. Сформулируем правило решения транспортной задачи методом потен- циалов (обоснование этого метода будет дано в п. 5.7). 1. Привести задачу к замкнутой модели (см. п. 5.1). 2. Найти первоначальный план перевозок х, являющийся крайней /почкой множества допустимых элементов. 3. Исследование плана перевозок х. Для найденного плана х по- строить матрицу С = » Cij — щ 4- Vj, определяя m + n потенциалов u,, Vj из системы m + n — 1 уравнений: Ui -i- vj = Cij для базисных индексов i,j. Эти уравнения линейно независимы, поэтому для однозначного опре- деления потенциалов u,, Vj положим заранее один из потенциалов за- данной величине, например, положим щ = 0. Замечание. Элементы Cij матрицы С не зависят от первона- чального выбора til. Действительно. Предположим, что вместо первоначального потен- циала ui мы бы взяли потенциал ui = ui +1. Тогда £4 = i»i — t и все = щ +t, Vj = Vj —i при базисных i, j, поскольку щ + Vj = с^ при ба- зисных i, j. Таким образом, сумма + Vj = Ui+t + vj—t = u, 4- Vj = Cij не зависит от выбора первоначального потенциала ui. 4. Провести исследование матрицы Д:= С — С. Если А > 0, то исследуемый план х является решением задачи (з), а потенциалы щ, Vj являются решением двойственной задачи. Если среди элементов матрицы А есть отрицательные, то выберем наименьший элемент. Пусть, например, Ajojo = min Atj < 0. * J 5. Построить новый план перевозок, являющийся крайней точкой множества допустимых элементов. Положим x>oJo = t, x'ij = Xij ± t для базисных индексов i,j, где t — некоторая положительная величина (не изменяя остальные небазисные компоненты х^ равные нулю) так, чтобы по-прежнему были нео- трицательны, но одна из базисных компонент обратилась бы в ноль. Вектор матрицы А, соответствующий этой компоненте, выводим из числа базисных, а вектор матрицы А, соответствующий переменной х«оjo > вводим в число базисных векторов. Далее вновь начинаем иссле- дование полученной крайней точки х', т. е. возвращаемся к п. 3. В невырожденной задаче в ноль может обратиться только одна из компонент. В вырожденной задаче в ноль может обратиться несколько компонент вектора х. В этом случае из числа базисных векторов ис- ключается любой вектор с нулевым значением, как правило исключа- ется вектор с наибольшей стоимостью перевозок. 75
5.5 Примеры транспортных задач. Пример 1. 2хц 4- 2x12 4- 4xi3 4- 8x14 + 4x21 4- 6x22 + 7хгз 4“ 6x244- 4-6хз1 4- Зх32 4- 4х3з 4- 9х34 -> min; £11 4- £12 4- Х13 4- £14 = ^21 4- £22 4- £23 4- £24 = £31 4- £32 + £33 + £34 = 14 £ц 4- £21 + £31 < 22, 1g’ £12 4- £22 4- £32 < 2, 1g’ £13 + £23 4- £33 < 17, xi4 + £24 4- £34 < И» > 0, i = 1,2,3, j = 1, 2,3,4. Решение. Поскольку суммарные запасы отправителей меньше 3 4 суммарных запасов потребителей, т. е. J2 о, = 48 < £ bj = 52, то i=! j=l надо привести задачу к замкнутой модели. Введем фиктивный пункт 4 з отправления А4 с требуемой величиной вывоза а4 = 52 ~ 52 а« = 4 i=i i=i и нулевыми стоимостями перевозок из этого пункта. Зададим транс- портную задачу в виде платежной матрицы. 61 = 22 Ь2 = 2 63 = 17 64 = 11 ai = 14 2 2 4 8 О2 = 18 4 5 7 6 О2 = 16 6 3 4 9 04 = 4 0 0 0 0 Построим по методу "Северо-западного угла” первоначальное распре- деление: 61 = 22 62 = 2 Ь3 = 17 64 = 11 ai = 14 14 О2 = 18 8 2 8 02 = 16 9 7 04 = 4 4 Для краткости в матрице плана перевозок не пишем нулевые значе- ния небазисных перевозок. Значение функционала равно 225. Число ненулевых элементов в первоначальном плане перевозок т 4- п — 1 = 4 4-4—1 = 7. Это позволяет сразу перейти к исследованию на опти- мальность найденного плана. Построим матрицу С: 76
г «1 = 2 «2 = 3 «з = 5 «4 = 10 «1=0 2 3 5 10 «2 = 2 4 5 7 12 «з = —1 1 2 4 9 «4 = —10 -8 -7 -5 0 О -1 -1 -2 л гч I и и и I В матрице Д = С — С = | _ . л л I минимальный элемент I э 1 U и I \8 7 5 0 / Д24 = min &ij = —6 < 0. Добавляя в первоначальный план распреде- ления на место нулевого небазисного элемента ®24 величину получим второй план возможных перевозок 14 8 2 8-t t 9 + t 7 — t 4 14 8 2 1 7 16 4 Величина t = 7, Значение функционала = 183. Построим матрицу С: «1 = 2 «2 = 3 «3 = 5 «4 = 4 «1 = 0 2 3 5 4 «2 = 2 4 5 7 6 «3 = —1 1 2 4 3 «4 = —4 -2 -1 1 0 (0 -1 -1 4\ 0 0 0 0 1 е л л г» I минимальные элементы 0 1 U о I 21-10/ Д12 = Д1з = Д43 = mm Aij = —1 < 0. Во множество базисных элементов включим элемент Ж43 с наименьшей стоимостью перевозок. Добавляя в первоначальный план распределения на место нулевого не- базисного элемента Х43 величину получим третий план возможных перевозок 14 8 2 1 -t 7 + t 16 i 4-t 14 8 2 8 16 1 3 77
Величина t = 1. Значение функционала =182. Построим матрицу С: г>1 = 2 v2 = 3 г>з = 4 г>4 = 4 «1 = 0 2 3 4 4 U2 — 2 4 5 6 6 из = 0 2 3 4 4 гц = —4 -2 -1 0 0 /0 -1 0 4\ В матрице А = С — С = 10 1 4 0 0 1 0 0 I с I минимальный элемент □ 1 \2 1 0 0/ Д12 = min Л,, = — 1 <0. Добавляя в первоначальный план распреде- ления на место нулевого небазисного элемента величину t, получим четвертый план возможных перевозок 14 -t t 8 4“ t 2-t 8 16 1 3 12 2 10 8 16 1 3 Величина i = 2. Значение функционала = 180. Построим матрицу С: vi = 2 г>2 = 2 v3 = 4 V4 = 4 «1 = 0 2 2 4 4 «2 = 2 4 4 6 6 из = 0 2 2 4 4 U4 = —4 -2 -2 0 0 (0 2 0 1 0 0 4\ 0 хп _ I > 0, то найденный четвертый э 1 0/ 0 1 1 2 план перевозок является оптимальным и суммарная стоимость всех перевозок равняется 180. Отметим, что возможны и другие, также являющиеся оптимальными, планы перевозок с той же суммарной сто- имостью перевозок. 78
Пример 2. £ц + 2^12 + 3xi3 + 4x14 + 4x21 + 3x22 + 2хгз+ +2хз2 + 2х3з + хз4 -> min; £11 + £12 + ®13 + ®14 = 3, £21 + £22 + £23 + £24 = 4, £31 + £32 + £33 + £34 = 5, £11 + £21 + £31 < 2, £12 + £22 + £32 < 3, £13 + £23 + £зз < 4, £14 + £24 + £34 < 3, £ij >о, t = 1,2,3, j = 1,2,3,4. Решение. Поскольку суммарные запасы отправителей равны сум- 3 4 марным запасам потребителей, т. е. а* = 52 = 12, то данная »=! j=l задача является замкнутой моделью транспортной задачи. Зададим задачу виде платежной матрицы: Ьг = 2 оо II II 64 = 3 ai = 3 1 2 3 4 02 = 4 4 3 2 0 а3 = 5 0 2 2 1 Построим по методу ’’Северо-западного угла” первоначальное распре- деление: 61 = 2 Ь2 = 3 63 = 4 64 = 3 01 = 3 2 1 02 = 4 2 2 Оз = 5 2 3 Для краткости в матрице плана перевозок не пишем нулевые значе- ния небазисных перевозок. Значение функционала равно 21. Число ненулевых элементов в первоначальном плане перевозок т + п — 1 = 3 + 4 — 1 = 6. Это позволяет сразу перейти к исследованию на опти- мальность найденного плана. Построим матрицу С: V1 = 1 02 = 2 Оз = 1 О4 = 0 = 0 1 2 1 0 02 = 1 2 3 2 1 Оз = 1 2 3 2 1 79
(О О 2 4 \ 2 О О — 1 j минимальный элемент -2-10 0 / Дз1 = min Дн = —2 < 0. Добавляя в первоначальный план распреде- ли ления на место нулевого небазисного элемента ®3i величину получим второй план возможных перевозок 2-t l + t 2-t 2 + t t 2 — t 3 0 3 4 2 0 3 Величина t = 2. Из трех обнулившихся базисных элементов в базисе оставили два элемента с наименьшими стоимостями перевозок. Зна- чение функционала равно 17. Построим матрицу С: «1 = 1 «2 = 2 «з — 3 «4 = 2 «1 = 0 1 2 3 2 U2 = -1 0 1 2 1 «3 = —1 0 1 2 1 (ООО 2 \ 4 2 0 — 1 I минимальный элемент Д24 = 0 10 0/ min = — 1 < 0. Добавляя в первоначальный план распределения на w место нулевого небазисного элемента #24 величину получим третий план возможных перевозок 0 3 4-/ t 2 o + t 3-t 0 3 1 3 2 3 Величина i = 3. Значение функционала = 14. Построим матрицу С: «1 = 1 «2 = 2 «з = 3 «4 = 1 «1=0 1 2 3 1 «2 = “1 0 1 2 0 «3 = “1 0 1 2 0 (0 0 0 3\ 4 2 0 0 1 все элементы неотрицательны. 0 10 1/ Значит найденный третий план перевозок является оптимальным Я суммарная стоимость всех перевозок равняется 14. 80
Пример 3. 5хц 4- 4^12 4- 13ххз + 9^14 4- 2x21 + 7хгг 4- бхгз 4- 8x24+ +9хз1 4- 7хз2 4- Ихзз 4- 7x34 4- Х41 4- 6x42 4- £43 4- £44 —> min; хц 4- ^12 + ®1з 4- ®14 = 19, хц 4-£21 4-£31 4-£41 = 9, £21 4" т22 4-£23 4-£24 = 7, £12 4- £22 4- £32 + £42 = 17, £31 4-£32 4“ £33 4-£34 = 11> £13 4-£23 + £33 + £43 = 15, £41 4- £42 4- £43 4- Х44 = 15, £14 4“ £24 4-£34 4“ £44 = 11» xij > О» М = 1,2,3,4. Решение. Представим транспортную задачу замкнутого типа в стандартной форме: 61 =9 Ь2= 17 Ь3 = 15 64 = 11 01 = 19 5 4 13 9 □2 = 7 2 7 6 8 □2 ~ 11 9 7 11 7 □4 = 15 1 6 1 1 Построим по методу ” Северо-западного угла” первоначальный план: Q- II со 62 = 17 Ь3 = 15 Ь4 = 11 01 = 19 9 10 □2 = 7 7 0 О2 = 11 11 □4 = 15 4 11 Для краткости в матрице плана перевозок не пишем нулевые значения небазисных перевозок. Значение функционала равно 270. Число эле- ментов в базисе m 4- п — 1 = 44-4—1 = 7. Один базисный элемент оказался нулевым. Это означает, что задача является вырожденной. Перейдем к исследованию на оптимальность найденного плана. По- строим матрицу С: vi = 5 V2 = 4 из = 3 г»4 = 3 ui = 0 5 4 3 3 112 = 3 8 7 6 6 из = 8 13 12 11 11 114 = —2 3 2 1 1 В ( 0 0 10 6 \ __g Q Q 2 1 л сп а I минимальный элемент —4 —5 0 —4 1 -2 4 0 0 / 81
&21 — min Ajj = —6 < 0. Добавляя в первоначальный план распреде- ления на место нулевого небазисного элемента a?2i величину получим второй план возможных перевозок 9—t 10+t t 7-t 0 11 4 11 2 17 7 0 и 4 И Величина t = 7. Значение функционала = 228. Построим матрицу С: vi = 5 V2 = 4 «з = 9 v4 = 9 ui = 0 5 4 9 9 «2 — ~ з 2 1 6 6 из = 2 7 6 11 11 и4 = -8 -3 -4 1 1 0 0 4 0 a М О и Z I В матрице А = С — ~ I 2 1 0 4 минимальный элемент \4 10 0 0 / А34 = min A,j = —4 < 0. Добавляя в план на место нулевого небазис- ного элемента Z34 величину /, получим третий план перевозок 2 17 7 0 11—t t 4+t 11-1 2 17 7 0 11 / 15 0 Величина t = 11. В этом случае обнуляются сразу два базисных эле- мента. Оставим из них в базисе элемент х44 с наименьшей стоимостью перевозок. Значение функционала равно 184. Построим матрицу С: vi = 5 V2 = 4 «з = 9 v4 = 9 «1: = 0 5 4 9 9 u2 = -3 2 1 6 6 «3 = -2 3 2 7 7 u4 = -8 -3 -4 1 1 0 0 4 0 Матрица А = С — С = I - л Л I > 0. Значит третий плаЯ I о э 4 и I \4 10 0 0/ перевозок является оптимальным и стоимость всех перевозок равна 184. 82
5.6 Задача двойственная к транспортной задаче. Рассмотрим транспортную задачу: m п (с, х) := niinj Xij > 0, i = 1,..., т, j = 1.п, (з) .=1 j=i n ^Xij =а4, i= 1................ (1) i=i m xij = bj, j = 1,..., n (2) »=1 (m n X 52 ai = Z2 bj “ . Двойственной к ней будет »=1 j=i / (выведите самостоятельно) задача т п (а,«) + (6, v) := а«и< + У^ bjvi max> i=i j=i и,- + vj < Cij, i = 1,... ,m, j = 1,.. .,n, (з**) в которой двойственными переменными являются потенциалы и = (ui,...,Um), V = (vi,...,Vn). В матричном виде ограничения задачи (з“) имеют вид: /1 0 1 О 1 О О 1 О 1 О О О О \о о О 1 о ... 0\ О 0 1 ... о ООО О 1 о О 0 1 ООО /«! \ «2 ит Vi V2 ✓ > Си Cml Cm2 X Cflu / О 1 1 1 о 1 0 1 1 о о 1 о о 1 о о Матрица ограничений является транспонированной по отношению к матрице ограничений исходной транспортной задачи (з). 83
5.7 Обоснование метода потенциалов решения транспортной задачи. Теорема. Крайняя точка х является решением в невырожденной транспортной задаче (з) тогда и только тогда, когда вектор Д > Q. Доказательство. Достаточность. Пусть Д > 0. Это означает, что для точки х найдены потенциалы и», Vj такие, что Д^ := —су == Cij — (ui + vj) > « = 1, *, TO, J = 1, . . ., П, причем U{ + Vj = Cij для базисных i, j (множество базисных индексов обозначим В). Следова- тельно, щ 4- Vj < с^, i = 1,..., m, j = 1,..., n. Таким образом, условие Д > 0 равносильно тому, что вектор (u, v) является допустимым в двойственной задаче (з**). С другой стороны, поскольку Xij = 0 при (i,j) £ В, то (с,г)=5252с^г,'> = 52сОжй = 52 (*+vi)xii = ^Y^+vi')xV- t=lJ=1 ij€B ijEB t=lj=l Разбивая последнюю сумму на две и учитывая условия (1) и (2), про- должим последнее равенство т п т п т п пт <с-х) = 52 52 щх‘з+52 52 = 52 u,52х»+52 52 = »=lj=l :=1 J=1 »=1 j = l j=l i=l = +52 v3b3 = <a> «>+<b> ®>- t=l j=l Отсюда по критерию решения п. 3.1 x — решение в прямой задаче (з), a (u,v) — решение в двойственной задаче (з**). Необходимость. Пусть х — оптимальный план. Докажем, что то- гда Д > 0. Проведем доказательство от противного. Допустим, что это условие не выполняется, т. е. существует Д,о7-о < 0. Поскольку Д,у = 0 для (i,j) € В, то (£о> jo) £ В. Возьмем достаточно малое t > 0 так, чтобы ж-Н > 0, где вектор t = {/tJ} выбирается по методу потен- Г±^или0, i,jeB, циалов, tij = < t, i = i0, j = j0, Условия (l)-(2) допустимости 10, иначе. вектора x +1 в задаче (з) равносильны условиям: т п 52«о=°, j = 52^=0, *=1> - ’га- »=1 7=1 84
Поскольку Cij = Ду 4- ctj = Ду 4- («» 4- ty), то m n {c, x +1} - (c, x) = (c, i) = 52 £?A,J + <Ui + 'Mi = t = l J=1 m n m n n m = 52 52 +52 ui 52 + 52 ъ* 52 = а»ол<Л’одо- t=l j=l 1=1 j=l j=l 1=1 Последние два слагаемых в этой сумме равняются нулю в силу соот- ношения (3). Слагаемые Aijtij = 0 при (t,j) (г*о, Jo), так как в этом произведении один из сомножителей равен нулю: Ду = 0 при (г,У) 6 В, tij — 0 при (г, j) $ В, (г, j) Таким образом, (с, х 4- i) — (с, х) = Д»оУо^»о^о < значит, х не является оптимальным планом. Получили противоречие. Следовательно, наше допущение, что существует Д»оуо < 0 неверно и, если х — оптимальный план, то обязательно Д > 0. 5.8 Задача о назначении. Пример. Пусть некоторая фирма нанимает т служащих на п вакантных мест. Известно, что при назначении г-oro служащего на j-e место фирма получит су прибыли. На какие должности кого надо назначить, чтобы общая прибыль фирмы после назначений была наибольшей? Таким образом, задача о назначении является частным случаем транспортной задачио максимуме функционала, когда = bj = 1, i = 1,..., m, j = 1,..., n: m n {c,x) := EE cyxy —> max; sy > 0, i = 1,..., m, j = 1,..., n, i=ij=i m n 52 = 1> J = 1, • • •, n; 52 Xii - L> » = 1> • • > ”»• i=l j=l Задачи о назначении также решаются методом потенциалов, пред- варительно перейдя от задачи на максимум к задаче на минимум т п -м = ЕЕ —Cij Xij —> min. »=i i=i Поэтому, если в платежной матрице задачи о назначении стоимости были су, то при решении методом потенциалов берутся стоимости -Су. 85
Пример. 5гц + 4ti2 + 7а?1з + 6^21 + 7®22 + Зхгз + 8x31 4- П*зг + 2жзз —> шах; ®11+ *12 + *13 = lj *21 +*22+ *23 = 1, *31 + *32 + *33 = 1 > *11 4-*21+*31 = 1 *12 + *22 + *32 = 1 *13 + *23 + *33 = 1 *0 > 0, i,j = 1,2,3. Решение. Задачу о назначении можно задать в виде платежной матрицы, не указывая величины а,,67-, поскольку они равны Г. 5 4 7 6 7 3 8 И 2 Перейдем от задачи на максимум к задаче на минимум, при этом в платежной матрице стоимости поменяют свой знак: -5 -4 -7 -6 ^—7 -3 -8 -И -2 Построим по методу ” Северо-западного угла” первоначальное рас- пределение. Два нулевых элемента будем считать базисными, чтобы число элементов в базисе было m + n — 1 = 3 + 3—1 = 5. Выберем их так, чтобы они имели минимальные стоимости. 1 1 0 0 1 Значение функционала равно —14. Построим матрицу С: «1 = —5 v2 = —8 V3 = 1 «1 = 0 -5 -8 1 U2 = 1 -4 —7 2 «з = —3 -8 -11 -2 (О 4 -8V —2 0 —5 I минимальный элемент Д13 = ООО/ min Ан = — 8 < 0. Добавляя в начальный план распределения на место м 86
нулевого дебаэисного элемента а?1з величину получим второй план 1-t t 1 0+t 0 1-t 0 1 1 1 0 Величина t = 1. Из двух обнулившихся базисных элементов в базисе оставили элемент с наименьшей стоимостью. Значение функционала равно —22. Построим матрицу С: «1 = -5 «2 = —8 V3 = —7 «1=0 -5 -8 -7 «2 = 1 -4 -7 -6 u3 = -3 -8 -11 -10 (О 4 0\ —2 0 3 1 минимальный элемент Д21 = 0 0 8/ min Ди- = —2 < 0. Добавляя во второй план распределения на место нулевого небазисного элемента ®21 величину получим третий план распределения должностей 0 1 t 1-t 1-t o+t 0 1 1 0 1 Величина t = 1. Из двух обнулившихся базисных элементов в базисе оставили элемент с наименьшей стоимостью. Значение функционала равно —24. Построим матрицу С: vi = —5 «2 = —8 «з = —7 «1=0 -5 -8 -7 «2 = -6 -9 -8 «3 = ~3 —8 -11 -10 /0 4 0 В матрице Д = С—(7 = 10 2 5 \0 0 8 Значит найденное распределение является оптимальным и значение ис- ходной задачи равняется 24. все элементы неотрицательны. 87
Глава 3 Классическое вариационное исчисление Началу появления вариационного исчисления дала толчок работа И.Бернулли 1696 года ”Новая задача, к решению которой приглаша- ются математики”, в которой поставлена задача о брахистохроне. В вертикальной плоскости даны две точки А и Б. Определить путь АМБ, спускаясь по которому под действием собственной тяжести тело М, на- чав двигаться из точки А, дойдет до точки Б за кратчайшее время. Вводя в плоскости систему координат так, чтобы ось t была горизон- тальна, а ось х вертикальна, и пользуясь законом Галилея о скорости тела, падающего вниз под действием силы тяжести, нетрудно выпи- сать формализованную постановку задачи: ti .____ [ — dt —> inf; х($о) = ®о, ff(ti) = J V*(t) to Эта задача была решена самим И.Бернулли, а также Лейбницем, Я.Бернулли и И.Ньютоном. Решение Лейбница было основано на ап- проксимации кривых ломаными. Развитая затем в работах Эйлера, эта идея заложила основы прямых методов в вариационном исчисле- нии. Выписанная выше задача об экстремуме интегрального функци- онала при заданных условиях на концах, является простейшей задачей вариационного исчисления, к рассмотрению которых мы сейчас и пе- рейдем. В третьей главе приводятся также и другие элементарные задачи КВИ: задача Больца, изопериметрическая задача. Все они являются частным случаем более общей задачи Лагранжа. Как частный случай задачи Лагранжа рассматриваются задача с подвижными концами и задача со старшими производными. 88
1 Простейшая задача классического ва- риационного исчисления 1.1 Постановка задачи. Простейшей задачей классического вариационного исчисления назы- вается следующая экстремальная задача в пространстве С1 ([to, <1])- ti /(а?(.)) = J £(/, x(t), x(t)) dt —> extr; x{Iq) = xq, x(ti) = «ь (з) to Здесь L — £(/, x, i) — функция трех переменных, называемая ин- тегрантом. Отрезок [to > *1] предполагается фиксированным и конеч- ным, to < <1- Экстремум в задаче рассматривается среди функции х( ) 6 О'1 ([to> h])> удовлетворяющих условиям на концах^ или краевым условиям; такие функции называются допустимыми. Введем норму в пространстве С1 ([to, ti]): l|y|lci([to,t,]) = maxdlvllcdto.tx]). Ilyllcato.h])}, где lly||c([t0, t,J) •= max{|j/(t)| 11 E [t0, <i]}- Для краткости введем еле- дующие обозначения 11у||о := ll!/||c([to,hl)> llvlli := ll»llc>([to,«i])> которыми будем пользоваться в дальнейшем. Определение. Говорим, что допустимая функция £(*) доставляет слабый локальный минимум в задаче (з), и пишем х() 6 locmin з, если существует 5 > 0 такое, что для любой допустимой функции х(), для которой ||х( ) — х( )||1 < J, выполняется неравенство Z(x(-)) > /(£(♦))• Наряду со слабым экстремумом в классическом вариационном ис- числении также изучается сильный экстремум. При этом расширя- ется класс функций, среди которых рассматривается задача. Силь- ный минимум ищется в более широком линейном пространстве, чем ^1([^0» *1]), а именно, в линейном пространстве кусочно-дифференци- руемых функций КС1 ([to, ti]). К строгому определению сильного экс- тремума вернемся в главе 5 п. 1. Однако, как правило, функции доставляющие абсолютный (гло- бальный) экстремум в С1 или КС1, доставляют абсолютный экстре- мум и среди более широкого класса функций — всех абсолютно непре- рывных функций, на которых функционал Г определен. 89
1.2 Вывод уравнения Эйлера с помощью основной леммы вариационного исчисления. Теорема. Пусть х(-) € locextr з (слабый), Ь,ЬХ,Ь± — непрерывны, L± £ C1([to> ti]). Тогда выполнено уравнение Эйлера + Lx(t) = 0 VtG[to,ti]. at Это дифференциальное уравнение второго порядка было впервые в 1744 году выведено Эйлером. Он, аппроксимируя кривые ломаными, вывел уравнение, которому были должны удовлетворять экстремали. Впоследствии Лагранж назвал его уравнением Эйлера. Сам Лагранж выводит это уравнение в 1759 году вариируя кривую, подозреваемую на экстремум, выделяет из приращения функционала главные линей- ные части, которые называет вариациями, и пользуется тем, что в точке экстремума вариация должна обращаться в нуль. Метод Ла- гранжа становится общепринятым. Этим методом мы и выведем далее уравнение Эйлера. Функции, удовлетворяющие уравнению Эйлера, называются экс- тремалями. Допустимые функции (класса С1 с заданными гранич- ными условиями), удовлетворяющие уравнению Эйлера, называются допустимыми экстремалями. Доказательство теоремы. Пусть ®( ) 6 locextr з. Возьмем про- извольную, но фиксированную функцию h( ) Е Cq ([/о, ^i])• Здесь мы пользуемся следующим обозначением: СЙ([*О, й]) = {*(•) € СЧро, Й]) I A(to) = ft(h) = 0). Поскольку £(•) 6 locextr з, то функция одного переменного ti 9?(А) := /(£(•) + А/»()) = У L{t, x(t) + Aft(t), i(i) + Xh(i)) dt to имеет экстремум при A — 0. Положим F(t, Л) = x(t) + AA(t), x(t) + Xh(t)). Из условий гладкости, наложенных на Z, f( ), h( ), следует, что функция ^(-) дифференцируема в нуле. Действительно, функции F я F\ непрерывны в некотором прямоугольнике [to> t\] * [— Ао, До], и, зна- чит по известной теореме из анализа можно дифференцировать под знаком интеграла. Но тогда по теореме Ферма у/(0) = 0. Дифферен- 90
цируя функцию <р и полагая А = 0, получаем ti р'(0) = J(L±(t)h(t) + Lx(t)h(t))dt = o v h е qj([to, ti]). (1) to Проинтегрируем по частям первое слагаемое в соотношении (1) для h 6 Co([to, ^11)' ti ti tx tj f Lihdt= f Lidh = Li(t)h(t)\tl - [ h^-Ltdt = - f h^-Lidt. J J >to J dt J dt to to to to Свободные члены при интегрировании по частям равняются нулю, так как h(to) = h(ti) = 0. Тогда соотношение (1) перепишется в виде ti /+Л=° v h е с№°> (2) to Основная лемма классического вариационного исчисления (лемма Лагранжа). Пусть функция а( ) непрерывна на отрезке [/о, /1] и ti У a(t)h(t) dt = 0 V Л( ) е Cjdto, ti]). to Тогда a(t) = 0. Доказательство леммы. Предположим а(т) / 0 в некоторой точке т € [to> tj (допустим а(т) > 0). Тогда в силу непрерывности функция a(t) > 0 и в некоторой окрестности точки т, например, от- резке [то, Ti] С [to, й]. Пусть h( ) 6 Со ([to, t J) — положительная в этой окрестности функ- ция и равная нулю вне ее, типа "шапочки”, например, h(t) _ Г (<-то)2(*-Т1)2, те[го,Т1], Тогда h( ) е Cq([to, ti]) — допустимая в лемме функция, но tx J a(t)h(t) dt > 0, to что противоречит условию леммы. Лемма Лагранжа доказана. По лемме Лагранжа из соотношения (2) вытекает уравнение Эй- лера. 91
1.3 Вывод уравнения Эйлера с помощью леммы Дю- буа-Реймона. В этом пункте мы выведем уравнение Эйлера для меныпих условий гладкостей, наложенных на интегрант L. Вместо леммы Лагранжа будем использовать лемму Дюбуа-Реймона. Теорема. Пусть х(-) G locextr (з) (слабый), функции Ь,ЬХ1ЬХ — непрерывны в некоторой окрестности множества {(/,£(/),£(/)) | t Е [fo.fi]}- Тогда Lx(t) Е Сг1([/о> <1]) непрерывно дифференцируемая функция и выполнено уравнение Эйлера — + Д₽(0 == О V f G [to, fij- ar Доказательство. Возьмем произвольную, но фиксированную фун- кцию &(•) 6 Со([/о, fi]). Поскольку £(•) 6 locextr з, то функция одного переменного ti р(А) := /(х(•) + АЛ( )) = У L(t, x(t) 4- Xh(t), £(t) + Xh(t)) dt to имеет экстремум при A = 0. Положим' F(t, A) = L(t, x(t) + Xh(t), x(t) + AA(t)). Из условий гладкости, наложенных на L, х(), Л(-), следует, что функция у>( ) дифференцируема в нуле. Действительно, функции F и F\ непрерывны в некотором прямоугольнике [to, ti] х [—Ао, Ао], и, зна- чит по известной теореме из анализа можно дифференцировать под знаком интеграла. Но тогда по теореме Ферма у>'(0) = 0. Дифферен- цируя функцию <р и полагая А = 0, получаем f tx ^(0) = f dt = 0 V Л( ) 6 Cq([io, 11]). (1) to Здесь мы не можем, как в предыдущем случае, брать второй ин- теграл по частям, поскольку не задана дифференцируемость функции Ь«()- Уравнение (1) означает, что вариация по Лагранжу функционала /(•) равна нулю: <f/(x(-),A()) = o v Л() е (Ш, til). 92
Лемма Дюбуа-Реймона. Пусть ао(')>а1(') 6 Сфо, ti]) и ti j(ai(i)h(t) 4- a0(t)h(t)) di = О V h E СоФо, *i])« to Тогда ai( ) 6 £*([*0, <i]) « ~4<*i(t) + <«o(t) = 0 V t e [to, ti]. at Из леммы Дюбуа-Реймона и соотношения (1) следует утверждение теоремы. Доказательство леммы. Возьмем функцию р() 6 С1 фо, / J) та- кую, что ti ti p(/) = a0(Z), У p(t)dt = У ai(t)dt, to to Она существует, так как p(t) = ao(i) — дифференциальное уравне- ние 1-го порядка, решение которого определенно с точностью до кон- станты, а выбором константы можно удовлетворить второе условие. Тогда для любой функции Л(-) 6 С*оФо, ^1]) по условию леммы должно выполняться равенство ti tj ti У+ aQ(t)h(t)) di = j ai(t)h(t) dt + jh(i)dp(t) = to to to tl tl tl = f ai(i)h(t)dt +h(t)p(i)\ — f p(i)h(t) dt = [(ai(i) - p(t))h(t) di = 0. J bo J J to to to v, (2) ‘ « f Возьмем функцию h(t) = f(ai(r) — p(r))dr. Тогда h(-) = pif) — to ₽(’) € Cq ([*o, ^i])j Равенство h(to) = 0 следует из определения функции h( ). Равенство h(ti) = 0 вытекает в силу выбора функции р(-): ti Л(«1) = = 0. to Значит для функции Л(-) должно выполняться равенство (2), т. е. h f(ai ~ р)2 dt = 0. Из последнего соотношения следует, что ai(t) = р(/), to т. е. ai(-) g С1([<о, Ъ]) и + ao(O = 0- Лемма Дюбуа-Реймона, di а вместе с ней и теорема доказаны. 93
1.4 Многомерный случай. Мы сформулировали теорему для одномерной простейшей задачей классического вариационного исчисления. Аналогично ставится век- торная задача и формулируются необходимые условия экстремума. Пусть x(t) = (a?i(Z),..., xn(i)) — n-мерная вектор-функция, инте- грант L = £(/, «1,..., хп, ii, •. •, in) — функция 2n + 1 переменного. Рассмотрим задачу ti J Lft.xij. ..,a?n,ii,. ..,in)cft -> extr; to = xij> i = j = 0,1. Необходимые условия экстремума в простейшей векторной задаче со- стоят из системы уравнений Эйлера -4x»<(*) + Xri(i) = °, «=1,...,п. at Доказательство теоремы в векторном случае тривиально редуци- руется к одномерному случаю. 1.5 Интегралы уравнения Эйлера. Если интегрант L = L(t, х, х) не зависит явно от одной из переменных, то уравнение Эйлера сводится к более простым уравнениям. 1. Если интегрант L = L(t, х) не зависит явно от ж, то имеет место интеграл импульса Li(t) = const. 2. Если интегрант L = Цх,х) не зависит явно от t, то имеет ме- сто интеграл энергии (оба названия интегралов взяты из классической механики) £(/)£*(/) — L(t) = const. Для доказательства интеграла энергии достаточно продифференциро- вать равенство по t и воспользоваться уравнением Эйлера: xLi + x^-Li - Lxx - Lxx = 0 <=> -x( - -^-Lx + Lx} = 0. at \ at / Замечание. Отметим, что при выводе интеграла энергии мы ис- пользовали дополнительное предположение о существовании второй производной х. Интеграл импульса имеет также лишнюю экстремаль x(t) = const. 94
1.6 Примеры. Пример 1. /(*(•)) = J о х2 dt —> inf; х(О) = О, х(1) = 1. Уравнение Эйлера: х = О. Общее решение: х = С it + Сг. Из начальных условий находим единственную допустимую экстремаль: х = t. Докажем, что она доставляет глобальный минимум в задаче, т. е. х = t 6 absmin. Для этого надо показать, что Z(x()) > Z(x()) для любой допустимой функции х(), или 1(х + Л) > 1(х) для любого h 6 Cq([0, 1]). Действительно, 1 ill I(x + h) — I(x) = j\x -F A)2 dt — j f2 dt = 2 J xhdt + j h2 dt> о ooo i 1 1 >2 J xhdt = 2 y* idh = 2x/i| — 2 j xhdt — 0. 0 0 0 Таким образом разность всегда неотрицательна, то есть имеем аб- солютный минимум. Пример 2. Зтг/2 1(х( )) — J (х2 — х2) dt —> inf; х(0) = = 0. о Уравнение Эйлера: х + х = 0. Общее решение: х = Ci sint + Сгсов/. Из начальных условий нахо- дим единственную допустимую экстремаль: х = 0. Покажем, что она не доставляет локального минимума, т. е. х £ locmin. Рассмотрим последовательность функций xn(t) = £siny. Оче- видно, что хп( ) — допустимые функции и хп( ) —> х( ) в С1 ([0,1]), но при этом '(*•(•» = = =/(»(•)). Получили, что значение функционала на хп( ) меньше, чем на х(-), зна- чит £() не доставляет слабого локального минимума. Из этого при- ора видно, что уравнение Эйлера — необходимое, но не достаточное Условие экстремума. 95
Задачи. Простейшие задачи классического вариационного исчисления. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 1 J х2 dt -> extr; я(0) = 1, х(1) = 0. о 1 У (х2 - x)dt —> extr; z(0) = ж(1) = 0. о 1 У (z2 4- tx) dt -> extr; ж(0) = x(l) = 0. о 1 У (i2 — t2x) dt —> extr; x(0) = x(l) — 0. о e У tx2 dt -» extr; z(l) = 0, x(e) = 1. 1 1 У (1 + t)x2 dt -> extr; x(0) = 0, ®(1) = 1. о з У(t2 — l)x2df -> extr; r(2) = 0, x(3) = 1. 2 i У x2x2 dt —> extr; z(0) = 1, x(l) = V2. о 4/3 [ jtЛ ->extr; ®(o) = i- ®(!) = (?) = s- J X ' О ' <7 о 1 У exx2 dt —> extr; x(0) = 0, z(l) = ln4. о 1 У(ir2 + xx + 12tx) dt -> extr; z(0) = z(l) = 0. о i У(t2x2 + 12x2) dt -> extr; x(0) = 0, x(l) = 1. о 96
1 13. у\х2 4- х2) dt —> extr; х(—1) = х(1) = 1. — 1 1 14. у\г2 4- х2 + 4х sh t) dt -> extr; x(0) = —1, x(l) = 0. о i 15. j(x2 + x2 + 4x ch t) dt —> extr; x(0) = x(l) = 0. о тг/2 16. J (x2 — x2) dt —> extr; x(0) = 1, x^) = 0. о ir/2 17. J (x2 — x2 + 4 z cost) dt —> extr; x(0) = x^^=0. о ir/2 18. У (x2 — x2 - 4x sint) dt —> extr; x(0) = = 0- о 1/2 ______ 19. / —- dt —> extr; x(0) = 1, xfi) = -7Д J x 2 0 20 f v/1^ X dt “*extr; = V’ = 1 1/2 To ________ 21. J xy/l + x2 dt —> extr; x(—Tq) = x(Tq) = £ -To (задача о минимальной поверхности вращения), ti ________ /yjJ д»2 --2=—dt -> extr; х(*о) = xo, s(*i) = Xi у/X to (задача о брахистохроне). To ______ 23. у Vx + h\/l + i2dt -> extr; x(0) = 0, x(Tq) = f. 0 1 24. J(i2 4- ~ 2x1x2) dt -> extr; 0 a?i(0) = хг(0) = 0, xi(l) = sh 1, x2(l) = —sh 1. 97
2 Задача Больца 2.1 Постановка задачи. Задачей Больца называется следующая экстремальная задача без ог- раничений в пространстве С71([/о>^1])- ti В(х()) = У L(t, x(t), x(t)) dt + l(x(t0), x(ti)) extr. (3) to Здесь L = L(i,x,z) — функция трех, a I = /(x(to), x(/i)) — функция двух переменных. Задача Больца — элементарная задача классического вариационного исчисления. Функционал В называется функционалом Больца, функция I — терминантом. Функции класса С1 ([/о, ti]) являются допустимыми в задаче. Определение. Говорим, что допустимая функция х(-) доставляет слабый локальный минимум в задаче (з), и пишем х(•) 6 locmin з, если существует 6 > 0 такое, что для любой допустимой функции $(•), для которой ||я(-) — £(')||1 < выполняется неравенство В(х( )) > В(х(•)). 2.2 Необходимое условие экстремума. Теорема. Пусть £(•) 6 locextr з (слабый), функции L,LX,LX — не- прерывны в некоторой окрестности множества {(/,£(/),£(/)) | t € [to, ° функция I — непрерывно дифференцируема в окрестности точки (f(to),x(/i)). Тогда Lx(t) Е (71([/о, ^1)] к выполнены а) уравнение Эйлера -^-Li(t) + Lx(t)=O vte[to, ti]; at б) условия трансверсальности = ^r(to)> ^«01) ~ ^®(ti)- Доказательство. Возьмем произвольную, но фиксированную функцию Л(-) 6 С1 ([to, h])- Поскольку £(•) 6 locextr з, то функция одного переменного ^(А) := B(i(.)+AA( )) = h = J L(t, x(t) + Xh(t), £(t) + AA(t)) dt + l(x(t0) + Xh(t0), х(й) + Aft(ti)) to 98
имеет экстремум при А = 0. Но тогда по теореме Ферма у?'(0) = 0. дифференцируй функцию <р и полагая А = 0, получаем ti ^(0) = у (Li(t)h(t) + Lx(t)h(t)) dt + ixMh(t0) + = о to (i) равенство (1) выполняется для любой функции h 6 С1 ([to, *1]), а зна“ чит и для функций h( ) 6 Со Фо, *1])- Следовательно, из (1) вытекает, что t У (Li(t)h(t) + Lx(t)h(t)) dt = О V h 6 С^([*о, 11]). to Отсюда по лемме Дюбуа-Реймона L®( ) 6 С1 ([to, ti]) и ~Lx(t) + Lx(t) = O Vie [to, #1]. at Для завершения доказательства теоремы осталось вывести усло- вия трансверсальности. Проинтегрируем по частям первый интеграл в соотношении (1) (оно стало возможным в силу доказанного включения Lx(t) е ^((io.ii)]): У Li(t)h(t)dt = У Lx(t)dh(t) = Zi(Z)h(Z)|‘l - У h(t)^Lx(t)dt. to to ’to Подставляя полученное выражение в соотношение (1) и учитывая уже доказанное уравнение Эйлера, получим ?'(о) = У (-&(*) + М))А(0 Л+ to + (Др(*1) + )Л(^1) + (—+ (r(t0))^(to) = = 4- 4c(ti))Л(/1) 4- (~Xr(/o) 4- £r(t0))^(to) — 0 Vhe^atoJx]). (2) Подставляя в (2) последовательно h(t) = t—ti и h(t) = t—to, придем к Условиям трансверсальности Li(to) = lT(t0) и Zf(ti) = — ^(tj- Тем с&мым теорема полностью доказана. 99
2.3 Многомерный случай. Мы сформулировали теорему для одномерной задачи Больца класси- ческого вариационного исчисления. Совершенно аналогично ставится векторная задача Больца и формулируются необходимые условия экс- тремума. Пусть x(t) = (xi(t),... , zn(t)) — n-мерная вектор-функция, инте- грант L = L(t, ,..., xn, ii,..., хп) — функция 2п 4- 1 переменного, терминант I = l(xi(io)t..., xn(<o),, sn(ti)) — функция 2п пе- ременных. Рассмотрим задачу ti J L(t,xit... ,хп,хи ... ,хп) dt+ to +/(®1(/о)..®п(*о).• .«n(ti)) -> extr. Укажем на необходимые изменения для векторного случая. Необходимые условия экстремума в векторной задаче Больца со- стоят из системы п уравнений Эйлера + ье<(0 = о> « = at и системы 2п условий трансверсальности Доказательство теоремы в векторном случае тривиально редуци- руется к одномерному случаю. Каждое уравнение Эйлера — дифференциальное уравнение второго порядка — содержит при интегрированиии две константы. Всего — 2п констант интегрирования. Для их нахождения у нас есть 2п уравне- ний — условий трансверсальности. В таком случае, когда количество неизвестных совпадает с количеством уравнений для их нахождения, мы говорим о полноте набора условий для нахождения экстремали. Как правило, во всех наших задачах мы имеем полный набор усло- вий для определения неизвестных. 100
2.4 Пример. J (z2 - x) dt + x2(l) —> extr. о Необходимые условия: а) уравнение Эйлера ~Li + L* =0<^2f + 1 = 0; б) условия трансверсальности Ii(0) = /.(О), Ix(l) = -/r(i) *=> x(0) = 0, i(l) = -x(l). Общее решение уравнения Эйлера: х = —t2/4+Cit+C2- Из условий трансверсальности находим, что Ci = 0, С? = 3/4. Таким образом, имеется единственная допустимая экстремаль х = (3 —t2)/4> Покажем, что она доставляет абсолютный минимум в задаче. Действительно, если h 6 С1 ([0,1]), то 1 1 1 B(x + h)-B(x) = J2£hdt + J h2dt- J hdt+ 2x(l')h(l) + h2(l). 0 0 0 Интегрируя по частям и учитывая, что х удовлетворяет уравнению Эйлера 2ж-Ы = 0 и условиям трансверсальности х(0) = 0, i(l) = —х(1), 1 . а также отбрасывая неотрицательные члены f h2 dt и Л2(1), получим о 1 В(х( ) + Л( )) - В(х( )) = 2£(i)h(t)|* - J(2~x(t) + dt+ о 1 + j h2(t) dt + 2х(1)Л(1) + Л2(1) > 2(i(l) + x(1))Л(1) - 2£(0)Л(0) = 0. о Таким образом, х = (3 — t2)/4 € absmin. Очевидно, что Smax = +оо. Действительно, возьмем последова- тельность функций xn(t) = п, тогда В(хп( )) = — п + п2 +оо при п оо. 101
Задачи Больца. 1. f (£2 - sc) Л — Х (1) -»• extr. J £ о 1 2. У (х2 + х2) dt - 2х(1) sh 1 -4 extr. о 7Г 3. У (х2 + х2 — 4xsint) dt 4- 2х2(0) 4- 2х(тг) — х2(тг) -> extr. о тг/2 4. У (х2 - х2) dt + х2(0) - + 4ж(^) extr- о х/2 5. У (х2 - х2 - 2x)dt — 2х2(0) - ®2(^) extr- о 1 6. У(Х1Х2 4- xix2) dt 4- Х1{0)х2(1) 4- Х1(1)х2(0) -» extr. о е—1 7. У (t + 1)х2 dt 4- 2х(0)(х(е -1)4-1)—» extr. о 2 8. У t2x2 dt — 2х(1) 4- х2(2) —» extr. 1 е 9. У 2(tx2 4- хх) dt 4- Зх2(1) — х2(е) — 4х(е) —> extr. 1 з 10. У 4х2х2 dt 4- я4(0) — 8х(3) —> extr. о 1 * 11. У exx2 dt 4- 4ег(0) 4- 32е"х(1) -» extr. о 1 12. У е*+1(х2 4- 2х2) dt 4- 2х(1)(х(0) 4- 1) extr. о 102
3 Изопериметрическая задача 3.1 Постановка задачи. Изопериметрической задачей в вариационном исчислении называется следующая экстремальная задача в пространстве С1([/о> ^1])- ti /0(х( )) = У /о(<, x(t), x(t)) dt -> extr; (з) to tl д(х(.)) = у /,(/, x(Z), i(t)) dt = aj, i = 1,... , m, (1) to x(to) = x0, x(ti) = Xl, (2) где ai,..., am — заданные числа. Отрезок fa, h] является фиксированным и конечным, to < Ограничения вида (1) называются изопериметрическими. Экстремум в задаче рассматривается среди функций z() 6 Сг1([/о, <1]), удовлетво- ряющих изопериметрическим условиям (1) и условиям (2) на концах; такие функции называются допустимыми. Определение. Говорим, что допустимая функция х( ) доставляет слабый локальный минимум в задаче (з), и пишем £(*) € locmin з, если существует 6 > 0 такое, что для любой допустимой функции ж(), для которой ||х(-) — х(-)||1 < 6, выполняется неравенство Zo(z( )) > /о(£(’))- 3.2 Необходимое условие экртремума. Теорема. Пусть ж( ) 6 locextr з (слабый), а функции fa, fax, fix, i = 0,1,..., m, — непрерывны в некоторой окрестности множества {(t,£(i),i(t)) | t е [to, <i]}- Тогда существует вектор множителей Лагранжа А = (Ао,..., Ат) 6 Rm+1, А / 0, такой, что для лагранжиана т L = ^ х’ 6 - *11) »=0 й и выполнено уравнение Эйлера — + ^«(*) = 0 V t е [to, ti]- at 103
Доказательство. А) Определение вариации по Лагранжу. Пусть X, Y — нормированные пространства, и задано отображение f : X -> У. Тогда будем говорить, что отображение f имеет в точке х произ- водную по направлению h, если существует 1.т№+»)-№) = х—>о A v ' Будем говорить, что отображение f имеет в точке х вариацию по Лагранжу 6f(xy )y если для любого h Е X существует 5f(xfh) (т. е. существуют производные по всем направлениям). Выпишем вариацию по Лагранжу функционала I(x) = f /(/, х, to найденную нами при выводе необходимых условий в простейшей зада- че классического вариационного исчисления. Для функции у>(А) = /(£(•) + АЛ()) (Л(-) Е С1 ([t0, ti])) в п.п. 1.2-3 мы вычислили произ- водную ti р'(°) = lim = Г(f)A(t) + ;х(<)л(/)) dt = SI{ii л). A—►U A J to Таким образом, ti /»(•)) = У + А(*)Л(0) dt, Л(-) 6 Cj([t0, ti])- to Б) Построение конечномерного отображения и выделение выро- жденого и невырожденого случаев. Рассмотрим следующее линейное отображение Л:Сд([/о, *1]) —> Rm44 пространства Cq([/o, ^1]) в конеч- номерное пространство Rm+1: АЛ() = (*/о(*(), ЛС)),^!^), Л(.)),... Л())). Возможны два случая: 1) Im Л Rm+1, т. е. А — отображение на часть пространства Rm+1 (вырожденный случай); 2) Im Л = Rm+1, т. е. А — отображение на все пространство Rm+1 (невырожденный случай). 104
В) Доказательство теоремы в вырожденном случае.Образ линей- ного пространства при линейном отображении является, как известно, подпространством. Значит 1mA есть собственное подпространство в Rm44. Но тогда найдутся числа Ао,..., Ат, не все равные нулю и таг кие, что ^AiZ,=0 /»()) = О V /»(•)£ Со* ([to, ti]). i=a i=o Откуда из явного вида для $4 (£(•), Л(-)) имеем Ат т ч УЗ + = О V Л() G Cj([to, *i])- to i=0 i=t> ' Тогда из леммы Дюбуа-Реймона следует, что для лагранжиана L = m ZZ х) ) е C'1([toJ <1]) и выполнено уравнение Эйлера :=О ——+ Lr(Z) = 0 V t 6 [to> Г) Доказательство теоремы в невырожденном случае. Пусть Im А = Rm+1. Покажем, что невырожденный случай невоз- можен. Тем самым теорема будет полностью доказана. Поскольку образ отображения A Im А = Rm+1, то можно выбрать функции hj( ) € Со([<о, <1]) так, чтобы Ahj( ) = ej, j = 0,1,..., m, где e0 = (1,0,..., 0),..., em = (0,..., 0,1) — канонический базис в Rm44, то есть 5Ii (i, = 6ij Sij = f q’ £ j’ — символ Кронекера . Рассмотрим функцию Ф : Rw44 —> Rm+1, действующую по фор- муле х т т к Ф(/?) = (/0 (* + УЗ АЛ»), • • •, Л» (* + УЗ Я1**)) • i=0 i=O Нетрудно проверить, что построенная функция Ф непрерывно диф- ференцируема в некоторой окрестности точки Д = 0 и ф(4) = (Zo(*(-)), • • •,4п(*( ))) = (ао,*1,... ,ат) = « (ао := Zo(*( ))• 105
Теорема (конечномерная теорема об обратной функции). Пусть F'.U —> Rn — непрерывно дифференцируемое отображение некоторой окрестности U С Rn точки х в Rn, F(x) = у и якобиан отображения f fdF(x)\n \ F в точке х отличен от нуля (det ( — 7 ) ф 0). Тогда суще- х х uXj / itj — l / ствует обратное отбражение F~v некоторой окрестности V точки у в окрестность точки х такое, что F~1(y) = х и IF-*(!/) - < К|у- $1 Vyev с некоторой константой К > 0. Поскольку якобиан отображения Ф не равен нулю как определи- тель единичной матрицы (Ф'(0) = (6Ii(£(•), / — единичная матрица), то по теореме об обратной функции существует обратное отображение Ф”1 некоторой окрестности точки а в окрестность точки Д = 0 такое, что |Ф”х(а) — Ф"х(а)| < 2<|а — а| О |Ф”1 (а)| < Я|а - d| с некоторой константой К > 0. Возьмем а = (ао + £, <*i,...,<*т) при достаточно малом е и обозна- чим 0(e) = Ф”х(а). Тогда Ф(0(е)) = а, т. е. m т /о(®( ) + $2&(е)М ))= «о + £, Л (*() + 52&<б)М ))= “»• j=Q j=Q i = 1,..., m, при этом |Ф-Х(а)| < К\а - а| |£(е)| < К|4 Получилось, что в любой окрестности экстремальной функции £(•) в пространстве Сх([/о» h]) существует допустимая функция (а именно т х( ) + Для которой значение функционала может быть i=o и больше (при е > 0), и меньше (при е < 0) чем для х. Пришли к противоречию, что х(-) не доставляет локального экстремума. Таким образом, случай 2) невозможен. Теорема полностью доказана. 106
3.3 Пример. J х2 dt —> inf; J xdt = Qt z(0) = 0, ®(1) = 1. о 0 Решение. Лагранжиан L = Aoi2 4- Aix. Необходимое условие — уравнение Эйлера d r + Lx — 0 at <—> — 2Aqx 4- Ai — 0. Если Aq = 0, то Ai =0 — все множители Лагранжа — нули. Этого не может быть. Положим Ао = 1/2. Тогда х = Ар Общее решение: х = Cit2 4- С*2< 4- Сз- Неизвестные константы С1,С2,Сз находим из условий на концах и изопериметрических условий: г(0) = 0 => Сз = 0, х(1) = 1 => Ci 4- С2 = 1, 1 1 f х dt = 0 => /(С^2 4- C2t) dt = 0 => 4- = 0. о о Отсюда Ci = 3, C2 = — 2. Таким образом, в задаче имеется един- ственная допустимая экстремаль х = З/2 — 2t. Покажем с помощью непосредственной проверки, что функция z() доставляет абсолютный минимум в задаче. Возьмем функцию А(-) 6 С1 [0,1] такую, что х(-) 4- А() допустимая. Для этого надо взять 1 функцию А(), для которой А(0) = А(1) = 0 и f h dt = 0. Тогда для о 1 функционала /(«(•)) = f х2 dt имеем о 1 1 1 х2 dt = 2 j xhdt + J h2 dt> 2 J xh dt. 0 0 0 Интегрируя по частям с учетом условий на А, получим 1 1 1 I(x + h)-I(£) >2 Jid/i = 2£/i|* — 2Jihdt = -12J hdt = Q. 0 0 0 Таким образом разность всегда неотрицательна, то есть имеем абсо- лютный минимум. 107
3.4 Задача Дидоны. Одними из первых задач на отыскание наибольших и наименьших ве- личин являлись изопериметрические задачи о нахождении замкнутой кривой, имеющей заданную длину и охватывающей наибольшую пло- щадки о нахождении пространственной замкнутой поверхности, име- ющей заданную площадь и охватывающей наибольший об’ем. Еще до Аристотеля (IV век до н.э.) было известно, что среди изопериметри- ческих (имеющих равную длину) кривых наиболее вместимой является окружность, а среди среди изопифанных (имеющих равную площадь) поверхностей — сфера. Изопериметрическая задача содержится также в легенде о царице Дидоне. Описываемые события легенда относит к 825 году до н.э. Финикийская царица Дидона и с ней небольшая часть жителей го- рода Tiipa, спасаясь от преследований, покинули родной город и в по- исках счастья отправились на кораблях на запад вдоль берегов Сре- диземного моря. Выбрав на африканском побережье удобное место (нынешний Тунисский залив), Дидона и ее спутники решили основать здесь город. Эта идея не понравилась местным жителям, но все же фи- никийской царице удалось уговорить их предводителя Ярба, и он про- стодушно и неосторожно согласился уступить Дидоне клочок земли, ’’который можно окружить бычьей шкурой”. Хитрая финикиянка, раз- резав шкуру на тонкие ремни, связала их в один длинный ремень и, окружив им значительную территорию, заложила на ней город Кар- фаген. В память об этой истории карфагенская цитадель получила название Бирса (шкура). Из истории город Карфаген помнится нам еще войнами с Римом за обладание господством на Средиземном море (Пунические войны Hi- ll век до н.э.), которые завершились взятием римлянами Карфагена и его разрушением. Мы видим, что Дидона решала классическую изопериметрическую задачу о наибольшей вместимости. Естественно считать, что Дидона хотела сохранить выход к морю. Тогда мы получаем первую задачу Дидоны, Среди всех кривых длины I с концами на фиксированной пря- мой (прямолинейный берег), найти ту, которая ограничивает фигуру наибольшей площади. Формализованная задача имеет вид: т т У xdt —> sup; j \/1 4-'i2 dt = /, x(—T) = x(T) = 0 -T -T (здесь T — подвижный конец). Эта задача относится к типу задач Лагранжа (см. §5). 108
Давайте решим вторую задачу Дидоны, в которой оба конца кривой закреплены на прямой. Формализованная вторая задача Дидоны имеет вид: То т0 У xd/->sup; У \/1 + х2 Л = /, х(—То) = х(То) = О -То -То (здесь То — фиксировано). Это — задача, укладывающаяся в схему изопериметрических задач п. 3.1. Приведем ее решение с помощью вариационного исчисления. Лагранжиан L = Xqx 4- Ал/1 4- х2. Необходимое условие — уравнение Эйлера d _ d Ах ж -diLi + Lx = 0 ~л7ГтР+ 0 Если Ао = 0, то А 0 (не все множители Лагранжа — нули) и значит х = const. Тогда из условий на концах и изопериметрического условия следует, что х = О, I = 2Tq. d Хх Положим Ао — 1. Тогда из уравнения Эйлера • == — 1. Про- at у1 + х2 Ах интегрировав по t это уравнение, получим ....... = t 4-Ci. Выразим Vl 4- х2 из последнего уравнения х: _______t -Ь (71__ ix/A?-(t + Ci)2’ Проинтегрировав по t полученное уравнение, найдем функцию x(t): х 4- С2 = Т\А2 — (t 4- Ci)2 <=> (t 4- Ci)2 4- (х4-С2)2 = А2. Это уравнение окружности. Из условий на концах х(—То) = х(То) следует, что Ci = О, т.е. t2 + (x + C2)2 = А2. Неизвестные константы С2, А определяются единственным образом из условия х(То) = 0 и изопериметрического условия. При 2То < I < тгТо имеется единственная (с точностью до знака) экстремаль, являющаяся дугой длины I окружности, проходящей че- рез точки (±То,0), с центром на оси х. Поскольку у нас задача на максимум, то мы выбираем экстремаль, лежащую в верхней полуплос- кости. При / < 2То в задаче нет допустимых функций, при I *^&То нет допустимых экстремалей. 109
Изопериметрические задачи. 1 1 1. J х2 dtextr; J xdt = ft, х(0) = 1, х(1) = 0. 0 0 1 1 2. J х2 dt -> extr; J txdt = 0, x(0) = 0, x(l) = 1. 0 0 1 1 1 3. J x2 dt —> extr; J xdt—1, j txdt^O, x(0) = x(l) = 0. 0 0 0 T V 4. 1 x2 dt extr; / xcvstdt = x(0) = 1, x(?r) = —1. J J ** 0 0 7Г 7Г 5. J x2 dt -> extr; J xsintdt = 0, x(0) = 0, х(тг) = 1. 0 0 1 1 6. J x2 dtextr; J хе~г dt = e, x(0) = 2e + 1, x(l) = 2. 0 0 1 1 2 7. J(x2 + ®2) dt —> extr; J xe* dt = “j~> z(0) — ®(1) = e. 0 0 2 2 8. [t2x2 dt -> extr; [ txdt — x(l) = 1, r(2) = 2. J J ** 1 1 1 1 9. У x2 dt -> extr; j x2 Л = 1, x(0) = ®(1) = 0. 0 0 ?r/2 r/2 10. /* Г z 7ГХ 1 (x2 — x2) dt -> extr; / xsintdt = 1, x(0) = = 0. 0 0 To To 11. J x\/l 4-x2dtextr; J y/l + i2dt = l, -To -To x(-T0) = x(To) = 0. i : 1 12. J(xi + X2) dt extr; J X1X2 dt = 0, 0 0 xi(O) = x2(0) = 0, Xi(l) = 1, x2(l) = -3. ПО
4 Задана с подвижными концами 4.1 Постановка задачи. Задачей с подвижными концами называется следующая экстремальная задача в пространстве С1 (A) х R2: ti !(£) = Jf(t>x,x)dt + il;Q(to,x(tQ),ti,x(ti)) ->extr; (з) to = О, i=l,...,m, (1) где £ = (я(-), ioj ti)> А — заданный конечный отрезок, € A, to < /1. Частным случаем является задача, в которой один из концов или даже оба закреплены. Элемент £ = (®(),$о> ti) называется допустимым, если х € С^А), *о<*1>и выполняются условия (1) на концах. Определение. Говорим, что допустимый элемент £ = («(•), $о>$1)) доставляет слабый локальный минимум в задаче (з), и пишем £ 6 locmin з, если существует б > 0 такое, что для любого допустимого элемента 4 = (®(),/Оз $1), Для которого ||х() — £(-)11с*(Д) < |$о—$о| < б, |<1 ~ h| < б, выполняется неравенство /(£) > /(£). 4.2 Необходимые условия экстремума. Теорема. Пусть £ = (£(•), $о3 Л) 6 locextr задачи (з) (слабый), функ- ции — непрерывны в некоторой окрестности множества {($, x(t),x(t)) | t 6 А}, а функции tpi, г = 0,... , т, — непрерывно диф- ференцируемы в окрестности точки Тогда суще- ствует ненулевой вектор множителей Лагранжа А = (Ао,..., Аш) 6 Rm+1, А / 0, такой, что для функции Лагранжа У m Л = / А0/($,х,х)Л-|-^2 А»^($о}®($о)>$1,®($1)) /о выполнены условия: а) стационарности по х — уравнение Эйлера для интегранта L = Xof(t,x,x) -i-'Liit) + Lx(t) = 0 V 16 a <=► -^AoA(t) + АоЛ(О = 0; at at 111
1 m б) трансверсальности по х для терминанта I = ^2 А^(<о,ж(^о), Дг(4)) — ^x(to) Ao/r(4)) =^r(t0), —: 4r(tj) A0/f(h) “ ^r(ti)> в) стационарности по to^i (выписывается только для подвижных концов отрезка интегрирования): At0(/o) = 0 <=> — Ао/(/о) + 40 + 4?(t0)®(4)) = О, Аг1(Л)=О <=> Ao/(h) 4- 4i 4- ^(#!)®(Л) = 0. Необходимые условия экстремума в задаче со подвижными концами непосредственно будут вытекать из необходимых условий экстремума в задаче Лагранжа п. 5.2. 4.3 Пример. т Т) — j\x2 — х + l)dt extr; х(0) = 0. о Решение. Функция Лагранжа: т А = J Ао(ж2 — х 4-1) dt 4- Aiz(0). о Необходимые условия: а) уравнение Эйлера для интегранта L = Ао(х2 — х 4-1) —~ Lx 4“ Lx — 0 \ —2Aq2? — Ао = 0} dt б) трансверсальность по х для терминанта I = Ахж(О) Lz(0) = /.(о), Li[T) = -/r(T) <=> 2Аох(0) = Аь 2Aoi(T) = 0; в) стационарности по Т (выписываем только для подвижного конца отрезка интегрирования) Ат(Т) = 0 <=> А0(х2(Т) - х(Т) + 1) = 0. 112
Если Ао = 0, то из б) следует, что Aj = 0 — все множители Ла- гранжа оказались нулями. Если Ао 0, то положим Ао = 1. Тогда условия а)-в) преобразуются к виду —2х - 1 = 0, х(Т) = 0, х(Т) = 1. Из первого уравнения следует, что х = + C\t 4- Сг- Поскольку <г(0) = 0, то Сг = 0. Неизвестные C*i,T определяются из условий Г х(Т) = 0, / -f + сх = 0, 1«(Т) = 1 |-£ + CiT = l. Отсюда находим, что Т = 2, С\ = 1. Таким образом, в задаче имеется единственный допустимый экстре- „ . t2 мальный элемент £ = (£(•), Т) = -Н>2). Покажем, что £ не доставляет локального экстремума, т. е. что в любой его окрестности существует другой допустимый элемент, на котором значение функционала как больше, так и меньше значения в t2 этой точке. Возьмем элемент £ = (х(),Т) = (—— + £, Т). Тогда '<«=/((4+- (-?+*)+0 л=2/G -4 * > о о 2 >/«*) = 2^(1 О при Т > Т и /(£) < Z(f) при Т < Т, поскольку под знаком интеграла стоит неотрицательная величина. Найдём абсолютный минимум в задаче. Возьмём последователь- п ность элементов = (хп( ),Тп) = (t, п); тогдаI(fn) = f(2—t)dt -оо о при п —> +оо, т. е. Smin = —оо. Найдём абсолютный максимум в задаче. Возьмём последователь- 1 ность элементов £п = (xn( ),Tn) = (nt, 1); тогда I(xn( ),T) = f(n2 — о + 1) dt —> 4-оо при п 4-оо, т. е. Smax = 4-оо. 113
Задачи с подвижными концами. О 1 1. j х2 dt — 2х2(1) —> extr; х(0) = 0. о i 2. J(х2 4- x) dt —> extr; x(l) = 0. о т 3. j x2 dt —> extr; x(0) = 0, T 4- x(T) 4-1 = 0, о т 4. У x2 dt-¥ extr; x(O) = 0, (T — 1)*2(T) + 2 = 0. 0 T 5. У x3 dt -> extr; x(O) = 0, T 4- x(T) = 1. о T 6. У(x2 4- x) dt —> extr; x(0) = 1. о тг/4 7. У (x2 — x2) dt —> extr; x(0) = 1. о тг/4 8. У (x2 — x2 4- 4xcost) dt —> extr; x(0) = 0. о i 9. У(x2 4- x2) dt — x2(l) —> extr; x(0) = 1. о T 10. У (x2 4- x2) dt —> extr; x(T) 4- T — 1 = 0. о i t_______ /</1 —L. --------dt -» extr; x(0) = 1. x о т 12. j 4/1 * x2 dt extr; x(0) = 1, x(T) = T-1. 0 To _______ 13. У x\/l 4- x^dt —> extr; x(7o) = C о 114
ч5 Задача Лагранжа. Все задачи, изученные нами в предыдущих пунктах, являются част- ными случаями или могут быть сведены к задаче (мы сформулируем ее чуть позже), поставленной Лагранжем в сочинении ” Аналитическая механика” в 1788 году. Для ее решения Лагранж использовал метод неопределенных множителей, который впоследствии стали называть методом множителей Лагранжа. Впрочем этот метод не был им акку- ратно обоснован, и понадобилось более ста лет для того, чтобы при- дать рассуждениям Лагранжа вид строго доказанной теоремы. 5.1 Постановка задачи. Задачей Лагранжа называется следующая экстремальная задача Во(£) -> inf; В.^)<0, i=l,...,m', = 0, i = m' + 1,..., m, (з) xa(t) - y?(t, x(t)) = О V t G Д, (1) где£ = (z(),t0,ti), *(•) € С^Д,^), tQiti G Д, to < tx, Д — заданный конечный отрезок, ti = f/i(t,z(t),i(t))dt + ^i(to,a:(to),ti,z(ti)), i = 0,l,...,m. to Условие (1), называемое дифференциальной связью, может быть на- ложено не на все координаты вектор-функции х(-) = (®i(-),..., атл(-)), а только на некоторые, для определенности на первые к координат: i,(t) — ^t(t,x(t)) = 0, i = 1,..., к. Обозначим далее х() = (хв(-),жд(-)), где ха() = (a?i(),...,a:k()), хр() = (a^+iC), • • •, М))- Если Диффе- ренциальная связь отсутствует, то к = 0 и «(•) = Поскольку вместо ха в функции /i(t,x,i) можно подставить из (1) равное ему выражение y?(t,x), то в дальнейшем считаем, что Л = A(t, *,*/?). Частным случаем задачи (з) является задача, в которой один из концов to илд ti — подвижный, а другой закреплен или оба конца отрезка интегрирования [to, ti] фиксированы. Элемент £, для которого выполнены все указанные условия и огра- ничения задачи, называется допустимым. Определение. Говорим, что допустимый элемент £ = (f(), to, ti)) Доставляет слабый локальный минимум в задаче Лагранжа (з), и пишем £ € locmin з, если существует 6 > 0 такое, что для любого допусти- мого элемента £ = (х(-),to,ti), для которого ||£ — fllci(A)xR2 < О ' ’ И) 7 i( )Hd(A) < <У, < |t0 — <о| < 6, выполняется неравенство Во(£) > Во(0- , 1*1 - Ъ| < 6, 115
5.2 Необходимые условия экстремума. Теорема Эйлера—Лагранжа. Пусть £ = (я(),£оД1) доставляет слабый локальный минимум в задаче Лагранжа (з). При этом функ- ции fi, i = 0,1,..., т, и их частные производные по х и х, а также функция, р и ее частная производная по х непрерывны в некоторой окрестности множества {(t, x(t), x(t)) | t 6 Д}, а функции i = 0,1}.. .,т, непрерывно дифференцируемы в некоторой окрестности точки (*о,£(*о)Д1,£(*1)) (условие гладкости). Тогда найдутся множители Лагранжа (А,р) 6 Rm+1 х RA), (А,р()) 0, такие, что для функции Лагранжа h А = У (/(t1ar,ij9)+p(/)(iQ-^(t,a:)))A + /(to,a:(to)><b®(h))> to т т где f(t,x,X0) = 52 •*,/»(*>*. 1 = 52 — тер. i=O >=0 жинант, выполнены условия: а) стационарности по х() — уравнение Эйлера для лагранжиана L(t,x,x) = f(t}x,xp) +р(ха - <p(t,x)) + Lx(t) = 0 V t € A f ~РЙ нг +ГЛ + f - 0- б) трансверсальности no x 4# (4)) — ^r(to) p(^o) — 4?o(t0)> /гд(^о) = ^r^(t0)> Р(Л) = “^«(t!), = ””^(tx); в) стационарности no tQ,ti (выписывается только для подвижных концов отрезка интегрирования) Ato(^o) — 0 <=> ~/(^о) +40 + (r(to)^(^o) = 0» Ati(£i) = o <=> /(Л)+/x(ti)®(h) = 0; г) дополняющей нежесткости AiBt(f) = 0, i= д) неотрицательности / . ,т . 116
5.3 . Доказательство теоремы Эйлера-Лагранжа. В этом пункте, используя правило множителей Лагранжа для гладких задач с ограничениями типа равенств и неравенств в нормированных пространствах, докажем теорему Эйлера-Лагранжа. Покажем, что все условия теоремы о правиле множителей Ла- гранжа выполняются. Поскольку равенство В, = 0 можно заменить двумя неравенствами В, < 0, —Bi < 0, то в дальнейшем для простоты записи считаем, что у нас имеются только ограничения типа неравенств и mf = т. Пусть X = C1(A,Rn) х R2, У = C(A,R*). Это банаховы пространства — условие банаховости выполняется. Из непрерывной дифференцируемости функций в теореме Эйлера- Лагранжа следует, что функционалы Вг : X -> R, i = 0,1, и отображение F: X -> У, ti) = xa(t) - <p(t, x(i)), строго дифференцируемы в точке £ — условие гладкости выполняется. Ослабленное условие регулярности выполняется, т. к. ImF'(f) = У. Действительно, а система линейных дифференциальных уравнений с непрерывными коэффициентами *(<)-£«<. (<)*(<) = »(*) (1) имеет решение для любого у(») 6 C(A,R*), определенное на всем от- резке Д, с любым граничным условием в форме Коши h(to) — 7- Таким образом, ImF'(£) = С(Д, R*) — замкнутое пространство. Все условия теоремы главы 1 п. 4.3 выполняются. Согласно этой те- ореме существуют множители Лагранжа — вектор Л — (Ао, Ai,..., Аш) € Rm и функционал у* 6 У* не равные одновременно нулю и такие, что для функции Лагранжа m А(£,А,У*) = ^A.B,(e) + (y*,FU)) = ЛНМоЛАЛ = i=0 tl = У f(t,x.xp)dt + (y*,xa(t)-^(Z,®(t))) + /(io,a:(to),ii,sc(ti)) to 117
выполняются условия: а') стационарности Ле — О Ч—Лг — 0 АТсг — О, ЛТ/9 — О), Ato — 0, Л$х — 0; 6х) дополняющей нежесткости = 0, в') неотрицательности А, > 0, i = 0,1,..., т. Покажем, что из уравнения ЛГсг = 0 следует существование функ- ции р(-) G С11 (A, R*) такой, что Л (у* Ш dt V у( ) 6 С(Д, R*) to и для которой выполняются условия а)-б) теоремы Эйлера-Лагранжа. Тогда А = А и теорема будет доказана. Уравнения Эйлера и условия трансверсальности по хр будут вытекать из условия стационарности функции Лагранжа А по хр. Они выводятся как и для задачи Больца. Распишем условие стационарности А по ха : Аг„ = 0 <=> А1ст [*(•)] = 0 V Л() 6 СЧА, R*) «=> tl Уdt + 4„(to)A(to) + 4e(h)A(«i) + (у*> A(t) - ¥>Xa(t)h(t)} = 0. to Отсюда в силу соотношения (1) ti У,»()> = - / /«<.(<)A(t)A-L(t0)7-L(n)A(ti) Vy()6C(A,R*). to (2) Определим функцию р(-) из условий: -p(t) -p(t)<f>Xo(t) + Ajt) = о, р(Л) = (з) 118
По теореме существования и единственности решения задачи Коши для линейной неоднородной системы [АТФ, с. 191] функция р( ) 6 C'1(A,Rfc) определяется нашими условиями однозначно. Тогда в силу соотношений (1) и (3) имеем: ti ti [ zn(ph) dt - р(Л)Л(Л) - р(£о)Л(£о) = Kph + ph) dt = J at j to to t\ h = ^{fxah-p^Iah + py + p<pXahjdt = j(f*„h + py)dt. to to tl Находя их последнего соотношения f fXahdt и подставляя полученное to выражение в (2), получим = У Р»л -р(Л)Л(<1) +p(to)h(io) - iXa(toyf ~ = to = Jpydt + 7(p(to) -U(m) vy( ) eC(A,R*), v7eRfc. to Откуда следует, что ti («’. !/( )> = j Р(*)УЩ dt, p(£o) = Co(u)- to. Таким образом, Л = Л. Теорема полностью доказана. 5.4 Примеры. 1 1 Пример 1. /(«(•)) = f х2 dt -> inf; f xdt = 0, ®(1) = 1. о 0 1 Решение. Функция Лагранжа: Л = /(A0«2 + Air) d/4-A2(x(l) - 1). о 119
Необходимые условия: а) уравнение Эйлера для лагранжиана L = Аох2 + Aix —= ® —2Ао® + Ai = 0; б) трансверсальность по х для терминанта I = А2(х(1) — 1) МО) = ZT(0), Lx(l) = -Ц1) <=> 2Аох(0) = 0, 2Aoi(l) = -А2; Если Ао = 0, то из a) Ai = 0, а из б) А2 = 0 — все множители Лагранжа — нули. Этого не может быть. Положим Ао = 1/2. Тогда х = Ai. Общее решение: х = C\t2 + C2Z + Сз- Неизвестные константы С1УС2}Сз находим из условия трансверсальности х(0) = 0, из условия на конце х(1) = 1,из изопериметрического условия: х(0) = 0 => С2 = 0, 1 J C>i 4- Оз — 1, ' /хЛ = 0 t^L + C’3 = O. L О Отсюда Ci = 3/2, Сз = —1/2. Таким образом, в задаче имеется единственная допустимая экстремаль х = (3Z2 — 1 )/2. Покажем с помощью непосредственной проверки, что функция х доставляет абсолютный минимум в задаче. Возьмем функцию Л(-) 6 С1 ([0, 1]) такую, что £(•) + &(•) допустимая. Для этого надо взять 1 функцию Л( ), для которой h(l) = 0 и f hdt = 0. Тогда о 1 iiii I(x + h)-I(x) = J(i + h)2dt —/i2dt = 2 / £hdt + / h2 dt > 2/i'hdt. 0 0 0 0 0 Интегрируя по частям с учетом условий на h и условия трансверсаль- ности ж(0) =0, получим 1 . .л 1 .. 1 /(£ + /i)-Z(i) > 2 f xdh = 2xh\ -2fxhdt = -6 fhdt = O. 0 ’° о 0 Таким образом разность всегда неотрицательна, то есть имеем аб- солютный минимум. 120
Пример2. J х2 dt —> inf; x(0) = x(0) = 0, x(l) = 1. Решение. Эту задачу можно свести к задаче Лагранжа, вводя вме- сто функции х вектор-функцию (xj, х2), и обозначения: xi = х, Х2 = х. Тогда исходная задача сведется к задаче Лагранжа: У х2 dt —> inf; xi = х2, xi(0) = 0, х2(0) = 0, xi(1) = 1. о Функция Лагранжа: А = J (АоХ2 + Р(0(®1 ““ dt 4- AiXi(O) + А2х2(0) + Аз(х1(1) — 1). о Необходимые условия: а) система уравнений Эйлера для лагранжиана L = Aqx2+p(xi — х2) б) трансверсальность по х для терминанта Z = AiXi(O) 4- А2х2(0) 4- A3(x!(1)-1) — ^i(o)j Др1(1) = >—< р(0) ~ Ai, р(1) — —Аз, £z2(0) = /Г2(о), (1) = — k2(i) <=> 2Aqx2(0) = А2, 2Аох2(1) = 0; в) неотрицательность Ао > 0. Если Ао = 0, то из следует, что а) р = 0, а из б) Ai = А2 = Аз = 0 — все множители Лагранжа — нули. Этого не может быть. Положим Ао = 1/2. Тогда из а) х^ = 0 <=> х^ = 0. Общее решение: х = CiZ3 4- С2/2 4- Сз/ 4- Са. Неизвестные константы С\, С2, Сз, С4 находим 121
из условия трансверсальности х2(1) = 0 <=> ж(1) = 0 и из условий на концах: х(0) = 0 => С4 = О, х(0) = 0 => С3 = О, Г х(1) = 1, / Ci + C2 = 1, f Ci = -1/2, t i-(l) = 0 ( 6C1 + 2C2 = 0 |C2 = 3/2. Таким образом, в задаче имеется единственная допустимая экстре- маль х = —13/2 + 3t2/2. Покажем с помощью непосредственной проверки, что функция х доставляет абсолютный минимум в задаче. Возьмем функцию Л(-) € С2([0,1]) такую, что £(•)+&(•) допустимая. Для этого надо взять функ- цию Л(-), для которой h(0) = h(l) = h(0) = 0. Тогда для функционала 1 I(x( )) = J х2 dt имеем о 1 1 I(x + h) - /(£) = j\x + h)2 dt — j x2 dt = о 0 Интегрируя дважды по частям с учетом условий на функцию h и усло- вия трансверсальности х(1) =0, получим I(x + Л) — 1(х) > 2 [ xdh = 2xh | dt = 1 = -гЛр-Ь 2 J x^hdt = 0. 0 Таким образом разность всегда неотрицательна, то есть имеем аб- солютный минимум. 111 1 Smin = / xdt = / (-3/+3)2 dt = 9 У (<2—2/+1) dt = (3<3-9Z2+9)|q = 3. 0 0 о 122
Задачи Лагранжа. 1 1 1. J х2 dt -> extr; J txdt = 0, z(0) = 1. 0 0 T T 2. J x2 dt -> extr; J xdt = 1, x(0) = 3. 0 0 T T 3. f x2 dt —> extr; [ xdt = x(T) = 1. «/ J ** 0 0 7Г JT 4. Jx2 dt -> extr; jxsintdt = 1, x(0) = 0. 0 0 1 1 5. 1 xdt extr; / \/l + x2 dt = —» XU) = 0. 0 0 1 6. J x2 dt -> extr; z(0) = i(l) = 0, x(0) = 1. 0 7. e J t2x2 dt —> extr; x(l) = —1, x(e) = £(1) = e. 1 8. ж J(z2 — x2) dt -» extr; i(0) = £(?г) = 0, я(тг) = 1. 0 9. i У(x2 + x2) dt —> extr; ®(0) = 0, x(l) = sh 1, i(l) = ch 1. 0 ж/2 10. J (x2 — x2) dt —> extr; t(0) = x(0) = 0, — 1- 0 T 11. T-> extr; У x2 dt = 1, x(0) = i(0) = 0, x(T) = 1. 0 12. 1 x( 1) -> extr; У x2 dt = 4, r(0) = z(0) = x(l) = 0. 0 123
6 Задача со старшими производными 6.1 Постановка задачи. Задачей со старшими производными в классическом вариационном ис- числении называется следующая экстремальная задача в пространстве Cn([to, *1]): ti Z(z(.)) = у Z(t, x(t), x(t), i(t),..., x(n\t)) dt —> extr; (3) to *(fc)(t,-) = xkjt j = 0,1, к = 0,1,..., n - 1. (1) Здесь L = L(t,x,x,..tty — функция n + 2 переменных, назы- ваемая интегрантом. Отрезок [to, ti] является фиксированным и ко- нечным, to < ti. Экстремум в задаче рассматривается среди функций х(-) Е Cn([to, ti]), удовлетворяющих условиям на концах (1); такие функции называются допустимыми. Введем норму в пространстве Cn([to, ti]): llidln = IIy||c“([to. ti]) := max{l|y|lc([to, tl])> ll»llc([to, t>]) . I|y(n)||c([to, tl])}- Определение. Говорим, что допустимая функция f (•) доставляет слабый локальный минимум в задаче (з), и пишем £( ) Е locmin з, если существует б > 0 такое, что для любой допустимой функции z(-), для которой ||х(-) — £( )||п < выполняется неравенство /(«(•)) > /(£(•))• 6.2 Необходимое условие экстремума. Теорема. Пусть £(•) Е locextr задачи (з) (слабый), функции L,Ls, Li,..., Lx(n) — непрерывны в некоторой окрестности множества {(t, x(t),i(t),...I te[<o,ti]}. Тогда ) 6 C*([t0, ti]), k = 1,... ,п, и выполнено уравнение Эйлера-Пуассона п dh У2(-1)*5-3-£т(М(П = О Vi 6 [/о, tl]. Л=0 124
Доказательство. Уравнение Эйлера-Пуассона будет выведено из теоремы Эйлера-Лагранжа. Приведем задачу со старшими производными к задаче Лагранжа, сделав замену переменных Хк = к = 1,..., п, ti j L(t, , «n, in) dt -> extr; Xk = = 1,..., n — 1, to =ж?-1> J = 0,1, k= (s') Здесь фазовая переменная — вектор функция ..., хп( ))- По- скольку функция £(•) доставляет локальный экстремум в задаче со старшими производными (з), то вектор функция ((•),... ,жп()) до- ставляет локальный экстремум в задаче Лагранжа (з'). Выпишем со- гласно теореме Эйлера-Лагранжа необходимые условия стационарно- сти для лагранжиана п-1 L = A0L(i, хп, хп) + Рк&к ~ fc=i Терминальную часть функции Лагранжа, а также остальные необхо- димые условия экстремума, не играющие существенной роли в задаче с закрепленными концами и фиксированным отрезком интегрирования, не выписываем. Система уравнений Эйлера: d ~ к = 1,..., п “Pi + Ао^®1 — 0, -Рк + АоДг* ~ Pfc-i =0, к = 2,..., п - 1, d - — -^AoLin 4- XqLX91 — Pn-i — 0. Если Ao = 0, то из системы уравнений Эйлера следует, что рп-1 = ... = pi =0. Все множители Лагранжа — нули. Пусть Ао / 0. По- ложим Ао = 1. Выразим pn-i из последнего уравнения и подставим в предпоследнее; проводя эту процедуру для рп-2, • • ,Р1, придем в итоге к уравнению Эйлера-Пуассона: — о v t е [to, ti]- к=О f J 125
6.3 Пример. i х2 dt —> extr; ®(0) = x(0) = x(l) = 0, i(l) = 1. о Решение. Интегрант: L = x2. Необходимое условие — уравнение Эйлера-Пуассона -^-Li + L^Q № = 0. ai2 dt Общее решение уравнения Эйлера-Пуассона: х — C\t3+Crf2+С3/+С4. Неизвестные константы Ci, С2, С3, С4 находим из условий на концах ж(0) = 0 => С4 = 0, х(0) = 0 => С3 = 0, Г х(1) = 0, ( Ci + С2 = 0, J Ci = 1, (i(l) = l [3Ci + 2C2= 1 1С2 = -1. Таким образом, в задаче имеется единственная допустимая экстре- маль х = t3 — t2. Покажем с помощью непосредственной проверки, что функция х доставляет абсолютный минимум в задаче. Возьмем функцию Л(-) 6 С2([0, 1]) такую, что £(♦) + Л() допустимая. Для этого надо взять функцию Л(-), для которой А(0) = Л(1) = А(0) — А(1) = 0. Тогда для 1 функционала I(x(-)) = f х2 dt имеем о 1 1 Z(i+A) —Z(i) = J(x + h)2 dt — J x2 о 0 xhdt. Интегрируя по частям с учетом условий на А, получим 1 1 1(х + Л) - Цх) >2 j 'idh = 2£Л|* - 2 У x^hdt = о о 1 1 = -2 У x^dh = -2®(3>Л|+2 у x^hdt = 0. О о Таким образом разность всегда неотрицательна, то есть имеем аб- солютный минимум. * 126
Задачи со старшими производными. 1 1. У х2 dt -» extr; х(0) = х(0) = х(1) = 0, х(1) = 1. о 1 2. j(х2 — 48х) dt —> extr; х(0) = 1, х(0) = —4, х(1) = х(1) = 0. о 1 3. f (х2 - 24tx) dt -» extr; x(0) = x(0) = 0, x(l) = i x(l) = 1. J & о r 4. J(x2 - x2) dt -> extr; x(0)=0, i(0) = 1, x(7r)=sh7r, х(тг)=с117г. о ir 5. j(х2 + 4х2) dt -> extr; x(0) = —1, x(0) = 0, х(7г) = сЬтг, х(тг)=8Ьтг. о v/2 6. J (x2 - £2) dt -> extr; sc(O) = i(0) = 1, = 0. 0 1 7. J(x2 4- x2) dt -> extr; x(0) = 1, x(0) = 0, x(l) = ch 1, x(l) = sh 1. о 1 8. j* e~lx2 dt —> extr; x(0) = 0, x(0) = 1, x(l) = e, x(l) — 2e. о e 9. У(t + l)/x2dt —> extr; x(l) = 0, x(l) = 1, x(e) = e, x(e) = 2. 1 1 10. У(x^)2 dt -> extr; x(0) = i(0) = x(0) = 0, о z(l) = 1, ±(1) = 3, z(l) = 6. i 11. У ((x^3))2 4- x2) dt —> extr; x(0) = x(0) = 0, i(0) = 1, о x(l) = ch 1, x(l) = x(l) = sh 1. tt/2 12. У ((a^3))2 - x2) dt -> extr; x(0) = x(0) = о x(?r/2) = x(0) = x(tt/2) = 1. 127
Глава 4 Задачи оптимального управления В этой главе рассматриваются задачи оптимального управления. При- водится формулировка принципа максимума Понтрягина в общем слу- чае, доказательство принципа максимума в частном случае для задачи со свободным концом. Решаются простейшая задача о быстродей- ствии, аэродинамическая задача Ньютона и ряд других задач опти- мального управления. В пятидесятых годах многочисленные потребности прикладных дисциплин (техники, экономики и др.) стимулировали постановку и рассмотрение нового класса экстремальных задач, получивших назва- ние задач оптимального управления. Необходимое условие экстре- мума для задач этого класса — ”Принцип максимума”, — сформу- лированное Л. С. Понтрягиным в 1953 году, было доказано и развито впоследствии им, его учениками и сотрудниками. Важно отметить, что это условие имеет существенно иную форму в сравнении с класси- ческими уравнениями Эйлера и Лагранжа: в качестве обязательного условия в решении задачи оптимального управления входит решение вспомогательной задачи на максимум (отсюда и название — ’’прин- цип максимума”). За разработку теории оптимального управления Понтрягину и его сотрудникам В. Г. Болтянскому, Р. В. Гамкрелидзе и Е. Ф. Мищенко в 1962 году была присуждена Ленинская премия. Если Понтрягин рассматривал задачу на максимум, то мы для единообра- зия с прошлым материалом будем рассматривать задачу на минимум, называя соответствующее условие условием оптимальности. Для единообразия с предыдущим материалом принцип максимума Понтрягина формулируется в лагранжевой форме. В отличие от за- дачи Лагранжа в задаче оптимального управления вводится упра- вление и появляется дополнительное ограничение типа включения на управление: и 6 U. Множество U определяет возможности человека влиять на происходящий процесс. 128
1 Постановка задачи Задачей оптимального управления (в понтрягинской форме) будем на- зывать следующую задачу: ВоК) -> inf; В,(£) <0, i = 1,..., т1, Во(£) = 0, i = т' + 1,..., т, (з) x(t) - <p(t, x(t), u(t)) = 0 V t e T, (1) u(t) eu v t e Д, (2) где < = {x( ),u( ),t0,h), r() e XC^A.R”), u( ) € KC(A,Rr), <оЛ € A, to < ti, A — заданный конечный отрезок, U — произвольное мно- жество из Rr, Т С А — множество точек непрерывности управления «(). «г В,(£) = У fi(t,x(t),u(t))dt + i^i(to,x(to),ti,x(ti)), i = 0,l.т. to Здесь через KC(A,Rn) обозначено пространство кусочно-непре- рывных на отрезке А вектор-фу нкций, соответственно КС1 (A, Rn) — пространство непрерывных вектор-функций, имеющих кусочно-непре- рывную производную. Напомним, что кусочно-непрерывной функцией является функция, имеющая не более конечного числа разрывов первого рода (в точках разрывов существуют конечные пределы слева и справа). Отметим, что уравнение (1), называемое дифференциальной свя- зью, должно выполняться во всех точках непрерывности вектор-функ- ции «(•) = («1( ),... ,«г( )). В отличии от задачи Лагранжа име- ется ограничение (2) типа включения, а фазовая переменная х() — .. ,хп( )) может иметь меньшую гладкость. Частным случаем задачи оптимального управления (з) является задача, в которой один из концов или даже оба закреплены. Элемент для которого выполнены все указанные условия и огра- ничения задачи, называется допустимым или еще говорят допусти- мым управляемым процессом. Допустимый управляемый процесс £ = (i(-), й(), называется (локально) оптимальным (или еще говорят оптимальным в сильном смысле процессом), если существует 8 > 0 такое, что для любого до- пустимого управляемого процесса ( — (r(-), п(-)>*о>*1), Для которого ||z( ) — ®( )||с(д) < Ко — *о| < |*i — *1| < 8, выполняется неравен- ство Во(£) > Во(£). 129
2 Принцип максимума Понтрягина Теорема. Пусть £ — (ж( ), й( ),/оЛ1) — оптимальный (в сильном смысле) процесс в задаче оптимального управления (з); функции fi} i = 0,1,..., тп, <р и их частные производные по х непрерывны в неко- торой окрестности множества {(/,£(/)) | t 6 А}, декартово умно- женного на U, а функции i = 0,1,..., т, непрерывно дифференци- руемы в окрестности точки (?о, £(£о)>Л, £(Л)) (условие гладкости). Тогда найдутся множители Лагранжа (A,p)6Rm+1 xK’C1(A,Rr), (А,р( )) 0, такие, что для функции Лагранжа Л = (/(t, х, и) + p(t)(i — х, u))j dt +/(/o, m m где f(ttxtu) = £ (t,a?,u)» I = $2 ®(h)) — терми- i=O i=O нант, выполнены условия: а) стационарность no x — уравнение Эйлера для лагранжиана L(t, х, х, и) = /(/, х, и) + р(х — <p(t, х, и)) = 0 V t е т <=> -pit) + A(t) -p(t)<Mt) = 0; at б) трансверсальность по х Li{t$) = lx(tn) ?(*о) = (г(«о)> ^зг(Л) = f р(А) = в) оптимальность по и minL(Z,i(t),x(t),u) = й(/)) <==> u€t/ ^{/G>«W>«)-p(<)^>»(*).«)} = /Ю-₽(<)£(*) vteT; u€l/ г) стационарность по to, h (выписывается только для подвижных концов отрезка интегрирования) Л«о(^о) = 0 <==> — /(4)) +^t0 +4(«0)®(<о) — о, Ati(£i) = 0 <=> /(Л) + = 0; д) дополняющая нежесткостъ A»Bi(<) = 0, e) неотрицательность А, > 0, i = 0,1,..., mf. 130
3 Пример. 4 B(z( )) = J(х2 4- x) dt —> inf; |i| < 1, ®(0) = 0. о Решение. Приведем задачу к виду задач оптимального управления, введя управление и 4 (и2 + x)dt -> inf; х = и, и Е [—1, 1], я(0) = 0. о Функция Лагранжа: 4 Л = У(А0(и2 + я) + р(х — u)) dt -h Aiz(0). о Необходимые условия: а) уравнение Эйлера для лагранжиана L = Ао(и2 4- 4- p(i — и) — 4- Lx = 0 <=> -р+ Ао = 0; at б) трансверсальность по х для терминанта I = Ai®(0) МО) = /г(0), Li(4) = -lxW *=> р(0) = Аь р(4) = 0; в) оптимальность по и min^(Ao«2 — ри) — Х0й2 — рй; е) неотрицательность Ао > Q. Если Ао = 0, то из а) р = 0 и из б) р = Ai = 0 — все множители Лагранжа оказались нулями. Полагаем Ао = 1. Тогда из а) р = 1 и из б) р = t — 4. Из условия в) следует, что л _ f signp, |р/2| > 1, ч _ ( — 1, 0 < t < 2, “ “ 1р/2, |р/2| < 1, ( «/2 - 2, 2 < t < 4. Интегрируя, получаем 131
-Z + C*i, 0 < t < 2, t2/4-2t + C2, 2 < t < 4. Из начального условия x(0) = 0 выводим, что Ci = 0, а из условия непрерывности в точке t = 2 имеем — 2 = 1 — 4 + Сг С? = 1. Таким образом, . _ f -t, 0 < t < 2, х ~ 1 t2/4 - 2t + 1, 2 < t < 4. Докажем с помощью непосредственной проверки, что функция х доставляет абсолютный минимум в задаче. Возьмем функцию h е КС1 [0,1] такую, чтобы х + h была допустимой в задаче. Для этого надо взять функцию h, для которой + А| < 1, А(0) = 0. Имеем В(х + h) — В(х) = I((х + А)2 + х + h) dt — j (х2 + x)dt = Интегрируя по частям в первом интеграле с учетом условий Л(0) = 0, х (4) = 0, получим В(х + h) — В(х) >2ih| + /*(—2х 4- 1)А dt = f (—2х + 1)Л dt. Подставляя в последний интеграл найденную функцию х и разбивая отрезок интегрирования на два, имеем В(х + Л) - В(х) > / Лей > 0, ибо h(t) > 0 при t 6 [0, 2], так как h(0) = 0, и А > 0 при t G [Q, 2]. < Итак, х 6 absmin. 132
4 Формулировка и доказательство прин- ципа максимума Понтрягина для задачи со свободным концом Приведем формулировку и доказательство принципа максимума Пон- трягина для следующего частного случая задачи оптимального упра- вления — задачи со свободным концом и закрепленным временем: B(x( ),u( )) = j + inf; (з) to z(t) — (p(t, x(/), u(t)) = 0 V t 6 T, u(t) EU V t 6 [/о, / J, x(t0) = xq, где U C Rr — произвольное множество, T C [/о, h] — множество точек непрерывности управления «(•). Теорема. Пусть (х( ),й( )) -оптимальный процесс в задаче опти- мального управления (з). Функции f,(p и их частные производные по х непрерывны в некоторой окрестности множества {(t,x(t)) | t 6 [t0, й]}, декартово умноженного на U, а функция ф непрерывно диф- ференцируема в некоторой окрестности точки х(<1) (условие гладко- сти). Тогда выполняется условие оптимальности по и: vter, v«сtz, (1) где р() — единственное решение дифференциального уравнения + fx(t) - P(t)px(t) = o v t e t (2) с краевым условием ₽(*i) = (3) Отметим, что принцип оптимальности (1) с условиями (2)-(3) мо- жет быть выведен из необходимых условий оптимальности в общей задаче оптимального управления, а множитель Лагранжа Ао при функ- ционале В оказывается равным единице, условие трансверсальности по x(Iq) не существенно. Доказательство. Единственность решения уравнения (2) с крае- вым условием (3) следует из теоремы существования и единственности решения задачи Коши для линейных систем [АТФ, с. 191]. А) Игольчатые вариации. Зафиксируем точку r € Г, элемент v € U и такое малое число а > 0, что [г - а, т] С Т. 133
Управление _ f “(*)> 4 0 к-а,т), [ v, t 6 [т — а, т), назовем элементарной (игольчатой) вариацией управления й. Пусть ®Л() — решение уравнения x(t) = <p(t, x(t), ua(t)) с начальным усло- вием а?(£о) = «о» По локальной теореме существования [АТФ, с. 186- 189] функция ха( ) определена при а < ао в некоторой окрестности точки to, но из леммы 1, формулируемой ниже, следует, что на са- мом деле вектор-функция ха() определяется единственным образом на всем отрезке [to, ti]. Вектор-функция га() называется элементарной (игольчатой) вариацией функции £(•), а пара (а?а(),««(•)) — элемен- тарной вариацией процесса (»(•),«(•)). Пару (т, v), определяющую эту вариацию, будем называть элементарной иголкой. Б) Лемма 1 (о свойствах элементарной вариации). Пусть (т, г>) — фиксированная элементарная иголка. Тогда существует число ао > О такое, что [т — а, т] С Т при а Е [0, а0] « для любого а € [0, ао] функция ха(*) определена на всем отрезке [to, й]; при этом ха( ) —> i( ) в метрике пространства С([<о, ti],Rn), xa(t) - i(t) = ay(t) + ra(t) V t e [r, tj, причел sup > 0 при a —> +0, где функция y( ) кусочно диф- t€[r, ti] ференцируема на отрезке [т, ti] и удовлетворяет дифференциальному уравнению £(t) = ^r(t)y(t) V t е [т, ti] П Т (4) с начальным условием у(т) = V?(r,i(r),v) -ф(т). Доказательство леммы следует из двух основополагающих фактов теории обыкновенных дифференциальных уравнений: локальной тео- ремы существования и теоремы о непрерывной дифференцируемости решения по начальным данным. Мы не приводим их здесь, отсылая к книге АТФ, с. 89-91. В) Лемма 2 (о приращении функционала). Пусть (т, v) — фикси- рованная элементарная иголка, Z(a) := В(ха(),иа()). Тогда функ- ция Z(-) дифференцируема справа в нуле и ' Z'(+0) = /(г, i(r), v) - /(г) - p(r)j/(r). 134
Доказательство леммы 2. Используя теорему о среднем для чи- словых функций, правило дифференцирования под знаком интеграла и лемму 1, получим z-(+o) = ,im = и„ feWii-ВД! = «-►4-0 а а->4-0 а to т ti = lim-f [ (/(*.*«(*)>»)-/(*))<** + /(/(<> -/(<))*)+ <*->+0 а \ J J J г—а т ti +^'(*(*1)М*1) = f(r,£(r),v) - f(r) + j fx(t)y(t)dt + V'/(i(<i))!/(fi)- T Выражая fx из уравнения (2) и учитывая уравнение (4), имеем ti ti J A(0v(<)dt = J (p(0 + p(*)*M*)M*) dt = T r tl tl = J(p(t)v(t) + p(t)y(t)) dt = J ^(p(t)y(t)} dt = p(ti)!/(ii) -p(r)y(r). T T tl Л Подставляя найденное значение J fxy dt в выражение для Z'(+0), с уче- г том условия (3) получим искомое представление. Г) Завершение доказательства. Из леммы 1 следует, что если а Е [О, Оо], то (xa(-)iua(’)) — допустимый управляемый процесс и ®а( ) равномерно стремится к х( ). Поскольку (х( ), «(•)) — оптимальный процесс, то при малых а > О В(га(),«„(•)) > В(х(•),«(•)) <=> 7(а)>Я(0). Отсюда по лемме 2 ^'(-ЬО) > 0, и из выражения для Z'(+0) и у(г) вытекает, что /(т, i(r), и) - р(г)<р(т, х(т), v) > f(r) - р(т)£(т) V т е Г, V и е U. т. е. выполняется соотношение (1). Теорема полностью доказана. 135
5 Простейшая задача о быстродействии. Рассмотрим задачу о наибыстрейшей остановке лифта в шахте, вошед- шую во многие монографии по оптимальному управлению. Лифт упра- вляется под воздействием внешней силы, которая может изменяться в заданных пределах, регулируемых человеком. Предположим, что воз- можности действующей силы, а следовательно, и ускорения, ограни- чены какой-то величиной, например, ускорение может изменяться от -1 до +1. Требуется за кратчайшее время Т остановить (*(Т) = 0) лифт, для определенности в начале координат (*(Т) = 0). Нетрудно видеть, что задача может быть формализована следующим образом: Т -> inf; |*| < 1, *(0) = 6, *(0) = 6, х(Т) = х(Т) = 0. Аналогично формализуется задача о машине, движущейся прямоли- нейно без трения по горизонтальной дороге. Машина может двигаться в любую сторону с ускорением, не превышающем единицу. Требуется остановить машину в определенном месте за кратчайшее время. Решение. Приведем задачу к виду задач оптимального управле- ния, вводя вместо функции х вектор-функцию (*i, *2), управление н( ) и обозначения: *1 = *, *2 = ё, и = *, Т —> inf; *1 = *2, *2 = и, и 6 [—1,1], *1(0) = 6, *2(0) = 6, *1 (П = *2(Т) = 0. Функция Лагранжа: т Л. = j (pi(0(®i - + ₽2 (*) («2 - «)) dt+ о +А0Т 4- Ai(*i(0) - £1) 4- А2(*2(0) - £2) 4- A3*i(T) 4- А4*2(Т). Необходимые условия: а) система уравнений Эйлера для лагранжиана L = Pi(t)(*i — *2) + Р2(<)(*2 - и) ( ~dtLi' + “ °’ Г = °, (-^, + £„ = 0 = » <=> Рг(1) — СМ + Сг; б) трансверсальность по * для терминанта / = AqT4-Ai(*i(0)“£i)4- А2(*2(0) — f2) + Аз*1(Т) 4- А4х2(Т) Lii(0) = /®х(о)» <=> Pi(0) = Ai, pi(T) = -Аз, 136
LX2(0) = /Г2(о), LiAT) - <=> Рг(О) = Л2, Pi(T) = -Л4; в) оптимальность по и (не зависящие от и слагаемые не выписы- ваем) min {-р2(*)«} = => *€[-1,1] й_( signp2(Z), P2G) #0, [ любое из [—1, 1], P2(t) = 0; г) стационарность по Т Дт(Т) = 0 <=> Ао + Л3Х1(Т) + A4z2(T) = 0; е) неотрицательность Ао > 0. Учитывая то, что из начального условия следует Xi(T) = 0, а из б) А4 = —р2(Т), получаем, что г) равносильно условию Ао = p2(T)u(T). Поэтому если Ао = 0, то Р2(Т) = 0 либо й(Т) = 0, но отсюда из в) вновь Р2(Т) = 0. При этом р2 не может быть тождественным нулем, ибо иначе все множители Лагранжа были бы нулями. Значит, из а) р2(/) = C(t — Т), а тогда из в) следует, что u(t) = 1 или u(t) = — 1. Множество начальных условий, соответствующих таким управлениям, описывается уравнением L V ^si > si S ", (ti(t) = 1 => z2(/) = t - Ty xi(t) = (t - T)2/2 => £1 = £2/2; случай u(t) =4 аналогичен). Если же £2 ± ^>(fi), то Aq / 0, и мы полагаем Ао — 1. Тогда из г) вытекает, что |р2(Т)| = 1, т. е. имеются две возможности: p+(t) = C(t-T) + l, pj(t) = C(i-T)-l. Этим возможностям в силу в) соответствуют такие управления: + ( -1, 0 < t < т, _ ( 1, 0 < t < т, U “ [ 1, т <t<T, U ~ (-1, r<t <Т. Рассмотрим траектории, соответствующие оптимальным управле- ниям и+ и и~ на плоскости (a?i,x2), называемой фазовой плоскостью. Для тех значений /, для которых u(t) = 1, имеем х2 = 1 => xi = z2 = t 4- С1 => «1 = /2/2 + Cft -F СП = z|/2 4- С. 137
Таким образом, фазовая траектория, соответствующая этим зна- чениям t, является куском параболы xi = х2/2 + С, Направление дви- жения по такой параболе определяется из условия возрастания хг, так как в этом случае хг = 1. Аналогично получаем, что для тех значе- ний /, для которых u(t) = —1, фазовая траектория — кусок параболы «1 = — Х2/2 + С, а направление движения определяется из условия убы- вания Х2, так как Х2 = —1- Укажем теперь то место на фазовой плоскости (xi, хг), где должно совершаться переключение управления. В искомую точку (0,0) (sifr) = Я2СО = 0) мы должны попасть не более чем с одним переключением, двигаясь по фазовой траектории по разрешенному направлению. Сово- купность начальных условий, соответствующих управлениям и+ и и”, описывается неравенствами & > (для и $2 < ^(£1) (для и~)- Переключения совершаются на кривой & = у>(£1)- При этом, как не- трудно видеть, для каждого начального условия имеется единственная фазовая кривая, приводящая в точку (0,0). Рис. 1 Поскольку всегда |ят21 = 1 на оптимальной траектории, то Х2 = |i| + С и, значит, время движения Т = Var Х2 (вариация функции Х2). Од- нако проще находить оптимальное время Т, строя функцию х() класса /СС2([^о> <i]), удовлетворяющую необходимым условиям экстремума и начальным условиям. В примере 2 пункта 7 будет приведено решение одной из конкретных задач быстродействия. 138
Покажем, что оптимальная траектория, начинающаяся в точке (£1, &)> доставляет решение задаче. Пусть этой траектории соответ- ствует управление й (для определенности й“), функция х и время Т. Предположим, что имеется некоторый другой допустимый управляе- мый процесс (ж, u, 7), Т < Т. Доопределим функцию х(-) нулем на отрезке [7, 7]. Воспользуемся следующей формулой восстановления функции по ее n-ой производной х(г) ~ (п - 1)! /('Г~ s)n~lx{n}(s)ds + £ x(fe)(0) Jp. о fc=0 По этой формуле при п = 2 в силу условий на левом конце функции ж(-) и £(•) в точке т можно представить в виде г х(т) = y(T-s)i(s)ds + f2T + fi. о Поскольку x(s) = 1 > x(s) V s 6 [0, т], то т х(т) — я(т) — J(т — s)(l — x(s))ds > О, о причем равенство здесь возможно только, если во всех точках непре- рывности х(s) = 1, а тогда x(t) = x(t) V / 6 [0, т]. Аналогично с учетом условий на правом конце функции х(-) и £(•) в точке т можно представить в виде f х(т) = J(s — r)x(s)ds. т Поскольку i(s) = — 1 < r(s) V s € [т, Т], то т х(т) — х(т) = J(з — т)(—1 — x(s))ds < О, 7 причем равенство и здесь возможно только, если 'х(з) = — 1, а тогда jr(Z) = i(Z) Vte[r, Таким образом, имеем, что х(т) = х(т) и, следовательно, x(t) = f (/) V t е [0, 7]. Отсюда Т — Т. 139
6 Аэродинамическая задача Ньютона Задача Ньютона — это задача о сопротивлении движению тела вра- щения в ’’редкой” среде. Необходимо выбрать форму тела вращения так, чтобы сопротивление движению было минимально. Форма тела вращения задается функцией x(t) такой, что ж(0) = 0, х(7о) = £ (£ — заданное число). Для того, чтобы столкновение частицы среды учи- тывать только один раз, налагаем условие и > 0. Формализованно задача выписывается следующим образом: То /tdt у-—ц2 —> inf; х = и, и > 0, х(0) = 0, x(Tq) = о Функция Лагранжа То А = [° 2 + р(х - u)} dt + Aiz(0) 4- А2х(7о). о Необходимые условия: а) система уравнений Эйлера: — р = 0 р = const); б) трансверсальность по х: р(0) = Ах, р(7о) = — Аз; в) принцип минимума: f Aq/ Aot mm z-----n “ pu > = --— - pu : u>o 11 4- u2 J 1 4- u2 г) неотрицательность: Ao > 0. Если Ao = 0, то p 0 (если p = 0, то из б) следует, что Ai = Аг = 0 — все множители Лагранжа — нули). Минимум в соотношении в) конечен только, если р < 0, при этом й = 0, т. е. х = 0. Из условия ж(0) = 0 вытекает, что х = 0, тогда С = 0. Пусть Ао Ф 0. Положим Ао = 1. Тогда для достижения минимума в в) необходимо, чтобы р < 0 (если р > 0, то функция £(/, и) := --т — 1 4" ри монотонно убывает с возрастанием и и не достигает минимума). Если u(t) > 0, то Lu = 0. И из в) управление й(£) должно находиться из уравнения Р= - 2ut (1 + «2)2’ (1) При малых значениях t min L(/,u) = L(/,0). Таким образом, й = u>0 f 0, 0 < t < т, [ й(/) т < t < ТЬ’ Момент излома управления т характеризуется уравнениями — 140
Р~ (1 + й2(т))2 ’ r-l + «2(r) (2) (второе уравнение в (2) L(r — 0,0) = £(т, й(т)) - условие совпадения й2(т)т минимумов в точке т). Из второго уравнения получаем — = . ч тй(т) п ри(т], откуда р =---------у--. Подставив это соотношение в первое 1 + и*(Т) уравнение соотношения (2), находим, что й2(т) = 1. Отсюда й(т) = 1 (ибо и > 0), и тогда снова из первого уравнения (2) получаем равенство т = -2р. После излома оптимальное решение удовлетворяет соотношению (1), из которого следует, что <=-е<1±^ = -е(1+2«+14 Но dx dx dx dt dt p / 1 o\ — = u=> — =—• — = «— = -£(----------+2u + 3u3). dt du dt du du 2 \ и / Интегрируя это соотношение с учетом равенства х(т) — 0, й(т) = 1, получаем параметрические уравнения искомой оптимальной кривой: х = ~^й + и +4И) + 8Р’ t = -“(- + 2u + u3), р < 0. 2 / Константа р определяется из начального условия х(То) = £. Эту кри- вую называют кривой Ньютона. Покажем, что х доставляет абсолютный минимум в задаче. В силу принципа минимума для любой допустимой функции х € КС1([0, То]), ж(0) = 0, я(Т0) = t То То . Интегрируя это соотношение и учитывая, что J i(t) dt = / x(t) dt = 4, о о То То f tdt [ tdt о . . получаем / ----гт? > / -г?. Значит, х( ) 6 absmin. J 1 + *2 “У i + f2 о о 141
7 Примеры задач оптимального управле- ния Пример 1. 2 j xdt -> inf; |x| < 2, х(0) = £(0) = £(2) = 0. о Решение. Эту задачу можно свести к задаче оптимального упра- вления, вводя вместо функции х вектор-функцию (xi, х2) и управление и и обозначения: = х, х2 = х, и = х. Тогда наша задача сведется к задаче оптимального управления: 2 У dt -4 inf; xi — x2i x2 — «, «6 [-2, 2], zi(0) = x2(0) = x2(2) = 0. о Функция Лагранжа: 2 А = У (AoZi4-pi(^)(zi — xz)+p2(t)(x2 — u)) d£4-Aiz(0)+A2x2(0)+A3ff2(2). о Необходимые условия: а) система уравнений Эйлера для лагранжиана L = XqXi 4- pi(/)(a?i- - Х2) + p2(t)(x2 -и) ( —"cfcLx! + Lxi = о, , Г — pi 4- Ао = 0, I + Дг2 = 0 1 -Р2 - Р1 = о Г pi Ю = + Ci> IP2W = -Aot72 + CU + C2; б) трансверсальность по х для терминанта I = Aix(0) 4- А2а?2(0) 4- Азх2(2) Дг1(0) = ^i(o)> Дг1(2) = —^1(2) <=> Pi(0) = Ai, pi(2) = 0, Дра(0) — k2(o)> Дг2(2) = -k3(2) <==> Рг(О) = А2, р2(2) = -А3; в) оптимальность по и min {“Р2(<)«} = “Р2(С^(^) => « = / 8Ф*Р20)> Р2(<) # 0> и€[-2>2] [любое из [-2, 2], р2(/) = 0; 142
е) неотрицательность Ао > 0. Если Ао = 0, то из а) следует, что pi = Ci и из б) pi = 0. Поэтому из а) р2 — Cq 0, иначе все множители Лагранжа оказались бы ну- лями. Значит из в) й — 2 или й = —2, т. е. х = 2 или х = —2, откуда х = t2 4- Ait + Аг или х = —t2 + Bit + Bq. В обоих случаях не су- ществует функции такого вида, удовлетворяющей условиям на концах ат(О) = £(0) = i(2) = 0. Полагаем Aq = 1. Тогда из a) pi(/) = t + Ci и из б) pi{t) = t — 2, далее из а) следует, что p2(t) = — (t - 2)2/2 + С. Получили, что p2(t) — парабола с ветвями, направленными вниз и вершиной на оси t = 2, следовательно, p2(t) или не меняет свой знак на отрезке [0, 2], или ме- няет его с минуса на плюс в некоторой точке т € (0, 2). И, значит, из в) оптимальное управление й на всем отрезке тождественно равнятся двум или минус двум или меняет свое значение с минус двух на плюс два в некоторой точке г. Но как мы уже выяснили в первых двух слу- чаях функций, удовлетворяющих начальным условиям нет. Осталось рассмотреть случай Г -2, 0 < t < т, [2, т < / < 2. Интегрируя это равенство, находим, что f-2t + Ci, 0 < / < т, [ 2t + С2, т < t < 2. Из условий на концах х(0) = х(2) = 0 ; _ Г -2/, 0 < t < Г, х “ 12t - 4, г < t < 2. Поскольку функция должна быть непрерывной в точке т, то —2т = 2т — 4, откуда г = 1. Интегрируя еще раз, получаем - Г-*2 + С1, 0 < t < 1, Х V2-4t+C'2) 1 <t <2. Из начального условия х(0) = 0 Ci = 0 и условия непрерывности в точке т = 1 : —1 = 1 — 44-(72<^(72 = 2 находим допустимую экстремаль -f-t2, 0<t<l, Х {t2 - At + 2, 1 < t < 2. 143
Докажем с помощью непосредственной проверки, что функция х доставляет абсолютный минимум в задаче. Возьмем функцию Л( ) € /СС2([0,2]) такую, чтобы х(-) + Л(-) была допустимой в задаче. Для этого надо взять функцию h(-), для которой |х + h\ < 2, Л(0) = А(0) = 2 Л(2) = 0. Имеем для функционала I(x()) = f xdt о 2 2 2 2 2 /(г 4-Л) —/(х) = j\x + h) dt —f х dt = J hdt = — J p2hdt = — J hdp^- 0 0 0 0 0 Интегрируя по частям дважды с учетом условий Л(0) = А(0) = А(2) = 0, рг(2) = 0, получим 2 2 I(x + h) — Цх) = У hp2 dt - hp2|о= j hdp2 = о о 2 2 |2 Г .. Г .. = Ар2 ~ / hp2dt = — I hp2dt. Io J J 0 ' 0 Разбивая отрезок интегрирования на два и учитывая, что f h > 0, 0 < t < 1, Г Р2 < 0, 0 < t < 1, I h < 0, 1 < t < 2, а 1Р2 > 0, 1 < t < 2, имеем 1 2 Цх + h) — Цх) = — У hp2 dt — У hp2 dt > 0. о i Таким образом, х 6 absmin. Пример 2. Т inf; -1 < х < 3, z(0) = 1, х(Т) = -1, r(0) = х(Т) = 0. Решение. Приведем задачу к виду задач оптимального управле- ния, вводя вместо функции х вектор-функцию (a?i, хг), управление «(•) и обозначения: xi = х, х2 = х, и = х, Т -> inf; xi = х2, х2 — и, и£ [-1, 3], X!(0) = 1, Х!(Т) = -1, х2(0) = Х2(Т) = 0. 144
Функция Лагранжа: т А = J(pi(«)(®i - х2) +рг(0(®2 - «)) dt+ +Х0Т + А1(Ж1(0) - 1) + А2х2(О) + A3(zi(T) + 1) + А4г2(Т). Необходимые условия: а) система уравнений Эйлера для лагранжиана L = pi(/)(ii — х2) 4- р2(0(®2 - «) - Lit + LX1 — О, Г — pi = О, -^£^ + £„, = 0 1-Р2-Р1 = 0 <=► P2G) = С« + С2; б) трансверсальность по х для терминанта / = AqT + Ai (®i(0) — 1) + A2x2(0) 4- Аз(ж1(Т) 4-1) 4- А4Х2СГ) L*i(0) = /Г1(о), bfj(T) = -/Ж1(т) <=> Pi(0) = Ai, pi(T) = -A3, Дс2(0) = k2(o), LiQ(T) = -lX2(T) <=> Рг(0) = A2, Р2СП = — A4; в) оптимальность по и (не зависящие от и слагаемые не выписы- ваем) min {-p2(/)u} = -p2(t)u(t) => «€[-1,3] ( “1, Р2(0<0> U = < 3, p2(t) > 0, ( любое из [—1, 3], р2(/) = 0; г) стационарность по Т Лт(Т) = 0 <=> Ао 4- АзХ1(Т) 4- А4Ж2(Т) = 0; е) неотрицательность Ао > 0. Учитывая то, что из начального условия следует xi(T) = 0, а из б) А4 = —р2(Т), получаем, что г) равносильно условию Ао = р2(Т)й(Т). Поэтому если Ао = 0, то р2(Т) = 0 либо й(Т) = 0, но от- сюда из в) вновь р2(Т) = 0. При этом р2 не может быть тожде- ственным нулем, ибо иначе все множители Лагранжа были бы ну- лями. Значит, из а) р2(<) = C(t — Т), С / 0, а тогда из в) сле- дует, что u(t) = —1 или u(t) = 3, т. е. х = —1 или х = 3, откуда 145
х = -t2/2 + Ait 4- Л2 или x = 3Z2/2 4- Bit 4- B2. В обоих случаях не су- ществует функции такого вида, удовлетворяющей условиям на концах х(0) = 1, х(Т) = -1, £(0) = х(Т) = 0. Таким образом, в случае Ао = 0 нет допустимых экстремалей. Полагаем Ао = 1. В силу условий п.а) р2 — линейная функция, не тождественно равная нулю. Значит р2 может менять свой знак на отрезке [0, Т] не более одного раза. Причем, если функция р2 не меняет свой знак на [0, Т], то u(t) = — 1 или u(t) = 3. В обоих случаях мы уже проверили, что нет допустимых экстремалей. Поэтому р2 меняет знак на [0, Т] ровно один раз в некоторой точке т Е (0, 2). Получаем две возможности: . - ( 3, 0 < t < т, л -- Г-1, 0<t<T, r<t<Ti ИЛИ и“Х“(3, r<t<T. Первый случай невозможен, так как тогда параболы с заданными усло- виями на концах не пересекаются. Интегрируя второе равенство, на- ходим, что + 0</<т, х ~ t 3t + С2, r<t<T. Из условий на концах z(0) = i(T) = 0 имеем ; _ ( -t, 0<t<r, x-\3(t-T)> r<t<T. Поскольку x € X(72([0, T]), то функция x должна быть непрерывной в точке т, поэтому — т = 3(т — Т), откуда т = ЗТ/4. Интегрируя еще раз, получаем . _ ( —/2/2 4- С, 0 < t < ЗТ/4, Х ~ t 3(t - Т)2/2 + D, ЗГ/4 < t < Т. Из начальных условий ж(0) = 1, а?(Г) = — 1 следует, что С = 1, D = — 1, а из условия непрерывности в точке т = ЗТ/4 : —9Т2/32 = 3T2/32 — 1 находим, что Т = 4/ч/3. Таким образом, имеется единственная допу- стимая экстремаль ~ 0</< ч/З, 1 3(t — 4/V3)2/2 — 1, л/3 < t < 4/л/З. Аналогично тому, как это было сделано в простейшей задаче бы- стродействия, можно показать, что х € absmin, т. е. найденное значе- ние Т = 4/ч/3 доставляет абсолютный минимум в задаче. 146
Задачи оптимального управления. 1. J х sin t dt —> extr; |x| < 1, x(—n) = x(ir) = 0. — 7Г 7яг/4 2. У xsintdt -> extr; |z| < 1, x(0) = 0. о 4 3. У (x2 + x) dt —> extr; |i| < 1, x(4) = 0. о 2 4. У xdt —> extr; |x| < 2, x(0) + x(2) = 0, x(0) = 0. о 4 5. У xdt —> extr; |x| < 2, x(0) + z(4) = 0, z(0) = x(4) = 0. о 6. T -4 inf; |z| < 2, z(-l) = 1, x(T) = -1, i(-l) = x(T) = 0. 7. T -> inf; -3 < x < 1, x(0) = 3, x(T) = -5, x(0) = i(T) = 0. 8. T -> inf; 0<z<l, x(0) = £i, s(0)=&, z(T) = £(T) = 0. 2 9. У |x| dt —> inf; x > -2, x(0) = 0, x(2) = —1, x(2) = —2. о 10. 11. 12. 13. 14. 2 У |x| dt -> inf; x < 2, x(0) = 0, z(2) = 1, x(2) = 2. о i У x2 dt -> inf; x < 24, s(0) = 11, x(l) = i(l) = 0. о 2 У x2 dt -> inf; x > 6, x(0) = i(0) = 0, x(2) — 17. о i У x2 dt -> inf; |x| < 1, z(0) = x(0) = 0, z(l) = — / (z t~~~ +1®') di extr; = 0 147
Глава 5 Условия первого и второго порядка в КВИ В этой главе даны необходимые и достаточные условия экстремума в простейшей задаче КВИ. Это классические условия — условия Лежан- дра, Якоби, Вейерштрасса и другие. 1 Сильный и слабый экстремум Рассмотрим вновь простейшую задачу КВИ Z(x(-)) = / L(t,x(t),i(t)) dt —> inf; x(to) = *o, z(ti) = ®i. (з) J to Напомним, что функция x() 6 С1 ([/о, *i])> £(to) = i(ti) = доставляет слабый локальный минимум в задаче (з) (х 6 locmin з (слабый)), если она доставляет локальный минимум в пространстве С71([^о> *1])> т. е. если существует 6 > 0 такое, что для любой функ- ции х(-) 6 С1 (fab ti]), x(to) = xOt x(ti) = xi, для которой ||х() - ®(*)llcl[t0»ti] < выполняется неравенство Z(x(-)) > /(£(•)). Наряду со слабым экстремумом рассматривается понятие силь- ного экстремума. Говорят, что функция х() 6 ЯС1 ([to, ti]), #(to) = х0, £(*1) = ^1, доставляет сильный локальный минимум (х 6 locmin з (сильный)), если она доставляет локальный минимум в простран- стве C([to, ti]), т. е. если существует б > 0 такое, что для любой функции х() е ti]), x(t0) = xq, x(ti) — xi, для которой ||x( ) — £(-)||c([to, tj) < выполняется неравенство Z(x()) > /(£(•)). Так как множество функций, среди которых доставляется силь- ный экстремум, шире, чем для слабого экстремума, то если функция х() 6 С1 ([to, ti]) доставляет сильный, то она доставляет и слабый экс- тремум. Поэтому для таких функций необходимое условие слабого экстремума является необходимым условием сильного, а достаточное условие сильного является достаточным условием слабого. 148
2 Пример слабого, но не сильного экстре- мума [ х3 dt —> inf; х(0) = 0, х(1) = 1. Jo Необходимое условие слабого, а значит и сильного экстремума — урав- нение Эйлера: — + Lx = 0 <=> ^Зх2 = 0 <=> Зх2 = С <=> х = const. Общее решение уравнения Эйлера: х = Cit+Сг. Из условий на кон- цах находим, что 0'1 = 1, Сз = 0. Таким образом, имеется единствен- ная допустимая экстремаль х = t. Покажем, что она доставляет сла- бый локальный минимум в задаче. Действительно, если h 6 Cq([0,1]), 1 то для функционала /(«(•)) = f х3 dt имеем о /(*(-) + *(.)) - /(*(•)) = /(1 + Л)3 dt - f I3 dt = f Л2(3 + h) dt. (1) 0 0 0 Отсюда видно, что если ||h||i < 3, то 3 + h(t) > 0 и, значит, Z(x(-) + Л(-)) > /(£(•)), т. е. х 6 locmin (слабый). Покажем, что х( ) не доставляет сильного экстремума. Рассмотрим последовательность функций Лп(-) (n > 1) такую, что hn(t) = < -у/п, t € [0, 1/n], О, t Е (1/n, 1/2), 2/v^, t E [1/2, 1]. Тогда f ( * E ДО» l/nL hn(t) = / hn(r)dr = < t e (1/n, 1/2), { ( 2Z/7n - 2Д/п, t E [1/2, 1]. Легко понять, что An() E XCo([to, <i]) и ||An||o -> 0 при n -> оо. Поло- жим xn() = x() + hn( ). Получим последовательность допустимых (в задаче на сильный экстремум) функций хп( ), хп( ) —> #(•) в С([/о> h])> для которых в силу (1) 1 1/я 1 I(xn)-I(x)= J /»2(3 + Л„)Л= J n(3-yffidt+ j ^ + ^dt = 0 0 1/2 = 3 — у/п -I- 6/п + 4/(п>/п) —> —оо, при п -> оо, т. е. Smin = —оо и функция х не доставляет сильного локального минимума. 149
3 Условия Лежандра,Якоби, Вейерштрасса Рассмотрим простейшую задачу классического вариационного исчи- сления, для определенности задачу на минимум ti = j L (t,x(t), £(/)) dt -> inf; x(t0) = xq, x(ti) = xi. (3) u Пусть f(-) E Cx([to> tj) — некоторая фиксированная допустимая (f(to) = xo> x(ti) — «1) экстремаль (т. e. £(•) удовлетворяет уравне- нию Эйлера). Далее предполагаем, что интегрант L по меньшей мере дважды непрерывно дифференцируем в некоторой окрестности тра- ектории i(). Возьмем функцию А( ) 6 С$ ([^о3 Ъ])- Пусть £() 6 locmin з (сла- бый), тогда функция одного переменного SP(А) = /(£() + АЛ( )) = J £(t, x(t) + Xh(t), + Ah(t)) dt to имеет минимум при А = 0. Из условий, наложенных на гладкость функции L следует, что функция у>(А) дважды дифференцируема в нуле. Поэтому по необходимому "условию минимума первого порядка (по теореме Ферма) у/(0) = 0, т. е. tl р'(0) = J [Li(t)h(t) + Lx(t)h(t)) dt = 0 V /»(•) 6 СоЧро, ill). (1) to В главе 3 п. 1.3 было показано, что из соотношения (1) следует урав- нение Эйлера — необходимое условие экстремума первого порядка. По необходимому условию минимума второго порядка для функции одной переменной у>"(0) > 0, т. е. ti р"(0) = J + 2Lxx(t)h(t)h(t) + LIC(t)A2(t)) dt > 0 to v A( ) € Co([<0, tl]). (2) Из соотношения (2) выводятся условия второго порядка для про- стейшей задачи классического вариационного исчисления. Важную роль играет коэффициент La(t) при Л2. Говорим, что на экстремали х( ) выполнено условие Лежандра, если ДгНО >0 V t G [<о, <1] и усиленное условие Лежандра, если La(t) > 0 Vt€[to,ti]. 150
1 Пусть далее Ьц(-), Lizi), LXx( ) € ti],Rn) и выполнено усиленное условие Лежандра. Уравнение Эйлера по Л — ^Ьд(^) + £/i(t) = 0 для интегранта L = Z(t,A(t),A(t)) := Lxx(t)h2{t) ^^Lix{t)h{t)h{t) + b„(/)A2(Z), т. e. уравнение ~Tt + WW*)) + + Lxx(t)h(t) = 0 называется уравнением Якоби для исходной задачи на экстремали х(•). Точка т называется сопряженной к точке to, если для решения уравнения Якоби Л(-) с начальными данными h(to) = 0, A(to) = 1, функция Л(-) в точке т обращается в ноль (Л(т) = 0). Говорят, что на £(•) выполнено условие Якоби, если в интервале (to, ti) нет точек, сопряженных с to, и усиленное условие Якоби, если в полуинтервале (to, ti] нет точек, сопряженных с to- Уравнение Якоби — линейное дифференциальное уравнение вто- рого порядка, которое (из-за усиленного условия Лежандра) можно разрешить относительно второй производной. Пусть /: Rn -> R — дифференцируемая функция п переменных. Функцию Е(х, х') := f(x') - /(«) - f(x)(x' - х) назовем функцией Вейерштрасса, соответствующей /. Геометриче- ский смысл Е таков: Е(х, х’) — разность в точке ж' между значением / и значением аффинной функции, касательной к графику f в точке х. Отсюда ясно, что если f выпукла, то Е(х,х') > 0. Можно показать, что верно и обратное. Пусть L — интегрант функционала I простейшей задачи класси- ческого вариационного исчисления. Функция E(t, х, х, и) := L(t, х, и) — L(t, <₽, х) - Lift, х, х)(и — х) называется функцией Вейерштрасса функционала I. Таким образом, E(t,x,x, и) — функция Вейерштрасса функции х —> L(t,x,x), где t, х играют роль параметров. Говорят, что на экстремали х( ) выполнено условие Вейерштрасса, если E(t,x, х,и) = L(t,x,u)—L(t,x, > 0 Vu Е Rn Vt 6 [to, tj. 151
4 Необходимые и достаточные условия эк- стремума в простейшей задаче КВИ Рассмотрим простейшую задачу классического вариационного исчи- сления, для определенности задачу на минимум ti /(»(.)) = J L (t, x(t), x(t)) dt —> inf; x(to) = ^o, x(ti) = j?i. (3) to Теорема 1 (необходимые условия сильного минимума). Пусть функция х(-) 6 С1 ([/о, ti]) доставляет сильный локальный минимум в задаче (з) (z(-) £ locmin з (сильный)), и интегрант £(•) 6 Сх{и}, где U — некоторая окрестность графика {(t, x(t), x(t)) | t £ [to, ti]}, тогда на х() выполняется уравнение Эйлера + Lx(t) = 0 V t £ [t0, ti] и удовлетворяется условие Вейерштрасса E(t,x,x,u) = L(t,x,u)—L(t,x,x)-Li(t)(u-x) > 0 V и £ Rn Vt £ [to, tj. Если при этом существует Lxi(t) V t £ [to, tj, то выполняется также условие Лежандра: La(t) >0 V t £ [to, ti}. Доказательство. Формализуем задачу (з) как задачу оптималь- ного управления ti J L(t,x, и) dt —> inf; х = й, x(to) = xq, x(ti) = a?i. (з') to Условие x(-) £ locmin з (сильный) равносильно тому, что пара (х(),«(•)), гДе f<(t) = i(t), является оптимальным процессом в за- даче оптимального управления (з’). Поэтому согласно принципу мак- симума Понтрягина найдутся множители Лагранжа Ао, Ai, Аг и р( ) £ КС*1 ([to, tj) не все равные нулю и такие, что для функции Лагранжа задачи (з') ti А = У (A0L(t,z,u)+p(t)(z - н)) dt + Ai(x(t0) - х0) + A2(x(ti) - xi) to выполняются условия: 152
а) стационарности по х — уравнение Эйлера: “jfcXO + Ao£x(i) = 0 V t 6 [to, ii]; б) трансверсальности по х : p(t0) = Ai, p(ii) = -А2; в) оптимальности по и : min {AqL(/, «(/),«) - p(i)u} = AoL(i, x(t),x(t)) —p(t)x(t). u€Rn Если Ло =0, то из в) (поскольку минимум конечен и равен —p(t)x(t)) вытекает, что p(t) = 0, а из б) — что все множители Лагранжа нули. Значит, Ло / 0. Полагаем Ао = 1. Тогда из в) следует, что L®(i) = р(/) (необходимое условие I порядка минимума функции L(i,x(i),«) — p(t)u) и >0 V t 6 [io, *1] (необходимое условие II порядка). Подставляя р = Li в условие стационарности по xi тюлучаем. уравнение Эйлера. Условие оптимальности по и при Ао = 1 и р = Li есгтъ не что иное, как условие Вейерштрасса. Теорема 1 доказана. В дальнейшем нам придется использовать следующий результат. Лемма о скруглении углов. Пусть функция £(•) 6 КС1 ([io, ii]), интегрант L{t,x,x) 6 C(R3). Тогда существует последователь- ность функций {яп()}п >1 € C’1([to, ti]), *n(M = i(to), xn{ti) = £(ii), такая, что тп( ) —> £(•) в метрике пространства С([<о> й]), Н«п( )||1 < ||i( )|h, « ЯМ )) = /(«(•))• п—>оо Замечание. По определению пространства К С ([to, ii]) для функ- ции £(•) Е ЯС1 ([io, ii]) величина lli(')llc‘([t0, ti]) := max{lli( )llc([t0, ti])> ll®( )llc([to, ti])}> является конечной, несмотря на то, что сама функция £(•) возможно и не принадлежит пространству С1 ([io, ii]). Следствие. Абсолютный экстремум в задаче на сильный и сла- бый экстремум совпадают. 153
Теорема 2 (необходимые условия слабого минимума). Пусть фун- кция £(•) 6 C2([to, й]) доставляет слабый локальный минимум в за- даче (з) (х(-) G locmin з (слабый)), и интегрант Ц) 6 C3(U), где U — некоторая окрестность графика {(t, x(t)} x(t)) | t 6 [to, ti]}, тогда на f() выполняется уравнение Эйлера, условие Лежандра и если на экстремали выполнено усиленное условие Лежандра (La(t) >0 V t £ ко, ti]), то выполняется и условие Якоби, т. е. на интервале (to, ti) нет сопряженных точек. Доказательство. 1) Вывод уравнения Эйлера и условия Лежан- дра. Поскольку х( ) 6 locmin з (слабый), то для любой функции Л(-) С*о(ко, й]) функция ^>(Л) = 1(х(•) + АА()) имеет локальный минимум в нуле. Тогда по необходимому условию минимума функ- ции одного переменного ^>'(0) ~ 0 и у/'(0) > 0. В главе 3 п. 1.3 было показано, что первое условие равносильно выполнению уравнения Эй- лера на функции £(•). Второе условие эквивалентно неотрицательно- сти функционала ti К(Л(-)) = у (£^(<)Л2(<) + 2Х^(0Л(<)Л(4) + Ьо:г(<)л2(<)) Л>0 to v^OeCo^ko,^]). Из неотрицательности и вида функционала К следует, что h(t) = 0 доставляет абсолютный минимум (слабый) в задаче /<(/«(.))-> inf; Л( ) € *1]). (з") По следствию из леммы о скруглении углов функция h(t) = 0 доста- вляет в (з") и сильный минимум. Тогда в силу теоремы 1 о необ- ходимых условиях сильного минимума в задаче (з") на h выполня- ется условие Лежандра для интегранта Z(t,/i(t)} ft(t)) := Ln(t)h2(t) + 2^гк)А(/)/1(0+£хт(0Л2(0, т. е. ZAA(t) > 0 & Ln(t) >0 Vi 6 [to, h]. Таким образом, условие Лежандра в (з) выполнено. 2) Вывод условия Якоби. Предположим противное, что условие Якоби не выполнено, т. е. существует точка г 6 (to, ti) и нетриви- альное (h(-) 0) решение h( ) уравнения Якоби, для которого A(to) — h(r) =0. Отметим, что из нетривиальное™ решения Л(-) однородного линейного дифференциального уравнения второго порядка с условием Л(т) = 0 вытекает, что h(r) 0. Положим h(t) = Так как h(-) удовлетворяет уравнению Якоби, то после интегрирова- ния по частям получим 154 Г h(t), tQ < t < т, [0, r<t<ti.
K(h( )) = J (iir(i)A2(0 + 2^(0AW40 + i~(0A2(«)) <« = to = j (Lii(t)h(t)+Lix{t)h(t))h(t)dt+J ^Lxi(t)h(t)+Lxx(t)h(t))h(t)dt = to to = (Lxx(t)h(t) + £«(«)Л(*))л(п[о+ +j + bis(t)h(Z)) + LXje(t)h(t) + Lxx(t)h(t)^h(t)dt = O. to Таким образом, K(h(•)) = 0, а это означает, что h( ) E locmins" (сильный) (наряду с функцией h(t) = 0). Проводя рассуждения, ана- логичные проведенным в Теореме 1, получим, что найдется функция р( ) 6 КС1 ([to, ti]), для которой выполняется уравнение р(0 = lh(t, h(t), ф=> p(t) = 2 (Lix(t)i(t) + Lix(t)h(t))} . Поскольку h(t) = 0 при t > г, то р(т + 0) = 0 и в силу непрерывности р() 0 = р(г - 0) = 2Lxx(r)h(r - 0) = 2Ь^(г)Л(т) = 0, откуда h(r) = 0 (ибо Ьц(т) 0 из-за усиленного условия Лежандра). Мы пришли к противоречию с условием h(r) 0. Таким образом, условие Якоби выполнено. Теорема 3 (достаточные условия слабого минимума). Пусть фун- кция £(•) 6 C2([to, ti]) — допустимая экстремаль в задаче (з), инте- грант £(•) Е C3(V х Rn), где V Е R”+1 — некоторая окрестность графика {(t,x(t)) | t С [to, ti]}, на £() выполнены усиленные условия Лежандра и Якоби. Тогда £(•) доставляет слабый минимум в задаче (з). Теорема 4 (достаточные условия сильного минимума). Пусть функция £(•) Е С2([to, tj) — допустимая экстремаль в задаче (з), интегрант £(•) Е C3(V х Rn), где V Е Rn+1 — некоторая окрест- ность графика {(t,x(t)) | t Е [to, h]}, на х() выполнены усиленные условия Лежандра и Якоби, интегрант L является выпуклым по х на V. Тогда х(-) доставляет сильный минимум в задаче (з). В задаче на максимум условия Лежандра и Вейерштрасса меняют свой знак. 155
5 Примеры Пример 1. Исследуем с помощью условий второго порядка задачу, рассмотренную нами в п. 3.2: 1 J х3 dt —> inf; х(0) = 0, z(l) = 1. о Мы выяснили ранее, что имеется единственная допустимая экстремаль х = /, доставляющая слабый локальный минимум в задаче и не до- ставляющая сильного. При этом нами была построена последователь- ность допустимых (в задаче на сильный экстремум) функций яп(), ®п( ) х( ) в С([йъ й]), для которой 1(хп( )) —> -оо при п —> оо. Поскольку Lix(t) = 6f(t) = 6 > О V t 6 [0, 1], то выполняется усиленное условие Лежандра. Выпишем уравнение Якоби, которое является уравнением Эйлера по h для интегранта L = Lix(t)h2(t) + 2Lix(t)h(t)h(t) + LgX(t)h2(t) = 6А2: d - —12/i = 0 <=> А = 0. dt Общее решение уравнения Якоби: h = Cit + Съ- Начальным условиям А(0) = 0, А(0) = 1, удовлетворяет функция h(t) = t. Эта функция не имеет нулей в полуинтервале (0, 1]. Значит, сопряженных точек нет, и стало быть выполнено усиленное условие Якоби. По теореме 3 выполнено достаточное условие слабого локального минимума, значит х Е locmin (слабый). Поскольку функция L = х3 не выпукла по х, то достаточное условие сильного минимума не выполняется. Проверим необходимое условие сильного минимума — условие Вейерштрасса: Е(/,ж,х,и) = HtjX'U) — L(t}xt х) — Li(t)(u — x) = и3 — х? — 3£2(u-i) = = и3 -1 - з(« -1) > о (?) v и е R, v t е [о, 1]. Оно не выполняется. Так как не выполняется необходимое условие, то функция х не доставляет сильного локального минимума. 156
Пример 2. Исследуем с помощью условий второго порядка задачу, рассмотрен- ную нами в главе 3 п. 1.6 (пример 2): Зтг/2 !(»(.))= j (i2 — х2) dt —> inf; ат(О) = = 0. о Уравнение Эйлера: х 4- х = 0. Мы выяснили ранее, что имеется единственная допустимая экстре- маль х = 0, не доставляющая даже слабого локального минимума в задаче. При этом нами была построена последовательность допусти- 1 2/ мых функций xn(t) = -sin—-, xn( ) -> i(-) в Cx([0, 1]), для которых п 3 1(хп())<0 = !(£()). Поскольку Luft) = 2 > 0 V t 6 [о, , то выполняется усиленное условие Лежандра. Выпишем уравнение Якоби, которое является уравнением Эйлера по h -^ZA(t) + Xft(t) = O для интегранта I = £^(/)Л2(<) + 2Lxx(t)h(t)h(t) + Lxx(t)h2(t) = 2Л2 - 2Л2 : —h — /1 = 0 <=> h = Ci sint 4- C2cost. Начальным условиям Л(0) = 0, Л(0) = 1, удовлетворяет функция h(t) = sint. Эта функция в интервале ^0, обращается в ноль в точке т — тг. Таким образом, в интервале (о, имеется сопря- женная точка, и стало быть не выполнено необходимое условие Якоби слабого локального минимума, значит допустимая экстремаль £(•) не доставляет в задаче слабый минимум, и тем более не доставляет силь- ный минимум. 157
Задачи на исследования. тг/2 1. J (х2 — х2 4- 4х cos /) dt —> extr; х(0) = х = 0. 0 3ir/2 2. f / Зтг \ 1 (х2 — х2 — 4xsint) dt —> extr; х(0) = х^—J = 0. 0 1 3. У (х2 4- 3x2)e2t dt —» extr; х(0) = 1, х(1) = е. 0 4. 1 J(х2 — x2)e2t dt —> extr; х(0) = 0, х(1) = е. 0 5. 1 J sinxdt —> extr; х(0) = 0, х(1) = —. 0 1 6. У cos х dt —> extr; х(0) = 0, х(1) = тг. 0 То 7. У хех dt —> extr; х(0) = 0, x(Tq) — £. 0 8. 1 У х2ех dt -> extr; х(0) = 0, х( 1) = 2. 0 9. 1 У(х3 4“ 4х2) dt —> extr; х(0) = 0, х(1) = —1. 0 3/2 Г z Q \ 10. / (х2 4- 2х) dt —> extr; х(0) = 0, 0 То 11. У (х5 4- 5х) dt -> extr; х(0) = 0, x(Tq) = 0 12. i У (1 — х2)2 dt -> extr; х(0) = 0, х(1) = 0 158
Литература [1] АГТ Алексеев В. М., Галеев Э. М., Тихомиров В. М. Сборник задач по оптимизации. М.: Наука, 1984. [2] АТФ Алексеев В. М.} Тихомиров В. М., Фомин С. В. Оптимальное управление. М.: Наука, 1979. [3] Габасов Р., Кириллова Ф. М. Методы оптимизации. Минск. Изд-во БГУ, 1981. [4] ГТ Галеев Э. М., Тихомиров В.М. Краткий курс теории экстре- мальных задач. М.: Изд-во МГУ, 1989. [5] Галеев Э. М. Классическое вариационное исчисление, оптимальное управление. М.: Изд-во МГГА, 1995. [6] Галеев Э.М. Линейное программирование. М.: Изд-во МГГА, 1995. [7] Галеев Э. М. Задачи на экстремум. М.: Изд-во МГГА, 1996. [8] Заславский Ю.Л. Сборник задач по линейному программирова- нию. М.: Наука, 1969. [9] Карманов В. Г. Математическое программирование. М.: Наука, 1980. [10] Саульев В. К. Прикладная и вычислительная математика. Вып. 3. Изд-во МАИ, 1971. 159
Галеев Эльфат Михайлович Курс лекций по вариационному исчислению и оптимальному управлению. М.: Издательство механико-математического факультета МГУ, 1996.—160 с. Подписано в печать 20.10.1996 г. Формат 60x90 1/16. Объем 10 п.л. Заказ 12. Тираж 1000 экз. Издательство механико-математического факультета МГУ г. Москва, Ленинские горы. Лицензия на издательскую деятельность ЛР N 020806, от 23.08.1993г.__________________________________________ Отпечатано на типографском оборудовании механико-математи- ческого факультета и франко-русского центра им. А. М. Ляпу нова. 160