/
Author: Кувыркин Г.Н. Ванько В.И. Ермошина О.В.
Tags: анализ геометрия топология прикладная математика математическое моделирование учебник для вузов
ISBN: 978-5-7038-3845-7
Year: 2018
Text
В.И. ВАНЬКО, О.В. ЕРМОШИНА, Г.Н. КУВЫРКИН
ВАРИАЦИОННОЕ
ИСЧИСЛЕНИЕ
И
ОПТИМАЛЬНОЕ
УПРАВЛЕНИЕ
Под редакцией
д-ра техн. наук, профессора B.C. Зарубина
и д-ра физ.-мат. наук, профессора А.П. Крищенко
Рекомендовано Министерством образования
Российской Федерации
в качестве учебника для студентов
высших технических учебных заведений
4-е издание,
исправленное и дополненное
Москва
ИЗДАТЕЛЬСТВО
МГТУ им. Н. Э. Баумана
2018
УДК 517.1(075.8)
ББК 22.151.5
В17
Рецензенты:
профессор Н.А. Бобылев, профессор Р.А. Васин
Ванько, В* И*
В17 Вариационное исчисление и оптимальное управление :
учебник для вузов / В. И. Ванько, О. В. Ермошина, Г. Н. Ку-
выркин ; под ред. В. С. Зарубина, А. П. Крищенко. — 4-е изд.,
испр. и доп. — Москва : Издательство МГТУ им. Н. Э. Бау-
мана, 2018. — 488 с. : ил. — (Математика в техническом
университете ; вып. 15).
ISBN 978-5-7038-3845-7
ISBN 978-5-7038-4876-0 (вып. 15)
Наряду с изложением основ классического вариационного исчи-
сления и элементов теории оптимального управления рассмотрены
прямые методы вариационного исчисления и методы преобразования
вариационных задач, приводящие, в частности, к двойственным ва-
риационным принципам. На примерах из физики, механики и тех-
ники показана эффективность методов вариационного исчисления и
оптимального управления для решения прикладных задач.
Для студентов и аспирантов технических университетов, а также
для инженеров и научных работников, специализирующихся в области
прикладной математики и математического моделирования.
УДК 517.1(075.8)
ББК 22.151.5
Учебное издание
Математика в техническом университете
Выпуск 15
Ванько Вячеслав Иванович
Ермошина Олеся Владимировна
Кувыркин Георгий Николаевич
ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
И ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ
Оригинал-макет подготовлен в Издательстве МГТУ им. Н.Э. Баумана.
В оформлении использованы шрифты Студии Артемия Лебедева.
Подписано в печать 25.06.2018. Тираж 350 экз. Формат 60x90/16.
Усл. печ. л. 30,75. Заказ
Издательство МГТУ им. Н.Э. Баумана. 105005, Москва, 2-я Бауманская ул.,
д. 5, стр. 1. press@bmstu.ru www.baumanpress.ru
Отпечатано в типографии МГТУ им. Н.Э. Баумана. 105005, Москва,
2-я Бауманская ул., д. 5, стр. 1. baumanprint@gmail.com
© Ванько В.И., Ермошина О.В.,
Кувыркин Г.Н., 1999
© Ванько В.И., Ермошина О.В., Ку-
выркин Г.Н., 2018, с изменениями
© Оформление. Издательство
МГТУ им. Н. Э. Баумана, 2018
ISBN 978-5-7038-4876-0 (вып. 15)
ISBN 978-5-7038-3845-7
...Мне казалось, что лучше пересказать удовлетворив-
шие меня изложения различных вопросов механики, чем в
погоне за ложной оригинальностью ставить себя в стран-
ное положение не повторять умных формулировок лишь
на том основании, что они были кем-то до тебя сказаны.
Н.Г. Четаев. Теоретическая механика
ПРЕДИСЛОВИЕ
В истории развития естественных наук четко прослеживается
стремление свести количество исходных положений данной
науки к минимуму, и лучше всего к одному основополагаю-
щему принципу, который, как в зерне, заключал бы в себе
все содержание рассматриваемой области знаний. Например,
из принципа возможных перемещений Лагранжа вытекают
уравнения равновесия системы материальных точек и абсо-
лютно твердых тел. Соединив принцип Лагранжа с принципом
Даламбера, получим более общий принцип механики, следст-
виями из которого являются уравнения движения.
Упомянутые принципы естественным образом обобщаются
на модели сплошной среды — деформируемые твердые тела,
жидкости и газы.
Одна из трудностей вычислительного характера, возника-
ющих при реализации решения задачи, например, о нахож-
дении напряженно-деформированного состояния сплошной
среды либо некоторой конструкции, — высокий порядок про-
изводных искомых величин в уравнении движения (равнове-
сия). Кроме того, вывод самих уравнений движения и поста-
новка краевых условий зачастую являются самостоятельной
проблемой.
В настоящее время достаточно распространена следую-
щая схема постановки задач о состоянии деформируемых
тел* На основе подходящего (в части IV мы обсуждаем этот
вопрос) вариационного принципа выписывают функционал
(чаще всего — некоторое интегральное соотношение). С по-
мощью правил и приемов вариационного исчисления полу-
чают уравнения движения и естественные краевые условия.
6
Предисловие
Последнее обстоятельство является замечательным фактом:
«хороший» вариационный принцип содержит всю инфор-
мацию о природе изучаемого явления. Однако если полу-
чен функционал и известны его экстремальные свойства, до
уравнений движения (равновесия) дело не доводят, а строят
последовательность функций, предел которой доставляет
функционалу стационарное или экстремальное значение,
например минимизирует значение функционала. Этот спо-
соб получения приближенного решения является наиболее
простым и экономичным.
Авторы выпуска XV серии «Математика в техническом
университете» ставят перед собой следующие задачи:
• изложить основы классического вариационного исчис-
ления, подчеркнув при этом особенности и специфику вариа-
ционных задач как задач, обобщающих проблему поиска экс-
тремумов функций многих переменных без ограничений и
с таковыми;
• обсудить основные идеи и методологию теории опти-
мального управления Понтрягина и метода динамического
программирования Беллмана;
• изложить основную идею преобразования вариацион-
ных задач (выявление двойственных вариационных задач) и
построения на их основе аппроксимаций искомого решения.
В части IV приведены примеры использования вариаци-
онных принципов при постановке и решении различных на-
учно-технических проблем. На основе принципа Гамильтона
получены известные уравнения математической физики, урав-
нения движения идеальной жидкости. Подробно рассмотрена
аэродинамическая задача Ньютона (представлено решение за-
дачи именно методами вариационного исчисления). Отмечена
выдающаяся роль А.Н. Крылова, который не только дословно
перевел великий труд И. Ньютона «Математические начала
натуральной философии», но и снабдил комментариями и
подробными решениями многие утверждения Ньютона. Под-
черкнем, что современное вариационное решение аэродинами-
ческой задачи принадлежит Крылову.
Изложен вариационный подход к задачам на собственные
значения, подробно изучены задачи о продольном изгибе упру-
гих стержней. Рассмотрены динамические и нестандартные
задачи термомеханики.
В конце отдельных глав приведены задачи для самостоя-
тельного решения в целях проверки усвоения материала.
Предисловие
7
Основные источники (монографии, учебники, журнальные
статьи и задачники) помещены в списках литературы в алфа-
витном порядке.
Мы считаем своим приятным долгом выразить признатель-
ность профессору А.Н. Канатникову, чья критика во многом
способствовала совершенствованию изложения, доцентам
А.Д. Герман, которая любезно предоставила нам записи сво-
их лекций по вариационному исчислению, и Е.В. Пилявской,
активно сотрудничавшей с нами при написании дополнений,
включенных в это издание (2.6-2.9, 3.4, 3.5, 16-18).
Авторы будут благодарны всем, кто выскажет свои заме-
чания по книге.
Задания для самопроверки
Перед изучением данного выпуска полезно убедиться, что чи-
татель готов к усвоению материала, изложенного в учебнике.
Для этого предлагаются следующие задания.
1. Какие множества называют: а) замкнутыми; б) откры-
тыми; в) ограниченными; г) компактными? Что называют
диаметром множества? [I]
2. Дайте определение точной верхней (нижней) грани чи-
слового множества. В чем различие между minf(x) и inf f(x)
для действительной функции f(x) одного действительного пе-
ременного, определенной на некотором промежутке числовой
прямой? [I]
3. Напишите формулу Тейлора: а) для функции одного
действительного переменного; б) для функции многих пере-
менных. [II], [V]
4. Как проверить, является ли функция одного действи-
тельного переменного выпуклой вверх (вниз)? [II]
5. Что такое: а) линейное пространство; б) евклидово про-
странство; в) нормированное пространство? Приведите пример
нормы в линейном пространстве. Как вводят в W1 стандартное
скалярное умножение? [IV]
6. Как найти собственные значения и собственные векторы:
а) линейного оператора в конечномерном линейном простран-
стве; б) квадратной матрицы? Что такое характеристическое
уравнение матрицы? [IV]
7. Какую квадратичную форму называют положительно
(отрицательно) определенной? Сформулируйте критерий Силь-
вестра. [IV]
8
Предисловие
8. Какую функцию многих переменных называют: а) не-
прерывной по совокупности переменных; б) непрерывной по
части переменных?
9. Что называют условным экстремумом функции многих
переменных? Как можно найти точки условного экстремума?
Что такое множители Лагранжа? [V]
10. При каких условиях интеграл, зависящий от парамет-
ра, есть дифференцируемая функция? [VI]
11. Что называют: а) кратным интегралом; б) криволиней-
ным интегралом; в) поверхностным интегралом? Напиши-
те: а) формулу Грина; б) формулу Остроградского — Гаусса;
в) формулу Стокса. В каком случае значение криволинейного
интеграла не зависит от пути интегрирования? [VII]
12. Пусть дано обыкновенное дифференциальное уравне-
ние (ОДУ) га-го порядка. Что называют его: а) частным реше-
нием; б) общим решением? Как для этого уравнения ставится
задача Коши? [VIII]
13. Что такое первый интеграл системы ОДУ? Как ОДУ
/г-го порядка можно преобразовать в систему η ОДУ первого
порядка? [VIII]
14. Что называют нормальной системой ОДУ? Как для
однородной нормальной системы линейных ОДУ построить
фундаментальную систему решений? [VIII]
15. Пусть дана нормальная система ОДУ. Что называют ее:
а) решением; б) фазовой траекторией; в) интегральной кривой?
При каких условиях фазовые траектории системы не пересе-
каются? [VIII]
16. Что такое сходящийся числовой ряд? При каких услови-
ях данный функциональный ряд сходится на данном множестве
точек: а) поточечно; б) равномерно? [IX]
17. При каких условиях на периодическую функцию мож-
но утверждать, что ее ряд Фурье сходится к ней: а) в данной
точке; б) на данном промежутке? [I], [IX]
18. Дайте определение: а) банахова пространства; б) гиль-
бертова пространства. Что называют рядом Фурье элемента
гильбертова пространства? Напишите неравенство Бесселя и
равенство Парсеваля. [IX]
19. Сформулируйте задачу Штурма — Лиувилля. Найди-
те собственные значения и собственные функции оператора
Штурма — Лиувилля в случае граничных условий в виде
линейной комбинации функции и ее производной. [XI], [ХП]
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ
< и ► — начало и окончание доказательства
# — окончание примера, замечания
а е А, А в а — элемент а принадлежит множеству А (множе-
ство А содержит элемент а) 1-1.1
а £ А — элемент а не принадлежит множеству А 1-1.2
А с Б, В 2 А — подмножество А включено в множество В или
совпадает с ним 1-1.2
V — замыкание множества V в нормированном или
метрическом пространстве XIII
3V — граница множества V в нормированном или
метрическом пространстве I, XIII
N — множество натуральных чисел 1-1.2
Ш — множество действительных чисел 1-1.3
С — множество комплексных чисел 1-4.3, X
W1 — линейное арифметическое пространство IV
AJ3, \АВ\ — отрезок, соединяющий точки А и Б, и его
длина III
а, а — вектор (элемент линейного пространства) и
столбец его координат IV
|а| — длина (модуль) вектора а III, IV
|| а || — норма вектора а в нормированном простран-
стве IV
О — нулевой вектор III, IV
(а, Ь) — скалярное произведение векторов а и ЬIII, IV
Ат — матрица, транспонированная к А III
10
Основные обозначения
detA
η
Σα*
k=l
— определитель матрицы А III
— сумма η слагаемых аъ .,., ak9 .,·, ап 1-2.6
k = l>n — число k принимает последовательно все зна-
чения из множества N от 1 до η включительно
1-2.6
/(a), f(x)\x=a — значение функции f(x) в точке а 1-2.1
x(t) — вектор-функция скалярного аргумента t II
f(x) — векторная функция векторного аргумента
(функция многих переменных) V
grad f(x) — градиент скалярной функции f(x) векторного
аргумента х V
x(t), x{t) — производная вектор-функции скалярного ар-
гумента t II
> Лг> fx(x9 У) — частная производная функции f(x, у)
дх
по переменному х V
J[y] — функционал, определенный на некотором
множестве функций у(х); значение функционала
на функции (в точке) у(х) 1.2
II' 11с? II* 11с1 — нормы в нормированном пространстве С^а, Ь]
1.2
С [а, Ь] — линейное пространство кусочно-непрерывных
на отрезке [а, Ь] функций 6.5
Сп[а, Ь] — нормированное пространство функций, име-
ющих непрерывную /г-ю производную IV-1.2
Ι,2(Ω) — гильбертово пространство функций, сумми-
руемых на множестве Ω cz Rn с квадратом IX
ду, Ьу(х) — вариация аргумента функционала, значение
вариации в точке #1.2
8г/' = (5г/)' — производная от вариации 8у, если вариация
изохронна
bJ[y, by] — (первая) вариация функционала J в точке у
1.2
Основные обозначения
11
d2J[y, ду] — вторая вариация функционала J в точке у 5.2
Г[х, и] — вспомогательный функционал, соответствую-
щий функционалу 1[х, и] 7.2
H(i, х9 ρ) — функция Гамильтона 7.2, 7.3
if(\|/, х, и) — функция Понтрягина 7.2, 7.3
V — оператор Гамильтона VII
Δ — оператор Лапласа VII
D(A) и R(A) — область определения и область значений опе-
ратора А 10.2
12
Основные обозначения
Буквы латинского алфавита
Начертание
Аа Аа
Bb Bb
Cc Cc
Dd Dd
Ее Ее
Ff Ff
Gg Gg
Hh Яй
Ii /i
Jj J]
Kk tffe
LI LI
Mm Mm
Произноше-
ние
a
бэ
цэ
ДЭ
e
эф
же
аш
и
йот
ка
эль
эм
Начертание
Nn Nn
Оо Оо
Рр Рр
Qq Qq
Rr flr
Ss Ss
Tt Ti
Uu Г7и
Vv Vv
Ww Ifi^
Xx Xx
Yy Yy
Zz Z2
Произношение
эн
о
пэ
ку
эр
эс
тэ
У
вэ
дубль-вэ
икс
игрек
зэт
Буквы греческого алфавита
Начер-
тание
Аа
Ββ
Γγ
Δδ
Εε
Ζς
Ηη
Θθθ
Произно-
шение
альфа
бета
гамма
дельта
эпсилон
дзета
эта
тэта
Начер-
тание
Ii
Кк
Λλ
Μμ
Νν
Ξξ
Оо
Ππ
Произно-
шение
йота
каппа
ламбда
ми
ни
кси
омикрон
пи
Начер-
тание
Рр
Σσ
Ττ
Υυ
Φφ
Χλ
ψψ
Ωω
Произно-
шение
ρο
сигма
тау
ипсилон
фи
хи
пси
омега
Представлен наиболее употребительный (но не единствен-
ный) вариант произношения (в частности, вместо «йот» иногда
говорят «жи»).
ЧАСТЬ I
Классическое
вариационное
исчисление
Вариационное исчисление в широком смысле —
это учение об изменении функций, и в качестве
такового оно оказывается продолжением диффе-
ренциального и интегрального исчислений.
При таком понимании, например, исследо-
вания Пуанкаре о проблеме трех тел образуют
главу вариационного исчисления, поскольку в
них Пуанкаре из известных траекторий, обла-
дающих некоторым свойством, с помощью прин-
ципа варьирования получил новые траектории с
нужными свойствами.
Д. Гильберт
1. ОСНОВНЫЕ ПОНЯТИЯ
Разнообразие задач, приводящих к поиску максимума или
минимума некоторой интегральной величины, весьма ве-
лико. Это отражает мудрое высказывание великого Эйлера:
«В мире нет ничего, в чем не был бы виден смысл какого-либо
максимума или минимума».
1.1. Задачи, приводящие к вариационным
проблемам
Примеры успешного решения экстремальных проблем можно
найти уже в древней истории.
Пример 1.1 (задача Дидоны). В IX веке до н.э. финикий-
ская царевна Дидона и несколько ее спутников, спасаясь от
преследования тирской знати, бежали из г. Тира и высадились
на африканском берегу Средиземного моря. Решив поселиться
именно здесь, Дидона упросила местных жителей отдать в ее
распоряжение участок земли, который можно охватить шкурой
быка (чувствуете двусмысленность постановки вопроса?). Про-
стодушный правитель тех мест не понял всей глубины замысла
и согласился отдать беглецам участок земли, площадь кото-
рого, по его разумению, должна равняться площади расправ-
ленной шкуры быка. Дидона же после заключения соглашения
разрезала шкуру быка на тонкие полоски, связала их в длин-
ный ремень и ограничила им довольно значительную террито-
рию на берегу моря. Так был заложен город Карфаген, который
впоследствии был-таки разрушен римлянами.
Задача, которую поставила Дидона, может быть сформу-
лирована следующим образом. Найти такую кривую задан-
ной длины L (L в упомянутой выше истории — длина ремня
16
1. Основные понятия
из шкуры быка), которая ограни-
чивает на плоскости фигуру наи-
большей площади.
Формализуем задачу. Считая
берег моря прямолинейным, рас-
положим прямоугольную систему
координат Оху так, чтобы ось Ох
РИСв 1.1 совпала с берегом моря. Предпо-
ложим, что прямолинейная (мор-
ская) часть границы участка земли есть отрезок [а, Ь] оси Ox, a
криволинейная часть является графиком гладкой (т, е. непре-
рывно дифференцируемой) функции у = у(х), определенной на
отрезке [а, Ь] (рис. 1.1). При этом
у(а) = у(Ь) = 0. (1.1)
При сделанных предположениях длина L криволинейной
части границы вычисляется по формуле [VI]
ь
L = ^l + y'(x)2dx, (1.2)
а
а площадь S земельного участка — по формуле
ь
S=\y(x)dx. (1.3)
а
Итак, требуется найти такую гладкую функцию у = у(х),
которая удовлетворяет условиям (1.1)h(1.2)(L фиксировано)
и обеспечивает интегралу (1.3) максимальное значение. #
Задачи подобного рода ставили и решали (своими, ори-
гинальными способами) еще Аристотель и Архимед. Так,
Архимед установил замечательное свойство окружности: из
всех замкнутых кривых, длины которых равны некоторому
заданному значению, окружность охватывает наибольшую
площадь; из всех замкнутых кривых, которые охватывают
заданную площадь, окружность имеет наименьшую длину.
Несмотря на наличие древних прецедентов, моментом
рождения вариационного исчисления как математической
дисциплины принято считать 1696 год, когда в июньском но-
мере журнала «Acta Eruditorium» появилось письмо И. Бер-
1.1. Задачи, приводящие к вариационным проблемам
17
нулли, в котором он писал: «Остроумнейших математиков
всего мира приветствую я, Иоганн Бернулли! Людей высокого
ума нельзя ничем более привлечь к работе, как указать им
трудную и вместе с тем полезную задачу, решением которой
возможно и славу приобрести, и оставить по себе вечный па-
мятник. Я надеюсь, что заслужу благодарность ученого мира,
если я, по примеру Паскаля, Ферма и других великих, пред-
ложу лучшим математикам нашего времени задачу, которая
даст им возможность испробовать, хороши ли те методы,
которыми они владеют, и как велика сила их ума. Если кто-
нибудь найдет решение предложенной задачи и сообщит об
этом мне, то я объявлю ему публично заслуженную хвалу».
Вскоре были даны три решения задачи И. Бернулли:
первое принадлежало Якову Бернулли, второе — Лопиталю,
третье появилось в английском научном журнале без подпи-
си автора, но И. Бернулли без труда узнал в авторе Исаака
Ньютона по его «львиным когтям».
Вот задача, предложенная И. Бернулли.
Пример 1.2 (задача о брахистохроне). В вертикальной
плоскости через две данные точки О и В, не лежащие на одной
вертикали, провести кривую (т.е. найти ее уравнение), двига-
ясь по которой материальная точка под действием силы тяже-
сти переместится из верхней точки в нижнюю за минимальное
время (рис. 1.2). Ту же задачу можно сформулировать и так:
как спроектировать крышу дома, чтобы капли дождя скаты-
вались с конька крыши за наименьший промежуток времени.
Предположим, что начальная скорость падающей точки рав-
на нулю, а силы трения отсутствуют. К моменту, когда расстоя-
ние от начального положения точки О по вертикальной оси Оу
прямоугольной системы координат Оху будет равно у, точка
потеряет потенциальную энергию, которая уменьшится на mgy
(т — масса точки, g — ускорение
свободного падения). Кинетическая
энергия при этом увеличится на
mv2/2 (v — скорость точки). В силу
закона сохранения энергии (ведь
трение отсутствует) имеем
mv2
-mgy = 0,
Рис. 1.2
18
1. Основные понятия
откуда
Далее, предполагая, что траектория движения есть кривая
у = у(х), причем у(х) — гладкая функция, определенная на от-
резке [О, &], получаем
ds Jl + (y')2dx
v = — = - ,
dt dt
где ds — дифференциал длины дуги кривой; t — время. Поэ-
тому
J2gydt = jl + (y')2dx9
и мы приходим к уравнению
Из этого уравнения находим время, необходимое для перехо-
да из точки О в точку В:
Известные координаты начальной и конечной точек дают крае-
вые условия для функции у(х):
у(0) = 0, у(Ъ) = ув. (1.5)
Таким образом, нужно найти гладкую функцию у(х), для
которой t -» min при краевых условиях (1.5).
Пример 1.3 (задача о преломлении света). Согласно прин-
ципу Ферма, луч света, выходящий из точки А и попадающий
в точку JB, избирает путь, время перехода по которому явля-
ется наименьшим. В однородной среде скорость света посто-
янна, а свет распространяется по прямым. Если же среда
неоднородна, то скорость света изменяется от точки к точке,
а траектории лучей света уже не будут прямыми. Пусть средой
является атмосфера. Поскольку плотность воздуха зависит от
высоты у над уровнем моря, то правомерно предположить, что
и скорость света ν зависит от у и выражается с помощью
известной функции v(y). Определим траекторию луча света из
1.1. Задачи, приводящие к вариационным проблемам
19
данной точки А в данную точку В.
В вертикальной плоскости, про-
ходящей через точки А и В, выбе-
рем прямоугольную систему
координат так, чтобы ось Ох была
горизонтальна и расположена на
уровне моря. Нам известны коор-
динаты А (а, уА) и В (&, ув). Счи- Рис 1>3
таем, что луч света распространя-
ется по кривой, являющейся гра-
фиком гладкой функции у(х), определенной на отрезке [а, Ь]
(рис. 1.3).
При сделанных предположениях имеем
/ ч ds
где ds =*Jl + (y')2dx — дифференциал длины дуги кривой у =
= у(х). Поэтому
л ds
dt = ,
v(y)
и время, необходимое для перехода света из точки А в точку В,
выражается интегралом
J v(y)
(1.6)
Задача состоит в определении такой гладкой функции у = у(х),
удовлетворяющей условиям у(а) = уА, у{Ъ) = ув, что интеграл
(1.6) получает наименьшее значение.
Сравнив (1.6) и (1.4), отметим, что задача о брахистох-
роне — частный случай задачи о преломлении света. Этот
факт, подмеченный впервые И. Бернулли, представляет собой
так называемую оптико-механическую аналогию*.
Пример 1.4 (задача о минимальной поверхности враще-
ния). Пусть требуется в плоскости хОу соединить точки
^ (α> У а) и Б (Ь, у в) кривой так, чтобы боковая поверхность
* См.: Курант Р., Гильберт Д. (Здесь и далее в подстрочных библио-
графических ссылках указаны фамилии авторов работ, приведенных в
списке литературы в конце книги.)
20
1. Основные понятия
Рис. 1.4
тела, полученного от вращения
этой кривой вокруг оси Ох, имела
наименьшую площадь (рис. 1.4).
Предполагаем, что искомая
кривая является графиком глад-
кой функции у(х), определенной
на отрезке [а, Ь]. Вспомнив фор-
мулу для площади S боковой по-
верхности тела вращения [IV],
получим задачу
υ υ
S = 2π f yds = 2π f y,]l + (y')2dx -> min (1.7)
a a
с краевыми условиями y(a) = yA, y(b) = ув.
Пример 1.5 (задача о геодезических линиях). На поверх-
ности, заданной в прямоугольной системе координат Oxyz
уравнением (р(х, уу z) = 0, проведем кривую, соединяющую две
точки А и В этой поверхности и имеющую наименьшую длину
(рис. 1.5).
Наименьшие по длине линии между двумя точками неко-
торой поверхности являются геодезическими линиями этой
поверхности. Например, геодезическими линиями плоскости
являются прямые, геодезическими линиями на сфере — дуги
большого круга.
1.2. Основные определения
21
Предположим, что поверхность φ (х, у, г) = О является глад-
кой, а искомая кривая может быть задана уравнениями у = у(х),
2 = z(x), х е [а, &], с помощью гладких функций #(х) и 2(х).
Тогда ее длина L равна:
в ь
L=Udx2+dy2+dz2 = Ul + (y')2+(z')2dx. (1.8)
А а
Задача свелась к определению таких гладких на отрезке
[а, Ь] функций у = у(х) и z = z(x), что
(р(х, у(х), z(x)) = 09
2(x0) = z0, z(x1) = z1,
а интеграл (1.8) принимает минимальное значение. #
Оригинальность сформулированных задач в том, что неиз-
вестными в них являются функции, которые должны сделать
значение интеграла наименьшим.
1.2. Основные определения
Пусть задано некоторое множество Μ функций. Функциона-
лом J на Μ называют отображение J: Μ -> R множества Μ
в множество R действительных чисел. Функции из области
определения Μ данного функционала будем называть допус-
тимыми функциями.
Приведем некоторые типичные примеры функционалов:
• на множестве Μ всех функций, определенных на отрез-
ке [0, 1], можно задать функционал формулой J[y] = у(0);
• на множестве Μ = Сг[а9 Ь] интеграл
ь
J[y]=yi + (y')2dx,
а
представляющий собой длину кривой у = у(х), х е [а, Ь], за-
дает функционал;
22
1. Основные понятия
• на том же множестве Μ = Сх[а, Ь] можно определить
функционал с помощью формулы
ъ
\x^l + y'(x)2dx
JM = ~b
yi + y\x)2dx
а
(отношение интегралов представляет собой абсциссу центра
масс кривой у = у(х) [VI]).
Замечание 1.1. Уже по приведенным примерам видно, что
интеграл, с помощью которого задается функционал, может
быть достаточно сложным. Упрощая запись, в таких интег-
ралах в подынтегральном выражении опускают аргументы
неизвестной функции. Например, один из указанных выше
интегралов записывают следующим образом:
ь
jJl + ivYdx.
а
В дальнейшем будем придерживаться этого правила, а под-
робную запись использовать лишь в отдельных случаях, ког-
да требуется подчеркнуть характер функциональной зависи-
мости.
Область определения Μ функционала может иметь раз-
личную структуру. Предположим, что Μ — нормированное
пространство, норму произвольного элемента х в нем обозна-
чим ||х||. Если в данном нормированном пространстве рассма-
триваются разные нормы, то их будем различать добавлением
индекса, например ||х||э- Приведем примеры.
Пример 1.6. а. Банахово пространство С[а, Ь] функ-
ций f(x), непрерывных на отрезке [а, &]. Норма в этом про-
странстве определяется формулой
|4=тах|/<*)|.
[а,Ь]
1,2. Основные определения
23
б. Банахово пространство Cl[a, b] функций, непрерывно
дифференцируемых на отрезке [а, Ь]. Норму в этом простран-
стве можно определить так:
|/|cl=max{|/(x)| + |A*)l}·
в. Гильбертово пространство L2[a, b] функций, суммиру-
емых с квадратом на отрезке [а, Ь]. Нормой в этом простран-
стве является
\\f\\L2=jjf2(x)dx. #
При изучении функционалов вводят ряд понятий, аналогич-
ных соответствующим понятиям для функций: непрерывность,
дифференцируемость, экстремум и др.
Если функционал J[y] задан на линейном пространстве L и
представляет собой линейную форму (линейную функцию) на
этом пространстве, т. е. для любых уъ у2е L и любых а1? а2еЕ
J[a1y1 + a2y2} = a1J[yl\ + a2J[y2\,
то функционал называют линейным.
Пример 1.7· Функционалы
ь
Ji[y]= \y(x)dx, J2[y] = y(0)
а
линейные, а функционал
ъ
Jz[y]= j(l + y(x)fdx
а
таковым не является. #
Сложность вариационного исчисления, да и ряда других
примыкающих математических дисициплин, состоит в том,
что функции, сопоставляющие аргументу некоторое значе-
ние, сами рассматриваются как аргументы других отобра-
жений — функционалов. При этом характер зависимости,
которую функция представляет, не является существенным.
Учитывая эту сложность, мы в дальнейшем будем называть
точками функции, рассматриваемые как элементы некото-
рого множества (как правило, нормированного пространства)
24
1. Основные понятия
и как аргументы некоторого функционала. Это аналогично
тому, как мы часто называем точкой аргумент действительной
функции действительного переменного.
В нормированном пространстве можно ввести понятия
окрестности точки и непрерывности отображения [IX], кото-
рые аналогичны соответствующим понятиям для числовых
функций [I]. Так, ε-окрестностью точки у0 нормированного про-
странства N называют множество Οε (г/0) = {у G N:\\y — г/0Ц < ε)·
Если в данном нормированном пространстве рассматриваются
несколько норм, то каждой норме соответствует своя ε-окрест-
ность фиксированной точки пространства.
Рассмотрим банахово пространство С\а, &], введенное в
примере 1.6, б. Наряду с ранее указанной нормой ||· ||ci в этом
пространстве часто используют и другую норму:
\у\ = max | у(х) \.
Отметим, что с нормой ||- ||с линейное пространство Сг[ау Ь] уже
не является банаховым.
Пусть ε — положительное число. Сильной ^-окрестное-
тью функции г/о е C\af b] назовем множество функций
у е Сг[а, &], для которых
\\у- г/0 II = max | у(х)-у0(х) |< ε.
С [а,Ь]
Слабой ε-окрестностъю той же функции назовем множе-
ство функций у0 е С1[а, Ь], для которых
|у-Уо||С1 =тах{\у(х)-у0(х)\+\у\х)-уо(х)\}<£.
[а,Ь]
Из определений ясно, что функция у(х), попавшая в слабую
ε-окрестность функции Уо(х), попадает и в сильную ε-окрест-
ность этой же функции. Другими словами, слабая ε-окрестность
всегда содержится в сильной ε-окрестности.
Функционал J[y], определенный на нормированном про-
странстве М, называют непрерывным в точке у0 е М, если для
всякого числа δ > 0 существует такая ε-окрестность точки у0у что
для любой точки у из этой окрестности выполнено неравенство
В нормированном пространстве Μ функций выберем неко-
торую функцию Уо(х), и пусть у(х) — произвольная функция
1,2. Основные определения
25
из М. Разность у(х) - уо(х) = Ьу(х) называют вариацией функ-
ции уо(х). Сразу подчеркнем отличие понятия вариации от
приращения функции в точке. Приращение функции в точке х0
есть число, равное разности двух значений функции, а вариа-
ция — это функция, равная разности двух функций, рассма-
триваемых в качестве аргумента функционала* Для данного
функционала J[y] с областью определения Μ и данной функции
у е Μ будем называть вариацию Ьу этой функции допустимой
вариацией, если y + Sye M. Для дифференцируемых функций
следует различать производную вариации by* = {by) и вариацию
производной д(уг). Значением первого понятия может быть
лишь функция, являющаяся производной допустимой вариа-
ции, а значением второго — любая допустимая вариация·
Рассмотрим приращение функционала J[y], определенного
на нормированном пространстве Сг[а, Ь] в точке у, соответст-
вующее вариации (приращению аргумента) ду:
AJ[y]-J[y + by]-J[yl (1.9)
Пусть его можно представить как сумму
M[y] = J[y + Sy]-J[y] = Ji[y,Sy] + o(3y)9 (1.10)
где Ji[y, by] — функционал, линейный относительно бг/, а
о$У) — функционал, являющийся бесконечно малой величи-
ной более высокого порядка по сравнению с \\Ьу\\ при δ г/ —> 0
относительно нормы ||· ||ci в С\а, Ь], т.е.
|о(б!/)-Цо при 1ЫН0.
С1
Тогда функционал J[y] называют дифференцируемым в точ-
ке у, el линейный функционал Ji[i/, ду] — сильным диффе-
ренциалом (дифференциалом Фреше).
Понятие дифференцируемости функционалов аналогично
понятию дифференцируемости функций. Функция f(x) одного
действительного переменного дифференцируема в точке х, если
ее приращение Af(x) в этой точке можно представить в виде [II]
Af(x) = АА х + ο(Δ х),
где А не зависит от Ах, а о(Ах)/Ах -> 0 при Ах -> 0.
26
1. Основные понятия
Обратим внимание на то, что в этом представлении первое
слагаемое ААх линейно относительно приращения Ах. Коэффи-
циент А первого слагаемого представляет собой производную
f(x) функции в точке х.
Первой вариацией 5J[y, δ у] функционала J в точке у на-
зывают предел
а->о а аа
(1.11)
а=0
Этот предел представляет собой функционал, который каждой
вариации Зу (при фиксированном у) ставит в соответствие чис-
ло. Если этот функционал линеен (по 5i/), то его называют сла-
бым дифференциалом (дифференциалом Гато) в точке у.
Замечание 1.2. В вариационном исчислении часто под
первой вариацией понимают то, что мы назвали дифференци-
алом Гато. Другими словами, считают, что первая вариация
функционала линейна относительно вариации функции.
Теорема 1.1. Если функционал J[y] дифференцируем в
точке у, то его дифференциал Гато в точке у существует и
совпадает с дифференциалом Фреше.
< Выберем некоторую вариацию 8у в точке у и вычислим предел
sj[y,m=идЛу+чад-Лг]=11п/1[;/.«ЭД+°[<%1 =
сс^о α α->ο α
= lim
α->0
uJi\y*by\
α
+ 0 = Ji[i/,5i/]·
Здесь второе равенство справедливо в силу дифференцируемо-
сти J[y]y третье — в силу линейности J\ относительно 5г/. При
этом следует учесть, что
lim
α->0
о(а&у)
а
lim
α->0
о(а6у)
ш
•0 = 0,
так как при α -> 0
|ойу|| = |а|И->0.
Доказанное равенство показывает, что первая вариация
bJ[y,5y] дифференцируемого функционала представляет собой
функционал, линейный по Ьу. Поэтому, согласно определению,
1,2. Основные определения
27
этот функционал и есть дифференциал Гато, который оказался
равным дифференциалу Фреше. ►
Утверждение, обратное теореме 1.1, неверно: дифферен-
циал Гато может существовать и у недифференцируемого
функционала. Чтобы показать это, обратим внимание на сле-
дующее. Понятия дифференциала Фреше и дифференциала
Гато не связаны с конкретным видом нормированного про-
странства, и их можно рассматривать, например, в конечно-
мерном линейном арифметическом пространстве. В этом
случае функционал есть просто функция многих перемен-
ных, а дифференцируемость такого функционала совпадает
с дифференцируемостью его как функции многих перемен-
ных [V]. Первая вариация функционала в конечномерном
случае соответствует производной по направлению. Действи-
тельно, если задан функционал /: Rn —> R, то вариацией аргу-
мента х является произвольный вектор Ъх. Если этот вектор
имеет единичную норму ||5#|| = 1, то значением первой вариа-
ции функционала на этом приращении будет
, г f(x + a&x)-f(x) df
к[х, Ьх] = lim = —,
т.е. производная функции / по направлению η = Ьх. В общем
случае
on
6х
где η =
юх\\
Линейность первой вариации относительно δ* означает,
что первая вариация представляется через скалярное произ-
ведение
Α[*, δ*] = (α, δ*), (1.12)
где а — некоторый вектор. Отметим, что для дифференцируе-
мой функции / вектор а совпадает с градиентом этой функции.
Функция двух переменных
fl, *i=xf, (хъх2)*(0,0);
/(*Ъ*2)ЧЛ ρ , ч gtx м
О, Х\ФХ% ИЛИ (Хъ #2) = (0> 0)
28
1. Основные понятия
имеет производную в точке (0, 0) по любому направлению,
равную нулю, и, следовательно, имеет в этой точке дифферен-
циал Гато, так как производную по направлению можно пред-
ставить в виде (1.12), если в качестве а взять нулевой вектор.
В то же время эта функция не является непрерывной в точ-
ке (0, 0), а потому не дифференцируема в этой точке, т.е. не
имеет дифференциала Фреше.
В вариационном исчислении важнейшими являются функ-
ционалы, заданные с помощью интегралов, например:
ъ ь
J f(x, У> y')dx, j/(x, г/, г/\ ..., y{n))dx, jJ7(*, У, z'x, zy)dxdy
a a D
и т.д. Такой функционал будем называть интегральным
функционалему а подынтегральную функцию соответствую-
щего интеграла — интегрантом.
Выясним достаточные условия для существования сильно-
го и слабого дифференциалов у функционала
ъ
J[y] = jf(x,y,y')dx, (1.13)
а
заданного на нормированном пространстве С^а, Ь] с нормой
|| · ||С1. Пусть / — дважды непрерывно дифференцируемая функ-
ция трех переменных. Запишем приращение функционала на
некоторой функции у(х) е С1[а, &], соответствующее некото-
рому приращению Ъу{х) аргумента:
ь ъ
AJ = J[i/ + 5i/]- J[y] = )f(x, У + Ьу, y' + by')dx-jf(x, y9 y)dx =
υ
= J(/(*> */ + δ*/, у'+ by')-f(x, z/, y))dx.
a
Применим к подынтегральной функции формулу Тейлора:
ь i
■ у ·. ■ ν ■ ν , ν ■ у -. ■ ν ■ *, , и
а'
Ле7=J ^(х'у*у'}dy+&(*' У'у^у'
1
+^г;у(х,у+т,у+Щ^у)2+г;у'(х,у+Щ,у,+^у')^у +
1.2. Основные определения
29
LA
dx,
(1.14)
где θ ε (0, 1), вообще говоря, зависит от переменного х.
Отметим, что первые два слагаемых подынтегральной
функции в (1.14) представляют собой непрерывную функцию
переменного х. Значит, оставшиеся слагаемые в совокупности
образуют непрерывную функцию, которую можно интегриро-
вать. Оценим соответствующий интеграл*:
%ш
>\2
4VW+-/;y%')
dx\
и
*J \(H2+2\dy\py'\ + \8y'\2)jdx<2N(b-a)pyfcl =o(8y).
а
Здесь N = тах{|/;у|, \Q\, \%γ\}.
Имеем 8y'dx = (8y)'dx = d(6y), тогда, интегрируя по частям
ъ ь
]fy'(x, У, y'Wdx = ]f{,ix, у, y')d(dy) =
а а
Ъ
= (fyix, У, У')Ьу)\а - Ь-(#(*» У* У'))Ьуах>
находим, что приращение функционала можно представить
в виде
ъ
' d ^ . _
,-^ dx*^ j "
а
Ь
Δ</= | fy\x, z/, #')-—/Их' ^ yVbydx
а
+ (fyix,y,y')by)\a+o(6y),
(1.15)
т.е. как сумму функционала, линейного относительноby (пер-
вые два слагаемых) и бесконечно малой высшего порядка от-
носительно Ъу при by -> 0 (третье слагаемое). Значит, диффе-
Векторный аргумент функции / и ее производных не выходит за пре-
делы некоторого замкнутого ограниченного множества GbM3. Поэтому из
непрерывности функции f и ее производных следует их ограниченность
HaG[V].
30
1. Основные понятия
ренцируемость функционала доказана и найден его дифферен-
циал Фреше, который можно представить так:
ь
Jiiy, by] = j(ffiy + f;>by')dx, (1.16)
а
поскольку первые два слагаемых в (1.15) получены преобра-
зованием интеграла (1.16) интегрированием по частям.
Для существования дифференциала Гато достаточными
являются более слабые условия непрерывности функции / и
ее частных производных fu и f',. Действительно, вычисление
" у
первой вариации сводится к дифференцированию интеграла
по параметру:
&%»5у] = —J f(x, y + a8y,y'+aby')dx\a=Q =
а
b - Ъ
= J—f(x9 y + aby,y'+aby')dx\ = j(fyby + fy'Sy')dx.
a a
Для законности такого дифференцирования достаточно непре-
рывности подынтегральной функции и ее частной производ-
ной по параметру [VI], что обеспечивается поставленными
условиями. Полученная первая вариация является линейным
функционалом относительно 6z/, т.е. представляет собой диф-
ференциал Гато.
Говорят, что функционал J[y], определенный на линейном
пространстве Сг[а, 6], достигает сильного (слабого) минимума
на функции (в точке) у* е Сг[а, Щ (или уф доставляет соответ-
ствующий минимум функционалу J[y]), если найдется такая
сильная (слабая) ε-окрестность функции г/Дх), что для любой
функции у(х) из этой окрестности выполнено неравенство
J[y] > J[y*]. Если для любой функции из этой окрестности, от-
личной от у*(х)> указанное неравенство является строгим, то
такой минимум называют строгим. Сильный (слабый) макси-
мум вводят аналогичным образом. Сильные (слабые) максиму-
мы и минимумы объединяют под общим названием сильный
(слабый) экстремум. Функцию у*(х), доставляющую силь-
ный или слабый экстремум функционалу J[y], будем называть
точкой соответствующего экстремума функционала.
1,2. Основные определения
31
Поскольку всякая функция, принадлежащая слабой ε-окре-
стности функции i/*(x), заведомо входит в ее же сильную ε-ок-
рестность, то всякий сильный экстремум одновременно явля-
ется и слабым. Действительно, пусть у*(х) есть точка сильного
минимума функционала J[y]. Это значит, что для некоторого
ε > 0 для любой функции у(х), для которой ||у - у^ \\с < ε, выпол-
няется неравенство J[y] > J[y*]. Если ||у - у* \\ci < ε, то также и
\\у ~ #* lie < ε- Поэтому неравенство J[y] > J[y*] верно для лю-
бой функции у(х) из слабой ε-окрестности функции у*(х), т. е.
у*(х) является точкой слабого минимума для J[y].
Однако слабый экстремум функционала необязательно
является его сильным экстремумом. Это объясняется тем, что
функции, близкие по своим значениям (попадающие в силь-
ную ε-окрестность), могут иметь значительные расхождения
в производных, а это, в свою очередь, может повлиять на
значения функционала.
Рассмотрим функционал
ь
JV)2 -(yY]dx.
а
Функция f(t) = t2 -t* при t = О имеет локальный минимум,
равный нулю. Этот минимум является строгим на интервале
-1 < t < 1. Значит, если функция у{х) е С1 [а, Ь] подчиняется
неравенству \\y\\ci <1, то интегрант нашего функционала на
отрезке [а, Ь] неотрицателен, а функционал имеет неотрица-
тельное значение. Из этого следует, что функция у*(х) = О
является слабым минимумом функционала. Нетрудно, одна-
ко, придумать функцию, которая удовлетворяет условию
у\\с <ε для произвольного, наперед заданного ε > 0, но зна-
чение функционала на которой будет отрицательным (напри-
мер, можно взять у(х) = 0,5ε sin (kx), выбрав подходящий па-
раметр k). Следовательно, у^ не является сильным экстрему-
мом функционала.
Отметим, что, как правило, нахождение слабых экстрему-
мов функционала является более простой задачей по сравне-
нию с нахождением сильных экстремумов. Это объясняется,
в частности, тем, что функционалы, обычно рассматриваемые
в вариационном исчислении, непрерывны относительно «сла-
бой» нормы ||||ci пространства Сг[а, Ь], но далеко не всегда
32
1. Основные понятия
непрерывны относительно «сильной» нормы ||-||с. Таким, на-
пример, является функционал, рассмотренный выше.
Замечание 1.3· Поиск экстремумов функционала базиру-
ется, как и в случае поиска экстремумов действительной
функции действительного переменного, на различных необ-
ходимых и достаточных условиях* Из изложенного выше
вытекает, что любое необходимое условие слабого экстремума
является в то же время и необходимым условием сильного
экстремума, а любое достаточное условие сильного экстрему-
ма является достаточным условием и слабого экстремума.
Поэтому доказываемая ниже теорема для слабых экстремумов
названа необходимым условием экстремума функционала, так
как может использоваться и для слабых, и для сильных экс-
тремумов.
Теорема 1.2 (необходимое условие экстремума функцио-
нала). Если функционал (1.13) достигает слабого экстремума
во внутренней точке у*(х) своей области определения, причем
в этой точке существует дифференциал Гато, то этот диффе-
ренциал (первая вариация) в точке у*(х) обращается в нуль:
SJ[y,,5y] = 0. (1.17)
< Пусть, например, функционал J[y] на функции у*(х) дости-
гает слабого минимума. Рассмотрим функцию φ(α) = J[y+ + аду],
имея в виду, что вариация δ*/ фиксирована. Из условий тео-
ремы вытекает, что эта функция имеет экстремум в точке
a = 0. Действительно, существует такое ε > 0, что в слабой
ε-окрестности выполняется неравенство J[y]^J[y*]. Если
y = y* + v&y, то при |а|<е/|6у||с1 имеем
11у-Уо||С1 =Ца6у|1с1 =l«l IIMci <ε·
т.е. функция у(х) попадает в слабую ε-окрестность функции
у*(х). Следовательно, J[y]^.J[y*]i или φ(α)>φ(0).
Из существования дифференциала Гато функционала J[y]
в точке у* следует дифференцируемость функции φ(α) при
a = 0. В самом деле, зафиксируем произвольную вариацию Бу.
Тогда существует предел
Ψ+(α)Ια=0 = llm = &%·> Ьу\.
a->+0 a
1,3. Основные леммы вариационного исчисления
33
В силу линейности 6J[y*9 5у] no 5z/ существует и производная
»-(aU=b» а =
= lim J[U* "P5j/]" J[yJ = lim J^ +β(-δ^1-Jti/J =
β->+ο -β β-ню β
= -8J[i/,, -5z/] = 5J[z/„ 5y].
Односторонние производные совпадают. Следовательно, суще-
ствует производная φ'(0) [Π].
Так как φ(α) имеет минимум в точке a = 0 и дифференциру-
ема в этой точке, то ср'(О) = 0 (необходимое условие локального
экстремума для функции одного переменного [II])· Но это рав-
носильно тому, что 5JIJ/*, ду] = 0. Поскольку вариацию δ у мож-
но выбирать произвольно, заключаем, что дифференциал Гато
равен нулю. ►
1.3. Основные леммы вариационного
исчисления
Докажем несколько утверждений (часто называемых основ-
ными леммами вариационного исчисления), которые будем
активно использовать в дальнейшем.
Лемма 1.1 (лемма Лагранжа). Если функция f(x) непре-
рывна на отрезке [a, b] и для любой бесконечно дифференци-
руемой на [а, Ь] функции т\(х), для которой η(α) = r\(b) = 0,
выполнено равенство
ь
\f(x)r[(x)dx = 0,
а
то f(x) = 0 на [а, 6].
+ Допустим, что в некоторой точке х0 е [а, Ь] функция f(x)
отлична от нуля· Не теряя общности, мы можем предполагать,
что f(xo) > 0. Тогда в силу непрерывности функции f(x) мож-
но выбрать интервал (с, d), окружающий точку х0, х0 е (с, d)a
а [а, Ь], на котором функция f(x) положительна·
34
1. Основные понятия
Нетрудно показать, что функция
\е~х1х, л;>0;
*)=1о, *<о
имеет производную любого порядка в каждой точке числовой
оси. Поэтому функция г\(х) = (р(х-c)<p(d-x) бесконечно диф-
ференцируема и при этом отлична от нуля только в интерва-
ле (с, d). Значит,
Ъ d
\f(x)r[{x)dx= \f(x)r\(x)dx>0,
а с
так как подынтегральная функция непрерывна и положитель-
на на (с, d).
Итак, предположение, что f(x) отлична от нуля хотя бы
в одной точке, ведет к нарушению условий леммы. Следова-
тельно, если для функции f(x) выполняются условия леммы,
то f(x) = 0. ►
Замечание 1.4. а. Назначение доказанной леммы — обес-
печить достаточные условия интегрального типа, при выпол-
нении которых заданная функция обращается в нуль. Она
может формулироваться для различных классов пробных
функций г\(х). При этом чем уже класс этих функций, тем
сильнее утверждение леммы и тем проще проверка достаточ-
ных условий. Класс С°°, используемый в приведенной форму-
лировке леммы, выбран из практических соображений.
б. Доказанная лемма легко обобщается на случай функций
многих переменных. Например, в двумерном случае верно сле-
дующее утверждение. Если функция f(x9 у) двух действитель-
ных переменных непрерывна в ограниченной области G е Е2
и для любой функции ц(х9 у), бесконечно дифференцируемой
в области G, непрерывной в замыкании G = G + dG области и
равной нулю на границе dG области G, верно равенство
jj/(*, у)у\(х, y)dxdy = 0,
G
то f(Xj у) = 0 в G. Доказательство этого утверждения повторя-
ет доказательство леммы, отличаясь лишь тем, что в качестве
1.3. Основные леммы вариационного исчисления
35
пробной следует взять функцию ц(х, у) = ц> (г2 - х2- г/2), обра-
щающуюся в нуль вне круга х2- у2 = г2.
Лемма 1.2 (лемма Дюбуа-Реймона). Пусть функции f(x)
и g(x) непрерывны на отрезке [а, ft] и для любой бесконечно
дифференцируемой на [а, ft] функции г\(х), для которой η(α) =
= r|(ft) = О, выполнено равенство
ъ
\(f(x)r{(x) + g(xMx))dx = 0. (1.18)
а
Тогда функция f(x) непрерывно дифференцируема на [а, ft] и
f(x)-g(x) = 0 на [а,*?]. (1.19)
< Непрерывная функция g(x) имеет первообразную на отрезке
[a, ft], которая определяется с точностью до постоянной. Су-
ществует такая первообразная G(x) функции g(x)y что
ъ
\(f(x)-G(x))dx = Q. (1.20)
а
Действительно, если G0(x) — некоторая фиксированная перво-
образная функции g(x)y то любая первообразная G(x) может
быть представлена в виде G(x) = G0(x) + С. Подставляя это в
равенство (1.20), получаем условие на постоянную С:
ь ь
x)-G0(x))dx-icdx = 0.
а а
Отсюда находим
ь
C = -l—[{f(x)-G0(x))dx.
o-aJ
а
Итак, пусть G(x) — первообразная функции g(x), удовлет-
воряющая равенству (1.20). Тогда для любой пробной функ-
ции r\(x) е C°°[a, ft], η(α) = η(&) = 0, имеем, согласно формуле
интегрирования по частям,
/(«
36
1. Основные понятия
|£(я)г|(л:)Лс = G'(x)r|(:x;)d.r =
а а
Ъ Ь
= G(x)r\{x)\ba - \G(x)y\'(x)dx = - \G{x)tf{x)dx.
а а
Поэтому равенство (1.18) равносильно следующему:
ь
\(f(x)-G(x))r\'(x)dx = Q. (1.21)
а
Рассмотрим произвольную пробную функцию г\(х)9 удов-
летворяющую условиям леммы· Обозначим
1 "г
С« = \r\(x)dx.
η b-aJ
а
Функция
х
ςω=/(η(ξ)-^)^ξ
а
является бесконечно дифференцируемой, и при этом ξ(α) =
= ξφ) = 0. Согласно условию леммы, для такой функции вер-
но равенство (1.18) и, следовательно, равенство (1.21), т.е.
ь
\(f(x)-G(x))(;f(x)dx = 0.
а
В силу соотношения С)'(х) = г\(х)-СГ] получаем
ь ь
fo(x)-G(x))4(x)dx-C^{(f(x)-G(x))dx = 0.
а а
Следовательно, согласно (1.20),
ь
i(f(x)-G(x))j](x)dx = 0.
а
Так как пробную функцию η(^) выбирали произвольным
образом, по лемме 1.1 Лагранжа заключаем, что f(x) — G(x) = 0.
Но функция G(x) дифференцируема и G'(x) = g(x). Поэтому и
1.4. Некоторые замечания о задачах вариационного исчисления 37
функция f(x) дифференцируема и f'(x) = g(x)- Так как g(x)
непрерывна, то f(x) непрерывно дифференцируема. ►
1.4. Некоторые замечания о задачах
вариационного исчисления
Приведенные выше примеры иллюстрируют тот круг задач,
которые изучает вариационное исчисление. Можно сказать,
что задача вариационного исчисления (или просто вариаци-
онная задача) — это задача поиска экстремума функционала,
заданного на некотором множестве Μ функций, удовлетворя-
ющих определенным ограничениям. К вариационным задачам
также относят задачи поиска точек в области определения
функционала, где выполняется необходимое условие экс-
тремума функционала, т. е. первая вариация функционала
обращается в нуль (такие точки называют стационарными
точками функционала).
В вариационном исчислении трудность при нахождении
экстремума может возникнуть вследствие того, что область
определения рассматриваемого функционала не является
замкнутым множеством. В этом случае задача может не иметь
решения. Такая трудность, естественно, не исключается и в
конечномерном случае, когда необходимо найти экстремум
функции многих переменных. Но в бесконечномерном случае,
когда область определения функционала есть бесконечномер-
ное линейное пространство, условие замкнутости множества
проверить гораздо труднее. Впрочем, вариационная задача
может не иметь решения даже в том случае, когда область
определения функционала является замкнутым множеством.
В бесконечномерном нормированном пространстве не для вся-
кого замкнутого ограниченного множества можно утверждать,
что функция, непрерывная на этом множестве, ограничена и
достигает максимального и минимального значений.
Рассмотрим вариационную задачу
ь
J[y] = jyjl + ivYdx -» min
а
в классе функций, дважды непрерывно дифференцируемых на
(а, &), непрерывных на [а, &], имеющих в концевых точках а
38
1. Основные понятия
У k
и Ь нулевые значения (у(а) = у{Ъ) = 0) и вертикальную каса-
тельную (у'(а) = у'(Ъ) = ^). Это задача поиска кратчайшего
пути из точки (а, 0) в точку (&, 0) при условии, что в конце-
вых точках пути задано вертикальное направление движения.
На рис. 1.6 видно, что функцию из рассматриваемого класса
можно выбрать так, что длина ее графика будет сколь угодно
мало отличаться от длины отрез-
ка оси Ох, соединяющего точки
(а, 0) и (&, 0), который имеет на-
именыпую длину среди всех кри-
( ^- ** 1 ^ вых, соединяющих его концы.
0 а b х Однако сам отрезок является гра-
Рис· I·6 фиком функции, тождественно
равной нулю, которая не относит-
ся к множеству допустимых функций. Таким образом, функ-
ционал не достигает минимума на рассматриваемом множе-
стве функций.
В вариационном исчислении существование решения за-
дачи поиска экстремума требует отдельного доказательства, и
это составляет существенную трудность при решении многих
задач вариационного исчисления.
Как будет показано в 2, задача поиска стационарных точек
некоторого функционала сводится к решению дифференциаль-
ного уравнения или системы дифференциальных уравнений
(в зависимости от рассматриваемого функционала уравнения
могут быть как обыкновенные, так и в частных производных).
Например, вариационная задача
ъ
J[y] = \f(x* У> V)dx ->extr> У(а) = Уа> УФ) = уъ
а
при некоторых предположениях сводится к решению обык-
новенного дифференциального уравнения вида у" - φ(#, i/, у)
с дополнительными условиями у(а) = уа, у{Ъ) = ^ик после-
дующему анализу полученного решения. Задачу у" = (р(х, у, у')9
у(а) = уа, у{Ъ) = уъ в теории дифференциальных уравнений
называют краевой [VIII].
Чтобы краевая задача для ОДУ η-го порядка была правиль-
но поставлена, необходимо, чтобы количество краевых усло-
вий равнялось порядку уравнения п, так как общее решение
ОДУ га-го порядка зависит от η произвольных постоянных.
1.4· Некоторые замечания о задачах вариационного исчисления 39
Даже если задача поставлена правильно, решение может не
существовать, а если существует, то может быть не единст-
венным.
Пример 1.8. Рассмотрим краевую задачу
IV+i/ = 0, a<x<b;
t ? гм (1·22)
Общее решение дифференциального уравнения в этой за-
даче имеет вид
у(х) = С\ cos х + С2 sin х.
Краевые условия приводят к следующей системе линейных
алгебраических уравнений (СЛАУ) относительно неизвестных
постоянных С1 и С2:
[Ci cosa + C2 sina = уа;
\Ci cos b + C2 sin b = yb.
Определитель матрицы этой СЛАУ равен:
= cosasinb-cosbsina = sin(6-a).
cos a sin a
cos& sin 6
Система совместна и имеет единственное решение, если
Ъ - α Φ ηπ9 η е Ν.
Пусть b - α- π. Тогда получаем систему
\С\ cos a + C2 sin a = уа;
\Ci cos (a + π) + C2 sin (a + π) = уъ.
В силу формул приведения для тригонометрических функций
второе уравнение системы эквивалентно уравнению
-С\ cosa-C2sina = уь,
и мы видим, что решение СЛАУ существует лишь при уа - -уь.
Если это равенство верно, СЛАУ будет иметь бесконечно мно-
го решений, так как второе уравнение системы будет следовать
из первого, а первое уравнение имеет бесконечно много реше-
ний вида Ci = уасо$а + fsina, C2 = yasina - icosa, ie R.
40
1. Основные понятия
Вопросы и задачи
1.1. Найдите расстояние между функциями у\(х) = х2 и
г/2(#) = хг по норме пространства: а) С[0, 1]; б) Сх[0, 1].
1.2, Покажите, что функционал
1
[y] = j(y-y')dx,
о
определенный на Сх[0, 1] с нормой ||| 19 является непрерыв-
ным на функции Уо(х) = х3.
1.3. Покажите, что функционал
1
[y] = \(y')2dx,
о
определенный на Сг[09 1], разрывен на функции Уо(х) = 0 в
случае нормы | · | , но непрерывен на этой функции в случае
нормы II · II х.
и не*
1.4. Функционал
1
I[y] = \^l + (y')2dx,
о
определенный на С1[0, π], исследуйте на непрерывность на
функции уо(х) = 0 по норме: a) |-|L; б) ||· | г.
1.5. Покажите, что функционал
1
'[y] = jx*yll + y2dx9
о
определенный на пространстве С[0, 1], непрерывен на функции
Уо(х) = х2 по норме |-| .
1.6. Докажите, что любой линейный непрерывный функ-
ционал в нормированном пространстве является дифференци-
руемым. Запишите его дифференциал.
Вопросы и задачи
41
1.7. Докажите, что функционал
ъ
J[y] = fy2dx,
а
определенный в С[а, 6], является всюду дифференцируемым.
Запишите его дифференциал.
1.8. Проверьте, являются ли дифференцируемыми следую-
щие функционалы:
a) J[y] = у(а) в С[а, &]; б) J[y] = у(а) в Сг[а, Ь\\
в) J[y] = \у(а)\ в С[а, Ъ]; г) J[y] = ^1 + у'(а) в Сг[а, Ь].
1.9. Найдите первую вариацию функционала, определен-
ного на нормированном пространстве непрерывно дифферен-
цируемых функций:
1 1
a) I[y] = \x2jl + y2dx; б) I[y]= j(y'ey+ xy2)dx;
О -1
π Ι
в) I[y] = jysinydx; г) 1[у] = г/2(0) + j(xy + (y')2)dx.
о о
2. ВАРИАЦИОННЫЕ ЗАДАЧИ
С ФИКСИРОВАННЫМИ ГРАНИЦАМИ
2.1. Простейшая задача вариационного
исчисления
Рассмотрим задачу об экстремуме функционала
ь
J[y]=\f(x,y,y')dx, (2.1)
а
определенного на множестве функций у(х) е Сг[ау b], удовлет-
воряющих условиям
У(а) = У1,У(Ь) = у2- (2.2)
Предполагаем, что интегрант функционала f(x, у, у') — дваж-
ды непрерывно дифференцируемая функция трех перемен-
ных ♦
Сформулированную задачу называют простейшей задачей
вариационного исчисления. Именно на этой задаче отрабаты-
вались основные приемы данной дисциплины.
Первую вариацию функционала (2Л) при указанных усло-
виях на функцию /(х, у, у') можно записать в виде (1.16):
ь
bJ\y, Ьу]= \{ГуЬу + Гу<Ьу')<1х. (2.3)
а
Здесь Ъуе 0λ[α, b] и Ьуг — допустимая вариация функции у(х)
и ее производная. При этом §у\ а = 8у\ ь = 0, поскольку условия
(2.2) фиксируют значения допустимых функций на концах
отрезка и, значит, вариация функции в этих точках должна
иметь нулевое значение.
2.1. Простейшая задача вариационного исчисления
43
Теорема 2.1. Для того чтобы функция у*(х) доставляла
слабый экстремум функционалу (2.1), необходимо, чтобы она
удовлетворяла уравнению
dx y *
< Используя необходимое условие экстремума для дифферен-
цируемого функционала (см. теорему 1.2) и представление
первой вариации функционала в виде (2.3), получаем
ь
](fySy + fy'by')dx = 0.
а
Это соотношение верно для любой допустимой вариации
5г/, т. е. для функции 5z/e Сг[а, &], удовлетворяющей краевым
условиям ду(а) = ду(Ь) = 0. В частности, оно верно для любой
бесконечно дифференцируемой функции, удовлетворяющей
тем же краевым условиям. Поэтому, согласно лемме Дюбуа-
Реймона, для любого х е [а, Ь] выполняется равенство (2.4). ►
Согласно замечанию 1.3, уравнение (2.4) дает необходимое
условие и для сильного экстремума функционала (2.1). Это
уравнение называют уравнением Эйлера для функционала
(2.1), а гладкие решения этого уравнения — экстремалями
функционала. В дальнейшем для упрощения изложения мы
под экстремалью будем понимать не только функцию у(х),
являющуюся решением уравнения Эйлера, но и график этой
функции, т. е. кривую на плоскости хОуу которая описывается
уравнением у - у(х).
Поскольку условие (2.4) является необходимым, точки
экстремума функционала следует искать среди экстремалей
данного функционала. Это является обобщением ситуации для
дифференцируемых функций одного переменного, точки экс-
тремума которых находятся среди их стационарных точек [II].
Зачастую уравнение Эйлера способно дать исчерпывающий
ответ на поставленную задачу об экстремуме функционала.
Если из содержательного смысла задачи вытекает, что задача
имеет решение, а функционал имеет лишь одну экстремаль,
удовлетворяющую краевым условиям, то эта экстремаль и
будет решением задачи.
44
2. Вариационные задачи с фиксированными границами
Пример 2.1. Найдем экстремали функционала
2
J[y] = j(x(y')d-3y(y')2)dx,
о
удовлетворяющие краевым условиям у(0) = 4, i/(2) = 6.
Интегрант f(x, у, у') = х(у')г - Зу(у')2 рассматриваемого
функционала является дважды непрерывно дифференцируе-
мой функцией своих аргументов (даже бесконечно дифферен-
цируемой). Поэтому можно применить теорему 2.1. Поскольку
%=Sx(y')2-6yy', Гу=-Щ')\
уравнение Эйлера для данного функционала имеет вид бху'у"-
- буу" = О, или y"(xi/ - у) = 0. Это дифференциальное уравне-
ние второго порядка, которое распадается на два уравнения:
у" - 0 и xi/ - у = 0. Общее решение первого из них имеет вид
у = CiX + С2, а общее решение второго — у = Сх. Все функции
только второго семейства у - Сх входят в первое семейство.
Поэтому все экстремали рассматриваемого функционала име-
ют вид у = CiX + С2.
Постоянные интегрирования Сх и С2 находим из краевых
условий. Полагая х = 0 и х = 2, приходим к системе линейных
алгебраических уравнений относительно С1? С2:
<V0 + C2=4,
С2-2 + С2=6.
Из этой системы находим С^ = 1, С2= 4. Итак, поставленным
краевым условиям удовлетворяет лишь одна экстремаль рас-
сматриваемого функционала: у = х + 4. #
Предполагая, что функция у(х) является дважды диф-
ференцируемой, и используя правило дифференцирования
сложной функции, преобразуем первое слагаемое в левой ча-
сти (2.4):
^ Л/ Р» fi» / fift ft
~т~ iу ~ iy'x *ууУ + Ту'у'У m
С учетом этого запишем уравнение Эйлера (2.4) в следующей
форме:
%уУ"+%уУ' + %х-%=0·
2.1. Простейшая задача вариационного исчисления
45
Видно, что если выполняется неравенство /*у Φ 0, то урав-
нение Эйлера представляет собой ОДУ второго порядка, удов-
летворяющее теореме Коши существования и единственности
решения ОДУ. При /Jy = 0 оно уже не является уравнением
второго порядка; оно либо ОДУ первого порядка, либо алге-
браическое, т. е. не содержащее производных неизвестной
функции. Повторим, что эти умозаключения основаны на
предположении, что решения уравнения Эйлера дважды диф-
ференцируемы. Возникает вопрос: при каких условиях на
функцию / это предположение выполняется?
Теорема 2.2. Пусть у(х) — решение уравнения (2.4). Если
интегрант /(х, у, уг) имеет непрерывные частные производные
до второго порядка включительно, то во всех точках плоско-
сти хОу, в которых fy>y' Φ О, функция у(х) имеет непрерывную
вторую производную. #
Уравнение Эйлера далеко не всегда интегрируется в квад-
ратурах. Поэтому важно выявить такие случаи, когда интег-
рирование в квадратурах возможно. Рассмотрим некоторые
из них.
1. Интегрант не зависит от у\ В этом случае fy* = О и
уравнение Эйлера имеет вид fy (х9у) = О, т. е. является алге-
браическим уравнением относительно неизвестной функции
у(х). Решения этого уравнения, т. е. экстремали функционала,
могут и не удовлетворять поставленным краевым условиям.
Пример 2.2. Найдем экстремали функционала
ь
J[y]= jy3dx,
а
удовлетворяющие краевым условиям у(а) = г/1? у{Ъ) = у2-
Уравнение Эйлера Зг/2 = 0 рассматриваемого функционала
имеет единственное решение у(х) = 0. Если хотя бы одно из
чисел ух и у2 отлично от нуля, то в множестве Cl[a9 b] функ-
ционал не имеет экстремалей, удовлетворяющих поставлен-
ным краевым условиям.
2. Интегрант линейно зависит от г/. Этот случай, вклю-
чающий в себя и предыдущий, охватывает те функционалы,
46
2. Вариационные задачи с фиксированными границами
интегранты которых удовлетворяют условию f£y> = 0. Такие
функционалы называют вырожденными. Если
f(x, У у у*) = Р(х, y) + Q(x, У)у\
то уравнение Эйлера принимает вид
dQ
dx
Py-Q'yy' = 0.
dQ
Раскрывая производную по правилу дифференцирова-
dx
ния сложной функции, получаем Я'х+ЯуУ'-Ру-ЯуУ' = 0, или
Это уравнение, как и в предыдущем случае, алгебраиче-
ское. Его решения могут не удовлетворять краевым условиям.
Отметим, что если выражение Pdx + Qdy представляет собой
полный дифференциал, то уравнение Ру -Q'x = 0 является тож-
деством относительно х и у. В этом случае любая функция
у(х) е С\а, Ь] является решением уравнения Py-Qx-0 и,
следовательно, экстремалью функционала.
Пример 2.3. Найдем экстремали функционала
ь
J[y]= \(y2 + yy')dx,
удовлетворяющие краевым условиям у (а) = уъ у{Ъ) = у2-
Уравнение Эйлера -2у = 0 данного функционала имеет
единственное решение у(х) = 0. Если одно из чисел уъ у2 не-
нулевое, экстремалей, удовлетворяющих заданным краевым
условиям, нет.
3. Интегрант зависит только от у\ В этом случае он
имеет вид f(y'), а уравнение Эйлера для функционала —
Нетрудно увидеть, что это уравнение допускает понижение
порядка [VIII]: fyf =C. Мы получили алгебраическое уравне-
ние относительно у'. Все его решения можно записать в виде
y' = Ci, где Сх — произвольная постоянная. Таким образом,
2.1. Простейшая задача вариационного исчисления
47
экстремалями функционала с интегрантом рассматриваемого
типа является семейство линейных функций у = С±х + С2 с
произвольными постоянными С1 и С2.
Пример 2.4. Найдем экстремали функционала
ь
J[y]=\(y'-y'S)dx,
а
удовлетворяющие краевым условиям у (а) = уъ у{Ъ) = у2*
Так как интегрант функционала зависит только от у', то
решениями уравнения Эйлера для этой задачи являются ли-
нейные функции i/(x) = CiX + C2 (Ci и С2 — произвольные по-
стоянные). Два краевых условия позволяют выбрать единст-
венную функцию
y(x) = ^L(x-a) + yi. #
Ъ-а
4. Интегрант не зависит от у. Этот случай включает
в себя предыдущий. Интегрант имеет вид f(x, у'), а уравнение
Эйлера сводится к следующему:
dx
— fy'(x*y) = ^
и оно, как и выше, допускает понижение порядка: fy'=Ci.
Последнее уравнение есть ОДУ первого порядка или алгебра-
ическое уравнение (например, в предыдущем случае).
Пример 2.5. Найдем экстремали функционала
ъ
J[y]=\(y'2-2xy')dx,
удовлетворяющие краевым условиям у (а) = г/15 у{Ъ) = у2*
Уравнение Эйлера
-^-(2*/'+2х) = 0
ах
этого функционала после понижения порядка сводится к урав-
нению у' + х = С\. Решая его, получаем семейство экстремалей
у(х) = Сгх + С2 - х2/2. Постоянные Сх и С2 однозначно нахо-
дятся из краевых условий при любых ух и z/2.
48
2. Вариационные задачи с фиксированными границами
5. Интегрант не зависит явно от х. В этом случае он име-
ет вид Дг/,г/), а уравнение Эйлера при дополнительном предпо-
ложении, что fy'y* * О (см. теорему 2.2), сводится к следующему:
Умножив его на у', получим (проверьте самостоятельно!)
Таким образом, и в этом случае уравнение Эйлера допускает
понижение порядка:
y%-f = cx.
Пример 2.6. Найдем экстремали функционала
J[y]=\(yy'+y'2)dx.
Уравнение Эйлера после понижения порядка сведется к
уравнению первого порядка у\у + 2у') - уу' - у'2 = С, или
(г/)2 = С. Отсюда у= ±vC=Ci, и экстремалями рассматривае-
мого функционала будут линейные функции y(x) = CiX + C2-
Пример 2.7. Найдем экстремали функционала в задаче
И. Бернулли о брахистохроне (см. пример 1.2):
υ
\
.у . d*->min, i/(0) = 0, у(Ь) = ув>0.
В данном случае интегрант не зависит от х и является
дважды непрерывно дифференцируемой функцией в области
у > 0 на плоскости хОу. В этой области можно использовать
теорему 2.1, и мы заключаем, что уравнение Эйлера для рас-
сматриваемого функционала допускает понижение порядка:
2.1. Простейшая задача вариационного исчисления
49
Отсюда находим
Возведем в квадрат обе части уравнения и учтем константу 2g
в постоянной С. Тогда
у(1 + у'2) = С1>0.
Мы получили уравнение первого порядка, неразрешенное от-
носительно производной [VIII]* Его удобно решать методом введе-
ния параметра. Положим i/ = ctg\|/. Тогда 1 + г/2 = Ι/sin2 ψ и
y = 7%[ = C1sin2y. (2.5)
1 + 1Г
Мы выразили переменное у через параметр.
Равенство y' = ctg\\f означает, что dx = tg\\fdy. Подставляем
в это равенство выражение dy через <2ψ, которое получается
дифференцированием (2.5):
dx = tg\|/ Ci -28т\|/со8\|/с?\|/ = 2Q sin2 ψ^ψ.
Интегрируя, выразим переменное х через параметр:
x = Ci(2\\f-sin2\\f) + C2,
где Ci=Cx /2>0.
Заменив параметр на θ = 2ψ и объединив выражения х и
у через новый параметр, получим параметрические уравне-
ния циклоид
ijc = C1(#-sind) + C2;
U = Ci(l-cos$).
Эти уравнения описывают все экстремали функционала в об-
ласти у > 0. Посмотрим, как из всего семейства указанных функ-
ций выделить те, которые удовлетворяют краевым условиям
у(0) = 0, у{Ъ) = ув. Но при этом отметим, что точка (0, 0) не
входит в рассматриваемую область у > 0 на плоскости хОу и
выделенные функции, строго говоря, нельзя считать экстре-
малями на всем отрезке [0, Ь].
50
2. Вариационные задачи с фиксированными границами
Условие у(0) = 0 равносильно двум условиям: х(&) = 0,
Ζ/(θ) = 0. Из второго получаем θ = 2ηπ9 η е Ν, а из первого —
2nnCi + С2 =0. Подставим в параметрические уравнения вме-
сто С2 найденное выражение, тогда
х = С1((Ъ-2пп)-вт'&);
у = С1(1-со$Щ.
Заменяем параметр θ - 2ηπ = Θ и учитываем периодичность
тригонометрических функций:
'x = C1(G-sinQ);
(2.6)
у = С1(1-совв),
где Θ = 0 соответствует начальной точке х = 0, у = 0.
Остается учесть второе краевое условие:
Ъ = Cxi© -sin©);
(2.7)
yB=C1(l-cosQ).
Делим первое уравнение на второе (в предположении ув Φ 0),
избавляясь от неизвестной постоянной С\:
Θ-sin© Ъ л Л /0 оч
= — = А > 0. (2.8)
1 - cos Θ ув
Отметим, что для циклоид из рассматриваемого семейства
точки, соответствующие значениям параметра© = 2ηπ, явля-
ются точками возврата. Но экстремали не должны содержать
таких точек. Поэтому в нашем случае параметр Θ должен
меняться в пределах интервала (0, 2π). Можно показать, что
©-sin©
функция у = на этом интервале монотонно возраста-
1-cos©
ет. Значит, уравнение (2.8) на данном интервале имеет един-
ственное решение ©0. Это решение позволяет определить по-
стоянную Ci по формуле Сг = — . Найденное значение
l-cos©0
С\ выделяет из семейства экстремалей (2.6) ту единственную
экстремаль, которая удовлетворяет краевым условиям.
2.1. Простейшая задача вариационного исчисления
51
Пример 2.8. Рассмотрим вариационную задачу
1
J[y] = j(y2+y'2)dx^extr, i/(0)= 1, у(1) = е.
о
Уравнение Эйлера для функционала в поставленной задаче
имеет вид 2у"-2у = 0. Это однородное линейное дифференци-
альное уравнение с постоянными коэффициентами, решая
которое находим единственную экстремаль, удовлетворяю-
щую краевым условиям: у(х) = ех.
Убедимся, что найденная экстремаль является точкой ло-
кального экстремума функционала и тем самым дает решение
вариационной задачи. Вычислим приращение функционала в
точке у = ех для произвольной допустимой вариации ду в нор-
мированном пространстве Сг[а, Ь], которая, напомним, должна
удовлетворять условиям 6г/(0) = 6у(1) = 0:
1
AJ = J[y + 8y]-J[y]=j((y + 8y)2Hyf + ^2-y2-y,2)dx =
о
1
= feyby Hby)2+Zy'by'Hbyf)2)dx =
о
1
= \{2ехЪу + {Ъу)2 + 2exbyf + (by')2 )dx.
о
Так как
1 1
J2exby'dx = (2ехЬу)\10 - f 2exbydx,
о о
то
1
AJ = j{(8y)2+(8y')2)dx>0,
о
если \\by\\ci * 0. Значит, на функции у(х) = ех заданный функ-
ционал достигает строгого слабого минимума.
52
2. Вариационные задачи с фиксированными границами
2.2. Функционалы от нескольких функций
Пусть интегрант функционала зависит от двух функций пере-
менного х, т. е. функционал имеет вид
ь
J[yu У2] = }f(x, Уъ Уг* Уъ Уг)^ (2.9)
а
где / — дважды непрерывно дифференцируемая функция пя-
ти переменных.
В качестве области определения функционала рассмотрим
пары функций уг и у2 из класса Сг[а9 Ь], удовлетворяющие
краевым условиям
УЛ<*) = У\ъ У1(Ь) = У12, У2(а) = У2и У2(Р) = у22* (2.10)
Допустимые вариации Ьух и Ъу2 для функций yi и у2 должны
быть класса Сг[а, Ь] и удовлетворять краевым условиям 5j/x(a) =
= δ#2(α) = $Уг(Ь) = δΙ/2(^) = 0, так как допустимые функции
У\(х) и У2(х) имеют на концах отрезка [а, Ь] фиксированные
значения. Для произвольных допустимых вариаций byi и Ъу2
положим
Ф(аь а2) = J[y\ +а.\Ьуъ У2+0*2^2]·
Очевидно, что если пара функций уг и у2 доставляет экстремум
функционалу J[y\, z/2], то функция φ(α1? α2) двух переменных
имеет экстремум в точке (0, 0). В этом случае должны выпол-
няться необходимые условия экстремума:
θφ
Эах
θφ
Эа5
= 0.
al=ot2=0
Iai=ct2=0
Используя формулу Лейбница дифференцирования опре-
деленного интеграла по параметру [VI], получаем
ь
= ]{fy1byi+fyiSyi)dx = Q,
9φ
9φ
ai=a2=0
Эос 5
al=a2=0
ν
= J (4 δ#2 + fy'2 by2)dx = 0.
Эти соотношения выполняются в том числе и для произволь-
ных бесконечно дифференцируемых функций 5г/г и ду2 с нуле-
2.2. Функционалы от нескольких функций
53
выми значениями в точках а и Ь. Согласно лемме Дюбуа-Рей-
мона, получаем следующие необходимые условия экстремума
функционала:
— Г. -Г =0·
α* (2.11)
dxTn Ty2
Эти необходимые условия экстремума функционала не-
трудно обобщить на случай интегранта, зависящего от η
функций.
Теорема 2.3· Если функционал
ъ
3\.Уъ..*Уп\= y{x,yi,...,yn,y\,...,y'n)dx, (2.12)
а
где / — дважды непрерывно дифференцируемая функция,
достигает экстремума на системе функций уъ ..., уп ξ 02[α, &],
то эта система функций является решением системы диффе-
ренциальных уравнений
Любое гладкое решение системы уравнений (2.13) {систе-
мы уравнений Эйлера) называют экстремалями функцио-
нала (2.12). Как и выше, термином «экстремаль» мы будем
называть не только систему функций у\(х),..., уп(х), являющу-
юся решением системы уравнений Эйлера, но и кривую в ΜΛ+1,
которая описывается уравнениями у γ - у\{х)У ..., уп = уп(х),
т. е. график вектор-функции.
Пример 2.9. Найдем экстремали функционала
ъ
J[yi> Ы= J(2|M2 -2rf +(yi)2 -{y'2)2)dx.
а
В соответствии с теоремой 2.3 записываем систему урав-
нений Эйлера:
[2^-2^+4^=0;
-arf-ги-о. (2Д4)
54
2, Вариационные задачи с фиксированными границами
Из второго уравнения находим уг = -у2 и подставляем это
выражение для уг в первое:
У2У+2У2 + У2=0.
Это однородное линейное дифференциальное уравнение с по-
стоянными коэффициентами. Его общее решение имеет вид
у 2 (х) = С\ sin х + C2xsin x + С3 cos х + С±х cos x. (2.15)
Значит,
Ух(х) = -(Ci + C4)sin x + (2С2 - C3)cosjc -
~C2xsinx-C4Lxcosx. (2.16)
Соотношения (2Л5) и (2.16) описывают все экстремали
рассматриваемого функционала.
2.3. Функционалы с производными
высшего порядка
Пусть функция /(х, у, у\ у"у ..., #(я)) непрерывно дифференци-
руема 72 + 2 раза. Рассмотрим функционал
J№= \f(x, У> У\ У\ -, y{n))dx (2.17)
α
на множестве функций у(х)еСп[а,Ь], удовлетворяющих крае-
вым условиям
[у(<*) = у109 у'(а) = у1и ..., yin-1)(a) = yi9n-il
У(Ь) = у20, у'(Ъ) = у21, ..., У(л"1)(Ь) = у2>й-1·
В этом случае допустимой вариацией является любая
функция by е Сл[а, 6], удовлетворяющая однородным крае-
вым условиям
[δ0(α) = Ο, δρ'(α) = 0, ..., δ^η-«(α) = 0;
[бг/(&) = 0, 5г/,(&) = 0, ..., δ^Λ-1>(&) = 0.
Пусть функция у(х) доставляет экстремум функционалу
J[y]. Выбрав произвольно допустимую вариацию δ у и зафик-
сировав ее, рассмотрим функцию
2.3. Функционалы с производными высшего порядка
55
<p(a) = J[y + ady] =
ь
= ]/(*> У + <*δΙ/, у' + аЪу\ у" + αδ/,..., z/(n) + a5i/(/z))dx.
Здесь Ъу(к) -(Ъу)^— k-я производная вариации Ьу.
Функция φ(α) в точке a = 0 имеет экстремум, и поскольку она
дифференцируема в этой точке, то φ'(α)= 0 при a = О [II]. Но
d \
Φ'(α) = -Γ- /(^^ + αδ^^4αδ^,Ι/4αδ/,...,1/^+αδΙ/^>)^,
da J
а
где частные производные функции / под интегралом справа
вычисляются в точке
(х, у(х) + а&у(х)9 у'(х) + а&у'(х)9..., ум(х) + ссЬу(п)(х)).
Поэтому
φΧΟ)=|(/^ + ^ (2.20)
Здесь частные производные функции / вычисляются в точке
(х, у(х), у'(х)9 у\х\ ..., у(п)(х)).
Предположим, что у(х)е С2п[а9Ь]. Тогда, используя интег-
рирование по частям и краевые условия, получаем
-л
dxh
jfySy'dx = -J
а а
bydx.
2 Л
3ydx,
J/^.V> <** = (-!)" J ^
bydx.
56
2, Вариационные задачи с фиксированными границами
Подставляем эти соотношения в (2.20):
N
\§ydx = 0.
*-ε*+^«-+-+(-1)"^·
Данное равенство верно, в частности, для любой бесконечно
дифференцируемой функции Ъу{х) с нулевыми значениями на
концах отрезка [а, Ь\. Поэтому, согласно лемме Лагранжа,
откуда, меняя порядок слагаемых, получаем
+(-i)^/;+/;=o. (2.21)
Уравнение (2.21) называют уравнением Эйлера—Пуассона,
а его 2п раз непрерывно дифференцируемые решения — экс-
тремалями функционала J[y].
Итак, доказано следующее утверждение·
Теорема 2.4. Если функционал J[y] вида (2.17), определен-
ный на множестве функций из Сп[а,Ь], удовлетворяющих
краевым условиям (2.18), достигает экстремума на некоторой
функции у(х) е Сп[а,Ь], то эта функция является экстремалью
функционала J[y].
Замечание 2.1. Теорема 2.4 в частном случае η = 1 отлича-
ется от доказанной ранее теоремы 2.1 тем, что на функцию
у(х), на которой функционал достигает экстремума, наклады-
вается дополнительное требование гладкости у(х) е С2[а,Ь].
Ослабления требований в теореме 2.1 удается достичь с помо-
щью леммы Дюбуа-Реймона, которая в доказательстве тео-
ремы 2.4 не используется.
Пример 2.10. Найдем экстремали функционала
ь
J[y]=\((ym)2+y2-2yx3)dx.
2.4. Функционалы от функций многих переменных
57
Запишем уравнение Эйлера — Пуассона:
-2ущ+2у-2хг=0.
Это неоднородное линейное дифференциальное уравнение с
постоянными коэффициентами и специальной правой частью
[VIII]. Решая его, получим
у(х) = xz +Ciex +C2e~x +(C3ex/2 +Cte-x/2)cos — х +
+ (C5ex/2+C6e-x/2)sin^x.
Li
Каждая функция этого семейства является экстремалью дан-
ного функционала.
2.4. Функционалы от функций
многих переменных
Перейдем к обсуждению функционалов, определенных на
множествах функций многих переменных. Рассмотрим, на-
пример, множество Μ функций z(x, у) от двух переменных,
которые дважды непрерывно дифференцируемы в некоторой
области G cz R2. Исследуем задачу об экстремуме функционала
J[z\=\\f(x,y,z,zx,zy)dxdy, (2.22)
D
где D — область, удовлетворяющая условию (D \JdD) czG; f —
дважды непрерывно дифференцируемая функция своих аргу-
ментов·
В качестве области определения этого функционала возь-
мем подмножество тех функций из М, которые на границе
области D имеют заданное значение:
*(*»У)|эл=Ф(*'У)· (2·23)
Допустимыми вариациями в этом случае будут функции
8z(x,y) e C2(G), обращающиеся в нуль на границе 3D области D.
Как и для функционала (2.1), необходимое условие экстре-
мума можно записать в форме
3J[z,dz] = 0. (2.24)
58
2. Вариационные задачи с фиксированными границами
В данном случае первая вариация
δ J[zf 6z] = — J[z + abz] I
θα 'a=0
функционала записывается в форме
δJ[z,Sz] = Jj [fzbz + fpbp + /ff'5g) dx dyy
D
где рид обозначают соответственно zx ж zy. Так как
ТО
{{(№ + /J5g)dxdz/ =
z>
■ Ж £йМ+£№*)>**- Jj(S+f H*·
5y
Используя формулу Грина
dD
D
dxdy,
получаем
jj\^(f'pbz)+y(ffiz)\dxdy= jbz(f'pdy-%dx) = 0,
D ^ У J dD
так как 8z = О на границе 3D области Z) в силу фиксированных
значений функции z(x,y). Значит,
^(fpbp + fqbq)dxdy = -^\γ- + γ- \tedxdy,
дх ду
D D
и необходимое условие экстремума принимает вид
flf*-S-f >■**-*
D
дх ду J
2,5. Канонический вид уравнений Эйлера
59
Поскольку первый сомножитель под знаком интеграла
непрерывен, а вариация произвольна, то, согласно замеча-
нию 1.4, функция z(x, у) является решением дифференциаль-
ного уравнения в частных производных
^- + ^-/;=0, (2.25)
ох ду
которое называют уравнением Остроградского, а любое глад-
кое решение этого уравнения — экстремалью функциона-
ла (2.22).
Пример 2.11. Напишем уравнение Остроградского для функ-
ционала Дирихле
J[z] = U\((z'x)2+(z'y)2)dxdy.
2
D
В этом случае f(x, у, 2,р, q)=p2 + q2. Поэтому f'p=2p = 2zx,
fq =2q = 2z'y, f2 = 0, и мы приходим к уравнению Лапласа
д2г д2г
дх2+ду2
Таким образом, экстремалями функционала Дирихле явля-
ются гармонические в области D функции [XII].
2.5. Канонический вид уравнений Эйлера
Функционалу
ъ
J[y]=lf(x,y,y')dx9 (2.26)
а
где у(х) = (i/i(#),..., уп(х)) — гладкая вектор-функция, а функ-
ция / дважды непрерывно дифференцируема, отвечает систе-
ма уравнений Эйлера
A/£-yj|=of ; = 1Я (2.27)
ах
Эта система, вообще говоря, представляет собой систему ОДУ
второго порядка. Такую систему можно свести к системе ОДУ
первого порядка введением дополнительных переменных
zi=Ui> i = 1, и. Тогда fy' = fz , и мы получаем следующую си-
60
2. Вариационные задачи с фиксированными границами
стему 2л уравнений первого порядка, эквивалентную исход-
ной системе (2.27):
d ,,
а* (2.28)
dyt
dx
= zi9 i = l, n.
Эта система ОДУ не является нормальной, и поэтому с ней
неудобно работать. Пусть
A=ft, « = l,n. (2.29)
Определитель матрицы Гессе (матрицы частных производных
второго порядка) интегранта f по переменным у\ совпадает
с якобианом
Р{Ръ-'->Рп)
Если этот определитель отличен от нуля, то, согласно теоре-
ме об обратной функции [V], система уравнений Pi=fy.9
i = 1, η, определяет совокупность старых переменных у\ как
функцию новых pt:
у\ = ht(x, y9 p)y i = l, п. (2.30)
Рассмотрим функцию
η
Щх, У, p) = ~f(x, У, Цх, уу р)) + ^М*> У, p)Pi, (2.31)
i=l
где h = (hi, ..., hn). Эту функцию называют функцией Гамиль-
тона данного функционала (2.26), а переменные д:, у, jp, свя-
занные со старыми переменными х, у, у* соотношениями (2.29)
или (2.30), — каноническими переменными данного функ-
ционала.
Из определения функции Гамильтона следует, что
η η
(Ш. = -df + ^ Pidy't + ^ y'idPi =
П 71 П П
i=l i=l /i=l л=1
2.5. Канонический вид уравнений Эйлера
61
В силу равенств (2.29) третье и четвертое слагаемые в правой
части равенства (2.32) взаимно уничтожаются. Поэтому
η η
dH=-&dx-Yf;idyi+^y'idPi· <2·33)
Значит, для частных производных функции Гамильтона по ее
переменным х, у, ρ справедливы следующие равенства:
Н* = -f'x > Н^. = -fy., Н'Р| = у\.
Отсюда fy. =-H'yi9 y\ = Н^,. Так как, согласно введенным обо-
значениям, fz. = fy<. - Pi и гх-уь из системы ОДУ (2.28) полу-
чаем следующую нормальную систему ОДУ, эквивалентную
системе уравнений Эйлера (2.27):
dyt
dx
dpi
_ЭН
Эр**
__эн
i = l, п;
i = 1, п.
(2.34)
-. i = 1. п.
dx dyt
Систему (2.34) называют канонической формой уравнений
Эйлера функционала (2.26).
Как известно, первым интегралом системы ОДУ называют
функцию, сохраняющую постоянное значение вдоль каждой
интегральной кривой этой системы. Для того чтобы данная
гладкая функция была первым интегралом системы ОДУ,
необходимо и достаточно, чтобы полная производная этой
функции в силу системы ОДУ тождественно равнялась нулю
[VIII]. В некоторых частных случаях можно указать первые
интегралы системы (2.34), а значит, и системы (2.28).
Пусть интегрант / = f(y, у') не зависит от х явно. Тогда и
функция Гамильтона не зависит от х явно. Значит,
M^JMl + YhJEL, (2.35)
dx 4-f " dx ^i p' dx
так как = 0. Подставляя выражения для производных Н'
dx Уг
и Н^. из системы (2.34) в соотношение (2.35), получим, что
dVL/dx = 0. Значит, вдоль каждой экстремали Η постоянна.
62
2. Вариационные задачи с фиксированными границами
Таким образом, если интегрант явно не зависит от независи-
мого переменного х, то функция Гамильтона является первым
интегралом системы уравнений Эйлера.
Замечание 2.2. В общем случае верно тождество
dx дх
где слева стоит полная производная функции Гамильтона в
силу системы (2.34).
Теперь поставим вопрос о том, при каких условиях данная
функция Ф(у,р), не зависящая явно от ху является первым
интегралом системы (2.34). Вычислим полную производную
функции Φ по х в силу системы (2.34):
^=Σ^%+φ',.^=ΣΚ,Η'.-φ'.^)·
dx ^i\ dx Fl dx
Выражение
[Ф.Н] = £(Ф^-Ф'ЙН'Й)
i=l
называют скобкой Пуассона функций Φ и Η. Таким образом,
= [Ф,Н],
dx
и мы доказали следующее утверждение.
Теорема 2.5. Дифференцируемая функция Ф(у,р) явля-
ется первым интегралом системы (2.34) тогда и только тогда,
когда [Ф, Н] = 0.
2.6. Инвариантность формы представления
уравнения Эйлера
Введем полезное понятие о вариационной производной. Рас-
смотрим некоторый функционал J[y], определенный на требу-
емом (структурой интегранта) множестве функций у(х), х е
[а, Ь\\ допустимую вариацию Ъу{х) считаем отличной от нуля
2.6. Инвариантность формы представления уравнения Эйлера 63
лишь в окрестности некоторой
точки а<х0<Ь (рис. 2.1).
Приращение функционала
в точке у(х):
M[y] = J[y+by]-J[y].
Обозначим через AS площадь,
ограниченную кривыми у(х),
у = у(х) + 5z/(x), и вычислим
У\
А
1
А
AS
Ах
I
JB
1 W
U Xq
Рис. 2.1
b х
v AJ
lim —.
as->o AS
Определение 2.1. Если вычисляемый предел существует,
то его называют вариационной производной функционала
J[y] в точке х = х0.
В литературе принято обозначение
.. AJ Ы\
lim = —|
as^o AS 5z/
X=XQ
Выведена замечательная формула:
by y dx y
где J[y]= y(x,y,y')dx.
Таким образом, левая часть уравнения Эйлера является ва-
риационной производной функционала J[y] на отрезке xg [α, b].
Теперь необходимое условие экстремума функционала мож-
но сформулировать аналогично теореме Ферма: если дифферен-
цируемый функционал достигает в точке у*(х) своего экстре-
мума, то вариационная производная в этой точке равна нулю:
δ»
= 0.
у=у*
Замечание 2.3. Из определения вариационной производной
очевидно: если 5i/(x) отлична от нуля в некоторой окрестности
точки х = х0 и ограничивает площадь AS, то
64
2. Вариационные задачи с фиксированными границами
bJ = J\y + by]-J\y] =
6J_
ьу
+ ε
X=XQ J
AS,
здесь ε -» О при |5г/(л;)| -» О, Δ#-»0.
Пусть на плоскости хОу введены криволинейные коорди-
наты (в общем случае) по формулам
\x-x(u,v)
\y = y(u,v)
D =
Уи yv
*0
в рассматриваемой области изменения переменных. Это зна-
чит, что кривой у = у(х) на плоскости хОу взаимно-однознач-
но соответствует кривая ν = v(u) на плоскости uOv.
При замене переменных (x,y)—>(u,v) преобразуется и
функционал
ъ
J[y] = )f(x,y,y')dx = Jt[v] =
а
β ( ' 'Л р
= 1)\x(u,v),y(u,v), V»+Vf \(x'u+x'vv')du= k(u,v,v')du,
J \ x„+ x„v J J
так как
У =
dy = y'udu + y'vdv = y'u+y'vv'
dx x'„du + x',,dv
"' U "' 1) ^
Докажем следующее утверждение.
Утверждение 2.1. Если у*(х)ехОу является экстремалью
функционала J[y], то соответствующая ей (в результате пре-
образования координат) функция v = v*(u)guOv является
экстремалью функционала J\[v], т.е. v = v*(u) удовлетворяет
уравнению Эйлера для функционала «/i[u]:
—fio'-fL· -0·
du
< Площади, ограниченные кривыми у*(х) иу*(х) + ду(х)
(в плоскости хОу) и соответствующими кривыми ν* (и) и
ν*(υ) + δν(η) (в плоскости uOv)> обозначим AS и Δσ.
2.6. Инвариантность формы представления уравнения Эйлера 65
Предел отношения этих площадей при \Ьу\ —»0, Ах —> 0 ра-
вен модулю якобиана:
lim—= LD|*0.
Δ*->0
Поэтому (из условия обращения вариационной производ-
ной в нуль на экстремалях) имеем:
lim — = 0 => lim —— = 0;
AS->oAS Δ£->οΔσ|£>|
в новых переменных:
lim—-^ = 0 => —i = /li;-—/ll/=o.
Δσ->ο Δσ ου du
Следовательно, свойство кривой «быть или не быть» экс-
тремалью функционала не зависит от выбора системы коорди-
нат, в которых решается задача. ►
Пример 2.12. Найти экстремаль функционала
Ψ1
J[r(q>)]= Nr2+r'2d(p;
Фо
Заметим, что подынтегральное выражение есть дифферен-
циальный элемент дуги
dS = jr2+r'2dq>,
поэтому в декартовой системе координат
dS=^]dx2+dy2 =,]l + y'2dx =>
ь
=> J[r(9)] = J1[y(x)] = J>/l + ^2^
a
y(*) = Vi> у{Ъ) = у2.
66
2. Вариационные задачи с фиксированными границами
Так как интегрант функционала Ji[y] явно от х не зави-
сит, выписываем первый интеграл уравнения Эйлера:
f-y%>=C => С^1 + у'2=1 =>
Используя формулы связи декартовой системы координат
с полярной, получим
rsin(p = C1rcos(p + C2.
Постоянные С\ и С2 находим в силу краевых условий:
\Сгг0 coscpo +C2=r0 sin(p0,
С^Го cos ср! + С2 = r0 sin φΧ.
Таким образом, при замене переменных в преобразованной
краевой задаче нет необходимости вычислять новые пределы
интегрирования и новые краевые условия. Вернувшись к «ста-
рым» переменным, для определения постоянных интегриро-
вания используем «старые» краевые условия.
Пример 2.13. Найдем экстремаль функционала
ь
|V*2+y2Vw2d*.
а
Исходя из инвариантности уравнения Эйлера, переходим
к полярным координатам (г, φ):
ΦΙ
«%WiH = JVVr2 + r'2 αφ.
φο
Интегрант преобразованного функционала явно от φ не
зависит. Запишем первый интеграл уравнения Эйлера:
2.7. Простейшая задача в параметрической форме
67
Отсюда
1 С
— arccos—|- = φ + β (С2=р) =>r2cos (2(р+р) = С1в
Возвращаясь к декартовым координатам, учитывая, что
У „;,
/
X
У) У ,„iM х
φ = arctg—, sin arctg— = , =, cos arctg— =
*J V^+7' ^ *J >Ι**+ν2
получим
x2 cos β - 2xy sin β -i/2 cos β = C1.
2.7. Простейшая задача в параметрической
форме
В приведенных ранее задачах искомое решение представлялось
в виде у = у(х). При этом мы должны ограничивать рассмотре-
ние простыми кривыми: прямые, параллельные оси Оу, пере-
секают искомую кривую у = у(х) только в одной точке.
Это ограничение существенно сужает круг рассматривае-
мых задач· Кроме того, при задании кривой в виде у = у(х)
координаты х и у неравноправны и поэтому получаемые
формулы несимметричны относительно х и у.
Переходим к параметрическому заданию кривых:
* = <№)> г/ = ψ(0·
Известно, что одна и та же геометрическая кривая допу-
скает бесчисленное множество параметрических представле-
ний, получаемых посредством преобразования параметра £:
t = %(T) => Χ = φ[%(τ)] = φ1(τ)9 у = ψ[Χ(τ)] = ψ!(τ).
При этом
ατ dt dx dt
Для взаимно-однозначной связи между параметрами t
и τ достаточно, чтобы функция %(т) была монотонной·
68
2. Вариационные задачи с фиксированными границами
Пусть %(τ) возрастает, тогда при возрастании параметров t
и τ обход дуги кривой происходит в одном и том же направ-
лении. Считаем, что %(т) имеет непрерывную положитель-
ную производную — = %'(т)>0, чтобы существовала непре-
dx
рывная производная обратной функции —= , .
dt % (τ)
Рассмотрим функционал простейшей задачи
ь
J = y{xJy,y')dx.
После введения параметра t имеем:
h (
J = \f\x(t)9y(t),j-
xdt.
Интегрант xf
to
{ УЛ
x,y>-
есть функция однородная первой сте-
пени относительно х, z/, так как, умножив на k > О, получим:
Ш\ х, У, т^
I kx
= kxf
( УЛ
\х* У> -
I X
Обратно, пусть дан функционал, взятый вдоль некоторой
кривой γ:
J = jf(x,y,x,y)dt.
γ
Если можно принять за параметр х, то
* = i, у=~г =>Кх>у*х>у) = Кх>уЛ>у') =
dx
ь
= f(x,y,y') => jf(x,y9x,y)dt = jf(x,y9y')dx.
γ α
Таким образом, интегралы \f(x9y9x,y)dt при специальном
У
ъ
выборе параметра х = t переходят в интегралы f(x,y,yr) dx,
изученные ранее.
2.7. Простейшая задача в параметрической форме
69
ь
С другой стороны, вводя в интегралы f[xyy,y)dx пара-
а
метрическое представление кривой, получаем функционалы,
для интегрантов которых выполняется условие однородности.
Из этого условия в силу теоремы Эйлера об однородных функ-
циях (первой степени относительно х, у) имеем:
Дифференцируем это равенство по ху затем — по у:
Τх — Тх "*" %Тхх + У Тух > Ту = %Тху +Ту + У Ту у ^
\xfL+yf!!x=o>
[xf*y+yf!y=0·
В силу равенства смешанных производных (/(·) — дважды
непрерывно дифференцируемая) получим
№
±* _ xfxx _ УТуУ .
/ух . . =^
у х
=> 5*. = -fk=%Ls-Fl. (2.36)
Τ ху хг
Итак, если интегрант f(x,y,y) удовлетворяет условию од-
нородности, то функционал
ъ
J{y]=\f(x,y>y')dx
а
зависит только от вида кривой и не зависит от выбора ее па-
раметрического представления.
Распространяем теорию, развитую для функционалов, вы-
числяемых на отрезке [а, &],
и
J'
ь
f(x,y,y)dx
а
на функционалы от кривых.
Говорят, что кривые, заданные в виде
\х = x(t)
\y = y(th
70
2. Вариационные задачи с фиксированными границами
принадлежат множеству Ci[t0,ti], если x(t)9 y(t)eCi; при
этом считаем, что x2(t) + y2(t)*0 на отрезке [*ο> *iL т. е. в
каждой точке кривой определена касательная (угол с осью Ох
(p = arctg—; φ = —, если х = 0).
х 2
Кривая ух находится в слабой окрестности кривой γ, если
между точками этих кривых установлено взаимно-однознач-
ное соответствие так, чтобы
1) расстояния между соответствующими точками не пре-
восходили некоторого ε > 0;
2) углы между касательными, проведенными в соответст-
вующих точках, различались не более, чем на ε >0.
Далее распространяем понятия «слабый и сильный экстре-
мумы» на функционалы от кривых:
J = jf(x,y,x,y)dt (t0<t<ti).
γ
Ставим задачу — найти экстремум функционала на глад-
ких кривых, соединяющих две заданные точки на плоско-
сти хОу:
J = f(x>y>x>y)dt —> extr.
γ
Итак, доказана следующая теорема.
Теорема 2.6. Если кривая, заданная параметрически х = :c(i),
У = y(t)9 доставляет функционалу Ji[y] экстремум, то
1) #(£), y(t) удовлетворяют системе уравнений Эйлера
\A-f.-f' =о-
\dt (2.37)
Wy ty '
2) краевыми условиями для системы (2.37) являются усло-
вия прохождения экстремалей системы через заданные точки:
t = tQ => x(t0) = xQ, y(tQ) = yQ;
t = t1 => x(ti) = xl9 y(h) = y1.
Однако уравнения (2.37) не являются независимыми.
2.7. Простейшая задача в параметрической форме
71
Действительно, если для кривой x = x(t), y = y(t) имеем
5J[y] = 0,
то для Yi: x = x[(p(i)]> г/ = Ζ/[φ(*)] (f-xp(f)) также 5J[yi] = 0, по-
скольку определенный интеграл инвариантен относительно
замены переменной.
Таким образом, если кривая γ — экстремаль системы (2.37),
то yi также является экстремалью (2.37) в силу инвариантно-
сти уравнения Эйлера. Отсюда следует, что одну из функций —
x(t) или y(t) — можно задать произвольно, после чего другую
определить, интегрируя любое уравнение системы (2.37).
Итак, рассматриваем функционалы с интегрантами
f(x,y,x9y), однородными первой степени относительно х и
у. По теореме Эйлера для однородных функций:
f = xfx+yfir
Отсюда, дифференцируя по х, затем по у, получим
| IX ~ %Тхх + У Тух 9
[Ту = %Тху + УТуу *
Учитывая полученные соотношения, запишем подробные
выражения уравнений Эйлера (2.37):
1)/;~й=(*/**+у5х)-(*^г+уй+^*+ад)=
= У\
У
= У
Цх-йу-ху^-хуЩ
ν Ух У
=> fx—r:u=if(f!x-fiy-Fi(xy-xy)) = 0
в силу равенств (2.36);
2) fy-j-J^-xiflx-Uy-F^xy-xyj)^.
72
2. Вариационные задачи с фиксированными границами
Из этих двух представлений, вследствие того что x(t) и
y(t) одновременно в нуль не обращаются, имеем уравнение
Эйлера в форме Вейерштрасса:
%y-%y-F1(xy-xy) = 0. (2.38)
Отсюда получим формулу для кривизны искомой экстремали.
Действительно, при параметрическом задании плоской кривой
х = x(t)y у = y(t) кривизна вычисляется по формуле
d\ arctg —
_ 1 _ αφ _ { х_
к = _ = ^_^ j_ yx-xy
R dS Jdx2+dy2 [x2+y2f2'
Из (2.38) имеем также
yx xy- - => к- —-—— -3^. {<£.d\J)
*i H F^+y2)
Продемонстрируем приложения полученной формулы Вей-
ерштрасса (2.39).
Пример 2.14, Пусть интегрант функционала имеет вид:
f{x, г/, х, у) = А(х9 у)^х2+у2.
Очевидно, что /(·) — однородная первой степени относи-
тельно х, у у дважды дифференцируемая функция.
Тогда соответствующий функционал
J = I A(x,y)\Jx2 + y2 dt= ГА(х,у) dS.
У У
Отметим, что подобный вид имеют функционалы в задачах
Ферма (траектория луча света) и И. Бернулли (брахистохрона)·
Это обстоятельство — аналогию между принципами Ферма
(оптика) и Мопертюи (механика) — сформулировал и исполь-
зовал Гамильтон для построения своей системы уравнений
механики.
Считаем А(х,у) положительной непрерывно дифференци-
руемой функцией.
2.7. Простейшая задача в параметрической форме
73
Имеем:
f(.) = A(x,y)^x2+y2 => ГХу=К У ^sinoc,
V* +y
где a — угол между касательной к экстремали и осью Ох;
f" - A'
/ух ΛΖ/
X
у1*2+У2
= Ay cos a;
I xv
X
V*2+*/2
Axy
,3/2 #
(х2+у2У
Получим из (2.36) выражение функции i\(x,i/,i:,z/):
fly _ А(х,у)
*У (*2 + t/2)3/2
к = — = (A' cos a - A' sin a).
R AK y }
(2.40)
Рассмотрим линии уровня поверхности z =A(x,y) (рис. 2.2).
Имеем:
ал дА
gradA = —η,
δη
где η — единичная нормаль к ли-
нии уровня; УI
(p = Z(w,Ox) =>
дА дА . дА .
=^> —п = —cosqw +—smcp-y;
дп дп дп
с другой стороны,
Μ
- л дА. дА . О i
gradA =—* +—у.
дх ду
gradA
Рис. 2.2
74
2. Вариационные задачи с фиксированными границами
Следовательно,
л' дА , дА .
А,=— coscp, Ay= — sin<p.
Тогда из (2.40) получим:
Д А
дА . θΑ . )
—smcpcosa coscpsma =
дя дп )
1 дА ( д Л
sin(a-(p) = —In A sin(a-(p). (2.41)
А дп \дп )
Согласно принципу Ферма, траекторией луча света явля-
ются экстремали функционала
i
dS
v(x,y)
γ
где v(x,y) — скорость света в оптически плотной среде.
Здесь v{xyy)- , поэтому из (2.41) получим выраже-
А(х,у)
ние для кривизны траектории луча света:
( д λ
к= —lnu sin((p-a). (2.42)
Vdn J
Если оптическая среда однородна и изотропна, то скорость
света — постоянная величина и0. Тогда из (2.42) получим
к = 0, т. е. траектории световых лучей — прямые, исходящие
из источника света.
Пример 2,15. Найти экстремали функционала
h
J[y]= iyx2+y2+a2(xy-yx)^dt.
to
Нетрудно заметить, что интегрант является однородной
функцией первого порядка относительно х, у.
Воспользуемся вейерштрассовой формой уравнения Эй-
лера и вычислим радиус кривизны возможной экстремали
(см. (2.39)):
2.7. Простейшая задача в параметрической форме
75
;|=te-«»)Ai(*wr.
Поскольку
ху
получим 1/R = 2a2, т. е. экстремали есть либо дуги окружно-
стей с фиксированными концами, либо полные окружности,
если x(t0) = xfa), y(t0) = y(tx).
В некоторых случаях независимости функционала от пред-
ставления кривой полезно перейти к виду у = у(х).
Пример 2.16. Найти экстремаль функционала
(1,2)
J[y]= \ * ~ ~ dt.
(0,0)
у2-3е^х2
, dy
Обозначим у = —— и преобразуем подынтегральное выра-
ах
жение:
<^2_зе/«*л2
dt
Kdt;
d* eta
dt
1
=>«%]=|(^2-8β^Χ; i/(0) = 0, i/(l) = 2.
о
Для преобразованного функционала запишем уравнение
Эйлера:
-^-(2у'-геУ') = 2у"-ЗеУ'у" = у"(2-ВеУ') = 0 =>
2 2
=> у = С1х-\-С2 или i/ = 1п— => г/ = In—x + C.
а а
Второе решение не позволит удовлетворить граничным
условиям.
Первое решение дает: у = 2х.
76
2. Вариационные задачи с фиксированными границами
Пример 2.17. Функционал задан в виде
(1.0)
J[y]= J Шх2 + у2 +xyjdt;
(-1.0)
x = x(t), y = y(t), i0<i<ii; α>0.
Найти экстремали, проходящие через точки А (-1, 0), Б (1, 0)
6 ΧΟΥ.
1. Решим задачу в представлении Вейерштрасса:
f* -f
ху /ух
Fi(x2+y2)
3/2
После несложных вычислений получим:
&=Ъ/г*=0;Л=-^г =
IX
-ху
а
[J*^¥]
— = а — искомые экс-
тремали — окружности, радиусы которых г = 1/а.
Так как окружности проходят через точки А(-1,0), В(1,0),
их центры располагаются на оси Оу.
2, Будем искать экстремаль в виде у = у(х):
Шх2+у2 + xy\dt = (ay]l + y'2 + y\dx
J[y}=\ lajl + y'2 +y\dx -» extr,
?(-!) = 0; i/(l) = 0.
Первый интеграл запишем в виде:
y%'-f = C1^l + y'2 =
а
(С. +y)
2 У ~
Сг+у
(х + С2)2+{у + С1)2=а.
2.8, Принцип Гамильтона. Интеграл энергии
77
Используем граничные условия:
[»<-!) = О
\У0) = 0
(-1 + C2)2+Ci=a2
2
С2=0, Сг=±\1а2-1 => x2+(z/±Va2-l) = a
2
2
Таким образом, в качестве экстремалей получили окруж-
ности радиуса а, центры которых лежат на оси Оу.
2.8. Принцип Гамильтона. Интеграл энергии
Продемонстрируем некоторые приложения принципа Гамиль-
тона к задачам механики.
Рассмотрим систему материальных точек с массами т^
т2, ··♦, тп и координатами хь yh zi9 i = l9n. Предполагаем от-
сутствие каких-либо связей, наложенных на точки системы.
Кинетическая энергия такой системы равна
где xityitZi — производные по времени t.
Систему сил, действующих на точки ти считаем потенци-
альной, т. е. существует такая дифференцируемая (пусть дваж-
ды) функция координат U(xly уъ гъ х2, у2, г2, .··, хп, уп> z„),
что компоненты силы, действующей на i-ю точку, выражаются
в виде частных производных по соответствующим координатам:
ди ди ди
J\. i — * I i — 9 ZJi — .
oXt dyt dZi
Потенциальной энергией назовем функцию координат то-
чек (xi7 yi9 Zi), равную потенциалу системы, взятому с обрат-
ным знаком:
Π = -17.
Введем в рассмотрение функцию Лагранжа
L = T + U = T-Il9
78
2. Вариационные задачи с фиксированными границами
т. е. функция Лагранжа есть дважды дифференцируемая
функция от скоростей и координат материальных точек ме-
ханической системы.
Пусть система совершает движение за фиксированное вре-
мя (ti -t0) из начального состояния A(xi0, yi0, zi0) в фиксиро-
ванное состояние В(ха, уа, za).
Определение 2.2. Действием по Гамильтону называют
функционал
h h
S=fLdt = ((T + U)dt.
to to
Система из состояния A(t0) в состояние B(fi) может пе-
рейти по любой дуге АВе Ж3п — кинематически возможной
траектории (т. е. согласной с наложенными связями, если они
имеются).
Сформулируем принцип Гамильтона (1834 г.): истинное
движение системы между двумя заданными конфигурациями
А и В отличается от кинематически возможных движений,
совершаемых за одно и то же время (^ -t0), тем, что на истин-
ной траектории действие по Гамильтону стационарно:
h
dS = b((T + U)dt = 0.
to
Таким образом, вариация функционала S равна нулю на
действительной траектории.
Замечание 2.4. Можно привести многочисленные приме-
ры, когда стационарность функционала S означает минимум
действия по Гамильтону на действительной траектории.
Поэтому в литературе принцип Гамильтона часто называют
принципом наименьшего действия.
Итак, постулируем принцип Гамильтона и ставим задачу
вариационного исчисления:
Г h
\S(x,y,z) = f(T + £/)di->extr,
< *о
\t = ti: xyy9z = x1,yl9z1.
2.8, Принцип Гамильтона. Интеграл энергии
79
Выписываем систему уравнений Эйлера:
— (Т + Ц)'ь-(Т + и)'Х1=0;
А.
dt
d
(Г + СО;4-(Г + £0'Л=0;
(2.43)
^-(Т + иУь ~(Т + иУг. = 0, г = 1,п.
Учитывая структуру каждой из функций Ги(7:
T = T(xi,yi,zi), U = U(xi,yi,zi),
из системы (2.43) получим:
—miXi-U^ = 0;
at
— τηω{ -U' = 0;
dt Vl
d
dt l l 2l
В силу связи компонент действующих сил с потенциалом U
окончательно можно записать уравнения Ньютона движения
системы η свободных материальных точек:
mixi=Xi9 тгу1=Уи 171^= Zt.
Принцип Гамильтона справедлив и в том случае, когда
на систему наложены голономные связи (даже в отсутствие
потенциала действующих сил). Тогда допустимые траекто-
рии S должны быть кинематически возможными, и принцип
стационарного действия приводит к вариационной задаче на
условный экстремум.
Продолжим рассмотрение системы η свободных точек:
T = T(xi9yiy2i)9 U = U(xi9yi92t).
Как показано ранее, уравнения движения являются след-
ствием принципа Гамильтона как необходимые условия экс-
тремума функционала
*1 i\
\(T + U)dt = fLdt.
to
to
80
2. Вариационные задачи с фиксированными границами
Вводим канонические переменные:
i dL . t . t .
Px=-r— = mXi> Py=myi9 р2=тгь.
Здесь plX9 ply, pl2 представляют собой компоненты количества
движения /-й материальной точки — импульсы.
Функция Гамильтона для интегранта функционала S
η
Я = ^(х^+у1Р1+2^)-Ь = 2Т-Т-и = Т + П
есть полная механическая энергия системы·
Пусть система консервативна, т. е. ее функция Лагранжа
не зависит явно от времени (от независимого переменного).
В этом случае Η = const вдоль действительной траектории
(экстремали), т. е. полная механическая энергия консерватив-
ной системы остается постоянной величиной при эволюциях
механической системы.
Замечание 2.5. Принцип был изложен Гамильтоном в рабо-
тах 1834-1835 годов для случая стационарных связей. Неза-
висимо от Гамильтона и в более общей форме (нестационарные
связи) принцип сформулирован в 1849 году М.В. Остроград-
ским. Поэтому в литературе этот принцип часто называют
принципом Гамильтона — Остроградского.
Вопросы и задачи
2.1, Найдите все экстремали функционала Ду], удовлетво-
ряющие заданным краевым условиям:
π/2 ,
a) I[y]= J ((yf-y2)dx9 у(0) = 0, у\^
= 1;
о
1
б) I[y] = \{(y'f + 12xy)dx, i/(0) = 0, у(1) = 1;
о
2π
в) I[y]= \[±(y'f-lyy'-y2)dx, y(n) = 0, у(2п) = 0;
Вопросы и задачи
81
π/8
г) Д«/]= J (l6y2 +{yf +2y{sm2x + 16x))dx, i/(0) = 0,
4f
\
8:
π/2
I
π/4
71/zl
Д) Д*/] = j (з#У+cosi/+i/'(2x3i/-*sinz/))<fa:, i/
= 0,
У
'π}
v2y
= 1;
е) /[y] = J(^(i/,)4+2i/(i//)3)^, i/(2)=l, y(4)=5;
2
1
ж) J[i/] = J((i/')2-^V-2^)iix, i/(0) = 0, y<X) = -h
1
3) ВД = jtgy'dx, i/(0) = 0, i/(l) = 2;
о
1
и) ^yl = ji(/)2+j^W У(0) = 0, i/(l) = -2.
/\2 , 2X1/
OV J
2.2. Среди плоских кривых, соединяющих две точки (хъ уг)
и (х2, 1/2)9 найдите ту, которая при вращении вокруг оси Ох
образует поверхность наименьшей площади (см. пример 1.4).
2.3. Покажите, что функционал
ь
' [у]=){р(х)у + q(x)y+Η*)) dx,
гдер(х) е Сх[а, &], #(х), r(x) е С[а, 6], не имеет экстремумов.
2.4. Покажите, что для всякого дифференциального урав-
нения у"-φ(Χ, г/, у) с дважды непрерывно дифференцируе-
мой правой частью (р(х, у, у') можно найти такую функцию
82
2. Вариационные задачи с фиксированными границами
f(x, у, у'), что решения этого уравнения* будут экстремалями
ь
функционала f(x, у, y')dx.
а
2.5. Найдите функции yi(x)7 У2(х) е Сг[а9 &], на которых
может достигаться экстремум функционала при данных крае-
вых условиях:
π/2
а) 1\У1,У2]= j (УхУг-УхУъ)^ i/i(0) = 0, уг(п/2) = 1,
о
i/2(0) = 0, y2(n/2) = -l;
з
б) ^[i/i, 2/2 ] = J (^ (i/i )2 (2/2 )2 + ^2/ii/2)^^» i/i(l) = 1,
1
У1(3) = 1пЗ + 1, у20) = 0, у2(3) = 0;
π/2
в) 1[УиУ2]= I [{y'i)2 +(У2)2 +3y!y2)dx, j/i(0) = 0,
о
У1(я/2) = 1, у2(0) = 0, 1/2(π/2) = -1;
π/4
г) Дг/1,г/2]= J(2yi-4rf+(^2)2-(yi)2)dxf i/i(0) = 0,
о
Ι/1(π/4) = 1, ifi(0) = 0, 1/2(π/4) = 1;
1
Д) I[yi,y2] = j({yif +(У2)2 +2yi)dX> ^(0) = 1,
о
i/1(l) = 3/2, i/2(0) = l, у2(1) = 1;
3
е) ^ti/i,i/2] = J(^(i/i)2+(i/2)2+^i/ii/2)^ 1/1 (2) = In3,
2
i/1(3) = ln3, z/2(2) = ln2, i/2(3) = 0.
* См. Н.Н. Ахиезер.
Вопросы и задачи 83
2.6. Найдите все экстремали функционала, удовлетворяю-
щие данным краевым условиям:
1
а) I[y] = j(120xy-y")dx, i/(0) = 0, y(l) = h y'(0) = 0,
о
*/'(!) = 6;
π/2
б) I[y]= J ((y")2-y2 + x2)dx, i/(0) = 1, */(π/2) = 0,
о
у'(0) = 0, у'(п/2) = -1;
ъ
в)ВД=/((Л2+(Я2)^> */(0)=o> №=о, уЩ = о,
о
У\Ъ) = 0;
1
г) I[y] = j({y")2+y2-2yx2)dx, i/(0) = 0, j/(l) = 1,
о
уЩ = 0, у'(1) = 1;
1
д) 1[у] = |(( Л2 " (Л2 )<Ь, У(0) = /(0) = О,
о
1/(1) = /(1) = sh 1, уЩ = 1, i/'(l) = ch 1;
1
е) I[y] = \{ymf dx, i/(0) = уХО) = у*(0) = 0, 1/(1) = 1,
О
у'(1) = 4, /(1) = 12;
π
ж) 1[у] = 1({у")2 -(yf)dx, у(0) = уЩ = уЩ = О,
о
У (я) = у\ъ) = sh π, у\п) = ch π+1 ♦
84
2, Вариационные задачи с фиксированными границами
2.7. Напишите уравнение Остроградского для следующих
функционалов:
a)JM = JJ
Эх)
2 i^l
dxdy, D с
б) J[«]=JJJ
θωΛ
дх
2 Г^Л2
+
Эй
+
[dzj
+ 2uf(x,y,z)
dxdydz,
Dc
2.8. Пусть функции Ф(х,у,р) и Щх,у,р) таковы, что
Φ* Φ О, Н'д. Φ 0. Докажите, что если Η — функция Гамильтона
вариационной задачи, то вдоль любой интегральной кривой
системы уравнений Эйлера выполняется равенство
аФ _дФ
dx дх
+ [Ф,Н].
2.9. Имеет ли смысл вариационная задача:
ь
J[y] = \(у2 + 2xy')dx -» extr;
а
у{о) = уъ У(Ъ) = у2?
2.10. Дан функционал
ь
J[y]= y(x,y,y')dx^>extr; у(а) = уъ уф) =
У2-
Покажите, что если добавить к интегранту полный диф-
ференциал любой дифференцируемой функции и = и(х,у), то
уравнение Эйлера не изменится.
2.11. Найдите экстремали функционала
ь
J[y]= jyx2+y2 +a2(xy-xy)^
dt.
Вопросы и задачи
85
2.12. Найдите экстремали функционала
J х
(0,0)
перейдя к представлению кривой в виде у = у(х).
2.13. Докажите, что функционал
1
J[y]=j(x2 + y4)dx, уеС[0,1]
о
достигает на у(х) = 0 строгого минимума.
3. ВАРИАЦИОННЫЕ ЗАДАЧИ
С ПОДВИЖНЫМИ ГРАНИЦАМИ
Наряду с рассмотренными вариационными задачами, в кото-
рых допустимые функции были определены на фиксирован-
ном отрезке [а, ft], причем концевые точки А(а, уА) и B(ft, ув)
графика функции были закреплены, часто необходимо решать
и иные задачи, в которых экстремум функционала, заданного
интегралом, ищем среди функций, определенных на разных
промежутках, причем значения этих функций на концах
промежутка не являются фиксированными. Для таких задач
можно использовать ранее полученные результаты (см. 2).
3.1. Задача с подвижными концами
Рассмотрим задачу об экстремуме функционала
ь
J[y] = jf(x,y,y')dx, (3.1)
а
областью определения которого является класс функций
С1[а, ft]. Она отличается от задач, рассмотренных ранее, тем,
что на допустимые функции нет ограничений в виде краевых
условий. С геометрической точки зрения такая задача состоит
в определении кривой, являющейся
графиком функции, концы которой }
расположены на вертикальных пря-
мых х = а, х = ft (рис. ЗЛ) и для ко-
торой соответствующее значение
функционала является экстремаль-
ным. Такого рода задачу будем назы-
вать вариационной задачей с под-
вижными концами. Рис. 3.1
3.1. Задача с подвижными концами
87
Будем считать, что интегрант рассматриваемого функци-
онала — дважды непрерывно дифференцируемая функция.
Отметим, что допустимой вариацией в данном случае явля-
ется любая функция Ьу(х) е Сх[а, Ъ\. Как и выше, используя
формулу Тейлора, убеждаемся, что первая вариация функ-
ционала (3.1) может быть представлена следующим образом
(см. (2.3)):
ь
bJly,by] = \(ffiy + fy<by')dx. (3.2)
а
Если функция у(х) доставляет экстремум функционалу J[i/],
то первая вариация функционала на этой функции равна нулю
(см. теорему 1.2). Значит, для любой функции 6у е Сх[а, Ь]
ь
j(ffiy + ffty')dx = 0. (3.3)
а
Отметим, что это равенство верно в том числе и для бесконеч-
но дифференцируемых функций с нулевыми значениями на
концах отрезка [а, Ь]. Значит, согласно лемме Дюбуа-Реймона,
функция у(х) является решением уравнения Эйлера
in-n-O, (3.4)
т. е. является экстремалью рассматриваемого функционала.
Однако условие (3.3) в задаче с подвижными концами
сильнее условий леммы Дюбуа-Реймона и позволяет полу-
чить дополнительные необходимые условия на функцию,
доставляющую экстремум функционалу. Если функционал
J[y] не является вырожденным, т. е. его интегрант удовлет-
воряет условию fy'y> Φθ9 то, согласно теореме 2.2, экстремаль
является дважды непрерывно дифференцируемой функцией.
В этом случае в силу правила интегрирования по частям
Ь ( η \
^[у.ы-Шу—Гу \dydx+f;sy\ba =
а ^ '
Ъ ( λ
= J" 4'~Ъ W<** + #UМ*)-#|*-«Ыа)' (3·5)
а ^ ^
88
3. Вариационные задачи с подвижными границами
Интеграл в правой части (3.5) на экстремали обращается
в нуль. Поэтому если у(х) доставляет экстремум функциона-
лу J[y], то
fy\x=bby(b)-fy\x=aby{a) = 0. (3.6)
Поскольку Ьу(а) и Ьу(Ъ) в рассматриваемой задаче могут
меняться совершенно независимо, заключаем, что последнее
равенство равносильно следующим двум;
у \х=Ь у \х=а
Итак, точки экстремума функционала J[y] в задаче с
подвижными концами удовлетворяют уравнению Эйлера (3.4)
и, кроме того, двум дополнительным условиям (3.7), которые
называют естественными краевыми условиями. Чтобы
найти эти точки, нужно среди решений уравнения Эйлера
(экстремалей функционала) выделить те, которые удовлетво-
ряют естественным краевым условиям.
Для функционала вида (3.1) можно поставить и «сме-
шанную» задачу, в которой, например, левый конец графи-
ка решения — точка А(а, уА) — является фиксированным,
а правый конец свободно перемещается вдоль прямой х = Ь.
В этом случае есть одно краевое условие, сужающее множе-
ство допустимых функций. Допустимая вариация должна
удовлетворять условию Ьу(а) = 0, так как все допустимые
функции имеют одинаковое значение при х - а. В равенстве
(3.6) обнуляется одно слагаемое, и это равенство сводится к
первому условию (3.7). Значит, среди экстремалей следует
искать такие функции у(х), которые удовлетворяют краевым
условиям
У(а) = Ул, fy'\x=b=0· (3·8>
Пример 3.1. Найдем экстремали функционала в следующей
вариационной задаче с правым подвижным концом:
π/4
J[y]= \ ((У)2-У2 + 4г/cosx)dx^>extr, y(0) = 0.
о
Данная постановка задачи означает, что среди экстрема-
лей функционала нужно выделить те, которые удовлетворяют
3.1. Задача с подвижными концами
89
поставленному краевому условию на левом конце и естествен-
ному краевому условию на правом конце.
Уравнение Эйлера рассматриваемого функционала имеет
вид у+у = 2cosx. Его общее решение можно записать так:
y = Ci cos x + С2 sin x + x sin x.
Из краевого условия на левом конце находим Сх = 0. На
правом конце естественное краевое условие имеет вид
(V)U4=o,
или у'(п/4) = 0. Используя его, определяем постоянную С2:
π
С2 =-1—· Таким образом, поставленным условиям удовлет-
4
воряет единственная экстремаль функционала
smx.
Пример 3.2. Найдем в вертикальной плоскости хОу кри-
вую, скатываясь по которой без трения, тяжелая точка достиг-
нет данной вертикальной прямой за кратчайшее время. Пред-
полагаем, что начальное положе-
ние точки — начало координат,
а вертикальная прямая задается
уравнением х = Ъ (рис. 3.2).
Эту задачу можно трактовать
как модификацию задачи о брахи-
стохроне (см. пример 2.7). Отличие
состоит в том, что правый конец
искомой кривой пересекает пря-
мую х = Ъ в некоторой, заранее не
известной точке.
Экстремалями рассматриваемого функционала является
семейство циклоид (см. (2.6)):
Рис. 3.2
x = C1(G-sinQ);
y = Ci(l-cos0),
где значение 0 = 0 параметра соответствует начальной точ-
ке х - 0, у - 0.
90
3. Вариационные задачи с подвижными границами
Чтобы определить С1? воспользуемся вторым краевым
условием (3.8):
г, = у
у1*=ь V^/i+iiO
= 0.
x=b
Отсюда находим, что у'(Ъ) = 0, т. е. правый конец искомой
кривой пересекает вертикальную прямую под прямым углом·
Так как, согласно правилу дифференцирования функции,
заданной параметрически [II],
, = /в = С! sin Θ ^0
х'е C^l-cos©)
а параметр Θ может меняться лишь в пределах интервала
(0, 2π), то либо Θ = 0, либо Θ = π. Первое значение соответст-
вует левому концу графика функции, поэтому для правого
конца Θ = π. Из условия лс(0) = Ь получаем CiU = b, откуда
Ci=b/n. Таким образом, необходимым условиям экстремума
функционала удовлетворяет единственная функция, имеющая
параметрическое представление:
х = — (6-sin9);
у = — (l-cos0).
Как и в примере 2.7, мы пока не можем утверждать, что най-
денная функция действительно доставляет рассматриваемому
функционалу наименьшее значение, т. е. движение по цикло-
иде происходит за наименьшее время.
3.2, Задача с подвижными границами
Задача с подвижными концами, рассмотренная выше, легко
обобщается. Действительно, если вернуться на геометриче-
скую точку зрения, то легко сформулировать вариационную
задачу, в которой концы графика функции лежат не на вер-
тикальных прямых, а на произвольных кривых или вообще
не подчиняются каким-либо ограничениям, т. е. являются
3.2. Задача с подвижными границами
91
свободными. Особенность подобных задач состоит в том, что
область определения допустимых функций не фиксирована
и меняется от функции к функции. Такие задачи мы объе-
диним общим названием: вариационные задачи с подвиж-
ными границами.
Как корректно сформулировать задачу, если функционал
ь
J[y] = lf(x,y,y')dx, (3.9)
а
порождаемый дважды непрерывно дифференцируемой функ-
цией /, рассматривается на множестве функций у(х) с разны-
ми областями определения [а, 6]? Отметим следующее. Если
функция у(х) непрерывно дифференцируема на отрезке [а, 6],
причем в концевых точках существуют односторонние произ-
водные, то эту функцию можно продолжить на больший от-
резок [а0, Ь0] так, что построенная функция у(х) будет непре-
рывно дифференцируемой на отрезке [а0, Ь0]. Учитывая это,
можно сформулировать задачу следующим образом: найти
экстремум функционала
υ
J[y,a,b] = j f(x, у, у) dx
на классе функций Сг[а0, b0] и при значениях параметров а0 <
< а < Ъ < Ь0·
Нам удалось сформулировать вариационную задачу так,
что областью определения функционала, как и ранее, являет-
ся линейное пространство. Однако это пространство не явля-
ется нормированным, так как «естественная» норма простран-
ства С\а$, Ь0] не отражает действительную степень близости
функций, включая и концевые точки. Близость функций в
данном случае можно задать при помощи расстояния. Для
произвольных функций у(х) и у(х) с концевыми точками
А (а, у(а))9 В (6, у{Ъ)) и А(а9у(а)), B(b,y(b)) положим
р(у, у) = max (\у(х) - у(х) \ + \у(х) - у'(х)\) +1 АЛ\
τ
где Τ = [а,Ь]Π [а, Ь] (рис. 3.3).
+
вв
92
3. Вариационные задачи с подвижными границами
5у(Ь) β Окрестностью функции у(х) с
концевыми точками (а, у(а)),
(&, у(Ь)) в данном случае является
множество функций у(х) с конце-
выми точками (а9у(а))9 (b9y(b)),
I j j I ! ^ удовлетворяющих неравенству
О а а Ъ b х р(у,у) < ε, где ε > 0.
Рис. 3.3 Несмотря на то что поставлен-
ная задача не вписывается в рам-
ки теоремы 1.2 и мы не можем
напрямую использовать введенные ранее понятия дифферен-
циала Фреше или дифференциала Гато, основная схема по-
лучения необходимых условий экстремума функционала
применима и в этом случае. Приращение функционала будет
зависеть не только от вариации функции ду = у-у, но и от
вариаций подвижных границ Ъа-а-а и $b = b-b. Отметим,
что если by, δα, 5b — тройка допустимых вариаций для функ-
ционала J[y,α,ft], то существует такое достаточно малое число
σ > 0, что при |α| < σ тройка вариаций αδΙ/, αδα, αδ& является
допустимой. Следовательно, для фиксированной тройки
5z/, δα, 8b в окрестности точки α = 0 определена функция
φ(α) = J [у + абг/, а + αδα, Ъ + аЪЪ\.
Если функция у(х) является точкой экстремума функционала
J[y,ayb], то функция φ(α) будет иметь экстремум при α = 0.
Если при этом функция φ(α) дифференцируема в точке α = 0,
то, согласно необходимому условию экстремума для функции
одного переменного, выполняется равенство (р'(а) = 0.
Применим изложенную схему к функционалу J[y,a,b]
конкретного вида (3.9), предполагая, что интегрант / функ-
ционала — дважды непрерывно дифференцируемая функ-
ция. Пусть функция у(х) с концевыми точками (а, г/(а)),
(i>, y(b)) доставляет экстремум функционалу J[y,a,b]. Запишем
функцию φ(α), задавшись некоторыми вариациями ду, δα, δ&:
ф(ос) = f(x9 у + осбг/, yf+aby') dx.
α+αδα
Дифференцирование функции φ(α) — это дифференцирование
интеграла по параметру, причем в данном случае от параметра
3.2. Задача с подвижными границами
93
зависят и пределы интегрирования. При сделанных предпо-
ложениях относительно интегранта функционала такое диф-
ференцирование возможно, и мы имеем [VI]:
Ь+аЬЬ
φ'(α)= Г — f(x,y + abyyy'+aby')dx +
J Эос
α+αδα
+ f(x,y + абу, у'+абу) \ b+abb bb-f(x,y + a6y,y'+a&y') | α+αδβ δα,
где у = у(х), Ьу = Ьу(х).
Значит,
ъ
φ'(0)=|(4'δΙ/+/;ν)^+
а
+ Пх,У>У')\х=ьЬЪ-Г(х,у,у')\х=аЬа. (ЗЛО)
Первое слагаемое в (3.10) справа преобразуем, как и ранее
(см. 3.1), с помощью интегрирования по частям:
ь ь
j{f?y + f^y')dx = jU-^fy' \bydx + f;>by\ba. (3.11)
а а ^ '
Далее, полагая 8yb = y(b + bb)-y(b), находим
ЬУЬ=У(Ъ + ЬЪ)-У(Ь) + У(Ъ)-У(Ъ)~
~ у\Ъ)ЪЪ + Ьу(Ь) ~ у\Ъ)ЪЪ + 5у(Ъ).
Проведя аналогичные рассуждения для левого конца и вы-
полнив в (3.11) соответствующие замены, из (ЗЛО) получаем
V'(0) = ](fy-^f^ydx + f;]x=bbyb +
+ V-№Ubb-fv'La δ^ -^-4V)|Χ=β δα. (3.12)
Получили формулу, в которую вариации Зу9 δα, Ъуа9 ЬЬ,
Ъуъ входят линейно. Как и в случае задач с фиксированными
концами, величину bJ[y, 6у9 δα, Ъуа9 ЪЬ, Ьуь] = φ'(0) назовем
вариацией функционала J[y>a>b] в задаче с подвижными гра-
ницами. Формула (3.12) вариации функционала как частные
случаи содержит:
94
3. Вариационные задачи с подвижными границами
• формулу для первой вариации функционала в вариаци-
онной задаче с подвижными концами — при δα = db = 0;
• формулу для первой вариации функционала в простей-
шей задаче вариационного исчисления — при Ъуа = Ъуъ = Ьа =
= ЬЬ = 0.
По аналогии с выводом формулы (ЗЛ2) можно получить
вывод формулы в более общем случае функционала, завися-
щего от нескольких функций, определенных на общем под-
вижном отрезке [а, Ь]:
υ
J[y] = jf(x,y,y')dx,
(3.13)
где i/ = (г/1,1/2» ···>*/„)£ С1[а,Ъ\, а функция f(x,y,y') дважды не-
прерывно дифференцируема.
В этом случае для вариации функционала имеем
6J[y,byM,bya,Sb,byb]= Ι 2,\fyi—T-1'u \^yidx + 2li&yb,i +
i /=Λ ax J i=i
(
It/
i=l
Λ
δα. (3.14)
\x=b *=1 V *=1 J\x=a
Рассмотрим еще одну задачу. Пусть функционал J[y]
определен на гладких функциях, концы графиков которых
лежат на двух фиксированных кривых у = (р(х) и у = \|/(х),
определенных на [а0, Ь0] (рис. 3.4). Пример вариационной за-
дачи с такой областью определения функционала дает задача
вычисления расстояния между двумя кривыми.
Если некоторая функция у(х)
доставляет экстремум функцио-
налу J[y], то она является точкой
экстремума среди всех функций,
графики которых имеют с графи-
ком у(х) общие концевые точки.
Значит, указанная функция у{х)
удовлетворяет уравнению Эйлера,
т. е. является экстремалью рассма-
Рис. 3.4 триваемого функционала. Следо-
ψ(*)
3.2. Задача с подвижными границами
95
вательно, в общей формуле (3.12) для вариации функционала
первое слагаемое равно нулю. Поэтому в данном случае необ-
ходимое условие экстремума принимает вид
#U fa+(f-fy'y) \х=ъ ьъ-Гу>\х=а Ьуа -(/-4V) \х=а δα = о.
Поскольку концы графиков допустимых функций лежат
на фиксированных кривых, то
Ьуъ = ¥(Ь)ЬЬ, Ьуа = φ'(α)δα.
Поэтому
bJ[y, 8у, δα, m = (f + {¥-y')fy')\x=b8b-
-(f + W-y')0x__Ja = O.
В силу независимости вариаций δα и δ&
(f + W-y')fy')\x=b =0, {f + (4>'-y%')\x=a =0, (3.15)
что дает краевые условия в данной задаче.
Краевые условия (3.15) называют условиями трансвер-
сальности. О кривой у = у(х), удовлетворяющей условиям
трансверсальности (3.15), говорят, что она трансверсальна
кривым у = (р(х) и у = \\f(x).
Пример 3.3. Выясним геометрический смысл условий
трансверсальности для часто встречающихся в приложениях
функционалов вида
ь
J[y] = JA(x,y)^l + (y')2dx, (3.16)
а
гдеА(х, у) — дважды непрерывно дифференцируемая функция
(см. примеры 1.1-1.5). Пусть этот функционал исследуется
на экстремум в классе гладких функций, концы графиков
которых лежат на кривых у = (р(х) и у = \|/(х), где функции ср(х)
и \|/(х) непрерывно дифференцируемы, А(х,у) * 0.
В данном случае f(x, г/, у) = А(х, y)yjl + (у)2 и
&=А(х9у) У- —У—
Щ& и»')2'
96
3. Вариационные задачи с подвижными границами
Поэтому (см. (3.15)):
f+fHv'-v') = f+
fy' W-y')= , А (i+yY)=o=
^/wj
^Чу!1
(ЗЛ7)
=> l + i/ψ =0.
Аналогично получим 1 + г/'ср' = 0.
Видим, что для функционалов данного типа условия тран-
сверсальности выражаются особенно просто: у\Ъ) = -1/ψ'(&) в
точке b и у' (α) = -1/φ'(α) в точке а.
Таким образом, условия трансверсальности экстремалей
рассматриваемого функционала к кривым у = φ(κ) и у = \|/(лс)
в данной задаче с подвижными границами есть условия их
ортогональности этим кривым.
3.3. Экстремали с угловыми точками
В вариационном исчислении есть задачи, в которых область
определения функционала не может ограничиваться классом
Сг[а, Ь]. Из самой постановки задачи может вытекать, что
функция, доставляющая экстремум функционалу, в некото-
рых точках теряет дифференцируемость, и если она и имеет
односторонние производные в такой точке, то эти производ-
ные различаются. К таким задачам относятся задачи на отра-
жение и преломление экстремалей, являющиеся обобщением
задач на отражение и преломление световых лучей.
Задача об отражении экстремалей. Эта задача ставится
следующим образом. Найти кривую у = у(х) (рис. 3.5), которая
соединяет фиксированные точки А (а, уА) и В (&, ув) и имеет од-
ну угловую точку С(с, ус), расположенную на кривой у = φ(#),
причем функция у(х) доставляет экстремум функционалу
ь
J[y] = )f(x,y,y')dx.
У\
В этом случае область опре-
деления функционала J[y] есть
множество функций, непрерывно
дифференцируемых на [а, Ь] всю-
ду, кроме, возможно, одной точки,
являющейся угловой точкой, т.е.
О
Рис. 3.5
3.3. Экстремали с угловыми точками
97
в этой точке существуют односторонние производные. Отме-
тим, что если функция у{х) доставляет экстремум функциона-
лу J[y], а ее угловая точка есть (с, у(с))у то сужения функции
на отрезки [а, с] и [с, Ь] являются экстремалями функционала.
Действительно, зафиксировав точку с и значения функции на
отрезке [с, ft], мы можем рассмотреть функционал
с
на классе функций С1[а> с], который отличается от исходного
постоянным значением (значением интеграла по отрезку [с, ft])
и достигает минимума на функции у(х). Значит, функция у(х)
является решением уравнения Эйлера на отрезке [а, с]. Анало-
гичные рассуждения можно провести и для отрезка [с, ft].
Удобно представить функционал J[y] в виде суммы двух
интегралов:
с Ь
J[y] = jf(x> У* y')dx+jf(x, у, y)dx = J1[y] + J2[yl
а с
Тогда необходимое условие экстремума функционала при-
нимает вид
δ^Ι[г/, 5г/] + 5J2О/, Si/] = 0.
По существу, мы имеем две вариационные задачи: пер-
вая — на отрезке [а, с] с фиксированным левым концом и
правым, движущимся вдоль кривой у = cp(x); вторая — на
отрезке [с, ft] с движущимся вдоль кривой левым концом и
фиксированным правым. Мы можем на отрезках [а, с] и [с, ft]
рассматривать только экстремали исследуемого функционала.
В этом случае первые вариации функционалов J\[y] и J2[y]
имеют вид (см. 3.2)
Тогда необходимое условие экстремума dJi [у, ду] + 8J2 [*Л δ*/] = О
в силу произвольности 5с принимает вид
(/+(ф'-^)|с_0-(/+(ф'-^)|с+0=о,
98
3. Вариационные задачи с подвижными границами
или
(f+to'-yYA ={fH¥-y%4
с+0
(3.18)
Условие (3.18) будем называть условием отражения.
Выясним физический смысл условия отражения для функ-
ционалов вида (3.16). Так как, согласно (3.17), при ψ = φ
то получаем (при А(х,у) Φ 0)
ФмуУ
If *
Vi+0/')5
If f
:_о V^
(3.19)
с+0
Пусть pi, β2 — углы наклона односторонних касательных
(слева и справа) к кривой у = у(х) в точке С, α — угол наклона
касательной к кривой у = ц>(х) в той же точке (рис. 3.6). Тог-
да угол падения, т. е. острый угол между дугой АС и кривой
у = (р(х), равен π - Pj + α, а угол
отражения, т. е. острый угол
между дугой СВ и кривой у =
(р(х), равен β2 - α. Так как
tgPi=i/'(c-0),
tga = <p'(c),
условие (3.19) можно записать
следующим образом:
1 + tgatgPi l + tgatgP2
Рис. 3.6
Isecpj
|secp£
Учитывая, что косинусы углов Pi и β2 имеют разные знаки
(один из этих углов острый, а другой тупой), получаем
cos3i(l + tgatg3i) + cosP2(l + tgatg32) = 0,
или, после преобразования, —
cos (Pi - a) + cos(P2 - a) = 0.
3.3. Экстремали с угловыми точками
99
Это равенство с учетом диапазона изменения рассматриваемых
углов означает, что π-β! + α = β2-α, т. е. угол падения кри-
вой у = у(х) равен углу отражения.
Если луч света распространяется со скоростью v(x>y) в не-
однородной плоской среде, ограниченной кривой у = (р(х), то
время Т, затраченное на прохождение луча из точки А (а, уА)
в точку В (&, ув), выражается интегралом
J v(x,y)
dx.
(3.20)
Свет распространяется так, что луч проходит от одной точки
до другой за минимальное время. Мы имеем дело с вариацион-
ной задачей для функционала вида (3.16)» Реальная траектория
луча является решением вариационной задачи, и мы получаем
подтверждение известного физического закона: угол падения
луча света на отражающую поверхность равен углу отражения.
Задача о преломлении экстре-
малей. Пусть в простейшей задаче
вариационного исчисления (2.1),
(2.2) концы графика допустимой
функции А(а, уа) и Б(6, уъ) нахо-
дятся по разные стороны от глад-
кой кривой у = ф(х), которая раз-
бивает полосу {(х, у): а < х < Ь}
на две области Dx и D2 (рис. 3.7),
причем
Рис. 3.7
f(x>y>y') =
%{*>У>уХ (x,y)eD2,
где fi(Xyy9j/) и /2(*>i/>i/') — дважды непрерывно дифференци-
руемые функции своих аргументов.
В этой задаче, как и в предыдущей, в качестве области
определения функционала следует выбрать множество функ-
ций, у которых график в точках пересечения с кривой у =
- (р(х) может иметь излом. Мы предполагаем, что допустимая
функция непрерывна, а в указанных точках имеет конечные
односторонние производные. Точки экстремума функциона-
ла нужно искать среди таких функций, которые на участках
100
3. Вариационные задачи с подвижными границами
гладкости являются экстремалями этого функционала. Точ-
ка С(с, ус) является подвижной, а ее координаты связаны
соотношением ус = (р(с). Поэтому, как и в случае отражения
экстремалей, имеем
«J = (АН<?'-уШ'у')\с_0 &-(/2 +(Ф'-г/')(/2)'Д+0 &.
Необходимое условие экстремума δ J = 0 на функциях указан-
ного вида записывается следующим образом:
(А+(<?'-уШУу>)\с_0 = (/2 Нч>'-у'ШУ')\с+0 · (3.21)
Это условие преломления. В развернутом виде его можно
записать так:
А (с, ср(с), у\с - 0)) + (ср'(с) - ^(с - 0)) (А )> (с, (р(с), jrtc - 0)) =
= к {с, ф(с), у'(с+о))+(ф'(с) - yV+о)) (/2 >;< (с, Ф(с), г/'(с+о».
Чтобы решить задачу о преломлении, нужно найти экстре-
мали исследуемого функционала в областях D1 и D2, решая два
уравнения Эйлера для интегрантов fi и /2. Среди этих экстре-
малей в областях £>! и D2 надо выбрать те пары у\{х) и у2(х),
которые удовлетворяют краевым условиям
уЛа) = J/a» i/i(c) = <Р(с), i/2 (с) = <Р(с)> i/2(&) = i/Б
и условию преломления (3.21). Экстремум функционала мо-
жет достигаться только на таких функциях.
Выясним физический смысл условия преломления, рас-
смотрев функционал вида (3.16), в котором функция А(х,у)
имеет линию разрыва у = φ(#). Обозначив А(х,у) = Аг(х,у) в D1
и А(х,у) = А2(х,у) в D2 и использовав (3.17), можем записать
условие преломления в виде
Ai(x,y)
i+фУ
^НуУ
= А2(х,у)
1 + ФУ
с-0
Vi+0/V
с+0
Вводя, как и в случае отражения экстремалей, обозначения
β15 β2, α и проводя аналогичные преобразования, получаем
cos(a-p!) _ А2(с,ф(с))
cos(a-p2) A1(cMc))7
3.3. Экстремали с угловыми точками
101
или
sin (π / 2 - (α - β!)) = А2 (с, (р(с))
sin (π / 2 - (α - β2)) Аг (с, φ(<?))'
Распространение света описывается функционалом (3.20), для
которого
^i(*»if) = — г> ^2(*»У) = — г>
М*,*/) ^2(#,1/)
и условие преломления в этом случае преобразуется к следу-
ющему:
sm(n/2-(a-$1)) = i>i(c,(p(c))
sin (π /2 -(α -β2)) и2(с,<р(с)У
Это соотношение представляет собой закон преломления све-
та Снеллиуса, согласно которому отношение синуса угла па-
дения к синусу угла преломления равно отношению скоростей
распространения света в двух средах.
В задачах на отражение и преломление экстремалей нали-
чие точки излома у графика функции, на которой достигается
экстремум, вытекает из постановки задачи. Но даже в задачах
с гладким интегрантом в отсутствие каких-либо дополни-
тельных условий функционал может не иметь экстремумов в
классе непрерывно дифференцируемых функций, а решение
вариационной задачи следует искать в более широком классе
функций, например среди функций, графики которых могут
иметь точки излома.
Пример 3.4, Исследуем на экстремум функционал
2
J[y] = j{y'f(l-y')2dx (3.22)
о
при краевых условиях г/(0) = 0, у(2) = 1.
Так как интегрант неотрицателен, то J[y]>0 на любой
допустимой функции у(х). Любая функция z/(x), для которой
J[y] = 0, может рассматриваться как точка экстремума функ-
ционала, даже если она не является непрерывно дифференци-
102
3. Вариационные задачи с подвижными границами
руемой на отрезке [0, 2]. В качестве такой функции можно
взять, например,
\х, 0<х<1;
УЛХ) = \1, 1<*<2.
Такая функция не является единственной. Подходит любая
кусочно-линейная функция, производная которой принимает
лишь два значения — 0 и 1 (за исключением одной или не-
скольких точек излома).
Если функция у(х) непрерывно дифференцируема на от-
резке [0, 2], то функция у[(х) непрерывна на этом отрезке и
поэтому не может принимать лишь два значения: 0 и 1. Сле-
довательно, в интеграле (3.22) непрерывная неотрицательная
подынтегральная функция отлична от нуля хотя бы в одной
точке. Значит, для непрерывно дифференцируемой функции
у(х) имеем J[y] > 0. В то же время можно показать, что в лю-
бой окрестности функции у*(х) (по норме ||||ci) имеются глад-
кие функции, значение функционала на которых в силу его
непрерывности мало отличается от значения функционала на
функции уХх), т. е. от значения 0. Таким образом, значение 0
является точной нижней гранью значений функционала, и это
значение не достигается в классе непрерывно дифференциру-
емых функций. #
Укажем условия, которым должны удовлетворять точки
экстремума функционала (3.1), если его область определе-
ния — множество кусочно-гладких функций на отрезке [а, Ь].
Мы называем функцию кусочно-гладкой на промежутке Т,
если она непрерывна на этом промежутке, имеет на нем не-
прерывную производную всюду, кроме, возможно, конечно-
го числа точек, в которых функция имеет конечные непре-
рывные односторонние производные. Во-первых, каждый
гладкий участок функции, являющейся точкой экстремума,
должен удовлетворять уравнению Эйлера (т. е. быть экстре-
малью). Во-вторых, исходя из необходимого условия экстре-
мума функционала, можно заключить, что в каждой угловой
точке х* функции, являющейся точкой экстремума, выполня-
ются следующие условия Вейерштрасса — Эрдмана:
3.4. Задача с подвижными границами в пространстве
103
Эти условия в совокупности с требованием непрерывности
функции у(х*-0) = у(х* + 0) позволяют найти координаты
угловых точек, если они есть.
Пример 3.5. Рассмотрим функционал
b
J[y] = j{(y')2-y2)dx
а
и условия Вейерштрасса — Эрдмана для него· Второе условие
/' I = /' I
V|c-o VUo
принимает вид 2у'(с-0) = 2i/'(c + 0), т. е. означает равенство од-
носторонних производных в любой точке· Значит, все точки
экстремума функционала, даже в классе кусочно-гладких
функций, не имеют угловых точек и являются непрерывно
дифференцируемыми функциями. Напомним, что условие
fy'y'^0 является достаточным для того, чтобы экстремали
функционала были дважды дифференцируемыми (см. теоре-
му 2.2). В этом случае экстремаль не имеет угловых точек, и
рассмотренный функционал — тому пример (для него /£у = 2
для любых значений аргументов функции /).
3.4. Задача с подвижными границами
в пространстве
Обобщим задачу для плоского случая: поставим задачу о пои-
ске кривой с подвижными границами в пространстве R3:
ь
J[y, A = J f(x, У\ г. У, г) dx -> extr,
а
у = у(х), г = z(x),
при условии, что одна или обе точки (а, у (a), 2(a)); (b^y(b),z{b))
подвижны, например, находятся на заданных кривых либо
поверхностях.
Очевидно, что экстремум достигается только на интеграль-
ных кривых системы уравнений Эйлера:
104
3. Вариационные задачи с подвижными границами
dxh h '
-^£<-£ = о.
ах
Рассуждая так же, как и в плоском случае, получим вари-
ацию функционала в виде
Ы\Ъу,Ьг,Ьа,Щ = (f- yfy'-zfz') \x=b δ& + fy>\x=b Ьуъ +fz'\x=b Ъгъ -
~ if-yfy* -Zfz') \x=a §a-fy'\x=a ?>Уа ~fz'\x=a tea· (3·23)
Возможны следующие варианты постановок:
1) правая конечная точка экстремали перемещается про-
извольно: вариации bb>byb,bzb — независимы, левый конец
экстремали фиксирован:
х = а: у(а) = уи г(а) = гг => δα = Ъуа = Ъга = О,
т. е. три последних слагаемых в (3.23) тождественно равны
нулю·
Равенство вариации нулю примет вид
^ = (f-yY^-^)\xmbSb+^\xmbbyb + f^\xsb^sb=09
и естественные условия в искомой точке х-Ъ можно записать
в виде трех равенств:
tf-y%-z%)\x=b=b,
f,\ = 0 fM =0
'у\х=ь ' h\x=b υ·
Этих равенств совместно с предварительными (геометри-
ческими) условиями
y(a) = yl9 z(a) = z1
достаточно для определения пяти неизвестных: четырех про-
извольных постоянных С1,С2,Сз,С±, от которых зависит об-
щее решение системы ОДУ, и значения х = Ь;
2) правая конечная точка экстремали скользит по данной
кривой у = (р(х), г = \|/(х); левая точка фиксирована.
Тогда (по аналогии с плоским случаем)
*Уъ = Φ,(6)δ&, bzb = ψ'(&)δ&.
3.4. Задача с подвижными границами в пространстве
105
Из условия обращения первой вариации функционала в
нуль получим условие трансверсальности:
(f44>'-y%'Hv'-z)U')\x=b=0.
Кроме того, имеем геометрические связи:
№ = №, г(Ъ) = У(Ъ).
Этих условий вместе с двумя предварительными условиями
в точке х = а достаточно для нахождения нужной экстремали;
3) правый конец искомой экстремали скользит по заданной
поверхности z = \\f(x,y).
В этом случае в точке встречи экстремали с поверхностью
z = \\f(b,y(b)) вариация Ъгь =ψ'Λ.δ&+ψ'!/δΙ/&, а вариация функцио-
нала
В силу произвольности вариаций ЬЬ, Ьуь получаем два ес-
тественных условия
\f-y%'HVx-z)fZ')l=h=0;
х=ь (3.24)
Следует учесть, что точка (b, у(Ь), z(b)} принадлежит по-
верхности, поэтому
z(b) = y{b,y(b)).
Этих условий, вместе с условиями фиксированности экс-
тремали в точке # = а, достаточно.
Пример 3.6, Выясним геометрический смысл естественных
условий (3.24) для функционалов вида
ъ
J[y(x), z(x)] = \А(х,уу2)^1 + у'2+г'2 dx.
106
3. Вариационные задачи с подвижными границами
Из условий (3.24) имеем
/ - У% + (Ψ', - z)U> = 0 => f + AfxZ
Jl + y'2+z'2
= 0,
х=Ъ
yll + y'2+z'2
= 0.
х=Ь
Пусть А(х, у, г) Φ О, тогда полученные выше равенства упро-
щаются: Ι + ψ^Ζ^Ο, y+yy'yz' = 0 в точке х-Ь (точка встречи
экстремали с поверхностью \\f(x9y)).
Отсюда (в точке х-Ъ)
1 _ у _ г
φΧ φ; (-1)'
т. е. векторы τ ={l,i/^,^} и η ={ψ^,ψ^,-1} коллинеарны.
Вектор τ есть касательный вектор к кривой, заданной па-
раметрически:
х = х,у = у(х), г = z(x);
вектор η — нормаль к поверхности
№,Ζ/,Ζ)Ξψ(*,#)-Ζ = 0.
Таким образом, искомая кривая (экстремаль) должна встре-
тить поверхность ортогонально к ее касательной плоскости.
Пример 3.7. Определим расстояние от точки А(1,1,1) до
сферы х2 +у2 +z2 =1, т. е., считая, что х = х, у = у(х), z = z(x)9
найти экстремаль вариационной задачи
1
J[y>z]= \ yjl + y'2+z'2 dx —> extr(min).
xi
Так как точка А находится во внешности сферы, коорди-
ната Х!<1. Поэтому правый конец искомой экстремали
фиксирован:
х = 1 => t/(l) = z(l) = l, (3.25)
3.4. Задача с подвижными границами в пространстве
107
а левый конец скользит по сфере, и в неизвестной точке встре-
чи (xi9y(xi)9z(xi)) нужно поставить условия трансверсально-
сти (см. условия (3.24)):
(/ - У?„'- + (Ч>'« - г')^' )| „„ = 0;
(fy-^'yM =o.
\Х=Х\
\Х=Х\
Из уравнений Эйлера получаем экстремали
у = Сгх + С2,
Ζ — CsgX + G4,
из условий (3.25): Сг+С2 = 1, С3+С4 =1.
Для краткости введем обозначения
a^l + Cf+Cf, β = λ/1-Χ12-Ζ/| =гг.
Тогда условия (3.26) можно записать так:
С* Г-,
α——+
α
-С,
α
<к , C8Hh)_n
α α ρ
следовательно,
1-
-^1 = 0 ^ СзЛ;
Vi^F
г/i
Ci-
Имеем
С3У1
Ф^*?1
= 0
Ci =
Vi
*i
_СъУ\
Χγ
=>
<V
-Ml
•
Xl
(3.26)
Ci*i = г/i = Cx^i + C2 => C2 = 0 и Cx = 1,
C3xa = Zi = Csxi + C4 => С4=0иС3=1.
Экстремаль имеет вид z-y-x.
Отсюда найдем координаты точки встречи экстремали со
сферой: X\-y\~Zx-l/v3.
Следовательно, искомое расстояние <i = V3-l.
108
3. Вариационные задачи с подвижными границами
Так как в задачах с рассмотренной структурой функцио-
нала экстремали ортогональны к поверхности в точке встре-
чи, найдено действительно минимальное расстояние от точки
А(1,1,1) до сферы.
Пример 3.8. Покажем следующее: если условие трансвер-
сальности является условием ортогональности в задаче о пои-
ске точки встречи, то интегрант функционала имеет вид
(в частном случае, для плоской задачи):
f(x,y,y') = A(x,y)^jl + y'2, А(х,у)Ф0.
Действительно, пусть
f(x,y,y')-f;>(-)(y'-<f>') = o =>
=> 1 + i/V = 0 в точке встречи.
Тогда cp' = -l/z/' и условие трансверсальности можно запи-
сать так:
f-fy
Отсюда получим
ν у )
у _1Э/
1 + У'2 fty
Умножим (3.27) на dy и проинтегрируем:
yty _ е 1 df ., _ с ty
(3.27)
if^-m^-n
В интеграле справа dy>f обозначает частный дифференциал
от искомой функции f(x,y,y') по параметру у'. Известно, что
по частному дифференциалу относительно некоторой перемен-
ной (в данном случае — dy>f(x9y,y')) функция /(·) восстанав-
ливается с точностью до аддитивной функции, не содержащей
этой переменной. В рассматриваемом случае — до аддитивной
функции С(х9у).
3.5. Задачи с односторонними вариациями
109
После интегрирования имеем
hn{l + y'2) = \nf{x,y,y) + \nC{x,y) ^
=> ^1 + у'2 = f(x,y,y')C(x,y) =>
=> Hx,y,y') = —^—Jl + y'2 =A(x,y),jl + y'2.
С(х,у)
3.5. Задачи с односторонними вариациями
Поставим следующую задачу:
ь
Jly] = y(x,y,y')dx -» extr,
а
у(а) = У1> УФ) = у21
(3.28)
где у(х)Е Ci[a,b]; /(·) — дважды непрерывно дифференцируе-
мая функция своих переменных.
На искомую экстремаль наложено дополнительное огра-
ничение (рис. 3.8)
г/(х)>ср(х). (3.29)
Равенство у = (р(х) определяет границу множества (x,t/)e хОу,
внутрь которого искомое решение (3.28) попасть не имеет
права.
Поэтому необходимые условия экстремума функционала
должны быть скорректированы. Вспомним о том, что уравне-
ния Эйлера в простейшей задаче выводились при условии
свободного варьирования функции у(х) в множестве допусти-
мых функций, т. е. вариация Ьу(х) могла быть как положи-
тельна, так и отрицательна.
При наличии геометриче-
ского ограничения (3.29) при
выходе искомой экстремали
на границу «запрещенной» об-
! у = ц>(х) ласти у = (р(х) вариация 5г/(х)
должна быть строго положи-
хг х2 ъ х тельной:
Рис. 3.8 §у(х) > 0, хе[хг,х2].
У\
О
а
110
3. Вариационные задачи с подвижными границами
Введем новое зависимое переменное z(x):
z/ = z2+(p(x) => y' = 2zz' + q>'(x).
Тогда функционал принимает вид
ъ ъ
<Л>]= \f(x,z2+<p(x),2zz'+(p'(x))dx= \Φ(Χ,Ζ,Ζ')αΧ.
а а
Поставленная задача (3·28) преобразуется в задачу:
ъ
J[z]=\<t>(x,z,z')dx —> extr,
а
z(a) = yly(a)-<p(a), г(Ь) = ^у(Ь)-(р(Ь).
(3.30)
Здесь, очевидно, (i/(a)-(p(a)) и (y(b)-(p(b)) неотрицательны
в силу условия (3.29); знаки корней уточнять не будем.
В задаче (3.30) на функцию z(x) ограничений не наложе-
но, поэтому имеем простейшую задачу вариационного исчис-
ления.
Следовательно,
d
dx
φ'Χ'-φ;=ο.
Вычисляем производные интегранта Ф(х,г,;г'):
dx dx
Отсюда получаем:
d
—Ф'2-Ф'г=2г
dx
dxTy h
= 0.
(3.31)
Уравнение (3.31) распадается на два уравнения: 1) 2 = 0,
которому соответствует ограничение у = <р(х); 2) уравнение
Эйлера для функционала исходной задачи (3.28) —fu'-fu = 0.
dx
3.5, Задачи с односторонними вариациями
111
Для полного решения задачи нужно найти условия сопря-
жения искомой экстремали с кривой у = (р(х), если экстремаль
выйдет за эту кривую.
Рассмотрим для определенно-
сти ситуацию, представленную
на рис· 3.9. Экстремаль вышла
за границу и течет по границе до
точки Б.
Тогда
х\ Ъ
J[y]=jf()dx+jf()dx.
О a %i%i + 5#i Ъ х
Рис. 3.9
хг
Приращение функционала состоит из двух слагаемых:
хе [a,#i]: Δ^ = f()dx- f()dx;
xG[xi9b]9y = (p(x): Лс/2 = f(x9(p9qf)dx- \ f(x,(p,(p')dx =
X\ +$Xi
xx
#!+$#!
= ~ f (x,(p(x),<p'(x))dx = -/(#1,φ(*1),φ^Λ1))δ#1 +o($Xi).
*i
Вариация 6J функционала также распадается на два сла-
гаемых:
1) &7i, которое вычисляется как вариация функционала в
задаче с левым фиксированным концом искомой экстремали
и правым скользящим по кривой у = (p(Jt):
v ** /\x=x\
2) 5J2> которое соответствует течению экстремали по гра-
нице, из формулы для приращения AJ2 запишем в виде
δ^2 =-/(*1»φ(*1)>φ'(*1))δ*1
112
3. Вариационные задачи с подвижными границами
В силу необходимого условия экстремума
SJl+8J2 =0.
С учетом произвольности 8хг имеем
{Kx,y,y')-f(xMx)^x))-{y-vV'y)\x=xx=b· (3.32)
С помощью формулы конечных приращений Лагранжа
получим (y(xi) = (p(x\)):
f(x3y,y^-f(x>y>№ = (y'-№fHx>y>Q)
Х=Х\
здесь y\xi)<q<<${x\) — «среднее» между у\х\) и cp'(xi)·
Подставляем найденную разность в (3.32):
(у -tf)(fyix,y,q)-fy>(x,y,y'))\x=x =0.
Еще раз применим теорему о среднем:
fyix^q)-fyi^y^ = f!y(x^q){q-y)y
здесь q — «среднее» между q и y'(xi).
В результате из (3.32):
(y-^)(q-y)fyv(^y^) = o.
Пусть fy'y'i*) ^ 0, что является достаточным условием суще-
ствования гД тогда
y'(*i) = <p'(*i), (3.33)
так как q Φ у\х\) в силу теоремы о среднем.
Таким образом, график функции у(х) в точке встречи с
границей z/' = (p(;e) касается границы.
Условие (3.33) является дополнительным уравнением для
определения экстремали.
Например, в ситуации, подобной изображенной на рис. 3.9,
задача будет иметь три подлежащих определению параметра:
Cj и С2 — произвольные постоянные общего решения и точ-
ка ВСТреЧИ X = Χγ.
3.5, Задачи с односторонними вариациями
113
Для их определения запишем три условия:
y(a9Cl9C2) = yl9
\y(xi9Cl9C2) = q(xi)9
y'(x1,Cl9C2) = (p'(x1).
(3.34)
Если ситуация подобна изображенной на рис. 3.8, то для
полученного общего решения уравнения Эйлера у = г/(л:,С1?С2)
в области хе [#2,&] нужно заново определить Сх и С2, а также
найти точку встречи х = х2.
Для этого имеем (по аналогии с (3.34)):
y(b9Cl9C2) = y29
#(*2,СЬС2) = Ф(*2)>
у'(х2,С19С2) = (р'(х2).
(3.35)
Однако может случиться, что искомая экстремаль ни в од-
ной точке отрезка [а, Ь] не встретится с границей, т.е. всюду
y = y(x,Cl9C2)>q>(x).
Достаточным признаком этого является несовместность
систем уравнений (3.34) и (3.35) в отдельности.
Чтобы рассмотреть все возможные ситуации, приведем
элементарный пример.
Пример 3.9. Найти экстремали функционала в задаче
1
J[y]=jyll + y'2dx -> min,y(-l) = y(l) = l;
-1
(3.36)
у(х)<х2 +а9 а>09
т. е. требуется соединить две точки на плоскости хОу кривой
наименьшей длины, не нарушая поставленного ограничения.
Решение уравнения Эйлера очевидно:
i/*(x) = CiX + C2.
При определении произвольных постоянных возможны
следующие ситуации:
а) (р(х) = х2+1 (рис. 3.10, а).
114
3. Вариационные задачи с подвижными границами
\
Л а
1\. ·^
1
У'
х^
^
1
/
т Ρ
■ 1J
1 ъ.
a
х
Рис. ЗЛО
Из (3.34) имеем систему алгебраических уравнений при
хе [-1, Xi]:
1/*(-1,СьС2) = 1,
i/*(^i»C1,C2) = 9(xi),
1/*'(^1,С1,С2) = ф'(л:1)
-^+02=1,
С\Х\ -\-С2 = я^ +1?
Cj — δ^
=> С2=1 + 2х1 => 2х^+2хх+1 = х^+1 =>
=> х1(х1+2) = 0 => х2=0 либо Х!=-2.
Второе решение должно быть отброшено, так как х = [-1,1].
Следовательно, точка встречи экстремали с ограничительной
кривой х2 = 0.
Отсюда: Сх=0, С2=1 => #*(#) = 1.
Решением задачи при хе[-1,0] является отрезок АС.
Такое же решение (х2 = 0, у*(х) = 1) получим и для правого
полуинтервала [0, 1] — отрезок СВ.
Решение задачи есть отрезок АВ;
б) φ(Χ) = Χ2 + 0,5 (рис. 3.10, б).
Из (3.34) при хе [-1, а^] имеем:
-Ci+C2=l,
Citfi+C2 =*i+0,5, => ^+2^+0,5 = 0
С\ = 2х^,
-2±V2
*i=-
*1Д=-0,29, *и«-1,71.
Вопросы и задачи
115
Следовательно, ^=-0,29, С^-0,58, С2=0,42 и участок
экстремали при хе[-1, 0,29]:
г/*(я) = -0,58:*: + 0,42.
Аналогичными действиями получим на полуинтервале
х2 =0,29, Сг =0,58, С2 =0,42 =>
=> г/*(х) = 0,58х + 0,42.
Таким образом, решение задачи (3.36):
Г-0,58* + 0,42, -1<х< -0,29,
у*{х) = \ х2 +0,5, -0,29 < х < 0,29,
[о,58х + 0,42, 0,29 < х <1;
в) (р(х) = #2 (рис. 3.10, в)·
Для определения хх получим уравнение х\ -2х^ +1 = 0 =>
=> Х\ = -1 — координата точки касания участка экстремали с
ограничительной кривой.
Аналогично находим точку х2:
х\ -2х2 +1 = 0 => JC2=1.
Экстремалью (решением уравнения Эйлера) является
кривая
Г-2х-1, 1 < jc < 0,
У <'Х)=[2х-17 0<*<1.
Однако решением поставленной задачи (кривой минималь-
ной длины) будет именно кривая у = х2.
Вопросы и задачи
3.1· Запишите условия трансверсальности на правом конце
в вариационной задаче
ь
J[y] = )A(x,y)^l + (y')2dx -> extr, y(a) = уа9 y(b) = φ(&),
116
3. Вариационные задачи с подвижными границами
функционал которой определен на множестве непрерывно
дифференцируемых функций. Предполагается, что значения
а, уа фиксированы, А(дс,(р(дс))*0, а (р(х) непрерывно диффе-
ренцируема.
3.2. Докажите общую формулу (3.14) вариации функцио-
нала, зависящего от нескольких функций, в задаче с подвиж-
ными границами.
3.3. Запишите условие трансверсальности на левом конце
в вариационной задаче
ь
I[y,z] = JA(x,yyz)yJl + (y')2 + (z)2dx -> extr,
a
z(a) = φ(α,*/(α)), y(b) = yb9 z(b) = zb,
функционал которой определен на множестве кусочно-глад-
ких функций, by уЪу zb фиксированы, (p(je, у) непрерывно диф-
ференцируема и А(х9 г/,ф(х, у)) * 0.
3.4. Выведите формулу для первой вариации функционала
ь
I[y] = )f(x,y,y',y")dx
а
в задаче со свободными концами (предполагается, что у g
е С2[а,Ь]).
3.5. Получите условия трансверсальности на правом конце
в вариационной задаче
ь
1[У> 2] = jF(x,y,2, у9 z) dx -» extr,
а
у(а) = уа9 z(a) = у а, z(b) = y(b9y(b))9
функционал которой определен на множестве пар кусочно-
гладких функций, a, уа9 za фиксированы.
3.6. Получите условия трансверсальности на правом конце
в вариационной задаче
Вопросы и задачи
117
I[y] = JF(x,y,y')dx^> extr, у(а) = уа, (p(&,y(&)) = 0,
а
функционал которой определен на множестве кусочно-глад-
ких вектор-функций, а, уа е R71 фиксированы.
3.7. Найдите экстремали в следующих вариационных за-
дачах с правым подвижным концом:
и
а) \{у')2 dx -» extr, у(0) = 0, у(Ь) + Ь +1 = 0;
о
б) Гл/1 + (У) dx^extTy y(Q) = 0, y(b) = b-5;
J υ
в) j[2y-x2(y')2)dx^extr, y(l) = e;
π/4
г) $ ((y')2-y+l)dx^extr, i/(0) = 0;
Д) \{УУ'НУ)2 +l)dx->extr, y(0) = 1, i/(i>) = -3;
e) Ul + yy]l + (y')2dx^extr, y(0) = 0, y(b) + b + 1 = 0.
3.8. Используя методы вариационного исчисления, найди-
те расстояние от начала координат до плоской кривой х2у = 1.
3.9. Используя методы вариационного исчисления, найдите
кратчайшее расстояние между двумя кривыми на плоскости:
а) у = х2 и у = х - 5; б) у = х2 + 2 и у = х.
118
3. Вариационные задачи с подвижными границами
3.10. Выясните, имеет ли функционал задачи
ъ
J[y] = j(2xy-y2 -(y')2)dx, y(a) = уа, y(b) = уъ
а
экстремали с угловыми точками.
3.11. В вариационной задаче
ъ
J[y]=jy2(i-(y')2)dx, i/(-i) = o, j/(i) = 1
а
найдите экстремали функционала с угловыми точками.
3.12. Поставим пространственную задачу, аналогичную
рассмотренной в примере 3.8: покажите, что если следствием
уравнения трансверсальности является ортогональность экс-
тремали к поверхности, то
f(x, у, 2, у, г) = А(х, у, z) y]l + y'2+z'2.
3.13. Найдите расстояние от точки А(0,0,4) до поверхности
г = х2+у2:
υ
J[y] = )f(x,y,y')dx -» extr; y(a) = yu y(b) =
У 2-
3.14. Найдите расстояние между поверхностями
•2 7/2 „2
У
— + — + — = 1 и x2 + i/2+z2 = 4.
25 16 9
4. ЗАДАЧИ НА УСЛОВНЫЙ ЭКСТРЕМУМ
4.1· Основные типы задач на условный экстремум
Рассмотренные ранее задачи характеризовались тем, что их
решения должны были удовлетворять некоторым условиям на
границе области интегрирования (краевым условиям). Однако
во многих важных приложениях вариационного исчисления
на решение задачи накладываются некоторые дополнитель-
ные условия. В этой связи вспомним задачу Дидоны (см. при-
мер 1.1). Контур (т. е. ремень из бычьей шкуры), которым ох-
ватывался участок земли, имел вполне определенную длину.
Это значит, что функция, дающая решение задачи Дидоны,
должна удовлетворять не только краевым условиям, но и до-
полнительному условию: длина графика функции фиксиро-
вана. Приведем общую формулировку задачи, в которой на
допустимые функции накладываются дополнительные усло-
вия — так называемые условия связи.
Пусть требуется найти экстремум функционала
b
^[y] = J/(*>y>yV*i У = (УиУ2>->Уп)> (4.1)
а
который мы будем называть целевым функционалом, на мно-
жестве функций у(х) из класса Сг([а, ft], R") непрерывно диф-
ференцируемых вектор-функций, удовлетворяющих краевым
условиям
У(а) = Уг> уФ) = у2 (4.2)
и некоторым соотношениям (условиям связи), которые могут
выражаться дифференциальными уравнениями
120
4. Задачи на условный экстремум
gj(x,y,y') = 0J j = l,k {k<n), xe[a,b], (4.3)
или интегральными
ъ
]кь(х,у,у')<1х = Ц, i = l,s. (4.4)
а
Здесь везде предполагается, что функции /, gj, j = 1, k , ht,
i = 1, s , дважды непрерывно дифференцируемы и краевые ус-
ловия (4.2) не противоречат условиям связи (4.3).
Дифференциальные соотношения (4.3) называют диффе-
ренциальными связями, а соотношения (4.4) — интеграль-
ными (изопери метрически ми) связями. Особо отметим част-
ный случай, когда в соотношениях (4.3) функции gj не зависят
от у1. В вариационном исчислении такие связи называют фа-
зовыми ограничениями, а в теоретической механике — голо-
номными связями.
Сформулированная задача общего вида представляет собой
вариационную задачу на условный экстремум. Частный
случай задачи, в которой наложены только дифференциаль-
ные связи (4.3), а также различные ее модификации, отли-
чающиеся краевыми условиями (иногда с дополнительными
интегральными связями (4.4)), называют задачей Лагранжа.
Эта задача была опубликована Ж.Л. Лагранжем в 1788 г. в
его «Аналитической механике». Задачу (4.1), (4.2), (4.4) с
интегральными связями называют изопериметрической за-
дачей, рассматривая ее как обобщение классической задачи
определения среди плоских фигур одинакового периметра
(изопериметрических фигур) той, которая имеет наибольшую
площадь (см. 4.4).
Отметим, что изопериметрическую задачу (4.1), (4.2), (4.4)
можно свести к задаче Лагранжа, добавив новые функции
X
^г{х)^^кь{х,у,у)ах, i = l, s. (4.5)
а
Тогда вместо интегральных соотношений (4.4) получим диф-
ференциальные соотношения
ΨΗ*) = ht{x,y,y), i = l9s. (4.6)
4.2. Необходимые условия в задаче Лагранжа
121
При этом, согласно (4.4),
ψ;(α) = 0, ^((Ь) = Ц9 i = l, s. (4.7)
Таким образом, изопериметрическая задача эквивалентна
следующей задаче Лагранжа: найти систему η + s функций
Уъ ·■·> Ут ¥ь · · > ¥s> связанных соотношениями (4.6) и удов-
летворяющих краевым условиям (4.2) для функций yi9 i = l,n,
и условиям (4.7) для функций ψ/, i = 1, s, которая доставляет
экстремум функционалу (4.1).
К задаче Лагранжа сводится и задача об экстремуме функ-
ционала, зависящего от высших производных. Для функ-
ционала
ь
J[y] = jf(x,y,y',...,yM)d*
а
нужно ввести новые функции
Уо=У> У1=У> У2=У\ -, Уп=У{п)-
Тогда исходный функционал заменяется функционалом
ъ
Л[Уо,У1>-,Уп] = у(х>Уо*У1">Уп)ах,
а
неизвестные функции в котором связаны уравнениями
\Уо=Уи
\у1=У2>
[Уп-1 ~Уп-
4.2. Необходимые условия в задаче Лагранжа
Задачи на условный экстремум встречаются и в конечномер-
ных задачах, когда аргументы функции многих перемен-
ных, экстремум которой нужно найти, связаны некоторыми
функциональными соотношениями. Для решения этих задач
обычно используют метод множителей Лагранжа [V]. Этот
122
4. Задачи на условный экстремум
универсальный метод, основанный на введении множителей
Лагранжа и составлении функции Лагранжа, применим и
для функционалов.
Сформулируем необходимые условия экстремума функцио-
нала в задаче Лагранжа (4.1)-(4.3). Будем предполагать, что
функции gj(x,y,y), y = l, ft, непрерывно дифференцируемы по
переменным у' и ранг матрицы Якоби по этим переменным
Г 3ft Эй
Эй
Э(#1,£2>-
~>Sk) _
■■>Уп)
Ъу{
dg2
Ъу'\
dgk
Ъу'г
dg2
ду'2
dgk
ду'п
dg2
ду'п
dgk
Ъу! Эг/з
ду'п
максимален и равен k. Мы можем считать, что
Ъу[ Эг/2
Э^г Э#2_
9yi Эг/2
Э^а Э#*
Эг/'i Эг/2
Ъу'н
Э^2
Э^а
Э^*
Эг/А
*0,
(4.8)
так как при необходимости можно изменить соответствующим
образом порядок переменных уг и функций gj.
Теорема 4.1. Если вектор-функция у*(х) = (i/i(#),..->Уп(х))
из С1([а, Ь]у Шп) является решением задачи (4.1)-(4.3) и при
этом выполнено условие (4.8), то существуют такие функции
Ai(#),.,., Xk(x), что у*(х) является экстремалью функцио-
нала
'М-J
( h λ
1=1
dx. #
(4.9)
4.2. Необходимые условия в задаче Лагранжа
123
Функционал 1*[у] будем называть вспомогательным
функционалом задачи (4.1)-(4.3). Интегрант вспомогательно-
го функционала, т. е. функцию
k
f*=f + ^Xigi> (4Л0)
>=i
называют функцией Лагранжа (лагранжианом) задачи (4.1)-
(4.3). В функцию Лагранжа входят левые части дифференци-
альных связей с коэффициентами Xj(x), которые называют
множителями Лагранжа.
Будем называть экстремалями задачи Лагранжа экстре-
мали функционала (4.1), удовлетворяющие краевым услови-
ям (4.2) и дифференциальным связям (4.3) (в частности, фа-
зовым ограничениям). Теорема 4.1 фактически утверждает,
что все экстремали задачи Лагранжа содержатся в множестве
экстремалей вспомогательного функционала 1*[у]. Значит,
чтобы найти их, нужно из экстремалей вспомогательного
функционала выбрать те, которые удовлетворяют условиям
(4.2), (4.3). Другими словами, экстремали вспомогательного
функционала, удовлетворяющие краевым условиям (4.2) и
дифференциальным связям (4.3), являются экстремалями
задачи Лагранжа.
Учитывая сказанное, из теоремы (4.1) легко получить пол-
ную систему условий для экстремалей задачи Лагранжа, т. е.
систему, в которой количество неизвестных равно числу урав-
нений. Действительно, для η + k неизвестных функций уЦх)
(i = 19п) и λ;(#) (/ = 1, k) мы имеем η уравнений Эйлера
—(f*Yyj-(f%j =0, j = l,n, (4.11)
для функционала/*[у] и k условий связи (4.3). Среди решений
этой системы выбирают те, которые удовлетворяют краевым
условиям (4.2), причем эти условия не должны противоречить
условиям связей.
Замечание 4.1. Иногда в качестве лагранжиана вместо
функции (4.10) используют функцию вида
124
4. Задачи на условный экстремум
k
где λ0 = const.
При этом полагают λ0 ^ 0, если в задаче (4.1)-(4.3) ищется
минимум, и λ0^0, если ищется максимум. Добавление в
лагранжиан еще одного множителя λ0 на самом деле не ока-
зывает существенного влияния, так как фактически равно-
сильно умножению лагранжиана на некоторое число. Такое
умножение, если λ0 ^ 0, не изменяет множества решений си-
стемы уравнений Эйлера. А значение λ0 = 0 есть вырожденный
случай, в котором задача поиска экстремалей вспомогатель-
ного функционала теряет смысл, так как эти экстремали ни-
как не будут связаны с целевым функционалом. #
Для иллюстрации задачи Лагранжа остановимся на дву-
мерном случае (п = 2), когда задано одно фазовое ограничение
(k = 1), т. е. будем решать задачу
ь
J[y,z] = jf(x9yyz9y',z')dx^extr, (4.12)
а
У{о) = Уа* У(Ь) = Уъ> z(a) = za> z(b) = zb9 (4.13)
g(x,y9z) = 0. (4.14)
Частным случаем этой задачи является задача о геодезиче-
ских линиях, в которой требуется на заданной поверхности
найти кривую наименьшей длины (см. пример 1.5).
В задаче (4.12)-(4.14) допустимыми функциями являются
пары функций у(х), z(x) е С1[а9 6], для которых кривая у = у(х)9
2 = г(х) лежит на поверхности g(x9 у9 г) - 0. Мы предпола-
гаем, что эта поверхность не имеет особых точек (т. е.
(g'x)2 +(8y)2 +(g'z)2 *0)· Теорема 4.1 в этом случае сводится к
следующему.
Теорема 4.2. Если пара функций у*(х)9 z*(x) e С1[а9Щ явля-
ется решением задачи (4.12)-(4.14), причем (g'y)2 +(g'z)2 ^0,
то существует такая функция λ(#), что пара функций у*(х)9
z*(x) является экстремалью функционала
ъ
J*[y,z] = ](f(x9y9z9y\z') + Xg(x9y9z))dx.
а
4.2. Необходимые условия в задаче Лагранжа
125
Μ Сначала рассмотрим частный случай, когда уравнение свя-
зи g(Xj у, z) = Q разрешимо относительно одной из переменных,
например z. Тогда это уравнение равносильно уравнению z -
= φ(Χ, у), где функция (р(х, у) дважды непрерывно дифферен-
цируема, так как по предположению дважды непрерывно диф-
ференцируема функция g(x, у, z). Условие непротиворечиво-
сти уравнения связи краевым условиям в данном случае оз-
начает, что za = φ(α, уа) и гъ = φ(&, yb).
Уравнение z = (р(х, у) позволяет свести рассматриваемую за-
дачу к задаче с одной неизвестной функцией. Действительно,
если у*(х), z*(x) — решение задачи (4.12)-(4.14), то функция
у*(х) является решением простейшей задачи вариационного
исчисления
ъ
|/(*,Ζ/,φ,Ζ/',φ; + (p'yy')dx^>extr,
α
у(а) = уа, y(b) = yb.
Поэтому, согласно теореме 2.1, функция у(х) удовлетворяет
уравнению Эйлера для функционала этой задачи, которое име-
ет вид
^{fy' + f^y)-fy-f^y -ft (<plx +qi„iO = 0. (4.16)
Так как
=j-x(fM,+f'MxWmy'),
то уравнение (4.16) равносильно следующему:
или
£(#)-«-/&;+£№№=*
d(fcK+i£№)-«k=0· <4Л7)
dx
Kdx ;
126
4. Задачи на условный экстремум
Частную производную φ^ можно выразить через частные
производные функции g следующим образом; <p'y=-gy /f g'2·
Сделаем соответствующую замену в уравнении (4.17):
dx
Уравнение (4 Л8) заменой
d / Λ/ \ л, ( d / я, \ *, | §у _ „
£№)-«-£№)-*
dx
У
Шг
λ =
ёг
(_d_
dx
№)-£
(4.18)
приводится к виду
^«•Κ-λ*;=ο,
(4.19)
а формулу замены можно записать так:
d
dx
№)-£-λ*;=ο.
(4.20)
Соотношения (4.19), (4.20) представляют собой уравнения
Эйлера для вспомогательного функционала
ь
1*[У> *] = J (f(x> У> z> У'> z) + Mx)g{x> У> z)) dx.
Итак, если г/*(х), z*(x) есть решение задачи (4.12)-(4.14),
то у*(х) является решением задачи (4.15), а следовательно,
и уравнения (4.16). Но тогда пара функций у*(х) и z*(x) =
= (р(х,у*(х)) удовлетворяет системе уравнений (4.19), (4.20),
т. е. системе уравнений Эйлера вспомогательного функциона-
ла. Теорема доказана в частном случае, когда уравнение связи
g(x,y,z) - 0 разрешимо относительно переменного 2.
Отметим, что доказательство теоремы 2.1, базирующееся
на лемме Дюбуа-Реймона, которая в свою очередь опирается
на лемму Лагранжа, в конечном счете использует только ло-
кальные вариации, т. е. вариации, малые по норме ||||с и от-
личные от нуля лишь в малой окрестности заданной точки
х0 ξ [α, Ь]. График такой вариации Ьу(х) отличается от графи-
4.3. Необходимые условия в изопериметрической задаче 127
ка варьируемой функции у*(х) лишь в малой окрестности точ-
ки (х0, у*(х0)). Эту окрестность можно выбрать настолько ма-
лой, что в ней при g'z^O уравнение g(x,y9z) = 0, согласно
теореме о неявной функции, разрешимо относительно пере-
менного 2. Если в точке (х0, у*(хо), г*(#о)) имеем gz = 0, то в
этой точке и в некоторой ее окрестности g'y Φ 0, так что мы
можем уравнение g(x,y,z) = 0 разрешить относительно пере-
менного у. ►
4.3. Необходимые условия в изопериметрической
задаче
Как было показано в 4.1, изопериметрическую задачу можно
свести к задаче Лагранжа. Основываясь на таком преобразова-
нии, получим необходимые условия экстремума функционала
для этой задачи.
Согласно (4.5)-(4.7), изопериметрическая задача (4.1),
(4.2), (4.4) эквивалентна задаче Лагранжа с целевым функ-
ционалом (4.1), дифференциальными связями (4.6) и краевы-
ми условиями (4.2), (4.7). Заметим, что в такой задаче ранг
матрицы Якоби дифференциальных связей по переменным
yt максимален, так как, например,
det
d(gi»-,&)
9(ψΙ,...,ψ'θ)
-1 0
0 -1
0 0
0
0
-1
*0,
где g} (х, у, у', Ψ, Ψ') = hj (х, уу у) - ψ}, / = 1, s.
Следовательно, можно применить теорему 4.1.
Запишем вспомогательный функционал
Ь ( 8 \
а { /=1
Ь
= jf(x,y,y',4>,4>')dx,
dx =
(4.21)
где Ψ = (ψ1,..-,ψβ),
128
4. Задачи на условный экстремум
f(x, у, у, Ψ, Ψ') = /(х, у, у') + ^ λ; (hjix, у, у) - у)),
и его уравнения Эйлера
-гК)~К)=^ /=1»«;
dx
(4.22)
Поскольку /ψ. =0, /ψ'. =-kj, получим
—Х}(х) = 0, y' = l, s.
α*
Таким образом, в изопериметрической задаче множители
Лагранжа постоянны, а оставшиеся уравнения системы (4.22)
можно записать следующим образом:
dx
-Η/% -(ГУу, =0, ;=1,п,
(4.23)
где r=f + ^}hj.
Система (4.23) является системой уравнений Эйлера для
функционала
Ь( s >\
α Ι /=1
d#,
(4.24)
и поэтому функции У\* т->Уп-> удовлетворяющие системе урав-
нений (4.22), являются экстремалями функционала (4.24).
Интегрант функционала (4.24) называют функцией Лагранжа
изопериметрической задачи.
Теорема 4.3. Если функции у{(х),..., у*п(х) из С\а, Ь] до-
ставляют экстремум функционалу в задаче (4.1), (4.2), (4.4), то
существуют такие числа λ1? ...,λ^, что функции у1(х), ...,*/*(х)
являются экстремалями функционала (4.24). #
4.3. Необходимые условия в изопериметрической задаче 129
Теоремы 4.1 и 4.3 представляют собой обобщение прави-
ла множителей Лагранжа, применяемого для исследования
функций многих переменных [V], на случай гладких беско-
нечномерных задач вариационного исчисления. Поэтому и в
вариационном исчислении метод решения задачи Лагранжа и
изопериметрической задачи, базирующийся на определении
функций Xj(x) и коэффициентов λ}9 часто называют методом
множителей Лагранжа. При этом экстремум, который нуж-
но найти в указанных задачах, называют условным экстре-
мумом. Уравнения (4.11) называют уравнениями Эйлера
задачи Лагранжа (4Л)-(4.3), а уравнения (4.23) — уравне-
ниями Эйлера изопериметрической задачи (4.1), (4.2), (4.4).
В заключение отметим, что в рассмотренных вариацион-
ных задачах на условный экстремум правило множителей
Лагранжа распространяется и на условия трансверсальности
(см. 3.1). Эти условия записываются так же, как и для зада-
чи на безусловный экстремум, но при этом роль интегранта /
играет функция Лагранжа соответствующей задачи·
Пример 4.1. Рассмотрим изопериметрическую задачу с
правой подвижной границей
JM = Г (У)2 dx -> extr> \l2ydx = 09
о о
1/(0) = 0, у(х2)-х2+2 = 0.
Запишем функцию Лагранжа f = (у')2 + Х(12у). Уравнение
Эйлера
£(г ^ -ел; =о
для вспомогательного функционала будет иметь вид у" = 6λ.
Интегрируя его, получим
у = ЗКх2+Сгх + С2.
Из краевого условия г/(0) = 0 имеем С2 = 0* Чтобы найти
оставшиеся неизвестные λ, Съ х2, составим систему из трех
уравнений. Первое уравнение — это изопериметрическая
связь, которая с учетом вида функции у такова:
130
4. Задачи на условный экстремум
*2
J 12(3λ*2 +Clx)dx = 0. (4.25)
о
Второе уравнение — это краевое условие на правом конце,
принимающее вид
3Xx$+CiX2 = х2 "2. (4,26)
Наконец, третье уравнение — это условие трансверсальности
на правом конце (см. 3.2)
(f + (φ'-у')(/%')| =0,
х * '\х=х2
которое в данном случае при /* =(у')2 +Х12у и ср(х) - х - 2
имеет вид
((1/')2+λ·12*/ + (1-1/').2Ζ/')| =0. (4.27)
V /\Х=Х2
Система трех уравнений (4,25)-(4.27) имеет два решения:
у = 0 (для него х2 = 2, J = 0) и у = -Зх2 - 4х (для него х2 = -2,
J = 32).
4.4. Примеры задач на условный экстремум
Пример 4.2. Вернемся к задаче Дидоны (см. пример 1.1).
Она представляет собой изопериметрическую задачу:
а
J[y] = J У dx -» max> У(~а) = 0, у (а) = 0,
и
К[у] = j <Jl + (y')2dx = L (L> 2α).
-a
В соответствии с теоремой 4.3 составим вспомогательный
функционал
а
4.4. Примеры задач на условный экстремум
131
и запишем для него уравнение Эйлера:
( ?/, ^
-1 = 0.
л d
λ-=—
dx
У
ФмуУ
)
Видно, что это уравнение допускает понижение порядка:
У
ФмуУ
■ - х - С\,
или
-——— -(Х + Сх) .
1+0/)2
Из этого уравнения найдем г/:
x+Ci
У' = ±
^-(x + CJ2
Решая это ОДУ первого порядка с разделяющимися перемен-
ными, получаем
у = ±^Х2-(х + С1)2+С2,
что равносильно
(х + С1)2+(у-С2)2=Х2.
Из краевых условий
находим:
(-а + Сг)2 + С\ =λ2, (а + Сг)2 +С2 =λ2
d = 0, Х2=С%+а2.
Таким образом, уравнение кривой сводится к следующему:
х2+(у-С2)2=С2+а2.
Длина дуги окружности может быть вычислена непосредст-
венно, и мы получим еще одно уравнение*:
* При этом следует учесть, что из двух дуг окружности, соединяю-
щих точки (-а, 0) и (а, 0), графиком функции является только меньшая.
132
4. Задачи на условный экстремум
2x[ci+a2 arcsin , = L,
которое заменой
t = —. fe
Ч
приводится к трансцендентному уравнению Lsint = 2at. Реше-
ние этого уравнения на промежутке (0, π/2] позволит опреде-
лить постоянную С2 при L < па.
Пример 4.3. Рассмотрим задачу выбора кривой наимень-
шей длины среди кривых на сфере х2 + у2 + z2 = α2, проходя-
щих через две данные точки {хъ уъ z±) и {х2, Уъ z2)*
Предположим, что в качестве параметра кривой можно
выбрать координату х (это возможно только при определен-
ных положениях концевых точек). Тогда кривая описывается
парой функций у(х), z(x), & длину кривой можно выразить
интегралом
Х2
JVy,z}=^l + {y'?4z)2dx.
Мы приходим к вариационной задаче поиска минимума функ-
ционала J[y, z] с краевыми условиями
У(*1) = У1, Ζ(Χ1) = Ζ1, У(Х2) = У2> Z(X2) = Z2 (4.28)
и фазовым ограничением
g(x,y,z) = х2 + у2 +z2 -а2 = 0.
Запишем вспомогательный функционал
*2
J[**]=J[Vi+<*^
dx.
*1
Два уравнения Эйлера для вспомогательного функционала и
условие связи в совокупности составляют систему трех урав-
нений относительно трех неизвестных функций у(х), z(x), X(x):
4.5. Принцип взаимности в изо периметрических задачах 133
— У - Щх)у = 0;
\dx jl + (y')2+(z')2
Ι — Z = - 2k(x)z = 0;
\dx ^Hy'fHz)2
[y2+z2+x2-a2 = 0.
Решение задачи следует искать среди решений этой системы,
удовлетворяющих краевым условиям (4.28). Однако решить
указанную систему весьма непросто.
4.5. Принцип взаимности в изопериметрических
задачах
Постоянство множителей Лагранжа в изопериметрической
задаче приводит к так называемому принципу взаимности,
или принципу двойственности.
В изопериметрической задаче (4Л), (4.2), (4.4) мы искали
экстремум функционала (4.1) при условии, что другие s функ-
ционалов принимают заданные значения L7, j = 1, s. Заметим,
что уравнение (4.24) для вспомогательного функционала в ме-
тоде множителей Лагранжа не изменится, если подынтеграль-
ное выражение умножить на некоторое постоянное число μ0.
Вводя обозначения
/о = А /; = hj9 μ j = μ0λ;, j = 1, s,
получаем
b s
В это выражение все функции /у входят симметричным
образом. Это означает, что в качестве подынтегральной функ-
ции целевого функционала можно выбрать любую из функ-
ций fj, а остальные отнести к изопериметрическим связям.
Другими словами, экстремали в задаче на экстремум, в кото-
рой интегрантом целевого функционала является функция /0>
а остальные функции fj отнесены к интегральным связям
(задача А), совпадают с экстремалями в задаче на экстремум
134
4. Задачи на условный экстремум
(задача В), в которой интегрантом целевого функционала яв-
ляется функция /т, а остальные функции /;- определяют изо-
периметрические условия
ь
]fj(x,y,y')2dx = Lj, j = О, 1,..., т - 1, т + 1,..., s.
а
При этом постоянная L0 равна экстремальному значению
функционала в задаче А, а остальные L} те же, что и в интег-
ральных связях (4.4). В качестве fm можно выбрать любую из
функций /х, ..., fB.
Описанное совпадение экстремалей и называют принципом
взаимности (принципом двойственности)♦ Например, задача
Д и доны (см. пример 4.2), состоящая в определении максималь-
ной площади фигуры при заданном периметре, двойственна
другой вариационной задаче, которая состоит в определении
минимального периметра при заданной площади. Обе эти зада-
чи имеют одни и те же экстремали, если максимум площади в
первой задаче задается как ограничение во второй.
Можно показать, что дуга окружности у* =\1а2 -х2, най-
денная в примере 4.2 как экстремаль функционала
а
-а
при заданной длине
а
-а
доставляет максимум этому функционалу, a J[y*] = πα2/2. Эта
же функция г/* = να2 -х2 доставляет минимум функционалу
длины К[у] при заданной площади J[y] = πα2/2.
4.6. Задача Больца и задача Майера
Анализ вариационных задач в зависимости от типа уравнений
связи (см. 4.1, 4.2) показывает, что задача Лагранжа является
наиболее общей. Другие задачи либо представляют собой част-
ные случаи задачи Лагранжа, либо сводятся к ней.
4.6. Задача Больца и задача Майера
135
Проведем классификацию вариационных задач по типу
целевого функционала. Задача (4.1)-(4.3) с интегральным
целевым функционалом
ь
а
представляет собой, как уже говорилось, задачу Лагранжа.
Если в задаче Лагранжа интегральный целевой функционал
заменить терминальным целевым функционалом
Т[у] = Т(у(а),у(Ъ)),
который определяется дважды непрерывно дифференцируе-
мой функцией T(yl9 у2), то получим задачу Майера. Задачу
со смешанным целевым функционалом
B[y] = J[y] + T[y]
называют задачей Больца. Во всех трех типах задач предпо-
лагается, что условия связи имеют вид (4.3), а краевые условия
в самом общем виде записываются следующим образом:
Ψ* (a,y(a),b,y(b)) = О, i = 1, з,
где количество s уравнений связано с размерностью η фазово-
го пространства неравенством s < 2п + 2.
Иногда задачу со смешанным целевым функционалом без
ограничений (т. е. без условий связи) называют элементар-
ной задачей Больца.
Задача Больца, так же как и задача Майера, может быть
сведена к задаче Лагранжа. Покажем это на примере задачи
Больца для целевого функционала вида
ь
BVy\ = \f{x,y,y')dx + T(y{b)) (4.29)
а
с дифференциальными связями (4.3) и краевыми условиями
у(а) = уК (4.30)
Отрезок [а, Ь] считаем фиксированным, а функцию Т(у) —
дважды непрерывно дифференцируемой.
136
4. Задачи на условный экстремум
Для рассматриваемой задачи
Т{у(а))_Т(у1)
Ъ-а
Ъ-а
= const,
так как a, ft, у1 в данной задаче фиксированы. Учитывая это,
терминальное слагаемое Т(у(Ъ)) в правой части (4.29) можно
преобразовать к виду
и
W)=J
α1-
Ъ-а dx
dx.
Это позволяет переписать целевой функционал (4.29) в интег-
ральной форме:
о-а ах
dx.
(4.31)
Видим, что задача Больца (4.29), (4.3), (4.30) эквивалентна
задаче Лагранжа для функционала (4.31) с теми же условия-
ми связи и краевыми условиями. Опираясь на эту эквивалент-
ность, докажем следующее утверждение.
Теорема 4.4. Если допустимая функция у*(х)е Сг([а9Ь]9Жп)
доставляет экстремум функционалу (4.29) с дифференциаль-
ными связями (4.3) и краевыми условиями (4.30), то сущест-
вует система из k функций λ^Χ), ..., Xk(x), при которых у*(х)
удовлетворяет системе уравнений Эйлера
d
— Li/. — Lj,. = 0,
dx Уь yi
i = l, n,
k
где L = f + 2\Xjgj — лагранжиан задачи (4.3), (4.29), (4.30),
и условиям трансверсальности
Μ Пусть вектор-функция у*(х) есть точка экстремума в зада-
че Больца (4.29), (4.3), (4.30). Тогда эта функция является
точкой экстремума и в задаче Лагранжа (4.31), (4.3), (4.30).
4.6. Задача Больца и задача Майера
137
Применим к задаче Лагранжа теорему 4.1. Согласно этой тео-
реме, найдутся такие функции Xj(x), j = 1, ky что у*{х) являет-
ся точкой экстремума для вспомогательного функционала
J Ь-а ах
dx, (4.32)
где L = f + ^Xjg}.
Запишем систему уравнений Эйлера для функциона-
ла (4.32):
^(f%l "(Пи =0, i = l~n, (4.33)
где
Преобразуем уравнения этой системы. Имеем
(/% =L'm+j-T'm, (/% =^+7*, i = UL (4.34)
Здесь при вычислении (Z*)'^ использовано равенство
£=1
Выражения для (f*)yi и (/*)^ подставим в уравнения сис-
темы (4.33):
1^—^=0, г = Ця, (4.35)
ах
которые в совокупности с дифференциальными связями (4.3)
составляют систему из η + k уравнений относительно η + k
неизвестных функций z/j(x), i = l, /г, и ХДх), у = 1, ft. Остается
записать условия трансверсальности на правом конце. Так как
138
4. Задачи на условный экстремум
Ь известно, а меняться может лишь значение у(Ь), приходим
к задаче с естественными краевыми условиями (см. 3,1)
(Г)
У1
= 0.
х-Ь
Учитывая (4.34), получаем
L'A = -Г'| , i = l~n. ► (4.36)
Уг\х=Ь Упх=Ь' ' V '
Замечание 4.2. Для функционала вида
ъ
B[y] = jf(x,y,y')dx + f[y{a)] + T[y(b)]
а
в случае фиксированного отрезка [а, Ь] и произвольных зна-
чений у(а) и у(Ь) (концы экстремали скользят по гиперплос-
костям х = аих = Ь)к условиям трансверсальности на правом
конце, т. е. при х = Ь, в теореме 4.4 следует добавить и условия
трансверсальности на левом конце:
и, I = г:
"Vi
х-а У'1
i = l, п. (4.37)
Замечание 4.3. Если в функционале (4.29) отсутствует
интегральное слагаемое (т. е. рассматривается задача Майера),
k
то лагранжиан L в теореме 4.4 имеет вид L = /^jSj-
y=i
Пример 4.4. Найдем экстремали функционала
2
B[y] = jx2(y')2dx-2y(l) + y2(2)
1
в классе функций C^l^].
Это элементарная задача Больца без условий связи и крае-
вых условий. В этом случае функция Лагранжа совпадает с
интегрантом целевого функционала и имеет вид L = f = х2(у')2.
Запишем для заданного функционала уравнение Эйлера:
:r(2*V)=o,
dxv '
откуда 2х2у* = С = const. Из этого уравнения найдем
Вопросы и задачи
139
/ С!
У = 5"»
где Ci - произвольная постоянная.
Решая последнее уравнение и учитывая, что х е [1, 2], по-
лучаем общее решение уравнения Эйлера:
X
(4.38)
Чтобы определить постоянные С\ и С2, используем условия
трансверсальности (4.36) и (4.37):
2х2у1х__2=-2у\х=2, 2*Н=1=-2·
Подставляя в эти уравнения представление (4.38) и решая
систему относительно Сх и С2, получаем Сх = 1, С2 = 1/2.
Таким образом, рассматриваемый функционал имеет един-
ственную экстремаль
у(х) = - + -.
х 2
Вопросы и задачи
4.1. Определите гладкие функции, на которых может до-
стигаться экстремум функционала в следующих вариацион-
ных задачах:
a) I[y,z] = j((y')2 +(z')2 -zy')dx, y = z + ex, у(0) = 2,
у(1) = е, z(0) =1, 2(1) =0;
π/2
б) I[y,z]= I ((y')2+(z')2-2zcosx-2y2}dx, y-z-2sinx,
π
i/(0) =1, У -| = 0, 2(0) =1, z
v2y
= 2;
140
4. Задачи на условный экстремум
π/2
в) 1[у,г\- {(у')2 +(г')2 -22'sinx}dx, y' = 2-cosx,
π \ π
у(0) = 0, у - = -, 2(0) = 1, 2
in)
ν2;
= 0;
JL
^) Дг/,г] = J(2xi/-(2')2)dx, */'- 2 + 2 = О, у(0) = О,
i/(l) = -, 2(0) = 2, 2(1) =3;
5
Д) 4y] = j(y')2dx, jy2dx = l, у(0) = 0, у(п) = 0;
о о
1
е) I[y,z] = jy'z'dx9 2/(0) = у(1) = 2(0) = 0, 2(1) =1,
о
1
хг/<2х = 0, Х2<2х = 0;
о о
1
ж) 1[у,г] = j((y')2 +(z')2)dx, y(0) = i/(l) = 2(0) = 2(1) = О,
о
1
yzdx = -2;
о
1
з) I[y,z] = jx(y-z)dx, i/(0) = 2(0) = 2(1) = 0, у(1) = 2,
о
4.2. Найдите геодезические линии кругового цилиндра
радиуса jR.
4.3. Найдите кратчайшее расстояние между двумя точками
А (0, 2, 4) и В (-1, V3, 2) на круговом цилиндре, ось которого
совпадает с одной из координатных осей.
Вопросы и задачи
141
4.4. Для следующих вариационных задач укажите тип, к
которому они относятся, и запишите полную систему необхо-
димых условий экстремума функционала:
ь
а) I[y] = jf(x,y')dx + T[y(b)]^extr, gj(x9y) = 09 j = hk
а
(k < п), y(a) = ya, a, b, ya = (z/f,..., y%) фиксированы;
ь
б) I[y] = jf(x,y)dx+T[y(a)]^>extr, gj(x,y') = Of j = l/k,
a
y(b) = 1Д α, b, уь = (г/f,..., уьп) фиксированы;
в) T[y(a)] + T[y(b)]^> extr, £,(х,^') = 0, у = 1, k (k<n),
α, b фиксированы.
4.5. Найдите экстремали следующих функционалов, опре-
деленных на множестве гладких функций:
1
a) m = j(ilf)2+y)dx-y2(l)t i/(0)= 1;
х
б) m = j(y')2dx + y2(0)-2y2a);
о
1
в) Лг/] = /((2/')2+У2)^-28Ы-г/{1);
о
3
г) I[y] = J4(y')2y2dx + yH0)-8y(3);
π/2
t *r\ ( ft λ
Д) Дг/]= j {(y')2-y2)dx+y40)-y2 I)+iy
v2y
v2;
4.6. Обобщите утверждение и доказательство теоремы 4.2
на случай функционала, зависящего от η функций при k фа-
зовых ограничениях.
5. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
Необходимое условие экстремума функционала состоит в том,
что первая вариация этого функционала обращается в нуль.
Это обобщает необходимое условие экстремума функции мно-
гих (в том числе одного) переменных. Достаточное условие
экстремума функции многих переменных базируется на пове-
дении второго дифференциала функции в исследуемой точке.
Аналогичная ситуация и в вариационном исчислении: вво-
дится понятие второй вариации, обобщающее понятие второго
дифференциала; достаточные условия экстремума строятся
на поведении этой вариации вблизи исследуемой экстремали.
Напомним, что в вариационном исчислении различают
сильный экстремум, при котором рассматриваются произ-
вольные непрерывные функции, и слабый экстремум, кото-
рый формулируется в классе непрерывно дифференцируемых
функций.
5.1. Слабый экстремум
Квадратичный функционал и вторая вариация. Отображе-
ние /: Ε2 —> Μ, которое каждой паре х и у элементов линей-
ного пространства Ε ставит в соответствие число f(x, у), на-
зывают билинейной формой, если это отображение линейно
по каждому аргументу, т. е. для любых значений аргументов
выполняются равенства
/(CliZi + <*2#2, У) = Cti/(Xi, у) + Ct2/(*2, У),
f(x,a1y1+a2y2) = aif(x,yi) + U2f(x>y2)-
В функциональном анализе, изучающем бесконечномерные
линейные пространства, и, в частности, в вариационном ис-
5.1. Слабый экстремум
143
числении билинейные формы принято называть билинейны-
ми функционалами. Если в билинейном функционале J[y, z]
приравнять аргументы, мы получим функцию G[y] = J[z/, у]
на линейном пространстве, которую называют квадратич-
ным функционалом. Квадратичный функционал G[y] по-
ложительно определен, если G[y] > О при любом у φ О и
неотрицательно определен^ если G[y] > О при любом у φ 0.
Пример 5.1. В линейном пространстве С[а, Ь] для любой
непрерывной на отрезке [а, 6] функции А(х) функционал
ь
J[y, 2] = | А(х) у(х)г(х) dx
а
является билинейным, а функционал
ъ
G[y] = J[y,y] = JA(x)(y(x)fdx
а
является квадратичным. Функционал G[y] положительно
определен, если А(х) > 0 на отрезке [а, Ь].
Пример 5.2. В линейном пространстве Сг[а, Ь] функционал
ъ
G[y] = j(A(x)y2+2B(x)yy'+C(x)(y'f)dx,
а
где А, В, С — непрерывные функции, является квадратичным,
так как он соответствует билинейному функционалу
ь
J\y-> ΖΛ - {Мх)уг + B{x)(yz + у'г) + C{x)yz)dx. #
а
Говорят, что функционал J[z/], определенный на некото-
ром нормированном пространстве, дважды дифференцируем
в точке г/, если его приращение AJ = J[y + 6у] - J[y] предста-
вимо в виде
Δ^ = δ^,δ#] + δν[1/,δ*,] + ο(||δΙ/||2), (5.1)
где 82J[y,8y] — квадратичный функционал по переменной 5г/,
называемый второй вариацией функционала J[y] в точке г/,
ao(||6i/||2)/|^i/||2^0 при6у-»0.
144
5. Достаточные условия экстремума
Если представление (5Л) для функционала J[y] существу-
ет, то оно единственно и, значит, вторая вариация определена
однозначно.
Теорема 5.1. Если функционал J[y] в точке у дважды диф-
ференцируем и имеет минимум (максимум), то 52J[z/,5i/]>0
(52J[i/,5y] < 0) при любом Ьу.
Л Доказательство теоремы проведем лишь в случае минимума,
так как для случая максимума доказательство аналогично.
Если функция у является точкой минимума функционала
J[y], то, согласно необходимому условию экстремума функ-
ционала, на функции у первая вариация функционала равна
нулю: bJ[yfiy] = 0. Поэтому представление (5.1) в этой точке
имеет вид
M = b2J[y,6y] + o(\\by\\2)>0.
Зафиксируем вариацию Ьу и рассмотрим приращение функ-
ционала, соответствующее вариации thy, где t — положитель-
ное число. Для этого приращения верно неравенство
δ2J[y,tby] + <4 thy||2) = i282J[y,by] + o(t2 \\8y\\2)>0,
или
5У[у,5у] o(||%||2Kfl
\\Ы2 11%II2 " '
Первое слагаемое в последнем неравенстве не зависит от i, в
то время как второе выбором досточно малого t может быть
сделано менее наперед заданного числа ε > 0, Значит, для
любого ε > 0
52J[j/,6pK г
18И*
откуда следует, что
\\Ы2 ~
и
32J[y,6y]>0.
Так как ду можно выбирать произвольно, заключаем, что
квадратичный функционал §2J[y,$y] неотрицательно опре-
делен: 52J[y,5z/]>0. ►
5.1. Слабый экстремум
145
Замечание 5.1. Неотрицательная определенность второй
вариации является условием необходимым, но не достаточным
для экстремума функционала. Это верно даже в случае функ-
ций одного переменного [II].
Говорят, что квадратичный функционал G[z/], определен-
ный в нормированном пространстве, сильно положителен,
если можно указать такое число К > О, что для любого у вы-
полняется неравенство G[y] > K\\y\\2. В конечномерном случае
квадратичный функционал представляет собой квадратичную
форму, а сильная положительность квадратичного функцио-
нала равносильна его положительной определенности (в ка-
честве К можно взять наименьшее из собственных значений
матрицы квадратичной формы). Но в бесконечномерном слу-
чае это уже не так.
Теорема 5.2. Если у дважды дифференцируемого функцио-
нала J[y], определенного в нормированном пространстве,
первая вариация в точке у* равна нулю, а вторая вариация в
этой точке сильно положительна, то функционал J[y] имеет
в точке у* минимум. #
Обсудим приведенные результаты в случае простейшей
задачи вариационного исчисления. Вычислим вторую вариа-
цию функционала
ь
а
заданного на множестве функций у е Сх[а, Ь], удовлетворяю-
щих краевым условиям у(а) = уъ у{Ь) = у2- Вариация функции
Ъу для такого функционала удовлетворяет однородным крае-
вым условиям Ьу(а) = ду(Ь) = 0. Считаем, что интегрант / функ-
ционала J[y] является дважды непрерывно дифференцируе-
мой функцией. Тогда, согласно формуле Тейлора, имеем
ь
J[y+by]-J[y] = j{ffiy+ffiyyx+
а
ь
+|{(u№)2+2i^^+^ir'(V)2)^+o(l^|g1)> (5.2)
α
где о(\\Ьу\\2с1)/1|ЬуР ^>0 при |δφ->0.
146
5. Достаточные условия экстремума
Представление (5.2) показывает, что
ъ
5V[^,8y] = ±J(/^ (5.3)
а
Используя интегрирование по частям и краевые условия
для вариации Ьу, получаем
ь ъ
2JQbyby'dx = JQd((by)2) =
а а
что позволяет записать соотношение (5.3) в следующем виде:
ъ
(5.4)
δ *J\y, бу] = j(Q(by)2 + Р(Ьу')2) dx,
где
Q=2
If d N
hy~~dxhy
V
P = -f
Замечание 5.2. Если мала функция 5i/, то мала и Ъу, так
как с учетом краевого условия Ьу(а) = О
X
dy(x) = jby'(t)dt
а
и в силу теоремы об оценке интеграла
X
| Ъу{х) \< [| by\t)\dt <max 18y\t)\(b-a).
J [a,b]
a
Обратное неверно, так как малость функции не означает, что
мала производная (пример: h(x) = 8sin(x/8)). Это говорит о
том, что в представлении (5.4) второй вариации основную роль
играет слагаемое Р(ду')2. Знак второй вариации зависит от
знака указанного слагаемого.
5.1. Слабый экстремум
147
Теорема 5.3. Если квадратичный функционал
υ
G\h\ = ((Q(x)h2 + P(x)(h')2) dx,
заданный на линейном пространстве функций h e Сг[а, Ь],
удовлетворяющих однородным краевым условиям h(a) =
h(b) = О, неотрицательно определен, а функция Ρ непрерывна,
то Р(х) > О всюду на отрезке [а, Ь].
Μ Предположим, что непрерывная функция Р(х) не является
неотрицательной на всем отрезке [а, Ь]. Тогда можно выбрать
точку х0 е (а, Ь) и некоторую ее окрестность (х0 - τ, х0 + τ) е
е [а, Ь], в которой выполняется неравенство Р(х) < Р(х0)/2 < 0.
Если функция h e Сг[а, Ь] тождественно не равна нулю, но
равна нулю вне интервала (х0 - τ, х0 + τ), то
и
\p{x)(ti)2dx<0,
так как функция Ы непрерывна и отлична от нуля хотя бы
в одной точке. Выберем функцию h указанного типа так,
чтобы этот интеграл оставался
отрицательным, а первое слагае- У \
мое Qh2 в подынтегральном вы-
ражении функционала G[h] дава-
ло как можно меньший интег- О
рал. Пусть h'(x) = 1 при х0 + δ/З <
< х < х0 + 2δ/3 при общем огра-
ничении \h'(x)\ < 1 (рис. 5.1).
Тогда
Рис. 5.1
л л хоти
\h(x)\<f\h'(t)\dt= f \h\t)\dt< \ \ti{t)\dt<2b
и
xq-6
Л
JQh2dx\< f \Q\h2dx<8Mb3,
a | xo -δ
где Μ — максимальное значение функции Q на отрезке [а, Ь].
148
5. Достаточные условия экстремума
Но в то же время
[p(x)(h')2dx = f P(x)(h')2dx<
a XQ-&
Λ:ο+2δ/3 *0+2δ/3
< J* P(x)(h')2dx< J* ^^-dx = -C8t
JCO+5/3 *0+δ/3
где С = -P(x0)/6 > О не зависит от δ. В результате получаем, что
G[h] < -Сд + 8Μδ3. Нетрудно увидеть, что независимо от зна-
чений Μ и С при достаточно малом δ будет выполняться нера-
венство G[h] < О, которое противоречит условию теоремы. ►
Теорема 5.4. Если функционал J[y] в простейшей задаче
вариационного исчисления достигает на функции у(х) мини-
мума, то выполняется условие Лежандра
%у'(х,У(х)>У'(х))*0- (5.5)
Μ Согласно теореме 5.1, для точки экстремума у выполняет-
ся соотношение 82J[y,8y] > 0, которое в силу представления
(5.4) можно записать в виде
ъ
j(Q$y)2+P(dy')2)dx>0.
а
Согласно теореме 5.3, Р(х) > О всюду на отрезке [а, Ь]. Учиты-
вая вид функции Р(х), получаем (5.5). ►
Итак, при исследовании функционала на экстремум важ-
нейшую роль играет поведение его второй вариации, яв-
ляющейся квадратичным функционалом. Рассмотрим ква-
дратичный функционал (5.4) на функциях Л, для которых
h(a) = h(b) = 0. Как было показано, необходимым условием
неотрицательной определенности этого функционала является
неравенство Р(х) > 0, х е [а, 6].
Запишем для функционала (5.4) уравнение Эйлера. В со-
вокупности с краевыми условиями получим краевую задачу
для ОДУ:
—(Ph')-Qh = 0, h(a) = h(b) = 0. (5.6)
dx
5.1. Слабый экстремум
149
Эта задача имеет очевидное решение h(x) = О, но могут суще-
ствовать и нетривиальные решения.
Рассмотрим ненулевое решение h(x) краевой задачи (5.6).
Если точка хе(а, Ь] такова, что h(x) = 0> в то время как
h(x) ■*■ О при а < х < х, то точку х назовем сопряженной точ-
ке а. Итак, точки а и Ъ сопряженные, если краевая задача (5.6)
имеет решение, не обращающееся в нуль на (а, Ъ). Отсутствие
на полуинтервале (а, Ь] точек, сопряженных точке а, означает,
что задача (5.6) не имеет ненулевых решений.
Теорема 5.5. Пусть функции Р{х) и Q(x) непрерывны на
отрезке [а, Ь] и Р(х) > О, х е [а, Ь]. Тогда для положительной
определенности функционала
ь
\{Qh2+P(ti)2)dx,
а
заданного на множестве функций h e Сг[а, Ь], для которых
h(a) = h(b) = 0, необходимо и достаточно, чтобы на этом отрез-
ке не было точек, сопряженных точке а. #
Итак, чтобы проверить квадратичный функционал на по-
ложительную определенность, нужно исследовать краевую за-
дачу (5.6) и выяснить, имеет ли она нетривиальные решения.
Отсутствие нетривиальных решений означает, что квадратич-
ный функционал положительно определен.
Вернемся к простейшей задаче вариационного исчисления
ъ
J[y] = J f(x> У, У) dx, y(a) = ya, y(b) = yb, (5.7)
а
где / — дважды дифференцируемая функция; у е Сг[а9 Ъ].
После выявления функций, удовлетворяющих необходи-
мому условию экстремума функционала, т. е. экстремалей,
дальнейшее исследование этих функций связано с анализом
на них второй вариации
ь
b2J[yM = \{Q(by)2+P$y')2)dx, (5.8)
а
являющейся квадратичным функционалом. Здесь
150
5. Достаточные условия экстремума
Р = р(х) = -fy>y> (x,y(x),y'(x))9
V
2
Уравнение Эйлера
-?-(Pby')-Qby = 0
ах
квадратичного функционала 62J[z/, by] (5.8) называют уравне-
нием Якоби исходного функционала J[y] задачи (5.7). Точку
х ε (α, Ъ) называют сопряженной точке а в смысле функцио-
нала J[y]9 если эта точка является сопряженной точке а в
смысле квадратичного функционала 52JQ/, 8y].
Теорема 5.6 (достаточные условия слабого минимума).
Функция у g Сг[а, Ь] доставляет слабый экстремум функцио-
налу J[y] в простейшей задаче вариационного исчисле-
ния (5.7), если одновременно:
1) функция у(х) является экстремалью функционала J[y];
2) для этой функции выполняется усиленное условие
Лежандра
P(x) = -fy>y{x,y(x),y'(x))>0, xe (а,Ь);
3) на интервале (а, Ъ) нет точек, сопряженных точке а в
смысле функционала J[y] (усиленное условие Якоби). #
Функционалы от нескольких функций. Все сказанное вы-
ше естественным образом переносится на общий случай функ-
ционалов, зависящих от нескольких функций. На линейном
пространстве (^([а, Ь], Шп) непрерывно дифференцируемых
вектор-функций рассмотрим функционал
ъ
J\y] = y(x,y>y')dx, (5.9)
а
где функция / дважды непрерывно дифференцируема; у(х) =
= (Уг(х), 2/2(*)> ■··> Уп(*))-
5.1. Слабый экстремум
151
Если приращение AJ[y, 5у] рассматриваемого функционала
J[y], соответствующее вариации функции ду = (5г/1? ·.., 5г/л),
имеет вид
Ы[у, δρ ] = J[y + by] - J[y] = Ы[у9 &y] + δ2 J\y9 by] + o(|| by \\2cl),
где b2J[y,by] — квадратичный функционал на пространстве
вектор-функций Зу, то функционал J[y] будем называть дваж-
ды дифференцируемым, а функционал b2J[y,8y] — второй
вариацией функционала J[y] в точке у.
При фиксированных концах вариация 8у должна удовлет-
ворять условиям Ьу(а) = Ьу(Ь) = 0. Будем также считать, что
интегрант / является дважды дифференцируемой функцией.
Используя, как и в одномерном случае, формулу Тейлора,
получаем выражение для второй вариации функционала:
ь
δ 2J[y, by] = \\{^Γπ by* + ЩТу'у δ!/τ + ЬуТуу {by'Y)dx,
где fy\, fy'y, fy'y' —матрицы Гессе интегранта f, отвечающие
соответствующим переменным.
Как и в одномерном случае, можно применить правило
интегрирования по частям. В результате получим
ь
b2J[y,by]=j(by'P(by'r +бглэбут)<г*, (5.ю)
где
1,. Λ lf«, d ,„ Л
P = 2f"> Q=2
f —— f
Tyy ^Tyy
В общем случае основную роль во второй вариации также
играет слагаемое 5i/'P(5i/')T. Запишем систему уравнений Эй-
лера для квадратичного функционала, используя матричную
запись:
— (P(h'y)-QhT=Q (5.11)
(в правой части уравнения стоит нулевой столбец соответст-
вующей высоты). Систему (5.11) называют системой Якоби
функционала J[y].
152
5. Достаточные условия экстремума
При фиксированной вектор-функции у элементы мат-
риц Ρ и Q в представлении (5.10) зависят только от х, так как
они не зависят от компонент вектор-функции 5у. Поэтому
система Якоби (5.11) — это система линейных дифференци-
альных уравнений порядка не выше двух относительно ком-
понент вектор-функции ft, удовлетворяющая теореме суще-
ствования и единственности в каждой точке х, для которой
detP(x)*0.
Рассмотрим решения ht системы (5.11), удовлетворяющие
начальным условиям кь(а) = 0, h'(a) = е^ где el9 е2) ·■·» еп —
стандартный базис в Rn (т. е. у вектора еь отлична от нуля
лишь i-я компонента, которая равна единице). Значения этих
решений в точке х линейно независимы, если эта точка доста-
точно близка к точке а, т. е. Ah(x) = det(hi(x)7 ...,/in(x)) ^0.
Здесь использована блочная структура записи:
hint*)}
J
где Μ*) = (Λα,Λ/2,..., Ain).
Если точка х такова, что Ah(x) = 0, в то время как Ah(x) Ψ Ο
при а<х<х, то точку х назовем сопряженной точке а в смы-
сле функционала J[y].
Достаточные условия скалярного случая без изменений
обобщаются на векторный случай.
Теорема 5.7. Пусть функционал
ь
JYvl^yiXtVtvWx,
а
где / — дважды непрерывно дифференцируемая функция,
определен на множестве вектор-функций уе С1(\а,Ь\, Шп),
удовлетворяющих краевым условиям
у(а) = Уъ У(Ь) = у2.
Ых)
hn(x)
fftii(x) h12(x)
h2i(x) h22(x)
hni(x) hn2(x)
5.2. Условие Якоби
153
Функция у* доставляет минимум функционалу J[y}9 если од-
новременно выполняется следующее:
1) функция у* является экстремалью функционала J[y];
2) функция у* удовлетворяет усиленному условию Ле-
жандра
4V {х>у(х)>у'(х)) >°> хе (а>ъ)
(т. е. матрица /^у положительно определена при указанных
значениях х);
3) отрезок [а, Ь] не содержит точек, сопряженных точке а
в смысле функцонала J[y].
5.2. Условие Якоби
Рассмотрим функционал
ъ
J[y] = )f(x,y,y')dy
а
с дважды непрерывно дифференцируемым интегрантом /,
определенный на линейном пространстве Сг[а, Ь]. Если функ-
ционал J[y] не является вырожденным, множество его экс-
тремалей, проходящих через фиксированную точку (а, г/а),
образует однопараметрическое семейство, при этом в качестве
параметра можно взять угол наклона экстремали в точке
(а, уа). Если это семейство заполняет сплошь некоторую об-
ласть Del2, причем через каждую точку области D проходит
ровно одна экстремаль, то мы будем говорить, что в области D
задано поле экстремалей.
Поле экстремалей, заданное в области D, позволяет в этой
области определить функциюр(х,у). Значением этой функции
является значение тангенса угла наклона экстремали в точке
(х, у)> т. е. р(х, у) есть производная той экстремали z/(x), зна-
чение которой в точке х равно у. Функцию р(х,у) называют
наклоном поля экстремалей.
Рассмотрим экстремаль у*(х), проходящую через точку
(а, уа). Будем говорить, что эта экстремаль включена в поле
154
5. Достаточные условия экстремума
Уа
О
У*(х)
Рис. 5.2
экстремалей на отрезке [a, ft],
если можно указать такую область
DcR2, которая содержит график
функции у*(х)9 х е (a, ft], и в кото-
рой можно задать поле экстрема-
лей рассматриваемого функциона-
ла (рис. 5.2).
Теорема 5.8 (условие Якоби). Для того чтобы экстре-
маль у*(х) функционала J[y] можно было включить на
отрезке [a, ft] в поле экстремалей, достаточно, чтобы на интер-
вале (a, ft) не было точек, сопряженных точке а в смысле
функционала J[y]. #
Напомним, что отсутствие точек, сопряженных точке а,
равносильно отсутствию у краевой задачи (5.6) нетривиаль-
ных решений.
Пример 5.3. Проверим выполнение условия Якоби для
экстремалей функционала J[y] в вариационной задаче
ъ
J[y] = j((y')2-y2)dx^extr, i/(0) = 0, у(Ь) = 0.
Уравнение Эйлера рассматриваемого функционала име-
ет вид
£(2,')-(-2,) = 0,
или у" + у = 0. Единственным решением этого уравнения,
удовлетворяющим поставленным краевым условиям, являет-
ся функция у(х) ξ 0. Вычисляем коэффициенты Р(х) и Q(x)
для второй вариации функционала:
2
p(x)=-f;Y=i,
Q{X)=2
(
= -1.
Краевая задача (5.6) для уравнения Якоби в данном случае
имеет вид
\h"+h = 0,
\h(0) = 0, h(x) = 0,
где xg (0, b].
5.3. Инвариантный интеграл Гильберта
155
Общее решение ОДУ в краевой задаче имеет вид
h(x) = Сг cos x + C2 sin x.
Из краевого условия h(0) = 0 находим С γ = О* А второе краевое
условие приводит к уравнению C2sinx = 0, или, так как h(x)
должно быть нетривиальным, sinx = 0.
Полученное уравнение имеет решения x = kn, йе N. По-
ставленная краевая задача не будет иметь нетривиальных
решений, если ни одно из значений kn не попадет на проме-
жуток (0, 6], т. е. при Ъ < π. Таким образом, условие Якоби
для рассматриваемого функционала выполнено, если Ь < π,
и не выполнено при &>π. При Ь < π экстремаль у*(х) = О
включается в поле экстремалей у(х,С2) = C2sinx на отрезке
[О, 6).
Обратим внимание на то, что экстремаль у*(х) = О доставля-
ет слабый минимум функционалу в рассматриваемой задаче,
так как выполняются все условия теоремы 5.6.
5.3. Инвариантный интеграл Гильберта
Пусть в простейшей задаче вариационного исчисления (5· 7)
экстремаль у*(х) е С1\а,Ъ\ включается в поле экстремалей,
определенное в некоторой области D. Тогда в D определена
функция р(х,у) наклона поля экстремалей. Выберем такую
допустимую функцию г/(х), график которой, за исключением
начальной точки (а, уа)9 попадает в область D. Интеграл
ь
x9y(x),y'(x))dx9
а
задающий значение функционала J[y] рассматриваемой вари-
ационной задачи на функции у(х), можно интерпретировать
как криволинейный интеграл
J f(x,y,y')dx,
Г(у)
вычисляемый вдоль кривой Г(г/), которая параметрически за-
писывается в виде
«
156
5. Достаточные условия экстремума
\у = №, (5-12)
[y'=y'(t).
Поэтому приращение Ae/[i/\ by] функционала J[y] можно за-
писать как разность криволинейных интегралов, соответству-
ющих функциям у* и у - у* + By:
&J[y\by] = j f(x,y,y')dx- J f(x,y,y)dx.
Пу) IV)
Криволинейный интеграл
G(y)= j [f{x,y,P(x,y)) + (y'-p(x,y))fy'(x,y,P(x,y)\\dx,
Пу)
где кривая Т(у) соответствует экстремали у(х), график которой
попадает в область D, называют инвариантным интегралом
Гильберта.
Учитывая специфику кривой Т(у), которая параметриче-
ски описывается системой (5.12), подынтегральное выраже-
ние интеграла Гильберта можно преобразовать следующим
образом:
[f(x,y,p(x,y))+{y'-p(x,y))fy'(x,y,p(x>y))]dx =
= [f(x, у, р(х, у)) - р(х, y)fy' (х, у, р(х, у))] dx +
+ fy' (x> У у Р(х> У)) dy = R(x, y)dx + Q(x, y)dy,
где
R(x,y) = f(x,y,p(x,y))-p(x,y)fy'{x,y,p(x,y)),
Q(x,y) = fy'(x,y,p(x,y))-
Поэтому инвариантный интеграл Гильберта равен:
G(y)= J R(x,y)dx + Q(x,y)dy. (5.13)
Пу)
Но в этой форме в интеграл не входит третья координата у'.
Значит, его можно рассматривать как криволинейный
5.3. Инвариантный интеграл Гильберта
157
интеграл в плоскости хОу, взятый вдоль графика Т0(у) функ-
ции у(х):
G(y)= J* R(x,y)dx + Q(x,y)dy. (5.14)
Го (у)
Отметим, что интеграл Гильберта, взятый вдоль экстрема-
ли, совпадает со значением функционала на этой экстремали:
j [f(x,y,P(x>y)) + (y'-p(x,y))fi'(x,y,P(x,y))]dx =
г(/)
ь
= | f(x9y,y^dx = jf(x9y*(xMy*)Xx))dx = J[y*],
Пу*) а
так как р(х, у) = (у*)'(х) на кривой T(i/*).
Оказывается, что интеграл (5· 14), как и (5.13), не зависит
от пути интегрирования, т. е. подынтегральное выражение яв-
ляется полным дифференциалом. Действительно, область D,
охватывающую график экстремали г/*(х), можно считать одно-
связной. Поэтому подынтегральное выражение R(x, y)dx +
+ Q(x, y)dy будет полным дифференциалом, если R'y -Q'x = 0.
Убедимся в выполнении этого равенства в каждой точке обла-
сти D. Имеем
R'y-Q'x=fy+ fy'Py - p'yfy> - ρ (fy>y + fy>y>Py) -
~fyx - fy'y'Px = fy ~ fyx ~ fyyP ~ fy'y {p'x+PPy)· (5Л5)
Предполагая, что функционал J[y] не является вырожденным,
раскроем уравнение Эйлера этого функционала:
— fy-fy^fyx+fyyV+fy^y-fy^. (5.16)
Отметим, что
р(х9у(х)) = у'(х) (5.17)
для экстремали у(х), откуда, дифференцируя, получаем
Рх+РуУ' = У"· (5·18)
158
5. Достаточные условия экстремума
Соотношения (5.17) и (5.18) позволяют исключить из уравне-
ния (5.16) производные у' и у":
fy'x + fy'yP + fy'y' (Рх + РуР) ~fi=0.
Полученное уравнение в совокупности с (5.15) приводит к
тождеству Ry-Q'x =0.
5.4. Сильный экстремум
Итак, если в области D задано поле экстремалей, то инвариант-
ный интеграл Гильберта не зависит от кривой, соединяющей в
D точки (а, уа) и (fr, yb), a на экстремали у = у*(х), включенной в
это поле, совпадает со значением функционала</[*/*]. Значит, из-
учая приращение функционала, соответствующее вариации 5i/,
можно заменить значение функционала на экстремали значе-
нием интеграла Гильберта, взятого вдоль графика функции у =
-ψ +Ъу (если Ъу достаточно мало по норме ||||с, то эта функция
попадает в область D, в которой определено поле экстремалей).
В результате получаем
&J[y\by] = J[y]-J[y*]= J f(x,y,y')dx- J f(x,y,y')dx =
Пу) Пу*)
= J f{x,y,y')dx-G(y*)= j f{x,y,y)dx-G(y)^
Пу) Пу)
= J {f{x,y,y')-f{x>yiP)-(y'-P)fy'(x,y,P))dx.
Пу)
Функцию
Щх,г/,ρ,у) = f(x,у,у)-f{x,г/,ρ)-iy -p)fy(x,у,р),
являющуюся подынтегральной для последнего интеграла, назы-
вают функцией Вейерштрасса. С помощью этой функции при-
ращение функционала можно записать следующим образом:
M[y\Sy]= J E(x,y,pix,y),y)dx,
Пу)
где у = у*+ ду.
5.4. Сильный экстремум
159
Отметим, что при у = у*(х), i/ = (у*'(х)) (короче говоря, на
экстремали) функция Вейерштрасса равна нулю, так как при
этомр(х, у*(х)) = (у*'(х)).
Функция Вейерштрасса позволяет анализировать при-
ращение функционала. Если Е(х> у> р, у') > О в окрестности
графика данной функции у*(х), то эта функция — точка ми-
нимума функционала. Если же Е(ху у, р, у') < О в окрестности
графика данной функции у*(х), то у*(х) — точка максимума
функционала.
Функция Вейерштрасса оказывается весьма эффективным
инструментом исследования конкретных функций на экстре-
мум для данного функционала. При этом такое исследование
возможно с точки зрения как сильного экстремума, так и сла-
бого экстремума. При исследовании на слабый экстремум фик-
сированной функции у*(х) необходимо проверить на знак функ-
цию Вейерштрасса в точках, близких к точкам кривой Г(#*),
т. е. определить знак Е(х, у, р(х, у), if) для таких троек (х, г/, yf),
которые близки к тройке чисел (х, у*(х), (у*У(х)). Если в таких
точках Е(х, у, р(х, у), у*) сохраняет знак, то функция у*(х) —
слабый экстремум.
При исследовании вопроса, является ли функция у*(х) точ-
кой сильного экстремума функционала, изучают знак функ-
ции Вейерштрасса для таких троек (х, у, у'), для которых у
близко к у*(х). Функция Вейерштрасса должна сохранять свой
знак при любых изменениях аргумента у\ так как величина
у'(х) не влияет на степень близости функций у*(х) и у(х) по
норме || · ||с.
Известно*, что если функция Вейерштрасса, будучи непре-
рывной, в каких-либо точках (х, у*(х)> р(х, у*(х))> уг) меняет
знак, т. е. при некоторых значениях г/ она положительна, а
при некоторых — отрицательна, то у*(х) не является точкой
экстремума функционала. Если такое изменение знака при-
ходится на точки (я, у*(х), р(х, у*(х)), (у*У(х))> т. е. на точки
графика исследуемой функции, то эта функция не доставляет
и слабый экстремум.
Пример 5.4· Исследуем на экстремум функционал
ъ
J[y] = j(y')3dx,
О
* См., например: Гелъфанд И.М., Фомин СВ.
160
5. Достаточные условия экстремума
определенный на множестве функций у е С1 [0, ft], удовлет-
воряющих краевым условиям г/(0) = 0, y(b) = yb(b > 0, уъ > 0).
Уравнение Эйлера исследуемого функционала J[y] имеет
вид (3(г/)2У = 0, или у'у" = 0. Оно распадается на два дифферен-
циальных уравнения i/ = 0 и у" = 0, которые несложно решить.
Общее решение уравнения можно записать в виде у = С\Х + С2·
Выбрав среди экстремалей те, что удовлетворяют левому крае-
вому условию у(0) = 0, получим однопараметрическое семейст-
во у(х,С) = Сх функций, из них единственная функция у*(х) =
= (Уъ/Ь)х удовлетворяет и правому краевому условию·
Выясним, является ли функция у*(х) точкой экстремума
для функционала J\y\. Отметим, что эта функция включается
в поле экстремалей, так как через любую точку (х9 у) из пер-
вого квадранта плоскости проходит единственная экстремаль
семейства у = Сх. В качестве области D, в которой задано поле
экстремалей, можно взять область {(х, у): х > 0, у > 0}.
Через точку (х,у) из области D проходит экстремаль у(х) =
= (у/х)х, для которой у\х)-у/х. Значит, функция наклона
поля экстремалей имеет вид р(х, у) - у/х. Составим функцию
Вейерштрасса, учитывая вид интегранта f(x, у, у') = (у')г:
E(x>y,p,y') = f(x,y,y')-f(x,y,p)-(y'-p)fyix,y,p) =
= W)z-Pz-iy-P)^P2)-{y-P){{yr
= (У'-Р)2(У' + 2Р)·
Первый сомножитель {у-р)2 в функции Вейерштрасса
на знак не влияет, так что нужно проверить на знак функцию
φ(#, У у У*) = Уг + 2/?(х, у) = у' + 2у/х. На исследуемой функции
У = (Уь/Ь)х имеем ф(х,#,#0 = (*/&/&) + Жу&/&)>0· Это же неравен-
ство сохраняется и в ближайшей окрестности графика этой
функции, например при у > 0 и if > 0. Значит, функция у*(х)
доставляет функционалу слабый экстремум. В то же время вид-
но, что, каковы бы ни были хиу9 выбором переменного г/ мож-
но придать как положительное, так и отрицательное значение
функции Вейерштрасса. Следовательно, функция у*(х) не яв-
ляется точкой сильного экстремума функционала J[y]. #
Приведенный пример достаточно прост, и исследование
функции Вейерштрасса не потребовало особых усилий. В бо-
лее сложных случаях задача исследования функции Вейер-
5.4. Сильный экстремум
161
штрасса может оказаться не такой элементарной. Тогда могут
быть полезны другие, более простые достаточные условия, из
которых вытекает знакопостоянство функции Вейерштрасса.
Если функция /(х, у, у') дважды непрерывно дифференци-
руема, то к ней можно применить формулу Тейлора:
f(x,y,y') = f(x,y,p)+(у -p)fy'(х,у,ρ) + У Р fyy(z,у,q),
raeq=p + v(yf -ρ), 0 < ν < 1.
Значит,
Е(х, у, р,у')= у р fyy (x, у, д),
и знак функции Вейерштрасса определяется значением fy>y> в
некоторой точке (х, у, q).
Таким образом, если /£у > 0 всюду в области определения
функции /, то функция Вейерштрасса сохраняет знак и любая
экстремаль, удовлетворяющая краевым условиям, является
точкой сильного экстремума функционала· В более сложных
случаях необходимо проверять знак /£у в таких точках (х,у,]/),
для которых точка (я, у) близка к графику исследуемой функ-
ции у*(х), а г/ произвольно. Если при указанных условиях /£у
сохраняет знак, то у*(х) является точкой сильного экстремума.
Наконец, если /£у сохраняет знак в точках (х, у, у'), близких
к (х, у*(х), (у*У(х)), т. е. для функций, близких к у*(х) по нор-
ме || ■ ||ci, то у*(х) будет точкой слабого экстремума функционала*
Условие
%у'(х> У> У) > 0 или f!v(x> Уг> У) < °
знакопостоянства производной /*у называют усиленным усло-
вием Лежандра.
Пример 5.5. Исследуем на экстремум функционал
о ^
определенный на множестве функций у(х)еС1[09Ь]9 удовлет-
воряющих краевым условиям у(0) = О, уф) = уь (&, уь > 0).
162
5. Достаточные условия экстремума
Рассматриваемый функционал отличается лишь посто-
янным множителем от функционала задачи о брахистохроне
(см. пример 1.2). Его экстремали параметрически задаются в
следующем виде (см. пример 2.7):
^ = C1(e-sin9);
(5.19)
i/ = ад-cos©),
причем, каковы бы ни были значения Ъ > О и уъ > О, через
точку (6, уь) проходит единственная экстремаль. Это значит,
что в области D = {(я, у): х > О, у > 0} задано поле экстрема-
лей, а любая экстремаль рассматриваемого семейства оказы-
вается включенной в это поле. Однако записать функцию
наклона аналитическим выражением не удается, так как
нужно решать трансцендентное уравнение. Но можно прове-
рить усиленное условие Лежандра. Имеем
/', = У- , f, , = > о
Таким образом, единственная функция, которая параметри-
чески задается системой (5.19) и удовлетворяет поставлен-
ным краевым условиям, доставляет сильный минимум рас-
сматриваемому функционалу.
Вопросы и задачи
5.1. Проверьте, выполнено ли условие Якоби для экстре-
мали функционала
ь
J[y] = j(ex2-4y2+(y')2)dx,
о
проходящей через точки А(0, 0) и В(Ь, 0). Предполагается, что
Ъ*
( 1Ι
п + -
π.
5.2. Покажите, что для функционала
ъ
J[y] = y(x*y')dx>
Вопросы и задачи
163
где / дважды непрерывно дифференцируема; /Jy Φ 0; у(х) е
е С1[а9 &], каждая экстремаль может быть включена в поле
экстремалей.
5.3. Для следующих функционалов проверьте, включены
ли экстремали, удовлетворяющие заданным краевым услови-
ям, в поле экстремалей:
1
b)\{{y?-y{y'?)dx, i/(0) = 0, 1/(1) = 0;
б) \{y'?dx, i/(0) = 0, у(Ь) = с (с>0);
о
1
B)JMy)yll + (yydx9 y(0) = ya, у(Ъ) = уь (h(y)>0);
о
1
г) j(6{y')2-(y')4)dx, z/(0) = 0, у(Ь) = с (с>0).
о
5.4. Докажите, что для функционала
5π/4
«%] = j (y2-(y'f)dx
(5π
—
4
не является точкой экстремума.
= 0 экстремаль у(х) = О
5.5· Исследуйте на экстремум следующие функционалы,
определенные на множестве непрерывно дифференцируемых
функций, удовлетворяющих заданным краевым условиям:
а
а) j((y')2 +2yy'-16y2)dx, у{0) = 0, у(а) = 0 (а > 0);
о
2
б) jy'(l + x2y')dx, 1/(1) = 3, i/(2) =5;
164
5. Достаточные условия экстремума
π/4
в) j(4y2-(y')2+8y)dx, у(0) = -1, у(п/4) = 0;
о
1
г) \((у*)2+у2+2уе2*)ах9 1/(0) = 1/3, у(1) = (1/3)е2;
о
π/4
Д) } (У2 -(У)2 +6ysin2x)dx9 у(0) = 0, */(π/4) = 1;
о
2
е) JV НУ)2 ~2xy)dx, y(Q)=0, y(2) = 3.
о
5.6· Исследуйте на экстремум функционал
1
J[y] = f(x2+e(y')2+y2)dx, y(0) = 0, г/(1)= 1
о
в зависимости от значения параметра ε.
5.7. Покажите, что в вариационной задаче
1
J[y] = \{(У)2 ~y{y?)dx -> extr, y(0) = у(1) = О
о
экстремаль у(х) = 0 доставляет слабый минимум функционалу
J[y]. Доставляет ли эта экстремаль сильный минимум функ-
ционалу J[y]?
ЧАСТЬ II
Оптимальное
управление
Лучшее — враг хорошего.
Народная поговорка
6. ВАРИАЦИОННЫЕ МЕТОДЫ
В ОПТИМАЛЬНОМ УПРАВЛЕНИИ
Аппарат классического вариационного исчисления при всей
своей фундаментальности не позволяет найти решения цело-
го ряда вариационных задач, важных в различных отраслях
техники. Вторая часть книги посвящена методам решения
вариационных задач неклассического типа. Начнем с описа-
ния основных классов таких задач, которые будем называть
задачами оптимального управления.
6.1. Постановка задач оптимального управления
Задача 1. Управляемый объект (управляемая система) —
это некоторая машина, модель, прибор, процесс, конструк-
ция и т. п., снабженная «рулями». Манипулируя «рулями»
(в допустимых пределах, т. е. с учетом имеющихся ресурсов
управления), мы тем самым определяем поведение, движение
объекта, управляем им.
Слово «руль» взято в кавычки, поскольку под «рулем» в
данном случае понимается любой фактор, дающий нам воз-
можность влиять на движение объекта. Так, у автомобиля
два «руля»: «баранка» и акселератор, а ресурсы управления
характеризуются максимально возможным углом поворота
колес и мощностью двигателя. Если в качестве управляемого
объекта рассматривать технологический процесс проведения
химической реакции, то роль «рулей» могут играть состав
ингредиентов, количество катализатора, поддерживаемая
температура и другие факторы, от которых зависит течение
реакции.
Будем считать, что управляемый объект нам дан, так что
известны и ресурсы управления, и закон движения, устанав-
168
6. Вариационные методы в оптимальном управлении
ливающий для выбранного правила манипулирования «руля-
ми» эволюцию состояния объекта. Речь идет только об объек-
тах, движение которых (при заданых начальных условиях)
вполне точно и однозначно определяется выбором положения
«рулей» в каждый момент времени. Такие объекты называют
детерминированными, при их изучении никакие «случайно-
сти» во внимание не принимаются.
Следует учитывать, что часто наши возможности управ-
лять объектом лимитируются не только ресурсами управле-
ния, но и тем, что в процессе движения объект не должен по-
падать в состояние, физически недоступное или недопустимое
с точки зрения конкретных условий эксплуатации объекта.
Например, при работе электрической системы нельзя допу-
скать перегрева мотора; осуществляя маневр судна, необхо-
димо учитывать ширину фарватера и т. д. Подчеркнем, что
такого рода ограничения на состояние объекта совершенно не
зависят от свойств самого объекта и являются дополнительны-
ми, диктуются условиями конкретной задачи.
Имея дело с управляемым объектом, мы всегда стремимся
так манипулировать «рулями», чтобы, исходя из определен-
ного начального состояния, достичь некоторого желаемого
состояния, т.е. реализовать стоящую перед нами цель управ-
ления. Если, скажем, речь идет о запуске спутника, то нужно
рассчитать режим работы двигателей ракеты-носителя, кото-
рый обеспечит доставку спутника на желаемую орбиту. Как
начальное состояние объекта, так и цель управления зависят
от рассматриваемой прикладной задачи.
Как правило, существует бесконечное число способов
управлять объектом так, чтобы добиться желаемого результа-
та. В связи с этим и возникает задача не просто как-то реализо-
вать цель управления, а найти тот способ управления, который
в определенном смысле является наилучшим, оптимальным.
Конечно, для этого мы должны располагать критерием каче-
ства, позволяющим судить о том, какой способ управления
лучше, а какой хуже. Этот критерий также свой в каждой
конкретной задаче. Так, при управлении электроприводом
естественно стараться обеспечить отработку искомых величин
за минимальное время, расчет графика полета самолета из
одного пункта в другой преследует достижение наименьшей
себестоимости и т. д.
Такова в общих чертах задача оптимального управления.
Перейдем к ее математическому описанию.
6.1. Постановка задач оптимального управления
169
Задача 2. Будем рассматривать объект, состояние которо-
го в фиксированный момент времени описывается набором из
η чисел #i, ..., хп — фазовых координат (или фазовых пере-
менных [VIII]). Эти числа удобно считать компонентами фа-
зового вектора {фазового состояния) х = (хъ ..., хп)Т. Таким
образом, состояние объекта в каждый момент времени можно
изобразить точкой (элементом) я-мерного арифметического
пространства Шп, называемого фазовым пространством
объекта [VIII]. Например, в случае механического объекта
с конечным числом степеней свободы фазовый вектор х со-
ставляют из обобщенных координат qu ..., qk и обобщенных
импульсов Pi, ...,Pk-
Движение объекта проявляется в том, что его фазовые ко-
ординаты меняются с течением времени i, т. е. фазовый вектор
является вектор-функцией независимого переменного t. При
движении объекта фазовая (изображающая) точка x(t) =
- (#i(0> ■··> #л(0) описывает в фазовом пространстве кривую —
фазовую траекторию (фазовую кривую). Обычно фазовые
координаты объекта являются «инерционными» переменны-
ми. Это значит, что они непрерывно зависят от времени*
Пусть в фазовом пространстве R71 задано некоторое мно-
жество S, представляющее собой совокупность всех фазовых
состояний, в которых управляемому объекту разрешается
находиться* Тогда при движении объекта его состояние x(t) в
каждый момент времени t должно подчиняться условию
x(t)eSczRn9 (6.1)
которое называют ограничением на фазовые координаты
(фазовым ограничением). В ряде задач интерес вызывает слу-
чай, когда множество S замкнуто, а фазовая траектория может
проходить по его границе·
Предположим, что положение имеющихся у управляемо-
го объекта «рулей» описывается в каждый момент времени
набором из г чисел иъ ..., иг — управляющих параметров,
составляющих вектор управления и = (щ, ···, иг)Т. Положение
«рулей» объекта в каждый момент времени можно изобразить
точкой r-мерного арифметического пространства Rr. Мани-
пулирование «рулями» означает выбор вектор-функции u(t)9
называемой управлением (управляющим воздействием).
170
6. Вариационные методы в оптимальном управлении
Существенным моментом, характеризующим управляе-
мую систему, является описание множества допустимых
управлений, т. е. совокупности таких функций u(t), которые,
исходя из реальных обстоятельств рассматриваемой задачи,
разрешается выбирать в качестве управлений и среди кото-
рых мы будем в дальнейшем искать, например, оптимальное
управление. Это множество задают, как правило, с помощью
«геометрических» условий, накладываемых на возможные
значения функции и(£)> и требований к ее функциональным
свойствам.
В любом реальном объекте «рули» не могут занимать со-
вершенно произвольные положения либо из-за конструктив-
ных особенностей объекта и ограниченности ресурсов, либо
из-за условий эксплуатации объекта, опасности нарушения
его нормальной работы. Это значит, что в пространстве Шг
управляющих параметров выделено некоторое множество f/,
называемое областью управления. В любой момент времени
точка u(t) должна принадлежать этому множеству. Иначе го-
воря, для любого t верно соотношение
u(t)eUaW, (6.2)
называемое ограничением на управление. Самым типичным
является случай, когда область управления U — ограниченное
замкнутое множество (последнее означает, что, грубо говоря,
«рули» могут занимать и свои «крайние» положения).
Помимо ограничения на значение управляющего вектора,
в каждый момент времени необходимо также выяснить допу-
стимый характер изменения этого вектора с течением времени.
Обычно в качестве управлений рассматривают кусочно-непре-
рывные вектор-функции, т. е. вектор-функции, у которых
каждая координатная функция ut(t) имеет на любом конечном
интервале конечное число точек разрыва, причем все точки раз-
рыва первого рода [I]. Значение управления в точке разрыва не
играет сколько-нибудь существенной роли в задачах управле-
ния. Но для определенности удобно считать, что оно совпадает
с левосторонним пределом вектор-функции в точке разрыва:
и(х) = и(т-0)= lim u(t).
t->T-0
Также будем считать, что управление u(t) непрерывно на кон-
цах рассматриваемого отрезка [ii,^]·
6.1. Постановка задач оптимального управления
171
Если ограничение (6.2) на область значений управления вы-
глядит достаточно естественно, то выбор в качестве управлений
кусочно-непрерывных функций нуждается в пояснениях·
Наиболее реалистично выглядит требование, чтобы управ-
ление u(t) было непрерывной функцией· Оно соответствует
представлению о том, что управляющее воздействие, обладая
определенной инерционностью, не может изменяться скач-
ком. Но такое требование оказывается весьма неудобным.
Как свидетельствуют даже простейшие примеры линейных
задач (см· 7.4), в классе непрерывных функций решение за-
дачи оптимального управления может не существовать. Кро-
ме того, более внимательный анализ реальных управляемых
объектов показывает, что почти всегда в качестве управля-
ющих можно выбрать такие параметры, которые в пределах
разумной точности можно считать безынерционными. Поэ-
тому класс кусочно-непрерывных функций оказывается вы-
годным с теоретической точки зрения и приемлемым с точки
зрения практических приложений.
Кусочно-непрерывные управления со значениями, попа-
дающими в область управления С/, будем называть допусти-
мыми. В дальнейшем, говоря об управлениях, будем иметь в
виду допустимые управления, не оговаривая это каждый раз.
Чтобы указать, как именно фазовая траектория объекта
определяется по выбранному управлению, нужно иметь закон
движения объекта, описывающий динамические свойства
рассматриваемой управляемой системы. Будем предполагать,
что закон движения представляет собой соотношение
* = /(*,*,*), (6.3)
где /(i,#,u) = (/i(i,#,u),..., fn(t,x,u)) —известная вектор-функ-
ция, конкретный вид которой определяется конструктивными
особенностями объекта или условиями рассматриваемой зада-
чи. Далее будем полагать, что функции fi(t, x, u), i = l9n9 не-
перерывны по всей совокупности переменных и непрерывно
дифференцируемы по совокупности переменных х [V].
Объект, математическая модель которого задается сис-
темой уравнений (6.3), является управляемым, что выража-
ется в следующем. Если выбрано (допустимое) управле-
172
6. Вариационные методы в оптимальном управлении
ние u(i), tG [ti,t2]> T0 подстановка его в (6.3) приводит к нор-
мальной системе ОДУ [VIII], записанной в векторной форме:
x = f(t,x9u(t)). (6-4)
При заданных условиях на вектор-функцию f эта система
удовлетворяет теореме существования и единственности для
задачиКоши, т. е. при начальном условии x(ti) = x1 =(х\->..., х\)
она имеет решение, и притом единственное, в окрестности точ-
ки х1. Другими словами, при выбранном управляющем воздей-
ствии u(t) на отрезке [fb t2] движение объекта описывается
вектор-функцией, которая представляет собой решение задачи
Коши для системы ОДУ [VIII]. Очевидно, что движение объек-
та будет меняться в зависимости от управляющего воздействия.
Решение системы (6.4) при заданном управлении u(i), как и
определяемую этим решением кривую в фазовом пространстве,
называют фазовой траекторией, соответствующей этому
управлению. Начальное условие х1 в задачах оптимального
управления часто называют начальным состоянием.
Заметим, что именно к виду (6.3) обычно сводятся урав-
нения движения для механических управляемых объектов с
конечным числом степеней свободы. Далее везде под управля-
емым объектом будем понимать систему ОДУ вида (6.3).
Детерминированность управляемого объекта означает, что
выбор управления u(i), £е[£ь*2], должен однозначно опреде-
лять (при заданном начальном условии) траекторию x(t),
t ε [ii,*2]· Чтобы это было так, достаточно считать, что вектор-
функция f(t,x,u) удовлетворяет ранее оговоренным условиям
(непрерывность по совокупности переменных (i, де, и), непре-
рывная дифференцируемость по совокупности переменных х).
х а Тогда на каждом участке непрерывности
управления u{t) система (6.4) удовлетво-
ряет теореме существования и единст-
венности для задачи Коши. В точках
разрыва какой-либо из координатных
функций управления надо производить
стыковку решений системы (6.4), обес-
печивающую непрерывность фазовой
траектории. На рис. 6.1 показан пример
6.1. Постановка задач оптимального управления
173
фазовой траектории на плоскости, которая отвечает управле-
нию, имеющему разрывы первого рода в моменты времени τ± и
τ2. Таким образом, траектория x(t) при кусочно-непрерывном
управлении является непрерывной кривой, а ее производная
x{t) кусочно-непрерывна на рассматриваемом отрезке времени
(такие кривые называют кусочно-гладкими [V]). Если u(t) —
допустимое управление, a x(t) — соответствующая фазовая
траектория, удовлетворяющая ограничению (6Л), то пару
функций (x(t), u(t)) будем называть допустимым процессом.
Полезно иметь в виду следующую геометрическую интер-
претацию системы (6.3). Пусть в некоторый момент времени
t управляемый объект находится в фазовом состоянии x(t).
Вектор x(t) представляет собой вектор фазовой скорости и
является касательным вектором к кривой х = x(t) в соответст-
вующей точке. Если в фазовом пространстве Шп построить при
фиксированном х всевозможные векторы f(t,x,u) для всевоз-
можных допустимых управляющих воздейст-
вий и (момент времени t фиксирован), то по-
лучим, согласно (6.3), множество допустимых
(возможных) фазовых скоростей в точке х (на х
рис. 6.2 пунктиром изображено множество
концов всех таких векторов). Другими слова-
ми, выбор управляющего воздействия u(t) g U Рис. 6.2
в момент времени f, когда изображающая
точка находится в состоянии х, равнозначен выбору допусти-
мой фазовой скорости, с которой изображающая точка выхо-
дит из этого состояния.
Задача 3. При рассмотрении реальных управляемых объ-
ектов прежде всего возникает задача управления движением.
Для ее формулирования нужно задать в фазовом пространстве
некоторое множество Μ (цель управления) тех состояний,
которые являются желательными. При этом должно быть
выполнено включение Μ a S,
Говорят, что управление u(t), te[tl9t2]9 переводит объект
(6.3) из состояния х1 в состояние х2, если соответствующая
этому допустимому управлению фазовая траектория x(t) (ре-
шение задачи Коши для системы (6.4) с начальным условием
x(ti) = я1) определена на том же отрезке времени [i2, t2], удов-
летворяет ограничению (6.1) и в момент времени t2 попадает
174
6. Вариационные методы в оптимальном управлении
в фазовое состояние хг (т. е. x(t2) = х ). Обратим внимание на
то, что отрезок [ib t2] — это конечный промежуток числовой
прямой. Если управление u(t) переводит объект (6.3) из на-
чального состояния х1 в некоторое состояние х2 е М, то будем
говорить, что управление и(£) реализует цель управления М.
Задача управления движением состоит в том, чтобы найти
какое-нибудь допустимое управление, реализующее цель.
Другими словами, для объекта (6.3) требуется отыскать та-
кую кусочно-непрерывную функцию u(t) со значениями в 17,
определенную на отрезке [tl9t2] (вообще говоря, t2 заранее не-
известно), чтобы система (6*4) имела решение x(t), удовлетво-
ряющее начальному условию x(t{) - x1, ограничению (6.1) и ко-
нечному условию x(t2) e M. Следовательно, задача управления
сводится к решению краевой задачи для системы тг-го порядка
(6.3) [VIII] при ограничениях (6.1) и (6.2). Однако общей тео-
рии решения подобных задач нет. Доказательство разрешимо-
сти задачи управления и фактическое отыскание управления,
реализующего цель, наталкиваются на серьезные трудности.
Мы не будем рассматривать вопросы разрешимости задачи
управления, предполагая, что цель управления, поставленная
для изучаемого объекта, может быть реализована. Отметим,
что во многих прикладных задачах разрешимость задачи
управления вытекает «из физических соображений».
Задача 4. В задачах управления движением возникают
различные по количеству и характеру краевые условия. Если
множество М, характеризующее цель управления, совпадает
со всем фазовым пространством Шп9 то такую задачу называют
задачей со свободным концом траектории. В этом случае роль
краевых играют начальные условия x(ti) = х1.
Более сложные задачи — так называемые двухточечные
задачи, или задачи с фиксированными концами. Эти задачи в
качестве краевых условий имеют как начальное x(t{) = x1, так и
конечное x(t2) = х2. При этом интервал времени управления
t2 - f! может быть как заданным, так и подлежащим опреде-
лению. В этом случае множество Μ цели управления состоит
из единственной точки х2.
В классе многоточечных задач управления для несколь-
ких фиксированных моментов времени 1Ъ t2, ..., tm заданы
значения некоторых координат вектора состояния.
6.1. Постановка задач оптимального управления
175
Наконец, в классе задач с подвижными (скользящими)
концами требуется найти управление, переводящее объект из
некоторого (заранее не известного) состояния х1, принадлежа-
щего известному множеству М1? в некоторое состояние х2 из
известного множества М2. Часто эти множества представляют
собой гиперповерхности в арифметическом пространстве W1.
Если Mi и М2 вырождаются в точки, то приходим к задаче с
закрепленными концами.
Задача 5· Предположим, что задача управления разре-
шима. Наиболее типичной является ситуация, когда задача
управления имеет бесконечно много решений, т. е. сущест-
вует бесконечно много управлений, реализующих цель, и все
они с этой точки зрения совершенно равноправны. В таком
случае может быть поставлена задача оптимального выбора:
среди допустимых управлений выбрать такое, при котором
управляемый процесс будет наилучшим в каком-то опреде-
ленном смысле. Другими словами, если качество процесса
оценивается некоторой числовой характеристикой, то задача
заключается в том, чтобы выбором управления обеспечить ее
максимальное или минимальное значение. Эту числовую ха-
рактеристику называют критерием качества.
Значение критерия качества определяется управлением, ди-
намикой управляемого процесса (временем управления, фазовой
траекторией). Соответственно, критерий качества представляет
собой функционал того или иного вида, и задача оптимального
управления состоит в отыскании управлений, обеспечивающих
минимум или максимум этого функционала. Случай, когда тре-
буется максимизировать функционал, сводится к задаче мини-
мизации заменой исходного функционала / функционалом -J.
Поэтому данный случай отдельно не рассматривают.
Таким образом, задача оптимального управления состоит
в том, чтобы найти такое управление и(£), реализующее цель,
для которого функционал принимает наименьшее возможное
значение. При этом управление u(t) называют оптимальным
управлением, соответствующую фазовую траекторию x(t) —
оптимальной траекторией, а процесс (x(t), u(t)) — опти-
мальным процессом.
Для управляемых процессов с законом движения (6.3) на-
иболее широко используют так называемые интегральные
критерии качества — функционалы вида
176
6. Вариационные методы в оптимальном управлении
*2
I=\f0(t,x{t),u(t))dt. (6.5)
*i
К этому классу критериев относятся:
а) критерий оптимального быстродействия с подынтег-
ральной функцией
/°(i,*fiOsl,
который сводится к представлению J = i2 — *i- Такой критерий
используется в теории автоматического управления (в следя-
щих системах) для выбора параметров, обеспечивающих на-
именьший по длительности процесс при отработке входного
сигнала. Оптимальное управление в задачах с критерием оп-
тимального быстродействия называют управлением, опти-
мальным по быстродействию;
б) интегральный квадратичный критерий с подынтег-
ральной функцией
η
f0(t9x9u) = ^aixf9
где х = (jci, #2,..., Xn)> a среди коэффициентов α; есть хотя бы
один ненулевой. В представлении (6.5) могут рассматриваться
как конечный (£2 < +°°)> так и бесконечный (i2 = +00) интерва-
лы времени. Такой критерий дает косвенное представление о
точности работы системы, рассматриваемой в фазовом про-
странстве. Его также используют в теории автоматического
управления;
в) энергетические критерии качества с подынтеграль-
ными функциями
г г
/°<*,*,Ιθ=Σδ?** и /°(*,*,»)=Σδ^|,
где и = {иъ и2, ..., иг), а среди коэффициентов δ/ есть хотя бы
один ненулевой. Эти критерии характеризуют затраты энер-
гии, например, в задачах ориентации спутника с помощью
газореактивных двигателей;
г) смешанный интегральный критерий с подынтеграль-
ной функцией
6.L Постановка задач оптимального управления
177
i=l /=1
дающий отклонения по фазовым координатам «в среднем» и
общие энергетические затраты.
Наряду с интегральными критериями качества в теории
оптимального управления часто встречаются терминальные
функционалыj т. е. функционалы вида/ = T{x{ti),x{t^)). К это-
му классу неинтегральных критериев относится, например,
критерий конечного состояния I - r(jc(ii)). Этот критерий
обычно используют, когда систему необходимо привести в за-
данное конечное состояние а = (al5 ..., ап) в момент времени t2 с
наименьшей ошибкой. В такой постановке критерий имеет вид
η
T(x(t1)Mt2)) = ^(xi(t2)-ai)2=^(t2)-af.
Задача 6. Неклассический характер задачи оптимального
управления особенно ярко проявляется в случае поиска управ-
ления, оптимального по быстродействию, для системы (6.3),
у которой правые части — линейные функции относительно х
и и с постоянными коэффициентами, а множество U представ-
ляет собой замкнутый выпуклый многогранник, определяе-
мый, например, неравенствами |иД£)| < 1, j = 1, г· Оказывается,
что оптимальное управление осуществляется скачкообразной
вектор-функцией u(i), у которой точка u(t) поочередно нахо-
дится в вершинах многогранника U. Закон управления сво-
дится к последовательности скачкообразных переходов от
одной вершины к другой.
Эта линейная вариационная задача, играющая важную роль
в технических приложениях, решена в 7,4. Классические мето-
ды для ее решения не применимы (см. 6.4). Указанный скачко-
образный характер оптимального управления не позволяет ог-
раничить класс допустимых управлений только непрерывными
функциями. Если же ввести такое ограничение, задача станет
неразрешимой. То же будет и в случае, если условиться, что
множество управлений U — открытое множество.
Для отыскания оптимального управления можно использо-
вать два подхода. Первый заключается в том, что оптимальное
178
6. Вариационные методы в оптимальном управлении
управление строится как функция времени t. В результате
получают программное управление, которое известно на-
перед на весь интервал времени и не зависит от возможного
поведения системы. Система управляется без обратной связи
(по разомкнутому циклу). С прикладной точки зрения такой
подход несовершенен, так как подразумевает точное знание
динамики объекта, но любая математическая модель дви-
жения объекта приближенна и не учитывает влияния всех
внешних факторов.
Второй подход состоит в том, что оптимальное управление
строится как функция фазовых координат. Такую функцию
называют синтезирующей функцией, а задачу построения
синтезирующей функции — задачей синтеза оптимальных
управлений (см. 7.5). Этот подход ближе к практическим
приложениям, так как при управлении учитывают текущее
состояние системы (управление с обратной связью), но син-
тезировать управление значительно сложнее, чем строить
программное управление. Однако можно сочетать оба подхода
(например, в методе аналитического конструирования).
Проиллюстрируем, как ставится задача оптимального
управления.
Пример 6.1· Рассмотрим математический маятник (т. е.
груз малых размеров на невесомом стержне), который нахо-
дится вблизи верхнего (неустойчивого) положения
равновесия (рис. 6.3).
Для простоты предположим, что трение отсут-
ствует. Если угол φ отклонения маятника отсчиты-
вать против хода часовой стрелки от направления
на верхнее положение равновесия, то уравнение
движения маятника имеет вид
}2
dt2
mr —ψ = mglsiiup,
где т — масса маятника; / — его длина; g — уско-
рение свободного падения.
Ограничиваясь областью, достаточно близкой к положению
равновесия, мы можем заменить sin φ на φ, так как sin φ « φ при
малых значениях φ. Введя обозначение ω2 = g/l9 ω > 0, получим
линейное дифференциальное уравнение второго порядка
6.1. Постановка задач оптимального управления
179
^|-ω2φ = 0, (6.6)
dta
описывающее движение маятника при малых значениях φ,
т. е. при |φ| <Ф для некоторого Φ {уравнение линейного при-
ближения).
Известно (это, впрочем, очевидно), что верхнее положение
равновесия маятника неустойчиво. Каково бы ни было началь-
ное положение φ(0) = φ0, ф(0) = ф0, отличное от положения
равновесия (φ = 0, φ' = 0), маятник начинает движение, соглас-
но дифференциальному уравнению, по закону
<р(*) = С1вш*+С2е-^ (6.7)
где С1? С2 — постоянные интегрирования.
Из соотношения (6.7) вытекает, что маятник в конечном
счете удаляется от положения равновесия. Правда, следует
отметить так называемое лимитационное движение, возни-
кающее, например, в линейной модели (6.6) при φ0=-ωφ0;
при таком движении маятник приближается к положению
равновесия с убывающей скоростью, но не достигает его ни за
какой конечный промежуток времени.
Допустим теперь, что к маятнику приложена некоторая
внешняя сила F(t), линия действия которой в каждый момент
времени t перпендикулярна оси маятника* Величину и направ-
ление силы можно выбирать по своему усмотрению, меняя
во времени, но при этом должны соблюдаться ограничение
|F(i)| < F0, которое отражает лимиты на имеющиеся ресурсы,
и требование, чтобы функция F(t) была кусочно-непрерывной.
Будем описывать силу положительной скалярной величи-
ной F, когда сила направлена в сторону увеличения угла φ,
и отрицательной, когда сила направлена в сторону уменьше-
ния φ. Тогда уравнение линейного приближения вынужден-
ного движения маятника будет таково:
0-ω»φ = /<«), (6.8)
где f(t) = F(t)/(ml).
Спрашивается: можно ли подобрать функцию F(t) внешне-
го воздействия так, чтобы маятник из начального состояния
(р0, фо за конечное время достиг положения равновесия? Если
180
6. Вариационные методы в оптимальном управлении
это возможно, то как привести маятник в верхнее положение
равновесия за наименьшее время? Отметим, что ответ на эти
вопросы связан с решением задачи Коши для дифференциаль-
ного уравнения (6.8) второго порядка. Однако требуется не
просто решить задачу Коши с заданными начальными усло-
виями, а подобрать вид правой части уравнения так, чтобы
решение соответствующей задачи Коши в некоторый конеч-
ный момент времени проходило через положение равновесия.
При этом выбор правой части должен удовлетворять ограни-
чениям (кусочная непрерывность F(t) и неравенство |JF(f )| ^ Fo)-
Пусть такая функция существует (что, конечно, совсем неоче-
видно), причем не единственная. Тогда возникает задача оп-
тимального выбора, т. е. выбора такой функции, которая
обеспечивает наименьшее время перехода из начального со-
стояния в положение равновесия.
Используем ранее введенные обозначения. В каждый мо-
мент времени t состояние маятника описывается двумя пара-
метрами (фазовыми координатами): углом отклонения Χγ - φ и
скоростью ф = #2. Значит, фазовое пространство рассматривае-
мого объекта является двумерным (представляет собой фазовую
плоскость). Ограничение на фазовые координаты имеет вид
|*11< Φ (6.9)
и диктуется размерами области, в которой применима линей-
ная модель движения маятника. Роль управляющего параме-
тра играет «сила» /, введенная в (6.8). Обозначим этот пара-
метр буквой и. Согласно условию задачи, область управления
U описывается неравенством
1"1</о· (6.10)
Множество допустимых управлений — это множество кусоч-
но-непрерывных функций u(t), в каждый момент времени
подчиняющихся ограничению (6.10).
Уравнение (6.8) в принятых обозначениях сводится к сис-
теме дифференциальных уравнений
(±1=*2; (6-ц)
\х2 =согхг + и,
которая относится к законам движения управляемого объек-
та вида (6.3). Предполагаем, что в начальный момент времени
t = fх = 0 задано начальное состояние объекта
6.2. Задача Лагранжа в форме Понтрягина
181
х1 -
Хл
Х<\
\
')
Г<Ро
1%
(6.12)
а цель управления состоит из единственной точки на фазовой
плоскости, соответствующей положению равновесия:
х2 =
Г„2Л
Хеу
V * )
ГО'
(6.13)
За критерий качества / берем, как условились, время.
Нужно выяснить, какое допустимое управление переводит
объект, описываемый системой (6.11), из начального состо-
яния (6 Л2) в нужное состояние (6· 13) за наименьшее время.
Решение поставленной задачи оптимального управления
дано в 7.5 при дополнительных предположениях ω = 1, /0 = 1>
которые несущественны, но упрощают выкладки. Вопрос
о применимости линейной модели для описания реального
объекта (маятника), т. е. вопрос об описании области (6.9),
не обсуждается.
6.2, Задача Лагранжа в форме Понтрягина
Из предыдущего параграфа ясно, что задача оптимального
управления очень близка в своей постановке задаче Лагран-
жа (см. 4). Поэтому мы начнем с обсуждения вариационных
методов решения этой задачи.
Для задачи Лагранжа (см. 4.1)
gj(t,x9x) = 0, j = l9n (n< то),
(6.14)
рассмотрим частный случай, когда дифференциальные урав-
нения (6.14) разрешены относительно производных:
Х\ — / \Ту Х\, ..., Хп, Хп+\, ... ? Xjyi ))
(6.15)
Хп — J \С) Х\, ..., Хп, Xji+1 у ... 9 Xjji )·
182
6. Вариационные методы в оптимальном управлении
Переменные хъ ..., хп, соответствующие производным в левой
части системы (6.15), можно рассматривать как фазовые пе-
ременные, а остальные хп+ъ ..., хт — как управления. Для
управлений введем обозначения ир ; = 1, г, где г = т - п. В
таких задачах принято независимую переменную обозначать
буквой t (она ассоциируется с временем), а не х, как в клас-
сическом вариационном исчислении. Введенное деление пе-
ременных на фазовые переменные и управления позволяет
записать дифференциальные связи (6.15) в виде
x = f(t,x,u), (6.16)
где х = (хъ...,хпУ; и = (ии ...,г/г)т; f = (f1, ...,/n)T; x = x't.
Будем рассматривать задачи, в которых целевой функцио-
нал с учетом введенных обозначений имеет вид
I[x,u]=(f°(t9x,u)dt. (6.17)
h
Заметим, что он является вырожденным функционалом,
так как его интегрант f°(t9x,u) не зависит от производных
искомых функций. Предполагается, что отрезок [tl5 t2] фик-
сирован и на его концах поставлены следующие краевые ус-
ловия:
Ψ(*(*1)) = 0, θ(*(*2)) = 0, (6.18)
где Ψ = (ψ1,...,ψδ)τ, θ = (&9...,&)*, 8,1<η.
Задачу (6.16)-(6.18) называют задачей Лагранжа в форме
Понтрягина. Считаем, что все функции /Ч/ = 0, п), а также
функции Ψ, Θ дважды непрерывно дифференцируемы, x{t) e
GC1([i1,i2],IR?l), u(t)eC([tiJt2],^r). В такой постановке зада-
ча Лагранжа отличается от задач оптимального управления
только классом допустимых функций (в задачах оптимально-
го управления фазовые траектории x(t) кусочно-гладкие, а
управления u(t) кусочно-непрерывные), а также отсутствием
ограничений на фазовые координаты и управления.
Для решения задачи (6.16)-(6.18) применим подход
Лагранжа, основанный на введении множителей Лагранжа
6.2. Задача Лагранжа в форме Понтрягина
183
и уже использовавшийся ранее (см. 4.2). Составим вспомога-
тельный функционал задачи (6.16)-(6.18):
Г[х,и]= \Ldt + \iT4f(x(t1)) + vTe(x(t2)). (6.19)
Здесь
η
L(t,x,xJu) = f0(t9x,u) + ^Xi(t)(xi-fi(t9x,u)) =
i=l
= /°+XT(*-ft (6.20)
— лагранжиан задачи; λ(£) = (Xi(f),...,λл(£))т* μ = (μ1,...,μβ)τ,
ν = (Vi,..., ν^)τ — множители Лагранжа. Множители X^t) учи-
тывают дифференциальные связи (6.16) (как и в 4.2), а мно-
жители μ^, Vj — ограничения вида (6.18).
Теорему 4.1 можно обобщить на случай краевых условий
вида (6.18). Такое обобщение означает, что экстремали задачи
Лагранжа (6.16)-(6.18) являются экстремалями вспомогатель-
ного функционала Г[х, и]. Чтобы найти экстремали задачи
Лагранжа, нужно из экстремалей вспомогательного функцио-
нала выбрать те, которые удовлетворяют краевым условиям
(6.18) и дифференциальным связям (6.16). Иначе говоря, экс-
тремали вспомогательного функционала, удовлетворяющие
краевым условиям и дифференциальным связям, являются
экстремалями задачи Лагранжа.
Выпишем, имея в виду сказанное, уравнения для экстрема-
лей задачи (6.16)-(6.18). Уравнения Эйлера вспомогательного
функционала с учетом разделения переменных на фазовые
переменные и управления имеют вид
dt (6.21)
— L'uj-L'uj =0, ; = 1, г,
или для данного вида лагранжиана (6.20)
λ|=σ0)'*-λτ£, i = l,n, (6.22)
184
6. Вариационные методы в оптимальном управлении
(/%-λτ/;=0, у = 1, г,
(6.23)
где f = (f19f29 ...,/л)т. Уравнения (6.23) алгебраические, так
как производные й не входят в лагранжиан. К системе (6.22),
(6.23) нужно добавить условия трансверсальности на левом и
правом концах (см. замечание 4.2):
14
_ ,|Т\
v. | -μτΨ'ν. , г = 1, п;
V,
— iiTU/'
ΙΛ.Ι =-ντΘ'ν
H^t2
t=t2
**,
=-vt©;
t=t2
t=t2
μτΨ' , / = l,r;
t=ti > \t=h
, i = l, n;
, 7=1, r,
(6.24)
из которых лишь первая и третья группы уравнении не явля-
ются тривиальными. Они дают соотношения
λ^^) = μτΨ^(^))|^, 1 = 1,»;
(6.25)
xi(t2) = -vTe/Xi{^))\
t=t2
i = l, п.
(6.26)
Чтобы определить экстремали задачи Лагранжа (6.16)-
(6.18) в форме Понтрягина, нужно к системе уравнений
(6.22)-(6.26) добавить уравнения дифференциальных связей
(6.16) и краевые условия (6.18). В результате получим сис-
тему 2п + г уравнений, среди которых 2п уравнений — диф-
ференциальные первого порядка (уравнения (6.16) и (6.22)) и
г уравнений — алгебраические (уравнения (6.23)). Решение
этой системы зависит от 2п постоянных интегрирования и s + 1
неопределенных множителей Лагранжа μ^ и ν^. Для определе-
ния всех 2п + s + I неизвестных имеются 2/г условий транс-
версальности (6.25), (6.26) и s + I краевых условий (6.18).
Рассмотрим другой случай, заменив в задаче (6.16)-
(6.18) интегральный функционал (6.17) смешанным целевым
функционалом
B[x,u]= \ fViUx^dt + flxit^ + Tlxfa)]. (6.27)
6.2. Задача Лагранжа в форме Понтрягина
185
Эту задачу часто также называют задачей Лагранжа в форме
Понтрягина· Вспомогательный функционал для нее будет
иметь вид
h
с тем же лагранжианом, что и в предыдущей задаче· Поэтому
уравнения Эйлера будут такими же, как и в предыдущей за-
даче, т. е. будут иметь вид (6.22), (6.23). Условия трансвер-
сальности изменятся за счет терминальных слагаемых функ-
ционала В[х, и]:
λ4(*1)=(μτψ;| (*(*))+г; [*(t)])\t=h, *=ui,
^(*2)=-(ут©;д*(о)+г;[х(о])| , i=ui.
Если же ограничений (6.18) нет, то получаем задачу (6.16),
(6.21) со свободными концами — третью формулировку задачи
Лагранжа в форме Понтрягина. Условия трансверсальности в
этой задаче имеют вид
K{h) = rXi[x{t)]\t^ i = i,*,
h(t2)=-Txt[mlt=t > /=1>n
*2
Мы рассмотрели три задачи, в которых отрезок [£1? t2]
фиксирован. Однако подход Лагранжа позволяет получить
необходимые условия в задаче Лагранжа в форме Понтряги-
на и в случае переменных концов t± и t2. Рассмотрим это на
примере первой из ранее сформулированных задач — задачи
(6.16)-(6.18). Оказывается, что и при изменяющихся концах
t\ и t2 экстремали задачи Лагранжа являются экстремалями
вспомогательного функционала (6.19). Но при этом вспомога-
тельный функционал (6.19) зависит не только от функций x{t)
и u(t), но и от переменных ix и i2> τ· β. имеет вид
r[x9u,tl9t2]= \ Σ(α + μτΧ¥(Χ^1)) + ντΘ(Χ^2)). (6.28)
186
6. Вариационные методы в оптимальном управлении
Найдем вариацию функционала I*[x,u,ti,t2], повторяя
рассуждения из 3.2. Зафиксировав допустимые вариации
bx(t)j 6u(t), 5fi, 5i2, составим функцию
φ(α) = L(t, x + аЬх, х + абх, и + аЬи) dt +
+ μ^Ι*1 + abx1] + ντΘ|>2 + αδ*2],
где x1=x(t1); x2=x(t2); Ьх1 = (δ*{,..., 5*i)T; δ*2 =
= (δ*?,...,δ*2)τ.
Согласно определению вариации функционала,
Ы[х, и, tlft2y Ьх, 5и, 5ii, 6i2, δ*1 , 5х2 ] = φ'(0) =
=1 Σ(L*' "d*L*' &г*Л+J Σ Lufiujdt+
h
i=l'
*1 /=1
+E(Li+v'^.)
i=l
δ*?-£(^/+μ«η,)
f = *2
^~ z^XjLxt
i=l
/
5i9-
i = i2
/=1
5xf +
5fi.
t = ti
Приравнивая вариацию к нулю, получаем необходимые усло-
вия экстремума для функционала вида (6· 28)· При этом сис-
темы уравнений (6.21) и (6.24) дополняются уравнениями
L-
L-
п \
Zj*iL'xi
i=l J
η \
2j*iL'xi
1=1 )
= 0;
t = ti
(6.29)
= 0.
t=t2
Значит, экстремали функционала (6.28) удовлетворяют тем
же уравнениям, что и экстремали функционала (6.19). Но
кроме того, они подчиняются и дополнительным условиям
(6.29), которые можно рассматривать как замену условий фик-
сированных концов.
6.2. Задача Лагранжа в форме Понтрягина
187
Чтобы теперь определить экстремали задачи Лагранжа
(6.16)-(6.18) в случае переменных концов tx и t2y нужно к си-
стеме условий (6.22), (6.23), (6.25), (6.26) и (6.29) добавить
уравнение дифференциальных связей (6.16) и краевые усло-
вия (6.18). При этом, учитывая соотношения L%t =ki9 i = 1, η,
уравнения (6.29) можно преобразовать к виду
η
L(*(iJk),i<tA)ftt(tA))-2i:l(tJk)Xl(ifc) = 0f A;=l,2. (6.30)
г=1
Это соотношение и есть то недостающее условие, которое по-
зволяет определить параметры t\ и i2·
Для дальнейшего обсуждения задачи Лагранжа в форме
Понтрягина нам удобно использовать каноническую форму
уравнений Эйлера, которые в задаче Лагранжа (4.1)-(4.3) име-
ют вид (4.11). Введем канонические переменные
k
Pi=(f%u i = l,n, (6.31)
где /* -f+y,^j§j — лагранжиан задачи, и запишем функцию
7=1
Гамильтона
Щх>У>Р) = -Г + ^У*Р*>
в которой переменные у[ находятся из системы уравнений
(6.31). Уравнения Эйлера (4.11) эквивалентны системе урав-
нений
dPt
dx
dyi
-_Н^., i-l,n;
= н' , г = i,7i.
ах
Вернемся к задаче (6.16)-(6.18). Ее лагранжиан имеет вид
L = f°(Ux,u)^Xi(t)(xi-fi(Ux,u)).
i=l
188
6. Вариационные методы в оптимальном управлении
Поэтому
Pi =Lx, =λ/,
lb It
mt,x9p9u) = -L + ^XiPi=^p*fi-f0' i = ^"' (6'32)
Функцию Гамильтона Η для задачи Лагранжа в форме Пон-
трягина часто называют функцией Понтрягина.
В канонических переменных дифференциальные связи
(6Л6) и уравнения Эйлера (6.22) можно записать в виде нор-
мальной системы ОДУ
dxt
dt
dpt
= Н^, / = 1, η;
(6.33)
dt
-~ΗΛ., z-l,7i,
которую называют гамиль тоновой системой.
Чтобы получить полную систему условий, к (6.33) нужно
добавить вторую группу уравнений Эйлера — алгебраические
уравнения (6.23), которые с учетом (6-32) можно преобразо-
вать к виду
н'ц.=о, 7=Γ7. (6.34)
Кроме того, нужно добавить краевые условия (6· 18) и условия
трансверсальности (6.25), (6.26), которые в канонических пе-
ременных имеют вид
Λ(*1) = μτΨ'Χ| (*(ti))|i=|i, i = 1, η, (6.35)
Pi(t2) = -ντΘ^ (*(i))|i=i2, i = 1, п. (6.36)
Итак, метод Лагранжа, широко используемый в решении
вариационных задач, позволяет получить необходимые усло-
вия экстремума для задачи Лагранжа в форме Понтрягина.
Эти условия дают возможность найти решение задачи в
классе гладких функций Xt(t), i = 1, тг, и непрерывных функ-
ций Uj(t), / = 1, г. Подвести итог раздела можно так: если
функции, входящие в постановку экстремальной задачи, обла-
6.3. Некоторые задачи с ограничениями ...
189
дают достаточной гладкостью, то для решения задачи можно
использовать подход, основанный на введении множителей
Лагранжа.
6.3. Некоторые задачи с ограничениями
в классическом вариационном исчислении
Для задач оптимального управления характерно наличие огра-
ничений на допустимые функции, т.е. фазовых ограничений
и ограничений на управление. Некоторые задачи с такими
ограничениями удается решать с помощью методов вариаци-
онного исчисления.
Рассмотрим задачу
*2
ЛУ1 = j f(x,y,y')dx -> extr
(6.37)
*i
с дважды непрерывно дифференцируемым интегрантом / в
классе непрерывно дифференцируемых функций у(х), удов-
летворяющих условию
у(х)>(р(х), xe[xl9x2], (6.38)
где q>eC1[xl9x2].
Введением функции и(х) = у'(х) эту задачу можно свести к
задаче Лагранжа в форме Понтрягина с фазовыми ограниче-
ниями (6.38):
Ду»и]= f(x9y,u)dx—>extr, y'= и.
XI
Однако для наглядности вариационного подхода остановимся
на исходной формулировке (6.37),
(6.38).
Равенство у = (р(х) определяет
границу множества, внутри кото-
рого не могут находиться значе-
ния функции, доставляющей экс-
тремум функционалу (рис. 6.4).
Наличие ограничений (6.38) при-
водит к необходимости некоторой
О хх
190
6. Вариационные методы в оптимальном управлении
корректировки вывода необходимых условий экстремума
функционала.
Основное условие — уравнение Эйлера — выводилось в
предположении, что функции могут свободно варьироваться,
т. е. если у — допустимая функция, то допустимыми являют-
ся такнсе любые функции у + Ъу при Ъу, достаточно малых по
норме. Для вариаций функции у(х), удовлетворяющих нера-
венству 5у > 0 на отрезке \хъ х2], допустимыми функциями
являются и функция у + Ьу, и функция у - ду. При наличии
ограничений (6.38) в случае функции у(х), выходящей на
границу множества возможных значений (см. рис. 6.4), допу-
стимой является любая функция у(х) + Ьу(х) при Ьу(х) > 0 на
отрезке [а, 6], но функция у(х) - Ьу(х) уже не будет допусти-
мой, так как будет принимать значения, не удовлетворяющие
ограничениям. Значит, при наличии ограничений указанного
типа вместо произвольной вариации надо рассмотреть одно-
сторонние вариации, которые определяются функциями Ьу(х)
одного знака на интервале (а, Ъ). Такие вариации позволяют
получить решение задачи в случае, когда экстремум достига-
ется на функции, не являющейся экстремалью.
Заменим в задаче (6.37), (6.38) зависимое переменное у на
переменное z согласно уравнению у = г2 + (р(х). Тогда у' = 2zz' +
+ φ'(·*0 и функционал относительно z принимает вид
<ЛХ1= f(x>z2 +<p(x),2zz'+q>'(x))dx= <£>(x,z,z')dx.
XI xi
Функция z(x) уже не подчиняется каким-либо ограничениям,
а границе области в исходной задаче соответствует z = 0.
Так как в задаче для функции z(x) ограничений нет, эта
функция, будучи точкой экстремума функционала, должна
удовлетворять уравнению Эйлера
ах
Но
<b's'=fy\y')'s'=2zfy>,
dx dx
6.3. Некоторые задачи с ограничениями ...
191
Следовательно,
dx dx
Уравнение Эйлера для переменного z сводится к следующему
уравнению для переменного у:
2г
(_d_
dx
&-fu =0,
т. е. распадается на два уравнения: первое — z = 0, которому
удовлетворяет функция у = (р(х); второе — уравнение Эйлера
для исходного функционала (6.37).
Итак, экстремум функционала (6.36) при наличии ограни-
чений (6.38) может достигаться на функциях, график которых
состоит из участков границы множества допустимых значений
и дуг экстремалей (в частном случае участок границы может
стянуться в точку).
Для полного решения задачи нужно также найти условия
сопряжения участков экстремалей с участками границы мно-
жества допустимых значений. Пусть экстремум функциона-
ла (6.37) достигается на состав-
ной функции у(х) и точка а есть
точка сопряжения экстремали с
функцией у = <р(х)9 график ко-
торой ограничивает множество
допустимых значений (рис. 6.5).
Для определенности считаем, что
экстремали соответствует участок
слева от точки а. Тогда
I/*
О
^ I I 1
1 1 1
1 1 1
Xl а а + δα х2
Рис. 6.5
X
а Х2
1[у] = J f(x,y(x),y'(x))dx = J /(х,ф(х),(р'(х))с?х.
xi
Приращение функционала, соответствующее вариации
ду(х), будет состоять из двух частей: приращения на экстремали
а+Ьа
Mi= \ f(x*y + §y>y' + fy)dx- \f(x,y,y)dx
Χγ
XI
192
6. Вариационные методы в оптимальном управлении
и приращения на участке функции у = (р(х)
Х2 *2
ΔΓ,- J f(xMx-i.«x))dx-jf(x.«x).«x))dx.
n-δα а
i
f (x,<p(x)9(p'(x))dx = -f (α,φ(α)9φ'(α))δα + o(ba).
α+δα
α+δα
-J
Вариация функционала также распадается на два слагаемых,
соответствующих вариации экстремали и пограничной функ-
ции. Слагаемое δ/i, соответствующее экстремали, можно вы-
числить по обычной формуле вариации с подвижным правым
концом, перемещающимся вдоль кривой у = (р(х) (см. 3.2):
Sh=(f-(y'-y')fy')\ δα,
а слагаемое δ/2> соответствующее пограничной функции, равно:
5/2 = -/(я» Φ(α)5 φ'(α))δα.
Так как на функции у(х) достигается экстремум, то сумма
dli + δΙ2 должна равняться нулю, откуда в силу произвольно-
сти δα и с учетом равенства у(а) = φ(α) получаем
(/(^^^-/(^^φΟ-(^-φν;)|^α=°· (6·39)
Преобразуем разность (/(х,#,#')~/(х>*/>ф'))| _ с помощью
теоремы (формулы) Лагранжа [II]:
где q — некоторое число между φ'(а) и у'(а).
Подставляя преобразованное выражение в (6.39), получаем
= 0.
х=а
((y'-<?'){fy<x,y,q)-fyix,y,y')))\
Снова применим теорему Лагранжа:
((y'-¥)(q-y%\ix,y,qi))\ _ =0, (6.40)
\х=а
где qi — некоторое число между q и у*(а).
Если fy'y'(a,y(a),q)*0 для значений q между у'(а) и φ'(а),
то из равенства (6.40) вытекает, что у*(а) = φ'(α)> так как ра-
6.3. Некоторые задачи с ограничениями ...
193
венство q = у'(а) в силу теоремы Лагранжа невозможно при
у'(а) Φ φ'(α).
Таким образом, при достаточно общих предположениях об
интегранте функционала (fy>y'(x,(p(x)9q) Φ 0 при любом q) гра-
фик функции у(х) в точках сопряжения касается графика
функции φ(#), или, другими словами, производная функ-
ции у(х) должна быть непрерывной.
Условие непрерывности производной функции дает допол-
нительные уравнения, необходимые для определения экстре-
малей. Пусть, например, решается задача (6.37), (6.38) в клас-
се функций у(х)еС1[х1,Х2] с фиксированными значениями
на концах у(х{) = у\, у(х2) = У2- Предположим, что график
искомого решения включает в себя один участок границы
у = (р(х) (см. рис. 6.4). Если найдено общее решение уравнения
Эйлера и тем самым получено уравнение семейства экстрема-
лей для функционала задачи, то для построения решения
нужно определить:
• абсциссы а и Ь точек сопряжения графиков экстремалей
с границей множества допустимых значений;
• две постоянные интегрирования на левом участке, соот-
ветствующем экстремали;
• две постоянные интегрирования на правом участке, со-
ответствующем экстремали.
Всего имеются шесть неизвестных, для определения ко-
торых нужны шесть уравнений. Два уравнения — это крае-
вые условия у(х\) = j/i, y(x2) = У2- Два уравнения вытекают
из непрерывности искомой функции в точках сопряжения:
у(а) = φ(α), if(b) = φ'φ). И два уравнения — это условия непре-
рывности производной функции у(х) в точках сопряжения:
у'(а) = <р'(а)9у'(Ъ) = <р'(Ь).
Пример 6,2. Найдем кривую наименьшей длины, соединя-
ющую точки А(а9 уА) и Б(Ь, ув)
и не заходящую внутрь круга D
(рис. 6.6).
Формально ограничение в по-
ставленной задаче не относится
к тому типу ограничения (6.38),
которое мы рассмотрели. Однако ° а
отметим, что в приведенных выше Рис. 6.6
194
6. Вариационные методы в оптимальном управлении
рассуждениях, главным в которых был анализ точек сопряже-
ния, используются только локальные свойства функции (р(х).
Поэтому все полученные результаты будут верны и в данной
задаче.
В поставленной задаче в предположении, что искомая кри-
вая является графиком функции, функционал можно записать
следующим образом:
ь
J[y] = jyjl + (y')2dx.
а
Так как интегрант рассматриваемого функционала зависит
только от г/, его экстремалями являются прямые у = С^х + С2
(это, впрочем, очевидно). Если круг D не пересекается с отрез-
ком АВ, то решение задачи — функция, графиком которой
является указанный отрезок АВ. Если же круг D пересекается
с отрезком АВ, то решение задачи следует искать в виде кривой,
составленной из отрезков, сопряженных с дугой окружности
dD, ограничивающей круг D. Поскольку /£у = (l + {у)2) ^ О,
кривая должна быть гладкой в точках сопряжения, т. е. отрез-
ки, стыкующиеся с дугой окружности 3D у являются отрезками
касательных к этой окружности (см. рис. 6.6)· Имеются два
кандидата в кривые наименьшей длины: один — кривая, рас-
положенная выше отрезка АВ (кривая AMNB), другой — ниже
(кривая AMN'В). Выбор из двух кандидатов зависит от распо-
ложения центра круга D по отношению к отрезку АВ: центр и
искомая кривая наименьшей длины располагаются по разные
стороны от прямой АВ. Отметим, что обе кривые соответствуют
двум точкам минимума рассматриваемого функционала, опре-
деленного на множестве кусочно-гладких функций, графики
которых не пересекают круг D.
Эта задача была решена в 1871 г. английским математиком
И. Тодхантером. #
Метод, примененный нами в задаче с ограничениями на
значения допустимых функций, можно использовать и в зада-
чах другого рода — задачах с управлением. Рассмотрим задачу
о минимизации функционала
ч
I[x,u]=\f°(t9x,u)dt (6.41)
6.3. Некоторые задачи с ограничениями ...
195
в классе непрерывных функций x(i)> удовлетворяющих крае-
вым условиям
x(ti) = Xi9 X(t2) = #2*
и в классе непрерывных функций u(t) (управлений), подчиня-
ющихся ограничению
u(t)<k, k = const. (6.42)
Предложенная задача может быть сведена к задаче с огра-
ничениями в виде равенств. Для этого нужно ввести вспомо-
гательную функцию z(t) по формуле
22 = k - U
и заменить ограничение (6.42) эквивалентным ему ограниче-
нием
z2 + u-k = 0. (6.43)
Тогда исходная задача будет эквивалентна задаче Лагранжа
с целевым функционалом
I[x,u,z] = f°(t,x,u)dt
h
и уравнением связи (6.43) (см. 4.1).
Этот подход может использоваться и в случае, когда вме-
сто ограничения (6.42) в задаче ставится ограничение в виде
двойного неравенства
кг<иЦ)<к2. (6.44)
Введя вспомогательную функцию z9 такое ограничение можно
заменить эквивалентным ограничением в виде равенства
(и-кг)(к2-и)-22 = 0.
Рассмотренный подход фактически исчерпывает возмож-
ности классического вариационного исчисления в задачах с
ограничениями, приводящими к поиску экстремума в замк-
нутой области. Успех здесь в основном определяется тем,
удается ли с помощью некоторых искусственных приемов
заменить в ограничениях неравенства равенствами. Иногда
способ такой замены подсказывается самой постановкой за-
дачи. Но даже если такое преобразование в задаче удалось
осуществить, преобразованная задача может не иметь ре-
196
6. Вариационные методы в оптимальном управлении
шения в классе гладких (и даже непрерывных) функций.
Показательной в этом смысле является линейная задача, к
изучению которой мы переходим.
6.4. Линейные задачи
оптимального управления
Среди управляемых систем, пожалуй, самое широкое приме-
нение в различных областях техники находят так называемые
линейные управляемые системы, т. е. автономные системы
с линейным законом движения
х = Ах + Ви, (6.45)
где х = (*i,..., хп)Т; и = (щ,..., иг)Т; А = (ау) и В = (bik) — число-
вые матрицы типов пхп и пхг соответственно.
Наиболее популярной в классе линейных управляемых
систем является задача оптимального быстродействия,
т. е. задача оптимального управления, в которой в качестве
целевого функционала взято время достижения системой
некоторого состояния x(t2) = х2. Это иллюстрируют системы
автоматического управления, которые поддерживают задан-
ный режим (или заданное движение) объекта, преодолевая
действие различного рода возмущающих сил. Для таких си-
стем обычно составляют уравнения возмущенного движения
[VIII] вида
x = f(x,u),
в которых фазовые координаты xt представляют собой откло-
нения координат объекта от их значений в заданном режиме
{возмущения), причем в начальный момент времени ix пола-
гают, что
x(t1) = x1*Q. (6.46)
Задачей системы управления является обеспечение таких
управляющих воздействий, которые в кратчайший срок воз-
вращают систему в заданный режим, т. е.
x(t2) = 0. (6.47)
Так как отклонения системы от установившегося режима
обычно малы, то правые части уравнений возмущенного дви-
6.4. Линейные задачи оптимального управления
197
жения можно приближенно заменить линейными выраже-
ниями, используя формулу Тейлора. Полученные линейные
уравнения вида (6.45) обычно называют уравнениями пер-
вого приближения [VIII] для возмущенного движения.
Рассмотрим частный случай системы (6.45), когда управ-
ление одно, т. е* u(t) = u(t) — скалярная функция, г = 1. Такая
система имеет вид
±i ~2\aVxJ +biu;
(6.48)
7=1
В качестве целевого функционала возьмем время t2 дости-
жения системой положения равновесия Xi(t2) = О, i = l,n, т. е.
I[x,u]= fdf->min, (6.49)
h
а на управление u(t) наложим ограничение
|и|<1. (6.50)
Попробуем с помощью вариационных методов решить
линейную задачу оптимального управления^ которая опре-
деляется соотношениями (6.46)-(6.50). Полагаем, что
хЮе&^МЛ*), u(t)eC[tut2].
Задача (6.46)-(6·50) является частным случаем задачи
(6.41), (6.44). Как было установлено (см. 6.3), экстремум мо-
жет достигаться лишь на функциях, составленных из участков
экстремалей и участков границы области управления (6.50).
Чтобы найти экстремали задачи, являющейся задачей Лагран-
жа в форме Понтрягина, запишем лагранжиан
η ( η
L(x9x,u) = l + ^Xt(t)\ Xi-^aijXj-biU
i=l { hl
Необходимое условие экстремума вне границы области (6.50)
есть уравнения Эйлера (6.22), (6.23). В линейном случае сис-
тема (6.22) преобразуется к виду
198
6. Вариационные методы в оптимальном управлении
Xt - -к\С1ц -}^2a2i ~--~hnani9 i -1, Uj
в матричной форме она имееет вид λ = -Ατλ9 или
λτ=-λτΑ, (6.51)
где λ = (λ19...,λη)τ; Α = (αφ — матрица системы (6.48) типа
пхп.
Второе уравнение (6.23) примет вид
η
ИЛИ
X(t)TB = 0, (6.52)
где В = (bl9..., bn)T — столбец коэффициентов при управлении
и в (6.48).
Продифференцируем равенство (6.52):
λτβ = 0. (6.53)
Исключим из этого равенства λτ, используя соотношение
(6.51) и свойства операции транспонирования. В результате
получим
λτΑΒ = 0. (6.54)
Снова продифференцируем (6.54) и затем исключим λτ, ис-
пользуя (6.51). Получим
λτΑ25 = 0.
Повторив операцию дифференцирования η - 1 раз, а затем
исключив λτ, приходим к следующей системе алгебраических
уравнении относительно λτ:
[λτΒ = 0;
\λΙΑΒ = 0;
λτΑ2Β = 0; (6.55)
λτΑΛ-1Β = 0.
6.4. Линейные задачи оптимального управления
199
Эта система имеет единственное нулевое решение в том
случае, когда ранг матрицы системы равен количеству не-
известных я, т. е.
Rg(B, АВ,..., Ап~1В) = п. (6.56)
Случай, когда выполняется соотношение (6.56), является
основным в теории линейных управляемых систем (без фа-
зовых ограничений). Это соотношение — необходимое и до-
статочное условие управляемости такой системы. Систему
называют управляемой*, если для любых начального и конеч-
ного состояний системы существует хотя бы один допустимый
процесс, переводящий систему из заданного начального состо-
яния в заданное конечное состояние. Свойство управляемости
системы означает, что задача управления для этой системы
имеет решение при любых краевых условиях.
Таким образом, в случае выполнения соотношения (6.56)
уравнение Эйлера имеет единственное решение k(t) = 0. Этому
решению соответствует лагранжиан L(x, x9 и) = 1, который сов-
падает с лагранжианом задачи, получающейся из исходной
отбрасыванием дифференциальных связей (6.48). Однако ли-
нейная задача (6.46)-(6.50) без дифференциальных связей
(6.48) бессодержательна и экстремалей не имеет.
Но если экстремалей не существует, то экстремум может
достигаться лишь на функции, график которой целиком нахо-
дится на границе области, т. е. либо и = 1, либо и = -1. Таким
образом, или оптимальное решение соответствует постоянному
управлению, или его можно найти, только если считать допу-
стимыми разрывные управления u(t) (далее мы покажем, что
задача имеет решение в классе кусочно-непрерывных управ-
лений). Как видим, вариацион-
ные методы, работающие в классе х а
непрерывных функций, в случае I
линейной задачи не позволяют, ! ! ! ! !
вообще говоря, найти решение. п—ч—h\—^—I—*~ **
Расширение класса допустимых ■ * ; 2 |_| · | т
функций требует изменить и ме- I
тоды решения задач. Рис. 6.7
В литературе термин «управляемая система» имеет различное тол-
кование.
200
6. Вариационные методы в оптимальном управлении
Даже если рассматривать кусочно-непрерывные управле-
ния и использовать напрашивающееся допущение, что опти-
мальное управление принимает лишь два значения ±1, мы
решения задачи все-таки не получим. Чтобы полностью опре-
делить кусочно-постоянное управление u(t), нужно указать
точки tkj в которых управление меняет значение на проти-
воположное (рис. 6.7).
6.5. Обсуждение методов
вариационного исчисления
Из изложенного в 6.3 и 6,4 ясно, что применение методов ва-
риационного исчисления в задачах оптимального управления
приводит к различного рода трудностям. Проанализируем
причины этих трудностей.
Задача Лагранжа в форме Понтрягина наиболее близка к
задаче оптимального управления. С помощью метода Лагран-
жа для нее удалось получить полную систему необходимых
условий и тем самым решить задачу в классе гладких функ-
ций x(t) и непрерывных управлений u(t). Но при этом урав-
нения Эйлера для управлений вырождаются в алгебраические
соотношения ((6.23) или (6.34)). Эти алгебраические соотно-
шения представляют собой необходимые условия экстремума
функционала и могут и не иметь решений, как, например, в
линейных задачах. В этом случае задача оказывается нераз-
решимой: функционал не достигает экстремумов в рассматри-
ваемом классе функций.
Что может дать расширение класса допустимых функций?
В связи с этим интересно сравнить задачу Лагранжа и задачу
оптимального управления в случае, когда в последней нет ог-
раничений на управление и фазовые координаты, т. е. когда
U = Шг и S = Шп. Тогда каждый допустимый процесс (x(t), u(t))
задачи Лагранжа является таковым и для задачи оптималь-
ного управления.
Обозначим через Λ функционал (6.17) в задаче Лагранжа
(6Л6)-(6.18), т. е. А[х9и] = Д*,и], х е C^i^L " е C[tl9t2],
а через О — этот же функционал в задаче оптимального управ-
ления*: 0[х9 и] = I[x, u], x g C[ti9t2]9 и е KC[ti,t2]- Очевидно,
* Обозначение КС[1Ъ t2] относится к классу функций, кусочно-непре-
рывных на отрезке [£ъ t2].
6.5. Обсуждение методов вариационного исчисления
201
что функционал Л является сужением функционала О. Пусть
в обеих задачах ищется наименьшее значение целевого функ-
ционала по всему классу допустимых управляемых процессов,
т. е. не локальный, а глобальный минимум. Так как Л есть
сужение О, то infA[x,u]> inf 0[х,и]. При определенных допол-
нительных предположениях относительно функций fl(i = 0, л),
Θ, Ψ, достаточно естественных в постановке задачи, можно
утверждать, что на самом деле inf A[x9u] = inf 0[х,и]. Напри-
мер, в простейшем случае дифференциальных связей х-и
указанное равенство будет выполняться, если лагранжиан
задачи непрерывен по совокупности переменных*.
Если в рассматриваемой задаче inf Л[#, и] > inf 0[x, и]9 то
очевидно, что существование решения в одной задаче не связано
с существованием решения в другой. Если inf Л[дс, и\- inf 0[x, и],
то возможна одна из трех ситуаций:
а) задача Лагранжа имеет решение. Тогда это решение од-
новременно является решением и задачи оптимального управ-
ления (правда, возможно, не единственным), так как решение
задачи Лагранжа является допустимым процессом для задачи
оптимального управления, дающим минимальное значение
целевого функционала;
б) задача Лагранжа не имеет решения, а задача оптималь-
ного управления имеет, т. е. точная нижняя грань значений
функционала достигается на управляемом процессе, в котором
либо x(t) не является непрерывно дифференцируемой, либо
u(t) не является непрерывной;
в) ни задача Лагранжа, ни задача оптимального управле-
ния не имеют решения, т. е. точная нижняя грань значений
целевого функционала не достигается и на более широком
классе допустимых процессов.
Пример 6.3. Проиллюстрируем ситуацию б):
1
1[х, и]= \ (1-й2)2dt-^min, х = и, х(0) = х(1) = 0.
о
Точная нижняя грань значений функционала достигается на
кусочно-гладкой функции x*(t) с соответствующим ей опти-
мальным управлением u*(t):
* Доказательство см. в книге: Алексеев В.М., Тихомиров В.М., Фо-
мин СВ.
202
6. Вариационные методы в оптимальном управлении
**<*) =
t, 0<t<-;
2
1-t, -<t<l,
2
u*(t) =
1, 0£*S-;
-1, I<«1.
В классе гладких функций точная нижняя грань функцио-
нала, равная нулю, не достигается, так как нулевое значение
функционала возможно лишь при u(t) = 1 или при u(t) = -1* Но
при этом x(t) = ±t + С, что противоречит краевым условиям.
В этой задаче переход от класса гладких к классу кусоч-
но-гладких функций означает переход от задачи Лагранжа к
задаче оптимального управления. Заметим, что в рассматрива-
емом случае inf Λ = inf О = 0. Действительно, так как значения
целевого функционала неотрицательны, то в силу неравенства
inf Λ > inf О достаточно показать, что inf Λ = 0. Рассмотрим по-
следовательность кусочно-гладких управлений
un(t) =
1,
0<*<Ι-Ι;
2 η
Л
п\ —t
-1,
1 1
1 1
, <f<- +—; 7i = 2,3,....
2 η 2 η
- + -<t<l,
2 η
Каждому из этих управлений соответствует допустимая
t
функция xn(t)=\un(t)dt, которая удовлетворяет условию
о
хп(1) - 0 в силу симметричности графика функции un(t) отно-
сительно точки (1/2, 0). При этом
Ι/2 + Ι/τγ
In=I[xn,un] = j(l-u2)2dt= j
г
s.l\
l-n<
1/2-1//1V.
— i
dt<-.
η
Таким образом, In —>0 при η—><».
Пример 6.4. Ситуацию в) иллюстрирует пример Больца:
1
I[x, u]= |((l-u2)2+;t2)di->min, х = и, х(0) = х(1) = 0.
6.5, Обсуждение методов вариационного исчисления
203
Рис. 6,8
В этой задаче решения не
существует. Действительно,
точная нижняя грань значений
функционала в классе кусоч-
но-гладких функций равна ну-
лю, так как значения целевого
функционала неотрицательны,
а нулевое значение достигается
в пределе по следующей после-
довательности кусочно-гладких функций (рис. 6.8):
t
*.(*)-JdsnUnaDiT*. „ = 1,2,....
о
Последовательность функций {xn(t)} равномерно сходится
к нулю, при этом Unit) = Xn(t) = 1 всюду на [0, 1], кроме конеч-
ного числа точек. Значит,
1 1
/[*л,ыл] = |((1-и*(^
о о
Однако нулевое значение не достигается функционалом
ни на одной кусочно-гладкой функции. Для x(t) = 0 u(t) = 0
и 1[х, и] = 1. А если x(t) φ 0 хотя бы в одной точке, то в силу
непрерывности этой функции
1
l[x,u]>\x2(t)dt>0. #
Мы сравнили задачу Лагранжа и задачу оптимального
управления с точки зрения глобального экстремума целевого
функционала. Чтобы провести такое сравнение для локальных
экстремумов, нужно ввести соответствующее понятие для за-
дачи оптимального управления.
Допустимый процесс (x*(t)9 u*(i)) будем называть локально
оптимальным в задаче с фиксированным отрезком [t1? t2L
если найдется такое ε > 0, что для всякого допустимого про-
цесса (x(t)j u(t))j удовлетворяющего условию
x(t)-x*(t)\<e9 te[tut2l
(6.57)
204
6. Вариационные методы в оптимальном управлении
верно неравенство
1[х,и]>1[х\и*].
Если отрезок [tl9 t2] не является фиксированным, то ка-
ждому допустимому процессу соответствуют свои моменты
времени t\ и i2. В этом случае локально оптимальным процес-
сом будем называть допустимый процесс (x*(t)7 u*(t)) с проме-
жутком времени [tl, i|], для которого найдется такое ε > 0, что
для любого процесса (x(t), u(t)) с промежутком времени [i1? i2],
удовлетворяющего условиям
|*i-*i|<e, |*2-*2|<ε> \x*(t)-x(t)\<E при *е[*1,*2]П[*1,*2]»
выполнено неравенство
1[х,и]>1[х\и*].
Отметим, что в задаче Лагранжа, как и в любой дру-
гой задаче вариационного исчисления, различают сильный
экстремум и слабый экстремум. Точка слабого экстремума
(x*(t), u*(i)) доставляет экстремум целевому функционалу
среди всех допустимых процессов (x(t)9 u(i))> для которых x(t)
попадает в некоторую слабую ε-окрестность x*(t), a u(t) —
в некоторую сильную ε-окрестность u*(t). Локально опти-
мальный процесс в задаче оптимального управления ограни-
чивает сравнение некоторой сильной окрестностью x*(t), а на
управления ограничения не накладываются вообще· Это соот-
ветствует сильному экстремуму в задаче Лагранжа. Поэтому
могут возникать ситуации, когда локальное решение задачи
Лагранжа не является оптимальным процессом соответст-
вующей задачи оптимального управления. Если же в задаче
оптимального управления найден оптимальный процесс с
непрерывным управлением, то (в рамках предположений от-
носительно функций, входящих в задачу) этот процесс будет
являться сильным минимумом в задаче Лагранжа, т.е. давать
ее локальное решение.
Итак, задача оптимального управления является в указан-
ном смысле расширением задачи вариационного исчисления.
Однако если область U допустимых управлений открыта, то
ничего нового в действительности мы не получим. По-настоя-
щему новой задача оптимального управления становится, если
6.5, Обсуждение методов вариационного исчисления
205
в ней присутствуют ограничения в виде нестрогих неравенств
(например, | иу-1 < М, j = 1, г ), когда область управления U яв-
ляется замкнутой· Именно этот дополнительный элемент де-
лает задачу оптимального управления существенно отличной
от вариационной и приводит к необходимости нового подхода
к ее решению, связанного с изменением понятия допустимой
вариации. Не углубляясь в детали такого подхода (об этом
речь далее), отметим лишь очевидные факты, вытекающие из
замкнутости области управления.
Вернемся к задаче Лагранжа (6.16)-(6.18). Введение мно-
жителей Лагранжа позволяет рассматривать переменные вспо-
могательного функционала (6.19) как независимые (множите-
ли Лагранжа при этом считаем фиксированными функциями).
При таком подходе задаче об экстремуме функционала Г[ху и]
можно поставить в соответствие две задачи:
\1*[х, u*]^extr,
(6.58)
/*[#*, и]—>extr.
Другими словами, если x*(t), u*(t) — решение задачи Р[х> и] -»
-> extr, то x*(t) — решение первой задачи в (6.58), a u*(t) —
второй. Поэтому можно объединить необходимые условия
двух этих задач, чтобы получить необходимые условия в за-
даче об экстремуме функционала Г[х9 и].
Однако в рамках задачи оптимального управления с замк-
нутой областью управления U система необходимых условий
(6.23) уже не является полной, так как не учтено ограничение
u(t) e U (множители Лагранжа позволяют учесть ограничения
только в виде равенств). Изменяется характер второй из двух
задач (6.58). Она формулируется так:
L(f,#*, #*, u)dt —> min,
ие KC[tlf i2], u(t)e U, te [tl9 i2]- (6.59)
Необходимое и достаточное условие экстремума в данной
задаче состоит в следующем. Кусочно-непрерывная функ-
ция u*(t) со значениями в замкнутой области U доставляет
минимум в задаче (6.59) тогда и только тогда, когда всюду
206
6. Вариационные методы в оптимальном управлении
на отрезке [fx, f2], кроме точек разрыва u*(t), выполнено
соотношение
min Lit, **(0, x*(t)Mt)) = L(t, **(i), **(0,"(θ)·
UGKC[tlft2] V 7 V 7
u(t)tU
В канонических переменных то же соотношение выглядит сле-
дующим образом:
min Hit, x*(t), P*(t), u(t)) = H(t9 **(i), P*(t), u*(t)). (6.60)
u(t)GU
Для получения полной системы условий к (6.60) нужно
добавить необходимые условия экстремума для задачи
1*[х7 и*] -»min, хе C[ii, t2],
которые в канонических переменных имеют вид (6.33).
Условия (6.33) и (6.60) фактически представляют собой
основные соотношения в принципе максимума Понтрягина.
Полная формулировка этого принципа будет изложена далее
(см. 7).
Если на управление u(t) нет никаких ограничений, то не-
обходимым условием максимума функции Понтрягина Η
является обращение в нуль производных этой функции по
управлениям, что и отражено в уравнениях (6.34). Но если
на управление и наложены нестрогие ограничения (т. е. U
замкнуто), то максимум функции Понтрягина может дости-
гаться как внутри U (тогда выполняются равенства (6.34)),
так и с выходом на границу. Это значит, что уравнения (6.34)
в случае замкнутой области U следует заменить более общим
условием — условием максимума функции Η по управлениям.
Именно эта идея, высказанная в 1956 г. Л.С. Понтрягиным*,
и послужила основой всех дальнейших работ, связанных с
развитием принципа максимума. Обоснование этой идеи было
дано много позже .
* См.: Болтянский В.Г., Гамкрелидзе Р.В., Понтрягин Л.С.
** См.: Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищен-
ко Е.Ф.
Вопросы и задачи
207
Вопросы и задачи
6.1. Запишите полную систему необходимых условий для
задачи Лагранжа в форме Понтрягина с подвижными конца-
ми t1 и i2-
f2 n
xfdt^> extr, x - (p(x) + G(x)u, x(t1) = x1, x(t2) = x2.
Здесь x = (xl9...,xn)T; и = (щ,..., игУ; <p(*) = (<Pi(z),..., φ„(*))τ;
G(x) — матрица типа η х г; х1, х2 — известные векторы на-
чального и конечного состояний.
6.2. Найдите экстремали в следующих задачах Лагранжа:
π/2
а) \ и2 dt —> extr, хх = х2, х2 = ~Х\ + ы, Х\(0) = 1;
о
π/2
б) \ и2 dt + [xi (О)]2 —> extr, Xi = х2, х2= -Х\ + и;
о
1
в) u2df+ |>2(0)]2 -^extr, x1=x2, x2=Xi+u, лп(0) = 1;
о
1
г) \(х2 +u2)dt —>extr, x = x + u9 #(1) = 1.
о
6.3. Найдите кратчайший путь между точками А (-3, 0) и
В (3, 2) на плоскости при условии, что вдоль этого пути вы-
полняется неравенство х2 + у2 > 4.
Σ
7. ПРИНЦИП МАКСИМУМА
В 1956 году Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкре-
лидзе и Е.Ф* Мищенко предложили метод, который обобщил
методы классического вариационного исчисления в случае
задач, в которых управляющие воздействия описываются
кусочно-непрерывными функциями, а множество значений
этих функций принадлежит замкнутому ограниченному мно-
жеству· В основу этого метода был положен так называемый
принцип максимума.
Принцип максимума дает необходимые условия оптималь-
ности, которые позволяют выделить из множества допустимых
процессов некоторое подмножество процессов, «подозритель-
ных» на оптимальность. В этом смысле метод решения задач
оптимального управления на основе принципа максимума ана-
логичен методам исследования функций одного или несколь-
ких переменных, при которых отбираются точки, удовлетворя-
ющие необходимым условиям, а затем каждая из отобранных
точек анализируется, например, с помощью достаточных усло-
вий. В рамках теории оптимального управления необходимые
условия хороши тогда, когда с их помощью удается выделить
небольшое количество процессов, которые могут быть опти-
мальными. Принцип максимума для широкого круга задач да-
ет возможность определить единственную траекторию, которая
может быть оптимальной. Если в конкретной задаче из каких-
либо соображений (например, из содержательного смысла этой
задачи) известно, что оптимальное управление существует, то
выделение единственной траектории, «подозрительной» на оп-
тимальность, дает решение задачи.
Первое доказательство принципа максимума дал Р.В. Гам-
крелидзе для линейных задач оптимального управления. Он
построил полную теорию линейных систем управления и до-
7.1, Автономная система управления. Формулировка принципа максимума 209
казал достаточность принципа максимума для таких систем.
Таким образом, для линейных задач оптимального управле-
ния принцип максимума — необходимое и достаточное усло-
вие оптимальности.
В общем нелинейном случае принцип максимума доказал
В.Г· Болтянский, который построил и основы нелинейной тео-
рии оптимального управления.
7.1. Автономная система управления.
Формулировка принципа максимума
В этом разделе мы сформулируем принцип максимума для
задачи оптимального управления в предположении, что фа-
зовые ограничения отсутствуют, т. е. для системы с законом
движения
x = f(x,u), (7.1)
где фазовый вектор x(t) = (xi(t),..., x„(f)) может принимать
любые значения из W1.
Считаем, что на вектор управления u(t) = (ui(t),..., ur(i))
наложены ограничения
ие KC[tl9 i2], u(t)e U, te [tu i2], (7.2)
где U — произвольное множество в MS (в частности, оно может
быть замкнутым и ограниченным), а вектор-функция /(#, и) =
= №г(х, и),..., fn(x, и)) непрерывна по совокупности всех пе-
ременных и непрерывно дифференцируема по части перемен-
ных х [V].
Как и раньше, управления, удовлетворяющие (7.2), будем
называть допустимыми, а пару (x(t)9 u(t)), в которой x(t) есть
решение системы (7.1) при заданном u(f), — допустимым
процессом.
Зададим следующие краевые условия:
x(ti) = x =(#i,..., хп) 9 х($2) = х =\х\»■■·» хп) ■ (7-3)
Требуется найти такое допустимое управление u(t), которое
переводит систему (объект) из фазового состояния x{t\) = x1 в
фазовое состояние x(t2) = x29 причем соответствующий допу-
стимый процесс (x(t), u(t)) доставляет минимум функционалу
210
7. Принцип максимума
I[x,u] = jf°(x(t),u(t))dt,
(7.4)
где функция f° удовлетворяет тем же условиям, что и вектор-
функция f.
Считаем, что интервал времени управления t2-ti произ-
вольный. Это означает, что каждому допустимому процессу,
при котором система переходит из состояния х1 в состояние
х2, соответствуют свои моменты времени ^ и t2.
Поставленная таким образом задача — это задача с фик-
сированными концами (точки л:1 и х2 фиксированы) и сво-
бодным временем. Как и ранее, управление u*(i), дающее
решение поставленной задачи, будем называть оптимальным
управлением, соответствующую траекторию x*(t) — опти-
мальной траекторией, а процесс (#*(i), u*(t)) — оптималь-
ным процессом.
Экстремальная задача (7.1)-(7.4) по форме похожа на за-
дачу Лагранжа (6.16)-(6.18), но отличается от нее наличием
ограничения на управление u(t) e U и расширением класса до-
пустимых функций. При этом не требуется, чтобы существова-
ли частные производные функций /°,..., fn по переменным иг
Остановимся на некоторых простейших свойствах опти-
мальных управлений и траекторий, непосредственно вытека-
ющих из постановки задачи. Прежде всего из автономности
системы (7.1) и интегранта функционала (7.4) следует, что
свойства управлений не изменяются при сдвиге вдоль оси t
(рис. 7.1). Другими словами, если управление u(i), t е [il7 i2],
переводит систему из состояния х1 в состояние х2, а целевой
функционал на соответствующем допустимом процессе при-
нимает значение /, то при любом h управление u(t - h), t e
е [#! + Λ, t2 + h] также переводит
систему из состояния я1 в состо-
яние х29 а целевой функционал
при этом также будет иметь зна-
чение /· Следовательно, решение
задачи не единственно. Но мы мо-
жем из оптимальных управлений
выбирать такое, для которого t\
имеет фиксированное положение,
u(t - h)
t2 t2-\- h t
Рис. 7.1
7 Л. Автономная система управления. Формулировка принципа максимума 211
а точка f 2 свободно перемещается по оси времени. Далее будем
считать, что ix фиксировано, a £2 свободно меняется.
Пусть х1, ..., хк — конечный набор точек фазового про-
странства, для которых существует набор таких управлений
u2(t), ..., uk(t)9 что управление Ui(t) переводит систему из со-
стояния х1~1 в состояние х1 и дает целевому функционалу зна-
чение Iif i = 2, k. Тогда существует управление u(t), переводя-
щее систему из состояния х1 в состояние хк и дающее целево-
му функционалу значение I = 12 + ... + Ik. Действительно,
поскольку управления можно сдвигать вдоль оси времени, то
будем считать, что интервалы времени управлений U;(f) при-
мыкают друг к другу, поэтому управление ut(t), i = 2,k, зада-
но на отрезке [i;-i> **]» причем ti < t2 < ... <tk (рис. 7.2). Тогда
управление u(i), на интервале [i;-i, tt] совпадающее с ut(t) и
в целом заданное на отрезке [il5 tk]9 переводит систему из со-
стояния х1 в состояние хк и придает функционалу значение
12 + ... + Ik- Отметим, что указанная операция «объединения»
управлений невозможна в классе непрерывных управлений,
так как в точках стыка tt объединенное управление u{t) может
иметь точки разрыва первого рода (см. рис. 7.2).
Hi
О tx t2 t3
Рис. 7.2
Если u*(i), t е [tl9 i2], — оптимальное управление, то любой
его участок [тх, τ2], ii < τ1 < τ2 < i2, также является оптималь-
ным управлением. То же верно для оптимальных траекторий.
Пусть x*(t) — соответствующая u*(t) оптимальная траекто-
рия, x*(ti) = х1, x*(t2) = x2. Рассмотрим произвольный участок
[ii, τ2] с: [tl9 i2], и пусть х3 = ^(тх), я4 = Χ*(τ2). Утверждается,
что интеграл
ff°(x*{t)9u*(t))dt
212
7. Принцип максимума
имеет наименьшее значение среди всех допустимых управле-
ний, переводящих систему из положения Xs в положение л:4.
Пусть значения целевого функционала для управления x*(t)
на участках [tlf τ^, [τ1? τ2], [τ2, t2] есть соответственно /1? /2,
/3- Тогда управление u*(t) на всем отрезке [i1? i2] придает
целевому функционалу значение I = Ii+ I2 + Is* Если управ-
ление u*(i) не является оптимальным на [τ1? τ2], то сущест-
вует управление v(t), переводящее систему из положения Xs
в положение я4 и придающее целевому функционалу значе-
ние Ιυ<12. Но тогда управление, составленное из управления
и на участках [fb τΧ], [τ2, i2] и управления »(f) на участке
[ii, τ2], переводит систему из положения х1 в положение х2
и придает целевому функционалу значение 11 + Ιυ + 13 < /,
т. е. u*(t) не является оптимальным управлением. Аналогич-
ные рассуждения можно провести для фазовых траекторий.
Перейдем теперь к основным соотношениям, необходимым
для того, чтобы сформулировать принцип максимума. Вклю-
чим фазовое пространство W1 в (п + 1)-мерное пространство
Мл+1, присоединив к координатам хъ ..., хп дополнительную
координату х0. При этом потребуем, чтобы функция JC0(i) удов-
летворяла соотношению
t
x0(t) = jf°(x,u)dt.
ч
Тогда функция Xo(t) будет решением уравнения
dXo j?0/ \
dt
Присоединим это уравнение к системе (7.1):
d х. л
— = /(*,"), (7.5)
dt
где х = (х0,х)т =(х0,хъ...,хп)т; / = (/°, /\..., fnf.
Заметим, что правые части системы (7.5) не зависят от х0.
Целевой функционал I (7.4) рассматриваемой задачи те-
перь можно записать в виде 1[х, и] = #0(i2), т. е. он оказался
равным конечному значению координаты х0. Задача тем са-
7.1. Автономная система управления. Формулировка принципа максимума 213
мым свелась к выбору такого допустимого управления u(i),
которое осуществляет переход точки x(t) в (п+1)-мерном
~1
пространстве из положения х = (0, дг) в ближайшую точку
Z2 -(^
х = (xq , лг) на прямой, параллельной оси Ох0 и проходящей
через точку (0, х2) (ближайшая точка в смысле минимума ко-
ординаты х0, рис. 7.3).
Рис. 7.3
Рассмотрим вспомогательную систему
α=0
dfa(x,u)
dXi
Ψ
α»
i = 0, η,
(7-6)
относительно неизвестных функций \|//(i). Эту систему иногда
называют сопряженной системой к системе (7.5), а перемен-
ные ψ, — сопряженными переменными.
Если u(i) — некоторое допустимое управление, x(t) — со-
ответствующая этому управлению фазовая траектория, то,
подставляя эти функции в правые части уравнений (7.6), по-
лучим линейную однородную систему дифференциальных
уравнений с известными кусочно-непрерывными коэффици-
ентами. Поэтому при любых начальных условиях эта система
имеет единственное решение [VIII]. Так как функции fa(x,u),
α = 0, η, не зависят от jc0, то первое уравнение системы (7.6)
имеет простой вид
dt
= 0,
из него получаем ψ0 = const.
214
7. Принцип максимума
Составим функцию Понтрягина
η
Η(Ψ, х, и) = £ψαΓ(*, и) = (ψ, f(x, »)), (7.7)
α=0
где Ψ = (ψ0,...,ψΛ)τ — вектор сопряженных переменных.
При фиксированных значениях Ψ и л: функция Понтряги-
на есть функция от и е U. Точную верхнюю грань значений
этой функции обозначим через Μ(Ψ, я:) :
M({¥,x) = suvH({¥9x,u).
НЕ U
Если точная верхняя грань значений непрерывной функ-
ции Η достигается в некоторой точке области управления U,
то Μ(Ψ, х) является максимумом значений функции Η при
фиксированных Ψ ид;.
Теорема 7.1 (принцип максимума). Если управление u*(i),
t e [fl5 i2], и соответствующая ему фазовая траектория x*(t)
оптимальны, то найдется такая ненулевая вектор-функция
Ψ*(0> соответствующая функциям x*(t) и ц*(£) (т. е. удовлет-
воряющая сопряженной системе (7.6) при подстановке в нее
x*(t) и u*(t)), что:
1° при каждом значении ie [il5i2] функция if (Ψ (t)9x (t),u)
от переменных и достигает максимума в точке и = u*(i):
я (ψ*(0, **(*)> »*(*)) = Μ(ψ*(*), **(*));
2° в конечный момент времени i2 выполнены соотношения
\V*0(t2)<09 M(4>*(i2),;c*(i2)) = 0. #
В заключение отметим, что системы (7.5) и (7.6) с помощью
функции Понтрягина могут быть записаны как гамильтонова
система следующим образом:
dxt дН
dt d\\ft
d\\ft _ дН
dt dxi
i = 0, η;
(7.8)
i = 0, п.
7.1· Автономная система управления. Формулировка принципа максимума 215
Очевидно, что если вектор-функция x(t) удовлетворяет систе-
ме (7.1), то она удовлетворяет и первой подсистеме в системе
(7.8), поскольку все уравнения, кроме первого, в этой подсис-
теме как раз и образуют систему (7.1).
Замечание 7.1. Если Ψ(0> x(t), u(t) удовлетворяют системе
(7.8) и условию 1°, то функции ψο(0 и Μ(Ψ(£), *(0) перемен-
ного t являются постоянными. Действительно, как уже было
отмечено, из системы (7.6) следует, что ψ0 = const. Покажем,
что функция Μ(Ψ(£)> x(t)) постоянна, предполагая, что она
имеет производную*, которую можно вычислять по правилу
дифференцирования сложной функции. Зафиксируем Ψ(£) и
x(t) и рассмотрим функцию Μ(Ψ(£), x(t)) переменного f. Вы-
числим производную этой функции в силу системы (7.8):
dM__ydM_dXi_ γ дМ dyj
dt ~^dxi dt ^ο^ψ; dt
Л.
При дифференцировании учтено, что функции Η (Ψ, х, и) и
Μ(Ψ, х) не зависят от х0. Так как
дМ дН дМ дН
dxt dxt 9 d\\fj d\\tj 9
то из (7.9) получаем
dM у^дН дН π дН дН
dt
> > = 0.
j-fdXi θψ* ^3ψ7· dxj
Из условия постоянства функций ψ0(0 и Μ (Ψ(£)> x(t)) сле-
дует, что условие 2° в теореме (7.1) можно проверять в любой
момент времени t e [fi, i2]·
* Доказательство существования у функции Μ(Ψ(£), x(t)) производной
почти всюду см.: Понтрягин Л.С^ Болтянский В.Г., Гамкрелидзе Р.В.,
Мищенко Е.Ф.
216
7. Принцип максимума
7.2. Обсуждение принципа максимума
Остановимся на достаточности соотношений принципа мак-
симума для решения поставленной задачи оптимального
управления. Набор условий теоремы 7.1 в некотором смысле
является полным» Он позволяет из всех траекторий, прохо-
дящих через две заданные точки х1 и х2, выделить отдельные
(или одну) траектории, среди которых находится оптимальная
траектория, если, конечно, она существует.
Действительно, вся совокупность траекторий определяется
2п + 1 дифференциальными уравнениями (7·8) (если опустить
первое уравнение —- = f°(x, и)) и г алгебраическими урав-
dt
нениями, которые дает условие 1° теоремы 7.1. Например,
если максимум функции Η достигается во внутренней точке,
то необходимым является обращение в нуль г частных произ-
водных. Если максимум достигается на (г - 1)-мерной поверх-
ности, лежащей на границе области управления С/, то по ме-
тоду Лагранжа для поиска условного экстремума функции
многих переменных [V] получаем г уравнений, приравнивая
нулю частные производные функции Лагранжа, и одно урав-
нение связи при дополнительном неизвестном — множителе
Лагранжа. После исключения множителя Лагранжа остается
г алгебраических уравнений. Аналогичен общий случай, ког-
да максимум достигается на ^-мерной поверхности, располо-
женной на границе U.
Итак, всего имеется 2п + 1 + г уравнений, связывающих
2η + 1 + г переменных Ψ, х, и. Так как из этих соотношений
г — алгебраические уравнения, решения зависят от 2/г + 1
параметров — начальных условий. Один из параметров явля-
ется несущественным, поскольку функция Η однородна отно-
сительно переменных ψα, а все функции ψα(£) определены
лишь с точностью до общего множителя. Кроме того, один из
параметров определяется условием в момент времени t\ (или
в любой другой момент):
тах#(ЧЧО, *(*i), и) = 0.
ueU
Таким образом, все многообразие решений зависит от
2п-1 параметров. Время t2 также является параметром. Сле-
7,2. Обсуждение принципа максимума
217
довательно, искомая оптимальная траектория, если она су-
ществует, определяется 2/г параметрами. Чтобы определить
эти параметры, мы имеем η начальных условий x{ti) = x1 и
η конечных условий x(t2) = х2* Значит, есть полная система
условий, которая позволяет найти одну или несколько потен-
циально оптимальных траекторий.
Однако пока нельзя утверждать, что траектории, найден-
ные в результате решения упомянутой системы соотношений,
являются оптимальными: использованные условия являются
необходимыми, но недостаточными. Требуется проверка най-
денных траекторий на оптимальность. В простейшем случае,
когда выявлена только одна траектория, а из каких-либо соо-
бражений известно, что оптимум существует, можно утверж-
дать, что найденная траектория и есть оптимальная.
Если принципу максимума удовлетворяют несколько тра-
екторий, то для выявления среди них оптимальной нужны
дополнительные условия. Иногда удается отделить посторон-
ние траектории, сравнивая значения целевого функционала.
Заметим при этом, что оптимальная траектория может быть
не единственной, а отброшенные траектории, не являясь оп-
тимальными, могут оказаться локально оптимальными.
Сравним принцип максимума с условиями оптимальности,
вытекающими из классического вариационного исчисления.
Для этого вернемся к задаче Лагранжа в форме Понтрягина
(6.16)-(6.18). Остановимся на частном случае, когда правые
части уравнений (6.16) и интегрант целевого функционала
(6.17) не зависят от t, правый конец t2 отрезка [i1? t2] свободен,
а краевые условия (6.18) имеют вид (7.3), т. е.
\W(x(t1)) = x(t1)-x19
; 9 (7.10)
[@{x(t2)) = x(t2)-x2.
В этом случае задача (6.16)-(6.18) преобразуется к виду (7.1),
(7.3), (7.4).
Запишем вспомогательный функционал (6.19). С учетом
(7.10) имеем
*2 η П
J*[x,tt] = jLdt + 2(^Kii)-^1)^+2(x^*2>"x?)i;'' (7Л1)
где L(jc, я, u)-f°(x7 u) + XT [x-f(x, it)).
218
7. Принцип максимума
В канонических переменных необходимые условия опти-
мальности, полученные с помощью метода Лагранжа, имеют
вид (6.33), (6.34). К ним следует добавить условия трансвер-
сальности (6.35), (6.36):
Pi(ti) = Vi> Pi(t2) = -Vi, i = l, n, (7.12)
и, учитывая свободное изменение t2, соотношение (6.30) для
k = 2, которое с учетом равенств pt =Xi9 i = l,n (см. (6.32)),
в канонических переменных принимает вид
η
L(x(t2), xit2)fU(t2))-^Pt(t2)Xi(t2) = 09
где (x(t), u(t)) — точка экстремума функционала.
Переходя по формулам (6.32) к функции Понтрягина Н,
находим
H(x(t2),p(t2),u(t2)) = 0. (7.13)
Здесь p(t) — вектор канонических переменных, соответству-
ющих точке экстремума (x(t), u(t)).
Соотношения (6.33), (6.34), (7.12), (7.13) представляют со-
бой необходимые условия экстремума функционала в задаче
Лагранжа, полученные вариационными методами. Отметим,
что в рамках рассматриваемой задачи условия (7.12) являют-
ся бессодержательными и для полного решения задачи (7.1),
(7.3), (7.4) достаточно систему дифференциальных уравнений
первого порядка (6.33) относительно 2/г неизвестных функций
дополнить 2/г краевыми условиями (7.3). Таким образом, полу-
чаем полную систему необходимых условий (6.33), (6.34), (7.3),
(7.13) для решения задачи Лагранжа в форме Понтрягина с
дифференциальной связью (7.1) и целевым функционалом (7.4).
Сравним эти условия с условиями принципа максимума в
рамках теории оптимального управления. Очевидно, что
функция Понтрягина (6.32) совпадает с аналогичной функци-
ей (7.7), если в последней положить ψ0 = -1. Это всегда можно
сделать согласно условию 2° теоремы 7.1, поскольку сопря-
женные переменные, как уже было отмечено, определены
лишь с точностью до общего множителя, а значение ψ0 = 0
соответствует вырожденной задаче, в которой поиск экстре-
мума теряет смысл, ибо построение решения никак не зависит
7,2. Обсуждение принципа максимума
219
от целевого функционала. С учетом этого система (6.33) пол-
ностью эквивалентна системе (7.8), если в последней отбросить
два очевидных уравнения —-~f°(x, и) и —- = 0. Вектор
dt dt
сопряженных переменных Ψ = (ψΧ,..., ψ„)τ имеет здесь тот же
смысл, что и канонические переменные р = (р\,..., рЛ)т.
Указанное совпадение уравнений для фазовых координат
полностью соответствует выводам в 6.5. В рассматриваемой за-
даче оптимального управления отсутствуют фазовые ограниче-
ния, а фазовые координаты xt{t) описываются непрерывными
функциями. Поэтому для них естественно ожидать выполне-
ния уравнений Эйлера, даже если управляющие воздействия
достигают ограничений и претерпевают разрывы. В последнем
случае координаты могут иметь угловые точки, а уравнения
Эйлера должны выполняться на каждой из дуг экстремали.
Сходство уравнений для фазовых координат не распро-
страняется на управления. В вариационной задаче (задаче
Лагранжа) управления не ограничиваются и описываются
непрерывными функциями. Поэтому гамильтонова система
(6.33) до полной расширяется системой (6.34), которая также
является эйлеровой. Уравнения (6.34) представляют собой не-
обходимые условия максимума для функции Понтрягина Н.
В задачах оптимального управления функции wy(i), вообще
говоря, разрывны и могут достигать ограничений на управле-
ния. Поэтому уравнения Эйлера (6.34) не применимы. Однако
условие максимума функции Понтрягина как необходимое
условие оптимальности сохраняется и в этом случае. При
этом условие 2° теоремы 7.1 согласуется с условием (7.13) на
правом конце, которое получено вариационными методами.
Таким образом, условие максимизации функции Понтряги-
на в принципе максимума является более общим по сравнению
с уравнениями Эйлера. Очевидно, что в случае, когда область
управления U есть открытое множество (тогда условие (6.34)
необходимо для максимума функции Н)у из принципа максиму-
ма следуют условия оптимальности (6.33), (6.34), полученные
методами классического вариационного исчисления.
Итак, принцип максимума выглядит, по крайней мере,
достаточно закономерной гипотезой, непосредственно вытека-
ющей из задач вариационного исчисления. Однако, несмотря
220
7. Принцип максимума
на то что эта гипотеза почти очевидна, она долгое время не
была обоснована. Дело в том, что при выводе необходимых
условий принципа максимума в соответствии с определени-
ем оптимального процесса приходится сравнивать не только
близкие одно к другому управления. В этом отличие данных
условий от условий классического вариационного исчисления,
в этом их сила и сложность в обосновании. Коснемся основной
идеи доказательства*.
Сначала принцип максимума был доказан для линейных
систем. Идея этого доказательства следующая. Пусть неко-
торое оптимальное управление переводит точку х1 в точку
х2. Если вместо оптимального управления взять другое допу-
стимое управление на том же отрезке [tu £2]> т° точка х1 пе-
рейдет в некоторую точку jc(i2)· В силу свойства линейности
совокупность всех построенных таким образом точек x(t2)
образует выпуклое множество М. Из оптимальности исходно-
го управления вытекает, что точка х2 лежит на границе этого
множества. Через любую граничную точку, в том числе и через
точку х29 выпуклого множества Μ можно провести так назы-
ваемую опорную гиперплоскость, т. е. гиперплоскость, кото-
рая проходит через эту граничную точку так, что множество
Μ целиком лежит по одну сторону от этой гиперплоскости.
Вектор Ψ, ортогональный к этой плоскости и направленный
во внешнюю сторону множества Μ, и является тем вектором,
который используется при построении функции Н.
Для нелинейной системы множество всех точек x(t2), по-
лучаемых с помощью всевозможных допустимых управле-
ний, не является выпуклым. Использование линеаризации
невозможно, так как она позволяет сравнивать лишь близкие
управления, а это не соответствует характеру задач оптималь-
ного управления. Успех определил выбор класса управлений
для сравнения с оптимальным. При построении этого класса
использовались так называемые вариации Макшейна (иголь-
чатые вариации). При таких вариациях управление изменя-
ется на небольшом промежутке времени. В пределе этот про-
межуток стягивается в точку, но изменение управления оста-
ется конечным. Таким образом, с игольчатыми вариациями в
рассмотрение вводятся управления с разрывами первого рода.
* Полное доказательство принципа максимума см. в книге: Понтря-
гин Л.С., Болтянский ВТ., Гамкрелидзе Р.В., Мищенко Е.Ф.
7.3. Задача быстродействия
221
С помощью нескольких игольчатых вариаций строится допу-
стимое управление, отклоняющееся от оптимального лишь
на конечном числе малых интервалов времени. Несмотря на
конечность изменения управления в каждом таком интерва-
ле, общее изменение функционала будет мало, так как мало
время изменения управления. Если такое изменение берется
относительно оптимального управления, приращение целево-
го функционала будет неотрицательным. Следовательно, хотя
множество точек x(t2), получаемых по всевозможным управле-
ниям, и не является выпуклым, некоторое его подмножество
выпукло, так что возникает возможность построения опорной
гиперплоскости и ортогонального к ней вектора.
7.3. Задача быстродействия
Частным случаем функционала вида (7.4) является функ-
ционал
I[x,u]=(dt=t2-tl9 (7.14)
h
который приводит к задаче оптимального быстродействия.
Здесь fQ(t, х, и) = 1, и функция Η имеет вид
#=ψ0+^ψα/α(*, tt).
α-1
Первое слагаемое не зависит от и, поэтому максимум функ-
ции Η по и реализуется одновременно с максимумом функции
Η(Ψ,Ι,·) = ^να/β(*,»),
a=l
где Ψ = (ψΧ,..., ψ„). Отбрасывая первые уравнения систем
(7.8), соответствующие i = О (х0 =f°(x, и), ψ0 =0), перепишем
гамилыпонову систему в виде
—L = HWi, i = 0,n;
™ (7.15)
^- = -HXi, 1 = 0, η.
dt
222
7. Принцип максимума
Так как Η = if-\|/0, то
Μ (Ψ, х) = sup Я(Т, *, и) = Μ(Ψ, дс) - ψ0.
eel/
Значит, из условий ψο^Ο и Μ(Ψ, Jt) = 0 следует, что
Μ(Ψ, х) > 0. Предположим теперь, что функции \|/i(i),..., ψ„ (t),
существование которых утверждает теорема 7Л, в некоторый
момент времени i обращаются в нуль: Ψ*(£) = 0. Тогда
H(W*(t)9x*(i)9u*(i)) = 09 отсюда Η(Ψ*(2), **(*). «*(*)) = Ψο(*)« Из
условий Μ(Ψ*, jc*) = 0 и Μ(Ψ*(£), **(£)) = const (см. замеча-
ние 7Л) получаем ψο(£) = 0. А это противоречит теореме 7Л,
так как Ψ*(£) = 0 и, следовательно, функция Ψ*(£) тождест-
венно равна нулю как решение линейной системы дифферен-
циальных уравнений с нулевыми начальными условиями.
Значит, и вектор-функция Ψ*(*) = (ψ1(*)>..., ψ£(*))» и вектор-
функция Ψ (i) = (ψο(*), Ψ*(*)) не обращаются в нуль ни в одной
точке отрезка [ilf £2]·
Итак, из теоремы 7Л вытекают следующие необходимые
условия оптимальности по быстродействию.
Теорема 7.2. Если (**(£)> »*(*))> t e [ib£2], — оптимальный
процесс, то найдется ненулевое частное решение Ψ*(£) сопря-
женной системы
dt s
такое, что:
1° при каждом значении te [ii,f2] функция ·Η"(Ψ*(£), x*(t)9 и)
переменного и достигает в точке и = u*(t) максимума:
Η(Ψ*(£), **(f), u*(t)) = MC¥*{t), x*(t));
2° в конечный момент времени t2 выполняется соотноше-
ние Μ(Ψ*(£2), **(i2))>0. #
Замечание 7.2. Как и в случае теоремы 7.1, проверку ус-
ловия 2° можно проводить в любой момент времени t e [£1? i2].
7.3. Задача быстродействия
223
Пример 7.1. Рассмотрим задачу оптимального быстродей-
ствия для системы
Г*1=*2+1' (7.16)
с областью управления
U = {ueR:\u\<l}9 (7.17)
начальным состоянием
*i(fi) = *2(fi) = 0 (7.18)
и конечным состоянием
xi(t2) = 0, x2(t2) = -4. (7.19)
Запишем для поставленной задачи функцию Н:
2
Η(Ψ, х, и) = ^ψα/α(*, и) = щ(х2 +1) + ψ2(-Χ1 + и)- (7.20)
α=1
Для сопряженных переменных щ и ψ2 с учетом (7.8) по-
лучаем систему
|ψ1=ψ2' (7.21)
|Ψ2=-Ψ1-
Согласно принципу максимума, оптимальное управление u*(t)
должно доставлять максимум функции Н. Из (7.20) с учетом
(7.17) имеем
М(Т^**) = тахЯ^*, ^
и
причем u*(i) = sign\|/2(t).
Найдем ψΗ*)· Из (7.21) получаем ψ2+ψ2=0. Интегриро-
вание этого уравнения дает [VIII]
yvl=C1sin(t-C2)9 (7.22)
где С\ > 0, С2 — постоянные интегрирования.
Значит, оптимальное управление имеет вид
u*(t) = sign\]/2(i) = signsin (i -C2). (7.23)
224
7. Принцип максимума
Из представления (7.23) вытекает следующее:
1) при оптимальном процессе управление в любой момент вре-
мени принимает одно из своих предельных значений: 1 или -1;
2) переход от одного значения к другому, или, как говорят,
переключение, происходит через интервал времени, равный π.
Исключение может составлять только первый участок движе-
ния: первое переключение определяется значением постоянной
С2 и может произойти через интервал времени, меньший π.
Эти выводы фактически исчерпывают ту информацию, ко-
торую можно получить о структуре оптимального управления
из принципа максимума. Для полного решения задачи необ-
ходимо найти постоянные С± и С2, а для этого нужны, напри-
мер, начальные условия для функции Ψ(0* Но эти условия не
могут задаваться произвольно, так как однозначно определя-
ют функцию y2(t), следовательно, управление u(t) = sign\\f 2(t)
и фазовую траекторию x(t). Но процесс (x(t), u(t)) должен
удовлетворять краевым условиям задачи, которые еще не бы-
ли учтены. Тогда начальные условия для Ψ(£) должны выте-
кать из краевых условий задачи.
Завершить решение задачи можно следующим образом.
Найдем совокупность траекторий, соответствующих постоян-
ным управлениям, равным предельным значениям ±1. Оче-
видно, что искомая траектория состоит из дуг траекторий,
отвечающих данным постоянным управлениям. При этом дуги
траекторий стыкуются так, чтобы удовлетворялись краевые
условия (7.18), (7.19). Тогда все параметры оптимального про-
цесса будут полностью определены.
Итак, найдем траектории, соответствующие управлению
и = 1. Для этого в систему (7.16) подставим и = 1:
\Хл = Хо + 1,
Х2 — "~#l "I" J- ·
Полученную систему записываем в симметричной форме [VIII]:
dxi _ dx2
х2 +1 -Х\ +1
или (-x1+l)dxi=(x2+l)dx2. Интегрируя, приходим к урав-
нениям окружностей с центром в точке 01 (1, -1):
(*i -I)2 + (х2 +1)2 = Я2· (7.25)
7.3. Задача быстродействия
225
Движение фазовой точки вдоль любой из этих окружностей
происходит по часовой стрелке, поскольку именно так направ-
лен вектор фазовой скорости (xi, х2) = (#2 +1, - #1 +1). При этом
движение происходит с постоянной угловой скоростью, равной
единице, так как угловая скорость ω и линейная скорость υ при
движении по окружности радиуса R связаны соотношением
0)= — = -*—Ь —.
R R
Значит, полный оборот совершается за время 2π, а за время π
фазовая точка пройдет половину окружности.
Аналогичным образом выглядит семейство интегральных
кривых системы (7.16) при и = —1. Это окружности с центром
в точке 02(-1, -1):
(x1+l)2+(x2+l)2=R2. (7.26)
Движение и в этом случае совершается по часовой стрелке с
постоянной угловой скоростью, равной 1.
Искомая траектория строится из дуг окружностей (7.25),
(7.26). Обратимся к начальным условиям (7.18). Отметим,
что через данную точку проходят только две окружности, од-
на из первого семейства, другая — из второго. Для заданной
начальной точки — начала координат — первая окружность
описывается уравнением
(x1-l)2+(x2+l)2=2f (7.27)
а вторая — уравнением
(*1+1)2+(*2+1)2=2. (7.28)
Фазовая точка может начать движение из начала координат
только по одной из этих окружностей (рис. 7.4).
Предположим, что стартовое управление равно -1 и опти-
мальная траектория на начальном отрезке времени идет по
окружности (7.28). В некоторый момент времени t0- С2 + π е (О, π]
в соответствующей этому моменту времени точке Pi на полу-
окружности О А (рис. 7.5) происходит переключение управле-
ния, и движение продолжается по дуге другой окружности,
относящейся к семейству (7.25). По этой, второй окружности
фазовая точка пройдет пол-оборота, и если она не достигнет
за это время конечной точки, то ровно через пол-оборота
226
7. Принцип максимума
1 1 1
-5 -4 -3
\
\
\
\
ч
\
\
\
ч
\
-2
^
Рис. 7.4
х2
2
/
/
0
Ι 1
/-1 0
1
1 · -1
1 02
V
Pi
-3
-4'
-5
D
К
[
1
1
0*1
/""
С у""
А
Μ
/
/
/
/
1 \
3 \
/
/
/
/
/
/
/
•
Ч^
4
1
5 Xj
Рис. 7.5
снова произойдет переключение управления в момент вре-
мени t0 + π, соответствующий фазовой точке Р2, и фазовая
точка продолжит движение по дуге окружности из семейства
(7.26). Так как переключение происходит через пол-оборота,
то точка Р2 является симметричной точке Pj относительно
центра 0^ Значит, Р2 находится на полуокружности MN,
7.3. Задача быстродействия
227
симметричной полуокружности ОА относительно Ol5 т. е. на
половине окружности
(*1-3)2+(*2+1)2=2.
Из построения видно, что дуга Р\Р2<> какой бы ни была
точка Р1 на дуге ОА, не проходит через конечную точку К
(О, -4), так как наименьшее значение ординаты точки на этой
дуге равно -1-V2 >-4. Поэтому конечный участок траекто-
рии не может лежать на дуге PiP2- Фазовая точка достигнет
Ρ2, и произойдет переключение управления, после которого
фазовая точка начнет движение по дуге окружности из семей-
ства (7.26). Окружность
(хх +1)2 + (лг2 +1)2 = 10, (7.29)
которая относится к этому семейству, пересекает дугу MN и
проходит через точку К (0, -4). Поэтому, если переключение
произошло в соответствующей точке дуги MN, то, двигаясь по
этой окружности, фазовая точка попадет в конечную точку К.
Обратим внимание на то, что если после второго переклю-
чения движение пойдет по дуге окружности, отличной от (7.29),
то далее фазовая точка пройдет мимо конечной точки К, а при
последующих переключениях траектория разворачивается по
спирали и фазовая точка уже никогда не попадет в нужную
точку К: при каждом переключении радиус окружности возрас-
тает и уже после третьего переключения будет превышать
лШ) — расстояние от каждой из точек Оъ 02 до точки К.
Итак, если стартовое управление равно -1, то искомая тра-
ектория должна содержать дугу окружности (7.29) и точку Р2
переключения на дуге MN. Оказывается, что окружность
(7.29) пересекает дугу MN в двух точках: Μ (2, -2) и С (2, 0)
(см, рис· 7.5)· Каждой из них соответствует траектория, удов-
летворяющая первому условию принципа максимума, т. е.
управление, соответствующее такой траектории, доставляет
максимум функции Н. Отметим, что если Р2 = М, то Р1? буду-
чи симметричной Р2 относительно Оь совпадает с началом ко-
ординат. Это означает, что первое переключение происходит в
стартовый момент времени. Другими словами, эта траектория
соответствует стартовому управлению и = 1, а наше исходное
предположение, что стартовое управление равно -1, на самом
деле не является существенным. Указанная траектория факти-
228
7. Принцип максимума
чески содержит не три, а две дуги окружности, так как дуга
первой окружности выродилась в точку.
Второй вариант с переключением в точке С содержит три
дуги. Первое переключение происходит в точке D (О, -2).
Дальнейшее движение от D к С идет по дуге окружности
(х!-1)2+(х2+1)2=2,
на которой лежит начало координат, т. е. в процессе переме-
щения otDkC фазовая точка возвращается в начало коорди-
нат. Значит, на самом деле есть еще одна, третья траектория,
которая представляет собой участок второй траектории от
начала координат до точки переключения в точке С и далее
до точки К. Эта траектория также удовлетворяет первому
условию принципа максимума, но в отличие от первых двух
соответствует начальному управлению и = 1. Очевидно, что
время движения по третьей траектории заведомо меньше вре-
мени движения по второй траектории, потому что какое-то
время затрачивается на движение по петле. Поэтому далее
вторую траекторию можно не рассматривать. Анализ случая
с начальным управлением и = 1 показывает, что других тра-
екторий, удовлетворяющих первому условию принципа мак-
симума и заданным краевым условиям, нет.
Итак, использование принципа максимума выявило две
траектории, которые удовлетворяют краевым условиям по-
ставленной задачи. Первая x*(t) заключается в движении по
дуге ОМ окружности (7.27) и в следующем за переключением
движении по дуге МК окружности (7.29). Вторая траектория
#**(£) представляет собой движение по дуге ОС окружности
(7.27) с переходом на дугу СК окружности (7.29) (рис. 7.6).
Поскольку движение по окружностям происходит с постоян-
ной угловой скоростью, равной 1, время, затрачиваемое на
движение по общим участкам двух траекторий, одинаково.
Время прохождения от точки С до точки Μ по дуге окружно-
сти с центром Oi отлично от времени прохождения от С до Μ
по дуге окружности с центром 02. Наилучший вариант соот-
ветствует дуге, имеющей наименьшее угловое расстояние. На
рис. 7.6 видно, что это дуга окружности с центром 02, так как
угол С02М меньше угла СОгМ. Таким образом, траектория
x**(t) более предпочтительна. Тот же вывод можно сделать,
используя условие 2° принципа максимума.
7.3. Задача быстродействия
229
*2
2
О,
5 Xi
Ml
О
о
-1
-2
-3
-4f
-5
Рис. 7.6
Проверим выполнение условия 2° теоремы 7.2 для траекто-
рий x*(t) и x**(t). Это условие на самом деле можно проверять
в любой момент времени, и в данном случае в качестве такого
момента удобнее всего взять начальный. Имеем
Μ(Ψ*(«1),**(*1)) = ψΙ(*1Χ^(*1) + 1)-
Учитывая, что, согласно (7.21), ψ| = -ψ2> и используя (7.22),
получаем
M(ΨЧtιhxЧtl)) = -C1cos(t1-C2) + C1\sm(t1-C2)\.
Точка переключения С траектории x**(t) соответствует мо-
менту времени t = ti+n/2, так как угловая длина дуги ОС
окружности (7.27) равна π/2 (угол ОО^С равен 90°). В то же
время, согласно (7.23), переключение с и - 1 на и - -1 про-
исходит при t-C2 = (2&+1)π, т. е. можно считать, что С2 =
= ti~K/2. Тогда Μ = Ci >0, значит, условие 2° теоремы 7.2 вы-
полнено.
230
7. Принцип максимума
Для траектории x*(t) точка переключения Μ соответствует
моменту времени t = tx + π. В этом случае C2 = t1vL Μ - -С\ > 0.
Условие 2° теоремы 7.2 нарушено.
Найдем время движения по траектории x**(t). Для этого
нужно подсчитать угловые длины двух дуг окружностей. Ду-
га ОС7 как уже отмечалось, имеет угловую длину π /2. Дуга
СК окружности (7.29) также име-
ет угловую длину π/2: эта длина
измеряется углом между векто-
рами 02С и 02К, а они, как не-
трудно увидеть, ортогональны.
Значит, общее время равно:
ик
О
tx f! + π/2 f i + π i
Рис. 7.7
Τ = to—U = —I— = я.
2 2
Движению по траектории #**(£) соответствует управление
( πλ
u**(i) = sign sin t-t1+— = sign cos (i-ti) (рис. 7.7).
ν 2J
Задача (7.16)-(7.19) имеет единственный допустимый про-
цесс (x**(t)j u**(i))> удовлетворяющий принципу максимума.
Однако нельзя утверждать, что этот процесс на самом деле
оптимален. Такое утверждение обоснованно, если известно,
что поставленная задача имеет решение. #
Приведенный пример показывает, какие трудности возни-
кают в случае применения метода, базирующегося на принци-
пе максимума. Главная трудность состоит в том, что при ис-
пользовании принципа максимума возникает краевая задача
для системы ОДУ (7.15), причем краевые условия задаются
только для фазовых переменных. Отсутствие краевых условий
для функции Ψ(£) существенно усложняет задачу. Ясно, что
оптимальное управление и оптимальная траектория, выходя-
щая из точки х1, зависят от начального вектора Ψ^Ο, но, к со-
жалению, условия максимума для функции Η явно не ука-
зывают, как выбирать этот вектор. Численный поиск началь-
ного условия для Ψ(*) можно организовывать, опираясь на
условие 2° теоремы 7.2. Однако одного этого условия недоста-
точно, чтобы организовать сходящийся итерационный про-
цесс последовательного уточнения вектора W(ti).
7.4. Линейная задача оптимального быстродействия
231
Успех аналитического решения задачи, рассмотренной в
примере 7.1, во многом объясняется тем, что система (7.16)
линейна. Именно в линейных задачах проявляются преиму-
щества принципа максимума.
7.4. Линейная задача оптимального
быстродействия
Вернемся к линейной задаче оптимального быстродействия
(см. 6.4), к которой неприменимы методы классического вари-
ационного исчисления. Проанализируем эту задачу, используя
принцип максимума* Но прежде всего уточним ее постановку.
Пусть закон движения рассматриваемой системы имеет вид
d х,
— = Ах + Ви, (7.30)
dt
где х = (х1,..., хпУ ε R"; и = (щ9..., ur)T е Rr; А = (аф — число-
вая квадратная матрица порядка п\ В = (bik) — числовая мат-
рица типа пхг.
В качестве области управления U рассмотрим множество,
описываемое системой нестрогих неравенств
г
2<хуи7-<й, i = M, (7.31)
и представляющее собой замкнутый ограниченный много-
гранник в Мг· В качестве целевого функционала возьмем вре-
мя перехода объекта из положения х1 в положение я2, т. е.
I = t2~ ti. Кроме того, предположим (не оговаривая это каж-
дый раз), что многогранник U удовлетворяет условию общно-
сти положения по отношению к системе (7.30), т. е. для лю-
бого вектора ν е Rr, параллельного какому-либо ребру мно-
гогранника £/, система векторов
Βν, ΑΒν, ..., Αη~λΒν (7.32)
линейно независима.
Напомним, что система векторов v\> и2,...,^вЕг линейно
независима тогда и только тогда, когда матрица, столбцами
которой являются столбцы координат этих векторов, не вы-
рождена:
det^, ..., νη)Φ 0.
232
7. Принцип максимума
Пример 7.2. Рассмотрим систему
%2 = х3 +м2»
Х$ = Х\ + U\,
для которой
А =
о
О
1
1
О
О
°!
1
°J
, в =
(1 0\
0 1
1 0
V )
многогранник U описывается неравенствами \ui\ < 1, \и2\< 1
и на плоскости UiOu2 представляет собой квадрат. Проверим
для этого многогранника (многоугольника) условие общности
положения по отношению к заданной системе.
Поскольку четыре ребра квадрата U разделяются на две
пары паралельных ребер, для проверки общности нужно рас-
смотреть только два вектора: vi = (1, 0)т и v2 = (0,1)т. Для пер-
вого имеем
'ол
1
ГтЛ
ΒνΛ =
Так как
0
1
ABvl =
1
ν j
(л\
ΑΔΒυΧ =
,0,
1
0
1
0
1
1
1
1
0
= -2*0,
то система векторов Bvi, ABvlf A2Bvi линейно независима.
Аналогично для второго вектора и2 получаем
ro) (i\ (ол
Βυ9 =
,0,
V J
, ABv2 =
0
0
V )
A2Bvo =
0
1
ν J
Так как
0
1
0
1
0
0
0
0
1
=-i*o,
то и система векторов Bv2, ABv2, A2Bv2 линейно независима.
7.4. Линейная задача оптимального быстродействия
233
Таким образом, заданный многогранник удовлетворяет
условию общности положения относительно заданной системы
дифференциальных уравнений. #
Для линейной задачи оптимального быстродействия (7*30),
(7.31) запишем функцию Понтрягина Η (Ψ, х, и):
η η η г
Η = ψτΑΧ + Ψ*ΒΗ = ΣΣνΙα4Χ>+ΣΣν^^ (7·33)
i=l j=l k=l 1=1
Сопряженная система в данном случае имеет вид
dVj Λ . —
i=l
или в векторной форме
= -ΑτΨ. (7.34)
dt
Согласно (7.33), функция if, как функция переменного и,
достигает максимума одновременно с функцией F(u) = ЧГВи.
Обозначим через Р(Ф) максимум функции F(u) на множест-
ве U. Из теоремы 7.2 следует, что если u*(i) — оптимальное
управление, то найдется такое ненулевое решение Ψ*(*) систе-
мы (7.34), что
(4**(t))TBu*(t) = P(4?*(t)). (7.35)
Так как система (7.34) с постоянными коэффициентами не
содержит неизвестных функций x(t), u(i), то все ее решения
можно найти, после чего легко определить соответствующие
управления u*(t) как решения уравнения (7.35). Решение по-
следнего сводится к поиску наибольшего значения линейной
функции F(u) на замкнутом ограниченном множестве U. Прав-
да, возникает вопрос, имеет ли задача поиска и, при котором
F(u) максимально на U9 единственное решение. Ответ на это
дает следующее утверждение.
Теорема 7.3. Для любого нетривиального решения 4f(t)
системы (7.34) соотношение (7.35) однозначно определяет
управление u(i)> причем это управление кусочно-постоянно, а
значениями управления в точках непрерывности являются
вершины многогранника U.
234
7. Принцип максимума
Μ Пусть Ψ(£) — произвольное нетривиальное решение систе-
мы (7.34). Так как функция Ф(£, и) = 4?(tyBu линейна по и, то
она имеет максимум на границе многогранника U [XIV]. При
этом максимум может достигаться либо в вершине многогран-
ника, либо во всех точках некоторой грани. Покажем, что в
силу общности положения многогранника последняя ситуация
реализуется лишь для конечного числа значений времени f.
Предположим, что для некоторого бесконечного множества
Μ a[tly t2] при t е Μ функция Ф(£, и) достигает максимума
на целой грани Tt многогранника U. Тогда при и е Tt она по-
стоянна. Поскольку множество Μ бесконечно, а количество
граней U конечно, в Μ можно выделить бесконечное подмно-
жество Мт значений, которым соответствует одна грань Г
многогранника U.
Пусть и0 и щ — концы ребра грани Tt. Тогда вектор ν = щ - и0
определяет направление этого ребра. При этом для t e Мт
*¥(t)TBv = Ψ(0ΤΒ(^1 -и0) =
= y¥(t)TBu1 -Ψ(*)τΒΙ*ο =Ф(и 1*0-Φ(*, и0) = 0.
Итак, функция ΨτΒν при t g Mt обращается в нуль. Мат-
рица В является числовой, и мы можем считать вектор υ так-
же постоянным, так как он один и тот же для всех t e Мг.
А теперь отметим следующее. Поскольку функции являют-
ся решениями линейной системы дифференциальных урав-
нений с постоянными коэффициентами, они представляют
собой аналитические функции [X]: в этом контексте t можно
рассматривать как комплексный аргумент, и аналитичность
будет иметь место во всей комплексной плоскости. Значит, и
функция ΨΤΒν является аналитической. Но так как она обра-
щается в нуль на бесконечном подмножестве Μ отрезка [ib t2],
то, согласно теореме единственности [Χ], ΨτΒν = 0 при любом t.
Последовательно дифференцируя тождество ΨτΒν = О по t
в силу системы (7.34), получаем
(ATJ¥(t))TBv = 0,
((Ατ)2Ψ(*))τβΙ> = 0,
((Ατ)η-1Ψ(*))τΒυ = 0,
7.4. Линейная задача оптимального быстродействия
235
или, учитывая известное матричное тождество (ΑΒ)τ = ΒΤΑΥ,
lx¥(t)TBv = 0,
mtyABv=o9
Ψ(*)τΑ2βυ = 0, (7.36)
\x¥(t)'TAn-1Bv = 0.
Так как, по предположению, выполняется условие общно-
сти положения многогранника U, система векторов Bv, ABv,...,
AnlBv линейно независима, а потому образует базис в Шп. Из
соотношений (7.36) вытекает, что при любом t вектор Ψ(£) ор-
тогонален каждому вектору базиса, а потому равен нулю. Это
противоречит предположению о том, что решение Ψ(£) систе-
мы (7.34) нетривиально.
Итак, противоречие показывает, что для всех i, кроме раз-
ве лишь конечного числа, функция Ф(£, и) достигает максиму-
ма только в одной точке — вершине многогранника. Значит,
всюду, кроме конечного числа точек, определено однозначно
управление u(t).
Выколов конечное число точек неоднозначной разрешимо-
сти уравнения (7.34), мы тем самым разобьем отрезок [il5 t2]
на конечное число частичных интервалов. Выберем один из
таких интервалов Δ = (хъХг)· Пусть »ь ♦♦♦, и$ — вершины
многогранника U. Тогда Δ разделится на s непересекающихся
множеств Мъ Μ2, ..., Ms, где М-г — множество значений t e Δ,
в которых максимум Ф(*, и) достигается в вершине ut. Оказы-
вается, что все множества Mt являются открытыми (см. ниже).
Но интервал Δ можно представить как объединение открытых
непересекающихся множеств только в том случае, когда лишь
одно из этих множеств непусто. Отсюда следует, что на интер-
вале Δ функция u(t) постоянна, а потому непрерывна.
Покажем, что множество Мг открытое, т. е. если т0 ξ Мь
то и целая окрестность τ0 также принадлежит Mt. Другими
словами, если в точке τ0 функция Ф(£, и) достигает максимума
в вершине щ, то и при всех f, достаточно близких к τ0, функ-
ция 0(f, и) достигает максимума в вершине щ. Итак, при j Φ i
имеем Φ(τ0, uj) < Φ(τ0, u7) = Ρ(Ψ(τ0)). Функция Ф(г, и) = 4*(t)TBu
непрерывна по i. Поэтому конечный набор неравенств Ф(£, uj) <
< Ф(*, U/), j Φ i, выполняющихся в точке t = τ0, останется в силе
236
7. Принцип максимума
и в некоторой окрестности точки τ0. Но это как раз и значит,
что точка максимума функции остается неизменной в некото-
рой окрестности τ0. ►
Согласно доказанной теореме, каждое оптимальное управ-
ление является кусочно-постоянной функцией со значениями
в вершинах многогранника U. Точки разрыва соответствуют
смене значения управления, и мы будем называть их точками
переключения. Если τ — точка переключения, то слева от нее
управление имеет одно значение, скажем щ, а справа другое —
Uj. В этом случае говорят, что в τ происходит переключение
оптимального управления u*(t) из вершины щ в вершину иг
Теорему 7.3 можно было бы охарактеризовать как теоре-
му о конечности числа переключений. В каждой конкретной
ситуации число переключений зависит от закона движения
(7.30), вида области управления (многогранника) U и крае-
вых условий х19 х2. Оказывается, что есть класс линейных
задач, в которых при любых краевых условиях можно указать
оценку сверху для числа переключений. Характерным при-
знаком этих задач является отсутствие комплексных корней
у характеристического уравнения матрицы А. Об этом гово-
рит следующая теорема, в первоначальном виде доказанная
А.А. Фельдбаумом.
В своей формулировке мы ограничимся лишь частным слу-
чаем многогранника — r-мерным параллелепипедом, т. е.
множеством в Мг вида
U = {u = (щ,..., ur):ak <uk<$k,k = i^r}. (7.37)
При такой структуре области управления каждое отдельное
управление щ представляет собой самостоятельный параметр,
область изменения которого не зависит от значений других
управлений. По-прежнему предполагаем выполненным усло-
вие общности положения.
Теорема 7.4. Если U — параллелепипед (7.37), а все корни
характеристического уравнения матрицы А в законе движения
(7.30) действительны, тоу любого решения u(t) = (ui(t)>..., ur(t))T
уравнения (7.35) каждая из координатных функций uk(t)
кусочно-постоянна и имеет не более п-1 переключений (п —
порядок системы (7.30)).
7.4. Линейная задача оптимального быстродействия
237
Μ Пусть u(t) — решение уравнения (7.35), т. е. в каждый мо-
мент t вектор u(t) доставляет максимум функции Ф(£, и) =
= Ψ(£)τ5α. Согласно теореме 7.3, для любой нетривиальной
функции Ψ(^) такое решение существует и единственно. Функ-
цию Ф(£, и) можно записать следующим образом:
г Г η \
Ф(£, u) = W(t)TBu = ^
k=l
Σ ΜΙ (0
i=l
м*.
(7.38)
где Ψ(*) = (ψ1(0>--->Ψ*(0)Τ; u = (ul9...9ur)T; В = (bik).
Так как область изменения каждой из переменных щ не
зависит от остальных, функция Φ достигает максимума при
фиксированном t в том и только в том случае, когда максиму-
( η \
^bik^i(t) \ик в (7.38). Но это
ма достигает каждое слагаемое
i=l
)
слагаемое достигает максимума при uk = ak в случае отрица-
тельного коэффициента при нем и при щ = β^ в случае поло-
жительного коэффициента. Таким образом, компоненты век-
тора и, доставляющего максимум функции Ф, определяются
соотношениями
uk=l
Функция ν&^,ψ;(0 как функция комплексного перемен-
ного t является аналитической функцией. Выбрав единичный
вектор ν = (0, .·., 1, .·., 0)т (единица стоит на k-м месте), на-
правленный вдоль k-το ребра многогранника (7.37), получим
ccft,
β*,
η
Σ&^ΨΚ0<0;
/=1
η
^^ψ£(0>0.
i=l
Ψ(*)'Β» = Σ&λΨ|(*).
i=l
Предположим, что сумма V bik\\fi(t) тождественно равна нулю.
1=1
Тогда с помощью рассуждений, аналогичных тем, что приве-
дены в доказательстве теоремы 7.3, заключаем, что Ψ(£) = О,
238
7. Принцип максимума
а это противоречит предположению о том, что вектор Ψ*(£) не-
η
нулевой. Значит, Vfef^fii) непостоянна и, будучи аналити-
ческой, может обращаться в нуль лишь в конечном числе точек.
Нам нужно показать, что число нулей этой функции не превос-
ходит /1-1, поскольку каждый такой нуль соответствует неод-
нозначности u*(t) и является точкой переключения.
Коэффициенты bik могут иметь произвольные значения,
поэтому фактически надо доказывать: любая линейная ком-
бинация функций \|/i(i), ψ2(£),..., ψΛ(*) имеет не более чем п-\
действительный нуль. Согласно структуре общего решения
линейной системы ОДУ с постоянными коэффициентами,
каждая из функций ψ*(*), в совокупности составляющих ре-
шение системы (7.34), имеет вид
/l(*)eXli+f2(i^+... + /mW^> (7.39)
где λ], ..., λΜ — совокупность всех различных действительных
корней характеристического уравнения матрицы -Ат;
f\(t)> ..., fm(t) — многочлены, причем степень многочлена ft(t)
меньше кратности rt корня Xt [VIII]·
Любая линейная комбинация функций \|//(i) также имеет
вид (7.39). Согласно лемме, изложенной ниже, общее число
действительных нулей функции вида (7.39) не превосходит
(r1-l) + (r2-l) + ... + (rm-l) + m-l =
= (r1+r2+... + rM)-l = n-l. ►
Лемма 7.1. Пусть λΧ, λ2, ·.., λ^ — действительные попарно
различные числа, /i(i)> .♦., fm(t) — многочлены с действитель-
ными коэффициентами, имеющие степени &1? ·.., km соответ-
ственно. Тогда функция (7.39) имеет не более чем ki + ...+km +
+ т-1 действительных корней*. #
В приведенных выше теоремах речь шла о структуре оп-
тимального управления в линейных задачах оптимального
быстродействия. Для этих задач принцип максимума позво-
ляет не только определить вид оптимальных управлений, но и
получить условия единственности оптимального управления.
Доказательство леммы см. в книге: Понтрягин Л.С., Болтян-
ский В.Г., Гамкрелидзе Ρ .В., Мищенко Е.Ф.
7.4. Линейная задача оптимального быстродействия
239
Управление u(t) называют экстремальным управлением,
если оно удовлетворяет принципу максимума. Для линейной
задачи оптимального быстродействия с областью управления в
виде многогранника управление u(t) является экстремальным,
если существует такое нетривиальное решение Ψ(*) системы
(7.34), что для него будет выполняться соотношение (7.35). Это
соотношение равносильно условию 1° теоремы 7.2, а условие 2°
этой теоремы, как показано ниже, выполняется автоматиче-
ски. Ясно, что всякое оптимальное управление является экс-
тремальным. Поэтому, чтобы найти оптимальное управление,
переводящее фазовую точку из положения х1 в положение х2,
нужно найти все экстремальные управления с теми же крае-
выми условиями, а затем среди них выбрать то, которое осу-
ществляет перевод за наименьшее время. Возникает вопрос:
могут ли существовать несколько экстремальных управлений,
переводящих фазовую точку из положения я1 в положение х21
Вообще говоря, да. Но если начало координат в пространстве
управлений является внутренней точкой многогранника Uy то
экстремальное управление единственно.
Теорема 7.5. Пусть в пространстве управлений начало коор-
динат 0 есть внутренняя точка многогранника U. Если u(t) и
u(t) — два экстремальных управления, переводящие фазовую
точку из положения х1 в положение х2 = О за время £2 " ti и
?2-ii соответственно, то t2 =i2 и u(t) = u(t), t e [ij_, f2]·
Μ Получим формулу для частного решения системы (7.30) при
произвольном управлении u(t) и начальном условии x(t{) = х1.
Для этого обозначим через φ1^), φ2(0>..., φ"(0 фундаменталь-
ную систему решений однородной системы
dx
— = Ах,
dt
которая определяется начальными условиями
IX i = jl —
где φ* =(φΙ, φ*,..., φ^)τ, а через ψ1^), Ψ2(*),..., Ψ*(0 - Фун-
даментальную систему решений однородной системы (7.34)
с аналогичными начальными условиями:
240
7. Принцип максимума
Для всех t имеет место соотношение
(7.40)
Действительно, это условие в силу выбора начальных условий
выполнено при t = tv Далее
=(-ατψ> (о, фчо)+(ψ7 ω, афчо)=о.
Таким образом, функция (ψ* (f), φ1(θ) постоянна и ее значение
при любом t совпадает со значением при t = t±.
В соответствии с методом Лагранжа вариации постоянных
[VIII] общее решение системы (7.30) можно искать в виде
н=\
Подставляя это выражение в систему (7.30), получаем
k=l
dt
(pk(t) = Bu(t).
Умножаем последнее уравнение скалярно на Ψ;(0 и учиты-
ваем (7.40):
^ = (Ч"М, ,В««)).
Решение системы (7.30) с произвольным управлением u(t) и
начальным условием х1 =(#J, x\,..., х\) теперь можно запи-
сать в следующем виде:
(7.41)
7.4. Линейная задача оптимального быстродействия
241
Обозначим через x(t) и x(t) траектории, соответствующие
управлениям u(t) и u(t) и выходящие из точки х1 в момент
времени ile По условиям теоремы x(t2) = x(t2) = О, или, соглас-
но (7.41),
п \ %
Σφ*(*2) ^ + /(ψ*(τ),Βα(τ))Λ
ν
5>*fo)
fc=l
*1
*2
= 0,
x\ + |(ψ*(τ),Εα(τ))<*τ
= 0.
у
Так как векторы (p*(i)> i = l,/i, линейно независимы, из
последних двух соотношений вытекает, что
Η h
-х\ = |(ψ*(τ), Ви(т))ат= Г(ψ*(τ), Βα(τ))<2τ. (7.42)
Пусть #2 > i2 и Ψ(£) — решение сопряженной системы
(7.34), для которого на отрезке [f1? t2] выполняется соотно-
шение
(W(t),Bu(t)) = P{W(t)),
(7.43)
определяющее функцию u(t). Разложим функцию Ψ(£) по
базису Ψ1(0,·.·,Ψη(0:
fc=l
Умножая (7.42) наА^ и суммируя по k, получаем
[ (ψ(τ), Би(т))<*т= [ (ψ(τ), Бй(т))йх. (7.44)
Заметим, что для любого решения Ψ(0 сопряженной сис-
темы (7.34) справедливо неравенство
Ρ(Ψ(*))>0.
(7.45)
242
7. Принцип максимума
Действительно
(х¥9Ви) = (Втх¥9и).
Поэтому
Ρ(Ψ(*)) = max(W(t)9 Bu) = max(£TXF(f), и).
Поскольку начало координат является внутренней точкой
многогранника U, то функция F(t9 и) = (BTX¥(t)9 и) при фикси-
рованном t может принимать как положительные, так и отри-
цательные значения либо тождественно равняться нулю. Если
она не тождественный нуль, то Ρ(Ψ(*))>0, а в противном
случае Ρ(Ψ(*)) = 0.
Учитывая (7.43), (7.45) и предположение f2 >*2, из (7.44)
получаем
h h
f (ψ(τ), Bu{x))dx = f Ρ(Ψ(τ))^τ <
*2 *2
< |ρ(Ψ(τ))^τ = Γ(ψ(τ), Βη(τ))ατ.
Итак
*2 t2
(ρ(Ψ(τ))ατ< Γ(ψ(τ), Вй(т))<*с. (7.46)
Согласно определению, P(T(i)) = max(T(i), 5u). Поэтому
(Ψ(0, Β*φ) = Ρ(Ψ(*))*(ψ(*), **(*))> ie [*!, Ь].
Значит, с учетом (7,46) имеем
(Ψ(0, Bu(t)) = (ψ<*), Btt(i))f f e [ilf ?2].
Но тогда в силу теоремы 7.3 оба управления u(t) и u(t)y удов-
летворяющие (7.35) с одной и той же функцией Ψ(*)» тожде-
ственно равны: u(i) = tt(i)> ie[ii,?2].
Из совпадения управлений и равенства (7.44) следует, что
7.4. Линейная задача оптимального быстродействия
243
h
Γ(ψ(τ),βα(τ))<2τ = 0,
h
или
h
\ρ(Ψ(τ))ατ = 0. (7.47)
h
Рассмотрим равенство Ρ(Ψ(τ)) = 0. Выполнение этого равен-
ства, как отмечено выше, означает, что при фиксированном t
функция F(tj и) тождественно равна нулю. Если предположить,
что равенство Ρ(Ψ(τ)) = 0 выполняется на некотором бесконеч-
ном множестве значений i, то, как и в доказательстве теоре-
мы 7.3, можно показать, что аналитическая функция Ψ(£) тож-
дественно равна нулю. А это противоречит принципу максиму-
ма. Поэтому указанное равенство может быть верным лишь для
конечного числа значений i. Но тогда равенство (7.47) при
условии (7.45) может выполняться только при t2 -i2. ^
До сих пор мы пользовались лишь условием 1° теоремы 7.2.
Покажем, что в рамках предположений теоремы 7.5 условие
2° теоремы 7.2 выполняется автоматически:
Μ (ψ(*2), x(t2)) = Я(T(f2), x(t2), u(i2)) =
= (ψ(*2), Ax(t2)) + (ψ(«2), Bu(t2)) = Ρ(Ψ(*2)) > 0,
так как x(t2) = x2 = 0.
В заключение сформулируем теорему существования для
линейных систем оптимального быстродействия (условие общ-
ности положения многогранника U считается выполненным).
Теорема 7.6*. Если существует хотя бы одно управление,
переводящее фазовую точку системы (7.30) из положения х1 в
положение я2, то существует и оптимальное по быстродействию
управление, также переводящее фазовую точку из х1 в х2. #
Задача управления состоит в построении допустимого
управления, реализующего цель. В рамках сформулированной
теоремы целью является состояние х2. Поэтому теорему 7.6
* Доказательство теоремы см. в книге: Понтрягин ЛХ., Болтян-
ский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф.
244
7. Принцип максимума
можно было бы сформулировать так: если для линейной сис-
темы решена задача управления, то для нее можно построить
управление, оптимальное по быстродействию.
Итак, теорема 7-6 утверждает, что оптимальное решение
в линейной задаче быстродействия существует. Любое опти-
мальное решение является экстремальным, а по теореме 7·5
экстремальное управление единственно. Следовательно, в
рамках теоремы 7.5 существует единственное экстремальное
управление, которое является оптимальным. В этом случае
принцип максимума является не только необходимым усло-
вием оптимальности, но и достаточным. С его помощью ли-
нейная задача быстродействия может быть решена полностью.
7.5. Задача синтеза управления
Выше, применяя принцип максимума, мы отыскивали оп-
тимальное управление в виде функции времени t. Такое
управление называют программным управлением. Однако
во многих случаях удобнее управление рассматривать как
функцию текущего состояния системы, т.е. как функцию фа-
зовых координат. Это позволяет при построении управления
учитывать возмущенное движение. Отклонение состояния
системы от расчетного фиксируется и учитывается в последу-
ющем управлении.
Можно представить некоторый технический объект, кото-
рый снабжен прибором, фиксирующим его текущее состояние
путем измерения фазовых координат, и исполнительным ме-
ханизмом, который по текущим фазовым координатам х ре-
ализует управление и(х). В этой ситуации мы имеем систему
с обратной связью
— = Ах + Ви(х).
dt
Фазовая траектория такого управляемого объекта зависит
от выбора функции и(х), которую называют синтезирующей
функцией (или обратной связью). Определение синтезирую-
щей функции, позволяющей реализовывать цель управления,
называют синтезом управления.
Синтез оптимального управления в линейных системах
осуществлялся задолго до появления принципа максимума.
7.5. Задача синтеза управления
245
Одним из первых среди советских ученых результаты в этой
области получил А.А. Фельдбаум, который ввел общее поня-
тие оптимального процесса в тг-мерном фазовом пространстве*.
Впоследствии он разработал метод фазового пространства, с
помощью которого была решена задача синтеза управления
для линейных систем второго порядка с одним управляющим
параметром и с действительными собственными значениями
матрицы системы**· Позже эта задача была решена для систем
второго порядка с комплексными собственными значениями.
Появление принципа максимума упростило процедуру реше-
ния задачи. Использование этого принципа позволило решить
задачу для систем второго порядка с двумя управляющими
параметрами.
Отметим, что сама постановка задачи синтеза и методы ее
решения характерны для теории оптимального управления и
гораздо хуже согласуются с методами вариационного исчисле-
ния. В этом разделе мы обсудим некоторые задачи, относящие-
ся к задачам синтеза.
Быстрейшая остановка движущейся точки в заданном
месте· Пусть материальная точка движется по инерции вдоль
прямой. Задача состоит в том, чтобы наискорейшим образом
остановить движение этой точки в заданном месте, которое
мы примем за начало координат на прямой, с помощью огра-
ниченной по величине силы.
Закон движения рассматриваемой системы имеет вид
d2x
dt2
В качестве области управления возьмем U = {и : \ и \ < 1}.
Преобразуем уравнение движения второго порядка введе-
нием дополнительных координат в систему дифференциаль-
ных уравнений первого порядка:
*1=Х2; (7.48)
х2 = и,
где Хх - ху х2- х-
Мы имеем дело с задачей быстрейшего попадания в начало
координат х2=(0у 0)т из заданного начального состояния
* См.: Фельдбаум АЛ. (1953 г·)
f* См.: Фельдбаум АЛ. (1955 г.)
246
7. Принцип максимума
х1 = {х\, х\У. Функция Понтрягина Η для этой задачи име-
ет вид
Η =ψ1#2+ψ2^.
Учитывая ограничение \и\< 1 на управление, получаем
maxH(W, x, и) = угх2 +ψ2signψ2.
|и|<1
Согласно теореме 7.3, экстремальное управление u*(t) имеет
вид
u*(i) = signi|/2(i). (7.49)
Из сопряженной системы
[Ψ1 = 0;
Ιψ2=-Ψ1
находим \|/i(i) = С1? ψ2(0 = С2 - C^i, где Cl7 С2 — постоянные
интегрирования. Значит, экстремальное управление
u*(t) = sign\y2(i) = sign(C2 -Cit)
является кусочно-постоянной функцией с двумя значениями
1 и -1, имеющей не более одного переключения, так как ли-
нейная функция C\-C2t на отрезке [ii, t2] меняет знак не бо-
лее одного раза (это полностью согласуется с теоремой 7.3).
Для интервала времени, на котором и = 1, имеем
f^i= х2;
[х2 =1.
Записав систему в симметричной форме [VIII]
(хХл dXo T ,
—- = —- = dt,
х2 1
получаем уравнение с разделяющимися переменными dx± -
= x2dx2. Его интегрирование дает
х2
xt=-2- + S. (7.50)
Аналогично поступаем в случае и = -1. Система в симметрич-
ной форме имеет вид
7.5. Задача синтеза управления
247
dxi
х2
dx2
-1
= dt,
откуда
Хл — ho.
2
(7.51)
Семейство фазовых кривых для рассмотренных случаев
показано на рис. 7.8, а (и = 1) и б (и = -1). Так как для первой
системы dt = dx2, то движение по параболам в случае и = 1
происходит снизу вверх. Для второй системы dt = -dx2 и дви-
жение по параболам при и = -1 направлено сверху вниз.
х2к
*2i
Рис. 7.8
Нас интересуют те дуги парабол, которые приводят в на-
чало координат. Учитывая направление движения, заключа-
ем, что такими дугами могут быть дуга ОА параболы Х\ ~ — х\
1 ^
(см. рис. 7.8, а) либо дуга ОВ параболы Х\ - —х\ (см. рис. 7.8, б).
Li
Управление u*(t) имеет не более одного переключения и
максимум два интервала постоянства. На первом интервале
постоянства нужно выбрать такое из двух значений 1 или -1,
которое привело бы фазовую точку из начального положения
х1 на одну из дуг ОА или ОВ. На дугу ОА, соответствующую
управлению и = 1, можно попасть по траекториям с и = -1, т. е.
двигаясь сверху вниз. А на дугу ОВ можно попасть лишь при
движении снизу вверх (рис. 7.9). Таким образом, плоскость
разделяется на две области.
Если х1 расположена выше кривой АОВ, то, двигаясь свер-
ху вниз по кривым семейства (7.51), мы выходим на дугу ОА
248
7. Принцип максимума
Рис. 7.9
и по этой дуге после переклю-
чения попадаем в начало коор-
динат. Если же х1 расположена
ниже кривой АОВ9 то начальное
движение снизу вверх по кривой
семейства (7.50) выводит фазо-
вую точку на дугу ОВ, по кото-
рой после переключения фазовая
точка попадает в начало коор-
динат. Наконец, отметим ситу-
ацию, когда начальное положение х1 оказыватся на кривой
АО В. В этом случае переход в начало координат не требует
переключения.
Как видим, для любого начального состояния х1 сущест-
вует ровно одна экстремальная траектория, ведущая в начало
координат (что согласуется с теоремой 7.5). Если оптимальная
траектория существует, то она совпадает с экстремальной, т. е.
построенная нами траектория обеспечит наименьшее время
движения. Существование оптимальной траектории вытекает
из теоремы 7.6. Эта теорема показывает, что в рассматрива-
емой задаче при любых начальных условиях х1 оптимальная
траектория существует, так как существует хотя бы одно
управление, реализующее цель. Итак, найденные траектории
оптимальны по быстродействию, и других оптимальных тра-
екторий, ведущих в начало координат, нет.
Как построить в решенной задаче синтезирующую функ-
цию? Поскольку для оптимального движения в каждый мо-
мент времени нужно выбирать между двумя значениями 1 и
-1, то оптимальное по быстродействию управление равно:
fl, (#i, х2) ниже АОВ или на ОА\
и (х\, х2) —
-1, (xl9 х2) выше АОВ или на ОВ.
Тогда система
Х\ — Х2\
X2~U (Xi, Х2)
при любых начальных условиях в качестве решения дает оп-
тимальную траекторию. Нам удалось решить задачу синтеза
для рассматриваемой системы. Отметим, что кривую АОВ
называют линией переключений.
7.5. Задача синтеза управления
249
Приведение маятника в верхнее положение равновесия.
Применим принцип максимума к задаче о приведении матема-
тического маятника в верхнее положение равновесия (см. 6Л).
Эта задача сводится к задаче наискорейшего перехода в начало
координат с законом движения
\Х\ -Х2\
\х2 =о)2х1+и,
начальными условиями л:1 = (φ0, фо) и ограничением на управ-
ление \u\<f0. Для упрощения выкладок будем считать, что
ω2=1, /0=1-
Запишем функцию Η:
#(Ψ, дс, u) = \\f1x2+y\f2(xi+u).
Сопряженная система имеет вид
Ψ1=-Ψ2;
Ψ2=-Ψ1-
Несложно найти ее общее решение [VIII]:
Ψ1 (t) = -<ν + С2е~1, ψ2 (t) = Схег + С2е~*,
где Ci, C2 — постоянные интегрирования, не равные нулю
одновременно (Ψ не должно быть тривиальным решением).
Из условия максимума для функции Η находим управ-
ление:
u*(t) = sign\\f2(t).
Управление оказывается кусочно-постоянной функцией, а
так как функция y2(t) имеет не более одного нуля, то управ-
ление имеет лишь одно переключение и два интервала посто-
янства значения. Для интервала, на котором и = 1, запишем
систему
х2 =*i+l,
из которой получаем уравнение с разделяющимися перемен-
ными (хг + 1)ахг - x2dx2. После интегрирования:
(#1 +1) ~х2 - Si,
где Si — произвольная постоянная.
250
7. Принцип максимума
Это семейство гипербол с единым центром в точке (-1, 0).
Так как dt = ахг/х2> движение по гиперболам будет слева на-
право в верхней полуплоскости х2 > 0 и справа налево в ниж-
ней (рис. 7.10, а).
а б
Рис. 7.10
Для интервала времени, на котором и = -1, поступаем ана-
логично и приходим к другому семейству гипербол с центром
в точке (1, 0):
(xi -1) -х2 = S2.
Движение по этим гиперболам будет слева направо в верхней
полуплоскости и справа налево в нижней (рис. 7.10, б).
Как и ранее, нас интересуют дуги тех гипербол, которые
приводят в начало координат. Это дуга ОА гиперболы (xi + I)2 -
-х\-\ и дуга ОВ гиперболы (хг -I)2 -х\ -1. Так как управ-
ление кусочно-постоянно и имеет не более одного переключе-
ния, то оно имеет не более двух интервалов постоянства, а
соответствующая фазовая траектория имеет не более двух дуг
гипербол, причем вторая дуга (может быть, единственная) есть
часть дуги ОА, если переключение с -1 на 1, или часть дуги
ОВ, если переключение с 1 на -1. Первая дуга траектории
должна привести фазовую точку из начального положения
равновесия на дугу ОА при управлении и = -1 или на дугу ОВ
при управлении и = 1. Состыкованная из двух дуг траектория
будет оптимальной.
7.5. Задача синтеза управления
251
Рис. 7.11
Анализ изображений на
рис. 7.10 показывает, что
на плоскости хгОх2 выде-
ляется область Q, которая
представляет собой полосу
между прямыми хх + х2 =
= -1 и Xi + х2 = 1, не содер-
жащую указанных прямых
(рис. 7.11). Если точка х1
находится в этой области,
то по некоторой гиперболе
из этой точки можно перей-
ти на кривую АОВ, и в ре-
зультате для такого началь-
ного состояния оптимальная траектория существует. Если же
точка х1 находится вне области Q, то попасть на кривую ЛОБ
не удается, так что для такого положения оптимального ре-
шения не существует. Учитывая это, область Q можно назвать
областью управляемости данной системы. Напомним, что,
согласно теореме 7.6, оптимальная траектория существует,
если существует хотя бы одна допустимая траектория, пе-
реводящая фазовую точку из заданного положения в начало
координат. Отсутствие оптимальной траектории для началь-
ного положения фазовой точки вне области Q на самом деле
свидетельствует о том, что из точек вне Q вообще ни при каком
допустимом управлении попасть в начало координат нельзя.
Теорема 7.6 говорит о том, что задачу поиска оптимального
управления имеет смысл решать только в области управляе-
мости объекта.
Итак, из любого состояния х1^ Q можно наискорейшим
образом попасть в начало координат. Оптимальная траектория
состоит из двух участков, на которых управление постоянно.
Как и в предыдущей задаче, здесь можно записать синтезиру-
ющую функцию:
и (#1, х2) -
1, (Xi, х2) ε Q ниже АОВ или на ОА;
-1, (xl9 x2)g Q выше АОВ или на ОВ.
252
7. Принцип максимума
7.6. Задача с подвижными концами
В задаче с подвижными концами или начальная точка х1, или
конечная точка х2> или обе эти точки не известны. Заданы
лишь множества Mi и М2, содержащие эти точки.
Чтобы прийти к формулировке необходимых условий, же-
лательно использовать геометрические представления. В даль-
нейшем под гиперповерхностью мы понимаем множество
всех точек х = (xl9 ..., хп) в Шп, которые подчиняются соотно-
шению / (xi, ..., хп) = О, где / — скалярная дифференцируемая
функция многих переменных· В частном случае, когда / — ли-
нейная функция, гиперповерхность описывается уравнением
а1х1 +а2Х2 + ... + апхп+Ь = 0 (7.52)
и ее называют гиперплоскостью. При Ъ = О гиперплоскость
(7.52) является (п- 1)-мерным линейным подпространством
в Шп [IV]. Любое (п-й)-мерное подпространство Η cl" может
быть задано как множество решений линейной однородной
системы k уравнений с η неизвестными, матрица которой име-
ет ранг k:
lanxi + a12x2 +... + а1пхп = 0;
la21x1+a22x2+... + a2„x„=0;
< Kg(ay)=/z.
I ak\x\ + ak%x2 + - - - + Q>knxn = 0>
Такое линейное подпространство будем называть (гс-/г)-мер-
ной плоскостью. Множество решений системы нелинейных
уравнений
/i(#i,..., хп) = 0;
[fk(xl> ·■·» хп) = ®>
где функции /х,..., fk дифференцируемы и ранг матрицы Яко-
би этой системы функций равен k, представляет собой (n-k)·
мерное гладкое многообразие [V].
Используем эти геометрические понятия для того, чтобы
сформулировать задачу оптимального управления с подвиж-
ными концами. Эта задача состоит в том, чтобы найти такое
допустимое управление u(t) для системы с законом движения
7.6. Задача с подвижными концами
253
x = f(xf и), хеШп, uGir,
которое переводит фазовую точку из некоторого, заранее неиз-
вестного, положения х1 на ^-мерном многообразии М1 (гг < п)
в некоторое положение х2 на г2-мерном многообразии М2 (г2 < п)
и при этом придает функционалу
I[x,u]=lf°(x,u)dt
h
минимальное значение.
Ранее рассмотренную задачу оптимального управления с
фиксированными концами можно интерпретировать как част-
ный случай этой задачи при гг = г2 = 0, т. е. когда многообра-
зия Mi и М2 вырождаются в точку. Возможен и промежуточ-
ный вариант, когда лишь одно из этих многообразий вырож-
дается в точку, и тогда в задаче один конец фиксированный,
а другой подвижный.
Как и в классическом вариационном исчислении, управле-
ние, оптимальное в задаче с подвижными концами, является
оптимальным и в задаче с фиксированными концами. Поэтому
принцип максимума (см. теоремы 7.1 и 7.2), рассмотренный
нами для задачи с фиксированными концами, дает необходи-
мые условия и в этой задаче, имеющей более общую постанов-
ку. Но отсутствие уравнений, указывающих начальное и ко-
нечное состояния, приводит к тому, что система необходимых
условий перестает быть полной. Недостающие уравнения, как
и в вариационном исчислении, получают из условий трансвер-
сальности. Будем говорить, что вектор сопряженных перемен-
ных Ψ(£) = (ψ0(£),.··, Ψη(0)* существование которого утвержда-
ется в приципе максимума, удовлетворяет условию трансвер-
сальности на левом конце траектории x(t)9 если вектор
^(h)= (¥i(*i)» · ··» ¥*(*i)) ортогонален касательной плоскости к
многообразию Μλ в точке tf(ii), т. е.
(Ψ(*1),*) = 0, (7.53)
где 2 — произвольный вектор, лежащий в касательной плос-
кости.
Аналогично формулируется условие на правом конце.
254
7. Принцип максимума
Условие трансверсальности на левом конце равносильно
ортогональности Ψ^) каждому из г± векторов базиса в ка-
сательной плоскости, т.е. дает га уравнений. В совокупности
с условием принадлежности точки x{t{) многообразию М± (это
условие определяется п-г^ уравнениями) мы имеем ровно
η уравнений, как и в задаче с фиксированным левым концом.
Аналогичная ситуация возникает и на правом конце.
Теорема 7.7. Если (x*(t), u*(t))> te[tl9t2], — оптимальный
процесс в задаче с подвижными концами x{t\)e Мъ x(t2)e ^-ъ
то ненулевая вектор-функция Ψ (£), существующая согласно
теореме 7.1, удовлетворяет на каждом из концов траектории
условиям трансверсальности. #
Замечание 7.3. В случае задачи оптимального быстродейст-
вия с подвижными концами в сформулированном утверждении
ссылку на теорему 7.1 нужно заменить ссылкой на теорему 7.2.
Отметим частный случай задачи с подвижными концами,
когда, например, правый конец траектории свободен (это оз-
начает, что М2 = W1). Тогда условия трансверсальности сводят-
ся к соотношению x¥(t2) = (\\fi(t2)J...» ψη&2)) = ®· Полный век-
тор сопряженных переменных Ψ(^) = (Ψο(^)> ^(h)) определя-
ется с точностью до произвольной постоянной. Поэтому в
данном случае можно полагать ψο(£2)= "1 (согласно принципу
максимума, ψ0 < 0) и Ψ(£2) = (~-U 0, ♦.., 0). Это облегчает при-
менение принципа максимума, так как обеспечивает недоста-
ющее начальное условие для вектора сопряженных перемен-
ных. Как отмечено выше (см. 7.3), именно отсутствие краевых
условий для сопряженных переменных — главная трудность
в использовании принципа максимума. Как видим, в задачах
с подвижными (и, в частности, со свободными) концами мож-
но ожидать, что процедура решения будет более простой.
Пример 7.3. Вернемся к задаче о быстрейшей остановке
движущейся точки в заданном месте (см. 7.5) и изменим ее
постановку. Потребуем, чтобы точка не останавливалась в
начале координат, а достигала его за наименьшее время. Зна-
чение скорости в конечный момент времени нас теперь не
интересует.
В фазовых координатах Х\ - х, х2 = х закон движения сис-
темы имеет вид (7.48)
7.6. Задача с подвижными концами
255
Начальное состояние x(t{) = x1 считаем заданным, а про конечное
состояние x(t2) известно лишь, что оно находится на оси Ох2,
так как X\{t2) = 0. Пусть |а| < 1 — ограничение на управление.
Итак, поставлена задача с правым подвижным концом.
Многообразие М2 описывается уравнением х1 = 0. Это одномер-
ное многообразие, в каждой его точке касательное простран-
ство одномерно, а любой касательный вектор в точке (0, х2)
имеет вид z = (0, ξ2)> С2 G ^· Условие трансверсальности на
правом конце можно записать следующим образом:
0·ψ1(*2) + ξ2Ψ2(*2) = 0,
откуда ty2(t2) = 0. Функция Η и сопряженная система имеют
тот же вид, что и выше (см. 7.5). Поэтому функция \\f2(t)
линейна. Из условия \\f2(t2) = 0 следует, что она на интерва-
ле (ix, t2) сохраняет знак. Значит, оптимальное управление
u*(i) = sign\|/2(i) не имеет переключений и постоянно в течение
всего движения, т. е. или u*{i) = 1, или u*(t) = -1. Материаль-
ная точка движется по параболе семейства (7.50) в первом
случае и по (7.51) — во втором.
Пусть точка х1 начального состояния находится в правой
полуплоскости х1 > 0. Через эту точку проходят две траектории,
удовлетворяющие первому условию принципа максимума — по
одной из каждого семейства траекторий. По параболе семейства
(7.50) движение направлено снизу вверх. Если точка х1 распо-
ложена выше дуги ОА параболы семейства (7.50), проходящей
через начало координат (рис. 7.12), то по параболе семейства
(7.50) точка не достигает оси Ох2, так что оптимальным мо-
жет быть только движение по
параболе семейства (7.51). Если
же точка х1 расположена на ду-
ге ОА или ниже, то достичь оси
0x2 можно по любой из двух па-
рабол. Однако из этих двух тра-
екторий только одна удовлетво-
ряет второму условию принципа
максимума. Покажем это. Для Рис. 7.12
256
7. Принцип максимума
задачи оптимального быстродействия второе условие принципа
Понтрягина выглядит следующим образом:
MQ¥*(t2)9x*(t2))>0.
Учитывая, что в нашем случае
Μ(Ψ*(«2),**(*2)) = Ψ1(»2)*Ι(*2)+|Ψ2(*2)Ι
и Ψ:Η*2) = 0> получаем yl(t2)x2(t2)>0, или, согласно виду ре-
шения сопряженной системы (\|/J =Q = const), C1xl(t2)>0. Из
построений следует (см. рис. 7.12), что в случае, когда началь-
ная точка х1 расположена в правой полуплоскости, выполняет-
ся неравенство x2(t2)<0. Поэтому Ci<0. Равенство Ci=0 невоз-
можно, так как тогда \\f'2=C2 = const и в силу условия \\f2(t2)= О
решение Ψ является тривиальным. Остается случай С\ < О· Из
решения сопряженной системы имеем \\f2(t) = С2 -C^i. Так как
С2 < 0 и ψ2 (t2) = С2 - C\t2 = 0, то ψ2 (t) < 0 на отрезке [i!, t2]. Сле-
довательно, единственное допустимое управление, удовлетворя-
ющее принципу максимума, имеет вид w*(£) = sign\|/2(£) = -l·
Таким образом, если х1 находится правее оси Ох2, то опти-
мальным будет управление u*(t) = -1. Аналогично рассуждая,
заключаем, что при начальном состоянии левее оси Ох2 опти-
мальным будет управление u*(t) = 1. Конечно, рассмотренная
задача элементарна и не имеет большого практического зна-
чения* Ответ в ней просматривается в содержательной поста-
новке задачи: чтобы из пункта А попасть в пункт В за крат-
чайшее время, нужно двигаться с максимально возможным
ускорением. Жми на педаль — и все!
Найденное решение позволяет определить синтезирующую
функцию:
и(х *,-_*! -I ^ *1<0;
\ХХ\ [-1, Хг>0.
7.7. Неавтономные системы
В общем случае неавтономной системы правая часть закона
движения и подынтегральная функция целевого функциона-
ла зависят явно от времени £, т. е. закон движения имеет вид
х = f(t, х, и), (7.54)
7,7. Неавтономные системы
257
где х = (xi,..., хпУ, и = (щ,..., иг )т, а целевой функционал за-
писывается следующим образом:
Л>, u] = |7°(f, x, u)dt. (7.55)
Как и выше, считаем, что функции f°(t,x,u) и f(t9x,u) =
= (Ζ1*· ■. > /Τ непрерывно дифференцируемы по части перемен-
ных х. Также полагаем, что момент времени ix прохождения
через точку начального состояния х1 известен, а момент вре-
мени t2 прохождения через конечную точку х2 не задан и
должен быть найден. Область управления U не зависит от
времени.
Как и в случае систем ОДУ, поставленная задача может
быть сведена к автономной задаче введением дополнительного
переменного xn+i* К закону движения добавим уравнение
%п+1 = 1> а к начальным условиям — соотношение хп+1 (t^) = t±.
Эти два условия равносильны тождеству xn+1(t) = t. Теперь в
расширенном составе фазовых переменных система (7.54) при-
нимает вид
\x\-f (#Л+1» х> и);
#2=/ (ХП+1> X>U)> /Г7 ССЧ
(7.56)
хп+1 — / v^n+l? Χ·> и)у
а функционал 1[дг, и] — вид
ч
1[х, и] = |/°(xn+i, л:, и)Л, (7.57)
h
где Γ+1 = 1.
Мы преобразовали неавтономную 7г-мерную задачу в авто-
номную, но с расширенным фазовым пространством. В новой
задаче требуется найти оптимальную траекторию, соединяю-
щую точку (tx, х\>..., х\) расширенного фазового пространст-
ва с некоторой прямой, проходящей через точку (0, х\,..., х%)
параллельно оси 0#п+1 (конечное значение t2 переменного хп+1
нам не известно). Таким образом, преобразованная задача —
это задача с фиксированным левым и подвижным правым
концами.
258
7. Принцип максимума
Если в задаче оптимального управления (7.54), (7.55),
(7.2), (7.3) (в частности, в задаче (7.1)-(7.4)) известны и на-
чальный момент времени i1? и конечный момент времени f2, то
такую задачу называют задачей с фиксированным временем.
Преобразование такой задачи введением дополнительного пе-
ременного приводит к задаче с фиксированными концами в
следующей формулировке. Требуется найти управление u(t)9
которое переводит фазовую точку системы (7.56) из положения
(ii, х\у..., х\) в момент времени ix в положение (*2> *i > ···> ^л)
в момент времени i2, причем функционал (7.57) принимает на-
именьшее значение. Мы можем не считать фиксированным
момент времени t2 попадания в точку (х29 i2)> так как в силу
тождества #π+1 = t попадание в точку (х29 t2) может произойти
только в момент времени i2. С учетом этого мы можем к данной
задаче применить теорему 7.1. Согласно этой теореме, для по-
лучения необходимых условий экстремума функционала мы
должны составить функцию Понтрягина
η
Η* = Σψ«Γ(*η+1, х, α)+ψ„+1 =Я + \|/п+1, (7.58)
α=0
где
ft,
H(t9^9x9u)^^Ja(t9x9u)
α=0
— прежнее выражение функции Понтрягина, не учитывающее
дополнительную, (тг+1)-ю переменную, в котором за этой пе-
ременной оставлено старое обозначение i. Сопряженная сис-
тема записывается следующим образом:
дН
ψ*=-—, i = 09n;
Соотношения в условиях 1° и 2° теоремы 7.1 принимают
вид
H{tt Ψ*(*), **(*), »*(*)) + ψ·+1<*) = AT(t, Ψ*(*), **(*))+ 4Ci(t),
ψ£(*2)<0, Μ(*,ψ·(*).*·(0) + ψ;+1(*)-0. (7.60)
7,7. Неавтономные системы
259
Сократим первое условие на \J/^+i(i):
H{t, Ψ*(0, x*(t), u*(t)) = M(tf Ψ*(0, **<*)). (7.61)
Если бы функции ψο(0> ¥i(0> ■■ ■> Ψ л (О в некоторый момент
времени i0 обращались в нуль, то мы имели бы
Щ*о^"(*о).**(*о)^*(*о)) = 0,
откуда, согласно (7.60) и (7.61), Ψη+1(*ο) = 0. Но тогда ψ/(*) = 0,
£ = 0, /г +1, как решение линейной системы дифференциальных
уравнений с нулевыми начальными условиями. А это проти-
воречит теореме 7.1. Таким образом, Ψ (t) = (\\f0(t),..., ψ„(*))
есть ненулевое решение системы (7.59). Это позволяет умень-
шить размерность задачи и не рассматривать функцию ψη+1
и второе из соотношений (7.60). Мы приходим к следующему
утверждению.
Теорема 7.8. Пусть (ar*(i), u*(f)), te[tl9t2]j — оптималь-
ный процесс для задачи с фиксированным временем. Тогда
существует ненулевая вектор-функция Ψ (t) = (ψο(£)> ···» Ψλ(*))»
соответствующая этому процессу, такая, что:
1° для любого f ε [*х, f2] функция ff(i, Ψ*(*)> x*(t)9 и) пере-
менного и достигает при и = и*(£) максимума
н(*, ψ*(*), **(*),») = M(t, ψ*(«), **(*));
2° \|/0(i)<0, ie[ibi2l· #
Как и выше, ψ0 = const. Поэтому условие 2° теоремы доста-
точно проверить в какой-то одной точке отрезка·
Эта теорема в такой же степени позволяет решить задачу
с фиксированным временем, в какой теорема 7.2 — задачу со
свободным бременем. Уменьшение количества условий на од-
но (отсутствует условие M(i, Ψ (i2)^ ^*(*2))= ^) компенсирует-
ся уменьшением количества неизвестных на одно (задан мо-
мент времени i2).
Обратимся к случаю, когда при фиксированном моменте
времени t2 правый конец свободен. Это задача о том, как из
данного положения х1 за данное время t2 - ii пройти по траек-
260
7. Принцип максимума
тории с произвольным конечным положением при минимуме
данного функционала. Условия трансверсальности тогда имеют
вид ψ1(^) = Ψ2(^2) = •■• = ¥rc(i2) = 0. Следовательно, ψ0 ^ 0, и мы
можем принять ψ0 = -1. Тогда при t = t2 должно выполняться
условие
Ψ(*2) = (-1>0>...,0). (7.62)
Для рассматриваемого случая необходимое условие опти-
мальности состоит в том, что функция Η достигает макси-
мума при любом t на оптимальном управлении u(t) и выпол-
няется (7.62).
Отметим, что в задаче с фиксированным временем и сво-
бодным правым концом часто целевой функционал является
не интегральным, & смешанным:
I[x9u]= \f°(t9 х, u)dt + T[x(t2)]. (7.63)
h
В этом случае смешанный функционал необходимо преобра-
зовать в интегральную форму (см. 4.5):
1[х,и]= \\ f°(t, х, u)dt+ T[*(fl)] +—7ΙΧ*)] }dt. (7.64)
II h-ь dt )
Пример 7.4. Рассмотрим систему с законом движения
[*1=*2' (7-65)
Х2 ~~ ~Х\ τ cAl·
Пусть даны: ограничение на управление -1/2 < и < 1, началь-
ное состояние Xi(0) = -1, #2(0) = 1 в момент времени t\ = 0,
целевой функционал
I[x\, х2, u]= udt + x2(t2), (7.66)
о
где известно, что i2 = 2π.
Поставленная задача — это задача с фиксированным вре-
менем и свободным правым концом, функционал в этой за-
даче смешанный. Преобразуем функционал в интегральный
согласно (7.64):
7.7. Неавтономные системы
261
1[х1,х2,и] = Г и +
х2(0) | dx2(t)
h
dt
dt.
(7.67)
Третье слагаемое в подынтегральной функции можно заме-
нить, используя закон движения:
dx2(t)
dt
= -x1(t) + 2u.
С учетом краевых условий и заданного конечного времени
t2 = 2π приходим к следующему виду целевого функционала:
2я , ν 2я
I[xl7x2,u] = \\3u + Xi \dt= \(Su-xi)dt + l. (7.68)
Появившееся постоянное слагаемое 1 никак не влияет на вы-
бор оптимального решения, и его можно отбросить, заменив
исходный функционал другим:
2π
/[#!, X2,ll] = (3U-Xi)
dt.
К данной задаче применима теорема 7.8. Запишем функ-
цию Понтрягина:
Η = ψ0(3α- x1) + \\f1x2 +Ψ2(-*1 + 2u) =
= ("Ψθ "Ψ2)*1 + Ψ1*2 +(3ψ0 + 2\|/2)u.
Эта функция является линейной по управлению и и поэтому
достигает максимального значения либо при и = -1/2, либо
при и - 1 в зависимости от знака выражения 3ψ0 + 2ψ2, т. е.
u*(t) =
--, 3ψ0(*)+2ψ2(*)<0;
Li
(7.69)
[1, 3ψ0(0 + 2ψ2(0>0.
Запишем систему для сопряженных переменных:
Ψο=0;
ψ!=ψ0+ψ2;
Ψ2=-Ψ1·
(7.70)
262
7. Принцип максимума
Общее решение системы имеет вид
ψΧ (i) = -Ci cos t + C2 sin t;
4/2(0 = Cisini + C2cosi-C3,
а учитывая краевые условия ψ0(2π) = -1, ψ!(2π) = ψ2(2π) = 0
для сопряженных переменных на правом конце, находим
Ci = 0,C2 = -l, С3 = -1, т. е.
ψ0=-1, \\f1=-smt, \|/2=l-cosi.
Итак, 3ψ0 +2ψ2 =-l-2cosi, и мы можем записать экстре-
мальное управлениеу анализируя знаки функции -1 - 2cosf
(рис. 7.13):
(7.71)
и,
1
0
-1/2
1
2π/3 4π/3
Ι Ι
Рис. 7.13
2π! i
"*(*) = -
1 2
—, 0<f <-π;
2 3
2 4
1, — n<t<— π;
3 3
1 4
—, — π<*<2π.
[ 2 3
Поскольку найдено лишь од-
но управление, удовлетворяющее
принципу максимума, оно и будет оптимальным при условии,
что оптимальное управление в данной задаче существует.
Определим экстремальную траекторию, соответствующую
найденному управлению. Для этого необходимо решить сис-
тему (7.65) при двух возможных значениях и. На промежутке
(7.72)
решая которую, получим
х1 (*) = Ci cos t + C2 sin t -1, x2 (t) = -Ci sin t + C2 cos t. (7.73)
Из начальных условий #i(0) = -1, x2(0) = 1 определяем посто-
янные интегрирования Cj и С2. С учетом этих постоянных
имеем
x1(i) = sini-l, x2(i) = cosi. (7.74)
0,-π
я
при и =
О
-1/2 имеем систему
I Xi = Х2 9
\х2 =—Хг -1?
7.7. Неавтономные системы
263
Очевидно, что при движении по найденной траектории в мо-
2 ^
мент времени t = — π фазовая точка будет находиться в состо-
о
янии
*1
V3
-π =■
3 2
— 1, Х2
(2 Л
-π
V» J
1
2
На промежутке
деляется системой
(2 4
— 71,-71
3 3
оптимальная траектория опре-
[ #1 — Х2 9
Χ% = — Х\ +ω.
Общее реп1ение этой системы имеет вид
*i(i) = CiCosi + C2sini + 2, JC2(i) = -Cisini + C2cosi. (7.75)
Подставляя в общее решение найденные значения #1? х2 при
, 2
t = — π, получим систему относительно неизвестных постоян-
о
ных
1 = —Ci Η Со+2, — = Ci —Co·
2 2 2 2 2 2
Решая эту систему, находим Cj =—, С2 =1 . Следователь-
Li L*
^2 4
но, на промежутке
—π, —71
3 3
оптимальной будет траектория
Xi(t) = — cosi +
Li
1-
зТз
ν
sin £ + 2;
x2(i) = —sini +
Li
1-
зТз
(7.76)
cosi.
На промежутке
(4
— 7t, 2тг
3
оптимальная траектория удовлет-
воряет той же системе (7.72), что и на первом участке, и, сле-
4
довательно, имеет вид (7-73). Согласно (7.76), при t = —π имеем
о
*1
(4 ^
—π
7-V3
(4 λ
Χο\ —71
2 з
зТз-i
264
7. Принцип максимума
Как и выше, составляем систему относительно неизвестных
постоянных Ci и С2:
M = _ICl-^C2-l;
2 2 J 2 2
з7з-1_ 7з^ 1
— Ci Со.
2 2 2
Решая ее, находим Сг = О, С2 = 1 - 3v3. Таким образом, по-
следний участок траектории описывается системой
x1(t) = (l-3yi3)sint-l, x2(i) = (l-3V3)cosf. (7.77)
Из соотношений (7.74), (7.76), (7.77) следует, что оптималь-
ная траектория состоит из дуг трех окружностей (рис. 7.14).
Рис. 7,14
На первом участке 0 < t < — π оптимальная фазовая кривая
описывается уравнением
(хх+1)2+х| =1,
2 4
на втором участке — n<t<— π — уравнением
о О
7.8. Понятие особого управления
265
(*х-2)2+*| =10-Зл/3,
4
на третьем участке — π < t < 2π — уравнением
(Χ!+1)2+*| =(1-Зл/3)2.
Движение по дугам фазовой кривой осуществляется соглас-
но направлению вектора фазовой скорости, т. е. по часовой
стрелке·
7.8. Понятие особого управления
Принцип максимума Понтрягина не позволяет однозначно
выделить оптимальное управление, если максимум функции
Понтрягина Η по управлению достигается более чем в одной
точке на целом промежутке времени. В большинстве случаев
подобная ситуация говорит о наличии особых управлений.
На практике нередко встречаются задачи оптимального
управления, в которых функция Понтрягина линейно зависит
от всех управлений или хотя бы от некоторых из них. Таковы,
например, линейные задачи оптимального быстродействия.
В примерах линейных задач, рассмотренных выше (см. 7.5),
коэффициент при управлении зависел только от решения со-
пряженной системы и мог обращаться в нуль лишь в изоли-
рованные моменты времени. Благодаря этому оптимальное
управление однозначно определялось из условия максимума
функции Понтрягина. Эта ситуация типична для линейных
задач оптимального управления.
Однако в нелинейных задачах оптимального управления
(например, если функция Понтрягина является нелинейной
по одной или нескольким фазовым переменным) возможна
ситуация, когда на оптимальной траектории коэффициент при
одной из компонент вектора управления и обращается в нуль
на целом промежутке времени, и тогда условие максимума
функции Η по управлениям не позволяет однозначно опреде-
лить оптимальное управление.
Пример 7,5· Рассмотрим задачу оптимального управления
с законом движения
266
7. Принцип максимума
\Х\ - Х2
\*г = и>
целевым функционалом
1[х, и]
краевыми условиями
*i(*i) = х\> x2(h) = х\, xi(t2) = x2(t2) = 0 (7.79)
и ограничением на управление |ц| < 1. Начальный момент
времени t\ считаем фиксированным.
Поставленная задача отличается от рассмотренной в 7.5
лишь целевым функционалом. Посмотрим, к чему это приво-
дит. Составляем функцию Понтрягина
# = Ψθ(*2)2+Ψ1*2+Ψ2^
и записываем сопряженную систему
[ψο=0;
Ψ1=0; (7.80)
|ψ2=-2ψο*2-ψ1·
В каждой точке i, в которой y2(t) ^ 0, функция Понтрягина
имеет по управлению единственную точку максимума, и в
этом случае u*(t) = sin\y2(f)> т. е. ситуация здесь такая же, как
и в задаче оптимального быстродействия (см. 7,5)* Значит, на
интервалах времени, на которых \\f2{t)^ 0> оптимальные фа-
зовые кривые являются дугами парабол вида (7,50) или (7.51).
Однако возможна ситуация, когда \\f2(t) = 0 на некотором от-
резке [t\ t"]<z[ti, t2]· Покажем это.
Из первых двух уравнений системы (7.80) имеем ψο(*) = С0 =
= const, \|/i(i) = Ci = const. Подставляем найденные функции в
третье уравнение:
у2=-С1-2С0х2. (7.81)
Предположим, что принципу максимума удовлетворяет
траектория x*(t), на которой x2(t') = 0 для некоторого момента
*2
= j(x2)2dt,
7.8. Понятие особого управления
267
времени i/G[i1,i2]· Такую траекторию можно построить из
дуг парабол семейств (7.50) и (7.51). Если этой траектории
соответствует вектор сопряженных переменных Ψ(£') с
ψ1(^/) = Ο1=0 и ψ2(Ο-0> то в точке tf выполнены соотноше-
ния [VIII]:
ψ2(0 = ο, ψ2(θ = ο.
Это и может означать существование отрезка [t\ t% на кото-
ром ψ2(£) = 0. #
Ситуация, представленная в примере, получила название
особого режима. Опишем ее в общем случае.
Рассмотрим автономную задачу оптимального управле-
ния (7.1)-(7.4), в которой функция Понтрягина Η линейна
по части компонент управляющего вектора. Выделим из этих
компонент группу из гх управлений и обозначим ее через и, а
остальные г2 = г- гг управлений соберем в вектор ν, он может
включать и часть управлений, по которым функция Η линей-
на. Удобство такого разделения управлений будет видно ниже
при формулировании определений. При таких обозначениях
закон движения системы можно записать в следующем виде:
х = f(x, и, υ),
а функцию Понтрягина — в виде
#(Ψ, х, щ υ) = ^ €ц (Ψ> x, ν)щ + α0 (Ψ, x, υ).
Так как
дН
дщ
то, вводя обозначение
= α,(Ψ,*,υ), i = l,rl9 (7.82)
дН
дН дН
\
ди
запишем функцию Η в виде
,...,
дщ дип j
„ дН
ди
268
7. Принцип максимума
Предположим, что область управления задачи есть декар-
тово произведение U х V, где [/cf1 — область допустимых
значений вектора u, a Ve Rr2 — область допустимых значений
вектора v.
Пусть процесс (x(t), u(t), v(t)) совместно с решением
Ψ(*) = (Ψο(0> ···» Ψη(0) сопряженной системы
дН
Vi=—, i = 0,n, (7.83)
Эх,
удовлетворяет принципу максимума и при этом во всех точках
некоторого промежутка [t', f"] с [tl712] выполняется равенство
^(W(t),x(t)Mt)) = 09 (7.84)
ди
или, учитывая (7·82),
α(Ψ(£),*(£),υ(£)) = 0, (7.85)
где a = (ai,..., ап). В этом случае вектор управлений и(£) на-
зывают особым управлением в промежутке [£', £*], процесс
(*(i), и(£), i>(£)) — особым режимом, траекторию #(£) — тра-
екторией особого режима, а промежуток времени [£', £*] —
участком особого управления {режима).
Из формулы (7.85) вытекает, что на участке особого ре-
жима
Я(Ψ(£), *(£), u,v) = H(nt), *(£), υ),
т. е. функция Понтрягина не зависит от it и условие макси-
мума по и не дает никакой информации о конкретных значе-
ниях управлений в этом векторе.
Поскольку на участке особого режима верно тождество
(7.84), то как вектор-функция времени тождественно рав-
ди
на нулю, а потому равна нулю и ее производная по времени.
Значит, вектор-функции Ψ(£), x(t), u(t) могут принимать толь-
ко такие значения, которые удовлетворяют соотношению
dt
ди
= 0, (7.86)
7.8. Понятие особого управления
269
в котором производная по времени есть полная производная
в силу систем (7.1) и (7.83). Если левая часть этого равенства
не зависит от и, то для определения особого управления мож-
но взять следующую производную и приравнять нулю:
d2 (ΒΗλ_
dt
ydU J
и т. д. Эти соотношения совместно с условием (7.84) позволя-
ют выделить все особые режимы.
Пример 7.6. Продолжим обсуждение задачи из примера 7.5
и найдем в этой задаче особые режимы. Так как
Η(Ψ, Χ, U) = ψο#2 + Ψ1*2 + Ψ2">
то = Ψ2> и производные по времени этой функции в силу
ди
систем (7.78) и (7.80) равны
d_
dt
ЭЯ
= -ψ!-2ψ0^2»
dl
dt'
Ш
ydU;
= -2\|/0u.
Поэтому на участке особого режима должны выполняться ра-
венства
\|/2(i) = 0, -ψ1(*)-2ψ0(*)*2(*) = 0, -2y0(t)u(t) = 0,
или с учетом \|/0(£) = С0, \|/i(f) = Съ что следует из сопряженной
системы,
ψ2(*) = 0, Ci+2C0x2(*) = 0, u(t) = 0. (7.87)
Согласно условию 2° теоремы 7.1,
maxtf($(i), x(t), u) = Mmt), x(t)) = 0, te[tu t2].
\u\<l
Значит, на участке особого режима выполняется равенство
Ψθ(0*2(*) + ψ1(0*2(*) = 0,
или с учетом ψο(*)-£ο> ^i(t) = Ci
C0xl(t) + C1x2(t) = 0. (7.88)
270
7. Принцип максимума
Из условия Ψ(£)# Ο следует, что С0 и Сх одновременно не об-
ращаются в нуль. Тогда, согласно (7.87) и (7.88), на участке
особого режима
С2 = 0, x2(t) = 0. (7.89)
Из системы (7.78) вытекает, что X\(t) = 0. Поэтому X\(t) = const,
te[t',f].
Итак, на участке особого управления обе фазовые коорди-
наты остаются постоянными. Фазовая точка на таком участке,
попадая на ось Ох1ч остается на этой оси неподвижной на весь
период особого режима. Фазовой траектории особого режима
соответствует единственная точка на указанной оси. Обратим
внимание, что такое «стояние» в точке оси не влияет на зна-
чение целевого функционала, так как в течение всего времени
особого режима подынтегральная функция х\ целевого функ-
ционала равна нулю.
Теперь мы можем полностью описать все допустимые про-
цессы, удовлетворяющие принципу максимума. Оптималь-
ное управление может принимать лишь значения 1 и -1 на
обычных (не особых) участках, а также значение 0 на участ-
ке особого режима. Если, двигаясь по оптимальной траекто-
рии, мы достигнем оси Ох\ (тогда х2 = 0), то в достигнутой
точке можем устроить стоянку, причем любой длительности,
так как участок особого режима может быть произвольным.
Эта стоянка и ее длительность не отразятся на значении целе-
вого функционала. Для описанного процесса существует не-
нулевой сопряженный вектор Ψ(0, удовлетворяющий прин-
ципу максимума.
Выясним, сколько нулей может иметь функция ty2(t), Для
чего используем второе соотношение в условии 2° теоремы 7.1.
Согласно этому соотношению, ψ0 ^0 и, значит, С0 < 0. Из ра-
венств
х2 = и = sign ψ2(0> Ψ2 = -Ci -2C0x2
вытекает, что
ψ2 +2C0sign\|/2 =0. (7.90)
Покажем, что при С0 < 0 решение такого уравнения может
менять знак при te [£1? t2] не более одного раза. Предположим,
7.8. Понятие особого управления
271
что \\f 2(t) обращается в нуль в точках t\ f. Умножим уравне-
ние (7.90) на ψ2(0> учтем, что
Ψ2Ψ2=— (Ψ2Ψ2)"(Ψ2)2,
at
и проинтегрируем уравнение (7.90) на отрезке [t\ £*]:
t' t"
-j(y2)2dt + 2C0j\\v2(t)\dt = 0. (7.91)
t' t'
При С0<0в левой части полученного равенства — сумма двух
неположительных слагаемых. Поэтому равенство верно, ког-
да каждое из этих слагаемых равно нулю, и мы приходим к
выводу, что ψ2(0 = 0 на всем отрезке \t\ t"].
Итак, функция ψ2{t) обращается в нуль либо в единствен-
ной изолированной точке, либо на одном отрезке \t\ f*]. Так
как u*(i) = sign\|/2(i), то управление u*(t) имеет не более одной
перемены знака. Такое управление относится к одному из двух
следующих типов:
u*(f) =
1, tX < t < t'\
0, t'<t<t";
-1, f<t<t2,
или
f-1, fi < t < t';
u*(i) = i0, t'<t<t";
1, tff<t<t2.
Значение f' соответствует моменту времени, когда x2(t) обра-
щается в нуль, а значение t" — любое на отрезке [£', t2].
Теперь уже не составляет труда найти оптимальное управ-
ление и оптимальные траектории для конкретных начальных
условий (х|, х\). Наличие участка особого управления не из-
менит вид фазовых кривых, так как на таком участке фазовая
точка не перемещается, а стоит на месте. Фазовые кривые
будут те же, что и на рис. 7.9 (см. 7.5). Но оптимальным фа-
зовым кривым, пересекающим ось Охъ соответствует беско-
нечно много оптимальных процессов, каждый из которых
272
7. Принцип максимума
получается «вклеиванием» участка особого управления в мо-
мент достижения указанной оси. Длина участка может быть
произвольной. Такое «вклеивание» не меняет значение целе-
вого функционала. Существование особого режима приводит
к тому, что рассматриваемая задача при некоторых краевых
условиях имеет бесконечно много решений.
Понятие особого управления впервые ввел Л.И. Розоноэр*,
и это послужило началом целого направления в теории опти-
мального управления.
Вопросы и задачи
7.1. Решите следующие задачи оптимального быстродей-
ствия:
f*j* ^— γ О.
Х2 —U,
\и\<1;
б) Г1 *2+ ' xi(fi) = *2(*i) = 0, x1(t2) = -2, x2(t2) = 0,
\X2=-X1+U,
|u|<2;
\xi = x2-h
в) . _ x1(t1) = 0, x2(tl) = A, Xi(t2) = x2{t2) = Q;
X2 — ~X\ 1 Uj
r) \ } 2 ь Xi(h) = X2(h) = 2, x1(t2) = 6, x2(t2) = -2,
\x2 = xx + u2,
|ux|<2, |u2|<2;
\xi = -x2 + щ;
x1(t1) = -2t x2(h) = 2, xl{t2) = 2,
X2 — X\ + u2»
Д)
x2(t2) = -10, |«i| < 2, \u2\<2.
* См.: Розоноэр Л.И. (1959 г.)» а также: Габасов Р.Ф., Кириллова Ф.М.
Вопросы и задачи
273
7.2. Решите задачу оптимального быстродействия с правым
подвижным концом
' xl(t1) = 4, *2(*i) = -3,
2 _
[^i(i2)r+[^2(i2)r=4f |и|<1.
7.3. Решите следующие задачи оптимального управления
с фиксированным временем:
π
a) arsinidi -^min, х = и, х(п) = х(-п) = 0, |м|<1;
-π
б) (u2 +x)di -^min, х-щ х(4) = 0, |и|<1.
о
7.4. С помощью принципа максимума запишите полную
систему необходимых условий в следующих задачах опти-
мального управления (х\, х\, х\, jtf, Τ заданы):
т г ·
а) ГмЛ + [лг2(Г)]2->пш1» 1 * 2« xi(0) = jc11,
J \х2=х1+2и,
х2(0) = х\, |u|<l;
г г · _ .
б) Гucit + [дс!(О)]2 —>min, J 1_ 2' Х(р) = х2
J \Х2- -*1 +и>
о 1
х2(Т) = х%, \и\<1.
7.5. Исследуйте на наличие особого режима задачу опти-
мального управления (х{, x\, t2 заданы):
*2 г.
Со \Х1 = Х2 + и\ 1 1
(х\) dt —>min, ^ jci(0) = Xi, x2(0) = ^o,
J |x2 = -«»
JCi(*2) = *2(*2> = 0» |и| < 1-
274
7. Принцип максимума
7.6. В задаче о быстрейшей остановке движущейся точки
в заданном месте вычислите минимальное время движения из
произвольной точки х1 ={х\У х\)т в начало координат х2 =
= (О, 0)т.
7.7. Найдите оптимальное управление w*(i), оптимальную
траекторию x*(t) и время Τ в задаче
f(l+|u|)df-»min, Г1'*2' Xl(0) = 12,
J [Х2 = и,
х2(0) = х1(Т) = х2(Т) = 0, \и\<1.
7.8. Найдите оптимальное управление u*(t) и оптимальную
траекторию x*{t) в следующих задачах оптимального управ-
ления:
а) \xidt—>min, \ х1(0) + л:1(1) = 0,
J [х2 = и,
*2(0) + х2(1) = 0, |и|<2;
{Х\ — #2 5
х^О) = х2(0) = 0У |ы|<1,
Х2 = ~Х\ + W,
ie[0, 2π].
8. МЕТОД ДИНАМИЧЕСКОГО
ПРОГРАММИРОВАНИЯ
Одновременно с принципом максимума Понтрягина и незави-
симо от него в теории оптимального управления коллективом
американских ученых во главе с Р. Беллманом был разработан
метод динамического программирования. Этот метод более
универсален, чем метод, использующий принцип максимума.
Он был разработан для нужд оптимального управления про-
цессами более общего характера, чем процессы, описываемые
системами дифференциальных уравнений, и позволяет решать
большой круг задач оптимального управления дискретными
системами, т. е. системами, которые описываются разност-
ными уравнениями. В этой главе мы обсудим основные идеи
динамического программирования.
8.1. Принцип оптимальности
В основе метода динамического программирования лежит
сформулированный Р. Беллманом принцип оптимальности.
Этот принцип верен для тех систем, последующее движение
которых полностью определяется их состоянием в текущий
момент времени. К таким системам относятся, например,
управляемые системы, т. е. системы, которые описываются
системой дифференциальных уравнений
x = f(x, и), (8.1)
где х = (хи...,хпУ; / = (Д,...,/л)т; u = (ul9..., ur)T.
Состояние такой системы описывается точкой х фазового
пространства, а движение — это некоторая траектория x(t) в
фазовом пространстве (фазовая траектория). Принцип опти-
276
8. Метод динамического программирования
мальности также распространяется на дискретные системы,
которые описываются конечно-разностными уравнениями.
В таких системах роль времени играет дискретный параметр.
Принцип оптимальности отражает важнейшие особенности
задач оптимального управления. Его суть можно объяснять
по-разному. Ввиду его важности приведем несколько форму-
лировок.
Первая формулировка. Если управление оптимально,
то, каковы бы ни были первоначальное состояние системы и
управление системой в начальный момент времени, последую-
щее управление оптимально относительно состояния, которое
система примет в результате начального управления.
Указанное свойство — одно из основных для процессов
марковского типа, т.е. процессов, будущее поведение которых
полностью определяется состоянием и управлением в настоя-
щее время.
Вторая формулировка. Оптимальное управление в любой
момент времени не зависит от предыстории системы и опре-
деляется только состоянием системы в этот момент и целью
управления.
Под целью управления в данном случае понимается тре-
бование, которому должна удовлетворять система, такая,
что ее движение определяется управлением. Это может быть
приведение системы в заданное состояние или обеспечение
определенных условий движения в течение заданного перио-
да времени.
Еще один вариант принципа оптимальности дадим для за-
дачи оптимального управления с фиксированным временем и
свободным правым концом. Пусть закон движения описывает-
ся автономной системой дифференциальных уравнений (8.1),
причем заданы начальный 11 и конечный t2 моменты времени,
а также начальное состояние x{t{) = х1. Целевой функционал
определим следующим образом:
I[x,u]= (f°(x9u)dt. (8.2)
h
Третья формулировка· Начиная с любого момента времени
t'e[ti9t2] участок оптимальной траектории x*(t), iG[i1,i2]»
от точки #*(0 до точки x*(t2) также является оптимальной
траекторией (рис. 8.1).
8.1. Принцип оптимальности
277
х1 = x*(ii)
Другими словами, каково бы х f
ни было положение точки x*(t') на
оптимальной фазовой траектории,
ее участок от точки x*(t') (учас-
ток 2 на рис. 8Л) тоже является
оптимальной траекторией. Что же 0
касается участка 1 оптимальной р я t
траектории до точки #*(£')> то
можно утверждать, что этот учас-
ток есть оптимальная траектория, когда точка x*(t') = x яв-
ляется фиксированной (как, например, в многоточечных за-
дачах управления), т. е. когда по условию задачи допустимая
траектория обязательно должна проходить через точку х.
Если же задана только начальная точка #*(ii) = xl9 то учас-
ток 1 оптимальной траектории сам по себе может и не быть
оптимальной траекторией, т. е. может не доставлять макси-
мум функционалу
г'
Ji[x,u]= \f°(x,u)dt
h
в задаче со свободным правым концом.
Таким образом, важно иметь в виду, что принцип опти-
мальности относится к последующему за данным состоянием
движению системы, но может нарушаться для движения,
предшествующего данному состоянию.
Принцип оптимальности в третьей формулировке для не-
которого класса задач уже обсуждался в качестве свойства
оптимальных траекторий (см. 7.1)· Отметим еще одну особен-
ность оптимального управления, вытекающую из принципа
оптимальности: выбор оптимального управления определяется
лишь состоянием системы в текущий момент времени. Если в
какой-то период времени управление было неоптимальным, то
последствия этого в будущем исправить уже нельзя.
Пример 8.1· Рассмотрим простейший вариант дискретной
задачи распределения ресурсов и покажем, как можно исполь-
зовать принцип оптимальности. Производственно-экономиче-
ский процесс состоит в следующем. Некоторая начальная
сумма денег s = Xi затрачивается на приобретение оборудова-
278
8, Метод динамического программирования
ния двух типов А и Б, с помощью которого организуется про-
изводство. Пусть на оборудование типа Л выделена сумма иъ
О < щ < хъ тогда за определенное время его эксплуатации будет
получен экономический эффект g(u{). Оставшаяся сумма
xi " ui будет израсходована на приобретение оборудования
типа В, которое за тот же период времени даст экономический
эффект h(xi - Ui). К концу срока эксплуатации суммарный
экономический эффект составит
#i(*i> ui) = g(u1) + h(x1-u1).
По истечении срока эксплуатации оборудование реализуют,
за оборудование типа А выручат сумму аиъ О < а < 1, а за
оборудование типа В — сумму b(xi~ui), О < Ь < 1. Этим за-
вершится первый цикл производства. Вырученную от продажи
оборудования сумму
х2 =aui+b(xi -Ui)
используют как стартовую для организации второго цикла про-
изводства. Из нее на оборудование типа А выделят сумму и2,
О < и2 < х2, а на оставшуюся сумму х2-и2 приобретут оборудо-
вание типа В. Следующий цикл эксплуатации оборудования
даст экономический эффект g(u2) + h(x2 - и2) и остаточную сум-
му х$ -аи2 +Ь(х2 -и2) за проданное оборудование. Описанный
цикл производства многократно повторяется.
Считая известными функции #(ξ), Λ(ξ) и постоянные s, α,
b, найдем такую стратегию распределения средств при покуп-
ке обрудования типов А и В, чтобы обеспечить наибольший
экономический эффект за фиксированное количество η про-
изводственных циклов. Другими словами, надо так выбрать
значения i/1? ..., un в допустимых пределах, чтобы получить
максимум величины
η
Rn(s,ul9u2,...9un) = ^(g(uk) + h(xk-uk)), (8.3)
где хг = $, хт+1 = аит + Ь(хт - ит), 0 < ит < хт9 т = 1, п.
Мы пришли к дискретной задаче оптимального управле-
ния. Параметры щ, и2, ..., ип, которые нужно определить,
решая задачу, есть управление, неравенства 0 < ит < хт,
т = 1,пу описывают область допустимого управления, а сум-
8.1. Принцип оптимальности
279
марная величина (8,3) есть целевой функционал. Отметим,
что для планирования процесса на k-м цикле необходимо знать
лишь величину xk и число η-к оставшихся циклов. Процесс
планирования в предыдущие циклы никак не влияет на пла-
нирование в текущем цикле, т. е. «история» процесса не важ-
на. Основной интерес в этой задаче представляет не значение
максимального экономического эффекта, а процедура его до-
стижения, или, другими словами, оптимальная стратегия
распределения средств.
Принцип оптимальности предполагает использование хо-
рошо известного приема, состоящего в планировании от конца
к началу. Рассматривая последний гс-й цикл, найдем значение
оптимального управления ип как функцию состояния процес-
са на начало данного цикла, что позволит распределять сред-
ства на этом цикле в зависимости от их количества хп. Затем,
используя оптимум последнего цикла, найдем оптимальную
стратегию на двух последних циклах как функцию состояния
процесса на начало предпоследнего цикла. Для этого достаточно
найти un-i как функцию хп-\. Процедуру повторяем для трех
последних циклов, четырех и так далее до тех пор, пока не ох-
ватим все циклы. На последнем шаге, найдя щ как функцию
хг и зная фактическое значение Χγ - s, мы сможем вычислить
всю серию значений иъ и2, ..., ип, т. е. определить оптималь-
ную стратегию.
Итак, на п-м цикле в зависимости от хп максимальный
экономический эффект равен:
rn(xn)= max {g(un) + h(xn-un)),
0<ип<хп
а значение и^(хп)9 на котором достигается этот максимум,
является искомым оптимальным значением в зависимости
от хп. Считая, что на последнем цикле ип = ц*(хЛ) и достига-
емый экономический эффект равен гп(хп), ищем максимум:
rn-i(Xn-i)= max [g{un^) + h{xn^ -un^) + rn(xn)] =
= max [£(un_!)+ /*(*„_! -u^ + r^au^ +Ь(хп_г -u*_i))l
Найденный максимум гп-\(хп-\) и соответствующее значение
un-i> ПРИ котором он достигается, позволяют перейти к сле-
дующему этапу.
280
8. Метод динамического программирования
Продолжая продвигаться к началу процесса, мы на k-м
этапе ищем максимальный экономический эффект гт(хт)9
т = п-к+1,з& последние k производственных циклов в за-
висимости от средств хм на начало т-го цикла по формуле
rm(Xm)= max [s(um) + h(xm-um) +
Ъ<ит<хт^
+ rM+l(aum+b(xM-um))], m = n-k + l9 k = l,n. (8.4)
Соотношение (8,4) — это рекуррентное соотношение
Беллмана для рассматриваемой задачи. Оно сводит задачу
оптимизации на k последних циклах к оптимизации на первом
из них с учетом уже найденной оптимизации на k -1 послед-
них циклах· Величина гг(хг) представляет собой суммарный
экономический эффект за все η производственных циклов в
зависимости от стартового значения jq. Задача отыскания
максимума функции η переменных с очень сложной зависи-
мостью свелась к η последовательным задачам поиска макси-
мума функции одного переменного.
Изложенный метод решения дискретных задач оптималь-
ного управления можно использовать в непрерывных задачах
оптимального управления, но для этого непрерывную задачу
нужно заменить близкой ей дискретной задачей (эту замену
называют дискретизацией исходной задачи). Пусть система
имеет закон движения
x = f(x,u), хбК, иеЖ, (8.5)
и задано начальное состояние х(0) = х° системы. Для управ-
ления u(t) (как и выше, это кусочно-непрерывная функция)
введем ограничение \и\ < 1. Время движения Τ = t2 ~ t± счи-
таем фиксированным. Так как система автономна, можно при-
нять, что ti = 0. В качестве целевого функционала возьмем
τ
l[x9u]= (f°(x,u)dt. (8.6)
о
Для замены поставленной непрерывной задачи оптималь-
ного управления близкой ей дискретной выберем некоторое
натуральное число N и разобьем отрезок [0, Т] на N участков
одинаковой длины δ = Τ/Ν. Будем искать значения функций
лишь в дискретные моменты времени t = йб, k = 0, N. Вместо
8.1. Принцип оптимальности
281
х(кЗ) и и{кЪ) будем писать xk и uk соответственно. Дифферен-
циальное уравнение (8.5) заменим разностным, аппроксими-
руя первую производную в дискретные моменты времени со-
гласно формуле
dx _ Xfe+i - Xk
dt~ δ
В результате получим
xk+i=xk+f(xk, uk)b, fe = 0, N-1. (8.7)
Заменим также целевой функционал (8.6) интегрального
типа соответствующей интегральной суммой
1(х°,..., xN_u и0,..., uN_1) = ^f°(xk9 uk)6. (8.8)
Итак, мы пришли к дискретной задаче, в которой нужно
найти такое управление (u0, ul9..., un_i), которое удовлетво-
ряет ограничению \щ\< 1, k = 0, N-1, и минимизирует функ-
ционал (8.8) при начальном условии х0 = х°. Эта задача тем
лучше аппроксимирует исходную задачу (8.5), (8.6), чем боль-
ше число N.
Так как функционал (8.8) рассматривается только при
значениях xk и uk, удовлетворяющих закону движения (8.7),
мы можем опустить в его аргументах xl9 ..., х^-ъ т· е· будем
писать 1(х°, и0, ·.·, идг-i)* Положим, что
N-1
lN-m(xN-m> · *·> uN-m-> ■ ··> uN-l)= £j f (xk> uk)^ 171 = 1, N,
k=N-m
где Xjv-m+i> ■·■> xn-i определяются согласно рекуррентным фор-
мулам (8.7).
Другими словами, I^-m — эт0 часть интегральной суммы
в представлении целевого функционала (8.8), относящаяся к
моментам времени t = кЪ, k = N-m, N-1, и вычисленная в
зависимости от состояния х^-т системы в момент времени
t = (N - т)5.
Обозначим
\^N-m (xN-m) = , т1П ^Ν-τη (xN-m> uN-m > ■ - ■ ? uN-\)-
\uN-M\<l
282
8, Метод динамического программирования
Применим описанный выше прием оптимизации от конца к
началу в рассматриваемой дискретной задаче. Согласно прин-
ципу оптимальности, управляющее воздействие и^^ должно
быть выбрано так, что
№N-1 (xN-1 ) = In-1 (xN-1 > UN-1) = , ™ш /jv_i(Xtf-i,UN_i).
\uN-i\<l
Для простоты считаем, что указанный минимум достигается
в единственной точке и значение u*N_i определено однозначно,
т. е. тем самым определена функция ttjv_i(#jv-i)·
На следующем этапе рассматриваем оптимизацию 1^-2*
захватывая два отрезка времени от (N - 2)5 до Νδ. Так как
In-2(xN-2> uN-2> uN-l) - / (xN-2> ΜΛΤ-2)δ + In-i(xN-1> uN-l)>
задача сводится к определению z/#-2> Для которого
\1Ν-2(ΧΝ-2) = Ιν-2(ΧΝ-2> uN-2> uN-l)~
= mill \f°(xN-2yUN_2)^ + lN-l(xN-U^N.1)\
\uN-2\<lL J
где Xn-i выражается через x^-2 и uN-2 согласно закону движе-
ния (8.7) при k = Ν-2, a u*N_i = Wjv-i(xat-i).
Тем самым найдено оптимальное управление на двух по-
следних отрезках времени в зависимости от того, какое состо-
яние Хм-2 получит система на момент времени (ΛΓ-2)δ.
Повторяем процедуру, последовательно добавляя частич-
ные отрезки времени. На k-м этапе нам необходимо определить
оптимальное управление u*N-k из условия
V>N-k(xN-k) = lN-k(xN-k* u*N-k> u*N-k+l> ···> uN-l) =
= min \f°(xN_k,uN_k) +
+ lN-k+l(xN-k+l* uN-k+l> ■··> uN-l)\> k = 29N9 (8.9)
где значение Хдг-fc+i выражается через x^-k и uN-k> соглас-
но (8.7), следующим образом:
UN-k+l = XN-k+f(XN-k> uN-k)§-
8.2. Уравнение Беллмана
283
Определив на последнем этапе μο(#ο)и управление и*0> мож-
но по известному начальному состоянию х0 = х° найти последо-
вательно Х\, u\j..., Хдг-1, и^_!· Значение μο(#°) минимизирует
функционал (8,8)· Соотношения (8.9) представляют собой ре-
куррентные соотношения Беллмана для данной задачи.
Приведенный алгоритм решения задачи оптимального
управления (алгоритм динамического программирования)
можно перенести на общий случай задачи оптимального
управления с векторным законом движения (8.1). При этом
на каждом шаге нужно будет искать минимум функции г пе-
ременных, зависящей от г-мерного вектора управления. Это
приводит к существенному возрастанию объема обрабатывае-
мой информации. Р. Беллман* предложил некоторые способы
преодоления подобных трудностей.
8.2. Уравнение Беллмана
Хотя метод динамического программирования ориентирован
на решение дискретных задач оптимального управления, его
идею, которая на основе принципа оптимальности дает ре-
куррентные соотношения, можно использовать при изучении
непрерывных задач. Непрерывные задачи также подчиняют-
ся принципу оптимальности. Поэтому для них можно полу-
чить уравнение, аналогичное рекуррентным соотношениям
Беллмана.
Пусть система имеет закон движения (8.1), критерий оп-
тимальности задается целевым функционалом
τ
I[x,u]=\f°(x,u)dt, (8.10)
о
где f°(x, и) — непрерывная функция по совокупности аргу-
ментов, а начальное состояние равно:
х(0) = х°. (8.11)
Время движения Τ известно, а конечное состояние х(Т) —
нет. Мы имеем задачу с фиксированным временем и свобод-
ным правым концом.
* См.: Беллман Р., Дрейфус С.
284
8. Метод динамического программирования
Пусть x*(t), t e [О, Г], — оптимальная траектория, соот-
ветствующая оптимальному управлению u*(t). Выберем не-
который момент времени τ € [О, Г] и соответствующую точку
ξ = Χ*(τ) на оптимальной траектории. Согласно принципу опти-
мальности, участок траектории x*(t) от точки ξ до точки х*(Т)
является оптимальной траекторией. Это значит, что данный
участок доставляет наименьшее значение функционалу
τ
IT[x,u] = jf°(x,u)dt
τ
среди всех допустимых процессов (x(t)9 u(t)) на отрезке вре-
мени [τ, Τ] с начальным состоянием х(т) = ξ.
Положим
т
μ(ξ, τ) = min /°(лг, u)dt.
u(t)eUJ
(x<t<T) τ
Тогда при ξ = х° и τ = 0 мы получим величину μ(#°, Ο), пред-
ставляющую собой наименьшее значение функционала (8.10).
Предположим, что для любой точки ξ фазового простран-
ства и любого момента времени те [0, Г] существует опти-
мальная траектория (т. е. доставляющая наименьшее зна-
чение функционалу 1х{х, и)) с начальным условием х(х) = ξ.
Тем самым функция μ(ξ, Τ) определена всюду на декартовом
произведении Rn x [0, Г]. Обозначив аргументы этой функ-
ции через х и t, будем называть μ(#, t) функцией Беллмана.
Согласно данному определению, функция Беллмана в точ-
ке (х, t), 0 < t < Г, равна наименьшему значению функционала
1г[х9 и] на всех допустимых процессах с начальным состоянием
x(t) = х.
Пусть (x*(t), u*(t)), 0 < t < Г, — оптимальный процесс и
оптимальная траектория x*(t) удовлетворяет начальному усло-
вию х*(0) = х°. Тогда
τ τ
μ(*°,0)= min f/°(je(i), u(t))dt= [f°(x*(t),u*(t))dt.
u(t)<=UJ J
(0<i<r) 0 0
Для произвольного момента времени τ <= [0, Τ] участок
оптимальной траектории от точки х*(т) до точки х*(Т) сам
8.2. Уравнение Беллмана
285
по себе, согласно принципу оптимальности, является опти-
мальным, т. е.
τ τ
μ(**(τ),τ)= min {f°(x(t), u(t))dt= ff°(x*(t),u*(t))dt.
u(t)eUJ J
(0<i<T) τ τ
Рассмотрим приращение Δτ и соответствующий этому прира-
щению момент времени τ + Δτ. В силу аддитивности опреде-
ленного интеграла имеем
τ
»i<«*(T),T) = Jf0(x*(i),u*(i))di =
τ
τ+Δτ Τ
= J* f0(x*(t),u*(t))dt+ f f°(x*(t)9u*(t))dt. (8.12)
τ τ+Δτ
Согласно принципу оптимальности, участок оптимальной
траектории от точки x*(z + Δτ) до точки х*(Т) сам является
оптимальной траекторией, т. е.
τ
J f°(X*(t),U*{t))dt =
τ+Δτ
Τ
= min f f°(x(t), u(t))dt = u(x*(z + Az)Jz + Az).
u(t)eU J
(τ+Δτ<«<Γ)τ+Δτ
Учитывая последнее равенство, соотношение (8.12) можно
преобразовать к виду
τ+Δτ
μ(**(τ),τ)= J f°(x*(t),u*(t))dt+\i{x*(x+Ai),T + Az). (8.13)
τ
Второе слагаемое в (8.13) зависит от состояния системы
Χ*(τ+Δτ). В это состояние, в свою очередь, система попала под
действием управления u*(t), действовавшего на интервале вре-
мени [τ, τ + Δτ]. Следовательно, значение μ(#*(τ + Δτ), τ + Δτ)
определяется выбором управления на отрезке [τ, τ + Δτ]. Что-
бы представить это, рассмотрим различные допустимые управ-
ления u(t) на отрезке [τ, τ +Δτ]. Им будет соответствовать пу-
286
8. Метод динамического программирования
ьп к
О
х*(Т)
^ Χ*(τ + Δτ)
х*(0)
х*Ю
*i
*2
Рис. 8.2
чок траекторий x(t), исходящих из точки x*(z) на оптимальной
траектории (рис· 8.2)·
На каждой траектории из этого пучка фазовая точка зай-
мет в момент времени τ +Δτ некоторое положение х{х +Δτ).
Выберем управление u(t) на отрезке [τ +Δτ, Τ] так, чтобы тра-
ектория x(t) на этом участке была оптимальной, т. е. выбран-
ное управление обеспечивало минимум функционалу
[τ+Δτ
I
[х,и]= J f°(x(t),u(t)).
(8.14)
τ+Δτ
Такой выбор управления определяет продолжение каждой
траектории рассматриваемого пучка (см. рис. 8.2). При этом
минимальные значения функционала /τ+Δτ[*> и] вдоль траек-
торий пучка различны и зависят от точки х(т + Δτ):
mm
u(t)eU
(τ+Δτ<*<Γ)τ+Δτ
J
f°(x(t), u(t))dt = μ(*(τ+Δτ),τ+Δτ)·
Положение точки х(т + Δτ) определяется выбором управления
u(t) на отрезке [τ, τ + Δτ]. Поэтому значение μ(#(τ + Δτ), τ + Δτ))
зависит от управления u(i), t e [τ, τ + Δτ].
Рассмотрим значения функционала IT[x, и] на траектори-
ях пучка, построенного выше. Учитывая, что участок каждой
траектории x(t) пучка от точки х(х + Δτ) до точки х(Т) опти-
мален, т· е. доставляет наименьшее значение функционалу
Λ+ΔτΙ>> tt]t получаем
8.2. Уравнение Беллмана
287
τ+Δτ
1Лх,и]= f f°(x(t), u(t)) Μ+μ(Χ(τ+Ατ),τ+Ατ). (8.15)
τ
Выберем минимальное из значений 1т[х, и]. Так как оба сла-
гаемых в (8.15) справа зависят только от выбора управления
u(t) на интервале [τ, τ+Δτ], то и минимальное значение 1%
определяется выбором управления на этом интервале, т. е.
/* = min Ir[x, u].
u(t)eU
(τ<*<τ+Δτ)
Построенный пучок траекторий является подмножеством бо-
лее широкого множества всех допустимых функций, на кото-
рых и находим наименьшее значение функционала /τ. Поэто-
му верно неравенство
J* > min /τ[*, u] = Ix[x\ α*] = μ(:*:*(τ),τ). (8.16)
u(t)£U
{x<t<T)
Но оптимальная траектория x*(t) содержится в пучке. Поэтому
в неравенстве (8.16) на самом деле имеет место равенство, т. е.
min Ιτ [х, и] = μ(Χ * (τ), τ),
u(t)eU
(τ<*<τ+Δτ)
откуда с учетом (8.15) получаем
μ(**(τ),τ) =
"τ+Δτ
= min
u(t)eU
(τ<£<τ+Δτ)Ι_ τ
Γ f°(x(t), α(0)^ + μ(*(τ+Δτ), τ + Δτ)
(8.17)
Заметим, что в соответствии с (8.1)
х(т + Δτ) = х(т) + #(τ)Δτ+ο(Δτ) =
= *(τ) + /(*(τ), 1*(τ))Δτ + ο(Δτ). (8.18)
Предположим, что функция Беллмана μ(#, t) непрерывно диф-
ференцируема по всем своим аргументам. Тогда, согласно
(8.18), имеем
288
8. Метод динамического программирования
μ(#(τ+Δτ), τ + Δτ) = μ(*(τ), τ) +
αμ
+ У
Ι(*(τ),τ)
Введем обозначение
Γ(*(τ),α(τ))Δτ+^
dt
(*(τ),τ)
Δτ+ο(Δτ). (8.19)
(grad^fl^jM^/*
.=1 ax,
и перепишем (8.19) в виде
μ(#(τ + Δτ), τ+Δτ) = μ(#(τ),τ) +
+ HHWt),t)./(**(T),«(T)))AT + f|
(*<τ),τ)
Δτ+ο(Δτ).
Учитывая последнее соотношение, а также то, что для траек-
торий x(t) пучка имеет место равенство х(х) = х*(т), перепишем
равенство (8.17) в виде
~τ+Δτ
Г f°(x(t),u(t))dt +
μ(**(τ),τ) = min
u(t)eU
(τ<£<τ+Δτ)|_ τ
+ μ(Χ*(τ),τ) + ^τ!Ιαμ\(Χ4τ)τ), f(x*(x), »(τ)))Δτ-
3μ|
dt
Δτ+ο(Δτ)
(**(τ),τ)
(8.20)
Согласно определению, функция μ(#*(τ),τ) получена в ре-
зультате минимизации функционала Iz[x, и] по всем допусти-
мым управлениям u(i), te[x,T], т. е. эта функция уже не
зависит от и. Поэтому слагаемые μ(#*(τ),τ) и — (#*(τ),τ) в
dt
правой части равенства (8.20) можно вынести за знак мини-
мума. После сокращений получим
Γτ+Δτ
Δτ = min
Ι(*"(τ),τ) *1**υ τ
(T<i<T+Ax)L τ
3μ
~dt
TiXl
J* f°(x(t),u(t))dt
+ (grad^(T)T), f(x*(x), α(τ)))Δτ+ο(Δτ)
8.2. Уравнение Беллмана
289
Предположим, что u(t) непрерывна на отрезке [τ, τ+Δτ].
Тогда, разделив это равенство на Δτ и перейдя к пределу при
л л/ ν °(Δτ)
Δτ -> О (при этом lim —-—-
Δτ->0 Δτ
мана
= О), приходим к уравнению Белл-
3μ
э7
(**(τ),τ)
min
u(t)eU
/0(**(τ),Μ(τ))+£|Μ_
i-l l
f(x*(T),u(x))
(**(τ),τ)
(8.21)
или
-|± = mm [/°(*(τ), w(x)) + (grad^ /(*(τ), u(t)))], (8.22)
где для удобства оптимальная траектория обозначена просто x(i).
К уравнению Беллмана можно добавить краевые условия
μ(*,Γ) = 0,
(8.23)
вытекающие непосредственно из определения функции Белл-
мана.
Функция μ (я, t) в данном случае играет ту же роль, что и
функция \iN-m(xN-m) в дискретном варианте динамического
программирования, а уравнение Беллмана аналогично рекур-
рентным соотношениям Беллмана·
Уравнение Беллмана представляет собой дифференциаль-
ное уравнение в частных производных относительно функции
μ (я, i). Но это уравнение не является линейным из-за наличия
в выражении (8.22) операции минимизации. Эта операция
фактически означает подстановку в уравнение значения и*, на
котором достигается минимум и которое меняется в зависи-
мости от значений х и grac^, т. е. фактически является нели-
нейной функцией этих переменных.
Уравнение Беллмана можно использовать для решения
задачи (8.1), (8.10), (8Л1) следующим образом. Если сделан-
ные выше преположения выполняются и μ*(Ι, i) — решение
задачи (8.22), (8.23), то сразу же получаем наименьшее зна-
чение целевого функционала (оно равно μ*(#°, 0)). Чтобы
290
8. Метод динамического программирования
найти оптимальную траекторию, нужно определить опти-
мальное управление и* как функцию текущего положения и
градиента greidμ*: « = «(*, gradμ*). В результате из закона
движения при и = й(х, gradμ*) с начальными условиями
х(0) = х° мы получаем задачу Коши, решением которой и бу-
дет оптимальная траектория. Зная оптимальную траекторию,
мы уже можем найти оптимальное управление как функцию
времени: u*(t) = u(x*(t)9 gra.dμ*(x(t)9(t)).
Рассмотрим другую задачу, а именно добавим к условиям
(8.1), (8.10), (8.11) условие закрепления на правом конце
х(Т) = хт, (8.24)
где значение хт задано, а Т заранее не известно.
В этом случае функция Беллмана зависит только от теку-
щего состояния х: μ = μ(#)· Действительно, по определению
τ
\*x,x] = ff°(x*(t)9u*(t))dt.
τ
Но, согласно свойствам автономного процесса, значение ин-
теграла
τ
jf°(x4t), u*(t))dt
τ
при фиксированных x*(t)n u*(i) зависит только от длины
Τ-τ интервала интегрирования, который можно определить
из автономной системы (8.1), зная точки л:* =#*(τ) и х*(Т) на
траектории. Значит, Τ-τ есть функция от этих двух точек, а
μ явно не зависит от i. Для задачи (8.1), (8.10), (8.11), (8.24)
с помощью аналогичных рассуждений можно получить урав-
нение Беллмана, которое в этом случае имеет вид
min Γ/°(*(τ), ufr)) + (gr^, f(x(z), α(τ)))1 = 0.
Практическая реализация предложенного метода натал-
кивается на определенные трудности. Например, вид правой
части уравнения Беллмана нельзя назвать простым, так как
туда входит операция взятия минимума. Но самая главная
трудность состоит в том, что функция μ(#, t) может не быть
всюду дифференцируемой (например, для линейных систем
8.2. Уравнение Беллмана
291
дифференцируемость нарушается в точках, принадлежащих
линии переключения). Однако дифференцируемость функции
Беллмана — одно из предположений, на которые опирался вы-
вод уравнения Беллмана·
Пример 8.2. Рассмотрим задачу оптимальной одноосной
стабилизации космического аппарата с помощью маховика*.
Пусть космический аппарат, управляемый гироскопом-ма-
ховиком, имеет одну степень свободы, связанную с угловым
движением аппарата вокруг неподвижной оси, проходящей
через его центр масс. Обозначим через φ угол отклонения ап-
парата от заданного направления, а через ω угловую скорость
вращения маховика относительно аппарата. Тогда при опре-
деленных допущениях движение системы космический аппа-
рат — маховик относительно неподвижной оси можно описать
системой уравнений
(/ +/„)Ф+/Мш = 0; (g25)
/м (ω+φ) = -ттг,
где /а, JM — моменты инерции соответственно аппарата и
маховика относительно неподвижной оси; т — момент дви-
гателя маховика.
К системе (8.25) следует добавить уравнение электриче-
ского двигателя маховика. Если это двигатель постоянного
тока, то при некоторых допущениях момент т, развиваемый
двигателем, может быть выражен уравнением
m = k(u + to), (8.26)
где k и I — постоянные, характеризующие данный двигатель;
и — управляющее напряжение.
Будем считать, что на управление и нет никаких ограни-
чений.
Система (8.25) совместно с уравнением (8.26) приводится
к уравнению
IJp-k{u-c(^).
Коэффициент с определяется из условия, что момент количе-
ства движения всей системы космический аппарат — маховик
равен нулю:
(7а+7м)ф + /мсо = 0.
* См.: 8.5, а также: ЛетовАМ.
292
8. Метод динамического программирования
Отсюда
Ia+IM. л Ia+IM
Введя фазовые переменные х1 = φ, #2 = ф, получим стан-
дартную форму уравнений движения:
Ι >ν* —— ·ν* ■
Г"12· . (8.27)
kc , /e
где а = ; & = —.
II
Зададим начальное состояние системы л:(0) = #0. В качест-
ве целевого функционала выберем
1[х9и]= Г (o^xf +а2х1+&и2)аи (8.28)
о
где al5 α2, β — некоторые положительные постоянные.
Рассмотрим задачу нахождения управления, переводяще-
го систему из начального состояния х° в конечное ;е(°°) = 0 и
доставляющего минимум целевому функционалу (8.28). Сфор-
мулированная задача — один из вариантов задачи оптималь-
ной стабилизации (см· 8.5).
Эту задачу можно интерпретировать как задачу с фикси-
рованными концами и фиксированным временем процесса
Т = «\ Задача автономна, и функция Беллмана зависит только
от состояния х. Уравнение Беллмана в данном случае имеет
вид
( з., з,. Л
mm
и
агх1 + а2х2 +$и2 +—— х2 +—— (ах2 +Ьи)
dxi дх2
= 0. (8.29)
Поскольку на управление и нет ограничений, для определения
значения й, при котором достигается указанный минимум,
приравняем нулю производную по и выражения в скобках.
Получим
2β дх2
8.2. Уравнение Беллмана
293
Подставив найденную функцию в уравнение (8.29), получим
нелинейное уравнение в частных производных первого по-
рядка:
(X\X-t + (Х2Хо "^ ^2
θμ
θμ b2
(
+ ах2—■
dxi дх2 4β
θμ
дхо
У
= 0.
(8.31)
Краевые условия для функции Беллмана μ(#(οο)) = 0 с учетом
конечного состояния х(<=*>) = 0 принимают вид μ(0) = 0, Решение
будем искать в виде квадратичной формы
Мл^19 %2 ) ~ АХ л + ЛИХ\Х2 "Ь у-уХо
(8.32)
с неизвестными коэффициентами.
Подставим (8.32) в дифференциальное уравнение (8.31) и,
пользуясь независимостью переменных х1? х2, приравняем
нулю коэффициенты при различных произведениях перемен-
ных. Из системы трех уравнений с тремя неизвестными А, Б, С
получим
_ ф + ^αψ +Ъ2$а2+2Ъ$4щ$
Если теперь для найденной функции μ вычислить
и
воспользоваться формулой (8.30), то мы получим явное выра-
жение для оптимального управления:
и =·
\>-
lei+»!2t+a.a.
а
— + ■
Ь
β
β
Х2.
Оптимальное управление найдено в зависимости от фа-
зовых координат, т. е. решена задача синтеза. Отметим, что
синтезирующая функция линейна.
294
8. Метод динамического программирования
8.3. Уравнение Беллмана в задаче быстродействия
Рассмотрим задачу оптимального быстродействия с законом
движения
x = f(x, и), ueU, (8.33)
начальным состоянием х(0) = х1 и конечным состоянием х(Т) =
= х\
Для этой задачи с фиксированными концами и свободным
временем Τ процесса функция Беллмана зависит только от
текущего состояния: μ = \i(x). Если допустить, что выполнены
оба предположения (см. 8.2) о функции μ, то необходимое
условие оптимальности сведется к уравнению Беллмана
min (l + (gradμ, f(x, и))) = О,
ИЛИ
min (gradμ, f(x, и)) = -1. (8.34)
ueU v
Краевое условие имеет вид μ(#2) = 0·
Очевидно, что если (x*(t), u*(t)) — оптимальный процесс с
временем Т, то на отрезке [О, Т] выполняется тождество
(gradii(*4*)). /(**(*), *·(*))) = -!. (8.35)
Функция μ(#) имеет в этом случае простой смысл: ее зна-
чение в точке х равно времени оптимального по быстродейст-
вию перехода фазовой точки из положения х в фиксированное
положение х2. Наглядную геометрическую интерпретацию
допускает и уравнение Беллмана. Пусть объект находится в
состоянии х. Рассмотрим в фазовом пространстве поверхность
уровня μ(:τ) = μ(£) = const, проходящую через точку х. Эта по-
верхность представляет собой множество всех точек, из кото-
рых фазовая точка переходит в точку х2 за одно и то же время
μ(#). Из соотношения (8.34) следует, что
max ί-gradμ(i), f(x7 и) ] = -1.
ueU
8.3. Уравнение Беллмана в задаче быстродействия
295
Воспользуемся тем, что максимум в левой части равенства
достигается при значении и = и* оптимального управления,
соответствующем состоянию х. Это означает, что «оптималь-
ный вектор фазовой скорости» f(x, ц,*) образует с вектором
-grad^(i) острый угол (оптимальный вектор направлен в
сторону убывания функции μ). Другими словами, фазовая
точка x(t) на оптимальной траектории перемещается в сто-
рону поверхности уровня функции μ с меньшим временем
перехода μ (я).
Отметим, что минимизация по и выражения в левой части
(8.34) позволяет определить оптимальное управление и* как
функцию от grac^· При подстановке указанного значения и*
в тождество (8.35) получим не содержащее и уравнение в част-
ных производных первого порядка. Решение этого уравнения
должно удовлетворять краевому условию μ(#2) = 0. Если это
решение удастся найти, то будет решена задача синтеза, так
как будет найдена синтезирующая функция, или, другими
словами, оптимальное управление как функция фазовых ко-
ординат и = и*(х). К сожалению, получить решение уравнения
(8.35) удается лишь в простейших случаях.
Пример 8.3. Рассмотрим задачу оптимального быстродей-
ствия с законом движения
\Х\ — Х2 »
[х2 = и,
с ограничением | и \ < 1 на скалярное управление u(t), с пере-
ходом из начального состояния jc = (x1? х2У в начало коорди-
нат (см. 7.5).
В этом случае уравнение Беллмана имеет вид
mm
|u|<i
да да
-х2 +—!—и
. дхл дх^ .
V 1 * J
= -1, (8.36)
а краевое условие таково:
μ(0,0) = 0. (8.37)
Предположим, что функция μ непрерывна и имеет непре-
рывные частные производные по Χγ и х2. Поскольку из поста-
новки задачи выполнение этих условий не следует, дальней-
шее решение носит эвристический характер.
296
8. Метод динамического программирования
Из уравнения (8.36) вытекает, что оптимальным является
управление
* . 3μ
и =-sign-
дх?
Учтем это в уравнении Беллмана:
(8.38)
9μ
dxi
%2
3μ
dx?
+ 1 = 0.
(8.39)
Согласно (8.38), оптимальное управление и* может при-
нимать значения 1 и -1. Рассмотрим на фазовой плоскости
область L_l5 в которой и* = -1, и область Ll5 в которой и* = 1.
В области L_! уравнение (8.39) имеет вид
9μ 9μ
dxi
%2
дх?
+ 1 = 0,
(8.40)
а в области Lx —
3^2+i!L+1=o.
dxi
дх<>
(8.41)
Решение неоднородного уравнения (8.40) будем искать в
неявном виде ν(μ9 хъ х2) = 0 [VIII]. Используя правило диф-
ференцирования неявно заданной функции [V], находим
9μ _ дхг
θμ
дхх
э^' дх2
3μ
дУ
дх2
~W
9μ
Подставляя эти выражения в уравнение (8.40), получаем
dv dv э^=0
dxi дх2 θμ
Записываем уравнение характеристик [VIII]:
иХ\ их2
х2
-1
αμ
(8.42)
8.3. Уравнение Беллмана в задаче быстродействия
297
Отсюда, решая уравнение с разделяющимися переменными
иХ 2 (ХХ\
-1 #2
находим уравнение для оптимальных фазовых кривых в об-
ласти L_! (т. е. при и* = -1):
2 у~1
Хл Η = Ci ,
2
(8.43)
где С\ — постоянная интегрирования.
Это уравнение дает первый интеграл системы (8.42):
<Pl(*l>*2) = *l+-|-·
Несложно найти еще один первый интеграл, так как в этой
системе еще одно уравнение имеет разделяющиеся переменные:
ФгС^ъ Х2) — \^~х2*
Зная два первых интеграла, мы можем записать общее реше-
ние уравнения в частных производных:
(
Φ
•V'
2\
= 0,
где Ф((р1, φ2) — произвольная непрерывно дифференцируемая
функция·
Предположим, что уравнение Φ(φ!,φ2) = 0 можно разре-
шить относительно первого аргумента в виде <$х =Η(φ2). Тог-
да мы можем записать
μ = Χ2+Η
(
х
2\
Хл +—-
2
V
(8.44)
Это выражение для функции Беллмана в области L_le
Аналогично рассматривается ситуация в области L1§ Мы
получаем уравнение оптимальных фазовых кривых
Хл
Xi —- = с2 - const
(8.45)
298
8, Метод динамического программирования
и выражение для функции Беллмана в виде
μ = -Χ2+Θ
2\
X
-Xi+ —
2
(8.46)
Формулы (8.44) и (8.46) дают лишь представление о струк-
туре решения уравнения Беллмана, так как в них входит
неизвестная функция. Но, зная уравнения (8.43), (8.45) для
оптимальных фазовых кривых, мы можем найти и функцию
Беллмана. Для этого на плоскости х^Ох2 строим оптимальную
траекторию, составляя ее из дуг двух парабол из семейств
(8.43), (8.45), как это делалось ранее (см. 7.5). Построенная
траектория должна соединять
начальную точку х с началом
координат (рис. 8.3). Теперь
можно вычислить время дви-
жения вдоль построенной оп-
тимальной траектории и полу-
чить конкретный вид функции
Беллмана (см. задачу 7.6). Для
точки х выше линии переклю-
чения АОВ имеем
Рис. 8.3
xi
μ(#1, Х2)-%\\х\ +~г~ + х2>
(8.47)
а для точки х ниже линии переключения
μ(Χ\, x2)-2J-Xi + — -х2.
(8.48)
Функции (8.47) и (8.48) являются решениями уравнений
(8.40) и (8.41) соответственно.
Покажем, что ни в одной точке линии переключения АОВ
функция Беллмана \х(хи х2) не имеет частных производных.
Возьмем на дуге ОА произвольную точку С(х^, х|), т· е·
х{ - — (х2)2· Так как функция μ выше линии АОВ (или правее,
что то же самое) задается формулой (8.47), то для вычисления
правосторонней производной по Х\ мы должны использовать
именно эту формулу:
8.4. Связь метода динамического программирования с принципом... 299
3μ с сч_ 1 1
\Хл I U, Хо / — I — *
А левосторонняя производная вычисляется с использованием
представления (8.48). Но при этом
(хс) I
\i{x\, #2) = 2J-:ri+— х\ =2^х{-Х\ -х%9
и мы видим, что левосторонней конечной производной в точ-
ке Xi ~х\ не существует, так как функция у~\х не диффе-
ренцируема в точке 0· Можно так же показать, что частная
производная по х2 имеет в точках линии переключения ана-
логичный разрыв.
Приведенный пример демонстрирует, что условия Беллма-
на о существовании у функции Беллмана непрерывных част-
ных производных нарушаются даже в простейших ситуаци-
ях. Поэтому вопрос о применимости метода динамического
программирования к задачам оптимального управления с
ограничениями на управление требует дополнительного обо-
снования.
8.4· Связь метода динамического программирования
с принципом максимума
В 8.2 уравнение Беллмана получено как необходимое условие
оптимальности управления и, значит, в определенном смысле
перекликается с принципом максимума. Покажем, каким
образом на основе метода динамического программирования
можно получить условия принципа максимума.
Рассмотрим задачу оптимального управления с законом
движения (8.1), целевым функционалом (8.10), фиксирован-
ными начальным (8.11) и конечным (8.24) состояниями. Вре-
мя Τ процесса считаем неизвестным· В качестве вектора u(t)
управлений выбираем кусочно-непрерывные вектор-функции
со значениями из области управления U е Rr, являющейся
замкнутым выпуклым множеством·
300
8. Метод динамического программирования
Согласно принципу динамического управления Беллмана,
для оптимального процесса (x*(t), u*(f)) найдется такое реше-
ние μ(#) уравнения Беллмана
mm
u(x)eU
f0ix9u) + %j^f *(*>*)
■ 1 Эх,
i-l l
= 0,
(8.49)
что α*(£) = ω(#*(£), £гаац(**(£))), где u(je,grac^) — значение,
при котором достигается минимум. Покажем, что из уравне-
ния (8,49) следует существование некоторого вектора Ψ, ко-
торый удовлетворяет соотношениям принципа максимума.
Пусть μ(#) — функция Беллмана, которая соответствует
оптимальному процессу (x*(t)9 u*(i))- Введем следующие
обозначения:
Используя эти обозначения, преобразуем уравнение Беллмана:
Эр,(л·)
( η ^,~ч Л
mm
ueU
г=0
dxi
fl(x,u)
= 0,
J
или с учетом очевидного тождества -mini1 = max(-i*'):
( η ^ Л
mm
ueU
Ση д\к(х) п
г=0 *
fl(x,u)
V
= 0.
(8.50)
Отметим, что функции fl(x,u) не зависят от х0. Введем
обозначения
θμ
¥г =
Полагая
дх^
, i = 0,n.
(8.51)
Я (Ψ, ж, α) = ]£ψ„/α(*, и) = (ψ,/ (ж, и)),
α=0
где Ψ = (ψ0,ψ1,...,ψΛ)τ; f = (f°,f19.:,fny9 можно записать
уравнение Беллмана в следующем виде:
max (Ψ, f) = max#(Y, я, и) = 0.
ueU ueU
8.4. Связь метода динамического программирования с принципом... 301
Введенные нами сопряженные переменные ψ^ и функция
Понтрягина Η (ср. с (7.7)) получены пока чисто формальным
преобразованием из уравнения Беллмана. Покажем, что Ψ
удовлетворяет сопряженной системе
d\\fi дН
dt
dxt
i = 0, п.
(8.52)
Потребуем, чтобы функция Беллмана μ(κ) имела непрерыв-
ные производные второго порядка. Тогда функция
g(x9u) = ^\-^(x)f(x9u)
i=<H
(8.53)
имеет непрерывные производные первого порядка.
Оказывается, что для оптимального процесса (x(t), u(t))
при фиксированном t е [0, Τ] функция g(x, u(t)) переменного
х достигает в точке x = x(t) максимального значения, равно-
го нулю. Это следует из уравнения Беллмана (8.50). При этом
под равенством х = x(t) мы понимаем выполнение двух соот-
ношений:
х = x(t), х0 = I*/°(л:(0, u(t))dt.
Так как функция g(x, u(t)) достигает максимума в точке x(t),
то
dg(x, u)\
Учитывая, что
u=u(t)
= 0, fe = 0, n, tt[Q, Γ].
dg
-Σ
dxk i=0
32μ f3 3/'
dxtdxk ' dxi dxk
из (8.54) получаем соотношение
д2№)л, Л Ь( 3μ(*)ν/'(*,»)
k = 0,n,
Σ-^Μ-Σ
i=0^
dXidx
i=0
dxi
(8.54)
dxk
, k = 0,n, (8.55)
которое выполняется на оптимальном процессе (x(t), u(t)).
302
8. Метод динамического программирования
Так как
d_
dt
(
ЭД
2л \
θ*μ
V
дх
i=(H
dXidxk
i=0
92μ
dxtdxk
Л
fix, u),
то соотношение (8.55) преобразуется к виду
/
dt
ν
dxi
\-Σ-1
или с учетом обозначений (8.51)
эг
Эх/
k = 0,n9
<2ψ
Э/'
—- = -Τ Ψ* -^—, k = 0,n.
dt f^ dxk
Итак,
dy\fk _ dH
dt dxk
k = 0,n.
Уравнения (8.52) были получены в предположении, что
функция Беллмана μ имеет непрерывные производные второго
порядка. Это, конечно, не всегда так· Поэтому проведенные
рассуждения носят иллюстративный характер и не могут все-
рьез рассматриваться как обоснования принципа максимума.
Скорее они говорят о том, что принцип максимума и принцип
динамического программирования имеют пересекающиеся
«сферы влияния». При отсутствии ограничений на управле-
ние, когда все функции являются гладкими, оба принципа ра-
ботают. Но каждый принцип имеет область, в которой сопер-
ник конкурировать не может: уравнение Беллмана получено
при дополнительных предположениях, а принцип максимума
хуже приспособлен для решения задач дискретного характера.
8.5. Оптимальная стабилизация
Пусть для исходной системы
y = f(t, у, и)
(8.56)
при заданном управлении и = u(t) и заданном начальном усло-
вии jKfi)^1 построена траектория # = (p(i)> т. е. решена со-
8,5. Оптимальная стабилизация
303
ответствующая задача Коши. Такое движение назовем невоз-
мущенным движением. Рассмотрим еще одно управление
u = v(t) и соответствующую этому управлению траекторию
y = \y(t), которую назовем возмущенным движением.
Задача стабилизации невозмущенного движения у = cp(i)
состоит в выборе такой поправки Au(t) = v(t)-u(t), при которой
движение \|f(i) устойчиво.
Положим #(£) = ψ(0~ψ(0 и вместе с u(t) подставим в урав-
нения движения (8.56):
# = \j/-<p = f(£, φ + x, u + Au)-f(t, φ, и).
Считая траекторию cp(i) и управление u(t) фиксированными,
получаем уравнения
х = F(i, х, Аи), (8.57)
которые называют уравнениями возмущенного движения.
Предположим, что выполняются следующие условия:
1) все компоненты вектора состояния х в любой момент
времени известны;
2) по траектории x(t) можно восстановить вектор управле-
ния Au(t), который можно рассматривать как функцию време-
ни и текущего состояния Au(t,x);
3) управление Au(t,x) должно обеспечивать асимптотиче-
скую устойчивость невозмущенного движения x(t) = 0;
4) Au(t9 0) ^ 0;
5) вектор-функция u(£, x) определена и непрерывна в обла-
сти D: t > 0, |#;-| < L, j = 1, Пу где х = (хъ х2,..., хп)\
6) правые части уравнений (8.57) удовлетворяют условиям
теоремы Коши о существовании и единственности решения сис-
темы ОДУ [VIII] при любых начальных условиях в области D;
7) на вектор управления и нет ограничений, т. е. его ком-
поненты могут принимать любые сколь угодно большие зна-
чения, вектор-функция F(t, x, и) определена при любом зна-
чении и.
Задача оптимальной стабилизации невозмущенного
движения состоит в следующем. Пусть выбран критерий ка-
чества стабилизации, который может отражать такие требо-
вания к процессу стабилизации, как его монотонность, мини-
мизация объема используемых ресурсов и т. п. Этот критерий
будем представлять как некоторый функционал вида
304
8. Метод динамического программирования
I[x, Аи] = J F°(t9 x9 Au)dt. (8.58)
Требуется найти такое управление Au = u*(i, х)9 которое обес-
печивает асимптотическую устойчивость невозмущенного дви-
жения x(t) ξ 0 в силу уравнения
х = F(t, х, Au(i, x))
и которое среди всех управлений, также обеспечивающих
асимптотическую устойчивость невозмущенного движения,
придает целевому функционалу (8-58) наименьшее значение.
Следовательно, для любого управления Au(i,je), решающего
задачу стабилизации, неравенство
1[х\Аи*]<1[х,Аи] (8.59)
выполняется при любых начальных условиях из области
A = {(t9xl9...9xn): t>0, \xj\<e9j = l9n}9
где x*(t) и x(t) — траектории системы при заданных началь-
ных условиях и управлениях Аи* и Аи соответственно.
Начальные условия x(ti) = x1 играют роль начального воз-
мущения, а асимптотическая устойчивость означает, что на-
чальное возмущение в процессе движения компенсируется за
счет управления. Если неравенство (8.59) выполняется при
любых, необязательно малых, начальных возмущениях, то
говорят об оптимальной стабилизации в целом.
Задача оптимальной стабилизации — это задача оптималь-
ного управления для системы с законом движения (8.57), це-
левым функционалом (8.58), фиксированным временем про-
цесса Τ = ©о, фиксированным левым концом x(ti) = xl и фик-
сированным правым концом х(°о) = 0. Ее можно полностью
решить в случае, когда управление скалярно (и = и е R), урав-
нения возмущенного движения являются линейными авто-
номными, т. е. имеют вид х~Ах + ВАи (матрицы А, В посто-
янны), а интегрант целевого функционала F°(t9 x9 Аи) есть
квадратичная форма с постоянной симметрической матрицей
N и константой q:
F° (t9 х9 Аи) = xTNx + q(Au)2.
8,5. Оптимальная стабилизация
305
Решение задачи в этом частном случае составляет основное
содержание метода аналитического конструирования регуля-
тора*. Оно строится с помощью метода динамического про-
граммирования Беллмана.
Так как эта задача представляет собой автономную задачу
оптимального управления с фиксированными концами, функ-
ция Беллмана зависит только от фазовых координат: μ = μ(Χ).
Уравнение Беллмана в данном случае имеет вид
ттГ*т^* + дАы2+(£гас1ц, Ах + ВАи)] = 0. (8.60)
Здесь оно используется как достаточное условие оптималь-
ности**. Из уравнения (8.60) получаем управление Аи*, достав-
ляющее минимум левой части:
Ди* = - —(grad^ Б). (8.61)
2q
Подставив найденное управление Аи* в уравнение (8.60),
имеем нелинейное уравнение в частных производных первого
порядка относительно функции Беллмана μ(#)
*TiV* + (grad^ Ax) (grad^ В)2 =0 (8.62)
4q
с краевым условием
μ(*(οο)) = μ(0) = 0.
Решение уравнения (8.62) следует искать в виде квадра-
тичной формы μ(Χ) = ΧΥΡΧ с неизвестной симметрической
матрицей Ρ порядка η (неизвестных элементов п(п +1)/2).
Подставив это представление в уравнение, получим
1 Λ
Χτ
Ν + 2ΡΑ— ΡΒΒτΡ
x = 0,
•k-k-k
откуда вытекает матричное уравнение
N + 2PA--PBBTP = Q.
* См.: ЛетовАМ.
*w По поводу обоснования уравнения Беллмана как необходимого и
достаточного условия оптимальности см.: Болтянский ВТ. (1964 г.)
Уравнение такого типа в литературе называют матричным уравне-
нием Риккати.
306
8. Метод динамического программирования
Решив это матричное уравнение, мы можем найти функцию
Беллмана, а затем управление Аи* как функцию фазовых
координат:
Аи*=--ВтРх.
Я
Таким образом, метод аналитического конструирования
позволяет решить задачу синтеза, при этом синтезирующая
функция линейна.
Приведенный пример использования уравнения Беллма-
на — один из немногих, так как решить его удается редко.
В этой связи упомянем линейные автономные системы с кри-
терием обобщенной работы*.
Вопросы и задачи
8.1. Используя метод динамического программирования,
решите задачу оптимального быстродействия
х = ах + иу x(ti) = xl7 x(t2) = 0, |м|<1.
8.2. Составьте уравнение Беллмана в задачах оптимально-
го управления а) и б). Учитывая вид области управления £/,
запишите соответствующее уравнение в частных производных
для функции Беллмана (х\, х\, Τ заданы).
τ
Х\ — ИХ\ + Х2 \
Х2 = U ,
Хг(0) = Х{,
а) /°(t, xly x2)dt ^min,
о
х2 (0) = %2'
Τ г .
Г л / \ Х\ — ^\Х\ "г %2 > 1
б) / (i, Xu x2)di^>min, <. Xi(Q) = x},
J V 7 [X2=U2,
x2(0) = xl, | z/i | < 1, \u2\<l.
8.3. Составьте уравнение Беллмана для линейной задачи
оптимального быстродействия с законом движения (7.30) и об-
ластью управления U вида (7.37). Запишите соответствующее
уравнение в частных производных для функции Беллмана.
* См.: КрасовскийАЛ.
ЧАСТЬ III
Прямые методы
вариационного
исчисления
.„Часто бывает очень трудно найти выражение,
которое было бы максимумом или минимумом.
Леонард Эйлер
9. ФОРМУЛИРОВКА ВАРИАЦИОННЫХ ЗАДАЧ
Первые две части книги посвящены изучению задач, связан-
ных с поиском экстремума функционала, определенного на
некотором множестве функций. Как мы видели, во многих
случаях решение такой задачи сводится к решению системы
ОДУ или уравнений в частных производных. Систему диф-
ференциальных уравнений можно рассматривать как опера-
торное уравнение. Таким образом, задача поиска экстрему-
ма функционала сводится (при определенных ограничениях)
к решению некоторого операторного уравнения. Это анало-
гично тому, что задача поиска минимума функции многих
переменных с помощью необходимого условия экстремума
может быть сведена к задаче решения системы нелинейных
уравнений.
Однако есть и обратная задача: решение системы диффе-
ренциальных уравнений заменить решением некоторой вари-
ационной проблемы.
Построение математических моделей на основе вариацион-
ных задач в современной науке используется весьма широко.
Это объясняется тем обстоятельством, что многие фундамен-
тальные принципы в самых различных предметных облас-
тях наиболее естественно формулируются как вариационные
принципы. Достаточно в этой связи упомянуть закон сохра-
нения энергии, который сформулирован как равенство нулю
вариации функционала энергии системы.
Сведение вариационной задачи (т. е. задачи поиска либо
точек экстремума функционала, либо его стационарных точек)
к операторному уравнению — далеко не всегда хороший спо-
соб решения задачи. Это обстоятельство привело к разработке
ряда методов, в которых решение вариационной задачи можно
найти без использования систем дифференциальных уравне-
310
9. Формулировка вариационных задач
ний. Такие методы решения вариационных задач называют
прямыми методами. Эти методы, как правило, сводятся к
построению последовательности приближений к точному ре-
шению задачи, а каждое приближение находится как решение
системы функциональных уравнений, в которую не входят
производные неизвестных функций· Зачастую система функ-
циональных уравнений представляет собой систему линейных
алгебраических уравнений (СЛАУ), а решение СЛАУ найти
существенно проще, чем решение операторного уравнения.
9.1. Операторное уравнение
Любое отображение A: D(A) —> R(A) из некоторого множества
D(A) функций в некоторое множество R(A) функций называют
оператором.
Во многих случаях в качестве математической модели
исследуемого объекта, описываемого векторной функцией и,
можно рассматривать уравнение вида
A(u) = f, ueD(A), (9.1)
содержащее оператор А с некоторой областью определения
D(A). Этот оператор отражает свойства объекта и действует на
искомую функцию и (вообще говоря, векторную) и заданную
функцию / (в общем случае тоже векторную), характеризую-
щую внешнее воздействие на этот объект.
Мы ограничимся случаем, когда область определения D(A)
оператора А является подмножеством некоторого линейного
пространства. Линейное пространство, как правило беско-
нечномерное, элементами которого являются функции, часто
называют функциональным пространством. Функциональ-
ное пространство наделяют какой-либо структурой, позволя-
ющей оперировать с понятием непрерывности. В частности,
функциональное пространство может быть нормированным
(определена норма) или евклидовым (задано скалярное про-
изведение). Евклидово пространство можно рассматривать
как частный случай нормированного пространства, поскольку
скалярное произведение естественным образом индуцирует
норму, называемую евклидовой нормой. В нормированных
пространствах можно рассматривать сходящиеся последова-
9.1. Операторное уравнение
311
тельности [IX]. Критерий Коши верен не для всякого норми-
рованного пространства, т. е. в нормированном пространстве
могут существовать фундаментальные последовательности,
не имеющие предела. Если в данном нормированном (евкли-
довом с евклидовой нормой) пространстве любая фундамен-
тальная последовательность сходится, то такое пространство
называют полным. Полное бесконечномерное евклидово про-
странство традиционно называют гильбертовым*.
Пример 9.1. Множество Ι*2(Ω) функций, суммируемых
с квадратом на измеримом множестве Ω с W1, представляет
собой гильбертово пространство со скалярным произведением
(f,g) = jf(x)g(x)dx. (9.2)
Ω
Элементами этого пространства являются функции /: Ω —> R,
для которых конечен интеграл Лебега
\\f\f = j\f(xf dx (9.3)
Ω
(в скалярном произведении также предполагается интеграл
Лебега). Интеграл (9.3) определяет евклидову норму ||/|| = ||/||2
в этом пространстве, сходимость по которой называют сходи-
мостью в среднем квадратичном.
Пример 9.2, Рассмотрим множество L2(Q σ) функций /:
Ω —» R, определенных на измеримом множестве Ω € IRn, для
которых конечен интеграл Лебега
\\f\ko=i\f(*f°Wx,
Ω
где σ — неотрицательная измеримая на Ω функция.
* Давид Гильберт (1862-1943) — великий немецкий математик, ока-
завший большое влияние на развитие современной математики. Внес
значительный вклад в развитие как функционального анализа, так и
вариационного исчисления. Положил начало развитию прямых методов
в вариационном исчислении.
312
9. Формулировка вариационных задач
Это множество представляет собой гильбертово пространст-
во функций, интегрируемых с квадратом и весом σ. Скалярное
произведение в этом пространстве имеет вид
(f,g) = jf(x)g(x)o(x)dx. (9.4)
Ω
Отметим, что в функциональных пространствах, в которых
скалярное произведение вводится с помощью интеграла Лебега,
считают равными любые функции fug, для которых множе-
ство {хе Rn : f(x) Φ g(x)} есть множество (лебеговой) меры нуль.
Это гарантирует выполнение аксиомы скалярного произведе-
ния (и, соответственно, нормы), согласно которой (/, /) = 0 толь-
ко для нулевого элемента линейного пространства.
Пример 9.3· Гильбертовым также является линейное про-
странство U^ (Ω) векторных функций /: Ω —» Mm, Ω cz W1, для
которых конечен интеграл
V\f=\(№,f(x))dx.
Ω
Здесь (х, у) обозначает стандартное скалярное произведение
векторов х и у яг-мерного евклидова арифметического про-
странства. Скалярное произведение в L^(Q) определяется
формулой
V>g) = \(fix),g(x))dX' #
Ω
Если бесконечномерное нормированное пространство С не
является полным, то его можно пополнить, т. е. построить такое
полное нормированное пространство С, которое включает в
себя нормированное пространство £, причем С является мно-
жеством, всюду плотным в С . Расширение нормированного
(евклидова) пространства С до полного С называют пополне-
нием нормированного (евклидова) пространства С.
Пример 9.4. Рассмотрим линейное пространство С[а, Ь]
функций, непрерывных на отрезке [а, Ь]. Введем в этом про-
странстве скалярное произведение согласно формуле
9.1. Операторное уравнение
313
о
(f,g) = j(№,g{x))dx.
(9.5)
Получим евклидово пространство [IV]. Однако это простран-
ство не является полным, и потому оно не гильбертово. Дей-
ствительно, рассмотрим последовательность функций
<?п(х) =
-1, -1<х<—;
η
1 1
пх, <х< —;
η η
1, -<х<1.
η
Эта функциональная последовательность сходится на отрезке
[-1, 1] поточечно к функции
φ(Χ) =
-1, -1<х<0;
0, х = 0;
1, 0<х<1
(т. е. (рп(х)^хр(х) при я—>°° для любого хе[-1,1]).
Непосредственным вычислением убеждаемся, что
1 1/л
(фтг(х)-ф(х)) dx = 2 (l-nx)2dx = >0
-1 0
при /г —> ©о. Значит, φη —> φ по норме, порожденной введенным
скалярным произведением. Нетрудно, однако, заметить, что
функция (р(х) не является непрерывной на [-1, 1] и не станет
непрерывной, даже если ее изменить на множестве меры нуль,
так как она имеет точку разрыва первого рода.
Линейное пространство С[-1, 1] с заданным на нем ска-
лярным произведением представляет собой линейное много-
образие в гильбертовом пространстве L2[-l, 1], т. е. множе-
ство, замкнутое относительно линейных операций, но не
замкнутое в топологическом смысле, так как содержит не все
свои предельные точки (например, описанную функцию (р(х)).
314
9. Формулировка вариационных задач
Можно показать, что для произвольного отрезка [а, Ь] множе-
ство С[а, Ь] всюду плотно в L2[a, b], a значит, любая функция
из L2[a, b] является пределом сходящейся в среднем квадра-
тичном последовательности непрерывных функций. Таким
образом, при рассматриваемом скалярном произведении по-
полнением С[а, Ь] является L2[a9 b].
Пример 9.5. Множество Cm(Q) функций, т раз непрерывно
дифференцируемых на замкнутом ограниченном множестве
Ω с Жп9 относительно скалярного произведения (9.5) также
является нормированным, но не полным пространством.
Пополнением этого пространства является L2(0). #
Говорят, что оператор А действует в линейном простран-
стве £, если и область определения D(A), и область значений
R(A) этого оператора являются подмножествами в L· Пусть
D(A) — линейное многообразие в С. Оператор А называют ли-
нейным оператором, если
А(аи + βυ) = осА(и) + βΑ(υ)
для любых элементов и, ν е D(A) и любых чисел α, β. В част-
ном случае, когда линейное пространство L конечномерное,
a D(A) = £, приведенное определение равносильно определе-
нию линейного оператора в конечномерном пространстве [IV].
В конечномерном линейном пространстве С любой линейный
оператор А с областью определения D(A) можно продолжить
на все линейное пространство £, т. е. построить такой опера-
тор А с областью определения D(A) = £, который на D(A)
совпадает с А. В бесконечномерном случае это уже неверно.
Пусть А — оператор, действующий в нормированном про-
странстве £. Уравнение
А(») = /,
где f e С — заданный элемент нормированного пространства
А называют операторным уравнением.
Пример 9.6. Если С — конечномерное линейное простран-
ство, а А — линейный оператор с областью определения D(A) =
= £, то операторное уравнение Аи = / в координатной записи
в некотором базисе линейного пространства представляет
собой систему линейных алгебраических уравнений с квадрат-
ной матрицей.
9.1. Операторное уравнение
315
Если нелинейный оператор А действует в конечномерном
линейном пространстве £, то в координатной записи получа-
ем систему нелинейных функциональных уравнений.
Пример 9.7* Рассмотрим краевую задачу для ОДУ
d Ц(*)+сц(х) = 1у XG [0) 1]? се R?
dx*
с краевыми условиями и(0) = и(1) = 0. Дифференциальное
уравнение этой задачи можно интерпретировать как опера-
торное уравнение, определяемое линейным оператором
Аи = -и" + си. (9.6)
В качестве области определения этого оператора можно вы-
брать множество С2[0, 1] дважды непрерывно дифференциру-
емых функций, являющееся линейным многообразием в нор-
мированном пространстве С[0, 1] с нормой ||- ||с, причем всюду
плотным в С[0,1]. Но тогда найденные решения операторного
уравнения придется проверять на соответствие краевым усло-
виям. Поэтому в данном случае в качестве области определе-
ния оператора удобнее выбрать множество Cq[0, 1] функций,
дважды непрерывно дифференцируемых на отрезке [0, 1] и
удовлетворяющих краевым условиям. Так как заданные крае-
вые условия однородны, указанное множество является ли-
нейным многообразием в С[0,1].
Линейный оператор А представляет собой частный случай
линейного дифференциального оператора, поскольку в него
входит операция дифференцирования. Обозначив через Мс
линейный оператор умножения на число с (т. е. Мси = си), мы
можем записать линейный оператор А в виде
А = -—^ + Мс,
dx*
d2
где —г- — общепринятое обозначение оператора двойного
dxl
дифференцирования.
316
9. Формулировка вариационных задач
Пример 9.8. Рассмотрим краевую задачу для уравнения
Пуассона
-Au(x) = f(x), xeV, (9.7)
с краевым условием
u(x) = g(x), xeS, (9.8)
где Δ — оператор Лапласа; 7сМ3 — заданная область; f(x) —
заданная функция, непрерывная в области V; g(x) — заданная
функция, определенная на поверхности S, ограничивающей V.
Как и в предыдущем примере, мы имеем дело с линейным
дифференциальным оператором А = -А. В качестве области
определения оператора А можно взять множество C2(V)f]C(V)
функций, непрерывно дифференцируемых в области V и не-
прерывных на ее замыкании V = V\J S. Рассматриваемое мно-
жество является линейным многообразием в нормированном
пространстве C(V). Однако если в качестве области определе-
ния оператора А взять множество функций из C2(V)f\C(V),
удовлетворяющих заданным краевым условиям, то оператор
теряет свойство линейности, так как при неоднородных крае-
вых условиях указанное множество не будет линейным мно-
гообразием. В самом деле, пусть функции и, ve C2(V)f]C(V)
удовлетворяют условию (9.8), т. е. и(х) = v(x) = g(x)> x ε S, но
их линейная комбинация w = оси + βυ при произвольных зна-
чениях α, β g R уже не удовлетворяет этому условию, посколь-
ку w(x) = (а + $)g(x), х ε S.
Отмеченное обстоятельство объясняет, почему, решая по-
добные краевые задачи, обычно стремятся преобразовать их
так, чтобы получить однородные краевые условия.
Пример 9.9· Рассмотрим нелинейную краевую задачу с
операторным уравнением
_du(x)_ + q(u) = хе
ахг
и краевыми условиями
и(а) = а, и'(Ъ) + 8(и(Ъ)) = β, α, β ε R, (9.10)
9.1. Операторное уравнение
317
в классе дважды непрерывно дифференцируемых на [а, Ь] функ-
ций. Предположим, что функция f(x) в правой части уравне-
ния (9.9) и функция q(u) в его левой части являются непрерыв-
ными в своей области определения. В качестве области опреде-
ления оператора возьмем множество функций и(х)е С2[а, 6],
для которых выполняются краевые условия (9.10), причем
функция s(u(x)) во втором краевом условии непрерывна. #
Пусть линейный оператор А действует в гильбертовом про-
странстве Η и его область определения D(A) является множе-
ством, всюду плотным в TL. Если для произвольных элементов
u, v е D(A) выполнено равенство
(Au, v) = (u,Av), (9.11)
то оператор А называют симметрическим оператором.
Напомним, что в случае конечномерного евклидова про-
странства оператор, удовлетворяющий соотношению (9.11),
называют самосопряженным. Матрица самосопряженного
оператора в ортонормированном базисе является симметри-
ческой. Поэтому понятие симметрического оператора можно
трактовать как обобщение понятия самосопряженного опера-
тора в конечномерном евклидовом пространстве. Отметим, что
условие симметричности оператора в гильбертовом простран-
стве зависит не только от вида этого оператора (т. е. от фор-
мулы, которой он описан), но и от его области определения.
Расширение области определения может привести к потере
условия симметричности.
Линейный оператор А называют положительным опера-
тором*, если
(Au, u)>0, ueD(A), HI^O.
Для положительного оператора А из равенства (Аи, и) = 0 сле-
дует равенство ||и| = 0, или и = 0.
Симметрический оператор А называют положительно опре-
деленным оператором, если для некоторого числа γ > 0 верно
неравенство
(Аи, и) >γ2 kll2, ue D(A). (9.12)
Обычно термин «положительный» распространяют только на сим-
метрические операторы, но для дальнейшего изложения удобно рассма-
тривать эти два понятия независимо.
318
9. Формулировка вариационных задач
Положительно определенный оператор является положитель-
ным, но обратное утверждение, вообще говоря, неверно даже
в случае, когда положительный оператор одновременно явля-
ется и симметрическим.
Пример 9.10· Убедимся, что линейный дифференциаль-
ный оператор А, рассмотренный в примере 9.7 и определен-
ный на линейном многообразии D(A) = Cq[0, 1], является
симметрическим. Действительно, для произвольных функ-
ций и(х)9 v(x)e Cq[0, 1] последовательным интегрированием
по частям с учетом краевых условий и(0) = и(1) = v(0) = v(l) = 0
имеем
J.
(Аи, v) = (-u"(x) + cu(x))v(x)dx =
о
1
= -u'(x)v(x)\ + u'(x)v'(x)dx + c\ u(x)v(x)dx =
о о
1 1
= u(x)v'(x)\ - u(x)i>'(x)<lx; + c u(x)v(x)dx =
о о
1
= u(x)(-v"(x) + cv(x))dx = (u, Av).
Если считать, что областью определения рассматриваемо-
го оператора А является линейное многообразие С2[0, 1], то
этот оператор уже не будет симметрическим, так как, повто-
ряя те же выкладки, получим
(Аи, v) = (u(x)v(x)-u(x)v(x)fQ +(u, Av). (9.13)
Отсюда заключаем, что (Аи, ν) Φ (и, Аи) для некоторых функ-
ций i/иииз С2[0, 1].
При с > 0 рассматриваемый линейный оператор (с областью
определения Cq [0,1]) является и положительным, так как для
произвольной функции и(х)£ Cq[0, 1] с учетом краевых усло-
вий и(0) = и(1) = 0 интегрированием по частям получаем
9.1. Операторное уравнение
319
(Ащ и)= (-u"(x) + cu(x))u(x)dx =
о
1 1
= -и(х)и(х)\ + (и(х)) dx + c\ u2(x)dx =
о о
1
= Г(u(x)f dx + c\ufL2 > 0. (9.14)
о
В случае с > О равенство (Аи, и) = О возможно лишь при
||ы|| = 0, откуда следует, что и(х) есть нулевой элемент гиль-
бертова пространства L2[0, 1]. Если с = 0, то из равенства
(Аи, и) = 0 следует, что и\х)= 0 в интервале (0, 1). Значит,
в этом интервале и(х) = С = const, а в силу однородных крае-
вых условий С = 0 и и(х) = 0.
При с > 0 оператор А является и положительно определен-
ным, так как, согласно (9.14),
»и2
Щ\т ·
Пример 9.11. Рассмотрим линейный оператор А - -Δ из
примера 9.8. Используя вторую формулу Грина
(иАи - vAu)dV=\(uVv -vVu)ndS,
V S
верную для любых дважды непрерывно дифференцируемых
функций и(х), v(x) e C2(V), получаем
(Аи, ν)-(и, Av) = (uAv-vAu) dV =
к
= j(aVi;-i;Va)*dS, (9.15)
где V — оператор Гамильтона; η — единичный вектор внеш-
ней нормали к кусочно-гладкой поверхности S, ограничива-
ющей пространственную область V.
Отметим, что Vu равно градиенту действительной функ-
ции и, a (Vu) η = ди/дп — производной этой функции по на-
правлению η внешней нормали к S.
320
9. Формулировка вариационных задач
Из (9.15) следует, что равенство (Аи, и) = (и, Αν) не выпол-
няется для произвольных функций и и ν, т. е. оператор А = -Δ
с областью определения C2(V)C\C(V) не является симметри-
ческим. Но если ограничить действие оператора только на
функции, удовлетворяющие однородным краевым условиям,
положив в (9.8) g(x) = 0 на S, то интеграл в правой части (9.15)
обратится в нуль, а оператор А станет симметрическим.
Согласно первой формуле Грина
( v(Vu)ndS = ((vAu + VuVv)dV,
S V
находим
(Au, u) = -\uAudV = -fu(Vu)ndS+ \(Vu)2dV. (9.16)
V S V
Видим, что при однородных краевых условиях (т.е. при g(x) =
= 0) оператор А будет положительным, если его действие огра-
ничить на функции и ε C2(V)f]C(V)9 удовлетворяющие этим
краевым условиям. Действительно, согласно (9.16),
(Aw, u)= \(Vu)2dV>0.
ν
Из равенства (Аи, и) = 0 следует равенство Vu = 0. Но тогда
и = const, а с учетом однородных краевых условий и = 0. Мож-
но показать, что при однородных краевых условиях оператор
А будет и положительно определенным [XIII].
Однако оператор А не является положительным, а значит,
и положительно определенным, если в качестве его области
определения рассматривать все линейное многообразие
C2(V)f]C(V). Оказывается, что в этом случае существуют та-
кие функции и, для которых поверхностный интеграл в пра-
вой части (9.16) больше тройного интеграла. #
Рассмотрим операторное уравнение Аи = f, для которого
оператор А является линейным.
9.1. Операторное уравнение
321
Теорема 9.1. Если оператор А, действующий в гильберто-
вом пространстве Н, является положительным, а уравнение
Аи = f имеет решение, то это решение единственное.
Μ Пусть одновременно Ащ = f и Аи2 = /· Тогда, обозначив и =
= щ - и2, получим
Аи- A(ui -u2) = Aui -Аи2 =/-/ = 0.
Следовательно, {Аи, и) = (О, и) = 0. В силу положительности
оператора А заключаем, что и = 0 и щ = и2. Таким образом,
любые два решения уравнения Аи = f совпадают. ►
Теорема 9.2 (теорема о квадратичном функционале).
Если А — симметрический положительный оператор с обла-
стью определения D(A), a u0e D(A) — решение уравнения
Аи = f, то это решение доставляет наименьшее значение ква-
дратичному функционалу
J[u] = (Au, и) -2(u,f).
Наоборот, если элемент и0е D(A) доставляет наименьшее зна-
чение функционалу J[u], то этот элемент является решением
уравнения Аи = f.
Μ Пусть Аи0 = f. Тогда для любого элемента и е D(A)
J[u] = (Аи, и) - 2(/, и) = (Аи, и) - 2(Аи0, и) +
+ (Аи0, и0)-(Аи0, и0) = (А(и-и0),и-и0)-
- (Аи0, и0) = (Ай, й)-(Ащ, щ), (9.17)
где й = и-и0. Видно, что функционал достигает своего наи-
меньшего значения J[u0] = ~(Аи0, и0) при (Аи, и) - О, т. е. при
и = u0g D(A).
Пусть теперь элемент щ е D(A) доставляет наименьшее зна-
чение функционалу J[u]. Выберем произвольный элемент Au e
е D(A) так, чтобы и = и0 + Аи ε D(A). Тогда
J[u] - J[u0 ] = J[u0 + Аи] - J[u0 ] =
= (A(u0 + Аи),u0+Au)-2(f,uo+ Аи)-(Ащ, и0) +
+ 2(f, u0) = (AAu, Аи) + 2(Аи0 -f,Au)>0.
322
9. Формулировка вариационных задач
Записанное неравенство верно для любого элемента Аи. Вы-
брав Аи = tv, где элемент ν е D(A) фиксирован, a te R прини-
мает произвольные значения, получим
t2(Av, v) + 2t(Au0 -/, v)>0, te R.
Но это неравенство верно для любого te Ш только в том случае,
когда (Au0-f,v) = 0. Так как элемент ve D(A) произволен,
то заключаем, что Аи0-/ = 0, или Auq = /. ►
Теорема о квадратичном функционале устанавливает связь
между операторным уравнением и некоторой вариационной
задачей. Вместо того чтобы решать операторное уравнение,
можно искать наименьшее значение соответствующего функ-
ционала. Однако недостаток указанной теоремы состоит в том,
что далеко не всегда удается поставить математическую задачу
так, чтобы это было операторное уравнение с симметрическим
положительным оператором. Круг таких задач весьма ограни-
чен. Поэтому важно установить и другие условия, при которых
возможен переход от операторного уравнения к поиску наи-
меньшего значения соответствующего функционала и которые
не содержат требования симметричности или положительности
оператора. Если прикладная задача, сводящаяся к решению
операторного уравнения, допускает указанный переход к неко-
торой вариационной задаче, то последнюю мы будем называть
вариационной формулировкой исходной прикладной задачи.
9.2. Вариационное уравнение
Вернемся к операторному уравнению Аи = f с оператором А,
действующим в гильбертовом пространстве Н. Допустим, что
область определения D(A) этого оператора есть всюду плотное
множество в Н. Рассмотрим уравнение вида
F(u,6u) = 0, (9.18)
определяемое некоторым функционалом F[u9 δα] с областью
определения D(F) = DuxDbu, где D(A) ^DU<^H, Dbu сН.
Если это уравнение эквивалентно операторному уравнению
Аи = /, то его называют вариационным уравнением, соответ-
ствующим этому операторному уравнению· Условие равно-
сильности уравнений Аи = f и F[u9 8и] = 0 означает, что любое
9.2. Вариационное уравнение
323
решение операторного уравнения удовлетворяет вариацион-
ному уравнению при любой вариации 8и е DbuJ а любой эле-
мент ие D(A), превращающий вариационное уравнение в тож-
дество, есть решение операторного уравнения.
Вариационное уравнение называют голономным, если его
левая часть является первой вариацией 5J[u,5u] некоторого
функционала J[u] с областью определения D(J) = Du. Если та-
кой функционал J\u\ удается найти, то операторное уравнение
Аи = f будет равносильно уравнению 5J[n, 5u] = 0, т. е- решение
операторного уравнения равносильно поиску стационарных
точек функционала J[u]. Таким образом, переход к вариаци-
онной формулировке прикладной задачи может быть реализо-
ван построением голономного вариационного уравнения.
В некоторых ситуациях голономное вариационное урав-
нение, эквивалентное операторному, построить не удается,
но можно построить такое вариационное уравнение, которое
среди своих решений содержит все решения операторного
уравнения· Тогда, решив построенное вариационное уравне-
ние, нужно выделить среди найденных решений те, которые
имеют отношение к операторному уравнению.
В качестве вариационного уравнения, соответствующего
операторному уравнению Au = f, можно взять следующее:
(Аи-/, δα) = 0, 5ueDbu^H9 (9.19)
где Dbu всюду плотно в гильбертовом пространстве Н.
Нетрудно убедиться, что все решения операторного урав-
нения удовлетворяют уравнению (9.19). Верно и обратное.
Если для заданного элемента ие D(A) равенство (9.19) выпол-
няется для всех элементов 6и из всюду плотного в Η множе-
ства, то Au-f = 0 [IX]. В этом случае и является решением
операторного уравнения Аи = f.
Выясним, при каких условиях вариационное уравнение
(9.19), соответствующее линейному оператору А, является го-
лономным, т. е. его левая часть представляет собой первую
вариацию некоторого функционала J[u]. Сначала разберемся,
как ответ на этот вопрос выглядит в конечномерном случае.
Пусть А — линейный оператор в АГ-мерном евклидовом про-
странстве 8. В некотором ортонормированном базисе действие
этого оператора сводится к умножению столбца координат
324
9. Формулировка вариационных задач
i*i, и2> ..., uN вектора и на некоторую квадратную матрицу
А = (аф, а уравнение (9.19) можно записать следующим обра-
зом:
Ν ( Ν ^
Σ
k=l
^akjUj-fk №к=0. (9.20)
В данном случае вариационное уравнение голономное тогда и
только тогда, когда левая часть этого уравнения представляет
собой полный дифференциал некоторой функции J(ui, ..♦, uN)
многих переменных. Поэтому
( N \ ^ ( N >t
7=1
Э
k,m = l, Ν,
или
<*>km = amk> k9m = l9 N.
Итак, условие голономности вариационного уравнения
(9.19) равносильно условию, что матрица оператораА в орто-
нормированном базисе симметрическая. Но последнее означа-
ет, что оператор А является самосопряженным. Нетрудно
показать, что в случае самосопряженного оператораА в каче-
стве функционала J можно взять J (и) = — (Аи9 и)-{и, f).
Перейдем к бесконечномерному случаю. Естественно пред-
положить, что в гильбертовом пространстве голономность ва-
риационного уравнения для линейного оператора также свя-
зана с условием симметричности данного оператора. Убедим-
ся в этом. Предположим, что для заданного линейного
оператораА в гильбертовом пространстве Н, имеющего всюду
плотную в Η область определения D(A), существует функцио-
нал J[u], для которого 5J[u, 6u] = (Au - /, 5u). Выбрав произ-
вольные функции A, ge D(A), рассмотрим функцию
Тогда
φ(α, β) = J[u + ah + $g]9 oc, βе
φ(α + Δα, β) - φ(α, β)
(9.21)
φ'α(α, β)= lim
Δα^Ο
Δα
= lim
Δα^Ο
J[u + (α + Δα)Λ + β#] - J[u + ah + β#]
Δα
9.2. Вариационное уравнение
325
= 8J[u + ah + $g, h] = (A(u + ah + $g)-f, h) =
= (A(u + ah)-f, h) + $(Ag, h). (9.22)
Мы видим, что функция φ^ (α, β) дифференцируема по пара-
метру β и
Φ;β(α,β) = (Α£,/1).
Аналогично можно показать, что существует вторая смешан-
ная производная
φ£α(α,β) = (ΑΛ,£).
Две смешанные производные φ*β и ψβα существуют и непре-
рывны (они попросту постоянны). Поэтому они равны: φ* β = (р*а.
Следовательно, для любых функций h,g e D(A) выполняется
равенство
(Ag,h) = (Ah9g) = (g9Ah),
т. е. оператор А, имеющий всюду плотную в Η область опре-
деления, является симметрическим. Нетрудно показать, что
если оператор А симметрический, то левая часть вариацион-
ного уравнения (9.19) представляет собой первую вариацию
функционала J[u] = — (Au, u)-(f, и). Действительно,
Li
J[u + t8u] - J[u] = — [A(u + i5u), и + t&u) -
Li
-(f,u + t&u) — (Au, u) + (/, u) =
La
= -(t{Au, bu)+t(Abu, u) + t2(Abut bu))-t(f, Su) =
Lk
t2
= (Au - f, 5u)i + (A6u, δα)—,
Li
откуда 6J[it, Ьи\ = (Au - f, $u).
Замечание 9.1. Мы рассмотрели случай операторного урав-
нения Au = / с линейным оператором А. Однако вариационное
уравнение (9.19) можно использовать и в нелинейном случае,
326
9. Формулировка вариационных задач
но условия голономности вариационного уравнения в нели-
нейном случае более сложные, а восстановление функционала
по голономному уравнению требует значительных усилий.
9.3. Примеры построения функционала
по вариационному уравнению
В 9.2 показано, что квадратичный функционал вида
J8[u] = (Au,u)-2(f9u)9 (9.23)
соответствующий операторному уравнению Аи = /, где опера-
тор А действует в гильбертовом пространстве Н, можно по-
строить в случае, когда оператор А симметрический. Если этот
оператор положительный и уравнение Аи = f имеет решение
иQ e D(A)j то данное решение единственное (см. теорему 9.1).
Если же оператор А и симметрический, и положительный, а
уравнение Аи = / имеет решение а0, то, согласно теореме 9.2,
функционал Js[u] (9.23) достигает на этом решении своего
наименьшего значения Js[u0] = -(Аи0, и0).
Из примеров 9.10 и 9.11 видно, что симметричность и поло-
жительность оператора, рассматриваемого на множестве функ-
ций, удовлетворяющих краевым условиям конкретной краевой
задачи, существенным образом зависит от вида этих условий.
В краевых задачах прикладного характера эти условия обычно
неоднородны, и поэтому на таком множестве функций свойства
симметричности и положительности оператора утрачиваются.
Тем не менее и в такой ситуации в некоторых случаях можно
построить функционал, соответствующий операторному урав-
нению краевой задачи, если использовать вариационное урав-
нение, равносильное этому операторному уравнению· Поясним
данную процедуру на конкретных примерах.
Пример 9Л2. Рассмотрим краевую задачу для ОДУ
-^ + см(л) = М *е[0,Ц, (9.24)
с краевыми условиями
и(0)-аи(0) = а, и(1) + $и(1) = β, (9.25)
где с, α, α, β, βε R; f(x)e C[0, 1].
9.3. Примеры построения функционала по вариационному уравнению 327
Как и в примере 9.10, можно показать, что в случае од-
нородных краевых условий (α = β = 0) линейный оператор
d2
А- ^- + МС, действующий в гильбертовом пространстве
dxl
L2[0, 1], будет симметрическим, если в качестве его области
определения взять всюду плотное в L2[0, 1] множество дважды
непрерывно дифференцируемых функций, удовлетворяющих
таким краевым условиям. Действительно, для произвольных
функций и, ve C2[0, 1], удовлетворяющих (9.25), последова-
тельным интегрированием по частям получаем
1
(Аи, v) = (-u"(x) + cu(x))v(x)dx =
о
= {u(x)v(x)-u(x)v(xu + (u9Av) =
= «(1)(β-βυ(1))-17(1)(β-βαα))-
- u(0) (α + αυ(0)) + ν(0) (α + au(0)) + (u, Αν) =
= β(α(1) -υ(1)) - а(и(0)-υ(0)) + (и, Αν).
Таким образом, при однородных краевых условиях (ос =
= β =0) оператор А является симметрическим: (Аи, v) = (u,Av).
Но в общем случае этот оператор перестает быть симметриче-
ским (он даже не является линейным).
Построим вариационное уравнение (Аи - /, Ьи) = 0 вида
(9.19). Согласно выражению для оператора в (9.24), получим
1
(Au-f,6u)=\(-u"(x) + cu(x)-f(x))6u(x)dx = 0. (9.26)
о
Интегрируем по частям с учетом краевых условий (9.25):
1
(-и"(х) + си(х) - f(x)) Ьи(х) dx =
о
1 1
= -и(х)Ьи(х)\ + u(x)bu(x)dx+ [cu(x)-f(x))bu(x)dx =
328
9. Формулировка вариационных задач
±
= - (β - β w(l)) 5u(l) + (α + au(0)) 8u(0) + JV(*) 5u'(x) d*
о
1
+ (cu(x)-f(x))du(x)dx.
+
(9.27)
Учитывая общий вид первой вариации функционала ин-
тегрального вида (3.3), можем записать:
5?(Ц(*)) dx = J^(jC)SM/(x)djc> ue С^ОД], (9.28)
•л
сц2(л;)
2
-/(*)ы(х)
Л
dx =
= Ucu(x)-f(x))8u(x)dx, ue L2[0, l]. (9.29)
о
Для терминального функционала Τ [и] = u2(a) (a фиксировано)
непосредственным подсчетом находим
АТ[и] = Т[и + 8и]-Т[и] =
= [и(а) + 6и(а)) -и2(а) = 2и(а)&и(а) + (6и(а)) ,
откуда
ЬТ[и,Ьи\ = 2и(а)Ьи(а).
(9.30)
Приведенные представления первых вариаций функциона-
лов показывают, что правую часть (9.27) можно записать так:
(Au-f, 5u) = 6
au(0)-pu(l) +
2п\Л
аиг{0) + $иг(1)
+ δ
j.
9 f
(u(x)) +с(и(х)У
л
— f(x)u(x)
dx.
Это выражение является первой вариацией функционала
9.3. Примеры построения функционала по вариационному уравнению 329
J[u] = au(Q)-$u(l) + к——+\\ -^ fu
)
dx.
В качестве области определения D(J) функционала J[u] мож-
но взять D(J) = Сх[0, 1]. Из (9.26) следует, что каждое решение
рассматриваемой краевой задачи является стационарной точ-
кой этого функционала.
Аналогично можно построить функционал
ар(а)и(а) ЩЬ)и(Ь) | ар(а)и2(а) | $р{Ъ)и2(Ъ) |
аг
4
р(х)(и'(х)) +с(х)(и(х))
β1 2<xi
2 ^
2β1
—/(л)и(л)
)
dx
(9.31)
с областью определения D(J) = Сг[а, &], стационарной точкой
которого является решение краевой задачи для операторного
уравнения
d ( du(x)
dx
р(х)
dx
+ с(х)и(х) = f(x), ХЕ [α, Ь], (9.32)
с краевыми условиями
aiu(a) - аи(а) = a, $\u(b) + βα(6) = β,
(9.33)
где с,/ ε C[a,b]; ρ ε С1 [а, Ь]; р{а)р(Ъ)Ф 0; а, аь α, β, β1?βΕ R;
α1β1^ 0· Убедимся в этом следующим образом. Используя
представления (9.28)-(9.30), находим вариацию функциона-
ла (9.31):
«1
β!
+
ap(a)u(a)8u(a) βρ(6)^(6)δΙ/(6)
«i
β1
+ /?(x)w'(x)5i//(^:)dx +
(c(x)u(x)-f(x))6u(x)dx.
330
9. Формулировка вариационных задач
Первый интеграл в правой части этого равенства преобразуем
интегрированием по частям:
ъ ь
p(x)u\x)8u(x)dx = р(х)и\х)Ъи(х)\ - (р(х)и'(х)} bu(x)dx,
а а
и после подстановки преобразованного интеграла в выражение
для bJ[u9 Ьи] получим
с тг с _ ади(а) βδΙ/(&)
αΧ βΧ
аи(а)Ьи(а) $u(b)8u(b) , ч ,, ч5: , ,\Ъ
«1 Pi a
ь ь
- \{jp{x}u\x)) bu{x)dx+ Uc(x)u(x)-f(x)}<$u(x)dx =
а а
, .a+au(a)-aiu(a) ς , ч ,,.$-$u(b)-$iu(b) „ ,_.
«1 β1
+ jf- (p(x)u(x))' + c(x)u(x) - f(x)\u(x) dx. (9.34)
Если некоторая функция и0(х)е С2[a, b] является решени-
ем краевой задачи (9.32), (9.33), то эта функция обращает
правую часть (9.34) в нуль, т. е. будет стационарной точкой
функционала (9.31).
Пример 9,13. Рассмотрим краевую задачу для уравнения
Пуассона
-Au(x) = f(x), xeV, (9.35)
где Ve E3 — пространственная область, ограниченная кусоч-
но-гладкой поверхностью S; f(x)eC(V) (см. примеры 9.8 и
9.11).
Краевые условия задачи определим следующим образом.
На участках Sg поверхности S известны значения искомой
функции и(х):
u(x) = g(x), xeSg, (9.36)
а на остальных участках Sh = S \SL краевое условие имеет вид
9.3. Примеры построения функционала по вариационному уравнению 331
Vu(x)n(x) + au(x) = h(x), xeSh, oteR, (9.37)
где V — оператор Гамильтона, а п(х) — единичный вектор
внешней нормали к поверхности S в точке х.
Предполагаем, что g(x)e C(Sg) и h(x)e C(Sh). #
Рассмотрим линейный дифференциальный оператор А = -Δ,
область определения D(A) которого состоит из функций и(х)
линейного многообразия Cv =C2(V)(]C(V{jSg)nC1(V[jSh)i
удовлетворяющих краевым условиям (9.36) и (9.37). Область
определения оператора всюду плотна в гильбертовом про-
странстве L2(V), а если g и h тождественно равны нулю, яв-
ляется линейным многообразием в L2(V). В этом случае опе-
ратор А — симметрический. Для произвольных функций и и ν
из области определения оператора, используя равенство (9.15),
получаем
(Аи, ν) - (и, Av) = (uAv - vAu) dV - (uVv - vVu) ndS =
V S
= \ g(Vv-Vu)ndS+ \ h(u-v)dS = 0.
В общем случае для вариационного уравнения, соответст-
вующего заданной краевой задаче, имеем
(Au-f, 5и) = f(-Au-f)budV = 0. (9.38)
ν
Используя первую формулу Грина и краевые условия, учиты-
вая представления
b(^-dV=hubVudV, b\—dS=(aubudS, (9.39)
ν ν sh sh
аналогичные (9.28), (9.29), находим
((-Au-f)&udV = -hun8iuiS+{vuV(bu)dV-
V S V
-J fbudV = - J (h - au)8udS + J V иЩди) dV - δ J fudV =
V Sk V V
332
9. Формулировка вариационных задач
■»л
оси
>
-hu
ldS + δ
il
(Vu)2
-fu
dV = 0.
(9.40)
V
Обратим внимание на то, что поверхностный интеграл на
участках Sg поверхности S исчезает, поскольку на Sg заданы
значения искомой функции и, следовательно, 6и = 0 на Sg.
Кроме того, мы использовали и краевое условие (9.37).
Предпоследняя часть равенства (9.40) является вариацией
функционала
ли]=||
(Vm)s
-fu
\
)
dV +
il
sft'
air
-hu
dS.
(9.41)
В качестве области определения этого функционала можно
взять линейное многообразие Cl(V)f\C(V\JS), всюду плотное
в L2(V). Согласно проведенным выкладкам, первая вариация
этого функционала на множестве D(A) совпадает с (Аи - Д Ьи).
Аналогично можно построить функционал
J[u] = j\
(Vu)2
fu
dV +
1
sh
k f au2
hu
dS (9.42)
с областью определения D(J) = C1(V)r\C(V\jS)J соответству-
ющий операторному уравнению
-V (k(x)Vu(x)) = f(x), xgV,
с краевыми условиями
u(x) = g(x), xeSg,
a1(x)S/u(x)n(x) + a(x)u(x) = h(x), xe Sh>
(9.43)
(9.44)
где/е C(V); ke С^ЮПС(5Й); Ьф 0 на5л; аь а, he C(Sh); щфО
H8iSh.
Убедимся в том, что вариация функционала J[u] в области
определения D(A) оператора А, состоящей из функций линей-
ного многообразия £у, удовлетворяющих краевым условиям
(9.44), совпадает с выражением (Аи - /, &и). Для этого вычис-
лим вариацию функционала, учитывая представления (9.39):
9.3. Примеры построения функционала по вариационному уравнению 333
δ J[u, 5м] = f kVw5VudV - J fbudV + f —(оси - h) budS
k
с
ν sh
Первый интеграл в правой части этого равенства преобразуем
с помощью формулы Остроградского — Гаусса'.
f kVuSVudV = f kVuV(8u)dV =
ν ν
= (kVunSudS -J V(kVu)6udV.
Подставляя преобразованный интеграл в выражение для
bJ[u, δω] и учитывая, что δ« = 0 на Sg, находим
bJ[u, ди] = \kVunbudS - Г V(kS7u)dudV -
S V
-\fbudV+ j—(au-h)budS = -\(V(kVu) + f)8udV +
s^
+ —(a^un + au-fydudS. (9.45)
J ai
sh
Проведенные выкладки показывают, что первая вариация это-
го функционала на множестве D{A) совпадает с (Аи - /, Ьи).
Если некоторая функция и0 является решением краевой зада-
чи (9.43), (9,44), то правая часть (9.45) обращается в нуль, т. е.
эта функция будет стационарной точкой функционала (9.42).
Пример 9.14. Попытаемся для краевой задачи (9.9), (9.10)
построить по вариационному уравнению (9.19) функционал,
соответствующий операторному уравнению этой задачи.
Вариационное уравнение (9.19) в данном случае имеет вид
ь
((-u\x) + q(u)-f(x))bu(x)dx = 0. (9.46)
а
Левую часть (9.46) представим суммой двух интегралов:
ь ъ
-f(u"(x) + f(x))8u(x)dx+fq(u)8u(x)dx=Q. (9.47)
334
9. Формулировка вариационных задач
Для первого интеграла в (9.47), так же как в примере 9.12,
принимая во внимание то, что 5и(а) = 0, и учитывая второе
краевое условие (9.10), находим
ь
- (и"(х) + f(x))du(x)dx = -и'(х)ди(х)\а +
а
Ь Ъ
+ \и(х)(6и(х))' dx- \ f(x)Su(x)dx = -(β-s(u(b)))§u(b) +
b b f u(b)
+ u(x)6u(x)dx- 6^f(x)u(x)^dx = -6\ $u(b)- s(u)du
4
(u(x)Y
2
f(x)u(x)
dx.
(9.48)
Второй интеграл в (9.47) представим в виде
b Ь и(х)
q{u)bu(x)dx = δ \dx q(u)du.
α α 0
В итоге из (9.47)-(9.49) получаем
-δ
и(Ъ)
$u(b)- s(u)du
V
ы
+δ
■Л
(и(х))
+
-f(x)u(x)
Ь и(х)
(9.49)
dx + δ \dx q(u)du = 0.
J
а 0
Левая часть этого равенства есть первая вариация функцио-
нала
J[u] = -$u(b) + \[U (X)) dx-\f(x)u(x)dx
а а
Ь и(х) и(Ь)
+ \dx \ q(u)du+ s(u)du,
+
(9.50)
а 0
9.4. Исследование выпуклости функционала
335
в качестве области определения D(J) которого возьмем ли-
нейное многообразие Сх[а, Ъ). На множестве функций и(х)
из D(J), удовлетворяющих краевому условию и(а) = а, ва-
риация функционала совпадает с левой частью (Аи - /, 8и)
вариационного уравнения.
9.4. Исследование выпуклости функционала
Для каждого из построенных в примерах 9.12-9.14 функци-
оналов пока удалось лишь установить, что если соответству-
ющая ему краевая задача имеет решение, то это решение яв-
ляется стационарной точкой этого функционала. Естественно,
возникают вопросы: будет ли у такого функционала эта точка
единственной и будет ли в этой точке функционал достигать
наименьшего или наибольшего значения? Ответы на эти во-
просы можно получить путем проверки свойства выпуклости
функционала.
Подмножество Μ линейного пространства С называют
выпуклым множеством, если для любых элементов u,ve Μ
и любого числа ае [0,1] элемент σα + (1-σ)υ также принадле-
жит М. Простейшим примером выпуклого множества являет-
ся само линейное пространство £, а также любое его линейное
многообразие. Функционал J[u], определенный на выпуклом
множестве Μ = D(J), называют выпуклым функционалом,
если для любых ui, и2Е Μ и σΕ [0,1]
J[au1+(i-a)u2]<oJ[u1] + (i-a)J[u2]. (9.51)
Если при любых ui φ и2 и σ е (0, 1) в (9.51) выполнено строгое
неравенство, т. е.
R(uly u2) = Gj[u1] + (l-G)J[u2]-J[au1+(l-a)u2]>0, (9.52)
то функционал J[u] называют строго выпуклым функциона-
лом. Отметим, что в линейном пространстве R1 понятие функ-
ционала сводится к понятию действительной функции одного
действительного переменного. В этом случае понятие выпук-
лого (строго выпуклого) функционала равнозначно понятию
выпуклой вниз (строго выпуклой вниз) функции [II].
Пример 9.15. Выпуклым функционалом является линей-
ный функционал. В нормированном пространстве Μ выпук-
336
9. Формулировка вариационных задач
лым функционалом является норма ||и||, так как из неравен-
ства треугольника следует, что
σα + (1-σ)υ||<|σα| + ||(1-σ)υ| =
= a||u|| + (l-a)||u||, и, ve ΛΛ
Взяв неубывающую строго выпуклую вниз функцию / (х) дей-
ствительного х (например, / (х) = х2)> получим строго выпук-
лый функционал «7[u] = /(u|). Действительно,
«|(» + α-σ)1|||)</(σ||α|+α-σ)||»|)<
<σ/(||α||)+(1-σ)/(||υ||), щиеЛГ.
В частности, || и ψ — строго выпуклый функционал в нор-
мированном пространстве.
Замечание 9·2· Непосредственно из определений вытекает,
что сумма выпуклых функционалов является выпуклым
функционалом, а сумма выпуклого и строго выпуклого функ-
ционалов является строго выпуклым функционалом. В част-
ности, если F[u] — линейный функционал и функционалы
J[u] и J\\u\ связаны соотношением J[u] = J\[u] + F[u], то они
выпуклые (строго выпуклые) одновременно. Это означает, что
при исследовании функционала J[u] на выпуклость в его
представлении можно опускать линейные относительно эле-
мента и слагаемые. Например, квадратичный функционал
J[u] = (Auyu)-2(f9u) будет выпуклым (строго выпуклым) тог-
да и только тогда, когда выпуклым (строго выпуклым) явля-
ется функционал J2[u] = (Au, и).
Пример 9.16· Выясним, при каких условиях функционал
J2[tt] = (Au, и), построенный по линейному оператору А, будет
строго выпуклым. Для этого необходимо проверить неравен-
ство (9.52). Для произвольных элементов u, v e D(A) имеем
Щщ, и2) = σ( Ащ, щ) + (1 - σ)(Аи2, и2) -
- (A (aui + (1 - d)u2) j aui + (1 - o)u2) =
= a(l-a)((Au1,u1) + (Au2, и2)-(Аиъ и2)-(Аи2, щ)) =
= σ(1-σ)(Α(^!-α2), щ-щ).
9.4. Исследование выпуклости функционала
337
Так как σ(1-σ)>0 при ое (0,1), заключаем, что функционал
^2\ц\ = (Аи* и) будет строго выпуклым, если А — положитель-
ный оператор.
Выпуклые функционалы имеют несколько важных свойств.
Свойство L Ограничение выпуклого (строго выпуклого)
функционала на выпуклое множество является выпуклым
(строго выпуклым) функционалом·
Μ Пусть J[u] — выпуклый функционал иМсD(J) — выпуклое
множество. Тогда функционал е/де[и], определенный на множест-
ве Μ и совпадающий на этом множестве с функционалом J[u]
(т.е. Jm[u] есть ограничение J[u] на М), будет выпуклым функ-
ционалом. Действительно, для любых элементов и, υе Ми лю-
бого σ е (0, 1) элемент <т + (1 - α)υ принадлежит Μ и при этом
в силу выпуклости функционала J[u] верно неравенство (9.51).
А это и значит, что функционал Jm[u] выпуклый. Рассуждения
в случае строго выпуклого функционала аналогичны. ►
Свойство 2. Если функционал J[u] выпуклый (строго вы-
пуклый), то при с > 0 (с> 0) функционал cJ[u] тоже выпуклый
(строго выпуклый)·
Μ Свойство выпуклости функционала J[u] означает выполне-
ние неравенства (9.51). Умножив это неравенство на с, полу-
чим утверждение о выпуклости функционала cJ[u]. В случае
строго выпуклого функционала рассуждения аналогичны. ►
Свойство 3. Если J[u] — выпуклый функционал, a f(x) —
выпуклая (вниз) неубывающая функция действительного пе-
ременного х9 определенная на всей числовой оси, то компози-
ция f(J[u]) — выпуклый функционал. В частности, если J[u] —
линейный функционал, то J2[u] — выпуклый функционал.
Μ Для выпуклой функции при любых jc, уе Ж и σ^ (0, 1) верно
неравенство
f(ox + (l-<5)y)<af(x) + a-<3)f(y).
Рассматривая в качестве х и у значения функционала, полу-
чаем
<a/(J[tt1]) + a-«)/(J[tt2]),
где ui, u2 e D(J); a e (0, 1).
338
9. Формулировка вариационных задач
Если J[u] — линейный функционал, то \J[u]\ — выпуклый
функционал, так как
| J[(5ux + (1 -ti)u2] I = I oJ[ui] + (1 -σ) J[u2] \ <
Za\J[ut]\ + (l-o)\J[u2l\,
где иъ u2 e D(J); σ e (0, 1).
Выбрав выпуклую неубывающую функцию f{x)y равную
х2 при х > 0 и нулю при х < 0, заключаем, что функционал
J2[u] = / (|е/[и]|) является выпуклым. ►
Свойство 4. Непрерывный выпуклый (в частности, непре-
рывный строго выпуклый) функционал J[u] достигает наи-
меньшего значения на любом замкнутом ограниченном мно-
жестве в гильбертовом пространстве Н. Если J[u] —» +°о при
|| α || —> °°, то выпуклый функционал J[u] достигает наимень-
шего значения на любом замкнутом в Η множестве*. #
Свойство 5. Если строго выпуклый функционал J[u] до-
стигает на выпуклом множестве Μ своего наименьшего зна-
чения J*, то элемент щ, на котором достигается это значение,
единственный.
Μ Пусть J[u{\ = J* = J[u2]. Тогда, полагая σ = 1/2 в (9.52),
получаем
R(u1,u2) = -J[u1] + -J[u2]-
-J
1 1
— Ui+ — U2
2 2 2
— е/* — U
Щ-и2
>о,
т. е. J[(u1+u2)/2]<J*9 а это противоречит тому, что J* яв-
ляется наименьшим значением функционала на множест-
ве М. ►
Свойство 6. Если строго выпуклый функционал J[u], у
которого всюду в области определения существует дифферен-
циал Гато, имеет стационарную точку, то эта точка единст-
венная и в ней функционал достигает наименьшего значения.
Ч Покажем, что стационарная точка строго выпуклого функ-
ционала является его точкой минимума. Тогда, согласно свой-
ству 5, эта точка является единственной.
* См.: Экланд И., Темам Р.
9.4. Исследование выпуклости функционала
339
Пусть и0е D(J) — стационарная точка функционала J[u].
Выберем произвольную точку ue D{J). Тогда, согласно свой-
ству строгой выпуклости функционала J[u], для любого числа
ае (0, 1)
aJ[u] + (l-a)J[u0]> J[au+(l-a)u0].
Вычитая из обеих частей неравенства J[u0] и деля на σ, полу-
чаем
τΓ п τΓ Ι J[(m + (1-G)u0]-J[u0] J[u0+Gdu]-J[u0]
J[u]-J[u0] > = ,
σ σ
где Ьи = и-и0.
Так как функционал J[u] имеет дифференциал Гато, то
существует предел
J[u0+a6u]-J[u0]
lim = oJ[u0, ou].
Этот предел равен нулю, потому что щ — стационарная точка.
Но тогда
J\u л + а5и] - J[u η 1
J[u]-J[u0] > lim —- - —^- = 0,
τ. e. J [и] > J[u0] и щ в силу произвольного выбора ue D(A)
является точкой минимума функционала J[u]. ►
Пример 9.17. Выясним, при каких условиях функционал
J[u], определяемый соотношением (9.31), является выпук-
лым. Область определения D(J) = Cl[a, b] этого функционала
является линейным многообразием, т. е. представляет собой
выпуклое множество. Согласно замечанию 9.2, линейные сла-
гаемые можно опустить, поскольку они не влияют на выпук-
лость функционала. Функционал будет выпуклым, если
каждое из оставшихся слагаемых определяет выпуклый функ-
ционал на D(J). При этом, если одно из этих слагаемых опре-
деляет строго выпуклый функционал, то и функционал J [и]
является строго выпуклым.
Интеграл
ь
c(x)u(x)v(x) dx
!·
340
9. Формулировка вариационных задач
в случае с(х)>0, хе [а, &], можно трактовать как скалярное
произведение функций и(х) и v(x) в линейном пространстве
Сг[а> 6]. Поэтому слагаемое
1 ь
— с(х)(и(х)) dx
2 *
в (9.31) определяет строго выпуклый функционал как поло-
вину квадрата нормы (см* пример 9.15 и свойство 2).
Слагаемое
ъ
2
о
-jp(x)(u(x))2dx
при р(х) > 0, хе[а, &], определяет выпуклый функционал,
поскольку для любых функций и(х), u(x)t C\a, b] и любого
σ^ (0, 1) и μ = 1-σ имеем
ь ь
Щи, ν) = σ р(х)(и(х)) dx + μ р(х)(v'(x)) dx -
a a
b b
- p(x){pu(x) + \w'(x)) dx = G\i\p{x){u{x)-v{x)) dx>0.
a a
Отметим, что при построении функционала было исполь-
зовано условие р(а)р(Ь)±0 (см. пример 9.12), что вместе с
условием неотрицательности функции р(х) дает р(а) > 0 и
р{Ъ) > 0. Поэтому слагаемые
ар(а)и2(а) ЩЪ)и2{Ь)
2αΧ ' 2βΧ
определяют выпуклые функционалы, если α/αΧ > 0 и β/Ι^ > 0.
Это вытекает из свойств 2 и 3·
Итак, если р(х) > 0 при х е [a, &], с(х) > 0 при х е [а, 6],
р(а)р(Ь) * 0, а/ах > 0, β/ft > 0, то функционал (9.31) строго
выпуклый.
Пример 9.18. При исследовании выпуклости функционала
J[u] (9.42), область определения которого D(J) = C1(V)f\C(V)
есть выпуклое множество, можно не рассматривать линейные
слагаемые. Этот функционал является выпуклым, если сла-
гаемые
9.4. Исследование выпуклости функционала
341
\ f k(x)(Vu)2dV, \ \ -^-а(х)иЧ8
2 J 2 J аг(х)
определяют выпуклые функционалы· Можно показать, что
достаточным условием выпуклости первого из них является
неотрицательность функции k(x) в V, k(x) > 0, х е V. Предпо-
лагая, что эта функция непрерывна, заключаем, что она не-
отрицательна и на границе области, т. е. k(x) > 0, х е Sh. С
учетом этого нетрудно показать, что выпуклость второго функ-
ционала, определяемого интегралом по Sh> будет следовать из
соотношения a(jc)/cci(#) > 0, х е Sh.
Итак, рассматриваемый функционал выпуклый при k(x) > О,
х е Уу и а(х)/щ (х) > О, х е Sh. Можно показать, что если k(x) > О,
х g V, то функционал (9.42) является строго выпуклым.
Пример 9.19. Функционал (9.50) будет выпуклым, если
выпуклы функционалы
Ь и(х) и(Ь)
jdx J «/(ξ)<*ξ, J β(ξ)<*ξ, (9.53)
α 0 0
поскольку первое и третье слагаемые в правой части (9.50)
линейные и не влияют на выпуклость функционала J[u]9 a
второе слагаемое определяет выпуклый функционал.
Обозначив через Q(x) и S(x) первообразные функций q(x) и
s(x)y принимающие значение 0 в точке х = 0, можем записать
Ь и(х) Ь
Jq[u] = jdx J q(^)d^=JQ(u(x))dx,
u(b)
Js[u]= I 8®dZ = S(u{b)).
0
Выпуклость функционала Js[u] означает выполнение неравен-
ства
где щ(х)9 и2(х)£ Сх[а» b]; σ е (0, 1), μ = l-σ, а это равносиль-
но выпуклости (вниз) функции *S(x).
342
9. Формулировка вариационных задач
Как известно [II], критерием выпуклости дифференцируе-
мой функции является неубывание ее производной. Поэтому
функционал Js[u] выпуклый, если функция s(x) не убывает
на [а, Ь].
Условием, достаточным для выпуклости функционала
Jq[u], является выпуклость функции Q(x) или неубывание
функции q{x). Действительно, в случае выпуклой функ-
ции Q(x) имеем
ь
+
υ υ
<UaQ[u1{x)) + ^Q[u2{x)))dx = ci[Q(u1(<x))dx
a a
b
^Q{u2{x))dx = aJq[u1^ + \kJq[u2^
где Ui(x), u2(x)eC1[a,b]; ae(0,l); μ = 1-σ.
Итак, функционал (9.50) является выпуклым при условии,
что функции q(u) и $(и) не убывают. Нетрудно убедиться, что
этот функционал будет строго выпуклым, если функция q(x)
является монотонно возрастающей. Отметим, что строгая мо-
нотонность s(x) не обеспечивает строгой выпуклости функцио-
нала Js[u]9 так как
Js[ou1+(l-a)u2] = aJs[u1] + (l-o)J$[u2]
для любых функций Ui(x)vi и2(х), имеющих одинаковые зна-
чения в точке Ъ.
Вопросы и задачи
9.1. Убедитесь, что соотношения (9.2) и (9.3) удовлетво-
ряют всем аксиомам скалярного произведения и нормы соот-
ветственно.
9.2. Постройте функционал, соответствующий краевой за-
даче для ОДУ (9.32) с краевыми условиями
Вопросы и задачи
343
и (а) - аи(а) = ос, и(Ь) = β,
где α, α, β ε R.
Исследуйте этот функционал на выпуклость и укажите для
него множество допустимых функций.
9.3· Для ОДУ
р{х)и"(х) + q(x)u'(x) + с(х)и(х) = /(х), х е [а, Ь],
с краевыми условиями и(а) = м(&) = 0 укажите требования к
функциям р(х), q(x) и с(х), выполнение которых позволит по-
строить соответствующий этой краевой задаче строго выпук-
лый функционал. На каком множестве функций допустимо
рассматривать этот функционал?
9.4. Постройте функционал, соответствующий краевой за-
даче для дифференциального уравнения
-Аи(х) + с(х)и(х) = f(x), xtV,
где с(х), f(x)e C(V)9 с краевыми условиями (9.36), (9.44).
Укажите множество функций, на которых допустимо рас-
сматривать этот функционал.
10. МЕТОДЫ РЕШЕНИЯ ВАРИАЦИОННЫХ
ЗАДАЧ
10.1. Минимизирующие последовательности
Рассмотрим некоторый функционал J[u] в гильбертовом про-
странстве Н, ограниченный снизу, т. е.
inf JTu] = a>-oo.
ueD(J)
Бесконечную последовательность элементов ипЕ D(J), η ε Ν,
для которой
lim J[un ] = a,
называют минимизирующей последовательностью функцио-
нала J[u].
Построение минимизирующей последовательности позво-
ляет найти наименьшее значение рассматриваемого функцио-
нала. При некоторых дополнительных свойствах функционала
можно утверждать, что минимизирующая последовательность
является фундаментальной в заданном функциональном про-
странстве. В случае полного функционального пространства
это означает, что минимизирующая последовательность {ип}
сходится по норме пространства к некоторому элементу и0.
Этот элемент будет точкой минимума функционала, если
функционал непрерывен.
Квадратичный функционал Js[u] = (Au, it)-2(/, и), соответ-
ствующий операторному уравнению Аи = / с симметрическим
оператором А, задан лишь в области определения D(A) этого
оператора. Всюду в D(A) этот функционал имеет первую вариа-
цию 5c/[u] = 2(Au, 5u)-2(/, 5u). Если А — положительный
оператор, то функционал J[u] строго выпуклый. Если он до-
10.1. Минимизирующие последовательности
345
стигает своего минимума в некоторой точке и+, то эта точка
единственная и является стационарной точкой функционала,
т. е. 5J[u*, 8u] = 0 (см. 9.4, свойства 5 и 6).
Если оператор А, действующий в гильбертовом простран-
стве Н, является положительно определенным, т. е. для не-
которого числа γ > 0 выполняется неравенство (Аи, и) > у2 \\ и \\2,
и ε D(A), то можно ввести энергетическое скалярное произ-
ведение
(u,v)A = (Au,v)7 (ЮЛ)
индуцирующее энергетическую норму
l|ttlL=V(u'u^· (Ю.2)
При этом
Ik Li ^γ II ю II- (ю.з)
Несложно проверить, что введенное таким образом умножение
удовлетворяет всем аксиомам скалярного умножения. С по-
мощью энергетического скалярного произведения квадратич-
ный функционал можно записать в виде
Js[u] = (u,u)A-2(f,u) = \\u\\2A-2(f,u). (10.4)
Его обычно называют функционалом энергии.
Отметим, что из сходимости последовательности ип е D(A)
по энергетической норме* к некоторому элементу ueD(A)
следует сходимость ип —» и и по норме гильбертова простран-
ства, поскольку для положительно определенного операто-
ра А, согласно (10.3),
Ikn-ttll ^уЧки-иЦл- (Ю.5)
Поэтому если D(A) — полное евклидово пространство относи-
тельно энергетического скалярного произведения, то оно яв-
ляется линейным подпространством гильбертова пространст-
ва Η (т. е. замкнутым линейным многообразием)* Если же
D(A) относительно энергетического скалярного произведения
не является полным, то его можно пополнить — расширить
до полного евклидова пространства НА > причем такое попол-
Такую сходимость иногда кратко называют сходимостью по
энергии.
346
10. Методы решения вариационных задач
нение можно провести в рамках гильбертова пространства Н.
Полное евклидово пространство На называют энергетиче-
ским пространством. Нетрудно видеть, что функционал
энергии Js[u] естественным образом продолжается на все ли-
нейное пространство На с помощью той же формулы (10.4).
Теорема 10.1. Если А — положительно определенный опе-
ратор в Η и и0 — решение операторного уравнения Аи = /, то
любая минимизирующая последовательность функционала
энергии сходится к и0.
Μ HycTbAu0 = fn utD(A). Тогда, используя свойства скаляр-
ного умножения и учитывая симметричность и положитель-
ность оператора А, получаем
Js[u] = (u9 и)а -2(Ащ, и) + (и0,и0)А -(и0, и0)А =
= (и-и0, и-и0)А -(щ, и0)А =
= llu-aoiii-iiuoiii>-|u0|ii. (ю.в)
Из этих преобразований видно, что элемент и0 является точкой
минимума функционала Js[u] и значение Js [u0] = -1| и0 ||^ для
функционала наименьшее. При этом
|| и-Щ |i = Js [U] + || U0 Hi = Js [U]-Js [U0].
Если последовательность {ип} является минимизирующей для
функционала Js[u]9 то J8[un]-J8[u0]—>0 при п —> оо. Значит,
и || и-и0 ||^—> 0 при η —> °s т. е. минимизирующая последова-
тельность сходится к uq по энергии. Согласно (10.5), эта по-
следовательность сходится к щ также по норме гильбертова
пространства Н. ►
Напомним, что в случае положительного (в частности,
положительно определенного) симметрического операто-
ра А любое решение операторного уравнения Аи = / является
точкой минимума функционала энергии, и наоборот (см. тео-
рему 9.2), а согласно теореме 9.1, такая точка единственная.
Но вопрос, существует ли такая точка и при каких условиях,
пока открыт.
10.1. Минимизирующие последовательности
347
Теорема 10,2. Функционал энергии имеет в энергетиче-
ском пространстве точку минимума, и притом единственную.
Ч Согласно представлению (10.4), функционал энергии Js[u]
является строго выпуклым, так как в этом представлении
слагаемое 2(/, и) является линейным функционалом и его
можно не учитывать (см. замечание 9.2), а другое слагае-
мое — квадрат нормы — является строго выпуклым функ-
ционалом (см. пример 9.15). При этом, согласно неравенст-
вам Коши — Буняковского и (10.3),
J.[u] = |tt|i-2(/fu)>||*|i-2|/|||u||>
^llullA--2-ll/ILIklL· =IIuIU
«L-p-ll/IL
J
u —>°°.
Нетрудно убедиться, что относительно энергетической нормы
функционал энергии — непрерывный функционал. Действи-
тельно, с учетом неравенства (10.5) имеем
\Js[u + Su]-Js[u]\ =
= ||| и + δα ||i - 2(/, и + 5и) - || и ψΑ + 2(/, ц)| <
<|||tt + 5tt|i-|tt||i| + 2|(f,5tt)| < 2|(ttf5u)A| + |Mi +
н-21| ^[| || S«, || < 21|«. П^П δ«. |U н- II Sx^ Ц5, н-^^И /^ II^H δ«, ||^ ^ О
Υ
при || 6и ||^—> 0. А это и означает, что функционал Js[u] непре-
рывен в произвольно взятой точке ие D(JS).
Итак, функционал энергии непрерывен. Поэтому в силу
свойства 4 (см. 9.4) он достигает наименьшего значения в энер-
гетическом пространстве. Согласно свойству 5 (см. 9.4), точка
минимума у строго выпуклого функционала единственная. ►
Как утверждается в доказанной теореме, функционал энер-
гии достигает наименьшего значения на некотором элементе
щ, причем наименьшее значение функционала равно -1| и* \\\.
Если u+ g D(A), то этот элемент, согласно теореме 9.2, являет-
348
10. Методы решения вариационных задач
ся решением операторного уравнения Аи = f. Но это выполня-
ется не всегда, и если щ <£ D(A), то операторное уравнение не
имеет решений, так как любое решение и0 операторного урав-
нения есть точка минимума функционала J$[u]. Нетрудно по-
казать, что тогда и0 есть точка минимума функционала энер-
гии и в ΗА, т. е. должна совпадать с и*.
Если операторное уравнение Аи = f имеет решение, то его
называют классическим решением. В случае симметрическо-
го положительно определенного оператора А, если оператор-
ное уравнение не имеет решений, интерес представляет точка
минимума и* функционала энергии, ее называют обобщенным
решением уравнения Аи = f.
Напомним, что Ti = L2(Q) есть сепарабельное гильбертово
пространство. Доказано*, что и соответствующее энергетиче-
ское пространство На с Н, будучи линейным подпространст-
вом гильбертова пространства Н, также является сепарабель-
ным. В таком линейном пространстве существует счетный
базис {ит}. При этом, по предположению, D{A) всюду плотно
в Н, следовательно, счетный базис состоит только из элемен-
тов этого множества [IX]. При заданном счетном базисе обо-
бщенное решение представим в виде
со
и* = ^атит, ameR, (10.7)
т=1
где сходимость ряда рассматривается относительно энергети-
ческой нормы.
Если последовательность {ит} является ортонормирован-
ной системой функций гильбертова пространства НА> то ряд
(10.7) будет рядом Фурье по этой системе и его коэффициенты
ат можно найти по формулам Эйлера — Фурье:
ат = (и*,ит )А = (/, ит)9 те N. (10.8)
Последовательность функций
N
uN = ^amum9 NeN, (10.9)
* См.: Треногий В.А.
10.1. Минимизирующие последовательности
349
представляющая собой последовательность частичных сумм
ряда (10.7), сходится по энергетической норме к обобщенному
(или классическому) решению и*. В силу непрерывности функ-
ционала энергии эта последовательность является минимизи-
рующей для функционала Js[u]. Элемент uN при фиксирован-
ном N называют приближенным решением операторного
уравнения Аи = f.
Если счетный базис является ортонормированным, то для
частичных сумм ряда (10.7), являющегося в этом случае рядом
Фурье, верно соотношение \\uN+i -и* \\А < \\uN -и* \\А, N =
= 1, 2, ..., т. е. последовательность {||и#-и*||^} монотонно
убывает. Значит, с ростом числа N функций ит, используемых
в приближенном решении (10.9), точность приближенного
решения (в смысле энергетической нормы) уравнения Аи = f
возрастает.
Однако сходимость минимизирующей последовательности
еще не означает, что
lim ||Autf-/||=0f (10.10)
Ν—>οο
т.е. стремится к нулевому элементу невязка в уравнении Аи = f
при подстановке в него приближенного решения uN. Соотно-
шение (10.10) имеет смысл лишь в том случае, когда ит g
е D(A), m = lJV.
Отметим, что установленные для случая положительно
определенного оператора результаты имеют главным образом
теоретическое значение, поскольку на практике этот слу-
чай встречается достаточно редко. Однако возможность по-
строить минимизирующую последовательность в некотором
сепарабельном гильбертовом пространстве лежит в основе
методов приближенного решения широкого круга приклад-
ных вариационных задач. При этом важно предварительно
убедиться, что это пространство совпадает с множеством до-
пустимых функций для функционала, входящего в вариаци-
онную формулировку конкретной краевой задачи. В качестве
такого пространства обычно можно выбрать множество функ-
ций, интегрируемых с квадратом и весом вместе со своими
производными определенного порядка.
Пример 10.1. Рассмотрим функционал J[u]9 определяемый
соотношением (9.31), в котором р(х) > 0, с(х) > 0 на отрезке
350
10. Методы решения вариационных задач
[а, Ь] и а/а! > 0, β/β! > 0. Областью определения этого функ-
ционала является линейное многообразие Cl[a, b] в гильбер-
товом пространстве L2[a, b]. Введем в Сг[а7 Ь] скалярное про-
изведение по формуле
= ар(а)и(а)у(а) | §р(Ъ)и{Ъ)у{Ъ) |
«1 Pi
ъ
+ \ (p(x)u'(x)v'(x) + c(x)u(x)v(x))dx. (10.11)
При этом выполняются все аксиомы скалярного умножения.
Пополненное относительно скалярного умножения линейное
многообразие Сг[а9 Ь] становится сепарабельным гильберто-
вым пространством, в котором функционал J[u] запишем в
виде
JM-i|,,Mrt*M*>*+SeW^-fiEi»W»), (Ю.12)
2 J nti Ri
а сходимость минимизирующей последовательности этого
функционала рассматривать по норме, индуцированной ска-
лярным произведением (10.11).
Пример 10.2. Функционал J[u] (9.42) определен на линей-
ном многообразии D(J) = C1(V)f\C(V) в гильбертовом про-
странстве L2(V). Он является выпуклым при k(x) > 0, х € V,
и a(#)/ai(#) > 0, х е Sh (см. пример 9.18). В D(J) введем ска-
лярное произведение
(и, v)= \kVu4vdV+ \ — uvdS. (10.13)
ν sh
После пополнения относительно введенного скалярного умно-
жения получаем сепарабельное гильбертово пространство, в
котором функционал запишем в виде
J[u] = -\\u\\2-(fudV- [—hudS. (10.14)
2 J J аг
10.2. Методы приближенного решения вариационных задач 351
Сходимость минимизирующей последовательности этого
функционала удобно рассматривать относительно нормы, ин-
дуцированной введенным скалярным произведением. #
Характерной особенностью записи функционалов в виде
(10.12) и (10.14) является то, что в них как слагаемое входит
квадрат нормы. Именно это слагаемое определяет строгую
выпуклость функционала и тем самым единственность его
стационарной точки. Такая запись оказалась возможной бла-
годаря введению соответствующего скалярного произведения.
Однако в случае функционала (9.50), отвечающего нелиней-
ной краевой задаче, не удается ввести подобное скалярное
произведение. Поэтому сходимость минимизирующей после-
довательности этого функционала приходится рассматривать
относительно нормы, индуцированной исходным скалярным
произведением в гильбертовом пространстве Ζ/2(Ω).
10.2. Методы приближенного решения
вариационных задач
Пусть линейный оператор А, действующий в сепарабельном
гильбертовом пространстве Н, является положительно опре-
деленным с областью определения D(A), всюду плотной
в Н. Тогда D(A) можно пополнить до энергетического про-
странства На- Последовательность приближенных решений
йдг операторного уравнения Аи = f будем искать в виде после-
довательности частичных сумм ряда (10.7):
N
uN = ^amum, N=1,2,..., (10.15)
т=1
где {ит} — счетный базис в На-
В 10.1 показано, что {iiN} является минимизирующей по-
следовательностью функционала, сходящейся к обобщенному
решению по энергетической норме.
В силу введенной в На энергетической нормы для элемен-
та uN вычислим
Ν Ν
\\^\\2А=^ап^^т(ит9ип)А. (10.16)
п=1 т=\
352
10. Методы решения вариационных задач
Если счетный базис {ит} является ортонормированной сис-
темой функций в НА, то (10.16) можно упростить:
N
\\йм\\2А=^а2\\ип\\2А. (10.17)
т=1
В этом случае коэффициенты ат можно найти по формулам
Эйлера — Фурье (10.8). Однако построение ортонормирован-
ной системы (например, с помощью процесса ортогонализа-
ции Грама — Шмидта из некоторого исходного счетного ба-
зиса) — достаточно трудоемкий процесс. Способ нахождения
коэффициентов ат для произвольного счетного базиса в НА
называют методом Ритца. Суть метода состоит в следующем.
Если подставить (10.15) вместо и в квадратичный функцио-
нал Js[u]=\\u\\^ -2(f, и), достигающий на обобщенном реше-
нии и* g Н,А своего наименьшего значения, то, учитывая
(10.16), получим многочлен N переменных второй степени
Js[uN] = \\uN\\2A-2(f,uN) =
Ν Ν Ν
n=l m=l m=l
относительно коэффициентов ат, т = 1, N, определяющий
дифференцируемую функцию в RN. Поскольку квадратичный
функционал ограничен снизу, то эта функция также ограни-
чена снизу и достигает минимума при некотором наборе зна-
чений коэффициентов ат. Для нахождения этих значений
можно использовать необходимые условия минимума функ-
ции многих переменных:
В результате получим СЛАУ
N
^(ит, ип)Аап =(/, ит), m = l,N. (10.18)
п=1
Матрицей СЛАУ (10.18) является матрица Грамма для
системы функций um, т = 1, N, относительно энергетического
10.2. Методы приближенного решения вариационных задач 353
скалярного произведения. Эта матрица не вырождена, по-
скольку элементы ит9 m = l,N, линейно независимы [IV].
Поэтому СЛАУ (10.18) имеет единственное решение aUjNj
η = 1, iV. Второй индекс в обозначении коэффициентов αη^Ν
показывает, что они, вообще говоря, зависят от N.
Пример 10.3. Из курса сопротивления материалов известно,
что зависимость от продольной координаты х прогиба w(x)
упругой балки, нагруженной распределенной по ее длине
поперечной нагрузкой q(x), удовлетворяет ОДУ
d2 („га2ю(х)Л
dxa
EJ-
dxa
)
= g(x), хе[0, £],
(10.19)
где Ε — модуль упругости материала балки; J — момент инер-
ции поперечного сечения балки; / — длина балки.
Произведение Ε J характеризует жесткость балки на изгиб.
Примем, что EJ = const, q(x) =
= q = const, а концы балки име-
ют шарнирные опоры (рис. 10.1),
т. е. в точках х = 0 и х = I равны
нулю прогиб и кривизна изогну-
той продольной оси балки:
w(x)
Рис. 10.1
w(0) = w(l) = w"(Q) = w"(l) = 0.
(10.20)
Для принятых предположений дифференциальное урав-
нение (10.19) является операторным уравнением Aw(x) = g,
определяемым линейным дифференциальным оператором
A-dAjdxA и граничными условиями (10.20). Функцию w(x)
можно найти, последовательно интегрируя уравнение u;IV = q9
где q =q/(EJ)j и учитывая граничные условия:
w"(x) = qx + Cl9 w"(x) = ^х2+С1х + С2, C2 = 0, Сг = -^-,
La О
6 4
х2+С3,
w(x) = -?-x4-^xs+C3x + C4,
24 12
354
10. Методы решения вариационных задач
В итоге получаем уравнение изогнутой продольной оси балки:
w(x) = ^-(5c4-2x3+x), jc = -g[0,1]. (10.21)
Из симметрии условий закрепления и нагружения балки сле-
дует, что максимальный прогиб u>max балки будет в ее середи-
не, т. е. при # = 1/2. В этом можно убедиться и формальным
путем, если исследовать на экстремум функцию w(x). Из
(10.21) при х = 1/2 следует хорошо известный из курса сопро-
тивления материалов результат:
Располагая точным решением краевой задачи для уравне-
ния wIV(x) = q с граничными условиями (10.20), применим
для ее решения метод Ритца. Для этого предварительно выяс-
ним область определения оператора А = d4/dx4 и его свойства·
В качестве области определения оператора А примем мно-
жество Cq[0, l] четырежды непрерывно дифференцируемых
функций, удовлетворяющих однородным граничным услови-
ям (10.20). Это множество является линейным всюду плотным
многообразием в гильбертовом пространстве L2 [0, Ζ]. Убедим-
ся, что оператора с заданной областью определения является
симметрическим. В самом деле, для произвольных функ-
ций w9 v g D(A), последовательно интегрируя по частям, по-
лучаем
i
(Aw, ν) = v(x)w1Y(x)dx = v(x)wm(x) |
- v\x)wm(x)dx = -v\x)w\x)\ + (-v\x)w\x))dx =
о о
I
= v"(x)w'(x)\ - v"(x)w'(x)dx = -v"(x)w(x)\ +
I
+
0
\vlY(x)w(x)dx= \vTV(x)w(x)dx = (Av, w).
10.2. Методы приближенного решения вариационных задач 355
Также последовательным интегрированием по частям для
произвольной функции w е D(A) находим
I
(Aw, w) = w(x)wlY(x)dx =
= w(x)wfff(x)\ - w'(x)w™(x) dx = -w'(x)w"(x) I
+ w"(x)w"(x)dx - (w"(x)) dx>0.
Из равенства (Aw, w) = 0 следует, что w"(x) = 0, т. е. w(x) =
-С1х-\-С2ш Но из граничных условий (10.20) получаем С\ = С2 = 0.
Поэтому w(x) = 0 и оператор А является положительным.
Можно доказать", что оператор А с заданной областью опре-
деления является и положительно определенным, т. е. для
9 II II2
некоторого числа γ > 0 верно неравенство (Aw, w) > ψ || w || ,
w g D(A).
Поскольку операторное уравнение с симметрическим и
положительным оператором А имеет в D(A) решение (10.21),
то квадратичный функционал Js[w] = (Aw, w)-2(q,w) на этом
решении, согласно теореме 9.2 о квадратичном функционале,
достигает своего наименьшего значения· Приближенное реше-
ние этого операторного уравнения представим в виде
N
Σ γ
ansinnnx, х=— ε [0,1], (10.22)
п=\ l
и отметим, что ivN удовлетворяет всем граничным условиям
(10.20)· Подставляя (10.22) в функционал Js[u>] и учитывая
вид скалярного произведения в гильбертовом пространстве
L2[0,1], получаем функцию N переменных
Js[wN] = (Awn,wN)-2(q, wN) =
Ν Ν 1 Ν 1
= Σα" Σα™ (sin/7Z7l^)IVsinn7l^^^"2^^m qsinmnxdx =
/1=1 /71 = 1 0 /71 = 1 0
См.: Ректорис К.
356
10. Методы решения вариационных задач
Ν / λ4 JV
= Σα" — \am\sinmnxsinnnxdx-
л=1 ν / m=l
- Ν
.jjlylzHT (1023)
71 ** m
m=l
1
—, m = n;
2
О, тФп.
относительно коэффициентов ат9 т = 1, N9 являющуюся мно-
гочленом второй степени.
Система функций {sinnnx} на отрезке [0,1] ортогональная
(но не ортонормированная):
1
sinmnxsinnnxdx -
о
Поэтому в данном случае необходимое условие минимума
функции (10.23) приводит к СЛАУ с диагональной матрицей,
что позволяет записать явное выражение для каждого коэф-
фициента:
ап=21~^1}П qlA9 ne N. (10.24)
(ппу
Отметим, что коэффициенты ап не зависят от количества N
рассматриваемых функций счетного базиса, что является след-
ствием ортогональности счетного базиса. Это означает, что
формулы (10·24) дают точные, а не приближенные значения
коэффициентов.
Если в (10.22) ограничиться лишь одним первым слагае-
мым, то получим
4 ol^ titix
u?i =a,isinnx = —-qlA sin nx~ 0,013071 sin .
π5 EJ I
Это приближенное решение для максимального прогиба балки
при #=1/2 дает значение wmax~ 0,01307lql*/(EJ), которое
отличается от значения штах, полученного из точного решения
(10.21), менее чем на 0,5 %.
Характерно, что при η = 2 имеем а2 = 0, т. е. функция
sin27tx, будучи нечетной при переносе начала координат на
рис. 10.1 в точку х = 1/2, «не участвует» в формировании при-
ближенного решения задачи, симметричной относительно
этой точки. Из (10.24) видно, что такая же «участь» постигнет
в (10.21) все слагаемые с четными номерами.
10.2. Методы приближенного решения вариационных задач 357
Для η = 3 имеем α3 = 4<?Ζ4/(3π)5 ~0,000054g/4/(£J) и
_ 4 _;4 . _ 4 _
π5 (3π)£
i£3 = α2 sin их + α3 sin Зях = —ql4 sin π# + ql4 sin 3tix =
4ql4
π5£J
f nx 1 Snx^\
sin — + sin
V
/ 243 I
В точке х = Z/2 получаем значение й)3 * 0,013017 с пятью вер-
ными знаками после запятой, совпадающее со значением штах,
вычисленным по точному решению. #
Метод Ритца можно использовать для нахождения прибли-
женного решения не только в случае квадратичного функцио-
нала. Процедура этого метода применима и тогда, когда не
удается построить строго выпуклый функционал по вариаци-
онному уравнению, соответствующему заданному операторному
уравнению А(и) = /. Пусть в этом случае область определения
D(A) оператора А() (необязательно линейного) является всюду
плотной в сепарабельном гильбертовом пространстве Η и из-
вестна такая система {ит} функций ит е D(A), m e N, образу-
ющая счетный базис в Н, что система {vm} функций vm =
= А(ит) также образует счетный базис в И. Это означает, что
любой элемент / е Η можно представить в виде ряда
'=Σ
cmvm, cmeR. (10.25)
т=1
Рассмотрим функционал
F[u] = \\A(u)-ff, (10.26)
который достигает наименьшего (нулевого) значения на эле-
менте и* е D(A) (если он существует), удовлетворяющем опе-
раторному уравнению, т. е. Аи* = f. Приближение к этому
элементу будем искать в виде
N
u*N = ^bmum9 fcmeR, ATeN. (10.27)
Подставив (10.27) в (10.26), получим неотрицательную функ-
цию N переменных Ьи Ь2> ..., bN:
358
10. Методы решения вариационных задач
ф19...,Ъя) = ПиИ = \А{иЪ)-^ =
N
^ЬтиГ1
т=1
-/
(10.28)
Значения переменных в точке минимума можно найти одним
из методов конечномерной оптимизации [XIV] исходя из ус-
ловия
^i^^9bN) = \\A(u%)-f
->inf.
(10.29)
При этом в общем случае выполнение условия (10.29) не га-
рантирует существование единственного элемента и%.
Если оператор А линейный, то функция cp(&i, ..., bN) будет
многочленом второй степени от переменных Ъ\> ..., bN и9 сле-
довательно, дифференцируемой в R^. Значения переменных,
обеспечивающих минимум этой функции, должны удовлетво-
рять необходимым условиям минимума:
3φ
dh
= 0, m = l,N.
т
Отсюда получаем СЛАУ
N
^f(vm9vn)bn=(f9vm)9
л=1
m = ljN9
(10.30)
имеющую единственное решение, поскольку ее матрица яв-
ляется матрицей Грама относительно скалярного произведе-
ния в Η для системы линейно независимых элементов vm е Н,
т = 1, N. В случае положительно определенного оператора А
можно доказать*, что последовательность элементов и^-
(10.27), для которых коэффициенты Ьт являются решением
СЛАУ (10.30), сходится в 7ΥΑπο энергетической норме, а зна-
чит, и по норме гильбертова пространства, к обобщенному
решению и* уравнения Аи = /. При этом, согласно (10.29),
Au*N —> f при N —> °о.
Описанная процедура приближенного решения оператор-
ного уравнения характерна для метода наименьших квадра-
тов. Несложно убедиться, что при использовании данного
метода для нахождения коэффициентов αη(ηε Ν) в прибли-
женном решении (10.22) краевой задачи, рассмотренной в
примере 10.3, придем к тому же выражению (10.24).
* См.: Ректорис К.
10.3. Собственные значения симметрического оператора 359
Если известно, что обобщенное решение и* операторного
уравнения Аи = / с положительно определенным оператором А
совпадает с классическим решением этого уравнения, т. е.
u*e D(A) и Au* = f, то функционал
Ф[и] = (Аи, и)-2(/, и) +|| Au-f ||2, ие D(A),
достигнет своего наименьшего значения именно на элементе
и* (см. 10.1). Применение метода Ритца для построения ми-
нимизирующей последовательности {йп} функционала Ф[и]
из элементов вида (10.15) при произвольном счетном базисе
в Η приводит к методу Куранта*. Для метода Куранта со-
храняет силу соотношение (10.10) без использования ортого-
нального базиса из собственных элементов оператора А. При-
менение этого метода для вычисления коэффициентов
ап(пе Ν) в приближенном решении вида (10.22) краевой за-
дачи из примера 10.3 снова приведет к (10.24).
Отметим, что метод Ритца позволяет использовать счетный
базис, элементами которого могут быть функции, принимаю-
щие ненулевые значения лишь в отдельных подмножествах
области определения оператора. Такая возможность реализо-
вана, например, в методе конечных элементов.
10.3. Собственные значения симметрического
оператора
Одной из распространенных прикладных задач является так
называемая проблема собственных значений линейного опера-
тора, входящего в формулировку краевой задачи. Эта задача
состоит в нахождении ненулевых решений однородного опе-
раторного уравнения с однородными граничными условиями.
Ее решение может быть получено вариационными методами.
Напомним, что ненулевой вектор х произвольного линейно-
го пространства С называют собственным вектором линей-
ного оператора (иногда собственным элементом оператора) А,
действующего в £, если для некоторого числа λ верно равен-
ство Ах = Хх. При этом число λ называют собственным значе-
нием (или собственным числом) линейного оператора А.
* Рихард Курант (1888-1972) — математик, родившийся в Польше и
работавший до 1933 г» в Германии, а затем в США.
360
10. Методы решения вариационных задач
В случае конечномерного линейного пространства С соб-
ственные значения λ — это все такие числа, для которых опе-
ратор А - λΙ (Ι — тождественный оператор) не имеет обратно-
го, т. е. необратим· В случае бесконечномерного пространства
оператор А - XI может не иметь ограниченного обратного опе-
ратора* хотя бы по одной из двух причин:
а) оператор А - XI не является инъективным (взаимно од-
нозначным). Это равносильно тому, что уравнение (А - Х1)х -
= 0 имеет ненулевое решение, или, другими словами, число λ
является собственным значением оператора;
б) образ оператора А - λΙ не совпадает со всем пространст-
вом С.
Совокупность всех тех λ, при которых оператор А - λΙ не
имеет ограниченного обратного, называют спектром линейно-
го оператора А. Спектр естественно разделяется на две части:
дискретную и непрерывную·
В ряде случаев линейный оператор не имеет непрерывного
спектра, а дискретный спектр можно представить как некото-
рую последовательность значений λη9 пе N. Отметим, что соб-
ственные векторы действующего в евклидовом пространстве Ε
симметрического оператора А, отвечающие различным собст-
венным значениям, ортогональны. В конечномерном случае
(тогда А является самосопряженным оператором) это доказа-
но в [IV], но доказательство на самом деле не связано с раз-
мерностью линейного пространства и проходит в произволь-
ном евклидовом пространстве. Естественно, возникает вопрос,
можно ли из собственных векторов линейного оператора со-
ставить базис линейного пространства? В бесконечномерном
сепарабельном гильбертовом пространстве под базисом пони-
мают любую полную (или замкнутую, что одно и то же) ли-
нейно независимую систему [IX].
Задача определения собственных значений линейного опе-
ратора возникает во многих прикладных задачах. В [XI] рас-
смотрена задача поиска собственных значений и собственных
функций оператора Штурма — Лиувилля, играющая большую
роль в решении многих уравнений математической физики
rf Линейный оператор А в нормированном пространстве С называют
ограниченным оператором, если для некоторого числа К > 0 верно
неравенство ||Ая|| < К\\х\\, х е С. Наименьшее из таких чисел называют
нормой оператора.
10.3. Собственные значения симметрического оператора 361
[XII]. К аналогичной задаче приводит изучение собственных
(свободных) колебаний механических систем. С проблемой
собственных значений сталкиваются и при изучении вопросов
устойчивости механических систем.
Проблему собственных значений можно свести к решению
некоторой вариационной задачи. Если симметрический опе-
ратор А, действующий в евклидовом пространстве £, удовлет-
воряет неравенству (Ащ u)>k\\u ||2 (ke Ш) для любого вектора
ие 8, его называют оператором, ограниченным снизу. Ясно,
что при k > 0 этот оператор является положительно опреде-
ленным, а при k = 0 — положительным. Число
. (Ащи)
a = mf >k
и*о (и, и)
тесно связано с собственными значениями симметрического
оператора. Для любого собственного значения λ имеем λ > α,
так как
. (Аи, и) (Аиъих) (Хих,их) Х{их,их)
а = mf < = = = λ,
u*0 (щи) (uXyUX) (иХ, UX) (ик9 иХ)
где их — собственный вектор, отвечающий собственному зна-
чению λ.
Теорема 10.3. Если симметрический оператор А ограничен
снизу и для некоторого вектора и0
(Аи0,и0) . „(Ащи)
= a = mf , и ε D(A),
(и0,и0) **о (и, и)
то α есть наименьшее собственное значение оператора А, а
указанный вектор и0 — собственный вектор А, отвечающий
собственному значению а.
Ч Рассмотрим оператор В = А - а/. Тогда
(Ви, и)= ((A-aJ)u, и) = (Ащ и)-а(щ и)>0,
т. е. Б — неотрицательный оператор. При этом
(Ви0, и0) = (Аи0, и0)-а(и0, и0) = 0.
Пусть ν — произвольный вектор. Используя свойство симмет-
ричности оператора Б, вытекающее из симметричности А,
получаем в силу неотрицательности Б, что
362
10. Методы решения вариационных задач
(В(и0 + tv),uQ + tv) = (Ви0, u0) +
+2t(Bu0, v) +12 J ν f = t2 J ν f + 2t(Bu0 ,v)>0.
Но такое неравенство будет верным при любых t только в слу-
чае, когда (Ви0, ν) = 0.
Итак, (Ви0, ν) = 0 для любого вектора υ. Взяв, в частности,
υ = Вщ, имеем ||-Ви0||2 = 0, откуда Ви0 = 0. Рассматривая опе-
ратор А, приходим к выводу, что (А - al)u0 = 0, или Ащ = ащ.
Таким образом, вектор щ является собственным для А и отве-
чает собственному значению а. Как уже показано, все собст-
венные числа λ удовлетворяют неравенству λ>α. Значит,
α — наименьшее собственное значение· ►
Доказанная теорема позволяет переформулировать задачу
определения наименьшего собственного значения ограничен-
ного снизу симметрического оператора как задачу поиска на-
именьшего значения функционала:
(Аи, и)
J[u] = — -> inf. (10.31)
(it, и)
Этой задаче можно придать другую формулировку· Очевидно,
что
. (Ащ и) (Ащ и)
inf < mi .
и±0 (щ и) ||»||=1 (Щ U)
Но
(Ащ и) _ (Ащ и) ( J и } и Л
(и, и) || и
112
и
V V" V
и
= (Ащ,щ),
где вектор щ = и/||и|| удовлетворяет соотношению ||и0|| = 1.
Поэтому на самом деле
Л (Ащ и)
inf = inf (Аи, и).
и*0 (щ и) \\и\\=1
Таким образом, наименьшее собственное значение симмет-
рического оператора найдем, решая вариационную задачу для
функционала J[x] = (Ах, х):
(Ах,х)->Ш, |*|| = 1. (10.32)
10.3. Собственные значения симметрического оператора 363
Пусть спектр симметрического ограниченного снизу опера-
тора А состоит из последовательности λ1? ...,λΛ, ... собственных
значений, причем все они простые, т. е. соответствующее соб-
ственное подпространство оператора одномерно. Предполо-
жим, что наименьшее собственное значение λ! и отвечающий
ему собственный вектор Х\ найдены, например, как решение
задачи (10.32). Тогда ортогональное дополнение Н1 к собст-
венному подпространству Η = span^} оператора А является
инвариантным подпространством этого оператора. Значит,
можно рассмотреть ограничение оператора А на подпростран-
ство Н1 и поставить задачу вида (10.32), но с дополнительным
ограничением:
(Ах, х) —> inf, ||*||=1, (х,Х\) = 0. (10.33)
У ограничения оператора А на Н1 спектр будет состоять из
последовательности собственных значений λ2, λ3,... . Поэтому
если задача (10.33) имеет решение, то это решение даст соб-
ственное значение λ2 и соответствующий ему собственный
вектор #2, так как поиск наименьшего значения в (10.33) про-
исходит на подмножестве множества, определяемого в (10.32)
равенством ||дс|| = 1, то λ2 > λ^
Описанный процесс можно продолжить. На η-м шаге, зная
собственные значения λ1? ..., λη_1 и соответствующие им соб-
ственные векторы хъ .·., xn_i, решаем задачу
(Аде, *)—>inf, || л: || =1, (#, Χλ) = ... = (Χ, хп^) = 0.
Если эта задача имеет решение, то оно даст собственное зна-
чение λη и соответствующий ему собственный вектор хп. Ясно,
что λη >λη_1. Если симметрический оператор А положительно
определенный, т. е. (Ах, х) > у2 \\ х ||2 при х φ 0, то все его соб-
ственные значения положительны (не меньше γ2).
Замечание 10.1. Множество X в сепарабельном гильберто-
вом пространстве Η компактно, если любая последователь-
ность {хп} cz X содержит сходящуюся (по норме пространства)
подпоследовательность. Аналогично, используя сходимость по
энергии, можно ввести понятие множества, компактного по
энергии. Компактное множество является ограниченным и
замкнутым. В конечномерном пространстве эти два условия
являются и достаточными, но в бесконечномерном простран-
364
10. Методы решения вариационных задач
стве это уже не так. Множество, имеющее компактное замы-
кание, называют предкомпактным.
Линейный оператор А называют компактным (вполне не-
прерывным), если он любое ограниченное множество отобра-
жает в пред компактное. Вполне непрерывный оператор непре-
рывен, но не всякий непрерывный оператор является вполне
непрерывным. В гильбертовом пространстве H = L2[a9 b] ком-
пактным является оператор вида
ь
А[у(х)] = ]К(х, t)y(t)dt, xe [α, fc],
а
где К(х, t) — непрерывная функция на множестве [а, Ь]х [а, Ь].
Если К(х, t) = K(t, х), то указанный оператор симметри-
ческий, а его спектр представляет собой последовательность
{λη}, сходящуюся к нулю. При этом каждому значению λη φ Ο
соответствует конечномерное собственное подпространство.
Линейные дифференциальные операторы, как правило, не
являются непрерывными, а тем более вполне непрерывными.
Однако в ряде случаев линейный дифференциальный опера-
тор А имеет обратный оператор, являющийся вполне непре-
рывным. Тогда оператор А имеет спектр из последовательно-
сти собственных значений, стремящейся к °о [XI]. Примером
такого дифференциального оператора является оператор
Штурма — Лиувилля.
Пример 10.4. Рассмотрим задачу на собственные значения
d2u
-^-4 = Хи9 *е[0,1], и(0) = и(1) = 0.
dxl
Эта задача представляет собой задачу Штурма — Лиувил-
ля. Ее операторное уравнение Аи = Хи определяется линейным
d2
дифференциальным оператором А = -, который действует
ахг
в L2[0,1], определен на множестве Cq[0,1] функций, дважды
непрерывно дифференцируемых на [0, 1] и удовлетворяющих
граничным условиям задачи. Этот оператор симметрический
и положительно определенный (см. примеры 9.7 и 9.10). По-
ложительная определенность оператора означает, что он
10.3. Собственные значения симметрического оператора 365
ограничен снизу, причем в качестве константы k можно взять
нуль.
Задача Штурма — Лиувилля решается аналитически. Соб-
ственными значениями оператора А являются числа λη = η2π2,
а ортонормированная система собственных функций имеет
вид [XI]
(рп(х) = V2sinnnx, п= 1, 2, ... .
Выясним, как выглядит вариационная формулировка задачи
Штурма — Лиувилля. Для произвольной функции ие Cq[0, 1],
согласно (9.14) с учетом с = 0, имеем
(Аи, и) = (и(х)) dx.
о
Поэтому наименьшее собственное значение λΧ = π2 является
решением вариационной задачи
1 1
(u'(x)) dx^min, (ы(х)) dx = l> u(0) = u(l) = 0. #
о о
Отметим, что в прикладных задачах возникает необходи-
мость находить ненулевые решения операторного уравнения
вида
Аи~ХВи = 0 (10.34)
с однородными граничными условиями, где А — симметриче-
ский оператор, а В — положительно определенный, причем
D(A) cz D(B). Если в области определения D(B) оператора В
с помощью соотношения ||и||я = (Ви, и)1/2 ввести энергетиче-
скую норму ||-|[в, то наименьшее собственное значение λΧ и
соответствующий ему собственный элемент и\ будут решени-
ем вариационной задачи
(Аи, и) ->inf, ||u||B = l. (10.35)
Это можно показать, незначительно модифицировав доказа-
тельство теоремы 10.3. Аналогично (10.33) для следующего
по возрастанию собственного значения и соответствующего
ему собственного элемента получим задачу
(Аи, и) —> inf, || и \\в = 1, (Ви, щ) = 0,
366
10. Методы решения вариационных задач
так как векторы щ и и2, отвечающие различным значениям
λλ и λ2, ортогональны относительно энергетического скаляр-
ного произведения, порожденного оператором В (доказатель-
ство этого аналогично доказательству ортогональности собст-
венных векторов, отвечающих различным собственным зна-
чениям)· Последовательно можно найти собственные значения
λΧ, ..., λη_1 и отвечающие им собственные элементы иъ ...,
un-i. Тогда собственное значение λη и соответствующий ему
собственный элемент ип будут решением задачи
(Аи, и)->inf, || и\\в= 1, (Виу ui) = ... = (Bu, ип^) = 0.
ЮЛ. Приближенное решение задачи
на собственные значения
Задачу на собственные значения ограниченного снизу симме-
трического оператора Ах можно свести к задаче на собствен-
ные значения для положительно определенного оператора А.
Действительно, если выполнено неравенство (Ах> х) > й||я||2,
то оператор Аг=А- krI, где К < k, а / — тождественный опе-
ратор, является положительно определенным, так как
(Aix, x) = {Ax-kfxy x) = (Ax, x)-k\xj #)>(&-&')|λ:| >0.
При этом, если λ — собственное значение оператора А, ах —
соответствующий собственный вектор, то А±х = Ах - k'x =
= Хх - k'x = (λ - k')x. Значит, х является и собственным век-
тором оператора Аь а соответствующее этому вектору собст-
венное значение оператора Ах равно λ - k'.
Итак, можно ограничиться рассмотрением лишь положи-
тельно определенного оператора А, все собственные значения
которого положительны. Покажем, как вариационная задача
(10.32) нахождения наименьшего собственного значения тако-
го оператора А может быть решена методом Ритца.
Рассмотрим последовательность {еп} векторов из области
D(A) определения оператора А, линейно независимую и полную
относительно энергетической нормы, порожденной операто-
ром А. Образуем линейную комбинацию д:^ =^i^i +... + aNeN,
коэффициенты в которой подберем так, чтобы
10.4. Приближенное решение задачи на собственные значения 367
(AxN9xN) = \\xN\\A ->inf, (Χν>*ν) = \\*ν\\ = 1> (10.36)
т. е. наименьшее значение энергетической нормы ||х#11а будем
искать в линейной оболочке конечной системы векторов ех,
..., eN. Это приводит к поиску наименьшего значения дейст-
вительной функции N переменных аъ а2, ..., О/у, имеющей
вид
N N
f(au ...,aN) = (AxN, xN) = ^^(Ae )anam> (10.37)
n=lm=l
при ограничении
Ν Ν
(л:]У,л:Лг) = ^^(еп,ет)а7гат=1. (10.38)
n=lm=l
Поставленная задача имеет решение, поскольку непрерыв-
ная функция N переменных достигает своего наименьшего
значения на замкнутом ограниченном множестве [V]. Восполь-
зуемся методом множителей Лагранжа. Функция Лагранжа
имеет вид Ф = (Ахм, Xn)~Mxn> xn)> Необходимое условие экс-
тремума этой функции дает
^ = ^((Aen9em)-X(enJem))an=0y m = IjV. (10.39)
0(lm я=1
Согласно ограничению (10*38), искомое решение однород-
ной системы (10.39) линейных алгебраических уравнений
должно быть ненулевым, т. е. определитель ее матрицы дол-
жен равняться нулю:
(Ael9 ex)-X{el9 <?i) ... (AeN, βλ)-λ{βΝ, ex)
(Аеъ е2)-Х(еъ е2) ... (AeN9 e2)-X(eN, e2)
(Аеъ eN)-X(el9 eN) ... (AeN, eN)-X(eN, eN)
= 0. (10.40)
Так как система {еп}9 η = 1, Ν9 линейно независима, то ма-
трица Грама для векторов еъ ..., eN невырождена. Значит,
в (10.40) коэффициент при λ^, равный по абсолютному значе-
нию определителю матрицы Грама, не равен нулю.
368
10. Методы решения вариационных задач
Пусть λ0 — один из корней алгебраического уравнения
(10.40) ЛГ-й степени. Подставим λ0 в систему (10.39) и найдем
ее ненулевое решение (а^, а\,..., а^ 1, определяемое с точно-
стью до числового множителя. Этот числовой множитель по-
зволяет выбрать решение так, что будет выполнено условие
нормировки, т. е. можно считать, что
Ν Ν
ΣΣ(6-β-)αΜ=1· (10-41)
п=1т=1
Подставив значения α£, η = 19 Ν, и λ0 в (10.39), получим
тождества
Ν Ν
^(Аеп, ет)а% =λ0 ^(еп, ет)а%, т =1, N.
п=1 п=1
Умножим их на а% и просуммируем по т:
Ν Ν Ν Ν
т=1п=1 т=1п=1
Вследствие (10.41) правая часть этого соотношения равна λο·
Поэтому для вектора х^ =a^ei+... + a^eN имеем
Ν Ν
(Ax°N, x°N)= ££(Ае„, ет)а°па°т =λ0.
m=ln=l
Чтобы найти решение задачи, необходимо выбрать наи-
меньший корень Лдг алгебраического уравнения (10.40) и вы-
числить соответствующий этому значению вектор xN. Увели-
чивая N, получим последовательность {к^} значений Хдг
(N e N) и последовательность {х^} соответствующих им век-
торов. Так как при возрастании N множество, на котором идет
поиск наименьшего значения в (10.36), расширяется, после-
довательность {λ^} не возрастает, причем λ^ > α, где α — на-
именьшее значение функционала в вариационной задаче
(10.32)· Значит, существует предел lim λ^ > α. Можно пока-
зать, что на самом деле этот предел равен а, т. е. последова-
тельность fax) является минимизирующей.
10.4. Приближенное решение задачи на собственные значения 369
Чтобы найти следующее по возрастанию после λ^ собст-
венное значение оператора А, решаем вариационную задачу
(AxN ,*#)-> inf, (xN 9xN) = l9 (x% ,xN) = 0
на линейной оболочке системы векторов еь ..., eN> что приво-
дит к поиску наименьшего значения той же функции (10.37)
N переменных при ограничениях
Ν Ν Ν Ν
^^(еп^т)апат=19 ΣΣ^"' ет)а°ат =0,
п=1т=1 п=1т=1
которые вытекают из формулировки задачи (10.33).
Пример 10.5. В задаче Штурма — Лиувилля найдем при-
ближенные значения двух младших собственных чисел,
выбрав в качестве счетного базиса последовательность
uk(x) = (l-x)xk, feeN.
Взяв первые две функции счетного базиса, вычислим эле-
менты определителя второго порядка в характеристическом
уравнении (10.40). Для этого последовательно находим
(Wi,Ui) = , (Ui,U2)= , (^2>^2) = >
(Аи1,и1) = -, (Aul9u2) = -, (Aw2,u2) = —.
о о 15
Таким образом, в данном случае уравнение (10.40) имеет вид
3 30
6 60
Ι_λ·— —-λ —
б 60 15 105
= 0.
Раскрывая в этом уравнении определитель, получаем квадрат-
ное уравнение второго порядка:
1 λ2_^λ + 1 = 0.
420
105
370
10. Методы решения вариационных задач
Его решениями являются Xi =10 и λ 2 = 42. Точные значения
первых двух собственных чисел равны λΧ = π2 « 9,8696, λ2 =
= 4π2 » 39,4784. Нетрудно убедиться, что точность получен-
ных приближений находится в пределах 1,5 % для первого
собственного значения и в пределах 2,6 % для второго соб-
ственного значения. Отметим избыточный характер прибли-
жений. #
Применение метода Ритца для нахождения любого собст-
венного значения положительно определенного оператора А
обеспечивает приближение сверху. Однако на практике на-
ряду с оценкой собственного значения сверху не менее важ-
но иметь его оценку снизу. Наличие двусторонней оценки
собственного значения позволяет контролировать сходимость
приближенного решения и иметь представление о возможной
погрешности этого решения.
Оценку сверху собственного значения λ^ симметрического
оператора А получим, используя произвольный ненулевой эле-
мент и (\\и\\ > 0) из области определения D(A) этого оператора.
Действительно, в силу теоремы 10.3
- (Аи,и) ЛАщи)
Ai = >inf , ueD(A).
(и, и) и*о (и, и)
Если оператор А положительный, то оценку снизу для λλ
можно найти, располагая такой гарантированной оценкой λ2
снизу следующего собственного значения λ2, что Xi <λ2 <^2*
Тогда, вычислив предварительно по указанному выше нену-
левому элементу и ε D(A) значение
(Аи, Аи)
к- ,
(Аи, и)
придем в итоге к неравенству [XIII]
■| УС-к\
<λ!<λ1, (10.42)
которое имеет смысл при условии λ\ < κ. Это условие выпол-
няется, поскольку в силу неравенства Коши — Буняковского
\(Аи, и)\ < ||Аи|| * ||u||. Для положительного оператора λΧ > 0,
поэтому применение (10.42) эффективно лишь в случае, если
Вопросы и задачи
371
гарантированная оценка снизу для λ2 такова, что >τ<λ2.
В противном случае левая часть в (10.42) будет неположи-
тельной.
Вопросы и задачи
10.1. Исследуйте свойства оператора
тг π d ( Гл du\
J[u] = VI + х— ,
определенного на множестве Cq[0, 1] функций и(х), дважды
непрерывно дифференцируемых на [0,1] и удовлетворяющих
краевым условиям и(0) = и(1) = 0.
10.2. В задаче на собственные значения
-—[ Л+* — | = λα, хе [0,1], и(0) = и(1) = 0
dxу dx J
найдите методом Ритца два первых приближения для наи-
меньшего собственного значения Л^. В качестве двух первых
функций счетного базиса используйте функции щ{х) и и2(х)
из примера 10.5.
10.3. Выясните, является ли заданный оператор симметри-
ческим при заданных краевых условиях, и решите задачу на
собственные значения:
а)у" = Х1Л у(0) = у(1)=09 хе [0,/];
6)-j/" = Xy, y(0) = i/(0) = 0, хе [0,оо);
в) y1Y = -λ/, i/(0) = 0»(О) = jT(1) - jT(l) = 0, х е [0,1].
11. ДВОЙСТВЕННЫЕ ВАРИАЦИОННЫЕ ЗАДАЧИ
11.1. Альтернативные функционалы
Существенным преимуществом вариационной формулировки
прикладной задачи, функционал которой имеет определенные
экстремальные свойства, является не только возможность
применения эффективных прямых методов, но и удобные
способы оценки погрешности приближенного решения. Дей-
ствительно, из двух приближенных решений щ и и2 в задаче
на минимум функционала J[u] разумно отдать предпочтение
тому из них, на котором значение функционала J[u] меньше,
т. е. ближе к минимальному значению. В этом случае значе-
ние функционала выполняет роль обобщенного критерия для
сравнения двух и более приближенных решений.
Для количественной оценки погрешности приближенного
решения и можно использовать разность AJ = J[u]- J[u*] зна-
чений функционала (и* — точное решение задачи на минимум
функционала). Эту разность можно связать со значением
||u-uj|, отражающим близость точного и приближенного ре-
шений. Но элемент щ не известен в процессе приближенного
решения задачи, поэтому не известно и значение JTuJ. Следо-
вательно, необходимо направить усилия на поиск оценки зна-
чения J[uJ снизу, чтобы получить оценку разности Δ J сверху.
Оценка неизвестного значения J\u^\ может быть получе-
на, если построить дополнительную вариационную задачу на
максимум некоторого функционала Цу]> удовлетворяющего
условию
I[v*] = maxl[v] < min J[u] = J[u*]. (11*1)
Тогда для любой пары элементов и е D(J) и i; е D(I) имеем
I[v]<I[v*]<J[u*]<J[u].
(П.2)
11.1. Альтернативные функционалы
373
Таким образом, получаем оценку сверху приближенного
решения и:
&J = J[u]-J[u*]<J[u]-I[v].
Функционал Ι[υ]9 который связан с функционалом J[u]
условием (11.1), будем называть альтернативным (двойст-
венным) функционалом по отношению к функционалу J[u], a
вариационную задачу на максимум функционала I[v] — двой-
ственной вариационной задачей по отношению к вариацион-
ной задаче на минимум J[u].
Отметим, что оценка приближенного решения разностью
J[u] - I[v] имеет нижнюю границу, равную J[u*]-I[v*\. Поэ-
тому при построении двойственной задачи желательно, чтобы
эта граница была как можно меньшей. Лучше всего, когда она
равняется нулю. Однако это условие лишь необходимое и име-
ет в основном теоретическое значение, так как в практических
вычислениях эта граница не известна. Совпадение решений у
двойственных задач еще не гарантирует хорошей оценки при-
ближенного решения.
В прикладных задачах значение функционала обычно
имеет конкретный содержательный смысл и определяет не-
которую усредненную характеристику исследуемого объекта
или процесса. Поэтому двусторонняя оценка вида (11.2) дает
возможность понять, насколько точным является найденное
приближенное значение указанной характеристики. Таким
образом, весьма важно выяснить, при каких условиях для
данной вариационной задачи, представляющей собой вариа-
ционную формулировку некоторого операторного уравнения,
можно построить двойственную вариационную задачу.
Построение двойственной задачи — неоднозначный про-
цесс, оно может приводить к различным вариантам в за-
висимости от выбранного способа построения. Наиболее
распространенным подходом к построению двойственной за-
дачи является следующий. Рассмотрим задачу на минимум
функционала J[u], определенного на некотором множестве
U = D(J). Предположим, что имеется такой функционал
Ф[и, υ], заданный на множестве Ux V, что исходный функцио-
нал J[u] представим в виде
J[u] = sup<E>[ii, υ].
veV
374
11. Двойственные вариационные задачи
Тогда поставленную вариационную задачу интерпретируем
как минимаксную:
J* = inf J[u] = inf sup<I>[u, υ]. (11.3)
При этом оказывается, что функционал
J[i;] = infO[tt,i;]
ueU
является альтернативным по отношению к функционалу J[u].
Это вытекает из следующего утверждения·
Теорема 11.1. Если функционал Ф[и, ν] определен на мно-
жестве Ux V, то
supinf Ф[и, i/|<inf supO[u, v]. (11.4)
veV ueU ueU vgV
Μ Неравенство (11.4) очевидно, если его правая часть равна
+°° (это соответствует случаю, когда при любом ие U функ-
ционал Ф[и, ν] не ограничен по ν). Поэтому будем считать,
что минимакс в правой части неравенства равен некоторому
числу М.
Для любых и g U и veV имеем
Ф[и, и]<8ирФ[и, ν].
veV
Значит, и точные нижние грани по и связаны таким же нера-
венством:
inf Ф[и, υ]< inf вирФ[и, ν].
ueU ueUveV
Отсюда следует, что функционал I[v] = inf Ф[и, и] ограни-
чен сверху числом М- inf 8ирФ[и, и], т. е. число Μ является
utUveV
верхней гранью функционала I[v]. Поэтому sup/[u]<M, так
vtV
как точная верхняя грань — это наименьшая верхняя грань.
Последнее неравенство эквивалентно неравенству (11*4). ►
11.2. Построение альтернативного функционала
375
11.2. Построение альтернативного функционала
До сих пор краевые условия, входящие в формулировку ва-
риационной задачи, рассматривались как ограничения на
область определения функционала. Однако иногда удобно
трактовать вариационную задачу как задачу на условный
экстремум, которая в самом общем виде формулируется сле-
дующим образом·
Пусть в гильбертовом пространстве Η задан функционал
J[u] с областью определения D(J)9 а оператор Ф[и] отображает
D(J) в некоторое полное евклидово (гильбертово или конечно-
мерное евклидово) пространство V. Требуется найти минимум
функционала J[u] при условии Ф[и] = 0 (0 в данном случае
обозначает нулевой элемент евклидова пространства V). Дру-
гими словами, ищем минимум функционала J[u] на множест-
ве {u e D(J): Ф[и] = 0}.
В случае гладкой задачи, т. е. если множество D(J) откры-
то, а функционал и оператор дифференцируемы*, решение
этой задачи находим с помощью метода множителей Лагран-
жа. Если и* — решение задачи, то при некоторых дополни-
тельных предположениях существует такой элемент ν е V,
что элемент и* является стационарной точкой функционала
Лагранжа
L[u,u] = J[u]+(0[u],zj). (11.5)
Оказывается, что функционал Лагранжа позволяет сфор-
мулировать задачу, двойственную к исходной. Действительно,
вариационную задачу
J[u]->inf; Ф[и] = 0 (11.6)
поиска точки минимума щ функционала J[u] представим как
минимаксную задачу
J[ii*] = inf supL[u, v] (11· 7)
ueUveV
для функционала Лагранжа L[u, ν). При этом, если Ф[и] Φ О,
то supL[u, v] = +oo. Значит, решение минимаксной задачи
* Понятия дифференциала Фреше и дифференциала Гато для опе-
ратора аналогичны соответствующим понятиям для функционала, вве-
денным в 1.2.
** См.: Алексеев В.М., Тихомиров В.М., Фомин СБ.
376
11. Двойственные вариационные задачи
(11.7) не может достигаться на элементе и„, для которого
Ф[ы*] Φ 0. Но если Ф[и] = О, то L[u9 v] = J[u] и решение мини-
максной задачи (11.7) совпадает с решением вариационной
задачи.
Функционал Лагранжа L[u, ν] (11.5) по отношению к функ-
ционалу J[u] иногда называют полным, а функционал J[u]
по отношению к функционалу Лагранжа — частным. Если
J[u] — выпуклый функционал, удовлетворяющий условию
J[u] —> +°° при || α || —» оо, то в (11.7) можно изменить порядок
точных верхней и нижней граней*:
</[u*] = inf supL[w, v] = sup inf L[w, v] = s\xpl[v] = I[v*]9 (11.8)
ueU „εν vgVugU vgV
где
/[u] = infL[u, υ]. (11.9)
ueU
Отметим, что правая часть в формуле (11.9) может прини-
мать значение -°о. Разумно ограничиться теми значениями ν,
для которых Ι[ν] конечно. Это приводит к естественному су-
жению области определения функционала Ι[ν] до некоторого
подмножества jD(/) с V.
Предположим, что функционал L[u,v] при любом ve D(I)
достигает минимума в единственной точке uve U = D(J). Тог-
да, по существу, на множестве D(I) определено отображение ψ,
которое элементу ν ставит в соответствие элемент uve U.
С помощью этого отображения запишем
I[v] = mfL[u, v] = I№(v), »] = ^[ψ(υ)] + (Φ(ψ(1>)), i>),
т. е. при известном отображении ψ альтернативный функци-
онал Ι[υ] легко восстанавливается. Однако отображение ψ да-
леко не всегда удается получить в явном виде. Чаще всего оно
определяется некоторым уравнением, да и условие единствен-
ности точки минимума при фиксированном υ выполняется не
всегда. Тем не менее связь vnuv учитываем в выражении для
функционала Лагранжа и тем самым упростить задачу постро-
ения альтернативного функционала I[v].
Если функционал J[u] является дифференцируемым, то
уравнение для отображения ψ ищем с помощью метода мно-
жителей Лагранжа:
* См.: Экланд И., Темам Р.
11.2. Построение альтернативного функционала
377
5J[u, 5и] + (5Ф[и, 5и], υ) = 0, Ф(и) = 0.
Пример 11.1. Рассмотрим краевую задачу для уравнения
Лапласа
Аи(х) = 0, xeV, u(x) = g(x), xeS, (11.10)
где g(x) — известная функция, заданная на поверхности S,
ограничивающей область V.
Эта краевая задача является частным случаем задачи,
рассмотренной в примере 9.13. В этом примере для краевой
задачи построен функционал (9.41), который в данном случае
сводится к функционалу Дирихле
J[u] = -\(Vu)2dV (11.11)
2 J
ν
с областью определения C1(V)f]C(V).
Краевое условие и - g= 0 на S трактуем как условие Ф(и) = О,
причем отображение Φ переводит функцию и ε С1(У)ПС(УГ) в
вектор-функцию (u-g)n на поверхности S (здесь η — вектор
внешней нормали к поверхности). Таким образом, в качестве
полного евклидова пространства V в данном случае использу-
ем гильбертово пространство вектор-функций на S с интегри-
руемым скалярным квадратом. С учетом этого полный функ-
ционал можно записать в виде
L[u,v] = J[u] + fau),v) = -((Vu)2dV+Uu-g)vndS =
V S
= -\(Vu)2dV+\uvndS-\gvndS. (11.12)
V S S
Найдем вариацию функционала L[u, υ]:
6L[u, ν, 5u, bv] = VuSVudV + (u-g)6vndS+ vnSudS.
V S S
Отсюда, используя первую формулу Грина и полагая, что
SVu = V(5u), получаем
5L[u, v, 5w, δυ] = - ИшЬи dY + \(u- g)bvn dS+\{v + Vu)nbu dS.
378
11. Двойственные вариационные задачи
Из условия стационарности 5L[u, δα, ν, δν] = О полного функ-
ционала при произвольных вариациях 5w в V и δυ на S следу-
ет, что Аи = О в V и и - g = О на S, т. е. в стационарной точке
полного функционала должны быть выполнены равенства
(11.10). Но помимо этого получаем дополнительное условие
связи между и и ν: ν + Vu = 0 на S, или
Vu(x) = -v(x), xe S. (11.13)
Условие (11.13) позволяет построить непрерывное продол-
жение вектор-функции v(x), определенной на поверхности S, в
область V согласно формуле v(x) = -Vu(jc), x e V. Учитывая это
продолжение, находим по формуле Остроградского — Гаусса
\uvndS = f div(uv)dV = \vVudV + J uWvdV.
S V V V
Используя это равенство, а также условие связи Vu = -ν в
представлении полного функционала (11.12), получаем
Ци, v] = -\(Vu)2dV + \v4udV + \uVudV - Г gvndS =
V V V S
= -(v2dV-\v2dV+\uVvdV-(gmdS =
2
V V V S
= ~\v2dV+\uVvdV-\gvndS. (11.14)
V V S
В данном случае видно, что точная нижняя грань по и ко-
нечна лишь при выполнении условия
Wv(x) = aivv(x) = 0, xg V. (11.15)
С учетом этого условия из (11.14) получаем представление
альтернативного функционала I[v]:
Ι[υ]= inf L[u, v] = --{v2dV-\gvndS. (11.16)
ueD(J) 2 J J
V S
Его областью определения D(I) является множество непре-
рывно дифференцируемых в области ^функций, удовлетворя-
ющих условию (11.15).
11.2. Построение альтернативного функционала
379
Пример 11.2. Построим функционал, альтернативный
функционалу J[u] (9.50) из примера 9.14.
Областью определения функционала J[u] является линей-
ное многообразие С1 [а, 6] в гильбертовом пространстве L2[a, 6].
Его минимум ищем при краевом условии и(а) = α (второе
условие учтено в самом виде функционала)· Таким образом, в
данном случае Ф[и] = и(а) - а, причем оператор Φ переводит
функцию и(х) в число и(а) -а, т. е. является функционалом.
Значит, в качестве евклидова пространства V следует взять
одномерное арифметическое пространство R1 со скалярным
произведением (х, у) = ху. Используя условие связи, можем
записать
Ъ / ,. ч2 Ь
L[ufi;] = J[u] + (0[i/]fi;)^^
2
а
b u(x) и(Ъ)
+ \dx \ q(u)du+ s(u)du + (u(a)-a)v. (11.17)
а 0
Найдем первую вариацию функционала (11.17) при произ-
вольных вариациях ди(х) и δν:
ь
3L[u, v9 6u, δν] = -βδα(&) + u(x)8u(x)dx-
а
Ъ Ъ
- f(x)$u(x)dx+ q(u(x))3u(x)dx +
а а
+s(u(b)) bu(b) + (u(a) - a) δν + vbu(a).
Отсюда, интегрируя по частям, находим
ъ
ЪЦи, и, δα, δν] = -$δηφ) + 11'(Χ)δΙΙ(Χ)\ - 11*(Χ)δΙΙ(Χ)αΧ-
- f(x)8i/(#)dx + \q (u(x))8н(х)dx + s(u(b))8i/(&)
a a
l·(u(a)-ά)δv + vδu(a)^u\b)^s(u(b))-^δu(b)-l·
380
11. Двойственные вариационные задачи
ь
+
а
и
\_-и"(х) + q (и(х)) - f(x)~\ Ьи(х) dx -
+(г/(а)-а)5и + (и-и'(а))5и(а).
Из необходимого условия экстремума 5L[u, i?, Ъи, bv] = 0, кото-
рое должно выполняться при произвольных вариациях Su(x)
и 5i?, следует, что в стационарной точке полного функционала
верны все равенства (9.9), (9.10). Но помимо этого имеет место
равенство v = u'(a). Рассмотрим функцию v(x) = и'(х), которую
можно интерпретировать как продолжение значения ν = ν(α)
на отрезок [а, &]. Согласно правилу интегрирования по частям,
ь ь
u(a)v(a) - u(b)v(b)- u(x)v(x)dx- u{x)v\x)dx^
u(x) u(x)
q(u)du = q(u(x))u(x)- uq'(u)du9
о о
u(b) u(b)
s(u)du = s(u(b))u(b)- us'(u)du.
о о
Используя эти тождества, а также равенство v(x) = и'(х), из
(11.17) получаем
Ъ ( 7 \\2 Ь
L[u, ν] = -βu(b) + — dx - f(x)u(x) dx -
b u(x)
+ 1 q(u(x))u(x)dx- dx uq'(u)du + s(u(b))u(b)-
a a 0
u{b)
us{u)du + u(b)v(b) - u(x)v(x) dx - u(x)v'(x) dx -
b b
-av(a) = — v2(x)dx+ [-v'(x) + q(u(x))-f(x)Ju(x)dx
11.3. Оценка погрешности приближенного решения
381
Ъ и(х)
+[v(b) + s(u(b))-$]u(b)-fdx f uq\u)du-
а О
и(Ъ)
- us\u)du-av(a).
(11.18)
Точная нижняя грань полного функционала (11.18) конеч-
на, если выполняются условия
-v\x)+q (u(x)) - f(x) = О, х е [a, b];
v(b) + s(u(b))-$ = 0.
(11.19)
В этом случае функционал L[u, v] можно записать в виде
Ъ Ъ и(х)
I v2(x)dx-
2<
Ъ о и(х)
L[u,v] =— u2(x)rfx- \dx uq\u)du-
a 0
u(b)
- us'{u)du-av(a)y
(11.20)
а альтернативный функционал J[v] — в виде
f -b
J[u] = inf
— v2(x)dx-
b u(x) u(b)
-\dx \ uq(u)du- us\u)du-av{a)
. #
11.3. Оценка погрешности приближенного решения
Пусть {йдг} — минимизирующая последовательность квад-
ратичного функционала
Js[u] = \\u\\2A-2(f,u),
(11.21)
соответствующего краевой задаче для операторного уравнения
Аи = / с положительно определенным оператором А. Различие
382
11. Двойственные вариационные задачи
между приближенным решением uN и обобщенным реше-
нием и* операторного уравнения, на котором этот функцио-
II π 9
нал достигает своего наименьшего значения Js[u*] = -|Iu*IIa = ^
(см. ЮЛ), оценим по разности значений функционала на этих
решениях:
AJ[uN] = Js[uN]-Js[u*] = J[uN]-d. (11.22)
Если обобщенное решение и+ принадлежит области опре-
деления оператора А, т. е. является классическим решением,
то мерой погрешности приближенного решения uN может
служить норма || AuN -f \\A его невязки. Так как для классиче-
ского решения Ащ = /, то, полагая u = uN -и*, согласно теоре-
ме 10.3 и неравенству Коши — Буняковского:
(Аи, и) II Аи || || и ||
{щи) || и Ρ
A(UN-u*)\\ \\AUN-f\
uN-u* ll \\uN-u
(11.23)
где λ — наименьшее собственное значение оператора А.
Отсюда
\\иы-и,\И1А(й"-и'П· (и·24)
Λ
т. е. норму разности между приближенным и обобщенным
решениями на самом деле можно оценить с помощью нормы
невязки. В гильбертовом пространстве Ι/2(Ω) неравенство
(11.24) принимает вид
lj[uN(x)-u*(x)fd& <I lj[A(uN(x)-f)]2dQ. (11.25)
'ω \ω
Здесь речь идет об оценке среднеквадратичной погрешности
приближенного решения в области Ω. Отметим, что для га-
рантированной оценки сверху этой погрешности необходимо
использовать оценку наименьшего собственного значения сни-
зу (см. 10.4).
При построении минимизирующей последовательности
для функционала Js[u] с помощью метода Ритца условие
II Ай^ — /|| —> 0 при Ν —> сю выполняется лишь тогда, когда все
11.3. Оценка погрешности приближенного решения
383
функции ит в представлении (10.15) являются собственными
элементами оператора А В противном случае оценка (11.25)
может оказаться слишком грубой. Применение методов наи-
меньших квадратов или Куранта для построения минимизи-
рующей последовательности обеспечивает || AuN -/1| —> 0 при
N —»<*> в случае произвольного счетного базиса в энергетиче-
ском пространстве На, составленного из функций umeD(A)9
что уточняет оценку (11.25).
В более общем случае погрешность приближенного реше-
ния, построенного с использованием счетного базиса, включа-
ющего функции ит не только из D(A), приходится оценивать
по значению разности (11.22). Так как в энергетическом про-
странстве НА для положительно определенного оператора
(Ащ mO=|IuIIa> то вместо (11.23) с учетом (10.6) при и ~uN -u*
запишем
υ < a s-—jjjr — τ, ttq- — —й jjo—·
IIit|| \\uN -it„II Цйдг-и*!!
Отсюда получаем
u^-it^l < < . (11.2b)
Это верно, в частности, и для пространства Η = Σ2(Ω).
Точно определить минимальное значение d квадратич-
ного функционала удается редко. Однако если построена
неубывающая последовательность {dm}, сходящаяся к d, то
^Лилг]-^<^ИдгЗ-^и вместо (11.26) можно использовать
более грубую оценку
J$[uN]-dm
\\uN-u4<fSL γ т. (П.27)
Как и в случае (11.25), из (11.27) следует, что для количест-
венной оценки погрешности необходимо располагать оценкой
снизу значения λ.
Строить последовательность {dm} можно различными спо-
собами. Один из них состоит в построении функционала Ди],
двойственного функционалу Js[u] и достигающего на некото-
ром элементе υ* своего наибольшего значения Ди*] = d. Тогда
384
11. Двойственные вариационные задачи
построим последовательность {dm} приближенных решений dm
вариационной задачи для функционала Цр], которая сходится
к d снизу, не убывая.
Пример 11.3· В примере 11Л построен функционал
I[v] = --\v2dV-\gvndS, (11.28)
V S
двойственный функционалу Дирихле
J[u] = -\(Vu)2dV. (11.29)
2 J
ν
Оператор А = -Δ в краевой задаче (11.10) не является сим-
метрическим (см. пример 9.13). Тем не менее в этом случае
для оценки погрешности приближенного решения краевой
задачи (НЛО) применима оценка, аналогичная (11.26)·
Действительно, используя первую формулу Грина и полагая
и = uN - и*, преобразуем разность:
J[uN]-J[u,] = ±l [(УЗД2 -(Vu*)2] dV =
2
ν
= \ J(Vutf -Vu JVudF + | j(VuN -Vu JVu.dV =
2 У 2
ν ν
= - \vuVudV + - lvuVutdV = - \u4undS-
2 J 2 J 2 J
V V S
— uAudV + uVujidS- uAu*dV =— UAudV,
2J J J 2
V S V V
поскольку й = 0 на S и Аи* ξ 0 в К
Пусть оператор А есть оператор -Δ, рассматриваемый на
множестве функций и(х)е C2(V)C\C(V), удовлетворяющих
краевому условию и = 0 на S. Тогда этот оператор будет сим-
метрическим и
1 г 1
— UAudV = — (Ай, й\9 йе D(A).
V
11.3. Оценка погрешности приближенного решения
385
В силу теоремы 10.3 имеем
(Айи) J[y-J[ig
(и, и) \\uN-um\\*
где Xi — наименьшее собственное значение симметрического
оператора А.
Отсюда получаем
Ын-иЛ-2Щ1=*.
Если {dm} строить как минимизирующую последовательность
функционала -Цр], обратного по знаку функционалу (11.28),
то для гарантированной оценки погрешности приближенного
решения краевой задачи (11.10) используем оценку
йлг-и*И= J2
J[uN]-dm
λα
которая аналогична оценке (11.27).
Пример 11.4. При некоторых дополнительных предполо-
жениях оценку погрешности приближенного решения uN,
аналогичную (11.27), можно использовать и в нелинейных
задачах. В примере 9.14 построен функционал (9.50)
Ь , , ч2 Ь
J[u] = -$и(Ъ) + yu{x)> dx-\f(x)u(x) dx +
а а
Ь и(х) и(Ь)
+ \dx \ q(u)du+ s(u)du,
соответствующий нелинейной краевой задаче (9.9), (9.10).
Условием выпуклости этого функционала является неубыва-
ние функций q(u) и s(u) (см. пример 9.19).
Пусть этот функционал достигает своего наименьшего зна-
чения J\u+~\ на элементе и*(х) е D(A), удовлетворяющем (9.9),
(9.10), т. е.
386
11. Двойственные вариационные задачи
-ul(x) + q(u*(x)) = /(х), хе [а, Ь],
и Да) = а, и'ДЬ) + $(М&)) = β.
(11.30)
Обозначив U(x) = uN(x)-u*(x)9 запишем разность функцио-
налов:
J[uN]-J[u*] = -$(uN(b)-u*(x)) + j
{uN(x)f-(и*(х))2
Ь uN(x)
2
uN(b)
dx-
-\f(x)(uN(x)-u*(x))dx+\dx q(u)du+ s(u)du =
a u*(x)
u*(b)
b b
If,-, ,ч2
= -βω(6) + — (u'(jc)) dx + u'(#) и'*(х) dx -
b un(x)
uN(b)
- \f(x)u(x)dx+ \dx q(u)du+ s(u)du.
a u*(x)
uj&)
Заменим в двух последних интегралах q(u) и s(u) соответст-
венно на q(u*(x)) и s(u*(b)). Для неубывающих функций q(u) и
s(u) это не приведет к возрастанию правой части последнего
соотношения. Тогда, интегрируя по частям и учитывая соот-
ношения (11.30) и равенство й(а) = 0, находим
J[uN ] - J[u*] > -$u(b) + — {и{х)) dx + й(х)и*(х)\ +
+
υ υ υ
u(x)ul(x)dx- f(x)u(x)dx+ q(u*(x))udx + s(u*(b))u(b) =
= — (u(x)) dx+ (-ul(x) + q(u*(x))-f(x))u(x)dx +
+
1 u
(u:(b) + s(u*(b))-$)4b) = -j(u'(x))2dx
Вопросы и задачи
387
Выпуклый функционал
ь
F[u] = (u(x)) dx = | и |
а
достигает некоторого наименьшего значения λ° на замкнутом
ограниченном множестве U функций и(х) е С1[а, &], удовлет-
воряющих краевому условию и(а) = 0и условию |м||^2=1,
так как этот функционал непрерывен по норме |Н|С. Этот
минимум является решением задачи на условный минимум
функционала F[u] при условии |и||х,2=1. Решая эту вариа-
ционную задачу методом множителей Лагранжа (см. теоре-
му 4.3), заключаем, что функция и0(х), являющаяся точкой
условного минимума, удовлетворяет дифференциальному
уравнению щ =Хи0 (уравнение Эйлера для лагранжиана за-
дачи) и краевым условиям и(а) = 0, и!(6) = 0 (условие транс-
версальности). Другими словами, λ° есть собственное значе-
ние симметрического положительного оператора А[и] = -и",
определенного на множестве функций и(х) е С\а, &], удов-
летворяющих краевым условиям и(а) = и\Ъ) = 0. Ясно, что
λ° — это наименьшее собственное значение оператора А, ко-
торое нетрудно определить: λ° = π2/4 [XI]. Таким образом,
II f 112 II ~> ||2 тг ~ 1 тт л
λ° = mm F[u] = mm Vnrr -1—пт - 2 ,, V^»
||м||=1 u±o ||M|p ||й|р ||йдг-^*||
где минимумы ищут на множестве функций и(х) е Сх[а^ &],
для которых и(а) = 0.
В итоге получаем
\йм-«.\=]г*Щ&1.
Вопросы и задачи
11.1. Постройте функционал, двойственный функциона-
лу (9.31), переходом к полному функционалу.
388
11. Двойственные вариационные задачи
11.2. Сформулируйте задачу на собственные значения для
нахождения числа λ в (11.27) при использовании вместо Js[u]
функционала (9.31).
11.3. Постройте функционал, двойственный функциона-
лу (9.42), переходом к полному функционалу.
11.4. Сформулируйте задачу на собственные значения для
нахождения числа λ в (11.27) при использовании вместо Js[u]
функционала (9.42).
ЧАСТЬ IV
Приложения
вариационных методов
С тех пор как существует научная физика,
высшей целью, мерцавшей перед нею, было раз-
решение задачи — как обобщить все явления
природы, наблюдавшиеся в прошлом и могущие
быть наблюдаемыми в будущем, в одном про-
стом принципе...
Эта цель и сегодня не достигнута; она не
будет достигнута полностью и в будущем, что
лежит в природе вещей, но все более и более при-
ближаться к ней — вполне возможно.
М. Планк
12. ПРИНЦИП ГАМИЛЬТОНА
Механической системой называют множество материальных
точек, в которых положение каждой точки зависит от поло-
жения и движения остальных точек этого множества. Усло-
вия, ограничивающие движение точек системы, называют
связями. Связи могут записываться в виде уравнений или
неравенств, которым подчиняются координаты положения и
скорости точек системы.
Рассмотрим механическую систему из η материальных то-
чек с массами тъ m2j ..., тп и координатами положения rt =
= (xi9 уь Zi)9 i = l, η9 заданными в некоторой декартовой пря-
моугольной системе координат. Предполагаем, что связи в
рассматриваемой механической системе имеют вид
fj(rl9..., гп, гъ ..., г„) = 0, ; = 1, k. (12.1)
Если функции f j на самом деле от скоростей η материальных
точек не зависят, то соответствующие связи называют голо-
номными.
Кинетической энергией механической системы из η точек
называют величину
т=ъ1кт^> (i2-2)
где vi=ri={xi9yi9zi) — вектор скорости i-й материальной
точки.
Движение механической системы вызывается совокуп-
ностью сил. Пусть на i-ю материальную точку системы из
л точек действует сила Ft. Если существует такая функция
Щг) = Щх9 г/, г), что сила Ft может быть представлена в виде
Fi = gradC/(rj), то эту функцию называют потенциалом сил,
392
12. Принцип Гамильтона
а противоположную ей функцию V(r) = -U(r) — потенциаль-
ной энергией механической системы. Сумма кинетической и
потенциальной энергий механической системы представляет
собой полную энергию этой системы. Если в процессе движе-
ния механической системы ее полная энергия не изменяется,
т. е. Τ + V== Τ - U = const, то такую механическую систему
называют консервативной.
Если связи (12.1), наложенные на систему, являются голо-
номными, причем функции fj функционально независимы,
или, другими словами, ранг матрицы Якоби системы функций
/у, ] -1, ky максимален и равен &, то система уравнений (12Л)
может быть локально разрешена относительно каких-либо
k переменных. Тогда остальные Зп-k переменных могут сво-
бодно меняться, полностью определяя положение механиче-
ской системы. В этом случае говорят, что механическая сис-
тема имеет Зп-k степеней свободы. Эти т = Зп-k свободно
меняющихся переменных могут рассматриваться как обоб-
щенные (лагранжевы) координаты ql9 q2, ..., qm механической
системы. Конкретное положение механической системы будет
описываться набором значений обобщенных координат и мо-
жет интерпретироваться как точка в некотором тп-мерном
фазовом пространстве Е. При этом движение механической
системы будет изображаться некоторой кривой, которая пара-
метрически описывается вектор-функцией (#i(i), ..., qm(t)).
Производные лагранжевых координат по времени называют
обобщенными скоростями механической системы.
Итак, механическая система из η материальных точек изо-
бражается точкой в m-мерном арифметическом пространстве,
которое мы будем считать евклидовым со стандартным ска-
лярным произведением. Любому движению системы из поло-
жения A(q10, ..., qm0) в положение B(qn> ..., qml) соответствует
кривая q(t) = (gx(t), ..., qm(t))91 e [i0> *i]> Для которой gf(i0) = qi0,
<7i(*i) = Qiu i = 1> m· Все гладкие кривые в пространстве обоб-
щенных координат, проходящие через данные точки А и В,
будем называть возможными траекториями, а ту из них, по
которой происходит движение системы под действием прило-
женных сил, — действительной траекторией.
Пусть механическая система потенциальна и, вообще го-
воря, неконсервативна* Функцией Лагранжа механической
системы называют функцию
12. Принцип Гамильтона
393
L = L(t,q,q) = T + U,
а действием по Гамильтону для рассматриваемой механи-
ческой системы — функционал
«-1
S[q] = $L(t,q,q)dt,
to
заданный на всех возможных траекториях системы.
Согласно принципу Гамильтона, среди возможных тра-
екторий движения системы действительной является та, на
которой вариация действия по Гамильтону равна нулю:
6S[g] = 6
jL(t,q,q)dt
v*o
= 0.
Другими словами, действительная траектория является ста-
ционарной точкой действия по Гамильтону.
Итак, для того чтобы найти траекторию движения механи-
ческой системы, вызванного приложенными к системе внеш-
ними силами, нужно определить стационарные точки функ-
ционала, называемого действием по Гамильтону. Но точно так
же решается простейшая задача вариационного исчисления
h
jL(t,q,q)dt^extr, q(t0) = q0, q(h) = qi, (12.3)
«о
тце q0=(q10,...,qm0); Ч\ =(?ii. ···» QmiY, q(t)eC1([t0,t1],Rm).
Экстремали вариационной задачи (12.3) ищем как реше-
ния системы уравнений Эйлера
d
—Ц.-Ц.=0, i = l, т, (12.4)
удовлетворяющие краевым условиям вариационной задачи.
Система уравнений (12,4) в теоретической механике известна
как система уравнений движения в форме Лагранжа.
Замечание 12.1. Изложенный принцип был опубликован
В. Гамильтоном в 1834-1835 годах в случае стационарных
связей. Независимо от него и в более общем случае нестацио-
нарных неголономных связей этот принцип был сформулиро-
394
12. Принцип Гамильтона
ван М.В. Остроградским в 1848 году. Поэтому иногда в лите-
ратуре принцип Гамильтона называют принципом Гамиль-
тона — Остроградского. #
Хотя в принципе Гамильтона действительная траектория
характеризуется как стационарная точка функционала (дей-
ствия по Гамильтону), заданного на множестве возможных
траекторий на общем промежутке времени [i0, t\\ с общими
концами А и В, в ряде случаев по смыслу рассматриваемой
прикладной задачи ясно, что действительная траектория яв-
ляется и точкой минимума рассматриваемого функционала,
а поиск действительной траектории фактически эквивален-
тен решению простейшей задачи вариационного исчисления
(12.3). В таких случаях принцип Гамильтона сводится к прин-
ципу наименьшего действия.
Пример 12Л. Рассмотрим механическую систему, состоя-
щую из единственной точки, движение которой подчиняется
голономной связи х2 + у2 + г2 = i?2, где х, г/, г — текущие
координаты этой точки. В этой системе точка перемещается
по сфере. Если внешние силы отсутствуют, то потенциал сил
U можно считать равным нулю и действие по Гамильтону
имеет вид
J 2
to
где т — масса материальной точки; υ — вектор скорости точ-
ки в текущий момент времени.
Доказано*, что при отсутствии внешних сил движение идет
с постоянной по модулю скоростью (|и| = ν = v0 = const), а тра-
екториями движения будут дуги больших кругов на сфере.
Значит, действие по Гамильтону можно записать в виде
Для любых фиксированных точек А и Б на сфере укажем
две дуги большого круга, соединяющие эти точки. Каждая
из них, как отмечено, является действительной траектори-
ей. Меньшая из них дает минимум действия по Гамильтону,
См., например: Бухголъц Н.Н.
12. Принцип Гамильтона
395
а большая — максимум, так как при фиксированном проме-
жутке времени однозначно определена постоянная скорость,
с которой материальная точка должна двигаться по траекто-
рии, причем эта скорость пропорциональна длине траектории.
Итак, не всякая действительная траектория обеспечивает ми-
нимум действия по Гамильтону·
Отметим частный случай, когда точки А и В диаметрально
противоположны. В этом случае существует бесконечно много
действительных траекторий, соединяющих эти точки, причем
среди таких траекторий можно выбрать сколь угодно близкую
к некоторой заданной. В теоретической механике такие точки
называют сопряженными кинематическими фокусами.
Если движение на сфере ограничить некоторой областью D,
не содержащей диаметрально противоположных точек (сопря-
женных кинематических фокусов), то любая экстремаль будет
давать минимум действия по Гамильтону. Значит, принцип
Гамильтона в малом (локально) становится принципом наи-
меньшего действия.
13. КОЛЕБАНИЯ СТРУНЫ
Простейший пример механической системы с распределенной
массой — струна или стержень. Струной (нитью) называют те-
ло, у которого поперечное сечение намного меньше длины (од-
номерное тело) и которое сопротивляется только натяжению.
Струна однородна, если плотность материала, из которого она
изготовлена, постоянна.
Пусть в некоторый начальный момент времени струна под
действием натяжения N приобрела длину I и располагается в
прямоугольной системе координат Оху вдоль оси Ох, х е (О, Ζ),
концы ее закреплены в точках (0, 0) и (/, 0). Поперечные малые
колебания струны можно описать функцией и = и(х, f)> значе-
ние которой и(х, t) есть отклонение вдоль оси Оу точки, имею-
щей в положении равновесия координаты (х, 0). При этом
\и(х, t)\ « I, | и'х(х9 t)| <с 1 при t > t0 и х е (0, /). Кинетическая
энергия элемента длины струны равна
dr = ip(ui)2dx,
где ρ — линейная плотность материала. Поэтому кинетиче-
ская энергия колеблющейся струны выражается формулой
i
T = ^9(u\{x,t))2dx.
о
При колебаниях длина струны меняется на величину
I I
Μ = Ul + {ux)2dx -1 - - f (ux)2dx.
о о
13. Колебания струны
397
Сила натяжения совершает работу на этом приращении
длины. Согласно теореме Клапейрона*, вклад внешней силы
N в потенциальную энергию с учетом ее постоянства равен:
V = ^j(u'x)2dx.
2
о
Согласно принципу Гамильтона, ищем стационарные точ-
ки функционала
t\ h i
S[u] = j(T-V)dt = ^jdtj(p(u't)2-N(ufx)2)dx =
to t0 о
= \\f(t,u,ux, ut)dxdt9
Ω
где f = f(x, t, u, ux, u't) = -(p(ut)2-N(u'x)2) — интегрант функ-
ционала; Ω = [0, l]x[t0, t{\.
В качестве допустимых рассматриваются все непрерывно
дифференцируемые функции и(х, i), обращающиеся в нуль
при х = 0и х = 1, а при t = i0 и t = t1 — совпадающие с заданны-
ми функциями и(х, t0) и и(х, t\) соответственно (эти функции
описывают форму струны в начальный и конечный моменты
времени).
Уравнение свободных колебаний — это уравнение Остро-
градского для функционала S[u], которое в данном случае
имеет вид
dt ut дх *
Подставляя в него конкретный интегрант, находим
pu"tt-Nu"xx=0. (13.1)
Пусть на струну действует поперечная нагрузка интенстив-
ности р(х, t). Ее работа на поперечных перемещениях точек
струны равна:
См.: Работное Ю.Н.
398
13. Колебания струны
А = р(х, t)u(x, t)dx.
Струна, распрямляясь, совершает работу, отличающуюся зна-
ком от работы А внешней нагрузки. Следовательно, дополни-
тельная потенциальная энергия равна:
i
- р(х, t)u(x, t)dx.
о
Записав действие по Гамильтону
h h i
dxdt,
S[u] = j(T-V)dt = jj{\p(ut)2 -\Щи'х)2 +ри j
to tQo^ '
находим уравнение Остроградского этого функционала:
pu"tt-Nuxx=p(x,t), (13.2)
которое представляет собой уравнение вынужденных колеба-
ний струны.
Положение устойчивого равновесия* под действием стати-
ческой нагрузки получим, решив вариационную задачу
V[u] = j(~N(u'x)2-p(x)u
Соответствующее уравнение Остроградского, представляющее
собой уравнение равновесия, имеет вид
Nuxx+p(x) = 0.
Это уравнение является частным случаем уравнения (13.2)
при условии, что ускорение ии тождественно равно нулю,
а распределение внешней нагрузки не зависит от времени:
р(х, t) = р(х).
dx^min.
* См.: Волъмир АС.
14. КОЛЕБАНИЯ МЕМБРАНЫ
Мембрана — это материальная поверхность (пленка), которая
не сопротивляется изгибу и сдвигу. Пусть мембрана натяну-
та на плоский контур Г, охватывающий область G в плоско-
сти хОу. Рассмотрим поперечные колебания мембраны, в
которых перемещение и(х, у, t) каждой точки (х, у)е G пер-
пендикулярно плоскости хОу.
Пусть dl — элемент некоторого контура на поверхности
деформированной мембраны. На этот элемент действует уси-
лие TdU где вектор Τ вследствие отсутствия сопротивления
изгибу и сдвигу лежит в касательной к поверхности плоскости
и перпендикулярен dl, а его модуль Τ представляет собой на-
тяжение мембраны. Предполагая, что мембрана подвержена
малым колебаниям, т. е. \и(х9 у, t)\ намного меньше размеров
G, а | их |, \и'у\ много меньше единицы, мы можем пренебречь
вторыми и более высокими степенями частных производных,
так как, например, | их |2« | их |, | иу |2<$с | иу \.
Натяжение Т(х, у, t) во всех точках мембраны одинако-
во: Т(х, у, t) = Т0 = const. Считаем, что материал мембраны
обладает линейно упругими свойствами. Тогда потенциаль-
ная энергия деформирования мембраны пропорциональна
приращению площади ее поверхности, причем коэффициент
пропорциональности равен натяжению. Это можно показать,
выделив дифференциальный элемент площади и подсчитав
элементарную работу сил натяжения, затраченную на его
деформирование.
Площадь S поверхности деформированной мембраны вы-
числяется по формуле
S = jj,jl + (ux)2+(u'y)2dxdy7
G
400
14. Колебания мембраны
значит, приращение площади равно:
Hi(Vi+(**)2^
G
Отсюда находим потенциальную энергию деформированной
мембраны:
V = T0bS = ^jj((u'x)2Huy)2^xdy. (14.1)
G
Пусть на мембрану действует поперечное давление f(x, у).
Тогда элементарная работа, затраченная на перемещение эле-
мента поверхности dxdy на расстояние u(x,y,t), равна: δΑ =
= f и dxdy, а вся работа выражается интегралом:
А=\\ fudxdy.
Предположим, что контур Г мембраны удерживается линейно
упругими пружинами с модулем упругости с и может переме-
щаться только вдоль оси Oz. На контур действует внешняя
распределенная нагрузка р(1)9 направленная вдоль Oz и стре-
мящаяся удержать контур в положении равновесия* Тогда
суммарная работа упругих пружин равна:
Anv = --j)eu2dl,
а работа распределенной нагрузки р(1) есть
A(p) = -(T)p(l)udL
Кроме перечисленных внешних
сил, на контур действуют силы на-
тяжения Tdl. Их составляющая Т2
вдоль оси Oz совершает работу по
перемещению контура (рис. 14,1).
Вычислим эту составляющую:
14. Колебания мембраны
401
ди
Тг = Tsina~Ttga = T—,
дп
ди
где — — производная и по направлению внешней нормали
дп
η к контуру Г.
Таким образом, потенциальная энергия Vупругой системы
мембрана — контурные пружины может быть записана в виде
V = jj(?f((ux)ZHu'yf)-fu
dxdy\
G
+ф P(l)u + -c(l)u2 +T0—u\dl
Если пренебречь массой контурных пружин, кинетическую
энергию мембраны можно представить так:
K = Ujp(u't)2dxdy,
где ρ = ρ о = const — поверхностная плотность мембраны.
Для вывода уравнений движения мембраны используем
принцип Гамильтона, согласно которому действие по Гамиль-
тону на функции и(х, у> i), описывающей реальное движение
мембраны, т. е. функционал
*1
S[u] = JLdt, L = K-V,
to
имеет нулевую первую вариацию: 5S[w, Ьи] = 0. Другими сло-
вами, функция и(х,у, t) является стационарной точкой функ-
ционала
J |{^ρ(^)2-γ((^)2+Κ)2)-^^-
г ν /
dl\dt.
1
(14.2)
402
14. Колебания мембраны
Вычисляя вариацию этого функционала (см. 2.4) и при-
равнивая ее нулю, получаем уравнение колебаний мембраны
Τ
^(Kx+uly) + f(x,y) = putt (14.3)
и естественные краевые условия
= 0, (14.4)
Т0— + р + си\
on
Если речь идет о закрепленной по контуру мембране, то
контурный интеграл в (14.2) равен нулю и естественное крае-
вое условие (14.4) заменяется краевым условием и\г = 0.
При использовании принципа Гамильтона мы считаем, что
допустимые функции имеют конкретные значения в моменты
времени i0 и ^. Однако в задачах динамики задают только
начальное состояние, т. е. считают известными и(х,у, t0) и
Щ{х> y,t0). Таким образом, приходим к задачам смешанного
типа: ставим и краевые, и начальные условия.
Сформулируем задачу о статическом нагружении мембра-
ны. Из уравнений (14.3) и (14.4), приравнивая нулю произ-
водные по времени, получаем
2
-Au = — f(x,y), (x,y)eG;
л <14·5>
ои с ρ / ч _
^- + — и = ~т> (х,у)еГ.
дп Т0 Т0
Эта задача представляет собой краевую задачу III рода для
уравнения Пуассона [XII]. Если с велико (это соответствует
высокой жесткости пружин), то во втором уравнении можно
пренебречь производной по направлению нормали. В этом
случае получаем краевую задачу I рода (задачу Дирихле). Если
же с мало, так что можно считать, что с = 0, получаем условия
свободной границы. Это краевая задача II рода (задача Ней-
мана). Задача Неймана имеет не единственное решение. Ре-
шение будет зависеть от аддитивной постоянной, отражающей
начальное состояние мембраны. Кроме того, в случае краевых
14. Колебания мембраны
403
условий II рода равновесие возможно только тогда, когда сум-
марная сила, действующая на мембрану, равна нулю:
\\f(x> y)dxdy + (bp(l)dl = Q.
G
О способах интегрирования уравнений движения (равнове-
сия) мембраны см. в [XII].
15. УРАВНЕНИЯ ДВИЖЕНИЯ
ИДЕАЛЬНОЙ ЖИДКОСТИ
Рассмотренный ранее принцип Гамильтона можно обобщить
на случай неконсервативной и неголономной системы♦ Функ-
ция Лагранжа определяется равенством L=T-V=T + U,
где TviV — соответственно кинетическая и потенциальная
энергии механической системы. Принцип Гамильтона можно
записать следующим образом:
h
6S= f(8T + 8U)dt = 0. (15.1)
*о
Если в подынтегральном выражении (15.1) второе слагае-
мое 5t7, представляющее собой вариацию потенциала действу-
ющих на систему сил, заменить величиной
η
i=l
выражающей элементарную работу непотенциальных сил че-
рез обобщенные силы Qt и возможные обобщенные перемеще-
ния Sqi9 то получим обобщение принципа Гамильтона на не-
консервативные системы*. Вычислим интеграл от вариации
кинетической энергии:
h h
J5T(i, ql9..., qn, ql9..., qn)dt = j
dt
tid^
+
* См.: Бухгольц Η.Η.
15. Уравнения движения идеальной жидкости
405
ВТ.Л,. *гГ*ЭГ
дт
+Χ-δ^ \dt=j 2 δβ£+Σ—%
ii^
i=i э^ £iд^
dt,
(15.2)
так как в данном случае вариации изохронны и δ£ = 0.
Преобразуем второе слагаемое в (15.2) с помощью интег-
рирования по частям:
71 вт„. 1, жЦэг,. Г "г vi <*Гэт^
ν1 у
dqt
bqt dt =
δ#ε df,
учитывая, что начальное q(t0) и конечное qr(ii) положения ме-
ханической системы фиксированы и вследствие этого bq(t0) =
- Sg(ii) - 0. Поэтому
h
dt
ΒΤλ
+Qi
bqidt=0.
(15.3)
Из уравнения (15,3) вытекают уравнения движения не-
консервативной системы с η степенями свободы, если учесть,
что промежуток интегрирования произволен, а вариации bqt
независимы.
Оказывается, что принцип Гамильтона в форме (15.3) спра-
ведлив и для систем с линейными неголономными связями.
При этом из вариационного принципа можно получить не
только уравнения движения, но и краевые условия.
Пусть жидкость несжимаема. При движении такой жид-
кости любой выделенный ее объем не изменяется (хотя и ме-
няет форму). Выберем некоторый объем ΔΩ и рассмотрим
возможные перемещения 5г его точек. Перемещения должны
быть таковы, чтобы выполнялось условие несжимаемости:
ΔΩ'-ΔΩ
φ = = 0, где ΔΩ' — объем ΔΩ жидкости после переме-
ΔΩ
щения. Так как cp = divr, то
δφ = 5divr=div5r = 0.
(15.4)
406
15. Уравнения движения идеальной жидкости
Рассмотрим идеальную несжимаемую жидкость, на кото-
рую, возможно, воздействуют неконсервативные силы. Прин-
цип Гамильтона можно записать в виде
М(- -.
t0 Ω
bf + δΑ)ωΩ = 0, (15.5)
где δΤ и δΑ — вариации кинетической энергии Τ и работы
А, приходящихся на единицу объема.
Так как работа внутренних сил в любом объеме жидкости
равна нулю (вследствие того, что она идеальна), то δΑ есть
работа только внешних, например массовых, сил К, т. е.
SA = K6r.
Итак, ставится задача о стационарности действия по Га-
мильтону при дополнительном условии (15.4).
Используя метод множителей Лагранжа, получаем
h
Γ^[(δΓ + δΑ + λδφ)^Ω = 0. (15.6)
#0 Ω.
Здесь все подынтегральные величины отнесены к единице
объема. Так как Т = — ρυν, то δΤ = ρυδυ. Действительная ско-
рость есть полная производная по времени от вектора переме-
щения г. Поэтому
с ~ dr d(br)
oi; = o— = .
dt dt
Тогда
\pbvvdt = \pv—-—-dt =
to to
dv ^ ,. С dv
= pu-6r|г - ρ brdt = - ρ brat,
lto У dt У dt
dt J dt
to to
так как br(t0) = 8r(t{) = 0.
15. Уравнения движения идеальной жидкости
407
Далее, учитывая формулы связи между дифференциаль-
ными операциями векторного анализа, находим
λδφ = Xdiv 8r = div(X5r) - grad λ · 5r.
По теореме Остроградского — Гаусса
hdivbrdQ= f(div(X5r)-gradX.8r)dQ =
Ω Ω
= -fgradX-8r6^ + (M5rMdZ.
Ω Σ
Используя проведенные выкладки, получим
h
Γ^[(δΤ + δΑ + λδφ)^Ω =
t0 Ω
ti ti
= Γ *^* Γ Γ —f3 ^^ н- JKT — s"r ad A- | S j- сг^^ н- f сз?^ ^ X,Si- - л. c? S; = 0. (15.7)
to ΩΛ / t0 Σ
Чтобы это равенство было верным, достаточно обратить в нуль
каждое слагаемое.
Смысл множителей Лагранжа в случае механических сис-
тем состоит в том, что эти дополнительные неизвестные заме-
няют уравнения связей и на самом деле отражают ответные
воздействия связей на систему, т. е. характеризуют реакцию
связей.
При выделении объема идеальной жидкости связи прояв-
ляются как воздействие на выделенный объем «остальной»
среды. А это есть нормальные давления на поверхность вы-
деленного объема: λ = р. После введения множителя λ пере-
мещения 5г становятся свободными. Поэтому, приравнивая в
(15.7) первое слагаемое нулю, заключаем, что подынтеграль-
ное выражение равно нулю, и получаем уравнение движения
в векторной форме*:
р— + grsidp = K. (15.8)
dt
* См.: Лойцянский Л.Г.
408
15. Уравнения движения идеальной жидкости
Второе слагаемое в уравнении (15.7) после приравнивания
нулю порождает краевые условия, выраженные через давле-
ние и перемещения точек границы:
ρη8ηΣ=0. (15.9)
Если часть границы Zj области соприкасается с неподвиж-
ной стенкой, то из (15.9) с учетом ρ φ 0 получим условие от-
сутствия перемещений на этой части границы в направлении
вектора нормали rt, называемое условием непротекания (не-
проницаемости границы):
πδΓ|Σ=0.
16. ЗАДАЧА ЧАПЛЫГИНА
Сформулировать задачу Чаплыгина можно следующим обра-
зом: определить замкнутую кривую (траекторию), по которой
должен лететь самолет, имеющий собственную скорость (по
модулю) Vq, чтобы в промежуток времени Τ облететь наи-
большую площадь; при этом предполагаются постоянными
скорость и направление ветра*.
Пусть ось Ох совпадает с направлением вектора скорости
ветра a; x(t)9 y{t) — координаты положения центра масс са-
молета в момент времени i; скорость самолета в неподвижных
осях хОу есть геометрическая сумма векторов собственной
скорости и скорости ветра. Поэтому проекции скорости само-
лета на оси координат:
x'(i) = i>o cos α + a; y\t) = i>0 sin α. (16-1)
Здесь α = a(t) — угол между про-
дольной осью самолета, т. е. на-
правлением вектора v(i), и осью Ох
(рис. 16.1, Η—| условное обозна-
чение самолета).
Площадь, ограниченная замк-
нутой траекторией самолета, опи-
санной за время 7\ вычисляется в
виде
τ
J[x,y] = -](xy'-yx')dt.
о
У\
а
О
* См.: Лаврентьев М.А., Люстерник Л.А.
410
16. Задача Чаплыгина
Задача сводится к поиску maxJ[xyy] при дифференциаль-
ных (неголономных) связях (16.1), т. е. поставлена задача
Лагранжа в параметрическом виде.
Ставим задачу на безусловный экстремум
о
+ X2(yr-VQsma)~^dx —» max.
Запишем уравнения Эйлера:
L'x~L's=0 => Ζ/'-^(-1/+λ1) = 0, (16.2)
dt dt
L'-—L''=Q => -x'-—(x + X2) = 0, (16.3)
y dt y dt
L'a=0 => Xisina-A2cosa = 0. (16.4)
Из (16.2) и (16.3) следует:
2y + C1=k1; 2x + C2=-X2. (16.5)
Путем параллельного переноса координат добьемся того,
чтобы постоянные в выражениях (16.5) стали равны нулю,
тогда
*=zr- у=т- (16·6)
Выберем полюс полярной системы в некоторой точке F.
Перейдем к полярным координатам: г = ^х2 + у2 , φ — поляр-
ный угол.
Поскольку tgcp = —, из (16.6) получаем
X
tg<P = ~. (16.7)
А2
С другой стороны, из (16.4):
ctga = —. (16.8)
λ2
16. Задача Чаплыгина
411
Сравнение (16.7) и (16.8) дает:
α = φ+-, (16.9)
Li
так как ctga + tgcp = 0.
Подстановка (16.9) в (16,1) приводит к системе
[je' = -i>0sin(p + a;
ly' = v0cos<p.
Умножим первое соотношение на х, второе — на у и
сложим:
xx + yy = -VQX&irity+ax + VQyQ,o&($ =>
=> хх + у у - ах = ar cos φ -ar sin a,
поскольку х = г cos φ; z/ = rsin(p.
Исходя из равенства x'x + yfy = arsina9 имеем:
U/ о 9\ 1 d 9 dr . dr
\х* + и*} = та =г— = arsina => — = asina.
2dfv > 2dt dt dt
Воспользуемся вторым из соотношений (16.1):
dr _ a dy
dt v0 dt
Отсюда получим уравнение
г- — у + С => г = — rsm(p + C => г- .
l--%incp
Получили уравнение эллипса (a/v0 < 1, так как скорость
самолета больше скорости ветра), фокус которого находится
тоже в F, полюсе полярной системы, эксцентриситет ε = —,
большая ось направлена по оси Оу. Вектор скорости центра
масс самолета ортогонален радиусу-вектору (в полярной сис-
теме) г (φ) в силу (16.9).
17. АЭРОДИНАМИЧЕСКАЯ
ЗАДАЧА НЬЮТОНА
В 1687 г. вышел в свет исторический труд сэра Исаака Ньюто-
на «Математические начала натуральной философии». В Рос-
сии книга впервые была опубликована в 1914 г. в «Известиях
Николаевской морской академии» в переводе с латыни «с по-
яснениями и примечаниями Флота Генерала А.Н. Крылова,
заслуженного профессора академии, ординарного академика
Императорской академии наук».
В разделе 7 «О движении жидкостей и сопротивлении бро-
шенных тел» Ньютон решает задачу о сопротивлении движе-
нию шара и длинного круглого цилиндра равных диаметров
в «редкой» среде (модель идеального газа или слабо сопротив-
ляющейся жидкости); затем исследует движение усеченного
конуса в той же среде и ставит задачу о нахождении формы
тела вращения, испытывающего наименьшее сопротивление
при своем движении.
Без каких-либо пояснений Ньютон приводит решение по-
следней задачи (рис. 17.1): «Когда же кривая DNFG будет
такова, что если из любой ее точки N опустить на ось АВ пер-
Поток
«редкой«
среды
Рис. 17.1
17. Аэродинамическая задача Ньютона
413
пендикуляр ΝΜ и из конечной точки G провести прямую GP
параллельно касательной Ντ, построенной к кривой в точ-
ке Ν9 то имеет место пропорция
MN:GP = GP3:(4BPGB2)»*. (17.1)
Постановка задачи о теле вращения наименьшего сопро-
тивления зависит от закона сопротивления среды. Ньютон
представлял себе «редкую» среду состоящей из неподвижных
равномерно распределенных в ней абсолютно упругих шари-
ков массой т (поэтому и назвал среду «редкой»).
Пусть тело вращения (вокруг оси Ох) движется со скорос-
тью ν (|r|=const) в ньютоновской среде и сталкивается с рас-
положенными в среде шариками (рис. 17.2).
у
Рис. 17.2
Дифференциальный элемент dr на оси Or при вращении
вокруг оси Ох «заметет» площадь
da = 2nrdr.
Этому кольцу, принадлежащему плоскости Юу, на поверх-
ности движущегося тела соответствует поясок площадью αΣ.
За время dt поясок αΣ «вытеснит» объем
dV = 2nrdr(vdt).
(17.2)
См.: Крылов А.Н.
414
17. Аэродинамическая задача Ньютона
Пусть ρ — плотность «редкой» среды. Тогда количество
частиц, встретившихся на пути пояска dl,
AT = pd —. (17.3)
т
Вычисляем импульс, действующий на αΣ (за время dt).
Пусть элемент ds дуги меридиана поверхности вращения на-
клонен к оси Or под углом φ. Отражаясь от точек пояска αΣ
(при этом угол падения равен углу отражения), каждая части-
ца массы т получит приращение количества движения
m(v2-Vi) = 2mvncos(p9 (17.4)
где |υΧ| = \ν21; η — единичная нормаль к элементу поверхности;
φ = arctg— — угол ds с осью Or.
dr
В уравнении (17.4) столкновения абсолютно упругие.
В силу третьего закона Ньютона от столкновения с одной
частицей тело подвергнется действию импульса
dJ = -2mvn cos φ.
За время dt таких импульсов будет N> причем за счет осевой
симметрии компонента суммарного импульса Jr (по оси Or)
равна нулю, a Jx вычисляем (в силу (17.2) и (17.3)) следую-
щим образом:
|/х| = (N/^ucoscpJcoscp = 4ρπυ2 cos2 qrdr dt.
Отсюда получаем составляющую по оси Ох силы противо-
действия движению тела:
dFdt = Jx => dF = ^- =>
dt
=> dF = (4πρν2)cos2 φrdr
R R
rdr "r rdr
=> F = 4npv2 [сов2q>rdr = К [ Г Г=К f Г Т 9. (17.5)
J Jl + tg^Q J fdxY
о о б т oi+ _
[dr)
Необходимо определить уравнение такой кривой х = х(г),
чтобы сила сопротивления F была минимальной.
17. Аэродинамическая задача Ньютона
415
Прежде чем решить проб-
лему минимизации функцио-
нала (17.5), рассмотрим вспо-
могательную задачу: среди
всех усеченных конусов, по-
строенных на основании АС
радиуса R и на высоте й, най-
ти конус (т. е. определить ра-
диус меньшего основания) с
наименьшим сопротивлением
движению (рис. 17.3). Ины-
ми словами: построить пря-
мой конус (т.е. при заданном
радиусе основания R найти
высоту AS = Η), усечением
которого на высоте h получим конус с наименьшим сопро-
тивлением.
Ньютон (без объяснений) дает способ построения искомого
конуса: поделим отрезок АВ пополам точкой О, найдем гипо-
тенузу ААСО
CO = ,JR2+(h/2)2
и отрезок СО отложим от точки О вдоль оси АВ:
AS = H = - + ,]R2+(h/2)2.
Таким образом, построим конус ACS, который необходимо
«усечь» на высоте Л. Приводим решение А.Н. Крылова, данное
в его комментариях к «Математическим началам».
Введем вспомогательный параметр ξ: Η = h + ξ. Тогда
R
(Λ + ξ)
Сила сопротивления среды, действующая на усеченный
конус, есть сумма сопротивления 2*Ι носовой части GH и со-
противления F2 боковой поверхности:
F = F1+F2=4:Ttpv'
r0 R
\rdr +
Ко г0
с rdr
Jl + tg2q>
416
17. Аэродинамическая задача Ньютона
= 2τφν'
( ξ2β2
(А + У
1-
&
ν
2_l τ>2
R2+{h + ^Y
RA
R2+(h + l)'
= 2πρυ2R2 ξ +R , ΞF(ξ).
^2+(/* + ξ)2 W
Находим стационарную точку:
*"(ξ) = 0 => ξ2+Λξ-Λ2=0 =>
(-/г±л/л2+4Д2)
Берем положительный корень:
ξ = -^ + ν^2+(Λ/2)2,
LA
получаем высоту конуса ACS, предложенную Ньютоном:
H = h + ?, = - + ^R2+(h/2)2.
Рассмотрим малую секцию усеченного конуса:
ft^O =» Я—>i? => tgcp = >1,
т. е. образующая усеченного конуса пересекает меньшее осно-
вание под углом 135°.
Отсюда Ньютон делает важный вывод (рис· 17.4): «Если
тело образуется обращением эллипса или овала ADBE около
Поток
«редкой»
среды
Рис. 17.4
17. Аэродинамическая задача Ньютона
417
оси АВ и к производящей кривой проводятся касательные
FGj GH, Η J в точках F> В, J так, что GH ± АВ в точке каса-
ния, другие же касательные FG и HJ составляют с GH углы
FGB и JHB, равные 135°, то тело, образуемое обращением
фигуры ADFGHJE около той же оси АВ, будет испытывать
меньшее сопротивление, нежели первоначальное (т. е. тело,
образованное вращением овала), при движении вдоль оси
точкою В вперед.
Я считаю, что это предложение может быть небесполезно
при построении судов».
Пример 17.1. Спроектируем носовую секцию некоторого
аппарата, головная часть которого должна быть получена вра-
щением параболы х = гп вокруг оси Вх (рис. 17.5).
На каждой полуветви произво-
дящей кривой находим точки F, J,
такие, чтобы касательные, проведен-
ные из них, пересекали ось Вт под
углом 45°. Тогда координаты точек F,
J будут равны
( 1
'1^
\п)
п-\
η \
BG = r0 =
n-1
η
(Λ \
\η)
η-\
Χ\
J^C
ο t
Ι
ΤΓ V
1 Γ
^ ' ^
Η Β G
Рис. 17.5
Вычисляем силы сопротивления
и объемы тел, образованных враще-
нием параболы FBJ (Fi и Qi соответственно) и вращением
ломаной FGBHJ (F2 и Q2).
Сравнительные значения величин приведены в табли-
це5". Силы сопротивления Fl9 F2 даны в условных силовых
единицах, объемы — в некоторых кубических единицах
длины.
Отмечаем в обоих случаях уменьшение силы сопротивле-
ния и увеличение полезного объема носовых секций.
* См.: Ванько В.И.
418
17. Аэродинамическая задача Ньютона
Таблица
Парабола
х = г2
1 \Ч
fi
0,0866
0,1309
Qi
0,0982
0,1209
F2
0,0781
0,1204
Q2
0,1145
0,1418
^^-•100%
9,81
8,00
^^•100%
16,4
17,28
#
Из (17.5) получаем экстремальную задачу:
R
J 1 + х г
о
—» mm,
re[0,r0] => х = 0, х(Д) = Л,
(17.6)
кроме того, в силу замечания Ньютона имеем х'(г0) = 1·
В формуле (17.6) интегрант функционала явно зависит от
независимой переменной г, поэтому интегрировать соответст-
вующее уравнение Эйлера весьма затруднительно.
Получим более удобную форму функционала.
Считая функцию х = х(г) монотонно возрастающей, обра-
тим зависимость
x = x(r) => r = r(x) => dr-rdx.
Тогда
R 7 R
г гаг г
h+xr2 = l~
о о 1
rdr
+ -
fdr;
rdr Jc{dxJ f
1 J f^\2 J
rfZrdx
(dr/dx)'
\dxj
Kdx,
Следовательно, задачу ставим так:
J 1 + r
r'3rdx
mm,
г(0) = г0, г(Л) = Д, /(0) = !.
(17.7)
В (17.7) штрихом обозначили производную по х; далее
покажем, что г(0) = г0 * 0, т. е. тело вращения с минимальным
сопротивлением имеет площадку в носовой части. Это соответ-
ствует чертежу Ньютона (рис. 17.1).
17. Аэродинамическая задача Ньютона
419
Замечание 17.1. В комментариях А.Н. Крылова к задаче
Ньютона показано, что геометрическое условие (17.1) факти-
чески эквивалентно уравнению Эйлера вариационной зада-
чи (17.7).
Решаем задачу (17.7). Интегрант преобразованного функ-
ционала явно не содержит независимой переменной, в данном
случае х. Поэтому сразу выписываем первый интеграл (обо-
значив интегрант через /(·)):
r'p-f = c1
( rr'3 V
v1 + r'%
r'*r
г
2r'3r
(1 + r'2)
1 + r'2
7T-Ci
(17.8)
Полученное ОДУ первого порядка (17.8) интегрируем ме-
тодом введения параметра:
2р3г
г = р =>
= Ci
r = d
а+р2)2
а+Р2)2
Далее имеем
^ = Р => d\d
ах
2р3
0-+P2)2]
2р3
= pdx
Ci
з П
=> х = —- 1ηρ + —- +
2 Ι ρ2 4 ρ
dp
+ C9
Итак, выведены параметрические уравнения искомых экс-
тремалей (образующих поверхности вращения):
х = -
с-(
1пр +
1JL
4 ρ4
\+с2;
г =
Ci(l + ^)
2\2
(17.9)
420
17. Аэродинамическая задача Ньютона
Замечание 17.2. Параметрическое представление экстре-
малей задачи (17.9) впервые получено А.Н, Крыловым, при-
чем с1 = г^-.
2
Уравнения экстремалей получены также в параметриче-
ской форме*. Параметр, обозначенный через q, есть обратная
величина параметра, введенного в нашей работе: q = 1/р.
Известно решение задачи Ньютона с применением тео-
рии оптимального управления (во введенных обозначениях,
см. (17.5))**:
R л
г гаг
\- з" ~> illf>
J 1 + ir
о
dx
dr
х(0) = 0, x(R) = h,
ueR+.
Решение получено также в параметрической форме через
параметр и = -1/р (р — использованный в данной работе па-
раметр).
Отметим, что представления решений в виде (17.9) и в ци-
тированных работах совпадают с точностью до обозначения
параметров и постоянных.
Пусть начальное значение параметра р = р0>0. Тогда из
второго соотношения (17.9) получим r(pQ)^0. В противном
случае г(р0) = 0 =>€Ι=0, и из первого соотношения (17.9)
следует, что # = С2, т. е. кривая х = х(г) вырождается в отре-
зок прямой, параллельной оси Or, и при этом нарушается
условие взаимной однозначности зависимости х ~ г.
Исследуем семейство кривых (17.9). Рассмотрим кривую
при С\ = 2, С2 = 0; остальные кривые семейства при любых
Сь С2 получаются из этой кривой (С^ = 2, С2 =0) подобным
преобразованием с центром в точке, принятой за начало коор-
динат, с коэффициентом подобия Сх и перемещением на рас-
стояние С2.
* См.: Лаврентьев М.А., Люстерник Л.А.
** Решение приведено, например, в книге: Алексеев В.М., Тихоми-
ров ВМ., Фомин СВ.
17. Аэродинамическая задача Ньютона
421
Получили кривую Ньютона:
13 1
х = тр + —- +
Ар
4 '
1 2
г = — + - + р.
(17.10)
Исследуем поведение кривой (17.10) на плоскости хОг. При
/?^+0: г^+°о, х—>+<*>; при /?^+°°: г—>+оо, #_>+оо.
Поэтому при некотором значении параметра р = р* функ-
ции х(р) и г(р) достигают своих минимальных значений.
Найдем стационарные точки (р > 0):
dx
dp
р4-2р2-3
= 0 => р4-2р2-3 = 0;
dr _р4-2р2-3
dp ρ4
= 0
р4-2р2-3 = 0.
X А
х(р*)
В обоих случаях получили одно
и то же биквадратное уравнение,
единственный корень которого,
удовлетворяющий условию р>09
есть р* = л/3.
Для кривой (17.10), двумя вет-
вями уходящей в бесконечность,
точка с координатами (г(р*), х(р*))
есть точка возврата* (рис. 17.6).
Итак, при р—> функции
г(р), х(р) стремятся к своим ми-
нимальным значениям:
ре (0,у1з\: ρ—> у/3 => г —>г(р*), х^х(р*) — по 1-й ветви;
ре v3,+o°j:p—>+о° => г, х^+оо —по 2-й ветви.
Покажем, что минимальное значение функционала обес-
печивается 1-й ветвью кривой Ньютона: pG (0,v3]. Проверя-
ем выполнение усиленного условия Лежандра:
* См.: Рашевский П.К.
422
17. Аэродинамическая задача Ньютона
^^ = (ГТ^7(3"Г'2)>0^ (17Л1)
=> 3-г'2>0,
так как г, г' > 0.
Из неравенства (17.11) получаем ограничения на измене-
ние параметра ρ - г': 0<р< л/3.
Тангенс угла наклона касательной кривой (17.10) к оси Or
выражается в виде
dx 1
tg<p = —= —.
dr p
Отметим, что в точке возврата для обеих ветвей
tg(p = -= => φ = 30°.
λ/3
Так как при р—>0 => tg(p—>°°, на 1-й ветви существует
( 1Л
точка (г,х), где tg<p = l (φ = 45°): (rfx)=\ 4,— , ибо здесь р = 1.
Теперь приведем слова Ньютона: «...из конечной точ-
ки G проведем прямую GP... то имеет место пропорция...»,
см. (17.1).
Точка G на оси Or должна быть задана при постановке за-
дачи: г = г(х) => г(0) = г0, что будет показано далее.
Поэтому, на наш взгляд, задача Ньютона изначально ста-
вилась следующим образом: на оси Or задавался отрезок
BG = rQ, и кривая (х(р)9 г(р)) строилась так, чтобы точка G
была точкой кривой, где касательная образует с осью Or угол
45° (см. вспомогательную задачу о конусе наименьшего сопро-
тивления, пример 17.1).
Итак, пусть r(p0) = r(l) = r0, x(l) = 0. Тогда из параметри-
ческих соотношений (17.9) получаем значения постоянных
интегрирования:
1 2 16
17. Аэродинамическая задача Ньютона
423
Следовательно, решение задачи имеет вид
г0а+Р2)2.
г =
4 ρ
3
4
(л 1 3 1 Ι 7
р^ 4 ρ4
(17.12)
—ro-
16
Рассмотрим различные конструктивные требования.
Прежде всего отметим, что задавать произвольно габарит-
ные размеры R, h, г0, вообще говоря, нельзя.
Например, пусть R = 50, г0 =16, h = 57 некоторых единиц
длины. Из первого уравнения системы (17.12) прямой под-
становкой убеждаемся в том, что ρ = 1/2 есть одно из его ре-
шений. Второе уравнение системы (17.12) после подстановки
значений x = h = 57, r0=16 и ρ = 1/2 приведет к противоре-
чию: 1п1/2 = 0.
Покажем, что задание R и h (совместно с условием х'(г0) = 1)
определяет единственное решение задачи (17.7). Из уравне-
ний (17.12) исключаем г0 и, вводя параметр (a = h/R, получа-
ем уравнение
рА\пр = -рА-р2-- + <о(У + 2рв + р), 0<р<1. (17.13)
Обозначив через cpi(p) и (р2(р) левую и правую части урав-
нения (17.13), имеем <Pi(p) = q>2(P)-
Решения уравнения (17.13) есть абсциссы точек пересече-
ния графиков функций t/ = (Pi(p) и у = <р2(Р) на плоскостирОу.
Функция у = р4\пр на интервале (0, 1) корней не имеет:
у<09р^0^ г/^-0, ф!(1) = 0.
Исследование многочлена пятой степени (р2(р) с помощью
теоремы Бюдана — Фурье (построением таблицы перемен зна-
ков функции (Р2(р) и ее производных до пятого порядка в
точках ρ = 0 и ρ = 1) показывает, что многочлен имеет на ин-
тервале (0, 1) три корня или один корень*.
Таким образом, уравнение (17.13) на интервале ре (0,1)
может иметь от одного до трех корней (один корень заведомо
существует, так как φ2(0) = -3/4, φ2(1) = 4ω>0).
* См.: КурошАТ.
424
17. Аэродинамическая задача Ньютона
Покажем, что любому значению параметра ω = h/R > 0 со-
ответствует единственное значение ре (ОД).
Разрешив (17.13) относительно ω, получим
ω =
р41пр + р2 — Р4+ —
4 4,
p5+2ps+p
ω = ω(ρ): р^+0 => ω(ρ)^οο, ω(1) = 0.
(17.14)
Анализ значений производной функции ω(ρ) на полуинтер-
вале (0, 1] показывает, что со'(р) < 0, т. е* функция ω(ρ) на этом
отрезке монотонно убывает (рис. 17.7).
Пусть дано отношение габаритов h/R = (d0. На кривой
ω=ω(ρ) находим соответствующее значение р = Ро- Чтобы
определить значение г0, необходимо задать в некоторых
единицах длины, например, размер R. Тогда Λ = ω0Λ и зна-
чение г0 (в тех же единицах) определяется из любого из
уравнений (17.12).
Замечание 17.3. Рассуждения, изложенные выше, можно
рассматривать как доказательство существования поля экс-
тремалей в области х > О, г > 0.
Замечание 17.4. Выполнив дальнейший анализ с исполь-
зованием теоремы Бюдана — Фурье, убеждаемся в единствен-
ности решения задачи (17.7) при известных габаритах r0, R
или r0, h.
С геометрической точки зрения последние утверждения
очевидны: задание габаритного размера г0 определяет един-
17. Аэродинамическая задача Ньютона
425
ственную кривую (17.12); на этой кривой размер r = R опре-
деляет единственное значение x = h (и наоборот) (рис. 17.8)*.
Замечание 17.5. Рассмотрим решение задачи Ньютона в
упрощенной постановке .
Поставим задачу (см. (17.7)):
h „'3
г г °г
J= ^dx -> min,
о
r(0) = 0, r(h) = R.
1 + г
зующие поверхности вращения), получим
Считая, что ^-~1 (т. е. рассматриваются пологие обра-
h
J= fr'srdx -» min, r(0) = 0, r(h) = R.
о
Имеем уравнение Эйлера:
r'3-3(rr'2)'=(), (17.15)
следовательно, частное решение г = 0 неприемлемо в силу
поставленных краевых условий.
Уравнение (17.15) приводится к виду
r'3+3rr'r* = 0. (17.16)
Умножив (17.16) на г', заметим, что полученное выраже-
ние есть полная производная:
г'(г'3 + 3гг'г") = — (Г'3г) = 0 => г'3г = Сх =>
<2#
=> г =
ГСП178 Г4^/4/ Ι— λ3/4
' П =>г(х)=| (#СГ* + С2) . (17.17)
V г J
В силу граничных условий из (17.17) получим:
См·: Ванъко В.И.
См.: Краснов М.Л., Макаренко Г.И., Киселев В.Н.
426
17. Аэродинамическая задача Ньютона
с2=о, с1 =
зл
4 Л
R.
Таким образом,
г *\ъ'* г *\Ъ/А
г =
\*J
я,
следовательно, поверхность минимального сопротивления в
рассматриваемой постановке есть парабола степени 3/4.
Обратим внимание на то, что
,. dr
lim— = оо5
x^odx
следовательно, соответствующая поверхность вращения в но-
совой части имеет затупление.
Очевидно, что экстремали (17.14) образуют поле и выпол-
няется усиленное условие Лежандра.
Замечание 17.6· Задача Ньютона получила значительное
развитие в работах отечественных исследователей в связи с
проектированием головных частей космических аппаратов*.
* См.: Гонор АЛ.\ Ефремов Н.Л. и др.; КрайкоА.Н.; Черный Г.Г.
18. ЗАДАЧА О ПРОДОЛЬНОМ ИЗГИБЕ
УПРУГОГО СТЕРЖНЯ
18.1. Действие потенциальной силы
Даниил Бернулли, решая проблему чистого изгиба упругой
балки, выдвинул гипотезу прямых нормалей: все нормали к
нейтральному слою балки остаются таковыми и после изгиба
балки, не изменяя своей длины (рис. 18.1)·
Z i
О
\
dSQ
т.
3
X
Ь
\ d{? /
\ /
Рис. 18.1
При действии моментов крайние сечения элементов дли-
ны dS смещаются одно относительно другого на угол αφ. Вы-
числим деформации продольных волокон, находящихся на
расстоянии z от нейтрального слоя z - О (который сохраняет
свою первоначальную длину), -h<z<h:
Zz =
(dS0+zdq)-dSb _ d(p
dS0
= z
dS0
= KZ,
(18.1)
где к — приращение кривизны первоначального прямого
стержня.
428
18. Задача о продольном изгибе упругого стержня
Из (18.1): σ2 = Εε2 = Ekz — напряжения в точках волокон
упругой балки, Ε — модуль Юнга материала балки, Н/м2.
Поэтому внутренний изгибающий момент в сечении (рассма-
триваем балку прямоугольного постоянного сечения bx2h):
h
M=\a2zdF = \(EKz)zbdz = EK-bh3 => Μ = ΕΙκ. (18.2)
F -h
Здесь F — площадь поперечного сечения, м2; / — геометри-
ческий момент инерции сечения, м4; EI — жесткость упругой
балки (стержня) на изгиб, Н-м2.
Как известно, момент, приложенный к элементу dS> «ра-
ботает» на приращении угла между соседними поперечными
сечениями. Поэтому элементарная работа внутреннего момен-
та имеет вид
δΑ(Μ) = Μ αφ = ΕΙκ αφ = ΕΙκ^-dS = ΕΙκ2 dS. (18.3)
do
В силу теоремы Клапейрона, потенциальная энергия (работа
напряжений), накопленная элементом dS, равна половине
работы внешних сил (в данном случае моментов), приложен-
ных к элементу. Тогда потенциальная энергия изогнутой бал-
ки, длина которой /:
1 rl
U(dS) = -ElK2dS => П= \-ElK2dS. (18.4)
о
В письме от 22 октября 1742 г. Д. Бернулли сообщает
Л. Эйлеру, что задача об изгибе упругого стержня может быть
решена методом максимумов и минимумов: «...среди кривых
постоянной длины, которые проходят через две фиксирован-
ные точки... определить ту, для которой
р-—«-*
K^ds—»min» . (18.5)
о
Это была первая в истории теории упругости постановка
вариационной задачи. Действительно, к — приращение кри-
* См.: Эйлер Л.
18.1. Действие потенциальной силы
429
визны упругой оси изгибаемого стержня, длина которого I;
функционал (18.5) с точностью до множителя — ΕΙ — потен-
циальная энергия изогнутого стержня, Е1к — в формуле Бер-
нулли есть внутренний момент сопротивления поперечного
сечения стержня изгибу (Е — модуль Юнга, Н/м2; I — момент
инерции сечения относительно его нейтральной линии, м4);
(1/2)Е7к2 ds — потенциальная энергия элемента ds. Поэтому
требование минимальности функционала (18.5) — выражение
минимума потенциальной энергии упругого стержня.
Рассмотрим постановку
задачи о продольном изгибе
упругого стержня длиной I,
постоянного поперечного се-
чения, / = const (рис. 18.2).
Вычислим потенциаль-
ную энергию системы стер-
жень — внешняя сила, пре-
небрегая деформациями сжа-
тия оси. Считаем, что прогибы у(х) малы, к~у".
Потенциальная энергия элемента ds (в силу гипотезы Бер-
нулли и теоремы Клапейрона) равна —EI\c2ds. Отсюда энер-
гия всего изогнутого стержня
I
Рис. 18.2
Пг = \-ElK2ds.
Внешняя сила перемещает подвижный конец стержня на
величину Δ (см. рис· 18.2):
I I
A = l-L = l-\ cos(pds = Z- л/l-sin2 φ ds~
l-Ul-tg2($ds = l-\4l-y'2ds
о
l
~l-j(l--y'2 )ds~(-y'2dx (dx~ds).
430
18. Задача о продольном изгибе упругого стержня
Поэтому действующая сила совершит работу
Α(Ρ) = Ρ·Δ= \-Py'2dx.
J 2
о
Потенциальную энергию внешней силы можно вычислить
так:
n2=-jl-Py'2dx.
2
о
В силу принципа минимума потенциальной энергии кон-
сервативной системы ставим вариационную задачу:
i
J[y] = U1+n2=j(^EIyff2^Py'
dx —» min.
В силу теоремы о необходимом условии экстремума функ-
ционала имеем:
i
MivM = δ(Π! +Π2) = \(Е1у"Ьу"-Ру'Ьу')ах = 0.
о
Техника получения из условия SJ = 0 уравнения равнове-
сия и естественных краевых условий состоит в следующем.
Интегрированием по частям добиваемся, чтобы под интегра-
лом осталось некоторое выражение, умноженное на вариацию
5г/. Приравняв множитель при 5г/ нулю, имеем уравнение
равновесия. Внеинтегральные слагаемые с учетом кинемати-
ческих (предварительных) краевых условий, определяемых
постановкой задачи, образуют естественные краевые условия.
Итак (после процедуры интегрирования),
i
&7[»,бу] = 5(П1+П2)= j(EIylY +Py")bydx +
о
+Е1у^у'\10-Е1утЬу\10-РуЪу\10=0.
Для обращения вариации функционала в нуль достаточно
интеграл и внеинтегральные слагаемые приравнять нулю. Из
равенства интеграла нулю при произвольных непрерывных
вариациях Ьу(х) в силу леммы Лагранжа получим уравнение
равновесия
18.1. Действие потенциальной силы
431
Е1у1У+Ру" = 0. (18.6)
Тогда необходимое условие экстремума примет вид
Ы[У,№ = Е1у'ду]10 -Е1у"Ъу\[ - РуЪу\10 = О,
bJ = EIy"by'\[ -(EIym + Py')8y\l0=0.
Постановку задач для различных случаев закрепления
концов стержня проиллюстрируем примерами*.
Пример 18.1. Шарнирное опирание в точках х = 0 и х-1
(см. рис. 18.2).
Здесь у(0) = у{1) - 0 => $у(0) = 6у(1) = 0. Поэтому вариация
функционала имеет вид
8J = Е1у\1)Ьу'{1) - Е1уЩдуЩ = 0.
Так как вариации производных в краевых точках не равны
нулю и независимы, получим естественные краевые условия:
V(0 * ву'(0) * 0 => /(0) = у\1) = 0.
Задача о продольном изгибе в данном случае будет постав-
лена, если уравнение (18.6) решать при условиях
Irf0) = у<0 = 0, /(0) = /(Ζ) = 0.
Пример 18.2. Оба конца стержня жестко заделаны (рис. 18.3).
Рис. 18.3
Так как жесткость стержня на изгиб больше нуля, в точках
х = 0 и х-1 перемещения у{х) и производные у\х) равны
нулю, т. е. имеем кинематические краевые условия:
у(0) = у(1) = 0, у'(0) = у'(1) = 0.
При этом вариация 8J = 0.
См.: Ванько В.И.
432
18. Задача о продольном изгибе упругого стержня
Пример 18,3. В точке х = 0 — жесткая заделка, в точке
х = I — подвижный шарнир (рис* 18.4)·
Рис. 18.4
Имеем предварительные краевые условия:
1/(0) = у(1) = 0, уЩ = 0 => 5у(0) = 8у(1) = 0, δ*/'(0) = 0.
Отсюда
6J = EIy"(№y'(l) = 0 => /(i) = 0.
Получено естественное краевое условие, поскольку /(0*0.
Итак, краевые условия в этом случае:
у(0) = у(1) = 0, /(0) = 0, /(0 = 0.
Пример 18.4. В точке х = 0 — жесткая заделка, конец
х = I — свободный, сила Ρ сохраняет свое направление
(рис. 18.5).
В точке х = 0 имеем предварительные условия:
у(0) = 0, у'(0) = 0 => 5у(0) = 0, 5/(0) = 0,
I
kx
О
Рис. 18.5
поэтому вариацию функционала потен-
циальной энергии, приравненную нулю,
запишем так (5г/(0^0, 5/(0 *0):
&/[г/,81/] = Е//(05/(0-
-(£//(0 + Ρ/(0)δ»(0 = 0.
В силу независимости вариаций 5/(0
и 5i/(Z) получим два условия в точке х = I:
/(0 = 0, £//(0+Р/(0 = 0.
Таким образом, в каждом из рассмотренных примеров для
решения задачи о продольном изгибе упругого стержня име-
18.1. Действие потенциальной силы
433
ем однородное (правая часть равна нулю) ОДУ с однородными
краевыми условиями.
Поставим краевую задачу:
1/Ιν+λγ = 0 (0<х<1);
х = 0: z/(0) = 0; i/'(0) = 0;
x = l: у\1) = 0; у"(1) + Х2у'{1) = 0.
(18.7)
2=— —
ΕΙ
Поскольку (18.7) — однородная краевая задача, то одно из
Здесь λ2 = — — основной параметр
ΕΙ
решений есть у(х) = 0: при любом значении параметра λ =
ΕΙ
существует прямолинейная форма равновесия.
Выясним, существуют ли значения параметра λ, при ко-
торых наряду с тривиальным решением возможно решение
у(х) φ 0.
Общее решение уравнения (18.7) имеет вид
у(х) = Ci cosXx + C2 sin Ля + С3х + С4.
Произвольные постоянные интегрирования находим в силу
краевых условий задачи (18.7):
1/(0) = 0 => С!+С4=0;
у'(0) = 0 => ХС2+Св=0;
у"(1) = 0 => -K2C1cosKl-k2C2sui)J = Qi
y"(l) + X2y'(l) = 0 => Х2С3=0 => С3=0.
В силу равенств (18.8) имеем:
С2 =0, С4 =—Cij
cosXl = 0 =;
(18.8)
—l = - + nn(neN).
ΕΙ 2
(18.9)
Получено множество значений параметра λ = J—, т. е.
существует множество значений продольной силы Р, при ко-
торых наряду с тривиальной формой равновесия (у(0) = 0)
434
18. Задача о продольном изгибе упругого стержня
возможны нетривиальные формы равновесия (у(0) Φ 0). Такую
ситуацию называют бифуркацией.
Множество λп = называют множеством собствен-
I
ных чисел однородной задачи.
Вычислим минимальное значение силы, соответствующее
наименьшему собственному числу (п = 0):
2 ^ min" 4 I2 *
Значение силы Pmin называют эйлеровой силой (в тер-
минологии Л. Эйлера — «сила колонны») и обозначают Рэ.
Найдем, например, первую собственную функцию (первую
из отклоненных форм равновесия стержня), соответствующую
71
первому собственному числу λ! =—. Подставим λ! в систе-
му(18.8).
Решение задачи (18.7), соответствующее первому собствен-
ному числу, имеет вид
у(х) = С,
{ пх ,λ
cos 1
21
(18.10)
J
Свободному параметру С\ можно придавать произвольные
значения.
Полученный результат (18.10) с физической точки зрения
неудовлетворителен. Постоянная С± остается неопределенной,
т. е. одной и той же силе соответствует произвольный прогиб:
равновесие оказывается безразличным. Предположим, что
приложенная сила больше Р1? соответствующей я = 0 в фор-
муле (18.9), но меньше Р2 (п = 1). Рассуждения данного пара-
графа не обнаруживают никаких иных форм равновесия, кро-
ме прямолинейной.
Причина этих физических противоречий заключается в
том, что уравнение равновесия (18.6) выведено при условии
к~гД т. е. уравнение изгиба не является точным".
Замечание 18.1. Для того чтобы понять, что такое бифур-
кация, М.А. Лаврентьев** предложил и продемонстрировал
w См.: Работное Ю.Н.
*' См.: Лаврентьев Μ Α., Шабат Б.В.
18.1. Действие потенциальной силы
435
следующий эксперимент. Вертикально расположенный стер-
жень (тонкая упругая полоса, в эксперименте — длинная
стальная линейка) нижним концом закреплен в массивном
основании (см. рис. 18.5). К верхнему концу крепится точеч-
ная масса, создающая своей тяжестью сжимающую силу, в
начале опыта значительно меньшую соответствующей эйлеро-
вой силы РЭ = Р\ (18.9).
Если стержень, нагруженный таким образом, слегка откло-
нить от вертикального положения, а затем отпустить, то он,
совершив затухающие колебания в окрестности положения
равновесия, вернется в первоначальное положение. Имеем
устойчивое равновесие вертикального положения.
Увеличиваем точечную массу т. При этом уменьшается
частота колебаний стальной линейки. При некотором значе-
нии массы т-ггС частота колебаний обращается в нуль: стер-
жень при отклонении уже не возвращается в вертикальное
положение. Наступает состояние безразличного равновесия,
причем отклонение верхнего сечения стержня может иметь в
некоторых пределах любое значение* При тщательной поста-
η π2 ΕΙ
новке эксперимента т соответствует силе Рэ = —.
Замечание 18.2. В учебниках по сопротивлению материа-
лов показано, что величины Ely" и Ely" — соответственно
изгибающий момент и перерезывающая сила в сечении, вы-
званные произошедшим изгибом (под действием приложенной
нагрузки) стержня. Значит, полученные вследствие вариаци-
онной постановки в примерах 18.2, 18.4 естественные краевые
условия Е1у"(0) = 0, Е1у"(1) = 0 —
это выражения равенства нулю из-
гибающего момента в шарнирно-
опертых сечениях.
В примере 18.4 условие у"(1) = О
означает отсутствие изгибающего
момента в свободном сечении стер-
жня; условие (22/z/* + Pz/')| = О,
полученное посредством обраще-
ния вариации функционала энер-
гии в нуль, трактуется как выра-
жение перерезывающей силы Q
X к
Q = 0
Рис. 18.6
436
18. Задача о продольном изгибе упругого стержня
в сечении через приложенную нагрузку и угол поворота сече-
ния* (по гипотезе плоских сечений сечение х = I остается нор-
мальным к оси стержня) при неизменном направлении силы Ρ
(рис. 18.6):
Р = Р*+РХ\ Q + P*=0 => Q = -P*
Q = -Pcos
π
Λ
-φ
=> Q + Psin(p^Q + Ptg(p = 0 => (EIy* + Py')\ =0.
Подчеркнем, что при использовании вариационного под-
хода обсуждаемое статическое условие получено непосред-
ственно как естественное условие.
18.2. Действие следящей силы
До сих пор мы ставили задачи для консервативных сис-
тем (упругая конструкция плюс потенциальная сила), для
которых выполняется принцип минимума потенциальной
энергии.
Пусть на жестко заделанный упругий стержень действует
сила Р, приложенная к свободному сечению, причем направ-
ление силы в любой момент ее действия совпадает с направле-
нием касательной в точке х-1 (рис. 18.7). Показанную на
См.: Волъмир А.С.
18,2. Действие следящей силы
437
рисунке силу Ρ называют следящей, это непотенциальная
сила, так как ее работа зависит от траектории, по которой сис-
тему переводят в конечное состояние*.
Принципом минимума потенциальной энергии воспользо-
ваться нельзя, поэтому запишем уравнение Бернулли:
η
ElK = ^mom(Fk). (18.11)
1
Здесь Fk — силы, приложенные к стержню. Следящую силу
Ρ представим в виде суммы
где Pi — вертикальная составляющая, Р2 — горизонтальная
составляющая.
Пусть / — отклонение оси стержня от вертикали при х = I,
φ — угол наклона оси в сечении х = L
Уравнение (18.11) запишем в виде
=> ElK = Pco$(p(f-y)-Psm(p{l-x).
В геометрически линейном приближении (к- i/*, cosq)~l,
sincp = (p) уравнение (18Л2) принимает вид
EIy' = P(f-y)-P<p(l-x).
Обозначив Ρ/ΕΙ = λ29 получим краевую задачу:
\y" + X2y = X2f-X2<p(l-x);
\y(0) = 09y'(0) = 0;y(l) = f, y'(l) = <p.
(18.13)
Общее решение задачи (18.13):
у (х) = Ci cos λτ + С2 sinXx + / - φ(/ - х),
что легко проверить непосредственной подстановкой.
Постоянные Сх, С2, /, φ находим в силу краевых условий:
у(0) = 0 => d+/-q>Z = 0;
z/'(0) = 0 => λΟ2+φ = 0;
!/(/) = / => C1cosX/ + C2sinX/ = 0;
y'(l) = (f> => -XCismXl+XC2co$Xl = 0.
См.: Болотин В.В.
438
18. Задача о продольном изгибе упругого стержня
<?!+/-φΖ = 0;
λβ2+φ = 0;
Ci cos XI + C2 sin XI = 0;
-XCi sin XI + XC2 cos XI = 0.
Получили, как и выше, однородную СЛАУ, При обращении
определителя системы в нуль возможны нетривиальные ре-
шения.
Вычисляем определитель:
1 0 1 -Л
Δ =
0 λ 0 1
cosXl sin XI 0 0
-sinXl cosXI 0 0
= cos2 XI + sin2 XI = 1 φ 0.
При любом значении λ (следящей силы) определитель не ра-
вен нулю!
Из этого факта в некоторых публикациях авторами был
сделан вывод о том, что стержень под действием следящей
силы устойчивость не теряет*. Ситуация со следящей силой,
сложившаяся в 50-е годы XX века, описана В.В. Болотиным**.
Однако еще в 1928 году Е.Л. Николаи изучал действие не-
потенциальных нагрузок на упругий стержень и показал, что
для разрешения упомянутого «парадокса» (отсутствия кри-
тической силы) следует рассмотреть малые колебания около
положения равновесия, т. е. переходить к динамической по-
становке задачи: согласно Ляпунову, форма равновесия устой-
чива, если малые возмущения вызывают малые отклонения от
равновесной формы***.
18.3. Динамический подход
Изучим характер колебаний упругого стержня под действием
потенциальных и непотенциальных сил.
1. Консервативная система: сила возрастает, сохраняя
свое направление.
* См.: Феодосъев В.И.
** См.: Болотин В.В.
*** См.: Николаи ЕЛ.
18.3. Динамический подход
439
Статическая постановка рассмотрена выше (см. при-
мер 18.4):
э " 4 I2 '
Динамическая постановка: малые колебания около воз-
можного положения равновесия z/(x,i) = 0.
Для упрощения выкладок считаем,
что масса стержня сосредоточена в сече-
нии х-1 (точечная масса), а сам стер-
жень есть упругая связь (рис. 18.8).
Согласно принципу Даламбера, в пра-
вой части уравнения (18.11) необходимо
учесть момент силы инерции массы М:
X к
fit)
у(х, t)
EIy" = P(f-y)-
d2f
-Μ(1-х)—^, 0<х<1.
V Jdt2
(18.14)
Рис. 18.8
Здесь / = f(t) — отклонение сечения х = I
от вертикали. Перемещение y = y(x,t) подчиняется краевым
условиям: i/(0,£) = 0, y(l,t) = f(t), y'(0,t) = 0. Начальные усло-
вия: i/(x,0) = 0, y\x90) = 0; y(l,0) = f(0) = F = const, т. е. в на-
чальный момент времени сечение х-1 отклонили на величи-
ну F, в результате чего начались колебания.
Решение задачи ищем в виде:
y(x,t) = Y(x)elL1\ № = Fe
лш
i = V^T.
Подставляя эти выражения в уравнение (18.14) и сокращая
на elQt Φ О, получим для функции Y(x) краевую задачу:
МО2
Y"+X2Y = X2F + ^^(l-x)F;
ΕΙ ν }
Υ(0) = 0, Y'(0) = 0, Y(l) = F.
(18.15)
Запишем общее решение уравнения (18.15):
Ω2
Y(x) = Ci cos Xx + С2 sin Xx + F + Μ
Χ2ΕΙ
(l-x)F.
440
18. Задача о продольном изгибе упругого стержня
Для определения постоянных Ci,C2,F используем краевые
условия (18.15):
У(0) = 0 => Ci+F
1 +
ΜΩ
Х2Е1
2 Л
I
= 0;
ΜΩ.2
Г(0) = 0 => XC2-=^f^F = 0;
V ' 2 λ2ΕΙ
Y(l) = F => C!CosX/ + C2sinX/ = 0.
Обращая в нуль определитель системы, получаем частотное
уравнение (относительно частоты колебаний Ω):
ΜΩ2
1 0 1 + ^-Z
Δ =
0 λ
cos λ/ sin λ/
λ2ΕΙ
ΜΩ2
λ2 ΕΙ
0
= 0
ΜΩ2
λ2£7
(sin XI - XI cos λΙ) = λ cos λ£
=> Ω2 =
λ2ΕΙ XcosXl _(λΙ)2ΕΙ XlcosXl
Μ sinXl-XlcosXl Ml3 sinXl-XlcosXl
Ω =
_ \(λΙ)2ΕΙ cosXl
Ml3 sin λ/
XI
-cos XI
Введем переменную величину ξ = λΖ и рассмотрим функ-
цию под радикалом:
ξ2 cos ξ
φ(ξ)=
sin ξ
-cos ξ
Вычислим 1πηΦ(ξ), используя разложения βΙηξ и cosξ в
окрестности точки ξ = 0:
1πηΦ(ξ) = 1πη
ξ2
ξ->0
ξ->0
η
= 3.
ξ2---
2! 3!
/
18.3. Динамический подход
441
Таким образом, собственная частота колебаний системы
стержень — масса (λΖ-^Ο ~ Р^О):
ω°=&^· <18дб)
При возрастании параметра ξ>0: Φ(ξ)>0 =>elQt = cosQ£ +
+ isinQt, т.е. имеем гармонические колебания около положе-
ния равновесия Y(x) = 0.
При Φ(ξ)<0 получим е^\ т. е. неустойчивость положе-
ния у(х,0) = 0 вследствие возрастания экспоненты·
Найдем значение ξ = ξ% соответствующее обращению зна-
менателя функции Φ (ξ) в нуль:
^=-™8ξ = 0 =* ξ^ξ (™δξ*0). (18.17)
ξ
Наименьший корень уравнения (18.17) есть ξ* =4,493.
Поэтому на интервале ξ 6 (0, ξ*) функция Φ (ξ) непрерывна
и переход от устойчивости к неустойчивости прямолинейной
формы равновесия соответствует смене знака функцией Φ (ξ)
при ξ = π/2 за счет изменения знака числителя.
Следовательно, эйлерова критическая сила есть
э " 4 I2 '
т. е. получено то значение, которое было найдено при стати-
ческом рассмотрении (см. пример 18.4).
2. Неконсервативная система: малые колебания, под
действием следящей силы, линейная постановка (рис. 18.9).
Уравнение движения:
Р = Рг + Р2 =>
dv
EIy\x,t) = P(f-y)-Py{l-x)-M^(l-x). (18.18)
Как и для консервативной системы, решение ищем в виде
y(x,t) = Y(x)eiQt, f(t) = FeiQt, ф) = Ое1а*. (18.19)
442
18. Задача о продольном изгибе упругого стержня
*к
Р1 = Ρ cos φ « Ρ,
Ρ2 = Ρ sin φ % Ρ φ
У
Рис, 18.9
Здесь подлежат определению постоянные F, Θ и постоян-
ные интегрирования С\, С%*
После подстановки выражений (18.19) в уравнение (18.18)
имеем краевую задачу:
М№
Υ(0) = 0, Y'(0) = 0, Y(l) = F, Υ'(1) = θ.
(18.20)
Общее решение уравнения (18.20):
Ω'<
Y(x) = ClcosXx + C2smXx+F-Q(l-x) + M—^—F(l-x).
Χ ΕΙ
Методика получения частотного уравнения описана выше.
После раскрытия определителя линейной алгебраической сис-
темы относительно постоянных Сг, С2, F, Θ (в силу нулевых
условий (18.20)) запишем:
Ω<
ΕΙ
(Xlf
Ml3 sin XI
XI
cosXl
Ω =
ΕΙ
¥
Ml3 J sin ξ
ξ
COS ξ
■й?·^· <18·21)
При ξ = XI —> 0 (Ρ —> 0) получим, как и выше, значение собст-
венной частоты колебаний системы стержень — масса (18· 16).
18.3. Динамический подход
443
В выражении (18.21) смена знака подкоренной функции
Φ^(ξ) происходит за счет изменения знака знаменателя
(см. (18.17)):
ξε(0,ξ*) => Фх(У>0;
ξ>ξ* => Φ!(ξ)<0.
Следовательно, критическое значение следящей силы опреде-
ляется из равенства ξ = ξ*:
ξ = ξ*^λ/ = ξ*^Ρκρ=ξ*2^- ^PKp=20,187^f. (18.22)
Отметим: если отказаться от рассмотрения модели (рис. 18.9)
и изучать «обычный» стержень (распределенная по всей дли-
не масса) под действием следящей нагрузки, то значения кри-
тической силы, вычисленные различными авторами, мало
отличаются от (18.22).
* EI
В работе М. Бека получено значение Ркр =20,05—^-; в ра-
ЕТ
боте К.С. Дейнеко и М.Я. Леонова** — Ркр = 19,77——.
г
Итак, если система потенциальна, бифуркационный под-
ход Эйлера и динамическое рассмотрение дают равные зна-
чения критических нагрузок; если система непотенциальная
(конструкция упруго-пластическая и (или) нагрузка непотен-
циальна), то подход Эйлера может оказаться некорректным,
как в примере со следящей силой.
Отмеченные факты, как выяснено, связаны со свойствами
математических операторов поставленных задач: в консер-
вативных (потенциальных) задачах оператор — самосопря-
женный, для неконсервативных задач оператор не является
самосопряженным***.
См.: BeckM.
См.: Дейнеко К,С,У Леонов М.Я.
См.: Михлин С.Г.
19. ВАРИАЦИОННЫЕ ПРИНЦИПЫ
ЛАГРАНЖА, РЕЙССНЕРА И КАСТИЛЬЯНО
Прежде чем рассматривать вариационные принципы Лагран-
жа, Рейсснера и Кастильяно применительно к задачам для ли-
нейно упругих тел, сформулируем закон сохранения энергии
для тела, находящегося в равновесии:
где U — внутренняя энергия тела объемом V и ограниченного
поверхностью S:
U=\udV;
ν
и — объемная плотность внутренней энергии, т. е. количест-
во энергии, приходящееся на единицу объема;
SW=\bfiutdV+\pfiuidS
V S
— работа объемных (с компонентами Ъь) и поверхностных
(с компонентами pt) сил на возможных перемещениях Ьщ;
ut — компоненты вектора перемещения; Q — количество теп-
лоты, приобретенной телом. Здесь и далее мы опускаем зна-
ки суммирования, предполагая по умолчанию, что в форму-
лах при наличии одинаковых индексов выполняется сумми-
рование от 1 до 3.
Положим, что граничная поверхность S рассматриваемого
тела разделена на две части: Su, на которой заданы компонен-
ты вектора перемещения
щ=щ9 /=1,2,3, (19.1)
и Sa, на которой заданы поверхностные силы рг. При этом
S = Su U SG и Su U SG = 0. Очевидно, что дщ = 0 на поверхнос-
ти S„.
19. Вариационные принципы Лагранжа, Рейсснера и Кастильяно 445
В дальнейшем полагаем, что деформации малы и компонен-
ты тензора деформации е/у определяются соотношениями Коши
' 9uj дщ '
1
1 2
+ ■
dxj dxi
(19.2)
Так как компоненты векторов плотностей объемных bt и
поверхностных pt сил являются заданными функциями де-
картовых координат хк (k = 1, 2, 3), то работа SW внешних сил
на возможных перемещениях:
( \
δΤ^ = δ (biUtdV+ j* ptUidS
[ν s«
Вариацию количества теплоты, приобретенной изучаемым
телом, зададим в виде
5Q= \TbhdV,
ν
где Τ — абсолютная температура; h — энтропия единицы объ-
ема тела.
В дальнейшем будем рассматривать два случая деформиро-
вания: адиабатическое и изотермическое. В первом случае h =
= Н{хъ х2, Хз) — известная функция и δ/г = 0. Во втором случае
известна абсолютная температура Τ = Т(хъ х2, Хз) и δΤ* = 0.
Только для этих двух случаев
δ<5 = δ|
ThdV.
При изотермическом деформировании вместо и - и(Еф h)
нужно использовать объемную плотность свободной энергии
Α(εψ Г) и переход от первой функции ко второй осуществля-
ется с помощью преобразования Юнга — Фенхеля*:
Α(εψ T) = snp\u(EiJ9 h)-Th\
h
При Eij = 0 массовые плотности свободной и внутренней
энергий равны: А(0, Т) = В(Т) и и(0, К) = ЩН). Функции В(Т)
и H(h) при Τ * Т0 (Т0 = const — начальная температура тела)
отличны от нуля, и их учет необходим при изучении процес-
* См.: Бердичевский В.Л.
446 19. Вариационные принципы Лагранжа, Рейсснера и Кастильяно
сов деформирования, протекающих при переменных темпе-
ратурах и сопровождающихся рассеянием энергии. Так как
процессы рассеяния энергии мы не рассматриваем, то в даль-
нейшем полагаем, что В(Т) = 0 и H(h) = 0.
Таким образом, условие стационарности функционала
J[u] = U[u]-L[u]9 (19.3)
где
U[u]= \u(Eij)dV, L[u]= \Ь1щаУ+ \ p^dS,
V V £σ
определяет компоненты ut(i = 1, 2, 3) векторного поля и истин-
ных перемещений при адиабатическом деформировании на
множестве допустимых функций ui9 непрерывно дифферен-
цируемых в V и принимающих заданные значения на Su.
Функционал (19.3) называется функционалом энергии. Отме-
тим, что при изотермическом деформировании первое слага-
емое в правой части соотношения (19.3) должно быть замене-
но на J A(ey, T)dV.
ν
Рассмотрим условия, при которых задача поиска стационар-
ных точек функционала энергии сводится к задаче о его мини-
муме. Первый вопрос, который необходимо в этом случае вы-
яснить, — ограниченность снизу функционала энергии (19.3)*.
Пусть кинематические ограничения отсутствуют: Su = 0.
Тогда объемная плотность внутренней энергии и(еф равна
нулю на векторных полях перемещений, соответствующих
малым перемещениям упругого тела как абсолютно твердого,
т. е. при
Ui=Ci+eijk(ufXk9 (19.4)
где ct = const, ωΖ = const — компоненты вектора поворота;
eijk — символ Леви — Чивиты, представляющий собой тензор
ранга 3 (е^к = 1, если индексы z, у, k различны и следуют в
порядке (1, 2, 3), (2, 3, 1) или (3, 1, 2), eV]k - -1, если этот
порядок нарушен, и вщ = 0, если среди индексов есть одина-
ковые).
* См.: Зарубин B.C., Кувыркин Г.Н.
19. Вариационные принципы Лагранжа, Рейсснера и Кастильяно 447
При таких векторных полях перемещений имеем ε^ = 0.
Необходимым условием ограниченности снизу функционала
J[u] является равенство нулю его значений на векторных по-
лях перемещений вида (19.4). Поясним это условие.
Функционал Щи] неотрицателен и, следовательно, огра-
ничен снизу нулем. Функционал L[u] линеен, и поэтому мно-
жество его значений не ограничено. Линейная комбинация
функционалов Щи] - L[u] может оказаться ограниченной сни-
зу только за счет того, что с увеличением Ци] растет и Щи],
причем последний, будучи квадратичным функционалом, рас-
тет быстрее. Однако ясно, что рост функционала Щи] не смо-
жет компенсировать рост L[u] на тех функциях щ, на которых
Щи] = 0, т. е. на векторных полях перемещений вида (19.4).
Указанное условие ограниченности снизу функционала
J[u] дает соотношение
JMCi+e^iufX^dV + jpiici+etj^x^dS = 0,
V S
откуда при сьф 0 и со^·,φ 0 в общем случае следуют шесть ра-
венств:
(bidV + jpidS^,
V rr S г ^ (19·5)
[ν s J
Равенства (19.5) означают, что суммарные внешние сила
и момент, действующие на тело, должны быть равны нулю.
Если равенства (19.5) выполняются, то функционал J[u] инва-
риантен относительно движений упругого тела как абсолютно
твердого. В этом случае задача поиска стационарных точек
функционала J[u] не имеет единственного решения. Чтобы
решение было единственным, на поля перемещений надо на-
ложить ограничения. Например, можно принять, что
utdV = 0 и etjkuixj dV = 0,
ν ν
т.е. приравнять нулю среднее перемещение и средний поворот
тела.
Если упругие свойства рассматриваемого тела не вырожда-
ются (и(еф > 0 при Ец φ 0), то, как оказывается, условия (19.5)
448 19. Вариационные принципы Лагранжа, Рейсснера и Кастильяно
при Su = 0 являются достаточными для ограниченности снизу
функционала J[u]. Функции bt и pt при этом должны быть
суммируемыми с квадратом.
Если на части Su граничной поверхности тела заданы ком-
поненты вектора перемещения, то можно доказать, что функ-
ционал энергии также ограничен снизу для любых суммиру-
емых с квадратом функций bt и р{, в том числе и для имеющих
ненулевые суммарные силу и момент*.
Ограниченность снизу функционала энергии позволяет
поставить задачу об определении для него минимизирующе-
го элемента. Эта задача может быть сформулирована в форме
вариационного принципа Лагранжа: среди всех возможных
перемещений действительные перемещения сообщают функ-
ционалу энергии минимум.
Уравнения Эйлера для функционала J[u] можно получить,
приравняв нулю его первую вариацию:
5J[u, Ьи] = btijdV- bfiUidV- pfiiitdS = 0.
Из теории упругости известно, что компоненты σ^ симмет-
ричного тензора напряжений σ связаны с компонентами ε/;·
тензора деформации соотношениями
σ;* =
ди
Поэтому, согласно теореме Остроградского — Гаусса,
\ -г— δε udV = \ σ й - δ
у Ч
^<VU/_
dXj dxi
dV =
-w
VL
-—(anduA + -—(оцЬиА—г-^-51г4 —:r-y-6u/
Вх9к 3 > dxtK J n dxj dxt J
dV =
да а
J μ ] l J Эх, l
ЭХ;
V 3
См.: Бердичевскии В.Л.
г См.: Работное Ю.Н.
19. Вариационные принципы Лагранжа, Рейсснера и Кастильяно 449
Отсюда
v\ Xj J s
Так как вариации Ьиt произвольны в объеме 7ина поверх-
ности Sa, то в силу леммы Лагранжа
^Ц=0в7и ajinj=piH8LSG. (19.6)
Уравнения (19.6) представляют собой уравнения равновесия
в объеме V и граничные условия на поверхности 5σ. Они были
получены с учетом того, что Ъщ = 0 на поверхности Su.
Пример 19.1. Пусть задана объемная плотность свободной
энергии
где Сф1 — компоненты симметричного тензора четвертого ран-
га независимых от координат коэффициентов упругости, С^ы =
= Cjiki = cijik = CkUj; г(р = εψ — компоненты тензора темпера-
турной деформации (известная величина).
Используя вариационный принцип Лагранжа, получим
уравнения Эйлера для соответствующего функционала и запи-
шем эти уравнения через компоненты вектора перемещения.
Функционал энергии для заданной объемной плотности
свободной энергии будет равен:
I[u] = |J[c/iW(e„ -cJPXef/ -ejf>)-
2
ν
-Ст(-г^)(-г{р)]аУ- jbiUidV- J piUldS,
ν sa
и условия (19.5) ограниченности функционала 1[и] снизу вы-
полняются. Тогда
Щи, Ьи] = jCjtkiieja -E(feP)6ey dV -^Ь^щаУ - j р£ща8 = О,
So
так как 5ejf * = 0.
Ч
450 19. Вариационные принципы Лагранжа, Рейсснера и Кастильяно
Преобразуем первое слагаемое в правой части этого равен-
ства с помощью теоремы Остроградского — Гаусса:
\с,шагы -ε<?)δεν dV = \\ст(гы -W|b + |iL W =
ν ν V }' l J
FL
dxj
^(ст(Ч1-№))Ьщ - A(C|,„(ew -ε5Ρ))&*Λ
dV =
= \cnka4i ~ ^nfiuidS - j
c^^hu^v.
Окончательно условие равенства нулю первой вариации
функционала Да] примет вид
Ь1(щ)= 1(ст(гк1-е$)п, -р^бщаЯ-
4
с,
^и-ЕЙ.Л
ум
дх;
+ bt
ЬщаУ = 0.
Уравнения Эйлера в данном случае таковы:
C,wa(E"_~eg))+ftf=0 bV,
'}ikl
dxj
cjiki&kl-£ibl))nj-pi=0 HaSa.
Воспользовавшись соотношениями Коши (19.2), получим
Cjikl
д2Щ
dxjdxi
+ ^=С;Ш-^- bV,
Cjiki^jLn}=CjikiEM)ni+Pi HaS<y- #
dxi
19. Вариационные принципы Лагранжа, Рейсснера и Кастильяно 451
Преобразование Юнга — Фенхеля функции и(г^) по ε^
u*(aii) = &up(aijeij-u(Eij)) (19.7)
называют объемной плотностью дополнительной работы. Здесь
и далее полагаем, что компоненты щ вектора перемещения
непрерывно дифференцируемы в V, а на поверхности Su (при
Su φ 0) удовлетворяют граничным условиям· Кроме того, счи-
таем, что компоненты σ/; тензора напряжений σ непрерывно
дифференцируемы в У. Плотность внутренней энергии можно
выразить через дополнительную работу:
u(eij) = sup(oijeij-u*(oij)). (19.8)
Используя соотношение (19,8), можем записать
inf J[u] = inf sup/[cj, u]9 (19·9)
и и Q
где
7[σ, и] = j(σνευ,-u*(Gl}))dV- \btut dV-\ p^dS.
ν ν s0
Решение минимаксной задачи (19.9) при указанных тре-
бованиях к и и σ является стационарной точкой функциона-
ла /[σ, и] на множестве всех σ и и, удовлетворяющих гранич-
ным условиям (19.1). Вычисляя первую вариацию этого функ-
ционала по компонентам тензора напряжений, находим
ди*
Ец = . Если же варьируем функции щ9 то получаем урав-
нение равновесия в объеме У и граничные условия на Sa
(см. (19.6)).
Сведение задачи равновесия упругого тела к задаче пои-
ска стационарной точки функционала 7[σ, и] называют сме-
шанным вариационным принципом или вариационным
принципом Рейсснера. Стационарная точка функционала
/[σ, и] является седловой, так как она обеспечивает макси-
мум 1[а9 и] по функциям (5ц и минимум по функциям щ.
452 19. Вариационные принципы Лагранжа, Рейсснера и Кастильяно
Пример 19.2. Используя вариационный принцип Рейсс-
нера, получим уравнения (19.6) и соотношения, связывающие
компоненты тензоров напряжений и деформаций в изотерми-
ческом процессе деформирования. Объемная плотность допол-
нительной работы для изотропного однородного тела имеет
вид
Α*(σψΤ) = —
4μ
г
GijGlj —
3λ + 2μ
}kk
+ £(7V*,
где λ, μ — коэффициенты упругости; ahk — сумма диагональ-
ных элементов матрицы σ^.
В данном примере
I[a, u] = f
Gifii} ~
4μ|
σα°α —
3λ + 2μ
}kk
-E^a^dV-jbiUidV-jpMdS.
Вычислим вариацию функционала Ι[σ, и] по σ^ и приравняем
ее нулю:
Що,и\ = 1
1 (
ε«—— 2σи -
2λ
стьь5,;
li 4μ \ ij 3λ + 2μ ** "
-^Τ%
bCijdV = О,
где Ьц — символ Кронекера.
Отсюда следует, что при произвольных функциях δσ^
ε*7 =
2μ
°Ц-
3λ + 2μ
σ/Α
+ ε<Γ>δ,
Если же вычислим вариацию функционала /[6, и] по ии
то из условия δ/[σ, и, 5и] = 0 получим (19.6). #
Вариационный принцип, двойственный принципу Лагран-
жа, можно ввести следующим образом. Сначала проверяем
допустимость перестановки порядка вычисления максимума
и минимума в соотношении (19.9). Эта перестановка дает
sup
(19.10)
σ и
См.: Работное Ю.Н.
19. Вариационные принципы Лагранжа, Рейсснера и Кастильяно 453
где /0 — минимум функционала J[u\;
Φ[σ, и] = -J bt +—-?- hiidV- J (pi -apneas;
v\ Xj J sG
/*[σ, u]= \ OjiUjuidS- \u*{Gij)dV.
su ν
Очевидно, что для тензорных полей σ, удовлетворяющих
условиям равновесия и граничным условиям (19.6), Φ[σ, и] = О,
а для тензорных полей σ, не удовлетворяющих граничным
условиям, inf Φ[σ, и] = -«> в силу линейности этого функцио-
и
нала по иг.
Предположим, что функции и*9 минимизирующие функ-
ционал J[u], непрерывно дифференцируемы. Введем обозна-
чения:
/
86 = 2
V
—L +—L I
dXj dxi
σ? =
_ Эц(е^ )
Эе;,
т=щ
еу=еу
Из уравнений Эйлера исходной вариационной задачи для
функционала J[u] при заданных условиях на поверхности Su
следует, что компоненты σ-j тензора σ* удовлетворяют соот-
ношениям (19.6) и, следовательно, являются допустимыми
функциями:
δΙφΓ[σ]>Γ[σ*]· (19.11)
С другой стороны, так как S = Su U Sa,
д_
dxi
>[&*]= j a^njutdS-$η4σ*;)αν = $(^(σ№)-η4σ*})
su
dV-
J μ } l J \дх, fldx} "
-\
dV - \ a^njuldS =
dV-j piU-dS^
Sc
= f u{z\j)dV-\biutdV- f piutdS = I0.
454 19. Вариационные принципы Лагранжа, Рейсснера и Кастильяно
Из последнего равенства и неравенств (19.10), (19.11) сле-
дует, что
inf J[u] = sup/*[cj],
и д
где минимум и максимум берутся по всем непрерывно диффе-
ренцируемым в V функциям Gij, uh причем щ -щ на поверх-
ности Su и Оц удовлетворяют соотношениям (19,6).
Вариационная задача поиска максимума функционала
/*[σ] по всем тензорным полям σ, подчиняющимся условиям
(19.6), представляет собой математическую формулировку
принципа стационарности дополнительной работы, или вариа-
ционного принципа Кастильяно: дополнительная работа /*(σ)
достигает максимума, если тензор напряжений σ с компонен-
тами σ^ удовлетворяет уравнениям (19.6).
Пример 19.3. Получим уравнения Эйлера функционала,
соответствующего вариационному принципу Кастильяно,
записав их через компоненты тензора деформации.
При выводе требуемых уравнений будем полагать, что по-
верхность S0 совпадает с поверхностью S, ограничивающей
рассматриваемое тело объемом V. В этом случае
*[а\ = -\и*(сц)<1Г.
V
полагаем, что объемные Ь{ и поверхностные pt силы
являются заданными функциями координат. Тогда из урав-
нений (19.6) получаем
-^ = 0вУ и Ьспп;=0 hslS. (19.12)
dxj
Вместо шести компонент тензора малой деформации вве-
дем в рассмотрение шесть новых функций ft = fi(xi, jc2, Xs) и
Fij = Ρμ = Fij(xi, x2, Хз), приняв Fy = 0 при i = /, определяемых
из условий:
3 2
-Fi}. (19.13)
19. Вариационные принципы Лагранжа, Рейсснера и Кастильяно 455
Далее, используя соотношение £ц·, =ди*/дац9 полученное
ранее, запишем условие стационарности функционала /*[σ]
в вариационном принципе Кастильяно в виде
δ/*[σ] = -|ε,;δσ,^ = 0,
которое после подстановки в него соотношений (19.13) примет
вид
-li[E;+i:hdv+!F^dV-
= -(-^-bGijdV + f F^a^dV = 0. (19.14)
V y V
Преобразуя отдельно —1-δα^αν9 получим, используя ра-
ν ]
венства (19.12) и теорему Остроградского — Гаусса, что
J Эх,· " Jdx, l У дх,
= jfi3ajinjdS-jfi^^dV = 0.
s ν j
В силу этого равенства соотношение (19 Л4) эквивалентно
следующему:
Γ^·δσ^7 = 0. (19.15)
Введем в рассмотрение три произвольные функции коор-
динат аь = щ(х\, Χ2> ^з)· Умножим вторую группу уравнений
из (19.12) на о^ и проинтегрируем полученный результат по
поверхности:
ai8GjirijdS = 0.
456 19. Вариационные принципы Лагранжа, Рейсснера и Кастильяно
Применяя к последнему соотношению теорему Остро-
градского — Гаусса, получаем:
|-?-(a,5a/7)dF = 0,
д_
dXf
ν J
и после дифференцирования (с учетом симметрии тензора на-
пряжений σ) имеем:
J Эх,- 2 J dXj dXf
bGijdV^O.
С учетом первой группы равенств из (19.12) последнее со-
отношение можно переписать в виде
1гГЭс^ + Эо/л
2 J дх} dXi
Ьац<1У = 0.
(19.16)
Так как функции о^ могут быть произвольными, потребу-
ем, чтобы dat/dxj = О при i = j. Тогда последнее равенство име-
ет смысл только при i ^ у. Сравнивая соотношения (19.15) и
(19.16), получим:
Рц=В
L +—L I
dXj dxi
ΙΦ],
где В φ О — некоторая постоянная. Из этих равенств следует,
что
Ъ2¥<
23
дх2дх3
= В
Э3а2 Э3а3
Э2Д
13
дхгдх3
= В
дх2дх3 дх2дх%
Э3«! Э3а3 "1
Э2Д
12
дх\дх2
= В
дх2дх3 дхгдх1
Э3аг Э3а2
дх2дх2 Bxidx2
= 0;
= 0;
= 0,
(19.17)
19. Вариационные принципы Лагранжа, Рейсснера и Кастильяно 457
а также
3 ( 3F23 Э^з dF12
dxi I dxi дх2 дхг
V
= 2B
д3ах
θ fdR
дх?
23 &F13 Э^12
3jcx Э#2 3jc3
= 2B
3jci3^29jc3
Э3а2
= 0;
Э f 32^3 , 9ii3 9-F12
ЭХс
■ +
Э^х Эд:2 Эх3
= 2Б
Э^Эд^Э^з
Э3а3
dxidx2dx3
= 0; (19.18)
= 0.
Определяя Fi}; из (19.13), учитывая равенства
■+■
= 2ε,-
dxj dxi
при i = j и подставляя их в (19.18), получаем
Э (θε23 9ε13 <teiH Э2бц
dxi I 8jq Эд:2 Эх3 I Эд:2Эд:3
= 0;
Эд:5
Эдся
Эе23 Эе13 Эе12
Э#1 Эх2 д#3
дв23 Эе13 Эе12
Э^! дх2 dxs
Э2Е22
Э2в33
= 0;
= 0.
(19.19)
Система уравнений (19.19) содержит три из шести условий
совместности деформаций (условий Сен-Венана).
Другие три условия совместности деформаций получим,
подставив Ftjиз (19.13) в (19.17):
d2F.
23
Э2е23 ,1 Э2 ( Э/2 | дЬ ^
дх2дхз дх2дх3 2 дх2дх31 дх3 дх2
V
Э2823 .+ 1_Э^_ %_+1 Э2 Э/8
)
Эя2Эх3 2 Эх2 дле2 2 Эя2 Элг3
Э2823 1 Э2822 1 θ2ε33
■ +
+ ■
Эл:2Эа:3 2 Эх2 2 Эдг|
= 0
и так далее.
458 19. Вариационные принципы Лагранжа, Рейсснера и Кастильяно
Окончательно эти условия примут вид
Э2£22 , д2833 о Э2£23
Эх2
dxl
= 2
дЧ
dxl
зз+^11_ = 2
Э*|
дх2дх$
Э2£1з ,
dxidxs '
(19.20)
Э ^11 Э Е22 — о ^ £l2
Эх|
Эх2 Эд^Эд^
Таким образом, мы установили, что условие стационарно-
сти функционала дополнительной работы эквивалентно усло-
виям совместности деформаций (19.19) и (19.20). При этом
необходимыми условиями существования стационарной точки
функционала /*[σ/;] являются уравнения (19.6).
Если на части Su граничной поверхности S заданы компо-
ненты вектора перемещения (ut -й{ на Su), то, представив ft
в виде суммы ft (хъ х2, х3) = 8г{хь х2> *з) + fi(xi> %2> #з)> гДе
функции gt известны, причем gt = щ на SUJ ft - 0 на Sw, и про-
делав аналогичные преобразования, также получим условия
совместности деформаций, следующие из условия стационар-
ности функционала
Πσ]= J GjtTijuidS- [u^o^dV.
Su
20. ВАРИАЦИОННЫЕ ПРИНЦИПЫ
ТЕРМОУПРУГОСТИ
Термоупругостью называют раздел механики деформируемого
твердого тела, в котором изучают процессы упругого деформи-
рования и распространения теплоты с учетом взаимодействия
этих процессов.
В дальнейшем будем полагать, что компоненты ei;- (i, j -
= 1,2,3) тензора деформации ε связаны с компонентами щ
вектора перемещения и соотношениями Коши (19.2), компо-
ненты а^ симметричного тензора напряжений σ связаны с в/у
и абсолютной температурой Τ соотношениями Дюамеля —
Неймана
ац=Стгк1-&цЪ9 (20.1)
где Cijkl = Cjiki = Cklij = Ст — компоненты тензора коэффици-
ентов упругости материала тела; β^ =CijMa^i off — компо-
ненты тензора температурных коэффициентов линейного рас-
ширения; Φ = Τ - Т0; Т0 = const > 0 — температура естествен-
ного состояния тела, т. е. та температура, при которой тело
может находиться сколь угодно долго без взаимодействия с
окружающей средой и для которой |θ|/Γο «1.
Как и в 19, используем неявное суммирование по повторя-
ющимся индексам.
Вектор плотности q теплового потока с компонентами qt
связан с градиентом температуры законом Фурье [XII]
«·~^5· (2°·2)
где λ^Ρ =λ^Ρ — компоненты тензора теплопроводности.
460
20. Вариационные принципы термоупругости
Закон сохранения энергии имеет вид
рГо^ = -|^ + 9„. (20.3)
at aXi
*l
Здесь ρ — плотность материала тела; η — массовая плотность
энтропии; t — время; хи i = 1, 2, 3, — декартовы прямоуголь-
ные координаты; qv — объемная плотность мощности источ-
ников энерговыделения. При этом
рГ0л = рсе*+ЗДуЕу, (20.4)
где сЕ — удельная массовая теплоемкость материала тела при
постоянной деформации.
Запишем уравнения движения среды
^ + Ь,=А (20.5)
Здесь bt — компоненты вектора плотности объемных сил.
В постановку задачи термоупругости вводят краевые
условия:
начальное условие при t = 0
I о дщ
Щ\* о =Щ, —-
Ht=o " dt
f=0
граничные условия
щ\8=щ, (OijTiji =pt, ti\sT=&, ЪЩ\3=Ъ
где Su[j SG = S — граничная поверхность рассматриваемого
тела объемом V, причем Su Π SG = 0; п} — координаты единич-
ного вектора нормали к поверхности S; ST U Sq - S, ST Π Sq =
= 0; uf9 vfj Ь0, щ, piy Ь, q — заданные функции.
Полагаем, что все введенные функции и участки поверх-
ности S обладают необходимой гладкостью (т. е. имеют не-
обходимое количество непрерывных частных производных).
При формулировании вариационных принципов термо-
упругости будем использовать свертку двух функций по вре-
мени, которую определяют следующим образом [XI]:
20. Вариационные принципы термоупругости
461
г
f(t)*g(t) = jf(x)g(t-x)dx.
Для включения начальных условий в вариационную фор-
мулировку соответствующей краевой задачи используем пре-
образование Лапласа [XI]
ГЧр) = Ь[Ю)](р) = ^те-Р^
где / (t) — функция-оригинал; f(p) = L[f(t)](p) — изображение
по Лапласу функции f(t).
Перейдем к изображениям в уравнениях движения (20.5):
да%
μ j**
dXi
+ b;-p(p2u*-pu?-v?) = 0,
(20.6)
и в уравнении (20.3):
dqt
pT0pr)*-pT0r\(0) = -^- + qZ
dXi
Так как
МО)
if Эй? Эи^
= —I —1- + —-
dxj dxi
(20.7)
то, согласно (20.4), учитывая симметрию β^ и очевидное тож-
дество
β</
Эй? *Uj
dXj dx:
= 0,
получим
ρΓ0η(0) = рс£^о + ВД, еу (0) = pcefl0 +
+ Γ0β
ч
duf Ьи)
1 ■+ '
дХ; дХ;
L V ; l J
+—
2
duf Щ
о Л
dXj dxt
/J
= рсед0+ГоРу
Э^
Эх,
Поэтому закон сохранения энергии (20.3) в изображениях
можно записать в виде
dxt dXj
(20.8)
462
20. Вариационные принципы термоупругости
Решаем уравнения (20.6) и (20.8) относительно мг* и η*:
, 1 Эа!4 1 1 ft 1 п
ρ2 дх} ρ2 ρ ρ2
ρ ρ dXi ρ ρ dXj
Так как
\ = L[t], - = L[1],
Ρ2 Ρ
то, применяя теорему о свертке [XI], находим
двц , „, . да,
aXj aXi
где q(t) = t; g(t) = 1;
ди°
fi=g*bt+ p(tv? + it?); и; = g * qv + pced0 + Γ0β*; —*-.
Чтобы получить обобщение вариационного принципа
Лагранжа, введем понятие кинематически и термически до-
пустимого состояния, т. е. такого состояния, которое удовлет-
воряет соотношениям Коши (19.2), закону Фурье (20.2), урав-
нениям (20.1), (20.3), (20.4), а также граничным условиям на
участках Su и ST поверхности S. Тогда обобщение принципа
Лагранжа можно сформулировать следующим образом. Рас-
смотрим функционал
J[u, Щ =
= -j(g*Cjikl£kl*Eij-2g*$ifi*Eij+pui*ui-2fi*ui)dV-
2
ν
1 С( с* о а 1 · , 3» W 1
— Р£*—$*$ g*g*hu-—* +—g*w*$
2Ц То Т0* * 1!дх} дх> Т0ё
- \(g*Pi*Ui)dS-— \(g*g*q*-&)dS,
dV-
J
5σ Sq
который для любого f > 0 определен на множестве кинемати-
чески и термически допустимых состояний.
20. Вариационные принципы термоупругости
463
Вычислим первую вариацию функционала J[u, 9] и при-
равняем ее нулю:
Щи, Ь, δα, m = jg*((CmeM -β^)*δε*;· -βΛ *S$)dV-
ν
- [pig·*—Ъ*ШаУ + -!р(щ*Ьщ)аУ +
i { то ) 2l
+ ^r\(g*g*Xij^-*b^-)dV-\(fi*bui)dV-
ToJv{ d*i 9oc,J J
Ug*w*bff)dV- \ (g*pi*Sui)dS + — Г (g*g*q*bd)dS =
ν
ν ν X> )
--f
к L
—§* §*
. Э
9xj
λ»
ЭО
Iy Эх,
+ g*w
*№dV +
f £*£ =
4 dXi
\
Щ-q
*δθ</5 = 0.
J
(20.9)
Из уравнения (20.9) в силу произвольности 5«f и ЬЬ на
участках Sc, £?ς поверхности S и внутри объема V, а также
равенства нулю вариаций Ъщ на Su и ЪЬ на &г следуют урав-
нения движения и теплопроводности с соответствующими
граничными условиями.
Вариационный принцип для компонент σ^ тензора напря-
жений σ и компонент qt вектора q плотности теплового пото-
ка, аналогичный вариационному принципу Кастильяно, мож-
но сформулировать следующим образом. Пусть тензор σ и
464
20. Вариационные принципы термоупругости
вектор q образуют динамически и энергетически допустимое
поле тензора напряжений и вектора плотности теплового по-
тока, т. е. поле, которое удовлетворяет граничным условиям
на Sc и Sg. На таком поле определим функционал
Д6, д] = -|(5^ыОц *ckl)dV +
ν *Λ ] ) ν
_J_fJ_
2Τη J ο<?„ l
]\ If.
\\dV-—\kij(g*qi*q})dV +
dv+-\9g*d-^*^dv-
2 J_ dXj dxk
ν
dqt + dqk
2T0 J pca dxt dxk
dV +
"f —
Го J PCCT
/
g*w
dxk
dV-
- jui^ajinjdS-—-jg^:&^qinidS,
su
ST
где а'ц =Т0а(р/(рса); са =сг +Τ0^α(Ρ/ρ — удельная массовая
теплоемкость при постоянных напряжениях; S'ijki=Sijki~
- αψα'Η1\ Sijkl = Smj = Sm = Si;-tt — компоненты тензора коэф-
фициентов податливости материала тела, связанные с компо-
нентами Сф1 тензора коэффициентов упругости соотношения-
ми CijklSklmn =-(Simbjn +5in6M); kij=kn — компоненты тензора
термического сопротивления, к^т = bim.
Вариация функционала /[σ, q] равна нулю, если компо-
ненты тензора σ и координаты вектора q являются решения-
ми краевой задачи термоупругости.
Вычислим первую вариацию функционала /[σ, q] и при-
равняем ее нулю:
/[σ, q, δσ, 5qr] = J
ν
^0
(
w-g*
dxk
*8σηαν +
1 Г Э 1 r
+ — T~ (a'ij°ij)*S*bqkdV-— а^й*Оц *SqknkdS-
v
20. Вариационные принципы термоупругости
465
j-jk^qj^dV + jUg-
* δσμπ} dS -
-f—
ν '
Э (l даыЛ
— g* £i
Ρ dxk
*foi}dV-—\ —
1 T0 J pca
(. . dqj
g* g* —
dXj
*5<^7Z;dS +
f—
Э ( 1
+ \-r—\ 8*8*
oXi pca
dqj_
dxi
■ 5,,^-jA
dXj
*SOijdV +
f 1 1 f 1
-β * δσ «re,· dS + — ir * u» * 5gfcnfe dS -
Ι Ρ To I pca
■J
Э**
Ρ^σ
(£*и>)
■ 5gfc dF - j й4 * δσ;7Λ;· dS -
~\g*b*<htdS = l
St
д (\ daki 1^
Su
1 / f
S'ijklGkl+ — aij
■ dqk
w-g*
dxk
Эх
Ρ dxk ρ
/.
*δσ^ω^ +
Эх*1
4
«ytJtf -
Ρ^σ
Эх,-
\λ
-kikQi
J J
*SqkdV +
"Wj
£!
£y
(
Щрц +
pcCT
*5a;ire; d<S-
Я*——-и;
дх
-θ
У
*$qknkdS = 0.
Так как вариации δσ^ и 5^ произвольны, то из полученно-
го равенства следует, что если функции σ^ и qt удовлетворяют
граничным условиям на участках SG и Sq поверхности S, то эти
функции являются решением краевой задачи термоупругости.
Необходимо отметить, что рассмотренные функционалы
J[u,b] и /[σ, q] не обладают экстремальными свойствами.
466
20. Вариационные принципы термоупругости
В этом состоит их существенное отличие от функционалов,
которые входят в формулировки принципов Лагранжа и
Кастильяно.
Если не учитывать процессы деформирования, т. е. ε^ = О,
aLj■= О и Sa = Su = 0, то сформулированные вариационные прин-
ципы приводят к краевой задаче нестационарной теплопровод-
ности с соответствующими краевыми условиями.
Для получения соотношений, определяющих статическое
распределение деформаций и напряжений, а также стационар-
ную теплопроводность в рассматриваемом упругом теле, мож-
но воспользоваться предельным переходом ρ —> 0. В этом слу-
чае функции, содержащие в качестве сомножителя параметру
преобразования Лапласа, исчезают, а каждый из функциона-
лов J[u, $] и /[σ, q] преобразуется в сумму двух функциона-
лов: J[u, Ь] = J\\u\ + J^t^L Д&» £] = Ji[S] + /2[<ri· При этом
функционалы J\\u\ и Ι\[σ\ будут эквивалентны тем функцио-
налам, которые входят в формулировки принципов Лагранжа
и Кастильяно. Условия стационарности функционалов J^t^lи
7"2[#] эквивалентны краевой задаче стационарной теплопровод-
ности, сформулированной соответственно для Ь и q.
21. ДВУСТОРОННИЕ ОЦЕНКИ
В ТЕПЛОПРОВОДНОСТИ
Построенные в 20 функционалы в частном случае соответст-
вуют двойственной вариационной формулировке линейной
краевой задачи стационарной теплопроводности. Помимо ре-
шения такой задачи, т. е. нахождения температурного поля
в некоторой (в общем случае) пространственной области V7
ограниченной поверхностью S, двойственная формулировка
позволяет получить двусторонние оценки ряда важных ин-
тегральных параметров, характеризующих процесс передачи
теплоты*.
Пусть распределение температуры Т(М), зависящее от по-
ложения точки MeV на замыкании V = V\JS области V,
удовлетворяет дифференциальному уравнению
ν-(λ(Τ)(Μ)νΓ(Μ)) + ^(Μ) = 0, MeV, (21.1)
с граничными условиями
Г(Р) = Д(Р), PeSl9 (2L2)
XiT)(P)VT(P)n(P) + a(P)T(P) =
= /2(Р), PeS2. (21.3)
Здесь λ(Γ) — коэффициент теплопро-
водности; qv — объемная мощность
энерговыделения; ^и/з — задан-
ные функции точки Ρ на участках
S1 и S2 = S\S1 поверхности S соот-
* См.: Власова ЕЛ., Зарубин B.C.
468
21. Двусторонние оценки в теплопроводности
ветственно; η — единичный вектор внешней нормали к по-
верхности S; а — коэффициент теплообмена (рис. 21.1).
Краевой задаче (21.1)-(21.3) соответствуют двойственные
функционалы*
J[T]=U^-(VT)2-qvT)dV+j
2
I[T,ql = -f^dV-ffiq-ndS-f^T2dS, (21.5)
V Si S2
где q = q(M) — вектор плотности теплового потока, зависящий
от положения точки MeV.
Функционал (21.4) определен на температурных полях
Т(М), непрерывных на V, удовлетворяющих граничному
условию (21.2) и имеющих кусочно-непрерывные производные
в области V, а функционал (21.5) — на непрерывно дифферен-
цируемых в области V функциях q(M)> удовлетворяющих
условиям
\divq(M) = qv(M), MeV;
[q(P)n(P) = a(P)T(P)-f2(P), PeS2.
Справедливы неравенства
I[T,q\<J[T*]<J[T]9 (21.7)
где Т*(М), Me V, — распределение температуры, на котором
функционал J[T] достигает своего наименьшего значения.
Для этого значения с учетом (20.1)-(20.3) имеем
2J[T*] = -\qvT*dV+ {frX^WndS-iferdS. (21.8)
V Si S2
Выделим несколько характерных случаев оценки интег-
ральных параметров.
1. В области V действуют источники энерговыделения с по-
стоянной объемной мощностью qy, а поверхность S состоит из
участка Sj с заданным постоянным значением температуры,
которое можно принять за нуль отсчета, т. е. fi(P) = О, Ρ е Sl9
* См.: Зарубин B.C. (1983).
-T2-f2T\dS, (21.4)
21. Двусторонние оценки в теплопроводности
469
и участка S2, на котором /2(Р) = О»
Ρ е S2 (рис. 21.2). В частном случае
участок S2 может быть идеально
теплоизолированным и теплообмен
на нем будет отсутствовать (α(Ρ) = О,
Ρ е S2). Ясно, что поверхность S мо-
жет состоять лишь из одного участ-
ка: либо Sx, либо S2·
При указанных условиях второй
и третий интегралы в правой ча-
сти (21.8) исчезают, и мы получаем
формулу для температуры, осредненной по объему ^области:
VJ
T*dV = -2
<7[Г*]
qyV
(21.9)
Используя (21.7) и (21.9), запишем двустороннюю оценку для
этой температуры в виде
-2^Ι^Ι = Γ_<Γ<Γ+=-2 [ ,Я\ (21.10)
qvV qvV
2. Пусть в области V отсутствуют внутренние источники
теплоты (qv(M) = 0, Μ е V), участок S2 поверхности S идеаль-
но теплоизолирован (/2(Р) = 0 и а(Р) = 0 при Ρ е S2), а на
остальной части поверхности S имеются два не граничащих
между собой изотермических участка S[ и S[ с заданными
значениями температур Т[ и Т{ соответственно (рис. 21.3).
В этом случае вместо (21.8) получаем
2J[7T*] = 7VQi+7VQi, (21.11)
s a(P) = 0
где Q[ и Q[ — суммарные теп-
ловые потоки, поступающие в
область V через участки S{ и
Si ее поверхности соответст-
венно, причем
Qi = Jx<r>VriidS,
Qi=jX^VT*ndS.
^
470
21. Двусторонние оценки в теплопроводности
Согласно условию сохранения тепловой энергии при стацио-
нарном процессе теплопроводности, Q[ +Q[ = 0. Поэтому, учи-
тывая (21.11), получаем
Т{-Т{
Отсюда вытекает формула для термического сопротивления
7Y-7V (Т(-Т{)2
R =
(21.12)
Q[ 2J[T*]
области V между изотермическими участками S{ и Si поверх-
ности S. Из (21.7) и (21.12) следует двусторонняя оценка для
термического сопротивления:
(т;-т{)2 <я<(П-тГ)2
2J[T]
2/[Г, q]
(21.13)
3. В области V отсутствуют внутренние источники тепло-
ты (qy(M) = 0, Μ е V), участок Si поверхности S является
изотермическим (f\(P) = ΤΙ =
= const, Ρ g Si), а на участках
S2 происходит теплообмен с
внешней средой, температуру
которой принимаем за нуль
отсчета, т. е. f2(P) Ξ 0, Ρ е S2
(рис. 21.4).
При таких условиях от
участка Si через участок S2
к внешней среде будет прохо-
дить, согласно (21.8), тепло-
вой поток
J[T*]
Sl λ
(21.14)
а суммарное термическое сопротивление теплопередаче меж-
ду участком Si с температурой 7^ и внешней средой с нулевой
температурой будет равно:
Ry=^ =
Т2
Q 2J[T*]
(21.15)
21. Двусторонние оценки в теплопроводности
471
Используя (21.7), (21.14) и (21.15), запишем двусторонние
оценки для теплового потока
2£[г1чг]< jtt]
Г, 7\
и для суммарного термического сопротивления
Т2
2J[T]
<Rr =
Т2
2ЦТ, q]
4. Пусть по-прежнему в области V отсутствуют внутренние
источники теплоты (qv(M) = О, Μ е V), а также отсутствует
участок Si поверхности S, а участок S2, на котором, согласно
(21.3), происходит теплооб-
α(Ρ)
α(Ρ)
мен с коэффициентом тепло-
обмена а(Р), состоит из двух
частей: на части Si теплооб- q
мен происходит с внешней
средой, температуру которой
примем за нуль отсчета, т.е.
f2(P) = О, Ρ е S^; на осталь-
ной части S'2 = S2\ S2 имеем
f2(P) = Q2 = const (рис. 21.5). Рис. 21.5
При указанных условиях
из (21.8) можно найти среднюю температуру участка S'2:
*=^1
(21.16)
Из (21.7) и (21.16) следует двусторонняя оценка для этой тем-
пературы:
_2^<^-2Ы.
Если на участке S2 происходит теплообмен со средой, имею-
щей температуру Тс', т. е. q2 = а'Тс', где а' — постоянный на
этом участке коэффициент теплообмена, то, используя (21.16),
можно найти передаваемый через S2 суммарный тепловой поток
Q2 =α'(%-%)&2 =<х'ВД+2^р (21.17)
472
21. Двусторонние оценки в теплопроводности
и суммарное термическое сопротивление
Т'
Т'
Q'2 aXS'2+2J[T*]/Ti'
(21.18)
Отсюда, учитывая (21.7), получаем двусторонние оценки для
суммарного теплового потока
2^^ + aXS2 < Q2 < 2^^ + aXS'2
и для суммарного термического сопротивления теплопередачи
Т'
aXS2+2J[T]/Z
<Rv<
Τ'
aXS'2+2I[T,q]/Ti
Пример 21.1. Рассмотрим тепловыделяющий элемент,
представляющий собой стержень с поперечным сечением в
виде правильного шестиуголь-
ника (рис. 21.6). Построим дву-
стороннюю оценку средней по
сечению температуры f при усло-
вии, что коэффициент теплопро-
водности λ(Τ) материала стержня
и мощность qv энерговыделения
постоянны в поперечном сечении
такого шестигранного стержня.
Заданное значение Тп темпера-
туры поверхности этого стержня
примем за нуль отсчета темпера-
туры.
В силу симметрии сечения
стержня относительно прямых, проходящих через противопо-
ложные вершины шестиугольника и через середины его про-
тивоположных сторон, достаточно рассмотреть один из 12 тре-
угольников, заштрихованный на рис. 21.6. Площадь этого
треугольника F = β2/(2ν3), где В — радиус окружности,
вписанной в шестиугольник. Для функционала (21.4) в каче-
стве допустимого распределения температуры сначала возь-
мем следующее:
7\(М) = Сг(В2 -х2), М(х, у)е F. (21.19)
21. Двусторонние оценки в теплопроводности
473
Постоянную С1 определим из необходимого условия миниму-
ма функционала (21.4) после подстановки в него (21.19):
ЦТ) Л в х№
FK ~ J 0 0
C(UT) λ Df '}
J[Ti] = I -—(VTO2 -дуТг \dF = 2Х(Г)С? I x2 dx I dy-
qvCl^pJf\y=ClBim^
0 0
Отсюда следует, что
ψ-^c^-o,
2\2
(ο Β λ
или Сг = ςτ^/(4λ^Τ)), что соответствует значению J л = ^=—
32V3X(T)
функционала (21.4) и, согласно (21.10), нижней оценке сред-
ней температуры
f-=-2^=iS=0·125^· (21·20)
Несложно проверить, что распределение вектора плотности
теплового потока
чщ) = ^Щх2 + у2), М(х, у)е М,
4
с проекциями qx = qvx/2 и qy = qyy/2 на оси координат Ох и
Оу соответственно удовлетворяет первому из условий (21.6) и
поэтому может быть использовано в качестве допустимого для
функционала вида (21.5):
I[q\ = JJ^dF = \^i(q2x+qi)dxdy = -5 ^^ = 1г.
F F
Этому значению, согласно (21.10), отвечает верхняя оценка
средней температуры
т_+-2^=1^м,д38888^<0'139т^· <21·21>
474
21. Двусторонние оценки в теплопроводности
Таким образом, учитывая (21.20) и (21.21), получаем дву-
стороннюю оценку для средней температуры поперечного
сечения шестигранного тепловыделяющего элемента в виде
0,125^- < Τ < 0,139^-. (21.22)
Отметим, что замена шестигранного стержня круглым с
равновеликой площадью поперечного сечения радиуса г0 =
= yJl^Fjn = Byj2ν3/π приводит к значению средней темпера-
туры
- _gvr2 _ УЗ qvB2 qvB2
лежащему в найденных пределах (21.22) довольно близко к
верхней границе*
Распределение температуры (21.19) является достаточно
грубым. Следует ожидать, что его уточнение уменьшит «вил-
ку», определяемую двусторонними оценками средней темпера-
туры Т. Для уточнения допустимого распределения темпера-
туры в поперечном сечении шестигранного стержня построим
уравнение \|/(х, у) = 0 контура этого сечения в виде произведения
уравнений сторон шестиугольника (см. рис. 21.6):
АгА2 2В - х - у/Зу = 0,
A%AZ 2В + х - л/Зу = 0,
А^А4 2B + х = 0,
ААА6 2В + х + л/Зг/ = 0,
Α$Α6 2Β - х + л/Зг/ = 0,
А$АХ 2В- х = 0,
так что в итоге получим
ψ(*, у) = (В2 -х2)((2В + х)2 -Зу2)((2В-х)2 -3у2) = 0. (21.23)
Уравнения сторон записаны таким образом, что при смещении
точки внутрь шестиугольника левая часть уравнений стано-
вится положительной. Поэтому для любой внутренней точки
шестиугольника \|/(х, у) > 0.
21. Двусторонние оценки в теплопроводности
475
Примем допустимое распределение температуры в виде
Т2(М) = С2у{х, у), М(х, у) е F, и после его подстановки с уче-
том (21.23) в функционал (21.4) получим
(VT2)2-qvT2
\
dF =
Х<Г>С*
I
(ду(х, у)\2 (дц(х,у)^2
у дх
Эу
J -I
dxdy-
-qvC2 \ψ(Χ, y)dxdy~42,72C2l(T)B12 -l,809C2gFB8 = J2.
Из условия dJ[T2]/dC2 = 0 найдем C2 « 0,0212^/(λ(Γ)Β4) и за-
тем J2 = -0,0192(qvB2)2/X(T). Тогда, согласно (21.10), получим
уточненную нижнюю границу TL ^0713SqvB2/k^ для средней
температуры Т. Таким образом, «вилка», определяемая дву-
сторонними оценками, стала более узкой.
Дальнейшее уточнение нижней границы для средней тем-
пературы можно получить, если представить распределение
температуры в виде ряда
Т(М) = ψ(Χ, у)(а0 + Ьгх + сгу + апху + Ъ2х2 + с2у2 + ...). (21.24)
Степени х и у и их произведения образуют в данном случае
полную систему функций, а наличие сомножителя \|/(х, у)
обеспечивает равенство нулю температуры по контуру попе-
речного сечения, т. е. распределение (21.24) является допу-
стимым для функционала (21.4) при любых значениях коэф-
фициентов а0, &!, Cj и т. д. Вместо степенного ряда в (21.24)
можно использовать тригонометрический ряд.
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
Учебники и учебные пособия
Алексеев В.М., Тихомиров В.М., Фомин СВ. Оптимальное
управление. М.: Наука, 1979. 429 с.
Ахиезер Н.Н. Лекции по вариационному исчислению. М.:
Гостехтеоретиздат, 1955. 248 с.
Березин Н.С, Жидков Н.П. Методы вычислений. Т. 2. М.:
Физматгиз, 1962. 639 с.
Блисс Г.А. Лекции по вариационному исчислению. М.:
Изд-во иностр. лит., 1950. 347 с.
Буслаев B.C. Вариационное исчисление. Л.: Изд-во Ле-
нингр. ун-та, 1980. 288 с.
Бухгольц Н.Н. Основной курс теоретической механики.
Ч. 1. М.: Наука, 1965. 467 с; Ч. 2. М.: Наука, 1966. 332 с.
Власова Е.А., Зарубин B.C., Кувыркин Г.Н. Математиче-
ские модели процессов теплопроводности. М.: Изд-во МГТУ
им. Н.Э. Баумана, 2016. 124 с.
Гелъфанд И.М., Фомин СВ. Вариационное исчисление. М.:
Физматгиз, 1961. 228 с.
Гюнтер Н.М. Курс вариационного исчисления. М.: Гостех-
теоретиздат, 1941. 308 с.
Зарубин B.C., Селиванов СС Вариационные и численные
методы механики сплошной среды. М.: Изд-во МГТУ, 1993.
358 с.
Зарубин B.C., Кувыркин Г.Н. Математические модели ме-
ханики и электродинамики сплошной среды. М.: Изд-во МГТУ
им. Н.Э. Баумана, 2008. 512 с.
Колмогоров А.Н., Фомин СВ. Элементы теории функций и
функционального анализа. М.: Наука, 1989. 623 с.
Коша А. Вариационное исчисление: пер. с венгер. М.:
Высш. шкм 1983. 280 с.
Кротов В.Ф., Лагота Б.А., Лобанов СМ., Данилина Н.Н.,
Сергеев СИ. Основы теории оптимального управления. М.:
Высш. шк., 1990. 429 с.
Рекомендуемая литература
477
КурошАТ. Курс высшей алгебры. М.: ГИТТЛ, 1953. 335 с.
Лаврентьев М.А., Люстерник ЛА. Курс вариационного
исчисления. М.; Л.: Гостехтеоретиздат, 1950. 296 с.
Лаврентьев М.А., Люстерник Л А. Основы вариационного
исчисления. Т. I, ч. П. М.; Л.: ОНТИ НКТП, 1935. 400 с.
Михлин С.Г. Вариационные методы в математической фи-
зике. М.: ГТТИ, 1957. 476 с.
Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Ми-
щенко Е.Ф. Математическая теория оптимальных процессов.
М.: Наука, 1983. 392 с.
Ройтенберг Я.Н. Автоматическое управление. М.: Наука,
1978. 551 с.
Смирнов В.И. Курс высшей математики. Т. 4. Ч. 1. М.:
Наука, 1974. 336 с.
Смирнов В.И., Крылов В.И., Канторович Л.В. Вариацион-
ное исчисление. Л.: КУБУЧ, 1933. 204 с.
Тихонов А.Н., Самарский А.А. Уравнения математической
физики. М.: Наука, 1966. 724 с.
Треногий В.А. Функциональный анализ. М.: Наука, 1980.
496 с.
Эйлер Л. Метод нахождения кривых линий, обладающих
свойствами максимума либо минимума. М.; Л.: ГТТИ, 1934.
600 с.
Эльсгольц Л.Э. Дифференциальные уравнения и вариаци-
онное исчисление. М.: Наука, 1969. 424 с.
Янг Л. Лекции по вариационному исчислению и оптималь-
ному управлению: пер. с англ. М.: Мир, 1974. 488 с.
Дополнительная литература
Бобылев Н.А., Емельянов СВ., Коровин С.К. Геометриче-
ские методы в вариационных задачах. М.: Магистр, 1998.
658 с.
Болотин В.В. Неконсервативные задачи упругой устойчи-
вости. М.: ГИФМЛ, 1961. 336 с.
Брайсон А, Хо Ю-Ши. Прикладная теория оптимального
управления: пер. с англ. М.: Мир, 1972. 544 с.
Ванько В.И. Вариационные принципы и задачи матема-
тической физики. М.: Изд-во МГТУ им. Н.Э. Баумана, 2010.
190 с.
Ванько В.И. Очерки об устойчивости элементов конструк-
ции. М.: Изд-во МГТУ им. Н.Э. Баумана, 2015. 224 с.
Вариационные принципы механики: сб. / под ред. Л.С. По-
лака. М.: Физматгиз, 1959. 932 с.
478
Рекомендуемая литература
Волъмир А.С. Устойчивость упругих систем. М.: Физмат-
гиз, 1963. 879 с.
Галеев Э.М., Тихомиров В.М. Краткий курс теории экстре-
мальных задач. М.: Изд-во МГУ, 1985. 201 с.
Зарубин B.C. Инженерные методы решения задач тепло-
проводности. М.: Энергоатомиздат, 1983. 328 с.
Зарубин B.C. Прикладные задачи термопрочности элемен-
тов конструкций. М.: Машиностроение, 1985. 296 с.
Красовский А. А. Системы автоматического управления по-
летом и их аналитическое конструирование. М.: Наука, 1973.
558 с.
Крылов А.Н. Собрание трудов. Т. 7: Ньютон И. Математи-
ческие начала натуральной философии / пер. с лат. с приме-
чаниями А.Н. Крылова. М.; Л.: Изд-во АН СССР, 1936. 696 с.
Лаврентьев М.А., Шабаш В.В. Проблемы гидродинамики
и их математические модели. М.: Наука, 1977. 407 с.
Лейбензон Л.С. Вариационные методы решения задач тео-
рии упругости. М.; Л.: Гостехиздат, 1943. 287 с.
Лейбензон Л.С. Курс теории упругости. М.: ГИТТЛ, 1947.
464 с.
Лойцянский Л.Г. Механика жидкости и газа. М.: Наука,
1970. 903 с.
Меркин Д.Р. Введение в теорию устойчивости движения.
М.: Наука, 1987. 304 с.
Михлин С.Г. Численная реализация вариационных мето-
дов. М.: Наука, 1966. 432 с.
Николаи Е.Л. Труды по механике. М.: ГТИ, 1955. 584 с.
Проблемы Гильберта: сб. / под ред. П.С. Александрова. М.:
Наука, 1969. 239 с.
Работное Ю.Н. Сопротиваление материалов. М.: ГИФМЛ,
1962. 445 с.
Рашевский П.К. Курс дифференциальной геометрии. М.;
Л.: ГТИ, 1950.428 с.
Рокафеллар Р.Т. Выпуклый анализ. М.: Мир, 1973. 468 с.
Степанов В.В. Курс дифференциальных уравнений. М.:
ГИТТЛ, 1953. 428 с.
Формальский AM. Управляемость и устойчивость систем
с ограниченными ресурсами. М.: Наука, 1973.
Четаев Н.П. Теоретическая механика. М.: Наука, 1987.
367 с.
Экланд И., Темам Р. Выпуклый анализ и вариационные
проблемы: пер. с англ. М.: Мир, 1979. 400 с.
Эльсгольц Л.Э. Вариационное исчисление. М.: Гостехтеорет-
издат, 1958. 164 с.
Рекомендуемая литература
479
Справочные издания и монографии
Абовский Н.П., Андреев Н.П., Деруга А.П. Вариационные
принципы теории упругости и теории оболочек. М.: Наука,
1978. 287 с.
Александрова Н.В. Математические термины: справочник.
М.: Высш. шк., 1978. 190 с.
Атанс М., Фалб П. Оптимальное управление. М.: Маши-
ностроение, 1968. 764 с.
Беллман Р. Динамическое программирование. М.: Изд-во
иностр. лит., 1960. 400 с.
Беллман Р., Дрейфус С. Прикладные задачи динамического
программирования: пер. с англ. М.: Наука, 1965. 458 с.
Бердичевский В.Л. Вариационные принципы механики
сплошной среды. М.: Наука, 1983. 448 с.
Био М. Вариационные принципы в теории теплообмена:
пер. с англ. М.: Энергия, 1975. 208 с.
Бронштейн И.Н., Семендяев К.А. Справочник по матема-
тике для инженеров и учащихся втузов. 13-е изд., испр. М.:
Наука, 1986. 544 с.
Габасов Р., Кириллова М.Ф. Особые оптимальные управле-
ния· М,: Наука, 1973. 256 с.
Грибанов В.Ф., Паничкин Н.Г. Связанные и динамические
задачи термоупругости. М.: Машиностроение, 1984. 184 с.
Коллатц Л. Задачи на собственные значения: пер. с нем.
М.: Наука, 1968. 503 с.
Корн Г., Корн Т. Справочник по математике: для научных
работников и инженеров: пер. с англ. М.: Наука, 1973. 832 с.
Курант Р., Гильберт Д. Методы математической физики:
пер. с англ. Т. 1. М.; Л.: ГТТИ, 1934. 532 с.
Ланцош К. Вариационные принципы механики: пер. с
англ. М.: Мир, 1965. 408 с.
Лернер А.Я., Розенман Е.А. Оптимальное управление. М.:
Энергия, 1970. 358 с.
Летов AM. Динамика полета и управление. М.: Наука,
1969. 360 с.
Математический энциклопедический словарь / гл. ред.
Ю.В. Прохоров. М.: Сов. энцикл., 1988. 848 с.
Петров Ю.П. Вариационные методы теории оптимального
управления. Л.: Энергия, 1977. 280 с.
Полак Л.С. Вариационные принципы механики, их разви-
тие и применение в физике. М.: Физматгиз, 1960. 599 с.
Работное Ю.Н. Механика деформируемого твердого тела.
М.: Наука, 1979. 745 с.
480
Рекомендуемая литература
Ректорис К. Вариационные методы в математической фи-
зике: пер. с англ. М.: Мир, 1985. 590 с.
Справочник по теории автоматического управления / под
ред. А.А. Красовского. М.: Наука, 1987. 712 с.
Тимошенко СП., Гудъер Дж. Теория упругости: пер. с англ.
М.: Наука, 1975. 576 с.
Феодосъев В.И. Избранные задачи и вопросы по сопротив-
лению материалов. М.: ГТТИ, 1953. 240 с.
Феодосъев В.И. Сопротивление материалов. М.: Наука,
1979. 559 с.
Цлаф Л.Я. Вариационное исчисление и интегральные урав-
нения: справ, рук. 2-е изд., перераб. М.: Наука, 1970. 192 с.
Черноусько Ф.Л., Баничук Н.В. Вариационные задачи ме-
ханики и управления (Численные методы). М.: Наука, 1973.
238 с.
Черный Г.Г. Течения газа с большой сверхзвуковой скоро-
стью. М.: Физматгиз, 1959. 220 с*
Задачники
Алексеев В.М., Галеев Э.М., Тихомиров В.М. Сборник задач
по оптимизации. М.: Наука, 1984. 287 с.
Ефимов А.В., Золотарев Ю.Г., Терпигорева В.М. Матема-
тический анализ (спец. разделы). Ч. 2. М.: Высш. шк., 1980.
290 с.
Краснов М.Л., Макаренко Г.И., Киселев AM. Вариационное
исчисление. Задачи. М.: УРСС, 2002. 166 с.
Сборник задач по математике для втузов. Ч, 4. Методы оп-
тимизации. Уравнения в частных производных. Интегральные
уравнения: учеб. пособие / под ред. А.В. Ефимова. 2-е изд.,
перераб. М.: Наука, 1990. 304 с.
Периодические издания
Вернштейн Н.С. Об уравнениях вариационного исчисле-
ния // Успехи матем. наук. 1941. Вып. 8. С. 32-74.
Болтянский В.Г., Гамкрелидзе Р.В., Понтрягин Л.С. К тео-
рии оптимальных процессов // ДАН СССР. 1956. Т. 110. № 1.
С. 7-10.
Болтянский В.Г. Достаточные условия оптимальности и
обоснование метода динамического программирования // Изв.
АН СССР. Сер. матем. 1964. Т. 28. № 3. С. 481-514.
Ванько В.И. О собственных частотах колебаний проводов
воздушных ЛЭП // Изв. вузов. Сер. Энергетика. 1987. № 8.
С. 7-12.
Рекомендуемая литература
481
Гонор А.Л. О пространственных телах наименьшего со-
противления // Прикл. математика и механика. 1963. Т. 27,
вып. 1. С. 185-189*
Дейнеко К.С> Леонов М.Я. Динамический метод исследо-
вания устойчивости сжатого стержня // Прикл. математика
и механика. 1955. Т. 19, № 6. С. 738-744.
Ефремов Н.Л., КрайкоА.Н., Пьяное К.С., Таковицкий С.А.
Построение в рамках уравнений Эйлена головной части ми-
нимального сопротивления при заданных габаритах и объ-
еме // Прикл. математика и механика. 2006. Т. 70, вып. 6.
С. 1017-1030.
Крайко А.Н. Об определении тел минимального сопротив-
ления при использовании законов сопротивления Ньютона
и Буземана // Прикл· математика и механика. 1963. Т. 27,
вып. 3. С. 484-495.
Красносельский М.А. Некоторые задачи нелинейного ана-
лиза // Успехи матем. наук. 1954. Т. 9, вып. 3 (61). С. 57-114.
Розоноэр Л.И. Принцип Л.С. Понтрягина в теории опти-
мальных систем // Автоматика и телемеханика, 1959. № 10,
с. 1320-1334; № 11, с. 1441-1458; № 12, с. 1561-1579.
Слободянский М.Г. Оценка погрешности приближенного
решения в линейных задачах, сводящихся к вариационным,
и их применение к определению двусторонних приближений в
статических задачах теории упругости // Прикл. математика
и механика. 1952. Т. 16, вып. 4. С. 449-464.
Фелъдбаум А.А. Оптимальные процессы в системах авто-
матического регулирования // Автоматика и телемеханика.
1953. Т. 14, № 6. С. 1561-1580.
Фелъдбаум А.А. О синтезе оптимальных систем с помощью
фазового пространства // Автоматика и телемеханика. 1955.
Т. 16, № 2. С. 129-149.
Beck M. Die Knicklast des einseitig eingespannten, tangential
gedriickten Stabes // Zeitschrift angewandte Mathematik und
Physik. 1952. Band 3. № 3. S. 225-228.
предметный указатель
Аксиомы скалярного умноже-
ния IV, 345
Базис стандартный IV, 152
- счетный IX, 348
Бифуркация 434
Брахистохрона II, 17
Вариация функции допустимая 26
- функционала 26
- вторая 143
- первая 26
Вектор управления 169
- фазовой скорости 173
- фазовый 168
Вектор-функция кусочно-непре-
рывная 170
Воздействие управляющее 169
Возмущение 195
Время свободное 210
Гиперплоскость 252
Гиперповерхность 253
Градиент функции V
Движение возмущенное 303
- лимитационное 180
- невозмущенное 303
- объекта 169
Действие по Гамильтону 393
Дифференциал полный VII, 46
- сильный (Фреше) 25
Дифференциал слабый (Гато) 26
Дополнение ортогональное IV
Задача Больца 134
- элементарная 135
- вариационная 37
- на условный экстремум 119
- с подвижными границами 86, 90
Задача Больца с подвижными кон-
цами 86
- вариационного исчисления 42
простейшая 42
- двухточечная 174
- изопериметрическая 127
- Лагранжа 121
- в форме Понтрягина 181
- Майера 134
- Ньютона аэродинамиче-
ская 412
- о геодезических линиях 20
- о продольном изгибе 427
- оптимального управления ли-
нейная 169, 171
- оптимальной стабилизации 303
- синтеза оптимальных управле-
ний 178, 179
- со свободным концом 173
- с подвижными (скользящими)
концами 174
- стабилизации 302
- с фиксированным временем 258
фиксированными концами 173
- управления 173
- многоточечная 174
- Штурма — Лиувилля XI, XII,
433
Закон движения 169
Значение собственное IV, 433
Интеграл Гильберта инвариант-
ный 155
- Лебега IX
- первый системы ОДУ VIII, 61
Интегрант 28
Интервал времени управления 174
Комбинация линейная векто-
ров III, IV
Предметный указатель
483
Координаты фазовые 168
Кривая гладкая И, 99
- интегральная VIII, 61
- фазовая 169
Критерий интегральный квадра-
тичный 175
- смешанный 176
- качества 176
- интегральный 177
- энергетический 178
- конечного состояния 177
- оптимального быстродейст-
вия 177
Лагранжиан 123
Лемма вариационного исчисления
основная 33
- Дюбуа-Реймона 35
- Лагранжа 33
Линия геодезическая V, 20
- переключений 248
Максимум сильный 31
- слабый 31
Матрица Гессе V, 60
- Грама IV, 367
- диагональная IV
- невырожденная III
Метод динамического программи-
рования 275
- конечных элементов XIII, 359
Метод Куранта 359
- множителей Лагранжа 128
- наименьших квадратов XIII,
358
- Ритца XIII, 352
Методы прямые XIII, 308
Минимум сильный 31
- слабый 31
- строгий 31
Многообразие линейное IX, 317
Множество всюду плотное IX, 316
- выпуклое XIV, 335
- замкнутое 1-186, 363
- измеримое IX, XIII, 311
- компактное 1-189, XIII, 364
- по энергии 364
- (лебеговой) меры нуль IX, 312
- ограниченное 1-183, 363
- предкомпактное 363
- управлений допустимых 170
Множители Лагранжа 123
Модель математическая XX, 171
Наклон поля экстремалей 153
Невязка 349
Неравенство треугольника IV, 336
Норма IV, IX, 23
- евклидова IV, 311
- ограниченного оператора 360
- энергетическая XIII, 345
Нормаль внешняя V,
Область определения операто-
ра XIII, 311
- управления 170
- управляемости 251
Оболочка линейная системы век-
торов IV, 367
Объект детерминированный 168
- управляемый 167
Ограничение на управление 170
- фазовые координаты 169
- фазовое 169
Ограничения фазовые 120
Оператор XIII, 310
- Гамильтона VII, 320
- действующий в линейном про-
странстве 314
- компактный (вполне непрерыв-
ный) 364
- Лапласа XII, 316
- линейный IV, XIII, 316
дифференциальный XI, 316
- неотрицательный 362
- ограниченный 360
- снизу 361
- положительно определен-
ный XIII, 317
- положительный XIII, 317
- самосопряженный IV
- симметрический XIII, 317
- тождественный IV, 366
- Штурма — Лиувилля XI, 364
Параллелепипед г-мерный 236
Параметр управляющий 170
Переключение 224
Переменные канонические 60
- сопряженные 213
Поверхность V
Подпоследовательность 1-243, 361
Подпространство собственное опе-
ратора IV, 363
484
Предметный указатель
Поле экстремалей 153
Пополнение нормированного (ев-
клидова) пространства XIII,
314
Последовательность минимизиру-
ющая 344
- сходящаяся поточечно IX, 312
- сходящаяся равномерно 313
- фундаментальная 315
Принцип взаимности 133
- Гамильтона 391
- двойственности 133
- максимума 208
- оптимальности 275
Произведение скалярное энергети-
ческое XIII, 345
Производная функции полная
в силу системы VIII, 62
- по направлению V, 319
Пространство банахово IX, 24
- гильбертово IX, 24
- сепарабельное IX, 348
- евклидово арифметическое IV
- нормированное IV, IX, 22
полное IX, 311
- фазовое 169
- функциональное 311
- энергетическое XIII, 346
Процесс допустимый 168
- локально оптимальный 203
- оптимальный 175
- ортогонализации Гра-
ма — Шмидта IV
Режим особый 266
Решение операторного уравнения
классическое 348
обобщенное 348
приближенное 349
Ряд Фурье IX, 349
Связи голономные 120
- дифференциальные 120
Связи интегральные (изопериме-
трические) 120
Связь обратная 244
Синтез управления 244
Система векторов линейно незави-
симая IV
- гамильтонова 188
- (ОДУ) автономная VIII
- сопряженная 196
Система управляемая 167
- линейная 200
- уравнений Эйлера 53
- условий полная 123
- функций ортонормирован-
ия IX, 348
- Якоби 151
Скобка Пуассона 62
Соотношение Беллмана рекур-
рентное 280,283
Состояние начальное 172
- фазовое 168
Стабилизация оптимальная в це-
лом 304
Сужение функционала (отображе-
ния) 200
Сходимость в среднем квадратич-
ном IX, 312
- по энергии 345
Теорема Бюдана — Фурье 423
- о квадратичном функциона-
ле XIII, 321
неявной функции V
Точка возврата 421
- переключения 236
- сопряженная 149
- стационарная функционала 41
- угловая I, 96
- фазовая (изображающая) 169
- экстремума функционала 31
Траектория оптимальная 175
Траектория фазовая 169
- соответствующая управле-
нию 173
Управление 171
- допустимое 173
- оптимальное 178
- по быстродействию 178
- особое 265
- программное 244
- экстремальное 239
Управляемость системы 199
Уравнение Беллмана 289
- вариационное 322
- голономное 322
- Лапласа XII, 59
- линейного приближения VIII
- операторное XIII, 314
- Остроградского 59
- Пуассона XII, 317
Предметный указатель
485
Уравнение Эйлера 43
- Эйлера — Пуассона 56
- Якоби 150
Уравнения возмущенного движе-
ния 196
- первого приближения 197
- Эйлера задачи Лагранжа 128
- изопериметрической зада-
чи 129
Условие краевое естественное 88
- Лежандра 150
- усиленное 150
- начальное VIII, 172
- общности положения 231
- отражения 98
- преломления 101
- сильного минимума достаточ-
ное 158
- слабого минимума достаточное
150
- трансверсальности 95
- экстремума функционала необ-
ходимое 43
- Якоби 150
усиленное 150
Условия Вейерштрасса — Эрдма-
на 102
- связи 119
Участок особого управления (ре-
жима) 268
Форма билинейная IV, 143
- каноническая уравнений Эйле-
ра 61
Формула Грина VII, 58
- - вторая VII, 319
- - первая VII, 320
- Остроградского — Гаусса VII,
333
Формулировка прикладной задачи
вариационная 322
Функционал альтернативный 373
- билинейный 143
- вспомогательный 123
- выпуклый 335
- строго 336
- вырожденный 46
- дважды дифференцируемый
в точке 143
Функционал Дирихле 377
- дифференцируемый в точке 25
- квадратичный 143, 321
- - неотрицательно определен-
ный 143
- положительно определен-
ный 143
- сильно положительный 145
- Лагранжа 375
- линейный 23
- непрерывный в точке 25
- терминальный 177
- целевой 119
- целевой интегральный 135
- - смешанный 135
- терминальный 135
- энергии XIII, 345
Функция аналитическая X, 238
- Беллмана 284
- Вейерштрасса 159
- Гамильтона 60
- допустимая 21
- измеримая IX, XIII, 312
- комплексного переменного X,
237
- кусочно-гладкая 101
- Лагранжа 123
- Понтрягина 188
- пробная 34
- синтезирующая 178
- суммируемая с квадратом IX,
23
— и весом IX, 312
Цель управления 169
Экстремаль 43
- включенная в поле экстремалей
153
- задачи Лагранжа 123
Экстремум сильный 30
- слабый 30
- условный V, 129
Элемент оператора собственный
XIII, 359
ε-окрестность сильная 24
- слабая 24
ОГЛАВЛЕНИЕ
Предисловие 5
Основные обозначения 9
ЧАСТЬ I. Классическое вариационное исчисление 13
1. ОСНОВНЫЕ ПОНЯТИЯ 15
1.1. Задачи, приводящие к вариационным проблемам 15
1.2. Основные определения 21
1.3. Основные леммы вариационного исчисления 33
1.4. Некоторые замечания о задачах вариационного исчисления .... 37
Вопросы и задачи 40
2. ВАРИАЦИОННЫЕ ЗАДАЧИ С ФИКСИРОВАННЫМИ
ГРАНИЦАМИ 42
2.1. Простейшая задача вариационного исчисления 42
2.2. Функционалы от нескольких функций 52
2.3. Функционалы с производными высшего порядка 54
2.4. Функционалы от функций многих переменных 57
2.5. Канонический вид уравнений Эйлера 59
2.6. Инвариантность формы представления уравнения Эйлера 62
2.7. Простейшая задача в параметрической форме 67
2.8. Принцип Гамильтона. Интеграл энергии 77
Вопросы и задачи 80
3. ВАРИАЦИОННЫЕ ЗАДАЧИ С ПОДВИЖНЫМИ ГРАНИЦАМИ .... 86
3.1. Задачас подвижными концами 86
3.2. Задача с подвижными границами 90
3.3. Экстремали с угловыми точками 96
3.4. Задачас подвижными границами в пространстве 103
3.5. Задачи с односторонними вариациями 109
Вопросы и задачи 115
4. ЗАДАЧИ НА УСЛОВНЫЙ ЭКСТРЕМУМ 119
4.1. Основные типы задач на условный экстремум 119
4.2. Необходимые условия в задаче Лагранжа 121
4.3. Необходимые условия в изопериметрической задаче 127
4.4. Примеры задач на условный экстремум 130
4.5. Принцип взаимности в изопериметрических задачах 133
4.6. Задача Больца и задача Майера 134
Вопросы и задачи 139
Оглавление 487
5. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУ ΜΑ 142
5.1. Слабый экстремум 142
5.2. Условие Якоби 153
5.3. Инвариантный интеграл Гильберта 155
5.4. Сильный экстремум 158
Вопросы и задачи 162
ЧАСТЬ II. Оптимальное управление 165
6. ВАРИАЦИОННЫЕ МЕТОДЫ В ОПТИМАЛЬНОМ
УПРАВЛЕНИИ 167
6.1. Постановка задач оптимального управления 167
6.2. Задача Лагранжа в форме Понтрягина 181
6.3. Некоторые задачи с ограничениями в классическом
вариационном исчислении 189
6.4. Линейные задачи оптимального управления 196
6.5. Обсуждение методов вариационного исчисления 200
Вопросы и задачи 207
7. ПРИНЦИП МАКСИМУМА 208
7.1. Автономная система управления. Формулировка
принципа максимума 209
7.2. Обсуждение принципа максимума 216
7.3. Задача быстродействия 221
7.4. Линейная задача оптимального быстродействия 231
7.5. Задача синтеза управления 244
7.6. Задача с подвижными концами 252
7.7. Неавтономные системы 256
7.8. Понятие особого управления 265
Вопросы и задачи 272
8. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ 275
8.1. Принцип оптимальности 275
8.2. Уравнение Беллмана 283
8.3. Уравнение Беллмана в задаче быстродействия 294
8.4. Связь метода динамического программирования
с принципом максимума 299
8.5. Оптимальная стабилизация 302
Вопросы и задачи 306
ЧАСТЬ III. Прямые методы вариационного исчисления 307
9. ФОРМУЛИРОВКА ВАРИАЦИОННЫХ ЗАДАЧ 309
9.1. Операторное уравнение 310
9.2. Вариационное уравнение 322
9.3. Примеры построения функционала по вариационному
уравнению 326
9.4. Исследование выпуклости функционала 335
Вопросы и задачи 342
10. МЕТОДЫ РЕШЕНИЯ ВАРИАЦИОННЫХ ЗАДАЧ 344
10.1. Минимизирующие последовательности 344
10.2. Методы приближенного решения вариационных задач 351
488
Оглавление
10.3. Собственные значения симметрического оператора 359
10.4. Приближенное решение задачи на собственные значения 366
Вопросы и задачи 371
11. ДВОЙСТВЕННЫЕ ВАРИАЦИОННЫЕ ЗАДАЧИ 372
11.1. Альтернативные функционалы 372
11.2. Построение альтернативного функционала 375
11.3. Оценка погрешности приближенного решения 381
Вопросы и задачи 387
ЧАСТЬ IV. Приложения вариационных методов 389
12. ПРИНЦИП ГАМИЛЬТОНА 391
13. КОЛЕБАНИЯ СТРУНЫ 396
14. КОЛЕБАНИЯ МЕМБРАНЫ 399
15. УРАВНЕНИЯ ДВИЖЕНИЯ ИДЕАЛЬНОЙ ЖИДКОСТИ 404
16. ЗАДАЧА ЧАПЛЫГИНА 409
17. АЭРОДИНАМИЧЕСКАЯ ЗАДАЧА НЬЮТОНА 412
18. ЗАДАЧА О ПРОДОЛЬНОМ ИЗГИБЕ УПРУГОГО СТЕРЖНЯ 427
18.1. Действие потенциальной силы 427
18.2. Действие следящей силы 436
18.3. Динамический подход 438
19. ВАРИАЦИОННЫЕ ПРИНЦИПЫ ЛАГРАНЖА, РЕИССНЕРА
ИКАСТИЛЬЯНО 444
20. ВАРИАЦИОННЫЕ ПРИНЦИПЫ ТЕРМОУПРУГОСТИ 459
21. ДВУСТОРОННИЕ ОЦЕНКИ В ТЕПЛОПРОВОДНОСТИ 467
Рекомендуемая литература 476
Предметный указатель 482