/
Text
L. С. YOUNG
Distinguished Research Professor of Mathematics
University of Wisconsin
Former Fellow of Trinity College
Cambridge University
LECTURES ON THE CALCULUS
OF VARIATIONS
AND OPTIMAL CONTROL THEORY
W. B. SAUNDERS COMPANY
Philadelphia London Toronto 1969
Ж. Янг
Лекции
по вариационному
исчислению
и
теории
оптимального
управления
Перевод с английского М. Г. ЭЛУАШВИЛИ
Под редакцией В. М. АЛЕКСЕЕВА
ИЗДАТЕЛЬСТВО «МИР» МОСКВА 1974
УДК 519.3
В «Лекциях» проф. Л. Янга дано нестандартное изложение
различных аспектов вариационного исчисления и теории опти-
оптимального управления. Книга состоит из двух томов. В первом, из-
изложены классические результаты вариационного исчисления.- Во
втором большое внимание уделено обобщенному оптимальному
управлению.
Написанная живо и занимательно (без ущерба для строгости
изложения), книга предназначена для математиков, вычислителей,
астрономов, специалистов по теории управления и инженеров.
Она доступна студентам старших курсов, специализирующимся
в области оптимального управления.
Редакция литературы по математическим наукам
© Перевод на русский язык, «Мир», 1974
20203-033
041 @1)-74
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА»
По Лейбницу наш мир является
наилучшим из всех возможных миров,
и поэтому законы природы можно опи-
описать экстремальными принципами.
/С. Л. Зигель
Последние годы вариационному исчислению не очень везло
в преподавании. Представленное некогда в учебных планах
отдельным курсом, оно постепенно оказалось низведенным до
двух-трех лекций, иллюстрирующих основные понятия нелиней-
нелинейного функционального анализа. Вывод уравнений Эйлера и до-
достаточные условия ^-локального экстремума (положительная
определенность второй вариации) — вот, пожалуй, и все, что оста-
осталось. Столь богатая идеями теория Гамильтона — Якоби вместе с
геометрической оптикой и уравнениями в частных производных пер-
первого порядка, да и вариационная теория Штурма—Лиувилля —
Куранта полностью или почти полностью исчезли из обязатель-
обязательных курсов. Даже теория Морса стала восприниматься теперь
скорее как часть дифференциальной геометрии, нежели как «ва-
«вариационное исчисление в целом».
Бурное развитие теории оптимального управления и ее при-
приложений к практическим задачам, знаменитый принцип макси-
максимума Понтрягина — все это, с одной стороны, стимулировало
интерес к вариационным задачам, но, с другой, послужило по-
поводом для распространения отношения к классическому вариа-
вариационному исчислению как к некоему анахронизму.
Вряд ли это справедливо. Во всяком случае, профессор Вис-
консинского университета Лоренс Янг, перевод книги которого
представляется сейчас вниманию советского читателя, как мне
"кажется, этой точки зрения не придерживается. И дело здесь
не только в том, что вариационное исчисление, по словам Л. Ян-
га, является «летописью математических понятий». Гораздо важ-
важнее, что Янг убедительно демонстрирует возможности плодотвор-
плодотворного развития задач классической постановки в духе современного
функционального анализа, особенно там, где речь идет о теоре-
теоремах существования.
Автор сделал очень многое для того, чтобы придать вариа-
вариационным задачам такую форму, когда теоремы существования
становятся автоматическими следствиями определений. Разумеется,
11 Английскому изданию предпослано предисловие проф. У. X. Флеминга.
Большая его часть цитируется мцою далее и использована для текста на су-
суперобложке. — Прим. ред.
6 Предисловие редактора перевода
в соответствии с принципом, высказанным когда-то Гильбертом,
для этого понятие решения приходится надлежащим образом
обобщить. Представляя читателям английское издание книги,
проф. У. X. Флеминг пишет:
«Среди идей, существенно повлиявших на недавние исследо-
исследования в вариационном исчислении, следует отметить идеи, со-
содержащиеся в работах Л. Янга по обобщенным кривым и поверх-
поверхностям. Уже в статьях, посвященных обобщенным кривым
A933—1938 гг.), Янг предложил совершенно новый для того
времени подход, а именно возможность рассматривать кривую
или поверхность как функционал в пространстве подинтеграль-
ных выражений, отвечающих данной вариационной задаче. Это
обеспечило связь между вариационным исчислением и слабыми
решениями дифференциальных уравнений, «распределениями»
Шварца и «потоками» де Рама. В конечном счете это привело к
глубоким и красивым результатам, относящимся к многомерной
задаче Плато, и к построению глобальной теории для интеграль-
интегральных потоков и «вариобразий». (Краткое введение в эти последние
вопросы содержится в книге F. J. Almgren, An Invitation to
Varifold Geometry, Benjamin, New York, 1966.) С точки зрения
Янга рассматривать в пространстве кривых «очевидные» тополо-
топологии было бы неправильно. Предложенная им топология лучше
приспособлена для нужд вариационного исчисления. В этой то-
топологии пространство обычных кривых неполно; его пополнение
содержит объекты, которые Янг назвал обобщенными кривыми.
Они доставляют решения вариационным задачам, не имеющим
таковых в обычном смысле. Именно поэтому обобщенные кривые
или эквивалентные им понятия столь широко распространены в
современной литературе, посвященной задачам оптимального
управления, где они фигурируют под именем скользящих режи-
режимов и слабых управлений.»
Эта книга—отнюдь не популярный учебник. Математики-пу-
Математики-пуристы, возможно, найдут ее стиль даже недостаточно четким и
отшлифованным. Однако мне кажется, что она может дать обиль-
обильную пищу для размышлений над самыми различными проблемами
нашей науки. В своем предисловии автор подробно останавли-
останавливается на том, кому предназначена эта книга, и дает советы,
как ею пользоваться; нет нужды повторять это. Стоит, однако,
отметить, что своеобразный стиль книги, обилие в ней «лиричес-
«лирических отступлений» и исторических сведений придают лекциям
Л. Янга особый интерес. Автор принадлежит к клану с богатей-
богатейшими математическими традициями. Достаточно вспомнить о «не-
«неравенстве Юнга» (Юнг—старая транскрипция фамилии Young;
W. H. Young—отец автора книги) или заглянуть в именной
.указатель курса анализа Балле-Пуссена или в математическую
энциклопедию. В абзацах, набранных петитом, то и дело слы-
Предисловие редактора перевода 7
шатся живые голоса великих математиков, со многими из кото-
которых автор был знаком лично.
Перевод лекций Л. Янга выполнила М. Г. Элуашвили. Да-
Далекий от формализма и чересчур литературный для математи-
математической книги стиль сделал ее задачу, а также и мою, как ре-
редактора, весьма нелегкой.
В связи с этим я хотел бы выразить свою признательность
В. М. Сафраю, который принял участие в работе над рядом трудных
мест, и редактору издательства Н. И. Плужниковой. В тех случа-
случаях, когда наши объединенные усилия оказывались недостаточными
для однозначной интерпретации английского текста (особенно в
части реалий) или в подыскании удачного русского эквивалента,
автор этих строк брал на себя ответственность принять оконча-
окончательное решение. Надеюсь, что это не привело к каким-либо
существенным искажениям мыслей автора книги. Я благодарен
также В. М. Тихомирову, давшему мне несколько полезных со-
советов.
Особо следует сказать о терминологии. Л. Янг обращается с
ней довольно свободно, вводит много нестандартных слов и на-
настойчиво призывает пропагандировать новые термины. Мы ста-
старались, где возможно, сохранить тот же стиль и в переводе, хотя
бы иногда это выглядело несколько непривычно или шло враз-
вразрез с установившейся традицией. Для ориентировки читателя в
указателе часть терминов дается вместе с английскими прообра-
прообразами.
В. М. Алексеев
ПРЕДИСЛОВИЕ
Эти лекции предназначаются для широкого круга читателей.
Изложение доведено в них до самых современных исследова-
исследований и включает даже некоторые еще не опубликованные резуль-
результаты; весьма существенное место занимает аппарат функциональ-
функционального анализа. Кроме того, всей гамильтоновой теории придан
модернистский облик — в духе понятий выпуклого анализа.
Представлено также введение в теорию Морса. Далее, уже вступ-
вступление знакомит читателя с современной теорией обобщенных фун-
функций, а классическая теория, развитая в главах I, II и V (в той
ее части, которая посвящена вопросам единственности), нигде
больше не изложена столь же полно, если не считать замечатель-
замечательной книги Каратеодори. Наконец, весь первый том имеет своей
целью подготовить читателя к новейшим исследованиям в теории
оптимального управления, которым посвящен второй том11.
Сказанное выше может создать впечатление, что эти лекции
доступны только избранным, свободно владеющим ультрасовре-
ультрасовременными понятиями и методами остальных разделов анализа. Но
мы твердо убеждены, что это не так. Как раз напротив, эти лек-
лекции читались в аудитории, довольно неоднородной по своему
уровню, а теперь в написанном виде они рассчитаны на читате-
читателей с самой минимальной математической подготовкой. Помимо
этого, единственным необходимым условием, без которого читать
эту книгу не имеет смысла, является сильное желание учиться,
и мы всячески старались вдохновлять его и поощрять. Мы реши-
решительно отвергаем высокомерную пифагорейскую исключительность,
которая превращает некоторую область в вотчину секты посвя-
посвященных. Эти лекции предназначены не только для математиков;
ими могут воспользоваться, например, инженеры, астрономы и
вычислители, работающие в области космических исследований и
ощущающие потребность в соответствующих знаниях. Но глав-
главным образом они были задуманы в расчете на талантливую моло-
молодежь, которая оканчивает теперь высшую школу и в скором бу-
будущем сменит нас. Естественно, что таким читателям потребуют-
потребуются время и труд для изучения этой книги, но мы окажем им всю
возможную помощь.
Идея написать книгу для столь разнообразного круга читате-
читателей, не забывая при этом и об интересах специалистов — матема-
математиков, может показаться утопией, но ведь такие книги уже суще-
•' Для удобства читателя оба тома изданы одной книгой. Тем, кого в ос-
основном интересуют сведения практического характера, относящиеся к задачам
оптимального управления, мы предлагаем ограничиться чтением вступления,
главы I и части главы II, посвященной двойственности, а затем перейти не-
непосредственно к началу тома II.
JO Предисловие
ствуют. Достаточно упомянуть знаменитые «Неравенства» Харди,
Литтльвуда и Полна — книгу, которую мы настойчиво рекоменду-
рекомендуем читателю. Точно так же любители астрономии могли бы на-
напомнить о замечательных книгах Эддингтона. Что же касается
этих лекций, то мы уже имеем некоторые свидетельства об успехе;
вступление еще в виде машинописных копий пользовалось боль-
большим спросом среди коллег в качестве легкого воскресного чтения
после тяжких недельных трудов. Это частично объясняется тем,
что мы старались осветить должным образом как исторические
аспекты, которые в наше время мало кому известны, так и фило-
философские течения, которые мало кому понятны. В этом отношении
автор обладает преимуществом длительного знакомства с велики-
великими математиками, которые в наше время известны большинству
лишь своими громкими именами. Однако больше всего усилий мы
прилагали к тому, чтобы всеми средствами стимулировать и раз-
развивать интуицию читателя и его способность мыслить, стараясь
воздействовать на его воображение. В этом отношении автор сле-
следовал традиции образности изложения, унаследованной им от по-
покойных родителей У. Г. и Г. Ч. Янгов.
Что касается многочисленных отступлений, которые отражают
точку зрения автора, сложившуюся в результате долгого обще-
общения с математиками и большого опыта математических исследова-
исследований, то читатель, не согласный с ней, должен помнить, что автор
вовсе не старается обратить его или кого-нибудь другого в свою
веру, а лишь стремится создать хорошую атмосферу для дискус-
дискуссии. Если удастся сделать читателя своим единомышленником —
тем лучше, но это должно произойти только на основе его соб-
собственных убеждений. Атмосфера свободных дискуссий и критики
весьма существенна в математике, хотя крайне трудно создать ее,
оставаясь в рамках самой этой науки. Самое главное, чтобы
читатель не принимал на веру ни одно из математических положе-
положений, если он желает когда-нибудь овладеть им.
Вообще, основная цель этих лекций состоит в том, чтобы сти-
стимулировать в читателе интерес, энтузиазм и, в особенности, же-
желание учиться и выяснять все самостоятельно. В частности, мы
пользовались любым поводом, чтобы привлечь его к чтению и
изучению замечательных книг (перечисленных в конце в списках
литературы), что также отвечает этой основной цели ".
Я хочу выразить благодарность многим студентам и друзьям,
которые помогли мне устранить небольшие неточности и темные
места.
Л. Янг
11 Хороший способ изучения этих лекций состоит в том, чтобы рассматри-
рассматривать их как прочитанные устно и конспектировать. Конспект должен содер-
содержать то, что читатель найдет важным, а затем его нужно дополнить матери-
материалом нз других книг, если читатель сочтет это необходимым.
Том I
Лекции
по варисщгюнному
исчислению
Вступление
Общие замечания и типичные проблемы
Впедсние
Общий план этих лекций, а также способ их изучения, по-
пожалуй, заслуживают некоторых предварительных пояснений.
Выбор плана был обусловлен несколькими причинами.
Во-первых, не все еще понимают, что резко растущий в наш
космический век интерес к чистой математике оказывает глубокое
влияние на ее преподавание на всех уровнях и во всех странах.
Круг лиц, интересующихся математикой, значительно расширил-
расширился, и при подготовке лекций уже нельзя ориентироваться на
читателя со строго определенным уровнем математической под-
подготовки. Так и эти лекции рассчитаны не только на тех, кто
успешно выдержал экзамены по солидному курсу математических
наук, и уж, конечно, не только на тех, для кого она стала
профессией, хотя большую часть содержащихся в книге резуль-
результатов вы найдете лишь в журнальных публикациях. В равной
степени они адресованы инженерам, работающим в области кос-
космических исследований и остро ощущающим необходимость иметь
для своей науки строго обоснованный фундамент. Среди слу-
слушавших эти лекции действительно были инженеры, и мы счи-
считаем, что они доступны любому молодому или не слишком мо-
молодому человеку, обладающему серьезным желанием учиться
и некоторым набором хотя бы элементарных сведений из выс-
высшей математики (включая, разумеется, кое-что из дифференциаль-
дифференциальных уравнений, а также немного о матрицах и определителях
и т. п.). Однако иногда такому читателю, если он захочет сле-
следовать изложению во всех деталях, придется, вероятно, покор-
покорпеть над книгами в библиотеке.
Во-вторых, взгляд на самое математику настолько изменился,
что многие опытные преподаватели почувствовали некоторую
растерянность. Уже давно не звонят колокола в честь Мистера
Математика п, и с каждым годом остается все меньше оснований
рассматривать математику как некий барьер, построенный из
экзаменационных задач, решения которых должны быть написа-
и Senior Wrangler—титул, который до 1910 года присваивался студенту
Кембриджского университета, набравшему наибольшее число баллов на экза-
экзамене по математике, известном под названием Cambridge Mathematical Tripos.
14 Вступление. Общие замечания и типичные проблемы
ны как можно быстрее и именно в том виде, который предпо-
предпочитает преподаватель. Отбирать математиков на основе таких
экзаменов не более разумно, чем отыскивать поэтов на конкур-
конкурсе правописания.
Во всяком случае следует сразу же подчеркнуть, что наши
лекции не состоят из небольших кусков малопонятного текста,
сопровождаемых вереницей пояснительных примеров. Подобный
метод преподавания был подвергнут справедливой критике со
стороны девятилетней девочки, истинной леди, которая, решив
один из заданных на дом примеров на сложение, написала в
своей тетрадке: «Остальные делаются так же». В нашей книге
любая задача требует от читателя глубокого размышления и не
решается в несколько строчек. Поэтому эти лекции принесут
пользу не тому, кто хочет научиться быстро щелкать экзамена-
экзаменационные задачки, а тому, кто стремится приобрести глубокое
понимание основных понятий.
Такое понимание приходит лишь постепенно, и мы не соби-
собираемся мчаться галопом. Вместо этого мы постараемся дать всему
подходящую мотивировку, прививая читателю определенный стиль
мышления. А чтобы не слишком утомлять читателя и давать
некоторую пищу его воображению, мы будем перемежать серь-
серьезный текст более легким материалом и даже забавными исто-
историями. Важно, чтобы читатель с замедленной реакцией не испы-
испытывал комплекса неполноценности. Подлинные способности ни в
коем случае нельзя смешивать с обыкновенной быстротой сооб-
соображения. Оставим резвость попугаям и вычислительным маши-
машинам; мозг человека работает эффективнее на более умеренной
скорости.
§ 2
Место вариационного исчисления в математике
и в космических науках
Исследование частных задач вариационного исчисления, или,
как мы будем говорить, частных вариационных задач, началось
чрезвычайно давно. Это объясняется тем, что во многих ситуа-
ситуациях человека устраивает только лучший из возможных вари-
вариантов. Так мы приходим к проблемам оптимизации, т. е. к проб-
проблемам отыскания максимума или минимума. Некоторые из этих
задач были решены элементарными средствами математического
анализа, однако в большинстве случаев для их решения нужны
более сложные методы.
В действительности эти задачи требуют не только новых ме-
методов, но, что более существенно, новых понятий. За такие за-
задачи не стоит браться голыми руками; сначала следует позабо-
позаботиться о хорошем снаряжении. Необходимые понятия выраба-
§ 2. Место вариационного исчисления в математике 15
тывались довольно медленно, и хотя сейчас они пронизывают
всю современную математику, многие даже не подозревают, что
эти понятия возникли именно в нашем предмете. Это отчасти
объясняется тем, что в вариационном исчислении еще сохрани-
сохранилась старомодная терминология.
Уже само название нашего предмета является чисто истори-
историческим; оно связано с одним частным методом, восходящим к
Эйлеру и основанным на так называемых вариациях. Этот метод
когда-то играл в нашем предмете важную роль, однако сейчас
он представляет лишь второстепенный интерес. Вариационное
исчисление фактически стало одним из разделов функционально-
функционального анализа и занимает в нем такое же место, как теория макси-
максимумов и минимумов в обычном анализе.
А раз так, то и не удивительно, что понятия, которые, как
принято думать, относятся к функциональному анализу или про-
происходят из него, на самом деле впервые возникли (в менее эле-
элегантной форме) в вариационном исчислении. Так, ряд основных
средств современной математики, — например, обобщенные функ-
функции («распределения») Л. Шварца, неравенство Юнга1), а также
выпуклые фигуры и их поляры—можно в зачаточной форме об-
обнаружить в классических методах вариационного исчисления.
Это означает, что вариационное исчисление выступает не толь-
только как область математики, но и как летопись математических
понятий. А поскольку сейчас прогресс в математике во многом
связан именно с появлением новых понятий, изучаемый здесь
предмет предоставляет нам насущно необходимое руководство к
дальнейшим исследованиям, и в этом отношении ни одна область
математики не идет ни в какое сравнение с вариационным исчи-
исчислением.
Что касается непосредственной связи вариационного исчисле-
исчисления с остальной математикой, то читатель скоро поймет, какую
важную роль играют в нем фундаментальные вопросы чистой
логики, а в теории Морса (гл. III) сможет услышать звучание
гомологии, что роднит ее как с алгеброй, так и с топологией.
Топологам, кроме того, известны важные приложения теории
Морса или методов, основанных на сходных идеях, к их пред-
предмету. Однако основные приложения вариационное исчисление на-
находит в анализе и геометрии либо в связи с получением опре-
определенных неравенств и оценок (как в теории дифференциальных
Уравнений с частными производными), либо при разработке качест-
качественно новых методов и понятий (как это было у Римана, при-
11 С редакционной точки зрения крайне непоследовательно сохранить здесь
Другую транскрипцию, нежели на титульном листе, тем более что речь идет о
близких родственниках. Однако можно было опасаться, что в «неравенстве
Янга» значительная часть читателей не узнала бы доброго знакомого. — Прим.
16 Вступление. Общие замечания и типичные проблемы
менившего к конформным отображениям, а также в теории по-
потенциала «принцип минимума Дирихле»—принцип, получивший
впоследствии обоснование в знаменитой работе Гильберта).
Из сказанного можно было бы заключить (несмотря на наше
упоминание о нуждах инженеров), что вариационное исчисление—
наука весьма «чистая», имеющая отдаленное отношение к при-
прикладной математике. Дело обстоит как раз наоборот. Не только
конкретные задачи вариационного исчисления играют основопо-
основополагающую роль в повседневной жизни и в таких областях, как
экономика, техника и т. п. (ведь, как уже говорилось, челове-
человечество старается действовать наилучшим образом в пределах тех
возможностей, которыми оно располагает), но и сама эта теория
всем своим развитием обязана нуждам оптики, а позднее нуж-
нуждам космических наук и других подобных вопросов.
Результаты, относящиеся к космическим наукам, в данной
книге излагаются отдельно от других в части под названием
«Оптимальное управление». Это никоим образом не означает, что
Они независимы от остального содержания; просто они сложнее,
и поэтому лучше излагать их позже, когда основные понятия
и методы уже разъяснены на более простом материале. Рассмот-
Рассмотрение этих вопросов представляет собой в сущности исследование
вариационных задач, известных как задачи Лагранжа и Больца.
Типичной проблемой космонавтики является, например, про-
проблема доставки управляемого аппарата на Луну. Соответствующая
вариационная задача (или, как мы здесь говорим, задача опти-
оптимального управления) состоит в доставке управляемого объекта
на Луну за наименьшее время или с наименьшими затратами.
Здесь проблема оптимизации возникает самым естественным об-
образом, и наш предмет играет поистине главную роль в косми-
космических науках.
§3
Постановка простейшей задачи и некоторые родственные
вопросы
Хотя все задачи на максимум и минимум из функционального
анализа принадлежат, собственно говоря, к вариационному исчис-
исчислению, до сих пор только небольшое число и притом довольно
специальных задач изучено подробно. Простейшую из них можно
сформулировать следующим образом (обозначения, которые мы
здесь используем, носят временный характер и в следующих
главах будут заменены другими).
Предположим, что задана функция / трех переменных. Рас-
Рассмотрим на плоскости (х, у) задачу отыскания минимума интеграла
C.1) 3(C)=U(x, у, y')dx
§ 3. Постановка простейшей задачи ff
на классе кривых С, соединяющих две заданные точки и имею-
имеющих вид у = у(х), где у(х) имеет производную у' (х). Мы пред-
предполагаем, что в подинтегральную функцию / вместо у, у' под-
подставлены у{х), у' (х). В этой задаче функция /, как уже отме-
отмечалось, задана, тогда как функция у должна быть найдена, если
это возможно, из условия минимума. Поэтому здесь 3 (С) зависит
от неизвестной функции у = у(х), так что перед нами задача на
минимум из функционального анализа.
Эта задача станет геометрически наглядней, если мы будем
рассматривать кривые, заданные параметрически функциями
x{t), y(t) на соответствующих /-интервалах, на которых эти
функции имеют производные x(t), y(t). В этом случае интег-
интеграл 3 (С), подлежащий минимизации, имеет вид
C.2) g(C) = $F(x,y,i.y)dt.
где вместо х, у, х, у следует подставить функции x(t), y(t),
определяющие кривую С, и их производные x(t), y{t). Опять
предполагается, что кривые С имеют заданные концы, и интег-
интегрирование производится на соответствующем /-интервале. Функ-
Функция F считается заданной, однако теперь она должна удовлет-
удовлетворять условию однородности
C.3) F(x, у, ox, oy) = oF(x, у, х, у)
для о^О. Это условие обеспечивает зависимость интеграла C.2)
от самой кривой С, а не от выбора частного параметрического
представления x(t), y(t) этой кривой.
На практике / или F обычно бывают довольно простыми
функциями; например, если
f=y l+y'* или F =
то интеграл 3{С) определяет длину кривой С. Для начала мы
можем предположить, что функции / и F дифференцируемы
столько раз, сколько нам потребуется. Из дифференциального
исчисления мы помним, что, согласно формуле Эйлера для одно-
однородных функций, из условия C.3) следует тождество
C.4) xFi + y'Fy = F.
В дальнейшем будет удобно переходить от функции / к функции F,
или наоборот, полагая f(x, у, y) — F(x, у, 1, у'), т. е. отож-
отождествляя параметр t с переменной х. В таком случае частную
производную F^ для тех же переменных можно отождествить
с f у, a F ■ вычислить из C.4), что дает
18 Вступление. Общие замечания и типичные проблемы
Это последнее выражение довольно важно, оно является следст-
следствием условия однородности C.3).
Конечно, задача с функцией / не эквивалентна задаче с функ-
функцией F. В первой из них минимум ищется только относительно
тех кривых С, которые обладают представлением вида у(х); это
эквивалентно ограничению х@>0.
В любом случае наша задача состоит в выявлении опреде-
определенной кривой С, которая доставляет искомый минимум, и этим
мы похожи на читателя детективного романа, задача которого —
выявить преступника, если он может это сделать. Однако в по-
последнем случае читатель иногда бывает предупрежден о приметах
наиболее подозрительной личности: «Остерегайтесь одноногого
моряка». И, разумеется, рано или поздно эта личность проявляет
свой злодейский характер.
В этой главе мы тоже снабдим читателя довольно простым
рецептом для выделения кривых С, которые будут у нас временно
на положении подозреваемых. Этот рецепт принадлежит Эйлеру;
он устанавливает таинственную связь нашей задачи с некоторым
дифференциальным уравнением или парой дифференциальных
уравнений, а именно уравнениями C.6) или C.7), приведенными
ниже. При этом Эйлер думал и, как оказалось, совершенно
напрасно, что тем самым он решил задачу. Мы поговорим об
этом подробнее, а пока хотим напомнить читателю, что каждый
юрист понимает разницу между арестом подозреваемого и фак-
фактическим доказательством его виновности.
Рецепт Эйлера заключается в следующем: ищи подозрительные
кривые среди решений дифференциального уравнения
C-6> i(fs)=fv
или пары дифференциальных уравнений
<3-7) UF*) = F" It(Fi) = Fv
Заметим, что уравнение C.6) соответствует второму из урав-
уравнений C.7); однако легко убедиться, что C.6) можно записать
(после умножения на у') также и в виде
C.8) i(f-y'M = fx,
что соответствует первому уравнению C.7). Таким образом, два
уравнения C.7) не являются независимыми. В вариационном
исчислении кривая С, удовлетворяющая уравнению C.6) или
уравнениям C.7), называется экстремалью. Эйлер предлагает,
таким образом, считать экстремали подозрительными кривыми.
На данной стадии мы абсолютно никак не будем обосновывать
это подозрение; вскоре мы даже подвергнем его самой придир-
§ 3. Постановка простейшей задачи ]9
чивой критике. Однако если нам удастся доказать, что какая-то
подозрительная кривая действительно доставляет искомый мини-
минимум, то уже неважно, сколь шаткими были первоначальные
основания для подозрения. Точно так же преступник, вина ко-
которого уже доказана, едва ли может апеллировать на том осно-
основании, что вначале он был арестован при недостаточных уликах.
Однако тут есть разница: каждый понимает, насколько может
помочь обвинителю то, что настоящий преступник находится под
арестом, но совсем неясно, как мы можем использовать наши
подозрения в вариационной задаче.
В самом деле, предположим, что мы подозреваем только одну
кривую Со с заданными концами А, В. Чтобы удостовериться
в искомом свойстве минимальности, мы должны еще сравнить
эту кривую с каждой другой кривой С, имеющей те же концы,
и показать, что
т. е. что
\f{x, у, y')dx^t^f{x, у0, y'0)dx,
где у, у0—функции, определяющие С и С„ соответственно (для
простоты мы предположили, что кривая задана в непараметри-
непараметрическом виде). Совсем не ясно, чем облегчили эту задачу отыска-
отыскания минимума в функциональном пространстве наши подозрения.
В этом месте читатель, несомненно, вмешается, причем с пол-
полным правом, и заявит, что существует по крайней мере один
случай, когда желаемое неравенство легко проверяется, а именно,
когда при любом х для всех у, у' мы имеем
/(*, У, y')>f(x, Уо. Уд-
К сожалению, в конкретных вариационных задачах последнее
неравенство практически никогда не выполняется. Так, если f
имеет вид j/l+y'8, то оно справедливо только при у'0 = 0, т. е.
когда у0 постоянна и Со параллельна оси х.
А раз так, нам остается только повторить вопрос, поставлен-
поставленный выше: что толку в простом подозрении, которым нас снаб-
снабжает рецепт Эйлера? Однако не будем отвергать его слишком
поспешно. Стараясь найти применение этому подозрению, мы
пока что потерпели неудачу, но ведь такая ситуация часто воз-
возникает при математических исследованиях. Каждый математик
может столкнуться с ней на некотором этапе своей работы: у него
есть трудная задача, и он догадывается, каково ее решение;
вопрос заключается в том, как использовать эту догадку.
В нашем случае можно дать ответ на этот вопрос, и притом
довольно поучительный. Идея, на которой он основан, чрезвы-
чрезвычайно стара и пришла в голову нескольким математикам неза-
20 Вступл ение. Общие замечания и типичные проблемы
висимо. Затем в течение двух веков о ней не вспоминали. Эта
идея будет играть особенно важную роль позднее, в вопросах
оптимального управления.
Рассмотрим не одну задачу минимизации, а семейство таких
задач, возникающих, когда подинтегральная функция / и один
конец А остаются фиксированными, а второй конец занимает
различные положения на плоскости (х, у). Предположим теперь,
что на основании рецепта Эйлера или каких-нибудь других сооб-
соображений для каждой точки В мы подозреваем свою кривую Со,
зависящую от В (и оканчивающуюся, разумеется, в этой точке).
При этом значение интеграла 3 (Со) будет функцией от В. На-
Назовем эту функцию «подозреваемым минимумом» и обозначим ее
через S(B). Очевидно, что S(B) обращается в нуль в точке А,
поэтому ее можно записать также в виде разности S(B)—S(A).
Мы будем писать S(x, у) вместо S(В),.когда В—точка (х, у),
и ф(*. У, У') вместо полной производной Sx + y'Sy. Тогда вдоль
любой кривой С, соединяющей точки Аи В, разность S(B)—S(A)
является интегралом от ф. Отсюда следует, что искомое нера-
неравенство 3 (С) ^ 3 (Со) может быть записано в виде
$
с
Это неравенство безусловно выполняется, если для всех х, у, у'
C.9) f(x, у, у')>ф(*. У- У')-
Здесь ф, как было условлено,— полная производная Sx-\-y'Sy.
Подобное же рассуждение применимо и для параметрической
задачи, только C.9) следует заменить неравенством
F {х, у, х, у) > Ф (х, у, х, у),
где (D = xS +ySy.
На этой стадии читатель еще не в состоянии решить, следует
ли в какой-то конкретной задаче надеяться на выполнение нера-
неравенства C.9) либо его параметрического аналога, или на это не
приходится рассчитывать. Поэтому мы проверим, как обстоит
дело, на некоторых классических задачах.
Наши рассуждения здесь строятся по общему принципу, ко-
который в равной мере применим и в юридической практике: чтобы
использовать для обличения преступника имеющееся подозрение,
постарайтесь заменить его более широким подозрением, которое
легче проверить.
§ 4. Экстремали в некоторых классических задачах 21
§ 4
Экстремали в некоторых классических задачах
Рассмотрим три задачи с закрепленными, но не фиксированны-
фиксированными точно концами кривых, сначала в непараметрическом виде. В
этом параграфе мы просто выявим подозрительные кривые, следуя
рецепту Эйлера, т. е. определим экстремали. Это означает, что
мы проинтегрируем некоторые элементарные дифференциальные
уравнения; но так как эта книга не является курсом по решению
таких уравнений и мы хотим избежать неприятных вычислений,
то мы просто постараемся покороче получить решения, известные
наперед. Обычно этот путь связан с некоторой подстановкой.
Как только экстремали станут известными, мы будем готовы
к проверке нашего более широкого подозрения, но отложим ее
до § 5.
(а) «Кратчайшее расстояние»: / = у
Здесь, согласно уравнениям C.6) и C.8), каждая из величин
/V. /—y'tu"' равных соответственно у'if, l/f, постоянна вдоль
экстремали, так что и у' постоянна. Таким образом, экстрема-
экстремалями являются невертикальные прямые. Для параметрической
задачи экстремалями являются произвольные прямые; в самом
деле, в этом случае F = л/ х2-{-у^, a Fi, Fy постоянны соглас-
согласно C.7). Таким образом, здесь рецепт Эйлера согласуется с эле-
элементарной геометрией.
(Ь) «Брахистохрона»: [= piy .
Задача возникает при поиске такой формы проволоки, чтобы
надетое на нее колечко соскал ьзывало по ней под действием силы
тяжести из одной заданной точки в другую за наименьшее время.
Мы, конечно, ограничиваемся кривыми, лежащими в полуплос-
полуплоскости х^О, и для удобства интерпретации направляем ось х
v л?2 -4- tfl
вертикально вниз. Заметим, что здесь F = -—,._ .
У х
Вдоль экстремали /у (или Fу) постоянна. Если мы обозначим
эту постоянную через с, а через s—длину дуги, то, с одной сто-
стороны, ~oir — cVx, а, с другой, ~- = s\nu, где и — угол между
касательной и осью х, так что cosu = -^-. Отсюда вытекает, что
du { J
Следовательно, вводя обозначения а = ^-с~г, t = 2u, получаем,
22 Вступление. Общие замечания и типичные проблемы
что наши экстремали являются циклоидами
2M = a(l—cost),
у = 2а(и—YS'm2u]+b = a(t — sin t) + b.
Однако при этих вычислениях мы пропускаем случай с = 0,
который, очевидно, дает решения у= const; эти вертикали тоже
должны быть включены в число экстремалей.
(с) «Минимальная поверхность вращения»: f=\y\Vl +У>2-
Эта задача является частным случаем знаменитой задачи
о наименьшей площади, или задачи Плато, представляющей собой
двумерный аналог задачи (а). Задача Плато в своей общей фор-
формулировке все еще является предметом глубоких современных
исследований. Она представляет интерес также и для физиков,
так как ее решения можно реализовать посредством мыльных
пленок. Рассматриваемый здесь частный случай—это задача о ми-
минимальной поверхности вращения; мы ищем форму меридиана
такой поверхности. Поставленную так задачу можно найти во
многих источниках; впрочем, большинство из них теперь не имеет
особенной ценности и может пригодиться только для иллюстрации
тех затруднений, которые стоят на пути вариационных методов.
Согласно C.8), f—у'\у- постоянна, так что можно написать
\У\
а
Значит, уФО при афО и без ограничения общности можно поло-
положить у =а ch и, откуда у' — и'a sh и. Далее,
Значит, shu = ±i/' и, следовательно, ы'а = ±1. Интегрируя это
выражение, мы получим, что
и = ± (х—хо)/а
и, значит, у = a ch (х— хв)/а. Экстремалями являются цепные линии.
В наших вычислениях был пропущен случай у' = 0, ы = 0,
в котором величина и а остается неопределенной (или скорее
равной 0) и который дает дополнительное решение у = const. Это
лишнее решение появилось из-за дополнительного множителя у'
в уравнении C.8) и не удовлетворяет уравнению C.6), если
только не сводится к у = 0. Значит, ось х, ограничивающая нашу
полуплоскость, является еще одной подозрительной кривой с нуле-
нулевой площадью поверхности вращения.
Для параметрической задачи при F = | у | у хг-\-у* получаем
дополнительные решения х — const, которые удовлетворяют обоим
уравнениям C.7).
§ 5. Решение задач (а), (Ь), (с) 23
Только теперь, когда мы очертили круг подозреваемых в каж-
каждой из трех задач, начинается по-настоящему их решение.
В этот момент читатель, возможно,- вмешается и спросит:
«А нельзя ли действовать попроще? Вместо того чтобы ограни-
ограничиваться подозрениями и принимать на веру рецепт Эйлера,
почему бы нам не избавить себя от лишних хлопот, доказав,
что Эйлер был прав?» Он даже может добавить: «Знаете ли,
это нетрудно; я видел доказательство в другой книге».
В действительности, как мы увидим, дело обстоит совсем не
так просто, и метод Эйлера имеет серьезные недостатки как в тео-
теории, так и на практике. Вычисления, которые мы проведем, не
доставят нам удовольствия, но могут многому научить. Мы уви-
увидим, что необходимо заглянуть глубже. Сегодня в математике
и, вероятно, еще в большей степени в ее приложениях нет места
поверхностным и недостаточно обоснованным соображениям. Для
космических наук это слишком рискованно и слишком дорого
обходится; все до последних мелочей должно быть проверено
и перепроверено. Некоторые учителя могут удовольствоваться
быстрым ответом, но природа — более строгий экзаменатор.
Конечно, было бы замечательно, если бы мы могли указать
на простую связь между нашим предметом и решением элемен-
элементарных дифференциальных уравнений, если бы мы и в самом
деле могли сказать: «Смотрите, как полезна эта простая связь!
Вы узнаете в задаче о кратчайшем расстоянии решения, которые
всем известны; однако этим же методом решаются значительно
более сложные задачи, такие, как (Ь) и (с), которые долгое время
занимали умы выдающихся математиков прошлого». Возможно,
Эйлер и был столь радужно настроен, однако сегодня мы более
критичны.
§5
Решение задач (а), (Ь), (с)
Мы решим задачи (а) и (Ь); задача (с) будет решена только
при определенных ограничениях. В дальнейшем мы не будем
интересоваться побочной информацией и вообще постараемся све-
свести к минимуму неприятные вычисления, аналогично тому, как
мы поступили при нахождении экстремалей.
В задачах (а) и (Ь) за начальную точку примем начало коорди-
координат, а в задаче (с)—точку @, 1). Это не приводит к потере общно-
общности. Функции S и ф определяются как и раньше, а через Ф мы
обозначим функцию xSx-T-ySy. Наша цель состоит в проверке,
если это окажется возможным, неравенства вида / ^ ф, или
Р^Ф. Непосредственная проверка оказывается невыполнимой
в задачах (Ь) и (с), но для этих задач можно заменить ее эквивалент-
эквивалентными рассуждениями. Ввиду сказанного в предыдущем параграфе,
24
Вступление. Общие замечания и типичные проблемы
неравенства, которые мы получим, завершат проверку свойства
минимальности в каждом из трех случаев.
(а) Так как для этой задачи подозрительными являются пря-
прямые, проходящие через начало координат, то S~\rxi-\-y% и, сле-
следовательно, q> — (x-\-yy')/S. Искомое неравенство /^<р в этом
случае имеет вид х + уу'^. \/'x2 + yt-Vl + у"г и представляет со-
собой неравенство Шварца. Аналогично проверяется неравенство
5Ф
(Ь) Для того чтобы определить функцию S(x, у), мы должны
для каждой точки (*, у) иметь ровно одну подозрительную кри-
кривую, оканчивающуюся в этой точке. Однако циклоиды, проходя-
проходящие через начало координат, могут пересекаться. Поэтому мы
должны каким-нибудь образом сократить число кривых, подозри-
подозрительных в соответствии с рецептом Эйлера. Для этого хорош
любой способ, при условии (в этом и заключается трудность), что
в конце концов мы докажем виновность оставленных под арестом
подозреваемых. Поэтому мы сохраняем только дуги первой арки
каждой циклоицы, выходящей из начала координат. Далее, чтобы
включить полуось г/ = 0 в качестве предельного случая, зададим
арку циклоиды уравнениями
E.1)
— cos ест
ат —sin ах
где т>0, |а|т<2л, считая, кроме того, что х = -х-т*, у = 0
при <х = 0. Подозрительными кривыми являются начальные дуги
арок циклоид, полученные при а=const.
Область (а, т): т > 0, | а |т < 2л.
Для нахождения подозрительной кривой, оканчивающейся в за-
заданной точке (х, у), нужно решить уравнения E.1). В резуль-
результате мы получим постоянное значение величины а для этой подо-
§ 6. Решение зада» (а), (Ь), (с) 25
зрительной кривой и отвечающий ей интервал @, т). А тогда
мы сможем вычислить S и другие нужные нам величины.
Поскольку мы хотим решить уравнения E.1), рассмотрим отоб-
отображение (а, т)—*■(*, у), которое они определяют. Назовем его
отображением E.1). Согласно теореме Тейлора, функции, задаю-
задающие это отображение, разлагаются в ряды по степеням а и т,
причем члены с отрицательными степенями отсутствуют. Отсюда
следует, что они непрерывны и имеют непрерывные производные
всех порядков в области изменения (ос, т), включающей, конечно,
прямую <х = 0. Далее мы покажем, что отображение E.1) взаимно
однозначно и что его якобиан не обращается в нуль. Это озна-
означает, что обратное отображение (х, у)—>-(а, т) также имеет произ-
производные всех порядков, которые можно вычислить но цепному
правилу.
С этой целью положим я = <х~2, t — ат, считая сначала, что
а =7^0. Эти формулы задают, очевидно, взаимно однозначное
отображение каждой половины области (а, т) на полуполосу а > 0,
0 < / < 2я. Якобиан этого отображения равен —2сс~2. Теперь мы
должны взять композицию этого отображения с отображением
(a, t)—*(л;, у), определяемым формулами
х = а{\—cos?), y^=ct(t—sin t),
якобиан которого равен aq(t), где
Здесь q (t) не обращается в нуль при 0 < 11 | < 2я, так как
UgVs'l >|7*'1- Кроме того, <7(/)~f*/12 для малых t. Следова-
Следовательно, якобиан отображения E.1) равен —2^(ат)/а4; таким обра-
образом, он стремится к —т4/6, когда а—*0, и, значит, не обращается
(х,У)
в нуль. Заметим, наконец, что отображение (a, t)—*(x, у) взаимно
однозначно отображает полосу 0 < / < 2л в положительный квад-
квадрант (л\ у). В самом деле, прямая, выходящая из начала коорди-
координат и проходящая через точку (х, у) этого квадранта, пересекает
первую арку фиксированной циклоиды только в одной точке Р,
и, значит, только одна из циклоид содержит точку (х, у) на
26 Вступление. Общие замечания и типичные проблемы
своей первой арке, так что величины a, t однозначно опреде-
определяются точкой (х, у). [Это свойство арки циклоиды можно вывести
из ее выпуклости или просто из того, что вдоль нее отношение
У t-slut , .
к \-cost ё{-1)
является возрастающей непрерывной функцией от t в промежутке
О < 7г^ < я, так как ее производная
положительна.] Аналогично, полоса 0<—t < 2л взаимно одно-
однозначно отображается в симметричный квадрант, так что (а, т) —-*
—>(х, у) является взаимно однозначным отображением области
(а, т) в полуплоскость. ' .
Итак, отображение E.1) само хорошее, имеет хорошие произ-
производные и, более того, столь же хорошее обратное отображение.
К несчастью, все это нисколько не помогает практическому реше-
решению уравнений E.1). Таким образом, за непосредственное вычис-
вычисление функции S(x, у) браться не стоит.
Мы избавимся от этой трудности, используя хорошее преобра-
преобразование E.1) для того, чтобы перенести всю задачу в область (а, т).
Так как мы делаем это частично с помощью вспомогательных
переменных (a, t), то всюду, где это потребуется, точкой будет
обозначаться дифференцирование по параметру, необязательно обо-
обозначенному буквой t. Используя подстановку, индуцированную
отображением (a, t)—>-(x, у), получим
хг + у2 = Ха2 + 2[ша{+ \аНг,
где Я = A— cos02 + (*—sinO2, [i = t(l — cost), v = sin2rf +
+ (I—cosfJ = 2(I—cost). Разделив это выражение на х, полу-
получим, что F% имеет вид
где Л = Я/0—cos 0- Переходя к а, т, получаем
где Q(t) — A—1/2t2. Непосредственные вычисления дают
9Л — 4~4cos<~4<sin<-f 2<2 _ . U sin / ,2 1-fcos/
Ч~ 1-cos/ l-cos/+
1-cos/ l-cos/+ 1-cos*
sin f <2sin2<
, 4^ sin f <2sin2< _/ <sin< \a_
1— cost ■" A — cos 0s ~\ 1— cost) ~~
П — y^ctg-g-fj ~ t*/36 для малых /.
<£-
§ 5. Решение задач (а), (Ь), (с) 27
Таким образом, F становится функцией F*(a, т, а, т) вида
у 2рга2 + 2т2, где р —хорошая функция неременных (а, т).
Формулируя нашу задачу на языке функции F*, зависящей
от переменных а, т, мы замечаем, что отображение E.1) можно
непрерывно продолжить на граничную прямую т = 0 и что эта
прямая преобразуется в точку к = у -— 0.
Это означает, что кривая С, выходящая
из этой точки, является образом кри-
кривой С* на плоскости (а, т), которая
не обязательно начинается в определен-
определенной точке на прямой т = 0, но должна
лишь приближаться к ней при движе- **" ' *
нки от конца к началу. Она может,
например, приближаться к целому отрезку этой линии. Интеграл
3 (С) от F вдоль С можно представить как интеграл 3* (С*) от
F* вдоль этой «полуоткрытой» кривой С*.
В качестве подозрительных мы теперь берем кривые а = const.
Подозреваемый минимум интеграла 3* (С*), вычисленного вдоль
кривой С*, которая заканчивается в заданной точке (а, т) нашей
области, является функцией 5* (а, т). Эта функция S* вычис-
вычисляется без труда, так как на кривой а = const мы имеем F* = \^2t
и потому находим просто, что S' — Y^t. Отсюда полная произ-
производная Ф* равна |/2т. Очевидно, что
F* > Ф*.
Следовательно, 3* (С*) ^ S*, что равносильно неравенству 3 (C)^S.
Возможное отсутствие начальной точки на кривой С* нигде не
влияет на рассуждения.
Длина проделанных рассуждений довольно типична. У чита-
читателя не должно быть иллюзий: если задача не подобрана спе-
специально для экзаменов, то вряд ли она имеет короткое решение.
В этой задаче мы видим не только то, что подозреваемые
виновны, но также и то, что ими круг виновных исчерпывается.
В самом деле, коэффициент 2рг не обращается в нуль в обла-
области (а, т), так что F* > Ф*, если а Ф 0. В частности, исключен-
исключенные нами экстремали, которые содержали более одной арки цик-
циклоиды, не могут доставлять минимум, так как они соответствуют
в области (а, т) кривым, содержащим участки, на которых а не
равно постоянной. Это ясно показывает, что задача не сводится
только к нахождению экстремалей; следует по крайней мере
исключить еще те экстремали, которые не доставляют минимума.
Позднее мы увидим, что существуют даже задачи, в которых
экстремаль, соединяющая две точки, единственна, и все-таки не
Доставляет искомого минимума.
28 Вступление. Общие замечания и типичные проблемы
(с) Эта задача во многом похожа на задачу (Ь), но в ней есть
дополнительные трудности. Прежде всего мы убедимся в том,
что цепные линии, полученные в качестве экстремалей, проходя-
проходящих через @, 1), покрывают только часть полуплоскости у > О,
а затем—в том, что они покрывают эту часть дважды. Обозначив
постоянную л;0 через —оса и использовав условие прохождения
цепных линий через @, 1), получим, что а = ^— t
E.2) х = Ци, а), у = ц{и, а),
где и, а пробегают все действительные значения и тде
{. и—a ch и
На каждой цепной линии а—постоянная, а и—параметр. Общая
точка @, 1) соответствует значению ы=а, а низшая точка—зна-
точка—значению и = 0. Эта низшая точка находится в положительном квад-
квадранте при а < 0 и в квадранте х < 0, у > 0 при а > 0.
Так же как в задаче (Ь), следует рассматривать равенства E.2)
как определение преобразования (и, а)—*(л;, у) с якобианом
/ = £„т}а—ia'Pu! B новых переменных линейный элемент имеет вид
х2+у% = "ко? + 2цсш + vu2,
Причем Коэффициенты Л = || + Т]а, ^ = lain + Т]а Ци ,
shau Ch2u
удовлетворяют, конечно, тождеству >л>—\i2 = J*. Нам понадобится
явное значение якобиана J. Для его вычисления введем функцию
U = Jch3a и получим
)
= (!)(—chusha)—(—cha — [и—a]sha)(shu) =
— sh usha {—cth и -\- cth a -f- и—a} =
= shusha{g{u)—g{a)\,
где через g(t) обозначена функция t—ctht.
Наши цепные линии пересекают вертикаль х = const при
h и в этих точках
где для каждого фиксированного х Ф 0 величина <р (а) положи-
положительна и стремится к 4-°° вместе с |<х|, так что ее минимум поло-
положителен. Для определения точки минимума положим <р'(<х) = О.
§ 5. Решение задач (а), (Ь), (с)
29
Выражение <р' (a) ch2 а можно записать в виде
,ch<x sh и A -f*sha)—ch ush a=sh ush a {(cth a-\-u—a)—ctYiu)=U.
Рассматриваемый минимум не может иметь места при ы = О, так
как в этом случае U — — sha, что не равно нулю при хфО).
Поэтому он достигается там, где g(u)=g{a), ифО. Ввиду того
что.£@ = *—cth t имеет положительную производную
g' (t) = 1 — A —cth8 0 = cth81 > О,
эта функция, очевидно, возрастает от —оо до +оо на каждом
из интервалов (—с», 0) и @, +оо) и асимптотически близка к t
при t —>■ ± оо сверху для отрицательных t и снизу для положи-
положительных t. Таким образом, уравнению g (t) = g (a) удовлетворяют
два значения t = a, f = a* переменной Л Здесь а* можно рас-
рассматривать как функцию а* (а), которая возрастает от —оо до 0,
когда 0 < a < -f оо, и от 0 до + с», когда —оо < a < 0. Отсюда
следует, что геометрическое место точек, удовлетворяющих урав-
уравнению g{u) = g(a) на плоскости (и, а), содержит, кроме линии
и = а, еще две ветви, для которых координатные оси являются
асимптотами и которые расположены во втором и четвертом квад-
квадрантах. Обозначим через D* область плоскости (и, а), ограничен-
ограниченную этими двумя ветвями, а через D—область плоскости (jc, у),
которая является образом области D* при отображении E.2).
Далее, пусть Г является образом пары кривых, ограничивающих
область D*.
Очевидно, что Г состоит из низших точек пересечения цепных
линий E.2) с вертикалями х = const. Таким образом, область D
лежит над Г и каждая цепная линия, кроме одной, для кото-
которой a = 0, имеет ровно одну общую точку с Г, а именно ту, для
30
Вступление. Общие замечания и типичные проблемы
которой ы = а"(<х). При этом каждая цепная Линия остается над Г
и, следовательно, Г—огибающая цепных линий E.2).
Цепные линии E.2) дважды покрывают область D. Чтобы она
была покрыта один раз, нужно взять дуги этих цепных линий,
соответствующие частям горизонталей а = const, лежащим в об-
области D*. Однако мы должны исключить вертикаль х — 0, у ко-
которой покрыта, и притом всеми цепными линиями, только одна
точка @, 1).
Все это уже показывает, что с помощью цепных линий мы не
можем решить задачу (с), если заданный второй конец кривых
не является точкой области D или ее границы Г. Поскольку мы
все же хотим выяснить, какую пользу можно извлечь из рецепта
Эйлера, видоизменим задачу (с), оговорив, что все рассматрива-
§ 5. Решение зада» (а). (Ь), (с) 31
емые кривые и, в частности, их вторые концы должны лежать
в области D. Возможно, это ограничение сильнее, чем необходимо
для достижения нашей цели, однако оно обладает тем преиму-
преимуществом, что исключает одну из двух цепных линий, проходящих
через каждую точку (х, y)£D, а именно ту, которая касается
огибающей Г между точками (х, у) и @, 1). Следовательно, для
каждой точки (х, у), принадлежащей области D, но не лежащей
на ори у, мы имеем ровно одну подозрительную кривую, соеди-
соединяющую эту точку с точкой @, 1). Более того, теперь E.2) вза-
взаимно однозначно отображает область D* без линии и—а на об-
область D без оси у.
Имея все это в виду, мы теперь, как и в задаче (Ь), вычис-
вычисляем не подозреваемый минимум S(x, у) и его полную произ-
производную Ф, а соответствующие величины для переменных и, а.
Подинтегральным выражением будет функция F*(u, а, и, а), по-
подозреваемым минимумом S*(u, а), а его полной производной
O* = S^u-l-S^a. Далее, подозрительными являются линии a=const,
идущие от и = а к соответствующим точкам области D*. Мы
имеем
F* = г] У hx2 + 2\xat + v't2,
Так как v = ti2, то SH = v. (Это первое совпадение.) Нам нужно
найти также величину Sa, и мы обнаруживаем, что она равна ц
(второе совпадение). В самом деле,
dt
- 1 д Г dt »•
hdjh '
да J ch^cc ~chccda J choc
о о
вычитая это из очевидного соотношения
_д_ с ch t ,, _ l й_ Г - >•»- > jj
tojch^a" chaaaj cha "*»
о о
находим, что
Или 1 + fC ch2/d/J (ch-*a)' = ch-8a-f { {dt\ - -g-{ch-« a)'.
32 Вступление. Общие замечания и типичные проблемы
равно
1 д fu—a+shuch u\ _
choc ~дп \ cha (~
д {и~и\ , sh и д fch и
{) + {
Ж {!h£) + 5TSЖ
Ввиду того что v = тJ, имеем
= (Xv —
и, следовательно, F* ^ Ф*, где при а Ф 0 равенство имеет ме-
место в области D* только на линии и=а. Рассуждая так же, как
в задаче (Ь), получим, что в каждой из двух половин, на кото-
рые область D разделяется осью у, лаши
{и, «) цепные линии доставляют минимум вели-
величине 3 (С) относительно кривых С, распо-
расположенных в рассматриваемой половине и
соединяющих точку @, 1) с заданной точ-
точкой (х, у). (Конечно, так же как в за-
задаче (Ь), каждая кривая С является об-
образом кривой С* в D*. которая может не
иметь начальной точки, но асимптотически
приближается к части линии и = а.)
В то же время мы видим, что вторая цепная линия, которая
касается огибающей между точками @, 1) и (х, у), не может
доставить минимум, так как при помощи взаимно однозначного
отображения E.2) в каждой половине области D* ее можно
представить как образ кривой С*, состоящей из горизонтальной
части на уровне а* (и оканчивающейся на соответствующей ветви
кривой g(u)—g(a)) и не горизонтальной части, оканчивающейся
в точке (и, а). Следовательно, на этой кривой а не может быть
тождественным нулем, так как аф<х*.
Ограничение, наложенное на кривые С и заключающееся в том,
что эти кривые должны лежать в половине области D, можно
ослабить, позволив кривым пересекать ось у, но доказательство
в этом случае сложнее. (В задаче (Ь) мы столкнулись с подобной
трудностью при присоединении полуоси у = 0, х > 0 к семейству
экстремалей.) Если мы снимем это ограничение с кривых, распо-
расположенных в области D, а также позволим вторым концам лежать
вне D, то рецепт Эйлера не будет выделять подозрительные
кривые. Однако решение все-таки существует, во всяком случае
в параметрической форме; оно имеет вид ломаной линии, обра-
образованной двумя вертикальными отрезками, соединенными частью
оси х. В этом случае минимальная поверхность вращения, опре-
определяемая этим решением, распадается на два круговых диска.
Оказывается, что эта ломаная линия доставляет минимум и в том
§ 6. Лемма Эйлера—Лагранжа и обобщенные функции 33
случае, когда второй конец находится в D, но довольно близко
к Г. Доказательства этих фактов в принципе достаточно просты,
но мы должны пропустить их, ибо существует предел тому, что
стоит делать голыми руками.
§6
Лемма Эйлера — Лагранжа и обобщенные функции в смысле
Шварца
Этот параграф в основном является историческим отступле-
отступлением, хотя он и поможет нам удовлетворить читателя, интере-
интересующегося обоснованием рецепта Эйлера. В этой книге обобщен-
обобщенные функции («распределения») в смысле Шварца нам, конечно,
не нужны, и мы не будем ими пользоваться. Сведения из исто-
истории никогда не являются необходимыми, даже когда, как в этих
лекциях, они характеризуют этапы развития понятий.
Как уже было сказано, обосновывать рецепт Эйлера нет не-
необходимости: наши решения не станут от этого более совершен-
совершенными. Кроме того, в гл. II мы изложим теорию, в которой уже
не будет подозрений и странных совпадений. Но все же приятно
было бы иметь обоснование: это позволило бы лучше мотивиро-
мотивировать догадки, использованные нами при решении задач (а), (Ь)
и (с) (впрочем, последняя была решена только частично). В конце
концов не такие уж мы утилитаристы.
В лемме Эйлера—Лагранжа, на которой основан вывод диф-
дифференциального уравнения Эйлера C.6), впервые нашло приме-
применение то, что мы теперь называем обобщенными функциями (или
«распределениями») в смысле Шварца.
Что же такое обобщенные функции?
Здесь мы ответим на этот вопрос лишь частично, определив
обобщенные функции только на интервале @, 1), а не на всем
евклидовом пространстве. На самом деле ответов, по-видимому,
почти столько, сколько существует на свете математиков. О важ-
важности вопроса свидетельствует тот факт, что рано или поздно
почти каждый математик предъявляет права на нечто вроде ти-
титула, свидетельствующего о его принадлежности по крайней мере
к одному из следующих (необязательно взаимоисключающих)
классов: «тех, которые знали все это раньше», и «тех, которые
сделали это намного лучше». Третий интересный класс состоит
из одного-единственного члена — первого рецензента книги Лора-
Лорана Шварца в Mathematical Reviews. Его рецензию ни в коем
случае не следует упускать из виду: в ней нет и намека на цен-
ценность этой книги!
Ответ на вопрос, что представляют собой обобщенные функ-
функции в смысле Шварца, нужно искать не в более поздних обзорах,
а в самой книге Лорана Шварца. В математике новые понятия
2 N> I274
34 Вступление. Общие замечания и типичные проблемы
и новые теории следует изучать по первоисточникам, которые
почти всегда намного богаче идеями. Последующие изложения
могут быть более простыми или более продвинутыми, но в пер-
первых теряется богатый фон лежащих в основе идей, а вторые
лишаются первоначальной непосредственности. Но, конечно, мно-
многому можно научиться и по этим последующим работам.
Можно сказать, что обобщенные функции возникли тогда,
когда был осознан тот факт, что важна не столько сама по себе
функция /(л), сколько ее влияние на другие функции. В этом
смысле функции очень похожи на людей. Можно считать, что
влияние функции / (х), определенной, скажем, на интервале @, 1),
на другую такую же функцию i)(x) измеряется величиной
Так же как в случае человеческих отношений, нас интересует
здесь влияние данного индивидуума f не на всех индивидуумов,
а только на «цивилизованных» индивидуумов ц. Функцию ц бу-
будем считать цивилизованной, если она дифференцируема беско-
бесконечное число раз и тождественно обращается в нуль в некоторой
окрестности каждого из концов 0 и 1. Это звучит как предъяв-
предъявление слишком больших требований к индивидууму; кажется,
что это определение подразумевает такую изысканность и такое
совершенство, какие для человека вообще недостижимы, а един-
единственной цивилизованной функцией может быть лишь тождест-
тождественный нуль. К счастью, мы увидим, что поиски такой цивили-
цивилизованной функции не столь безнадежны, как поиски идеальной
женщины или идеального мужчины.
Операция Tf, примененная к переменной цивилизованной
функции т], называется обобщенной функцией в смысле Шварца,
связанной с функцией f. Можно также получить производные
этой обобщенной функции, которые определяются следующим
образом: мы называем n-й производной обобщенной функции Тf
операцию DnTf, действие которой на цивилизованную функцию ц
задается выражением
где т](п) есть п-я производная функции ц и, следовательно, ци-
цивилизованная функция.
В теории обобщенных функций ключевую позицию занимает
следующая лемма:
F.1) Лемма Эйлера — Лагранжа. Пусть f, g—интегрируемые
функции, и пусть Tf—DTg. Тогда f = Dg.
§ 7. Варианты той же леммы 35
Равенство здесь, конечно, следует понимать как равенство
почти всюду. Это современная формулировка леммы. Однако чи-
читатель, мало знакомый с этими понятиями, может в различных
местах этих лекций пользоваться старой интерпретацией: считать,
что равенство выполняется всюду, если рассматриваемые функции
непрерывны, или всюду, кроме конечного числа точек, если они
ограничены и имеют не более конечного числа точек разрыва.
Лемма Эйлера—Лагранжа не только показывает, что произ-
производные обобщенных функций ведут себя аналогично производным
обычных функций; из нее следует также, что обобщенная функ-
функция Тj единственным образом определяет функцию /. Так, если
мы положим g = 0, f = fx—f2, то, согласно лемме, из равенства
Tfl = Tf9 вытекает, что fl = f2.
§7
Варианты той же леммы
Для получения уравнения Эйлера C.6) можно с одинаковым
успехом применить несколько слегка отличающихся одна от дру-
другой форм леммы Эйлера—Лагранжа. Эти формы соответствуют
различному выбору класса так называемых «пробных» функций,
которые играют роль цивилизованных функций предыдущего па-
параграфа. Это могут быть следующие классы: (а) рассмотренный
выше класс цивилизованных функций ц; (Ь) более обширный
класс, состоящий из бесконечно дифференцируемых функций £,
которые обращаются в нуль в двух концах; (с) подкласс класса
(Ь), состоящий из функций s'mBnnx), 1—cosBnnx), n — l, 2, ...;
(d) совершенно другой класс, состоящий из непрерывных кусочно-
линейных функций £, тождественно равных нулю в окрестностях
двух концов; (е) подкласс класса (d), состоящий из «пеньков»—•
функций, которые мы определим ниже.
Для каждого из этих классов пробных функций справедлива
G.1) Другая форма леммы Эйлера — Лагранжа. Пусть К(х),
р(х)—интегрируемые функции на интервале @, 1), и пусть
J (Я, (х)т(х) + ц(х)т# (*))<** = О
о
для каждой пробной функции т. Тогда Я = ц'.
Мы обозначим через G.1)(а), G.1)(Ь) и т.д. варианты утвер-
утверждения G.1), соответствующие выбору классов (а), (Ь) и т. д.
пробных функций. Форма G.1) (Ь) является собственно леммой
Эйлера—Лагранжа, тогда как G.1) (d)—удобная модификация,
предложенная Дюбуа-Реймоном. Во всех этих утверждениях
можно без нарушения общности положить А. = 0, что мы и сде-
2*
36 Вступление. Общие замечания и типичные проблемы
лаем. Общий случай сводится к этому частному подстановкой
ц + Л вместо ц, где Л обозначает неопределенный интеграл от
функции К; в самом деле, интегрируя по частям, получаем
Доказательство G.1)(Ь) и G.1)(с). Очевидно, что достаточно
доказать G.1) (с). Так как Я = 0, то по условию леммы
ц (х) cos Bппх) dx — \ ц (х) sin Bnnx) dx = О
о
для п—1, 2, .... так что все коэффициенты Фурье функции ц,
кроме постоянного члена, обращаются в нуль. Таким образом,
доказательство сводится к применению теоремы единственности
для рядов Фурье.
Если же читатель не знаком с последней теоремой, то из этих
рассуждений следует только, что она эквивалентна лемме G.1) (с),
однако мы не будем далее пользоваться этой формой леммы.
Доказательство G.1) (d) и G.1)(е). Достаточно доказать
G.1) (е). Однако сначала надо определить «пенек»: мы называем
так функцию о (л:), которая линейна в двух непересекающихся
с(х)
а
-замкнутых интервалах равной длины (a, a-\-h), (b—h, b), лежа-
лежащих внутри @, 1), причем тангенс угла ее наклона равен соот-
соответственно + 1 и —1, постоянна в замкнутом интервале (о + А,
b—К) и обращается в нуль вне открытого интервала (а, Ь). la-
каш образом, о зависит от выбора величин а, b, h. Мы должны
показать (так как К — О), что если
G.2) ^ р(х)а' (x)dx = 0 для каждой а,
о
то fi постоянна почти всюду. Равенство G.2) можно переписать
в виде
a+h Ь
•Si
fc-ft
\ n(x)dx— \
§ 8. Доказательство основной формы леммы 37
откуда, разделив интегралы на А и устремив А к 0, получим, что
для любых двух точек а, Ь, в которых функция ц (х) является
производной взятого от нее неопределенного интеграла, мы должны
иметь n(a) — [i(b). Это завершает доказательство.
Теперь-остается доказать только лемму G.1) (а), которая яв-
является перефразировкой леммы F.1). Это современный вид леммы,
и мы посвятим -ему следующий параграф. Читатель, конечно,
может пропустить его. [Однако просмотрите замечания, следую-
следующее за (8.4).]
§ 8
Доказательство основной формы леммы
Мы выведем лемму G.1) (а) из G.1)(е). Очевидно, что доста-
достаточно доказать следующую аппроксимациейную лемму:
(8.1) Лемма. Пусть \i интегрируема в интервале (О, 1), и
пусть а—тенек». Тогда для любого е> 0 существует такая ци-
цивилизованная функция т|, что
1
(8.2)
\\i(x)\o'(x)-i\'{x)\dx
В самом деле, при предположениях леммы G.1) (а), в кото-
которой мы опять подразумеваем, что Я = 0, член сц' в (8.2) обра-
обращается в нуль, и, значит, это неравенство эквивалентно G.2).
Доказательство леммы (8.1). Напомним, что т зависит от посто-
постоянных a, b, h. Построим цивилизованную функцию ц, которая
достаточно хорошо имитирует поведение функции о. Искомая
функция т] будет зависеть от дополнительной достаточно малой
постоянной б > 0. Для определенности предположим, что б < /г/2
и что для всех интервалов Л длины б выполняется неравенство
(8.3)
Ввиду непрерывности неопределенного интеграла от [ ц |, нера-
неравенство (8.3) будет иметь место для всех малых б.
Фактическое построение соответствующей функции ц тоже
относится к ключевым моментам в теории обобщенных функций,
а ключом к этому построению в свою очередь является одно
простое свойство функции
(8.4) ехр (— 1/хг).
Вопросы, навеянные этим свойством, экзаменаторы-математики
часто задают на младших курсах будущим докторам различных
38
Вступление. Общие замечания и типичные проблемы
наук, так как это помогает исправить их интуитивные представ-
представления посредством убедительного и наглядного контрпримера.
Оно состоит в том, что если доопределить функцию (8.4), при-
приравняв ее нулю в начале координат, то она не только будет не-
непрерывной со значением 0 в этой точке, но будет иметь в начале
координат производные всех порядков с тем же самым значени-
значением 0. Отсюда следует, что функция не определяется однозначно
своим рядом Тейлора и что много разных функций могут иметь
в начале координат нулевой ряд Тейлора.
Обозначим через е(х) одну из таких функций, а именно ту,
которая совпадает с (8.4) при х>0и равна постоянной 0 при
. Далее для а<р положим
Таким образом, функции е(х), t]ap(x), ea$(x) бесконечно диффе-
дифференцируемы. Функция г)ар положительна лри а < х < р и равна 0
Va(*)
а + К
а + h
вне этого интервала. Следовательно, она доставляет нам первый
пример цивилизованной функции, отличной от тождественного
нуля, если мы будем рассматривать ее на интервале @, 1) и
предположим, что 0<а, {5 < 1. Функция еар возрастает при
§ 9. Первая вариация, уравнение Эйлера, трансверсальность
39
а<лг<C и принимает постоянные значения 0 и еар(C) соответ-
соответственно при х^.а и лг^р.
Сохраняя за числами h, б тот же смысл, что и раньше, опре-
определим теперь функции
1-а-/1, \+6-a-h(l—Х),
Эти функции опять бесконечно дифференцируемы, и мы видим,
что т]а обращается в нуль при х^а и при x~^a-\-h и прини-
принимает постоянное положительное значение при а^х^а + Л,
кроме точек х, лежащих внутри б-окрестностей каждого из концов,
в которых t]a(x) принимает промежуточные ■
значения. Следовательно, еа обращается в
нуль при х^.а, принимает постоянное по-
положительное значение при лг^за + Л и воз-
возрастает при а^х^а + А. В действительно-
действительности она к тому же линейна в этом интер-
интервале всюду, кроме б-окрестностей каждого
из концов. Эти свойства отражены на при-
приведенных рисунках, из которых видно, что еа до некоторой сте-
степени «имитирует» соответствующую кусочно-линейную функцию.
Для того чтобы получить искомую цивилизованную функцию
г)(л;)@^1 л;<11), мы просто умножим на подходящую положи-
положительную постоянную ограничение произведения еа(х)е-ь(—х)
на интервал Os^jc^I. Ясно, что теперь V] имитирует «пенек» а.
В самом деле, она отличается от о только в четырех малых интер-
интервалах Д,-, i = l, ..., 4. Если Д—любой из этих интервалов, то
в нем, очевидно,
и тогда ввиду (8.3)
i
1,1 <«(И
Это завершает доказательство леммы (8.1) и, следовательно,
леммы G.1) (а).
§9
Первая вариация, уравнение Эйлера, трансверсальность
Теперь мы установим связь всего сказанного с тем методом
выявления круга подозреваемых, который мы назвали «рецептом
Эйлера». Порядок предшествующих параграфов был выбран пред-
преднамеренно. Только теперь, убедившись на конкретных примерах,
40 Вступление. Общие замечания и типичные проблемы
в которых условия были довольно благоприятными, что метод
имеет серьезные недостатки, и, с другой стороны, осознав теоре-
теоретическое значение леммы Эйлера—Лагранжа, которая связывает
математические воззрения, разделенные двумя столетиями, мы
готовы взяться за обоснование метода с помощью леммы.
Рассмотрим для простоты непараметрическую задачу с под-
интегральной функцией f (х, у, у'). Наши обозначения здесь,
так же как и в остальной части этой главы, носят временный
характер, а определения, приведенные в этом параграфе, будут
пересмотрены в гл. III. Допустим, что задана минимизирующая
кривая С вида у{х) (а^.х^.Ь), и, не нарушая общности, поло-
положим а = 0, Ь— 1.
Погрузим кривую С в семейство кривых Са вида у(х)-\-а.г\(х),
где а—вещественный параметр, область значений которого содер-
содержит 0 в качестве внутренней точки, и где т]—любая из наших
пробных функций. Пусть для определенности она будет цивили-
цивилизованной. Назовем первой вариацией от 3 значение производной
(d/da)9(Са) в точке а = 0 и обозначим ее через 63. Используя
элементарные правила дифференцирования под знаком интеграла,
получим
(9.1)
так как под интегралом здесь стоит (d/da)f(x, у + ат), у ])
Далее, поскольку С—минимизирующая кривая, а кривая Са
имеет те же концы, что и С, интеграл 3 (Са) как функция пара-
параметра а достигает минимума при а = 0, так что по элементарной
теории максимумов и минимумов мы имеем 63 = 0. Это равенство
должно выполняться для каждой пробной функции г], и, следо-
следовательно, ввиду G.1) мы получаем уравнение Эйлера C.6).
(Допущение, что 0 является внутренней точкой области зна-
значений а, подвергает сомнению справедливость выводов для кри-
кривых С, содержащих граничные точки той области, в которой
должны находиться допустимые кривые. Заметим, что в двух из
трех задач, рассмотренных в § 4 и 5, эта область представляла
собой полуплоскость, так что на кривой С вполне могут суще-
существовать такие граничные точки.)
Заметим, что уравнение Эйлера, которое мы вывели для кри-
кривых, минимизирующих 3 (С) среди кривых, соединяющих две
фиксированные точки Р, Q, тем более удовлетворяется кривыми,
минимизирующими 3 (С) в более широком классе, когда концы
Р, Q могут как-то изменяться. Однако в этом случае становится
необходимым новое условие; оно получило название условия
трансверсальности.
§ 10. Парадокс Перрона 41
Здесь мы опишем это условие, не доказывая его. Заметим,
однако, что во многих задачах с подвижными концами вся поста-
постановка задачи нуждается в уточнении. Так, в примерах (Ь) и (с)
§ 4 и 5 мы рассматривали отображение, при котором начальная
точка превращалась в линию, и тогда нам приходится искать
минимум в более широком классе, чем класс кривых, исходящих
из определенных точек этой линии.
Здесь удобно использовать некоторые понятия, заимствован-
заимствованные из механики. Обозначим через М вектор /—y'fy, fy, соот-
соответствующий наклону у' в точке (х, у), и назовем его вектором
импульса. Через Мр, Mq обозначим его значения соответственно
в точках Р, Q. Пусть SP, &Q — производные двух непрерывно
дифференцируемых функций Р(а), Q(a) в точке а = 0, где а —
вещественный параметр, область значений которого содержит О
в качестве внутренней точки, и где Р@) = Р, Q(O) — Q. Мы
называем 6Р, 6Q виртуальными перемещениями концов Р, Q.
Условие трансверсальности является условием типа принципа
виртуальных перемещений, который утверждает, что
т. е. что система двух точек Р, Q при наличии связей, которые
ограничивают их подвижность, находится в равновесии, когда
в точке Р приложена сила Мр, а в точке Q — сила—MQ.
Приведенное доказательство того, что минимизирующие кривые
удовлетворяют уравнению Эйлера, долго занимало центральное
место в вариационном исчислении. В настоящее время за ним
стоит не только громадный авторитет Эйлера и Лагранжа, но
также и тот факт, что его основная лемма предвосхитила раз-
развитие одной из главных ветвей современного анализа. Это, несом-
несомненно, то самое место, где режиссер, экранизирующий эти лекции,
вставит, и даже на цветной пленке, якобы достоверный эпизод
из жизни Эйлера или Лагранжа,—возможно, даже неправильно
напишет Ла Гранж для поддельной старинности, — или по край-
крайней мере покажет монаха-библиотекаря, которому грим придает
весьма почтенный вид, достающего с высокой полки (из глины
и картона!) не простой печатный том, а громадный, украшенный
цветными рисунками фолиант Эйлера.
К несчастью, некоторые вещи никак не хотят укладываться
в очерченные рамки.
§ to
Парадокс Перрона
В средние века шут был немаловажной персоной. Маленькая
шутка, казавшаяся столь безобидной, могла разрушить королев-
королевства, когда выяснялся ее истинный смысл. Точно так же и
42 Вступление. Общие замечания и типичные проблемы
в наши дни маленькие шутки вносят беспорядок в математиче-
математические теории. Мы называем их парадоксами.
Парадокс Перрона состоит в следующем. Пусть N—наиболь-
N—наибольшее положительное целое число. Тогда для N=£\ мы имеем
N2 > N, что противоречит определению TV как наибольшего.
Следовательно, N = 1.
Последствия этого парадокса разрушительны. Решая задачу,
мы теперь уже не можем предполагать, что решение существует.
Подобное допущение делалось в незапамятные времена, когда
при решении простейших задач элементарной алгебры начинали
с фразы: «Пусть х является искомой величиной».
В вариационном исчислении уравнение Эйлера и условие
трансверсальности принадлежат к так называемым необходимым
условиям. Они получены посредством точно таких же рассужде-
рассуждений, как в парадоксе Перрона: они подразумевают существова-
существование решения. Это основное предположение делается явно, а затем
используется для отыскания решений, существование которых было
постулировано. Для класса задач, в которых это предположение
выполняется, такие рассуждения вполне правильны. Но что это
за класс? Как выяснить, принадлежит ли частная задача этому
классу? Так называемые необходимые условия не отвечают на
подобные вопросы. Тем самым метод решения, основанный только
на необходимых условиях, имеет сомнительную ценность.
Странно, что столь очевидная логическая ошибка так долго оставалась
незамеченной! Впервые метод Эйлера—Лагранжа был подвергнут критике
Вейерштрассом почти сто лет спустя. Даже Риман делал такое же неоправ-
неоправданное допущение в своем знаменитом «принципе Дирихле». А ведь в одной
из трех классических задач, рассмотренных в § 4 и 5, это допущение оказы-
оказывается неверным, если иметь в виду только гладкие решения, как это н дела-
делалось в то время. В наших лекциях мы встретимся с еще более убедительными
примерами подобного рода, причем даже в более простых случаях.
Беда в том, что, как показывает парадокс Перрона, тот факт, что «реше-
«решение» может быть вычислено, ннконм образом логнческн не оправдывает исход-
исходного предположения о его существовании.
Читатель может возразить, что на практике все эти тонкости несущест-
несущественны и что даже не очень квалифицированный спецналнст не получит неверных
результатов, пользуясь методом Эйлера—Лагранжа. Допустим, Эйлер был
не всегда логнческн безупречен в своих рассуждениях по современным стан-
стандартам, но разве он не был прав в своих выводах? Может быть, все необхо-
необходимые исправления сводятся лишь к добавлению вороха определений, которые
Эйлер подсознательно подразумевал?
На самом деле в ореоле непогрешимости не нуждаются нн великие мате-
математики, нн просто опытные или начинающие специалисты. Ошибка в диссер-
диссертации соискателя вовсе не лишает его морального права на ученую степень.
Обнаружив ошибку, он должен думать не о самоубийстве, а о том, кап спасти
то, что верно н ценно в его работе. (На похоронах двух своих учеников,
покончивших жизнь самоубийством, Гильберт под проливным дождем в течение
часа произносил надгробную речь, в которой он показал, что их диссертации
могли быть исправлены.) Ньютон сформулировал вариационную задачу о теле
вращения, испытывающем наименьшее сопротивление при движении в газе.
§ 10. Парадокс Перрона 43
Принятый им закон сопротивления физически абсурден, в результате чего
поставленная задача не имеет решения (чем более зазубрен профиль, тем
меньше сопротивление). Подобная ситуация близка к парадоксу Перрона. Если
бы выводы Ньютона были хотя бы приблизительно верны (после устранения
явных нелепостей), то мы не нуждались бы сегодня в дорогостоящих экспери-
экспериментах в аэродинамических трубах1». Много раз ошибался Лагранж. Коши
совершил трагическую ошибку, отвергнув работу Галуа. Этот список можно
продолжить. Великими мы считаем не тех, кто не делает ошибок, а тех, чьи
идеи и методы определяют дальнейшее развитие наукн.
1J По-видимому, автор имеет в виду задачу Ньютона о минимуме ин-
интеграла
]ТЩ ) = 0, у(а) =
о
решение которой у(х) доставляет профиль искомого тела вращения. Легко
убедиться в том, что inf 3 = 0, взяв, например, последовательность функций
Уп(х) — — * + sin2rt—х, и, действительно, соответствующие профили стано-
становятся при п -> оо все более «зазубренными». Однако можно думать, что Нью-
Ньютон имел в виду только монотонные профили, а с математической точки зре-
ння это означает решение задачи (*) при дополнительном ограничении у'"ё*0.
В такой постановке мы получаем уже задачу типа рассматриваемых во вто-
втором томе этой книги. Она имеет единственное решение, причем негладкое:
j/'3=I прн хо
Это решение оказалось полезным в современной сверхзвуковой аэродинами-
аэродинамике.— Прим. ред.
Глава I
Метод геодезических покрытий
§ и
Введение
Предыдущее изложение нооило лишь предварительный харак-
характер, а сейчас мы начнем все сначала. Пока что мы рассмотрели
ряд задач, не имея достаточной теоретической базы, причем на
таком уровне мы действовали вполне успешно. Однако это неоп-
неоправданно расточительный путь, основанный на догадках и совпа-
совпадениях и сопряженный с довольно неприятными вычислениями.
К тому же, перед тем как затрачивать время и усилия, желательно
заранее знать, приведет ли это к нахождению решения. В этом
отношении метод Эйлера—Лагранжа ничем не помог нам; он
лишь прояснил некоторые наши догадки, даже не обосновав их,
и не избавил нас от черновой работы, которую нам приш-
пришлось проделать. Необходим другой подход. И первое, что нам
потребуется (причем для сугубо практических целей), — это
теория.
Цель, которую мы ставим перед собой в этой главе, грубо
говоря, состоит в следующем: отбросить частные особенности,
присущие рассмотренным примерам, сохранить общую схему наших
рассуждений и формализовать их в виде теории. Такой подход
является классическим: по существу его основы были заложены
еще до появления метода Эйлера—Лагранжа, который на время
вытеснил его. Этот подход предназначен как раз для классиче-
классических задач, подобных тем, которые нам встретились, и он не
связан с парадоксом Перрона.
С точки зрения современной математики этот подход, как
и всякая классическая теория, обладает одним недостатком (су-
(существенным и с практической точки зрения): он требует излиш-
излишней гладкости данных. Впрочем, этот недостаток будет в значи-
значительной степени преодолен во втором томе.
Сейчас наша задача состоит в том, чтобы превратить метод
решения, примененный к ряду частных задач, в последователь-
последовательную теорию. Иными словами, нам предстоит, в сущности, не
слишком трудное упражнение в абстракции. Подобное упражне-
упражнение может предоставить материал для диссертации, впрочем, не
из самых лучших, и для начала может быть весьма полезным.
Разумеется, по-настоящему серьезный научный прогресс (подоб-
(подобный тому, который был вызван введением комплексных чисел
§ 12. Вариационный алгоритм Гюйгенса 45
или понятия группы), как правило, не достигается столь простым
способом.
Теорию удобнее развивать для случая n-мерного пространства,
нежели для плоскости, причем мы, разумеется, ограничимся ва-
вариационными задачами для кривых. Последние могут у нас быть
либо параметрическими, либо непараметрическими, и мы всегда
будем указывать на те различия в рассуждениях, которые могут
быть связаны с этим обстоятельством. В остальном степень общ-
общности класса допустимых кривых можно уточнять различными
способами, не затрагивая существа наших рассуждений, поскольку
на данном этапе нам понадобится производить над ними лишь не-
некоторые элементарные операции классического анализа. В связи
с этим читателю можно предоставить самому сделать соответст-
соответствующий выбор.
§ 12
Вариационный алгоритм Гюйгенса
Здесь мы будем следовать довольно близко рассуждениям,
приведенным в книге и статьях Каратеодори. Кроме того, мы
совершенно откажемся от обозначений предыдущей главы. Бук-
Буквой / будет теперь обозначаться независимая переменная или
параметр вдоль кривой в параметрическом случае, а буквой х —
точка /г-мерного евклидова пространства. Для подинтегральной
функции в вариационной задаче будет использоваться традици-
традиционный термин—лагранжиан. Так мы будем называть функцию
L(t, х, х), зависящую от скаляра t и двух /г-мерных векторов х,
х. Будем называть L параметрическим лагранжианом, если он
не зависит явно от t и удовлетворяет условию однородности
L(x, ox) = oL(x, x) для
Из этого условия можно вывести другое, которым мы будем
часто пользоваться. А именно, дифференцируя по а и полагая
о = 1, получаем
'xLk=L.
k
В параметрическом случае относительным единичным вектором
будем называть вектор х, для которого в заданной точке х имеет
место равенство
Цх, х)=1.
Кроме того, назовем геодезическим параметром или финслеровой
длиной дуги параметр t, для которого функция x(t), представ-
представляющая движущуюся вдоль кривой точку, и ее производная
x{t) удовлетворяют соотношению L[x(t), x(t)] = \. В таком слу-
46 Гл. I. Метод геодезических покрытий
чае мы говорим, что функция x(t) дает геодезическое представ-
представление кривой. Геодезический параметр сводится к обычной длине
дуги, когда функция L имеет вид |*|.
Далее мы предполагаем, что лагранжиан задачи является
достаточно гладкой функцией своих переменных. Трудно уста-
установить точную степень гладкости, потому что в действительности
нам требуется гладкость других функций, которые определяются
через L. Иногда предполагается, что L пять раз непрерывно
дифференцируем, что излишне щедро (в действительности дважды
было бы достаточно). Однако позднее нам придется ввести до-
дополнительные предположения о функции L, нужные для того,
чтобы теория была применима к задачам классической поста-
постановки, и это уже не просто предположения о гладкости. Было
бы хорошо обойтись совсем без гладкости. В самом деле, уже
в геометрической оптике приходится иметь дело с задачей, в ко-
которой лагранжиан терпит разрыв на поверхности линз или других
оптических инструментов и вообще на поверхности раздела двух
сред с разными показателями преломления. В дальнейшем мы
прокомментируем этот факт.
Теперь нашу задачу можно сформулировать так: задан лагран-
лагранжиан L и соответствующий класс кривых С, например гладких
или каких-нибудь других кривых с заданными концами; нужно
найти минимум величины 3 (С), которая является интегралом от
L вдоль С, т. е. найти минимум выражения
*. x(t), x(t))dt.
где функция x(t)—фиксированное (или произвольное) представ-
представление кривой С, x(t)—ее производная, а интеграл берется по
интервалу, на котором определена кривая x(t).
Сформулируем теперь заново совершенно очевидное замеча-
замечание, на котором основывалось решение частных задач в преды-
предыдущей главе.
A2.1) Основной алгоритм. Пусть М—класс кривых с задан-
заданными концами А, В, и пусть Со—элемент этого класса. Далее,
предположим, что существует точная производная Фо, такая,
что L = <DB вдоль кривой Со и L^(D0 вдоль всех других кривых
класса М. Тогда 3 (Со) является минимумом Э (С) относительно
М
Точной производной здесь, как и в соответствующей части
вступления, называется функция ф(/, х, х) вида St + xSx, где
S—функция от (t, x). Конечно, в параметрическом случае S не
зависит явно от /. Другими словами, точная производная
обладает тем свойством, что интеграл от нее вдоль кривой С
зависит только от концов кривой.
§ 12. Вариационный алгоритм Гюйгенса 47
Утверждение A2.1) доказывается непосредственно: для всех
кривых С£М значение интеграла Э (С) не меньше, чем значение
соответствующего интеграла от Фо, а "последний можно взять
вдоль Со, не изменяя его значения, которое равно 3(С0).
К этому можно добавить, что утверждение A2.1) на самом деле обратимо:
если 3 (Со) действительно является минимумом 3 (С) в классе кривых С с
одинаковыми концами, то существует точная производная Фо с перечислен-
перечисленными выше свойствами, правда, при условии, что мы несколько обобщим по-
понятие точной производной, сняв предположение о гладкости. Иногда подхо-
подходящая точная производная может оказаться разрывной даже для очень про-
простых задач, таких, как задача (с) из § 5 вступления. Эту обратную теорему
можно доказать по-разному, но для этого придется воспользоваться средст-
средствами современного анализа или функционального анализа. В принципе эта
обратная теорема представляет собой одну из форм теоремы о выпуклых функ-
функциях и о существовании линейной функции, которая касается данной выпук-
выпуклой функции снизу; все это родственно так называемой теореме Хана — Банаха.
Нам не понадобится здесь эта обратная теорема, но Мы хотим обратить вни-
внимание на то, каким образом в изучаемый нами предмет вплетаются теоремы
о выпуклости.
В дальнейшем мы будем пользоваться слегка видоизмененной
формой алгоритма A2.1). Пусть p(t, х)— векторная функция со
значениями в n-мерном пространстве, определенная в некоторой
области (п+ 1)-мерного пространства (t, х); если же мы имеем
дело с параметрическим случаем, то пусть р(х) — векторная функ-
функция, определенная в области х-пространства и удовлетворяющая
условию L(x, p) — \- Назовем р геодезическим, наклоном, если
существует точная производная
(в параметрическом случае Фо = xSx), такая, что для всех (/, х, х)
(в параметрическом случае для всех (х, х)), у которых (t, x)
(соответственно х) лежат в области определения функции р, спра-
справедливо неравенство
A2.2) L>(D0,
причем равенство имеет место при х = р.
Во вступительной главе исходной для нас была функция S,
которая, конечно, определяет Фо. Обратно, Фо определяет S с
точностью до аддитивной постоянной. Теперь мы хотим отметить,
что в тех случаях, когда Фо существует, она полностью опре-
определяется также и функцией р. Для этого заметим, что разность
^—Фо, рассматриваемая как функция от х, достигает минималь-
минимального значения 0 прих = р и, значит, обращается в нуль вместе
со своей производной по х при этом значении х. Отсюда еле-
48 Гл. 1. Метод геодезических покрытий
дует, что
A2.3) {^Zl-xL^ прих=Л.
В параметрическом случае второе уравнение отпадает; ввиду
однородности L оно сводится к уравнению St — Q и,* значит, S
не зависит явно от t.
Мы назовем геодезическими уровнями, или просто уровнями,
множества точек Р, на которых S(P) постоянна. В литературе
встречаются также термины «трансверсали» и «геодезические па-
параллели». Определение уровней связано скорее с Фо, нежели
с S, так как Фо единственна для данного р, в то время как S
определена только с точностью до аддитивной постоянной.
Если р—геодезический наклон, то кривыми геодезического
наклона мы будем называть решения векторного дифференциаль-
дифференциального уравнения х — р, где p = p(t, x) или р — р(х). Семейство
таких кривых назовем геодезическим семейством. Геодезическое
семейство назовем геодезическим покрытием, или геодезическим
потоком, если оно покрывает область определения функции р
однократно. Так как две кривые геодезического наклона в своих
общих точках обязательно касаются, а это означает, что они
являются двумя решениями с одинаковыми начальными значе-
значениями, то существование геодезического покрытия эквивалентно
тому, что в рассматриваемой области решения дифференциаль-
дифференциального уравнения х = р однозначно определяются начальными зна-
значениями.
Кривые геодезического покрытия будем для краткости назы-
называть кривыми потока. Прежде в ходу был термин «поле» вместо
«поток», но его лучше предоставить алгебраистам.
Так же как Каратеодори, мы считаем, что уравнения A2.3)
являются фундаментальными уравнениями вариационного исчис-
исчисления. Мы можем выразить их смысл, сказав, что для кривых
С, лежащих в нашей области, интеграл
A2.4) \{L(t, х, p) + (x-p)Lp(t, x, p)}dt
с
зависит только от концов кривой С Это выражение называется
инвариантным интегралом Гильберта; ввиду A2.3) оно, очевидно,
равно S(B)—S(^), где А и В — начало и конец пути интегри-
интегрирования. Заметим кстати, что под интегралом в A2.4) стоит не
что иное, как наша ф0.
Соотношения A2.3), конечно, дают лишь часть информации,
которую можно получить из A2.2), поскольку в A2.2) мы имеем
еще и неравенство. Если мы перепишем последнее в виде L—Фо^0
и подставим вместо Фо подинтегральную функцию из A2.4), то
§ 13. Связь с элементарным понятием выпуклости 49
получим условие Вейерштрасса
A2.5) <£^»0,
где $ = ${t, х, р, х} имеет вид
L(t, х, x)—L(t, x, p)—(x—p)Lp(t, x, p).
Очевидно, что A2.5) вместе с A2.3) эквивалентны A2.2). Выра-
Выражение <£, определенное выше, рассматриваемое как функция че-
четырех аргументов, известно под названием функции Вейерштрасса.
Если р является геодезическим наклоном, то L~O0+S, и, сле-
следовательно, для любой кривой С, соединяющей в рассматривае-
рассматриваемой области два уровня S = St и 8 = 8^,
A2.6) 3{C) = S2—Sx-
Это замечательная формула Вейерштрасса, которая произвела
революцию в вариационном исчислении. Можно также написать
ля 71 су /ЛЛ 1 (Г \
где Со—кривая потока, а С—любая кривая, соединяющая в на-
нашей области уровни концов кривой Се в правильном порядке.
§ 13
Связь с элементарным понятием выпуклости
Одна из целей создания математической теории состоит в
уменьшении количества вычислений в отдельных задачах. В связи
с этим заметим, что вычисления, проведенные в задачах (а), (Ь),
(с) предыдущей главы, были частично посвящены проверке нера-
неравенств вида F^O, или F*^Q>*, и что теперь их можно заме-
заменить проверкой условия Вейерштрасса A2.5). Мы увидим, что эту
проверку, для которой, казалось бы, потребовались даже стран-
странные совпадения, теперь можно сделать совершенно очевидной.
Для этого нужно только понять подлинный геометрический смысл
условия Вейерштрасса.
Если рассматривать L(t, x, х) при фиксированных (t, x) как
функцию /(|) вектора х = |, то A2.5) устанавливает, что /(|)^
^/(|), где /(!)—линейная функция, равная / при |=р, график
которой касается графика функции / в этой точке.
Это утверждение представляет собой одно из нескольких
эквивалентных между собой определений выпуклости, а именно
определение «дуга над касательной». Мы называем функцию /
выпуклой в точке \ = р, если существует линейная функция /,
50 Гл. I. Метод геодезических покрытий
такая, что /(!)<;/(£) для всех |, причем равенство имеет место
при | = р. Если / дифференцируема, то I обязательно является
касательной в этой точке, как и в нашем случае. В этом в сущ-
сущности и состояли наши рассуждения при переходе от A2.2) к
A2.3).
Более распространенное определение выпуклости соответствует
ситуации, изображенной на втором рисунке (определение «дуга
Дуга иад касательной. Дуга под хордой.
под хордой»). Согласно этому определению, / выпукла в точке
! = р, если для каждой хорды графика /, пересекающей прямую
! = р, линейная функция, определяемая хордой, не меньше, чем/,
в точке | = р. (Эта линейная функция определена на проекции
хорды в ^-пространство.) Мы возобновим обсуждение этих вопро-
вопросов в одной из последующих глав.
Существенным является здесь то, что сами определения выпук-
выпуклости непосредственно связаны с условием Вейерштрасса. Оче-
Очевидно, что одно из этих определений неявно присутствует в этом
условии, хотя Вейерштрасс сформулировал его задолго до вве-
введения понятия выпуклой функции. Вместо A2.5) можно просто
сказать, что функция L выпукла по х в точке х = р.
В параметрическом случае можно установить еще более про-
простую связь между условием Вейерштрасса и выпуклостью, если
предположить, что лагранжиан L положительно определен, т. е.
что функция L строго положительна при х^О. Этого часто
можно достигнуть путем перехода к эквивалентной задаче. С этой
целью будем считать эквивалентными две задачи, разность лаг-
лагранжианов которых является точной производной, так как оче-
очевидно, что если решена одна из этих задач, то вторая становится
тривиальной.
Конечно, в иепараметрическом случае сразу видно, что если выполняется
A2.2), то можно сделать лагранжиан строго положительным, переходя к эк-
эквивалентной задаче: для этого достаточно вместо L взять лагранжиан
o+
В параметрическом случае можно сделать нечто подобное при условии,
что A2.2) выполняется в более строгом смысле, а именно, что при некотором
значении х0 вектора х равенство в A2.2) может иметь место (исключая случай
х=0) только для векторов х, принадлежащих некоторому открытому полу-
§ 13. Связь с элементарным понятием выпуклости 51
пространству ах > О, и при условии, что вектор х принимает значения из
достаточно малой окрестности х0. Ввиду наших предположений существует
столь малая положительная постоянная а, что при х—х0, |*| = 1 из равен-
равенства £=Ф0 следует неравенство ах > а. Если мы теперь обозначим через е
минимум выражения L — Фо при х = х0, |х| = 1, ах<а и введем обозначе-
обозначение с = е/B|а|), то получим, что при х = х0, \'х\ = \ эквивалентный лагран-
лагранжиан
t = L — Ф0+са'х
больше, чем са, при ах > а и не" меньше, чем е—с|а|Эге/2, при —|а|<
а. Следовательно, лагранжиан L положительно определен вблизи х=хв.
Начиная с этого места мы будем, вообще говоря, предпола-
предполагать, что параметрический лагранжиан L положительно опреде-
определен. Это дает возможность выбрать в качестве t геодезический
параметр вдоль кривой, или финслерову длину дуги. Множество
векторов х, удовлетворяющих при заданном х соотношению
L(x, х) = 1
(т. е. множество векторов х, единичных в финслеровой метри-
метрике), называется индикатрисой лагранжиана L в точке х\ иногда
его называют также финслеровой единичной сферой. Нас будет
больше интересовать множество векторов х, для которых L^l;
оно по аналогии называется финслеровым единичным шаром в
точке х, и мы будем обозначать его через К- Кроме того, в па-
параметрическом случае F(£), как и ранее /(|), обозначает функ-
функцию L(x, x), рассматриваемую при фиксированном х как функ-
функция от вектора х — %.
Из сказанного выше следует, что условие Вейерштрасса
является условием выпуклости функции F в точке |=р. Пред-
Представим его в виде условия выпуклости шара К- (Понятия выпук-
выпуклой функции и выпуклого множества, как мы увидим в одной
из последующих глав, тесно связаны.) Функцию Вейерштрасса
можно записать теперь в виде
Предположим, что | и р лежат на индикатрисе. Тогда, ввиду
однородности функции F,
и, следовательно,
Здесь числитель является линейной функцией от |, и он пропор-
пропорционален расстоянию по перпендикуляру от £ до касательной к
52
Гл. I. Метод геодезических покрытий
индикатрисе, проведенной в точке р. Знаменатель равен значе-
значению числителя при | = 0. Таким образом, £ равно отношению
расстояний от | и от нуля до касательной, проведенной в точке р.
Это отношение положительно, если
| лежит по ту же сторону каса-
касательной, что и начало координат.
Условие
эквивалентно следующему утверж-
утверждению: индикатриса лежит по
одну сторону касательной (или ка-
касательного подпространства), про-
проведенной в точке р. Это снова
условие выпуклости, на этот раз
шара К, и снова оно принадле-
принадлежит тому же самому типу, что и
определение «дуга над касатель-
касательной» в случае функции.
В задачах (а), (Ь) и (с) пре-
предыдущей главы это условие выпук-
выпуклости выполняется, так как сра-
— зу видно, что в каждой из этих
задач индикатрисой является окружность. Зная об этом в свое
время, мы избавились бы не только от некоторых вычислений,
но также от суеверного чувства, что мы живем в мире совпадений.
Из сказанного видно, что в вариационном исчислении выпук-
выпуклость играет фундаментальную роль уже в самом начале теории.
В дальнейшем мы обнаружим и более глубокие связи. Тем не
менее, как это ни странно, слово «выпуклость» почти не упоми-
упоминается в некоторых почтенных трактатах. Причина этого частично
кроется в том, что некоторые из иих написаны до распростране-
распространения понятия выпуклости, а частично в том, что в нашем предмете
используются наименее распространенные определения выпуклости.
Впрочем, Каратеодори утверждает, что Минковский прочел в
Мюнхене летний курс лекций по вариационному исчислению,
в котором он широко пользовался понятием выпуклости (что и
естественно, поскольку он был его родоначальником). Записи
этих лекций заботливо хранятся там, и читать их, должно быть,
крайне интересно.
§ 14
Снова появляется уравнение Эйлера
До сих пор мы почти не пользовались гладкостью лагран-
лагранжиана, но сейчас она будет играть решающую роль. К сожале-
сожалению, классические рассуждения, которыми мы будем пользоваться,
§ 14. Снова появляется уравнение Эйлера 53
нельзя применить к обобщенным функциям.так как эти рассуждения
носят нелинейный характер: в них используются произведения и
отображения общего вида. По этой причине трудно сказать, как
на этой стадии можно быть более экономными в требованиях
гладкости, хотя с точки зрения приложений такая экономия была
бы весьма желательна.
Для успешного применения метода, изложенного в § 12, тре-
требуется выполнение трех условий. Одно из них — это условие Вей-
ерштрасса, которому мы только что дали геометрическую интер-
интерпретацию. Другое заключается в том, что покрытие, образуемое
решениями дифференциального уравнения x — p(t, х), является
однократным, и позднее это условие будет нас постоянно раздра-
раздражать. Третьим является условие точности, которое выражается
фундаментальными уравнениями A2.3) или, что то же самое,
инвариантным интегралом Гильберта. Изучим третье условие.
Обозначим для краткости правые части уравнений A2.3) через
Величины у и —Н иногда называют пространственным и вре-
временным импульсами, но здесь мы будем обращаться с ними просто
как с некоторыми функциями переменных (/, х, х). (Позднее мы
будем интерпретировать их иначе или, точнее, будем обращаться
с ними как с величинами, которые уже не являются функциями
этого частного набора переменных. Однако новая интерпретация
не повлияет на наши результаты.)
Условие точности, которое мы должны изучить, состоит в
том, что выражение
A4.1) ydx~Hdt
превращается в полный дифференциал dS относительно перемен-
переменных (/, х), если подставить x=p(t, x). Мы хотим выяснить, когда
это происходит.
Удобнее сформулировать вопрос в несколько более общем
виде, потому что это позволит нам сделать исследование более
наглядным-и избавит от вторичного выполнения той же работы.
С этой целью рассмотрим также и возможность предварительного
преобразования задачи при помощи некоторого отображения. Как
мы видели при решении задач (Ь) и (с) предыдущей главы, такие
отображения играют важную роль в приложениях. Их можно
также использовать для распространения теории на случай кри-
кривых, расположенных не в евклидовом пространстве, а на много-
многообразии, заданном посредством локальных координат.
В этом параграфе мы не будем пользоваться наиболее общими
отображениями некоторых троек в тройки (t, x, х). Вместо этого
54 Гл. I. Метод геодезических покрытий
ограничимся пространственными преобразованиями
A4.2) (t, и) - {t, х),
при которых время не изменяется. Это означает, что х заменяется
функцией x(t, и), где и—точка некоторого другого евклидова
пространства, необязательно той же размерности, и где функ-
функция x(t, и) определена в соответствующей области пространст-
пространства (t, и). Отображение A4.2) расширим до отображения троек
A4.3) (t,u,ii)-~(t,x,x),
полагая x = xt+.xau, т. е. подставляя вместо переменной х пол-
полную производную функции x(t, и). Вообще, если ф—функция
от (/, и), мы аналогичным образом обозначим через ф полную
производную ф, +Ф„«. Будем считать, .что функция x(t, и),
определяющая отображение A4.3), дважды непрерывно диффе-
дифференцируема. Обозначим через Н прямоугольную матрицу. Якоби хи,
составленную из частных производных, так что теперь x = xt-\-Eu.
Кроме того, мы будем использовать буквы а и а* для обозна-
обозначения любой компоненты вектора и; производную по такой
компоненте будем обозначать соответственно заглавной буквой
или заглавной буквой со звездочкой; так, например, X* будет
обозначать частную производную функции х по а*.
Условившись об этом, зададим себе вопрос: при каких обсто-
обстоятельствах семейство кривых, определяемое дифференциальным
уравнением
A4.4) u = p{t, и),
таково, что отображение A4.3), полученное указанным выше
способом из пространственного преобразования A4.2), превра-
превращает выражение A4.1) в полный дифференциал dS относительно
переменных (/, ы)? Если семейство кривых, заданных дифферен-
дифференциальным уравнением A4.4), обладает этим свойством, то мы
будем называть его индуцированным точным семейством. В этой
ситуации интеграл от выражения A4.1), взятый вдоль произволь-
произвольной кривой пространства (t, и), зависит только от концов кривой.
Мы назовем этот интеграл соответствующим инвариантным ин-
интегралом Гильберта.
Предположим, что функция p(t, и) дважды непрерывно диф-
дифференцируема. Кроме того (и это очень существенно для наших
рассуждений), область (t, и) будет предполагаться односвязной.
В этом случае необходимое и достаточное условие существования
функции S(t, и) можно найти в различных учебниках по высшей
математике, векторному анализу, дифференциальным уравнениям
и математическому анализу. Это условие является естественным
следствием независимости смешанных частных производных функ-
§ 14. Снова появляется уравнение Эйлера 55
ции S от порядка дифференцирования:
Следовательно, индуцированная точность эквивалентна мно-
множеству соотношений, сокращенно записываемых в виде
[а, а*] = [а, /] = 0.
Квадратные скобки используются в этой связи очень давно (как
ни странно, их ввел Лагранж, у которого был совершенно иной
подход к вариационному исчислению). Записанные развернуто
эти квадратные скобки представляют следующие выражения:
[a, 0L*]=^?(yX)—^
Все это в действительности является частным случаем общей
схемы, применяемой в теории дифференциальных уравнений в
частных производных первого порядка и их характеристик в
смысле Коши. Приведенные ниже выкладки более стандартны,
а полученные результаты менее неожиданны, чем могло бы
показаться. Имеем
^ (yxt) = Yxt + yXt = Yx+yXt + Q,
где R = X(yt—y), Q=Y(xt—x), так что
#_ Q = _2 (XY*—YX*) a*.
a*
Последнее соотношение можно записать в виде —[а, и] и, где
[а, и]—вектор с компонентами [а, а*] при фиксированном а.
Заметим также, что, поскольку y = Lx,
1\1дУ I dxVv
L)xLYx
Подставляя эти выражения в равенство, определяющее скобку
[а, /], мы получим, что
[a, t] = X(y-Lx)-u[a, и]
и, следовательно,
A4.5) X(y-Lx) = [a,t] + L[a, и].
В случае индуцированной точности все скобки Лагранжа об-
обращаются в нуль и, следовательно, то же происходит при каж-
56 Гл. I. Метод геодезических покрытий
дом а с обеими частями равенства A4.5). Меняя порядок двух
множителей в левой части, мы можем записать совокупность
уравнений A4.5), полученных из условия обращения левой части
в нуль для различных компонент а, в виде одного векторного
уравнения
A4.6) (y-Lx)Z = 0.
Уравнение A4.6) мы будем называть индуцированным урав-
уравнением Эйлера, а его решения — индуцированными экстремалями.
Если отображение A4.2) является тождественным, то 3—еди-
3—единичная матрица и мы получаем уравнение Эйлера
A4.7) y-Lx = Q.
§ 15
Теорема Малюса
Продолжим анализ понятия индуцированной точности, причем
начиная с этого момента мы можем и будем предполагать, что
кривые семейства, заданного дифференциальным уравнением
ы = /э(/, и), удовлетворяют индуцированному уравнению Эйле-
Эйлера A4.6). Выясним теперь, какие еще условия должны выпол-
выполняться. Ответ на этот вопрос дает известная теорема Малюса.
Знаменательно, что Малюс сформулировал свою теорему для задач геомет-
геометрической оптики, которые, ввиду принципа наименьшего времени (принципа
Ферма), можно рассматривать как вариационные задачи с разрывным лаг-
лагранжианом определенного вида. Теория Гюйгенса, которая легла в основу этой
главы, также была развита им применительно к задачам геометрической оптики,
н в значительной степени то же замечание относится к Гамильтону, вкладом
которого в теорию мы займемся позже. В этом отношении точка зрения перечис-
перечисленных авторов оказалась ближе к современным задачам, чем пришедшая ей
на смену классическая теория, в которой предполагается высокая степень
гладкости.
Ввиду A4.5) имеем теперь
A5.1) fa, t]+u[a, u] = 0.
Кроме того, скобки Лагранжа удовлетворяют некоторому
набору тождеств, найденному Лагранжем. Этот набор мы будем
называть «тождествами двойного ротора»; они выражаются век-
векторным соотношением
вместе с аналогичным скалярным соотношением, в котором и
заменено на t и в котором, конечно, [t, aj= —[a, t]. Для про-
§ 15. Теорема Малюса 57
верки скалярного тождества достаточно- записать его в виде
д д д
dt да* да
A5.2)
д д д
dt да* да
ABC
= 0,
где- А, В, С—коэффициенты при dt, da*, da в выражении, по-
полученном из A4.1) после подстановки вместо dx соответствующе-
соответствующего дифференциала в пространстве (t, и). Соотношение A5.2) спра-
справедливо, если А, В, С дважды непрерывно дифференцируемы.
Аналогичным образом' можно проверить и векторное тождество.
Имея это в виду, применим к функции
Ф = [а, а*]
приведенное выше определение полной производной ц>:
[
Используя скалярное и векторное тождества двойного ротора,
правую часть можно представить следующим образом:
Сравнив первые два члена этого выражения с равенством, полу-
полученным путем дифференцирования A5.1) по переменной a", a
остальные два члена с аналогичным равенством, в котором а
заменено, на а* и наоборот, получим
Следовательно, полагая и — р и обозначая, как и прежде, частные
производные заглавными буквами, имеем
A5.3) [а,а*] = Р[а*,и]-Р*[а,и].
В частном случае, когда р = 0 (т. е. когда индуцированное
семейство состоит из прямых ы = const), мы получаем результат
Лагранжа, широко используемый в небесной механике и состоя-
состоящий в том, что на каждой кривой этого семейства величина
[а, а"] постоянна.
Однако здесь нас интересует общий случай. Из A5.3) следует,
что скобки Лагранжа [а, а*] удовлетворяют однородной системе
линейных дифференциальных уравнении. Кроме того, согласно
A5.1), скобки [а, /] являются однородными линейными комби-
комбинациями скобок [а, а*].
58 Гл. I. Метод геодезических покрытий
Для таких дифференциальных уравнений справедлива теорема
единственности, которую мы напомним и вкратце докажем в
конце этой главы. Поэтому если скобки [а, а*] обращаются в нуль
в некоторой точке каждой кривой нашего семейства, то все скобки
Лагранжа тождественно равны нулю. Это и есть теорема Малюса.
§ 16
Достаточные условия инвариантности интеграла Гильберта
Обозначим через М семейство кривых u=p.(t, и), которое
покрывает интересующую нас область в пространстве (t, и), а че-
через N—семейство, состоящее из образов этих кривых в прост-
пространстве (/, х). Предположим, как и раньше, что область в прост-
пространстве (t, и) односвязна. Тогда обращение в нуль скобок
Лагранжа обеспечивает существование функции S(t, и), а это
в свою очередь означает, что интеграл Гильберта
A6.1) ^ydx—Hdt
не зависит от пути интегрирования в пространстве (t, и), если
концы этого пути заданы.
Таким образом, условия, полученные в предыдущем параграфе,
являются необходимыми и достаточными условиями инвариант-
инвариантности интеграла Гильберта. Они состоят в том, что каждая кривая
из М должна быть индуцированной экстремалью и в некоторой
точке этой кривой скобки Лагранжа по переменным и должны
обращаться в нуль. Остается только переформулировать это
последнее условие применительно к некоторым интересным слу-
случаям. Мы будем предполагать, что М состоит из индуцирован-
индуцированных экстремалей.
A6.2) Тривиальные случаи, i/казанное условие выполняется
(а) для всех плоских задач и (Ь) в случае, если для некоторого
t = t0 все кривые семейства N проходят через общую точку
(t0, х0) или все они имеют один и тот же импульс у = у0.
A6.3) Типичный случай. Указанное условие выполняется, если
гильбертова дифференциальная форма1'1 ydx—Hut точна по и
на некоторой гладкой поверхности вида t = t(u), которая пересе-
пересекает каждую кривую семейства М, не касаясь ее.
Заметим, во-первых, что, ввиду A6.2), для всех задач, рассмотренных в
предыдущей главе, условие точности оказывается тривиальным в любом из двух
вариантов.
х> Дифференциальную форму ydx—Hdt чаще называют интегральным
инвариантом Картаиа (или Пуанкаре — Картана). Ее точность в A6.3) означает,
что иа поверхности t = t (и) она является полным дифференциалом некоторой
функции f(u). — Прим. ред.
§ 16. Достаточные условия инвариантности интеграла Гильберта 59
Во-вторых, условие отсутствия касания, упоминаемое в A6.3), должно
выполняться только для кривых в пространстве (/, и); для кривых в простран-
пространстве (t, к) оно может нарушаться. В приведенном ниже доказательстве утверж-
утверждения A6.3) это условие используется, однако не ясно, насколько оно обяза-
обязательно. В теореме об огибающей из § 17 дело обстоит совсем по-другому, и,
кроме того, мы докажем ее для параметрического случая.
Доказательство A6.2). (а) В непараметрическом случае и—ска-
и—скаляр, и поэтому а = а* = н, а [а, а*] = 0. В параметрическом случае
отображение и—*х и наклон и = р не зависят от t. Далее, ввиду
однородности, # = 0, и поэтому гильбертова дифференциальная
форма равна ydx, а скобки вида [а, /], [а*. t] обращаются в
нуль. Значит, для параметрической задачи на плоскости нужно
рассмотреть только одну скобку Лагранжа, имеющую вид
[а, а*], где а=^а*. Согласно A5.1), эта скобка равна нулю, так
как здесь предполагается, что вектор рфО.
(Ь) Очевидно, что в каждом из двух случаев при t —10 имеет
место одна из следующих двух пар равенств: X = X* = 0 или
У = У*=0; поэтому XY* — YX* = 0.
Доказательство A6.3). Используем простое тождество. Ввиду
антисимметрии сумма по всем а, а* выражений вида а [а, а*] а*
юбращается в нуль; согласно A5.1), этот результат можно записать
гак:
A6.4) it [и, t] = 0.
Далее, отметим, что при u = p(t, и), t — t(u) величина k = tau
не равна 1, так как ввиду условия отсутствия касания диффе-
дифференциальные соотношения dt = tudu, du = udt не могут одно-
одновременно выполняться, а при tuii=\ первое из них является
следствием второго.
В переменных (t, и) гильбертова дифференциальная форма
имеет вид
v(t, u)du—K(t, ti)dt.
Положим
i{u) = v(t(u), и), К (и) = Kit (и), и)
и обозначим через о„ и2 и vu va соответственно компоненты
векторов v, v вдоль осей а, а*. Кроме того, как мы уже усло-
условились, через Т, Т* будем обозначать ta, ta*. На поверхности
t = t(u) гильбертова дифференциальная форма точна, т. е.
A6.5) Cv—Ktu)du
дифференциалом. В
*, имеют вид
(wx—TK) da -t- (ys—T*K) da*.
является полным дифференциалом. В этом выражении члены,
содержащие da, da*, имеют вид
SO Гл. I. Метод геодезических покрытий
Так как форма A6.5) точна, то
Левая часть этого соотношения равна значению при t*=t(u)
выражения
которое сводится к выражению
а это последнее можно записать в виде [а, а*]+Т*[а, t] —
— Т [a*, t]. Поскольку при t = t(u) оно обращается в нуль, то
при фиксированном а, взяв вместо а*-различные компоненты
вектора и, мы получим векторное уравнение
A6.6) [a, u]+tu[a, t] = T[u, t].
Умножая его скалярно на и и используя A5.1), определение
величины К и A6.4), находим, что
Следовательно, [a, t] = 0 и, значит, [и, t] = 0. Таким образом,
векторное уравнение A6.6) принимает вид [а, ы] = 0. Следова-
Следовательно, при t = t (и) все скобки Лагранжа вида [а, а*] обраща-
обращаются в нуль, и это завершает доказательство.
§ 17
Свойства инвариантности и теорема об огибающей
Мы сможем избавиться от отображения (t, и)—>■((, х), если
будем рассматривать сразу лагранжиан F(t,u,u), полученный
из лагранжиана L (t, x, х) заменой переменных. А именно, спра-
справедлива следующая теорема:
A7.1) Теорема об инвариантности при отображении (t,u)—*
—►(/, х). Индуцированные экстремали и скобки Лагранжа для L
являются экстремалями и скобками Лагранжа для F.
Чтобы доказать это, положим v = F-u, K = uv—F. Из равен-
равенства x=xt-\-xuu находим (считая независимыми переменными
t, и, и), что
§ 17. Свойства инвариантности и теорема об огибающей 61
Отсюда
так что Fn = LxE+yE, а, кроме того, v = Fu =Li-4-~ yE.
ди
Сгедовательно,
-A7.2) о — Ftt = (y— LX)E,
т. е. уравнение Эйлера для F является индуцированным урав-
уравнением Эйлера для L. Далее, из равенства v = yxu получаем,
что V = Yxu + yXu. Напомним, что в соответствии с принятым
соглашением U*—единичный вектор, направленный вдоль оси а*.
Поэтому
Вычитая это выражение почленно из аналогичного выражения
для UV*, находим, что
W— U*V = XV—X*Y.
Это равенство доказывает инвариантность скобок [а, а*], а ввиду
A4.5) и A7.2) также и инвариантность скобок [a, t].
Перейдем теперь к обсуждению взаимосвязи между парамет-
параметрической и непараметрической задачами. До сих пор большую
часть наших результатов мы формулировали применительно к
непараметрическому лагранжиану L(t, x, х), а параметрический
случай рассматривали как частный, в котором лагранжиан имеет
специальный вид L(x, x), где функция L удовлетворяет условию
однородности из § 12. Теперь мы хотим изучить обратную зависи-
зависимость. Для этого в непараметрическом случае удобно ввести обозна-
обозначения х0, х,, х[ вместо t, х, х и Lo вместо L. (Эти обозначения будут
временными.) Пару (%„, хг) будем теперь обозначать через х, а
параметрический лагранжиан, совпадающий с Lo при х = A, х'г), —-
через L.
Такой переход от Lo к L порождает несколько вопросов. Лагранжиан L
определяется сначала только для значений х определенного вида. Затем мы
расширяем область определения L, используя условие однородности, что, однако,
позволяет включить в нее только векторы х = (хв, Xi), для которых х0 > О,
и вектор х=0. Гладкое продолжение лагранжиана L на всю область хфО
может оказаться невозможным или неоднозначным. Так, если в плоской задаче
^-о(*о> *i> х[) = {х[J, то при х = (е, 1), где е > 0, лагранжиан L принимает
значение 1/е, так что его нельзя гладко продолжить на вектор х = @, I).
С другой стороны, если Lo обращается в нуль при | х[ | ё= 1, то существует много
гладких продолжений лагранжиана L в область х ■£ 0. Вектор х=0 мы должны
62 Гл. I. Метод геодезических покрытий
исключить из рассмотрения, так как параметрический лагранжиан может быть
гладким при х — 0 только в том случае, если он линеен по х. В самом деле,
функция Lx положительно однородна по х степени 0 и потому непрерывна
при х=0 только тогда, когда равенство Lx (х, x) = Lx(x,0) выполняется при
любых значениях вектора х.
На самом деле в этом параграфе продолжение лагранжиана L нам не по-
понадобится. Мы будем рассматривать L только на тех множествах точек (х, х),
которые отвечают некоторым кривым или семействам кривых и их окрестностям.
Когда L порождается лагранжианом LB, то и эти множества порождаются
соответствующими множествами непараметрической задачи, так что лагран-
лагранжиан L на этих множествах определен. А вдоль произвольной кривой нам
будет нужен не сам лагранжиан L, а гильбертова дифференциальная форма,
в которой х присутствует только как вектор, полученный из р.
A7.3) Теорема об инвариантности при переходе к параметри-
параметрической форме. При переходе от Lo к L гильбертова дифферен-
дифференциальная форма не изменяется, а индуцированные экстремали
остаются индуцированными экстремалями.
Так как в параметрическом случае # = 0, то новая гильбер-
гильбертова дифференциальная форма равна ydx, тогда как старую
следует писать теперь в виде y1dx1—HBdxB. Для проверки их
совпадения (относительно одного и того же семейства кривых)
мы должны положить х = A, х\) и показать, что при этом
*/ = (*/„, yi), где уе = — Яо. Но это так, поскольку, с одной сто-
стороны,
где
а с другой стороны, ввиду однородности,
L = 'xLx =Lko + x\y}J
откуда
LXt = L—x'ii)x = Lo—x[yt = — Яо.
Далее, дифференцируя вдоль кривой условие однородности
L—xyt получаем
откуда
A7.4) (Lx-y)i = 0.
С другой стороны, индуцированные уравнения Эйлера для пара-
параметрического лагранжиана L и отображения (ы0, и,) —»■ (х0, xt).
§ 17. Свойства инвариантности и теорема об огибающей 63
где хо = ио, х1 = х1(и0, и,), задаются уравнением
A7.5) {Lx—у) {У»*} »0.
Если параметр t вдоль соответствующей кривой отождествлен
с х0 и и0, то х = (дх/ди0) + (dx/duj и[, так что, согласно A7.4),
первое из уравнений A7.5) является следствием остальных, а эти
последние можно записать в виде векторного уравнения:
Так как дхо'/ди1 = 0, то первая компонента вектора Lx—у не
играет здесь никакой роли. Значит, уравнение A7.5) сводится
к уравнению
т. е. к индуцированному уравнению Эйлера. Это завершает до-
доказательство.
A7.6) Теорема о точности для семейства с огибающей в слу-
случае большой гладкости. Пусть односвязная область покрыта
семейством параметрических экстремалей x(t, и), где и прини-
принимает постоянное значение на каждой отдельной кривой, a t — па-
параметр вдоль кривой- Пусть задано второе семейство N, состо-
состоящее из кривых, расположенных на параметрическом многообразии
х = £(и), причем N является образом при отображении и—*х —
= I (и) семейства кривых М, определяемого в и-пространстве
дифференциальным уравнением и = р(и). Предположим, что при
t = 0
'A7.7) х@,и) = 1(и), х@, и) = Бвр(и).
Если все рассматриваемые функции гладкие, то семейство x(t, и)
будет точным тогда и только тогда, когда М — индуцированное
точное семейство.
Условие A7.7) означает, что начало отсчета параметра выбрано
так, чтобы при * = 0 экстремали x(t, и) касались многообразия
х = !(н) вдоль линейных элементов семейства N, и что пара-
параметр t, если это требовалось, был умножен на подходящий
множитель. Гладкость всех рассматриваемых функций здесь
весьма существенна и не является следствием гладкости семейства
x(t, и), так как хорошие семейства могут иметь очень плохие
огибающие.
Теперь перейдем к доказательству теоремы A7.6), которое
намного проще, чем ее формулировка. Как мы выяснили при
64 Гл. I. Метод геодезических покрытий
доказательстве теоремы A7.1), между начальными значениями
при t=^0 величин y(t, u) = L-x и соответствующими величинами
v(u) = F^ для индуцированной задачи существует связь, выра-
выражаемая соотношением
v^y@, и)В (и),
где Е=!„. Так как на многообразии х-=\(и) мы имеем
dx = S(u)du, то это соотношение можно записать в виде
A7.8) v(u)du = y{0, u)dx@, и).
Из A7.8) видно, что при t=dt = O гильбертова дифференциаль-
дифференциальная форма y(t, u)dx(t, и) равна гильбертовой дифференциальной
форме для индуцированной задачи на многообразии х=-£(ы).
Согласно теореме Малюса, семейство x(t, и) будет точным тогда
и только тогда, когда правая часть равенства A7.8) является
точной формой, а значит, тогда и только тогда, когда левая
часть этого равенства является точной формой, т. е. тогда и
только тогда, когда М — индуцированное точное семейство.
§ 18
Общие замечания и приложение теории к задачам на плоскости
Теперь читатель достаточно подготовлен и снаряжен для того, чтобы по-
новому взглянуть на конкретные задачи. Например, он в состоянии теперь
оценить задачи, которые можно найти в прекрасной главе, посвященной ва-
вариационному исчислению, из книги Харди, Литтльвудаи Полиа «Неравенства».
Если же читателя интересуют какая-нибудь старая задача или исторические
сведения, то он может переосмыслить с более современной точки зрения то,
что по этому поводу написано в старых книгах и статьях, посвященных
нашему предмету. Это занятие несколько напоминает чтение старых газет,
■когда мы уже знаем то, о чем наши предшественники могли только дога-
' дываться.
Полное решение конкретной задачи может оказаться очень длинным, не-
несмотря на то, что отыскание экстремалей займет всего лишь несколько
строчек или страниц. Конечно, весьма соблазнительно быстро разделаться
с задачей, ограничившись нахождением экстремалей. Кроме' того, в некоторых
приложениях решаются фактически не вариационные задачи, а задачи меха-
механики или теории дифференциальных уравнений, в которых и нужно только
определить экстремали. Когда же перед нами настоящая вариационная задача,
требующая детального изучения, то почти всегда мы ограничиваемся рассмот-
рассмотрением плоского случая, так как плоские вариационные задачи более податливы
и для них, согласно A6.2), условие точности является тривиальным. Это
показывает, что, хотя изучение конкретных задач может быть весьма полез-
полезным, опыт, приобретенный таким способом, будет несколько односторонним.
Так, даже для задач в трехмерном пространстве не понадобится теорема об
огибающей из § 17, потому что в этом случае огибающая самое большее
двумерна, а в двумерном пространстве все семейства экстремалей точные.
Поэтому, для того чтобы получить семейство экстремалей, которое не является
точным, ио имеет хорошую огибающую, нужно выйти по крайней мере в четырех-
четырехмерное пространство. Специфика вариационных задач на плоскости иллюстри-
иллюстрируется также следующей теоремой, в которой огибающая является кривой,
что как раз характерно для плоской задачи.
$ 18. Общие замечания и приложение теории к задачам Q5
A8.1) Теорема Якоби об огибающей. Предположим, что в теореме A7.6)
многообразие х = \(и) является кривой и что все экстремали x(t, и) исходят
из одной и той же точки Я„. Далее, обозначим через 3 (иг), 3 (и2) интегралы
от L, взятые соответственно вдоль кривых х(г,Ъу), x(t, и-,) от точки Р„ до
точек |("i), £(u2) их касания с огибающей * = g(u), о- через 3 (их, и2) обозна-
обозначим интеграл от L вдоль огибающей от g(ut) до g(u?). Тогда При иг^их
A8.2) 3(u2)=3(ul)+3(uL, u2).
Это непосредственно следует из доказательства теоремы A7.6), так как,
с одной стороны, очевидно, что дифференциальная форма v (u)du точна и, сле-
следовательно, ввиду A7.6), семейство x{t, и) является точным, а с другой
стороны, из соотношения y(t, u)dx(t, u) = dS(t, и) следует, что v(u)du =
— dS(О, и). Значит, в этом случае можно взять в качестве S{t.u)интеграл отL,
вычисленный вдоль экстремали от точки Ро до x(t, и), а тогда разность
S@, u2)—S@, иг) равна интегралу от v(u) вдоль огибающей. Именно это
свойство и выражено равенством A8.2)
Сфера применимости этой теоремы ограничена, с одной стороны, довольно
стеснительными предположениями гладкости, а с другой—требованием, что
огибающая является кривой. Последнее в сущности означает, что эту теорему
нельзя применять непосредственно для неплоских задач. Однако исторически
именно с нее начинается теория сопряженных точек, которую мы подробно
изучим в гл. IV этой книги. Практически теоремой A8.1) можно пользоваться
довольно редко, потому что огибающая обычно имеет точку возврата.
Теорему Якоби об огибающей можно несколько обобщить, предположив,
что экстремали x(t, ut), x(t, и3) имеют различные начальные точки Qlt Q2.
В этом случае разность между правой и левой частями равенства A8.2) равна
S(Qi)—S(Q2). Наиболее хорошо известен частный случай этой теоремы, до-
доказываемый в дифференциальной геометрии на плоскости и относящийся
к задаче о кратчайшем расстоянии. Он формулируется следующим образом:
разность длин отрезков двух нормалей
<ЭЛ. Qi.Pi
к плоской кривой Г равна длине дуги PtP« эволюты этой криво-1}, т. е. оги -
бающей y семейства нормалей кривой Г 1). В этом случае, ввиду ортогональ-
ортогональности, функция S принимает постоянное значение на Г.
Теоремой Якоби об огибающей можно воспользоваться при решении за-
задачи (с) о минимальной поверхности вращения, рассмотренной в предыдущей
главе. В этой задаче точкой Ро является точка @, 1). Так как дуга огибающей
V не является экстремалью, то кривая, состоящая из экстрема аи PePi и дуги
огибающей РгР2, не может доставлять минимума. Однако, согласно A8.2),
интеграл вдоль этой кривой равен интегралу вдоль экстремали, соединяющей
х> Здесь Рг и Р2—центры кривизны кривой Г в точках Qt и Q2 соот-
соответственно; эволюту можно определить также как геометрическое место
центров кривизны.— Прим. ред.
3 № 1274
£6 Гл. I. Метод геодезических покрытий
точки Ро и Р2. Следовательно, минимум интеграла на кривых, соединяющих
эти две точки, на дуге экстремали с концами Ро и Р2 не достигается.
К этому же самому выводу можно прийти, рассмотрев интересное геомет-
геометрическое свойство экстремалей этой задачи, впервые отмеченное Л. Линделё-
фом A861): касательные к экстремали в концах дуги Р0Р2 пересекаются на
оси. (Как показано в § 341 книги Каратеодори, это свойство можно установить
без всяких вычислений, используя только теорию сопряженных точек.) Далее,
Линделёф показал, что интеграл от Ро до Рг вдоль ломаной линии, образо-
образованной этими двумя касательными, равен интегралу вдоль экстремали Р0Р2.
(Каратеодори показывает в § 365 своей книги, как этот результат можно
совсем просто и без вычислений вывести из приведенного выше свойства
касательных.) Так как ни одна из касательных не является экстремалью, то
ясно, что это значение интеграла не будет минимальным.
Задачи. 1. Покажите, что в задаче (с) на экстремали от Ро до Р2
достигается минимум относительно класса кривых, имеющих те же концы и
не пересекающих огибающую Y-
2. Покажите аналогично, что для точек Q, лежащих над у, на экстремали
от Р„ до Q, касающейся у, достигается минимум относительно кривых с теми
же концами, имеющих общую точку с у, н0 не пересекающих ее.
3. Покажите, что существуют такие точки Q над у, что минимум между
Ро н Q на цепной линии не достигается.
(Эти задачи решаются без выкладок.)
Мы видим, что даже при решении сравнительно несложной задачи нужно
дать ответ на несколько дополнительных вопросов. Теперь, когда мы уже
справились со всем этим, можно спросить, ие проще ли было построить общую
теорию? Этим мы сейчас и заняты, однако для завершения работы нам потре-
потребуются еще некоторые средства.
§ 19
Необходимые сведения о неподвижных точках и о теоремах
существования для дифференциальных уравнении
и неявных функций
В дальнейшем нам понадобится несколько хорошо известных результатов
и стандартных приемов из других областей. Их можно в основном охаракте-
охарактеризовать как теоремы о неподвижных точках, и цель этого параграфа состоит
отчасти в том, чтобы подчеркнуть этот факт, не требуя от читателя чрезмер-
чрезмерных усилий. Но прежде всего стоит разобраться в общем стратегическом
замысле и уяснить себе наши потребности.
$ 19. Необходимые сведения о неподвижных точках 67
Сейчас мы уже в состоянии упростить решения задач предыдущей главы,
не опираясь при этом на явно слишком удачные совпадения. Однако два
пункта все еще подлежат обсуждению: нахождение экстремалей и проверка
взаимной однозначности покрытий. В этих местах нельзя добиться упрощения,
ио можно по крайней мере показать, что результаты не могли быть отрица-
отрицательными. Для общего случая мы сделаем это в следующей главе, где будут
доказаны локальные теоремы существования для вариационных задач. А для
уже рассмотренных задач достаточно тех средств, которыми иас снабдит этот
параграф. Они же пригодятся и при рассмотрении общего случая.
Нахождение экстремалей, не составившее труда в рассмотренных случаях,
в действительности опирается на теорему существования решения задачи Коши
для дифференциального уравнения первого порядка
A9.1) i = p(t,x).
Правда, уравнение Эйлера является уравнением второго порядка, но его легко
представить в виде A9.1), если обозначить х через г, а пару х, г считать
единым вектором, обозначая его через х.
Кроме того, такая теорема существования для уравнения A9.1) нужна
нам и для обоснования теории, развитой в этой главе, так как мы должны
быть уверены в единственности решения и его диффаренцируемости по началь-
начальным значениям. Нечто в этом роде мы и подразумевали, когда говорили
о семействах кривых, определенных уравнением вида A9.1), а при доказатель-
доказательстве теоремы Малюса мы явно использовали единственность.
Что же касается второго из упомянутых выше пунктов, то здесь подхо-
подходящим средством является теорема о неявной функции. В наших задачах,
получив семейство кривых, заданное в параметрическом виде функциями от
переменных a, t, мы должны были найти область, в которой эти переменные
однозначно выражаются через исходные координаты. Соответствующую теорему
о неявной функции можно сформулировать и доказать несколькими способами.
Обе теоремы, теорему существования для уравнения A9.1) и теорему
о неявной функции, можно сформулировать в виде теорем о неподвижных
точках. В первом из этих случаев такая возможность подсказывается самим
доказательством, которое мы приведем, хотя это доказательство уж совсем
старое. Значение общих теорем о неподвижных точках для многих вопросов
анализа столь велико, что читатель обязательно должен заняться их изучением.
Здесь же мы будем пользоваться только одной теоремой о неподвижной точке,
а именно теперь уже классической теоремой Брауэра. Из нее мы выведем
«теорему о малых деформациях», совершенно прозрачную с интуитивной точки
зрения, которая будет играть значительную роль в следующей главе.
Можно считать, что дифференциальное уравнение A9.1) описывает движе-
движение жидкости, задавая ее скорость х в каждой точке (t, x). Эта интерпретация
принадлежит Эйлеру, в то время как с точки зрения Лагранжа семейство
линий тока в жидкости определяется функцией x(t, с), где с постоянно вдоль
каждой линии. В книгах по гидромеханике можно найти красивые чертежи, изо-
изображающие такие семейства. Доказано, что при классических предположениях
о гладкости эти две интерпретации эквивалентны. Кривые x(t, с) являются инте-
интегральными кривыми уравнения A9.1), а в качестве постоянной с можно взять зна-
значение х при t = 0. Вот почему мы говорим о задаче Коши, т. е. о задаче определе-
определения решения по начальным значениям. Однако такая задача может ие иметь
смысла без предположений о гладкости, и позднее, в теории оптимального
управления, мы в этом убедимся. В более общей ситуации можно считать
постоянную с просто меткой, фиксирующей огдельную кривую семейства. Это
соглашение может оказаться необходимым в условиях недостаточной гладкости.
На рисунке представлены две кривые С,, С2, которые касаются в начальной
и конечной точках Ро, Р?, а также в промежуточной точке fV Можно сде-
сделать так, чтобы они удовлетворяли одному и тому же уравнению вида A9.1)
3*
68
Гл. I. Метод геодезических покрытий
с непрерывной функцией p(t, х). Однако эти решения не определяются даже
целыми своими дугами от Я„ до Рх, так как их «хвосты» можно поменять
местами.
Для простоты сначала предположим, что функция p(t, x) определена во
всем пространстве (t, x) и удовлетворяет условиям
A9.2) |р(*,х)К1, \p(t, x+h)-p(t, лс)|<|А[
для всех векторов ft. Пусть функция g (t) задана; введем обозначение
1
p(x. g(x))dx.
Тогда нахождение решения x=g(l) уравнения A9.1), удовлетворяющего на-
начальному условию g @) = х0, равносильно нахождению функции g, для кото-
которой g=Tg. Другими словами, мы ищем неподвижную точку преобразования
Т в функциональном пространстве, элементами которого являются функции g.
Идея, лежащая в основе метода решения, совершенно естественна с точки
зрения теории неподвижных точек. Мы берем некоторый элемент g0 и рас-
рассматриваем предел выражения Tv g0. Если такой предел g существует, то он
будет пределом и для Tv+lgb, и, таким образом, g = T lim Tvg0 = Tg. В учеб-
учебниках no дифференциальным уравнениям этот метод называется методом по-
последовательных приближений Пикара. При доказательстве этим методом пред-
предполагается, что рассматриваемые функции непрерывны, а равномерная сходи-
сходимость на любом конечном интервале [<|<yV устанавливается посредством
грубой оценки, которая обеспечивает также и единственность решения.
Чтобы получить эту оценку, положим М = sup (| gt—g2 [) при |<|<JV,
гДе Si. Si — некоторые функции. Тогда, согласно A9.2), для значений /, при-
принадлежащих этому интервалу,
t-Tg2 | < J | g, (т)-g2 (x) | dx.
где интеграл берется по одному из отрезков 0 *S т sg t или t < т sg 0. Отсюда
при помощи несложного рассуждения по индукции получаем
Это и есть грубая оценка. Если обе функции gt и g2 являются различными
неподвижными точками преобразования Т, а значит, и преобразования Tv , то
М ?= 0, и, взяв sup по t, мы придем к неравенству M^MNV /v! < М при
больших V. Это противоречие доказывает, что М=0, т. е. что имеет место
единственность. Если мы теперь допустим, 4Togl=g0, g2 = Tg0, то, используя
§ 19. Необходимые сведения о неподвижных точках
ту же грубую оценку, легко показать, что ряд
мажорируется рядом Тейлора функции Ме^К Отсюда следует равномерная
сходимость этого ряда при | t | «S /V и, значит, существование функции
g = l\mTv g0, т. е. неподвижной точки.
V
3fn рассуждения нуждаются в незначительном усовершенствовании; если
предположить, что функция p(t,x) определена и непрерывно дифференцируема
только на замыкании ограниченной области С, то неравенства A9.2) заменя-
заменяются ограниченностью функции р и отношения модуля ее приращения к мо-
модулю приращения аргумента, т. е. вместо условий A9.2) мы имеем более
слабые условия, правые части которых отличаются от правых частей A9.2)
постоянным множителем К > 0. Однако если изменить масштаб для х, то без
ограничения общности можно предполагать, что К—\. Нашими грубыми
оценками и основанными на них выводами можно пользоваться до тех пор,
пока выполняемые операции не выведут последовательные приближения Tvg0
и их предел из области С, поэтому область изменения t придется ограничить
подходящим интервалом, который мы будем называть допустимым. Легко
видеть, что если @, х0) £ С, то любой достаточно малый интервал П|<б
является допустимым. В самом деле, выбирая в качестве g0 постоянную хе,
получаем
\Tg0-g0\ = \
Применяя наши оценки, имеем |Tvg0—g0 | «йбе1'1 «с бе6 , и если 6 мало, то
все точки (t, Tvg0) принадлежат области С Отметим также, что если /—до-
/—допустимый интервал для начального значения х0, равного некоторому с0, то /
будет допустимым и для дсо = с, где с — постоянная, близкая к с0. В этом
случае мы берем в качестве g0 неподвижную точку, соответствующую началь-
начальному значению с0, и тогда, обозначив через То преобразование Т, в котором
начальное значение с заменено на с0, при t£l имеем
g0-go | = | (с-с0) + (rogo-g0) | = | с-с0 |.
Отсюда мы снова находим, что | Tvg0—g0 |sg|c—c0 |e'' '<|c—c0 | e1 7|, где
|/|—длина интервала /. Так как с—с0 мало, то применимы предыдущие
рассуждения; попутно мы убеждаемся, что наши решения g непрерывно зави-
зависят от начального значения х0.
Эти результаты можно применить также и для доказательства непрерыв-
непрерывной зависимости решения от дополнительных параметров. Так, если р — не-
непрерывно дифференцируемая функция от (t, x, и) в некоторой области С про-
пространства (t, х, и) и если и принимает постоянное значение вдоль решения,
то нужно рассмотреть дополнительное уравнение и — О и представить пару
(х, и) в виде одного вектора. В частности, из A9.1) можно вывести диффе-
дифференциальное уравнение для разностного отношения, зависящего ог параметра ft,
и тогда, используя непрерывную зависимость решений от параметра ft, заклю-
заключаем, что если функция р (t, x) непрерывно дифференцируема r-f 1 раз, то
решения уравнения A9.1) г раз непрерывно дифференцируемы по t н на-
начальным значениям.
Теперь перейдем к рассмотрению неявных функций. Обозначим через f
векторную функцию от пары (х, и), где х— вектор той же размерности, что f,
а и—точка пространства параметров. Предположим, что f непрерывно диф-
дифференцируема, /@, 0) = 0и определитель матрицы /х отличен от 0. Мы утвер-
утверждаем, что в некоторой окрестности точки и = 0 существует одна и только
JO Гл. I. Метод геодезических покрытий
одна функция £(и), график которой лежит в достаточно малой окрестности
начала координат и которая удовлетворяет условию f (|(u), u) = 0. Кроме
того, функция £ и ее матрица Якоби £о непрерывны, и последняя удовлетво-
удовлетворяет соотношению
когда *=£(")•
Эта теорема о неявной функции эквивалентна аналогичной теореме о су-
существовании локального обратного отображения для отображения х—>■«.
Последняя сводится к теореме о неявной функции, если положить / (х, и) =
= и — и(х). Обратно, если отображение (х, и)—*(f, и) обратимо, то можно
выразить х через (/, и) и затем положить / —0. Условия локального обращения
соответствуют условиям существования неявной функции. Теорему о неявной
функции также можно сформулировать в виде теоремы о неподвижной точке
в пространстве функций |(и). Обозначим через Т| функцию £ («) + /(£(")> ")•
Тогда элемент £, для которого Г£ = |, будет решением х = |(и) уравнения
f(x, u)—0. Однако приведенное ниже доказательство (также очень старое)
этой теоремы не использует принципа неподвижной точки. Оно заимствовано
нами из книги Ковалевского об определителях. Существуют и другие столь
же хорошо известные доказательства. Заметим также, что в прямо».! доказа-
доказательстве существования локального обращения, приведенном в книге Рудина
«Основы математического анализа», рассуждения Ковалевского изменены лишь
незначительно.
Обозначим через f; i-ю компоненту вектор-функции f, а через F,- (л:, и) —
градиент компоненты /,• по х, вычисленный в точке (х, и). Так как, согласно
условиям теоремы, определитель F = F(xil), ... , .*<">, и), составленный из
векторов Ffix^'K и), не равен нулю при жA) = ж<2)= ... =х<") = 0, и = 0, то он
не равен нулю и при достаточно малых значениях и и каждого из векторов дс1'1.
Предположим теперь, что для одного и того же значения и существуют
два вектора х', х", для которых f (х, и)=0. Так как в этом случае };(х', и)—
— fi(x", u) = 0 при t=l, 2 п, то, согласно теореме о среднем значении,
на отрезке, соединяющем точки х', х", существует точка х('\ для которой
Fr{x'—x") = 0 (t=l, 2 я).
Последнее равенство возможно либо при F=0, либо при х' = х". Следо-
Следовательно, вблизи начала координат неявная функция определена однозначно.
В частности, если мы зафиксируем достаточно малое г > 0, то f (х, 0) Ф 0
при \x\-r. Следовательно, непрерывная функция \f(x, 0) |2 имеет на сфере
| х | = г положительный минимум [х > 0. Итак,
\f(x, 0)|22йц>0 при ]х\ = г,
|/(х, 0)|* = 0 при |*|-0.
Ввиду непрерывности, существует такое а > 0, что при |и| < а
\f(x, u)|2SsyH при |*|—г,
1/С*. «I2<уИ при |*|=0.
Следовательно, для любого и, удовлетворяющего условию |и|<0, функция
\f(x, u)\2 достигает своего минимума на шаре |х[<г во внутренней точке
*=£(")• В такой точке обязательно
0 = grad(|/(x. и)р) = 2Нх
(где градиент берется по *). Так как определитель fx отличен от нуля, то из
этого равенства следует, что /=0. Это доказывает существование решения.
$ 19. Необходимые сведения о неподвижных точках 71
Наконец, если обозначить через Д£ приращение | (ы + Аи) — К"),
а через F{, С,- градиенты по ^ и по и компоненты /,-, вычисленные в некото-
некотоой точке отрезка [(£, и), (£+Д|. и~\-Аи)\, зависящей от i, то соотношение
(| + А|, и-\-Аи) — /,■(!• и) = 0 можно записать следующим образом:
A9.4) **
Как и прежде, определитель, составленный из F/, не обращается в нуль, и по-
поэтому, решив линейное относительно Д| уравнение A9.4), можно выразить
Д£ линейно через Ди. Коэффициенты соответствующей матрицы остаются огра-
ограниченными при Аи—j-0, и, значит, функция | непрерывна. Используя анало-
аналогичные рассуждения, можно доказать существование частных производных.
Каждая из этих производных равна пределу отношения Д£/Л, когда Ди равно
произведению малого скаляра h Ф 0 н единичного вектора вдоль одной из
осей ы-простраиства. Поэтому если мы разделим уравнение A9.4) на Л и решим
его относительно A\jh, то A\lh линейно выразится через Auih, причем коэф-
коэффициенты соответствующей матрицы ввиду непрерывности функции | имеют
ограниченные пределы при h —>■ 0. Из этого, очевидно, следует существование
предела отношения A\jh. В то же время если разделить уравнения A9.4) на
h и устремить h—»-0, то получатся строки матричного уравнения A9.3).
Две уже рассмотренные в этом параграфе теоремы имеют локальный ха-
характер: они обеспечивают существование решения лишь вблизи некоторой
точки или кривой. Для перехода от локальных теорем к глобальным обычно
используют теорему Бореля о конечном покрытии: если некоторое семейство
окрестностей покрывает ограниченное замкнутое множество Е в евклидовом
пространстве, то из этого семейства можно выбрать конечное число окрестно-
окрестностей, покрывающих Е. В следующих главах мы применим эту теорему для
перехода от локальных по (t, x, х) или по (х, х) теорем к локальным по
(t, x) или по х теоремам. Доказательство теоремы Бореля можно найти в лю-
любом учебнике анализа.
Другой способ освободиться от ограничений типа локальности состоит
в том, чтобы сформулировать интересующую иас теорему в виде теоремы
о неподвижной точке. Мы уже показали, что обе рассмотренные выше теоремы
существования допускают такую формулировку. В евклидовом пространстве
основной теоремой о неподвижной точке является теорема Брауэра для л-мер-
ного замкнутого шара U: пусть Т—непрерывное отображение шара U в себя;
тогда существует точка х £ U, для которой Тх = х. Из этой теоремы были
получены более общие теоремы для других пространств. Доказательство тео-
теоремы Брауэра можно найти в книгах по топологии.
Приводимое ниже интуитивно очевидное утверждение является типичным
приложением теоремы Брауэра о неподвижной точке.
A9.5) Лемма. Пусть Т — непрерывное отображение шара U в некоторое
множество Е того оке пространства; предположим, что расстояние от любой
точки х до ее образа Тх не превосходит радиуса р шара U. Тогда множество
Е содержит центр шара U.
Строго говоря, в доказательстве леммы A9.5) теорема Брауэра исполь-
используется вместе с другим результатом, относящимся к границе 2 шара U.
А именно, отображение То границы 2 в себя, которое каждой точке х £ 2
ставит в соответствие ее антипод, т. е. диаметрально противоположную точку,
не имеет неподвижных точек. В самом деле, расстояние от каждой точки
х £ 2 до ее образа Тох равно диаметру 2р.
Мы докажем лемму A9.5) от противного. Допустим, что она неверна;
тогда легко построить отображение шара V в себя, не имеющее неподвижных
точек. Выполним отображение Т и затем спроектируем множество Е из центра
шара U на 2; мы получим отображение шара 0 в 2, при котором ни одна
точка границы 2 не удалена от своего образа на расстояние, большее р ]/ .
72
Гл. I. Метод геодезических покрытий
Выполнив затем отображение То, сдвигающее каждую точку сферы 2 на рас-
расстояние 2р, мы получим отображение шара U в его границу 2, которое не
имеет неподвижных точек на 2, а следовательно, не имеет неподвижных точек
и во всем шаре U. Так как полученное отображение непрерывно, то это про-
тиворечит теореме Брауэра о неподвижной
точке.
Назовем ^-деформацией1} непрерывное
отображение некоторого множества в другое
множество того же пространства, при ко-
котором расстояние между каждой точкой и
ее образом не превосходит некоторого р > 0.
Тогда A9.5) является леммой о р-деформа-
циях единичного шара. Из этой леммы мы
получим следующую общую теорему о р-де-
формации:
A9.6) Теорема. Пусть Q — ограниченное
множество в п-мерном евклидовом проспгран-
стве, и пусть Н—подмножество множества
Q, граница которого удалена от границы
множества Q на расстояние, не меньшее р; далее, предположим, что либо Q
замкнуто, либо Н открыто. Наконец, пусть Т — непрерывное отображение
множества Q в множество Q' того же пространства, при котором рассто-
расстояние от каждой точки x£Q до ее образа Тх £ Q' не больше р. Тогда НcQ'.
Частный случай этой (опять-таки интуитивно очевидной) теоремы о р-де-
формации потребуется нам в следующей главе; мы будем называть его леммой
Каратеодори. Лемма Каратеодори отличается от A9.6) только наличием допол-
дополнительных предположений:
(i) H, Q, Q'—области,
(ii) T отображает Q на Q',
(iii) H содержит по крайней мере одну точку Множества Q'.
Используя эти дополиительиые предположения, можно доказать лемму Кара-
Каратеодори непосредственно, не опираясь на теорему Брауэра о неподвижной
точке. Ниже мы приведем и это элементарное доказательство.
Деформированное
множества
Доказательство теоремы 19.6. Если соединить отрезком любую точку
А £ Н с любой точкой R границы Q, то этот отрезок будет содержать
точку S, принадлежащую границе множества Н, а по условиям теоремы рас-
расстояние SR ие меньше р. Так как Q замкнуто или Н открыто, то замкнутый
шар U с центром в точке А и радиусом р содержится в Q. Следовательно,
1} Следует отметить, что в этом параграфе термин «деформация» употреб-
употребляется в другом смысле, нежели в § 39 и 53.— Прим. ред.
§ 19. Необходимые сведения о неподвижных- точках 73
сужение отображения Т на V является непрерывным отображением в множе-
множество Q', и для этого сужения можно использовать лемму A9.5), согласно
которой А £ Q'. Таким образом, мы доказали7 что каждая точка из Н при-
принадлежит Q .
Доказательство леммы Каратеодори о деформации при допол-
дополнительных предположениях (i) — (iii). Вместо условия (i) достаточно
даже предположить, что // — область, a Q' —открытое
множество. Вычеркнем два последних предложения в
доказательстве теоремы A9 6) и продолжим начиная с
этого места. Покажем, что А не может быть гранич-
граничной точкой множества Q'. В противном случае точка А
была бы пределом точек Рх £ Q', которые можно (хотя
бы одним способом) представить в виде образов точек
Pv £Q при отображении 7"; при этом расстояние между
Pv и P'v не превышает р. Точки Яу имеют по край-
крайней мере одну предельную точку Ро, расположен-
ную на расстоянии, не превышающем р, от точки А и потому принадлежа-
принадлежащую Q. Ввиду непрерывности, А = ТР0 £ Q'. Так как Q' — открытое множе-
множество, то А не является его граничной точкой.
Таким образом, любые две точки множества Н можно соединить дугой,
лежащей в Н, которая не пересекается с границей множества Q'. Так как,
согласно (iii), одна из точек Н лежит в Q', то и любая другая точка из Н
лежит в Q'.
Замечание. Подготавливая читателя к чтению гл. II, мы предположили,
что ему известны такие понятия, как равномерная сходимость и граница
области, а также теорема Бореля о покрытии. Вообще, при переходе от одной
главы к другой уровень математической подготовки, необходимой для пол-
полного понимания излагаемой теории, может повыситься. Читатель, не достиг-
достигший соответствующего уровня, не должен сдаваться: это обстоятельство
должно стать дополнительным стимулом для приобретения недостающих ему
знаний.
Глава II
Двойственность и локальное погружение
§ 20
Введение
Как уже говорилось, мы собираемся показать, что наш метод не является
бесплодным, по крайней мере в локальном смысле. Помня об этой вполне
конкретной цели, читатель с удивлением обнаружит уже в следующем параг-
параграфе, что его увели в сторону, заставив заняться формальными рассужде-
рассуждениями о гамильтонианах и канонических координатах, рассуждениями, напо-
напоминающими, быть может, об увядшей элегантности старого времени с его
изобилием формул. В те дни все были помешаны на гамильтонианах и эллип-
эллиптических функциях. К тому же они определялись неявно, а во времени все
делалось локально, и вся теория оказывалась переполненной неявными
функциями. Затем наступила новая полоса: нн в знаменитых Fondamenti
Тонелли, ни в теории Марстона Морса «в целом» о гамильтонианах даже не
упоминается.
На самом деле гамильтонианы неразрывно переплетаются с понятием
выпуклости и, в частности, с двойственностью выпуклых фигур. В настоящее
время это обстоятельство является фундаментальным для ряда областей ана-
анализа, особенно для функционального анализа. В идейном отношении гамиль-
гамильтонианы сравнимы по своей значимости с комплексными числами. В то же
время (и отчасти благодаря тому, что они по-новому освещают наш предмет
и его взаимосвязь с другими дисциплинами) гамильтонианы порождают почти
такую же мистическую атмосферу двойственности, с которой приходится
сталкиваться при первом знакомстве с комплексными числами и которую
можно сравнить с ощущениями человека, попавшего в фантастический мир,
где время течет в обратном направлении. Несомненно, что у маленького
ребенка захватывает дух, когда он после уверенного передвижения на четве-
четвереньках начинает делать первые робкие шаги. И подобно тому как ребенку
оказывается ненужным умение молниеносно взлетать на четвереньках по лест-
лестнице, в математике вдруг обнаруживается полная бесполезность феноменально-
феноменального мастерства в мгновенном решении задач на более низком уровне.
В этой главе мы все еще используем классический подход к гамильто-
гамильтонианам и каноническим координатам, так что определения здесь даются в ло-
локальной форме. Это неудобно лишь отчасти, поскольку их можно применять
к многообразию, заданному в локальных координатах. (Позднее будет дан
другой подход, который понадобится нам в теории оптимального управления.)
Определения, а также формулировка теорем существования и локального
погружения в параметрическом и непараметрическом случаях будут различными.
§ 21
Преобразование Лежандра
Так мы называем частный случай преобразования, известного в старину
под названием преобразования полюсов и поляр,— того самого, которое встре-
встречается в классической геометрии в теории конических сечений и кривых
второго порядка — предмете чрезвычайно модном в то время, когда было
введено понятие гамильтониана. Мы рассматриваем пространство, изоморфное
§ 22. Гамильтонианы и их свойства 75
пространству (/, л:), в котором переменными являются скаляр s и вектор г.
Одновременно мы рассматриваем другое такое же пространство, в котором
переменными являются s* и г*. При желаний можно считать, что это два
экземпляра одного н того же пространства. -
В пространстве (s*, г*) рассмотрим отображение, которое переводит точки
в гиперплоскости, н наоборот; пусть точке (а. Ь) оно ставит в соответствие
гиперплоскость s-\-a — bz, и обратно. Другими словами, координаты точки
становятся коэффициентами уравнения гиперплоскости. Это отображение из-
известно как преобразование полюсов и поляр по отношению к параболоиду
2s = г2. Оно определяется билинейным соотношением
и мы будем называть его преобразованием Лежандра. Это одно из целого класс а
преобразовании, давно используемых геометрами для иллюстрации двойст-
двойственности между точками и гиперплоскостями. Как это принято, мы будем
еще сопоставлять множеству точек огибающую соответствующего множества
гиперплоскостей, если она существует.
При помощи преобразования Лежандра мы определим также преобразо-
преобразование, переводящее гладкую функцию /. (г) в новую функцию Н (г*). Для
этого обозначим через Г график
Этот график является огибающей множества у своих касательных гиперпло-
гиперплоскостей. В точке (L(z0), г0) £ Г касательная гиперплоскость определяется
уравнением
s=yoz — Ho,
где yo = L2e, Н0=у„г0 — Ь(г0). Преобразованием Лежандра Г* огибающей Г,
или точнее \гаожества у, называется многообразие в пространстве (s*, г*),
заданное параметрически формулами
B1.1) s- = zLz-L(z), z* = Lz.
где г —параметр. Если это многообразие представляет собой график s*=Н (г*>
однозначной функции Н, то Н является искомым преобразованием функции £•
В общем случае многообразие Г* может и не быть таким графиком.
В этом случае преобразованную функцию Н (г*) можно определить локально.
Для этой цели допустим, что у0, Ио определены так же, как и прежде, при
фиксированном г0 и что матрица Ьгг невырожденна в точке г0. Согласно
теореме о неявной функции, векторное уравнение г* — Ц, можно решить отно-
относительно г вблизи точки z0> так что z=<p(z*), где г* принимает значения
вблизи у0. Подставив это значение г в выражение для s* из B1.1), получим
s*=#(z*), где // — искомое локальное преобразование Лежандра функции L.
В дальнейшем мы применим это преобразование к лагранжиану L (t, x, x)t
рассматриваемому как функция от вектора г = х. Полученная в результате та-
такого преобразования функция Н будет записываться в виде И (f, x, у), где
у=г*.
§ 22
Гамильтонианы и их свойства
В этом параграфе мы ограничимся случаем, когда лагранжиан
L (t, х, х) удовлетворяет следующему условию: в некоторой точке
(*о> ^о- -"О матрица Lxi , составленная из частных производных
второго порядка по х, невырожденна. (Кстати, это означает, что
7б Гл. II. Двойственность и локальное Погружение
мы рассматриваем только непараметрический случай, ибо в пара-
параметрическом случае, как мы увидим, эта матрица всегда вырож-
денна.) Вблизи точки (/„, х0, у0), где y() = Lx{t0, х0, х0), назо-
назовем локальным гамильтонианом или просто гамильтонианом
функцию
B2.1) H(t, х, у),
полученную, как описано в предыдущем параграфе, путем реше-
решения относительно х уравнения y-=Lx и подстановки найденного
значения х = <р(/, х, у) в выражение
B2.2) H = xy—L.
Переменные (/, х, у), являющиеся аргументами гамильтониана
B2.1), называются каноническими.
Как и следовало ожидать ввиду симметрии преобразования
Лежандра, связь между L и Н симметрична, и решение урав-
уравнения y — Lx можно представить в виде
B2.3) х = Ну.
В самом деле, при постоянных (/, х) и при * = <р(/, х, у)
Заметим, что при х = <р(/, х, у)
B2.4) Hx = y<vx-Lx-Lk<vx = -Lx.
Отсюда следует, что если выполняется равенство B2.3), то урав-
уравнение Эйлера можно записать в виде у=—Нх. Тем самым экстре-
экстремали определяются парой уравнений
B2.5) х = Ну, у = -Нх.
Мы назовем эти уравнения каноническими уравнениями Эйлера.
Иногда канонические уравнения удобнее записывать в виде
одного уравнения для точки (х, у) —г 2я-мерного пространства.
Для этой цели введем обозначение z = x-\-iy, рассматривая г
как комплексный вектор. Далее, положим
дг дх ' ду
и назовем транспонированным градиентом дифференциальный
оператор
дг~ду 1дхш
§ 22. Гамильтонианы и их свойства 77
В этих обозначениях уравнения B2.5) можно записать в виде
или z = — iHz, т. е. окончательно
B2.6) z = transp gradtf.
Заметим, что величины у, Н сохраняют тот же смысл, кото-
который мы приписали им в предыдущей главе, когда переменными
были /, х, х. Это означает, что гильбертова дифференциальная
форма опять имеет вид ydx—Н dt; если вместо у подставлена
некоторая функция q(t, x), или, что приводит к тому же резуль-
результату, если вместо х подставлена функция p(t, x), где р — Ну при
y~q(t, х), то форма ydx—Нdt будет полным дифференциалом
dS функции переменных /, х тогда и только тогда, когда при
y = q(t, x)
B2.7) y^Sx, —H = St.
Исключив у, получим уравнение с частными производными
B2.8) St + H{t, х, Sx) = 0.
которое называется уравнением Гамильтона—Якоби. В это урав-
уравнение S не входит явно, или, точнее, оно содержит только част-
частные производные от S. Кроме того, оно разрешено относительно St.
Таким образом, из вариационной задачи с лагранжианом
L(t, х, х) мы получили локальный гамильтониан H(t, x, у) и
соответствующее локальное уравнение с частными производными
B2.8). В теории уравнений с частными производными уравнение
вида B2.8) оэычно задается не только локально, но и глобально.
Обратно, имея локальное или глобальное уравнение с частными
производными вида B2.8), мы определяем соответствующий гамиль-
гамильтониан H(t, х, у), а затем, исключив у из уравнений
х — Ну, L — xy—Н,
находим лагранжиан L(t, x, х). В этом случае, однако, лагран-
лагранжиан L будет только локальным, и нужно еще предположить,
что матрица В, составленная из частных производных второго
порядка от гамильтониана Н по у, невырожденна. Таким образом,
L и Н обменялись ролями.
На самом деле произведение АВ матриц Д = /.^и В — Нуу
всегда является единичной матрицей. Это можно установить, диф-
дифференцируя по х тождество
//„(/, х, Lk)='x.
78 Гл. II. Двойственность и локальное погружение
Отсюда следует далее, что соотношения г) = А%, | = Bt], связыва-
связывающие пару векторов |, v\, эквивалентны и что квадратичную
форму Q=%r\ можно записать в любом из следующих видов:
. B2.9) Q = 2]Л,Д& == 2В«^П*-
Функцию Вейерштрасса также можно выразить через гамиль-
гамильтониан Я, когда последний определен для соответствующих зна-
значений у. Если мы положим q = L-x при х = /? и опустим для крат-
краткости аргументы t, x ъ рассматриваемых функциях, то получим
§ 23
Характеристики в смысле -Коши
Уравнение Гамильтона — Якоби в частных производных B2.8) является
частным случаем более общего уравнения
B3.1) St + H(t, х. Sx, S)=0,
в котором вместо нашего гамильтониана стоит функция Н (t, х, у, г), завися-
зависящая еще дополнительно от скаляра г. Для этой более общей функции Н мы
проведем вычисления, аналогичные тем, которые в предыдущей главе привели
нас к уравнению Эйлера. На этот раз мы отождествим и с х, так что Н будет
единичной матрицей, но мы будем пользоваться старыми обозначениями. Зада-
Зададимся семейством u = p(t, и) и дополним тождественное отображение до отобра-
отображения (t, и)—>■(/. х, у, г) посредством пары функций у, г от (t, и), т. е. от
(t, x). Предположим, что при такой замене переменных дифференциальная
форма
B3.2) ydx—Hdt
становится точной, т.е. превращается в полный дифференциал dS гладкой
функции S переменных (t, и), и что dS — dr.
Тогда скобки Лагранжа [а, а*], [а, <], те же самые, что и прежде, ввиду
точности формы обращаются в нуль. Далее, совпадение дифференциалов dS и dr
приводит к обращению в нуль величин
, . дг дх , .. дг , „ дх
ьч+И»
Эти два соотношения можно заменить следующими:
B3.3) [г, a] = R-yX, [r, t\\-u[r, u] = r+H^
Далее,
В вычислениях, проведенных в § 14 предыдущей главы, правая часть соответ-
соответствующего выражения имела вид Ух—XLX. Теперь же —Lx заменено на Нх и
имеются дополнительные члены
Y(Hy-'x
§ 23. Характеристики в смысле Коши 79
В остальном наши вычисления не изменяются. Раньше они привели нас К урав-
уравнению A4.5), теперь же, учитывая разницу, мы получим вместо этого равенство
y [a, и],
или, используя первое из соотношений B3.3), равенство
B3.4) X(y + yH, + Hx) + Y(Hy-x) = [<x, t] + i[a, u]-[r,a]Hr.
Поэтому если мы выберем семейство u = p(t, и) так, чтобы р—Ну, и положим
и=х, то ввиду обращения в нуль всех скобок Лагранжа равенство B3.4)
и второе из соотношений B3.3) дают нам систему уравнений
B3.5) х-Ну = 'у + уНг + Нх^'г-гН-уНу = О,
и, кроме того, первое из соотношений B3.3) приводит к равенству у = гх.
Кривые, определенные в пространстве (t, х, у, г) посредством дифферен-
дифференциальных уравнений B3.5), или точнее нх проекции в пространство {t, x),
называются характеристиками в смысле Коши дифференциального уравнения
в частных производных B3.1). Если Н не зависит от г, то уравнения B3.5)
сводятся к каноническим уравнениям Эйлера B2.5), а характеристики совпа-
совпадают с экстремалями задачи, гамильтонианом которой является функция Н.
Таким образом, загадка появления уравнения Эйлера в § 14 разрешена. Это
уравнение возникает как следствие стандартных выкладок, используя которые
Коши задолго до нас определял свои характеристики.
Можно считать, что значения величин у, г вдоль характеристики опреде-
определяют в пространстве (t, х, г) эле.ментарную площадку (бесконечно малый кусок
поверхности), передвигающуюся вдоль кривой, которая проектируется в нашу
характеристику. Мы будем формально различать две характеристики, состоящие
из одних н тех же точек, на которых соответствующие подвижные элементарные
площадки различны.
Важная роль, которую характеристики в смысле Коши играют в теории
дифференциальных уравнений с частными производными, продемонстрирована
во многих книгах, посвященных этому предмету. Здесь же мы упомянем только
следующее хорошо известное свойство характеристик, которым, впрочем, мы в
дальнейшем пользоваться не будем.
B3.6) Теорема. Пусть С—характеристика, а Р— точка на С. Далее, пусть
2—соответствующая элементарная площадка над точкой Р. Тогда любые два
гладких решения уравнения B3.1), совпадающие в точке Р и содержащие пло-
площадку 2, совпадают и касаются одно другого в любой точке характеристики С.
Действительно, если t0, х„, уп, г0 определены посредством Р, 2 и если
S(t, x) — одно из двух данных решений, то вдоль семейства кривых, опреде-
определяемого дифференциальным уравнением
x=Hv(l. х, Sx, S) = p(t, x),
величины y = Sx, r = S вместе с t, x удовлетворяют системе B3.5). Поэтому
величины t, х, у, г, рассматриваемые как функции от t, однозначно опреде-
определяются начальными значениями t0, x0, у„, г0 и системой B3.5), и совпадают
с значениями соответствующих величин в точках кривой С. Таким образом,
вдоль этой кривой два решения и их частные производные должны совпадать,
как и утверждалось (в случае частной производной Sf это совпадение следует
из B3.1) и из совпадения частных производных Sx).
gQ Гл. II. Двойственность и локальное погружение
§ 24
Двойственность и стандартный гамильтониан в параметрическом
случае
Преобразование, которое лежит в основе теории параметри-
параметрического гамильтониана, уже не является преобразованием Ле-
жандра; это более простое преобразование полюсов и поляр
относительно единичной сферы. То же преобразование, хотя и под
другим именем, появляется и в функциональном анализе. Нам
оно понадобится применительно к пространству п измерений.
(Оказывается, что в параметрическом случае матрица L-x- всегда
вырожденна; причину этого мы выясним позднее.)
Рассмотрим два евклицовых пространства, в которых переменными являются
соответственно у и г. Точке у первого из этих пространств поставим в соот-
соответствие гиперплоскость в г-пространстве, заданную уравнением
B4.1) «/г=1.
То же самое уравнение определяет и гиперплоскость в {/-пространстве, которая
соответствует точке г. Очевидно, что любая гиперплоскость, не проходящая
через начало координат, является прн таком соответствии образом одной
и толькой одной точки. Назовем эту гиперплоскость полярой рассматриваемой
точки, а точку — полюсом гиперплоскости. Не оговаривая этого особо, мы ис-
используем в дальнейшем элементарные свойства симметрии нашего преобразования,
например то, что гиперплоскости, проходящие через точку у, преобразуются
в точки ее поляры. Это утверждение можно распространить и на гиперплоскости,
проходящие через начало координат, если договориться, что они преобразуются
в «бесконечно удаленные точки».
Пусть / — кривая или просто множество точек в {/-пространстве, и пусть
в каждой точке множества / существует касательная гиперплоскость. При
соответствии полюс — поляра / порождает множество F в г-пространстве,
состоящее из полюсов гиперплоскостей, касательных к множеству /. Назовем F
полярным множеством, соответствующим /, илн полярой множества /. Если мы
теперь множеству F поставим в соответствие его поляру в {/-пространстве, то
окажется, что последняя часто совпадает с исходной кривой /; однако для
справедливости этого утверждения в общем случае приходится ввести некоторые
соглашения.
Так, если множество / представляет собой фигуру, состоящую из двух
полуокружностей, соединенных двумя параллельными касательными, то при под-
подходящем выборе системы координат в {/-плоскости множество F будет состоять из
точек вида
е1в
1 + а | cos 9 | '
где г, 8—полярные координаты и а—положительная постоянная. В этом слу-
случае F не имеет касательной в точках ± i, и его полярой будет исходное мно-
множество /, но без параллельных касательных отрезков. Для того чтобы присое-
присоединить к поляре эти два отрезка, мы должны договориться, что касательными
к F в точках ± i считаются всевозможные прямые, проходящие через эти точки
и заполняющие угол между касательными к двум дугам множества F, которые
соединяются в этих точках.
Применительно к параметрической вариационной задаче / будет индика-
индикатрисой в точке х, т. е. множеством точек г, удовлетворяющих условию
§ 24. Двойственность и стандартный гамильтониан g]
L(x, z)=l. Точнее говоря, в. рассматриваемой здесь локальной теории в ка-
качестве / берется часть индикатрисы, расположенная вблизи некоторой ее точки р.
Наши определения применимы тогда в окрестности линейного элемента (х, х),
такого, что L (х, х) > 0; вектор р получается прн этом умножением х на под-
подходящий положительный множитель. Их можно применить н в случае L < О,
если взять в качестве / множество точек г, удовлетворяющих условию
L(x,z) = —1, или его часть. Линейные элементы, для которых L = 0, следует
исключить из рассмотрения.
Аналитически фигуратрису F можно определить как множество
точек у, имеющих вид
B4.2) y = Lx, где L(x,x) = l.
Поскольку L и ].-х положительно однородны соответственно сте-
степени 1 и степени 0, условие L(x, x) = l можно заменить здесь
условием L (х, х) > 0. Кроме того, мы будем здесь иметь дело
только с окрестностью некоторого фиксированного линейного
элемента, в которой это условие выполняется. Стандартный га-
гамильтониан Н определяется условием Н {х, у) = \ для у, принад-
принадлежащих фигуратрисе F, построенной в точке х, и соглашением
о положительной однородности функции Н(х, у) по у. Этот
стандартный гамильтониан проявляет наибольшую симметрию
и по-настоящему двойствен лагранжиану L. Другие допустимые
гамильтонианы будут введены позднее. Для определения гамиль-
гамильтониана Н и установления основных его свойств мы могли бы
воспользоваться неявными функциями, но проще использовать
для этого уже развитую непараметрическую теорию. Эту теорию
нельзя применить к параметрическому лагранжиану L непосредст-
непосредственно, так как в этом случае матрица L^. всегда вырожденна.
(Это свойство параметрического лагранжиана уже отмечалось; оно
будет доказано в этом параграфе.) Однако она применима к дру-
другому лагранжиану, который оказывается подходящим для нашей
цели.
Чтобы убедиться в этом, введем лагранжиан
B4.3) f(x, x)=4"L2
82 Гл. II. Двойственность и локальное погружение
и обозначим через А* матрицу, составленную из частных произ-
производных второго порядка лагранжиана L* по х и вычисленную
для некоторого линейного элемента (х, р), удовлетворяющего
условию L(х, р)=\. Дифференцируя но х соотношение
и полагая х = р, L= 1, получим
B4.4) A* = A
где Q—матрица, составленная из произведений компонент вектора
q = Lp(x, p). Для того чтобы применить теорию, разработанную
для непараметрического случая, нужно предположить, что матрица
А* невырожденна, т. е. что ее ранг равен п.
Это последнее условие можно преобразовать в условие, касающееся только
матрицы А. Заметим сначала, что ранг матрицы А не превосходит я—1, так'
что матрица А заведомо вырожденна. Для доказательства этого факта приме-
применим к векторной функции L.=f(x) формулу Эйлера, относящуюся к одно-
однородным функциям степени т, т.е. формулу xf. = mf. Полагая /л = 0, х = р,
получим
B4.5) Ак = О при х=р.
Отсюда следует, что ранг матрицы А не превосходит п—1.
Запишем теперь любой вектор в виде
B4.6) l=r) + lp, где г)<7 = 0,
для чего следует положить А. = £</, т] = |—/>(£<?)■ (Здесь, как указано выше,
q=Lp.) Очевидно, что Q|=A.<7 и, ввиду B4.5), А\ = Ат\. Согласно B4.4), из
соотношений B4.6) получаем
B4.7) И|=ИЧ А*£=Аг) + Ц, g А%=г) АЧ + №.
Теперь легко показать, что матрица А* невырожденна, т. е. ее ранг равен п,
тогда и только тогда, когда ранг матрицы А равен я—-I, или, что то же самое
ввиду B4.5), когда из соотношения А%=0 следует, что | отличается от р ска-
скалярным множителем.
Поскольку матрица А симметрична, B4.5) равносильно тому, что рА=0,
а потому, в силу второго из соотношений B4.7), рА%=К; следовательно,
если /4*|=0, то обязательно А = 0 н Аг\ = 0. Если ранг матрицы А равен
и—I, то т] получается из р умножением иа скалярный множитель и соотно-
соотношение Аг] — О имеет место только при т] = 0, так как одновременно тде = 0,
pq — \. Таким образом, из соотношения /4*| = 0 следует в этом случае, что
|-0, т. е. А* невырождеина. Обратно, если А* невырожденна, то в силу
первого соотношения B4.7) равенство /4£ = 0 влечет за собой равенство £ = Ар,
следовательно ранг матрицы А равен л—-I.
Далее, будем говорить, что лагранжиан L удовлетворяет параметрическому
условию Лежандра, если квадратичиая форма |Л*| положительно определена.
Согласно третьему нз соотношений B4.7), это имеет место тогда и только тогда,
когда
B4.8) г)Лт] > 0 везде, где щ = 0 и т] ф 0.
§ 24. Двойственность и стандартный гамильтониан S3
Заметим, что условие невырожденности матрицы А* (равносильное тому,
что ранг матрицы А равен я—I) было нарушено в примере, рассмотренном
выше в этом параграфе и проиллюстрированном изображениями множеств
/ и F. А именно, оно не выполняется для части множества /, состоящей из
прямолинейных отрезков. Таким образом, этот пример показывает, с какими
трудностями мы сталкиваемся при нарушении этого условия.
Обозначим через х, у и Н*(х, у) канонические переменные
и гамильтониан, соответствующие лагранжиану L* в окрестности
вектора х — р, так что у близок к q — Lp=--L*p. Положим
где Н = Н(х, у). Функцию Я будем считать определенной только
там, где Я* положительна, и припишем ей положительный знак.
Покажем, что Я определена вблизи y = q и является положи-
положительно однородной функцией первой степени по у; кроме того,
Я = 1 во всех точках этой окрестности, где у имеет вид L-x , в част-
частности при y = q. Обратно, для х, расположенных вблизи р, и у,
расположенных вблизи q, решение уравнения B4.2) можно полу-
получить, положив
B4.9) х = Ну, где Н(х, у) = \.
Чтобы убедиться во всем этом, заметим, что если выполняется
B4.2), то L*=\/2 и y = L*k, xy=\, Н* = ху—/,* = 1/2, а следова-
следовательно, Я=1. Так как L*—положительно однородная функция
второй степени, то отображение х—yy — L\ положительно одно-
однородно первой степени, а ввиду единственности и обратное отобра-
отображение обладает этим свойством вблизи x — p,y = q. Поэтому выра-
выражения L*, ху, Н* являются положительно однородными функциями
второй степени по х и у и, значит, Я—положительно однородная
функция первой степени. Наконец, если Я=1, то B4.9) эквива-
эквивалентно, очевидно, соотношению х — Щ, а согласно непараметри-
непараметрической теории, это соотношение в свою очередь определяет един-
единственное решение уравнения y=-L^. .
Теперь можно, используя однородность, продолжить функцию
Я, определенную пока лишь вблизи (х, q), на все пары (х, у),
для которых (х, су) находится вблизи (х, q) при некотором о ^ 0.
Продолженную таким образом функцию Я (х, у) назовем стан-
стандартным гамильтонианом нашей параметрической задачи в окрест-
окрестности (х, q).
Из соотношений B2.4), записанных для L* и Я*, в случае,
когда L = H = 1 и вместо х подставлено Ну, получаем
Lx ='— Нх.
84 Гл. П. Двойственность и локальное погружение
Это означает, что уравнение Эйлера, выведенное нами в § 14 гл. I
как для параметрического, так и для непараметрического случая,
в канонической форме опять приводится к паре уравнений
при условии, что / — геодезический параметр, т. е. такой параметр,
для которого вдоль рассматриваемых кривых L(x, x) = l.
Задача. Покажите, что матрица S, составленная из частных производ-
производных второго порядка функции Н по переменным у, удовлетворяет соотноше-
соотношению Bq = O и что ранг матрицы В равен п— I.
§ 25
Другие допустимые параметрические гамильтонианы
Удовлетворительные определения гамильтониана и канонических перемен-
переменных в параметрическом случае можно получить исходя нз непараметрического
случая по образцу предыдущего параграфа. Однако существуют и другие
способы перехода от одного случая к другому, и в вариационном исчислении
очень важно уметь выполнять этот переход по возможности свободно. Поэтому
удобно допустить большую гибкость в определении гамильтониана, и мы введем
сейчас целый класс допустимых параметрических гамильтонианов Н (х, у),
соответствующих одному н тому же лагранжиану L (х, х). Каждому такому
гамильтониану мы сопоставим соответствующий выбор параметра t на всех
рассматриваемых допустимых кривых.
Мы ограничимся здесь рассмотрением линейных элементов
(к, х), лежащих в окрестности N некоторого линейного элемента
(х0, р), такого, что L=/=0 и матрица А имеет ранг п—1 (согласно
сказанному в предыдущем параграфе, это означает, что матрица
Л* невырожденна). Поскольку мы имеем дело с параметрическим
случаем, предполагается также, что если (х, x)£N, то (х, сх)£ N
для каждого а>0.
Рассмотрим класс функций Н (х, у), для которых при (х, х) £ N
и у — Lx выполняются следующие два условия:
B5.1) (а) Я(х, у)-const, (b) xHv^0.
Такую функцию Н назовем допустимым локальным гамильто-
гамильтонианом, если она определена в некоторой окрестности канонической
точки (х0, д), где q = Lx(x, i)|№i p).
Ввиду непрерывности частных производных второго порядка
лагранжиана L матрица А имеет ранг п—1 вблизи (х0, р),
и мы выберем окрестность N так, чтобы в ней всюду выполня-
выполнялось это условие. Теперь точно так же, как в B4.5), Ах — О,
где А вычисляется в точке (х, х)€ N. Взяв частную производную
по х, мы находим из B5.1) (а), что НуА = 0, когда y = L-x .
§ 25. Другие допустимые параметрические гамильтонианы $5
Следовательно, существует такой скаляр X, что
B5.2) х = КНу, когда y^Lx,
и, ввиду B5.1) (Ь), Х^О, а следовательно, Х>0 в окрестности
Л/, так как хфО. Умножая скалярно B5.2) на Lx и вводя
обозначение уНу — \/ц при y = Lx, получаем
K = \iL(x, х).
Поскольку у, рассматриваемая как функция от х, положительно
однородна нулевой степени, тем же свойством обладает и функ-
функция р. Значит, X, подобно L, есть положительно однородная
функция первой степени, т. е.
Х(х, ах) = оХ(х, х) для о > 0.
Вспоминая далее, что Х>0, мы можем на любой допустимой
кривой, линейные элементы которой принадлежат окрестности N,
произвести такую замену параметра, что для всех линейных
элементов этой кривой X станет единицей. Параметр t, для ко-
которого это справедливо, назовем каноническим параметром,
соответствующим гамильтониану Н.
В предыдущем параграфе мы выяснили, что для стандартного
гамильтониана уравнения y = Lx, L(x, x) — 1 имеют единствен-
единственное решение вида x = f(x, у). Аналогичный вывод, конечно, можно
сделать и для уравнений y = Lx, L(x, x) = —-1. Так как h>0
и X—положительно однородная функция первой степени, в то
время как Lx положительно однородна степени 0, такой же
вывод можно сделать и для уравнений y = Lx, X(x, х) = 1,
а формула B5.2) показывает нам тогда, что выраженное через
допустимый локальный гамильтониан Н решение этих уравнений
имеет вид х—-Ну.
Далее, если М—матрица, составленная из частных производ-
производных функций Lx по х, то при y — Lx, с одной стороны, имеем
Lx = Xjr-L- —Mx = XMHv,
а с другой стороны, вычислив частные производные по х от
B5.1) (а), получим
Н
Значит, при y = Lx выполняется равенство Lx + Я#х=»0 и, сле-
следовательно,
когда Х = 1 и либо y = Lx, либо х — Ну.
86 Гл. //. Двойственность и локальное погружение
Таким образом, мы видим, что для допустимого локального
гамильтониана Н и соответствующего ему канонического пара-
параметра / уравнение Эйлера в параметрическом случае опять при-
принимает канонический вид
х = Ну, {/ = — Нх,
точно такой же, как в непараметрическом случае.
Составляющие параметрического уравнения Эйлера безусловно
не являются независимыми. Комбинацию
можно записать в виде
что равно
и ввиду однородности обращается в нуль. Аналогично, комби-
комбинация
приводится к виду
и равна -г: Н; значит, она обращается в нуль на любой кривой,
на которой Н постоянна, а следовательно, на любой канонической
кривой, на которой х — Ну и Х = 1.
§ 26
Локальный переход от параметрического случая
к непараметрцческому
Рассмотрим снова окрестность N линейного элемента (х0, р),
в которой выполняются указанные выше условия. Выберем ко-
координатную ось хп так, чтобы соответствующая компонента век-
вектора р была отлична от нуля; меняя, если нужно, направление
оси, можно сделать эту компоненту положительной. Сузим
теперь окрестность N так, чтобы для всех (х, х) € N компонента
хп вектора х вдоль оси хп была положительна. Это означает,
что на любой допустимой параметрической кривой, линейные
элементы которой лежат в N, параметр t можно выбрать так,
чтобы он совпадал с х„.
§ 26. Локальный переход 87
Обозначим через £ вектор, состоящий из первых п— 1 ком-
компонент вектора х, и положим t = xn. Изменив обычный порядок
координат, будем писать (t, |) вместо х. Если рассматривать t
как параметр, то L(x, x) преобразуется в L(t, £, |), так как
i = (/, I), a t = \.
Учитывая это значение t, мы можем из соотношения одно-
однородности L(x, x) = xL-x выразить частную производную L-t через
функцию L. А именно,
h = 1-Щ
и, следовательно, L-t = — H(t, £, х\) при т) = £; , где Н—непара-
Н—непараметрический гамильтониан, построенный по лагранжиану L, а £,
т]—соответствующие канонические переменные.
Определим теперь параметрический гамильтониан Н (х, у)
равенством
Н{х, y) = yn + H(t, l, л),
где у„ есть /г-я компонента вектора у, а г\ есть (п—1)-мерный
вектор, состоящий из остальных компонент вектора у.
Покажем, что Н является допустимым локальным гамильто-
гамильтонианом, отвечающим лагранжиану L, и что t—соответствующий Я
канонический параметр. Для этого заметим, что первые п — 1
компонент вектора L-x совпадают с компонентами вектора L; ,
а последняя компонента, как мы видели, равна —H(t, £, L-).
Следовательно,
Н(х, Ь) = 0.
Далее, если y = Lx, то
УНу =Уп
где т] = £^. Значит, yHv = L = L и, следовательно,
Х(х, х)=1.
Ввиду B5.2) условие хНу^0 автоматически выполняется, так
что Н является допустимым локальным гамильтонианом.
Таким образом, мы можем перейти от параметрического слу-
случая к непараметрическому и наоборот. Конечно, в глобальной
гамильтоновой теории это будет уже не так.
Непараметрические уравнения Эйлера совпадают с первыми
п—1 из параметрических уравнений, а последнее параметри-
параметрическое уравнение является следствием остальных; его можно
записать в виде
B6.1) ±H(t, I, тд = Ни
88 Гл. II. Двойственность и локальное погружение
или же, вычислив полную производную в левой части, в виде
i
= 0, что, в силу непараметрических канонических
уравнений Эйлера, сводится к тождеству —i
Уравнение B6.1) имеет и самостоятельное значение. Оио оказывается
полезным для задач, в которых Н ие содержит / явно, так как в этом слу-
случае B6.1) утверждает, что Н постоянна вдоль экстремали (закон сохранения
энергии в механике). Например, это утверждение применимо к функции Н*
из § 24, которая оказывается постоянной вдоль любой из (непараметрических)
экстремалей x*(t). Постоянное значение функции Я* близко к 1/2, если ли-
линейные элементы экстремали x*(t) принадлежат достаточно малой окрестности
линейных элементов экстремали, для которой Н* =1/2. Соответствующее зна-
значение Н равно постоянной, близкой к единице. Так как x*(t) удовлетворяет
каноническим уравнениям Эйлера для гамильтониана //*, то при подходящем
выборе постоянной с, близкой к единице, **(<:/) удовлетворяет каноническим
уравнениям Эйлера для гамильтониана Н. Значит кривая к* (t) является
параметрической экстремалью. Аналогичным образом можно "проверить, что
точное семейство экстремалей для Н* превращается в точное параметрическое
семейство экстремалей для Н. Обратные утверждения очевидны.
Пример. В каждой из задач (а), (Ь), (с), рассмотренных во
вступлении, определите непараметрический и все параметрические
гамильтонианы, а также соответствующие этим гамильтонианам
окрестности линейных элементов и канонические параметры.
§ 27
Погружение экстремалей в трубки «в малом»
Производя все эти — казалось бы, нескончаемые—формальные построения
локального характера, мы не забывали нашу основную цель, и вот наконец
мы к пей приблизились. В идеальном случае войны выигрываются решающей
короткой битвой; так, Вильгельм Завоеватель решил судьбу Англии в один
день. Период подготовки, однако, может показаться бесконечным. Пока наша
точка зрения оставалась локальной, было не ясно, так ли важны введенные
выше понятия, чтобы уделять им столько внимания; теперь все изменится.
В этом параграфе будет доказана одиа-единствеиная теорема, которая, однако,
является ключом к доказательству локальных теорем существования как
в параметрическом, так и в непараметрнческом случаях. Сама эта ключевая
теорема относится к непараметрическому случаю.
Начиная с этого момента мы будем работать одновременно
в нескольких пространствах, и нужно уметь их различать. Пара
(/, х) будет, как и прежде, называться точкой, тройка (t, х, х)—
линейным элементом, а тройка (t, x, у)— канонической точкой.
Окрестность точки называется широкой окрестностью; окрестность
линейного элемента—узкой окрестностью, а окрестность кано-
канонической точки—канонической окрестностью. Если t опущено
или равно постоянной, то окрестности в этих пространствах,
а точнее в соответствующих подпространствах, мы будем называть
окрестностями для постоянного /. Мы предполагаем, что все
окрестности являются односвязными открытыми областями в своих
§ 27. Погружение экстремалей в трубки «в малом»
89
пространствах; окрестность называется факторизуемой, если ее
можно представить в виде прямого произведения.
Семейство канонических экстремалей x(t, и), y(t, и), зави-
зависящее от векторного параметра и (той же размерности п, что
и х), причем так, что и принимает постоянное значение вдоль
каждой экстремали этого семейства, назовем канонической труб-
трубкой, если x(tQ, и)=и и y(t0, и)~уи для некоторого t0, причем
у0 не зависит от и. Соответствующее семейство экстремалей
x(t, и) будем называть трубкой экстремалей, или престо трубкой.
Линейный элемент назовем неособым, если для этого линей-
линейного элемента матрица А, составленная из частных производных
второго порядка лагранжиана L по х, невырожденна.
B7.1) Теорема (о погружении в трубку). Пусть (t0, х0, р0) —
неособый линейный элемент. Тогда существуют:
(i) широкая окрестность W точки U(l, x0);
(и) узкая окрестность N линейного элемента (t0, х0, р0),
такая, что любую экстремаль, расположенную в W и содержа-
содержащую по крайней мере один линейный
элемент из N, можно погрузить в
трубку, которая покрывает W од-
однократно. Кроме того, для любой
заранее заданной узкой окрестности
No линейного элемента (t0, х0, р0)
можно добиться того, чтобы все ли-
линейные элементы указанной трубки
лежали в No.
Доказательство. Это доказатель-
доказательство основывается на трех отображе-
отображениях. Построим сначала каждое из
них в отдельности.
Первое отображение. Обозначим через у0 значение L-x
на линейном элементе (t0, xn, р0). Тогда, как было показано
в § 22, в некоторой канонической окрестности К канонической
точки (£0, х0, у0) единственным образом определен гамильтониан
H(t, х, у), и, полагая х = Ну, мы получаем взаимно однозначное
отображение канонической окрестности К на узкую окрестность N
линейного элемента (?0, х0, р0). Обратным отображением является
y = Lx. В дальнейшем, если понадобится, мы будем сужать
окрестности К, N, не изменяя при этом их обозначений. В част-
частности, условимся, что NczN0.
Таким образом, первое отображение имеет вид
(t, х, y)—»(t, х, х).
90 Гл. II. Двойственность и локальное погружение
Второе отображение. Рассмотрим при постоянном t = tb
малую каноническую окрестность точки (х0, у0) и канонические
экстремали х (t, и, v), y(t, и, v) с начальными значениями
x(t0, и, v) = u, y(tn, и, v) = -v, где (и, v) лежит в рассматрива-
рассматриваемой окрестности. Согласно теореме существования для диффе-
дифференциальных уравнений, доказанной в предыдущей главе, кано-
канонические экстремали существуют, однозначно определяются
начальными условиями и обладают нужной степенью гладкости.
При t — tQ матрица Якоби по и, v является единичной и, значит,
невырожденна. Согласно теореме о неявной функции, рассмот-
рассмотренной в предыдущей главе, мы можем после соответствующего
сужения окрестности К (а также N) определить нашу окрестность
для постоянного t — t0 таким образом, чтобы система уравнений
t = t, x = x(t, и, v), y = y(t, и, v) имела единственное решение
(t, и, v) при (t, х, у)€К.
Итак, наше второе отображение, определенное решениями
этой системы, имеет вид
(t, и, v)—*{t, х, у).
Третье отображение. Так как матрица Якоби вектор-
функции x(t, и, v) по и при t—t0 является единичной, то,
используя аналогичные рассуждения, можно показать, что урав-
уравнение х = х(£, и, v) локально разрешимо относительно и, когда
точка (/, х, v) лежит в подходящей канонической окрестности
точки (?0, х0, у0). Этим определяется наше третье отображение
{t, х, v)—*(t, и, v).
Его область определения можно считать параллелепипедом
в пространстве (t, x, v), и поэтому прямым произведением W xW
параллелепипедов W, W в пространствах (t, x) и v соответ-
соответственно.
Все три отображения взаимно однозначны. Кроме того, если
мы достаточно сильно сузим область определения W x W третьего
отображения, то образы третьего и второго отображений будут
содержаться соответственно в областях определения второго
и первого, а образ первого отображения будет лежать в N.
Затем в свою очередь можно так сократить окрестность N,
чтобы последний образ совпал с ней.
Результирующее отображение Т. Выполним теперь
эти три отображения в следующем порядке:
(/, х, v)—>(t, u, v)-+(t, x, y)-+(t, х, х).
Очевидно, что их суперпозиция определяет результирующее
отображение Г, которое является взаимно однозначным отобра-
§ 27. Погружение экстремалей в трубки «в малом» QJ
жением области WxW на окрестность N и имеет вид
(/, х, v)~+(t, х, л;)-
Это означает, что отображение Т задается уравнениями
/ = /, х=х, x = p(t, х, v),
и для заданного линейного элемента (t, x, x)£N существует
точно одно v, для которого справедливо третье уравнение.
Запомнив это, фиксируем произвольный линейный элемент
(tlt xlt pi)^N и выберем vx только что указанным образом так,
чтобы р1 = p(tlt x1% у,). Обозначим p(t,x,v,) через p(t,x). Огра-
Ограничение отображения Т на множество (t, x)gW, v = vx является
взаимно однозначным отображением на множество линейных эле-
элементов (t, х, х), у которых (t, x)£W и x — p(t, х).
Согласно построению, такое ограничение отображения Т также
получается суперпозицией трех наших первоначальных отобра-
отображений. Оно приводит к линейному элементу (t, x, х) экстремали
x(t, и, v), где v—-vl. Семейство таких экстремалей образует
искомую трубку, причем и однозначно определено линейным эле-
элементом (t, х, x) = (t, x, p(t, x)), т.е. точкой (/, х). Это означает,
что окрестность W построенным семейством экстремалей покры-
покрывается однократно, что и завершает доказательство.
Замечание. Сужая окрестность N в последний раз, когда она факти-
фактически превращается в образ области WxW при результирующем отображе-
отображении Т, нужно удостовериться, что N остается окрестностью. Для проверки
этого факта можно использовать теорию неявных функций; каждый элемент
множества N = Т (WxW) имеет окрестность, являющуюся образом некоторой
окрестности в области WxW, и, следовательно, /V—открытое множество.
Аналогично легко усмотреть, что N — односвязное множество. Однако в насто-
настоящее время математика располагает более эффективными средствами, и в этой
книге мы отнюдь ие ставим себе целью показать, как можно избежать их
использования.
В этом пункте вместо рассуждений, использующих теорему о неявных
функциях и специальный характер наших отображений, можно непосредственно
применить знаменитую топологическую теорему, а именно теорему Брауэра об
инвариантности области при непрерывном и взаимно однозначном отображении.
Эта теорема имеет долгую историю, и мы ничего не выиграем, если будем
игнорировать ее существование и использовать менее эффективные средства.
Поводом к ее доказательству послужило следующее (на первый взгляд, несколько
тревожное) открытие: существуют взаимно однозначные (но не непрерывные)
или же—кривая Пеано—непрерывные (но не взаимно однозначные) отображе-
отображения отрезка на квадрат. До этого были очень модиы обозначения типа оо2,
подразумевающие, что оо2 значительно больше, чем оо. Эти вопросы изучаются
в теории функций действительного переменного и в теоретико-множественной
топологии.
Таким образом, уже второй раз в этой книге на сцене появляется топо-
топологическая теорема. Первый раз мы использовали теорему Бра>эра о непод-
неподвижной точке в конце первой главы при доказательстве теоремы о деформа-
деформации A9.6). Эта последняя играет важную роль в следующем параграфе, хотя
92 Гл. II. Двойственность и локальное погружение
и там применительно к нашим вариационным задачам можно было бы обойтись
несколько менее эффективными рассуждениями, основанными на использовании
частного случая теоремы о деформации, а именно леммы Каратеодори.
§ 28
Локальная теория существования решений непараметрических
вариационных задач и краевых задач для обыкновенных
дифференциальных уравнений второго порядка
Основные локальные результаты, которые будут здесь получены, можно
разбить на две группы. Согласно результатам первой группы, некоторые
«хорошо направленные» экстремали доставляют минимум «в малом», а, согласно
результатам второй группы, подходящую пару точек можно соединить дугой
экстремали, или, в более общем смысле, локальным решением данного диффе-
дифференциального уравнения второго порядка. Результаты второй группы отно-
сятся фактически к краевым задачам для таких уравнений;
ключом к ним является теорема о .деформации A9.6). Резуль-
Результаты первой группы касаются только задачи минимизации; и
в их доказательстве ключевое место занимает теорема о по-
погружении B7.1).
Добравшийся до этого места читатель, особенно если
он уже успел заглянуть в следующие главы, не должен
думать, что существование непараметрической экстремали,
соединяющей заданные бчизкие точки, тривиально следует
из теории дифференциальных уравнений. На самом деле
почти нет непараметрических задач, для которых существова-
существование такой экстремали не требует дополнительных ограничений.
** В этом смысле задачи (а), (Ь) и (с), рассмотренные во вступ-
лении, являются отнюдь не типичными.
Так, например, во многих плоских задачах через некоторую точку Р про-
проходит только одна непараметрическая экстремаль с вертикальной касательной
в точке Р, и для точек Qt, лежащих на этой экстремали и близких к Р, эта
экстремаль является единственной экстремалью, соединяющей Р с Q1. Для
точки Q, близкой к Р и лежащей между этой экстремалью и ее вертикальной
касательной, ие существует экстремали, соединяющей Р с Q, так как эта
вторая экстремаль или тоже должна иметь вертикальную касательиую в точке Р,
или же должна пересечь первую экстремаль в некоторой точке Q,, а тогда Р
и Qx будут соединять две экстремали; и то и другое противоречит нашему
допущению.
Для того чтобы выяснить вопрос о существовании экстремали,
соединяющей две заданные точки, рассмотрим сначала более
общую задачу о соединении этих точек решением дифференци-
дифференциального уравнения
B8.1) x=g(t,x,x),
где g—непрерывная функция, определенная в открытом множе-
множестве линейных элементов (t, x, х). Предположим, что функция g
достаточно гладкая для того, чтобы решение задачи Коши для
эквивалентной уравнению B8.1) системы
z = g(t, х, г), x=z
§ 28. Локальная теория существования решений 93
(такие системы были изучены в предыдущей главе) существовало,
было единственным и непрерывно зависело от начальных значе-
значений (t, х, г).
Обозначим через G открытую область определения функции g
в пространстве линейных элементов (t, х, х), а через Е—огра-
Е—ограниченное замкнутое подмножество множества G. Далее, определим
открытое ограниченное множество G_ так, чтобы Е с G_cr G и
функция g была ограничена в G_. Это можно сделать следующим
образом: обозначим через g функцию
\g(t, х, i)|+|*| + l*l+M;
эта функция непрерывна и, значит, ограничена в Е некоторой
постоянной k; возьмем в качестве G_ множество, состоящее из
линейных элементов {/, х, x)£G, для которых g <2k.
Изменяя масштаб при помощи преобразования (t, x)—>-(at, bx),
где а, Ь—положительные постоянные (при этом следует также
произвести замену x—*bxla, чтобы изменение масштаба согласо-
согласовалось с нашими обозначениями производных), можно добиться
того, чтобы в множестве G_ выполнялись неравенства
B8.2) |«Г|<1. Й<1.
При изучении локальных свойств в произвольно выбранном огра-
ограниченном замкнутом подмножестве Е из G можно, не нарушая
общности, ограничиться рассмотрением множества G_. В даль-
дальнейшем мы будем обозначать множество G_ просто через G и
пользоваться таким масштабом на осях, чтобы в G выполнялись
условия B8.2).
Затем определим б > 0 так, чтобы расстояние от множества Е
до границы множества G в пространстве линейных элементов
(t, х, х) превосходило 36. Множество линейных элементов, рас-
расположенных на расстоянии, не превышающем 36, от множества Е,
обозначим через Е+. Как здесь, так и в дальнейшем б всегда
можно уменьшить; в частности, всегда можно заменить 6 на 6/2,
если так будет удобнее.
Назовем Ь-траекторией, или просто траекторией, кривую,
являющуюся графиком решения x(t) уравнения B8.1), опреде-
определенного на ^-интервале, длина которого не превышает 6. Пусть,
далее, задан линейный элемент (?„, х:0. ро)£Е; назовем локаль-
локальным Ь-пучком 6-траекторий, или просто локальным пучком, семей-
семейство траекторий, определенных на интервале ^0<^</0 + 6 (или
?0—6<* <t0) и содержащих линейные элементы (t0, x0, р), где
\р—Ро|^б- Наконец, в пространстве (/, х) введем обозначение
Р = (х—xo)/(t — tf0) и назовем локальным Ъ-углом линейного эле-
элемента (*0, х0, р0), или просто локальным углом, множество точек
94
Гл. II. Двойственность и локальное погружение
(t, x), для которых t0 <t <to + & (или /„—6 <*<*„) и
\Р—ро|<6. Для того чтобы различить в этих определениях
случаи t > tn и t < *0, можно при желании говорить в первом
случае о прямом пучке и угле, направленном вперед, а во вто-
втором—об обратном пучке и угле, направленном назад.
t = t0 + 6
Локальный угол.
Локальный пучок.-
B8.3) Лемма. Все линейные элементы траекторий каждого
локального пучка лежат в множестве Е+.
Доказательство. На самом деле мы докажем даже, что они
принадлежат внутренности множества Е+. Предположим против-
противное: пусть существуют линейный элемент (t0, х0, р0) £ Е, вектор р,
удовлетворяющий условию \р—ро|^6, и траектория x(t), кото-
которая содержит как линейный элемент (t0, x0, р), так и линейный
элемент, не принадлежащий внутренности множества Е+. Тогда
существует наименьшее значение / > /„ (или наибольшее t <t0),
для которого линейный элемент траектории лежит на границе
множества Е+. Для этого значения t, приняв для удобства
точку (t0, *о) за начало координат, получим
t t
откуда Р + х2 + (х—роу < 2? + (| 11 + бJ < 6б2. Это неравенство
показывает, что рассматриваемый линейный элемент лежит внутри
множества Е+, а не на его границе. Доказательство завершено.
B8.4) Лемма. На траектории Г значение х в момент t и
градиент Р хорды, концы которой соответствуют моментам tu
t2, удовлетворяют неравенству
Доказательство. Без ограничения общности можно считать,
что t = 0; для соответствующего линейного элемента траектории
Г положим х = 0, х=р. Обозначим через r,(i = l, 2) треуголь-
треугольник 0 < и < v < tt или 0 > и > v > t; в зависимости от знака tit
§ 28. Локальная теория существования решений 55
а через |Г,-| — площадь этого треугольника, равную х\4\- Если
мы теперь возьмем остаточный член формулы Тейлора в интег-
интегральной форме, т. е.
т
то получим, что \R1 — #2| = |^—^2|-|^—Р\- Значит, если tlt tt
имеют противоположные знаки, то \Р—р\ не превосходит
IM + IM ^ IM + Mtl ^ 2
С другой стороны, изменив нумерацию индексов и направление
оси t, если это понадобится, можно считать, что 0 < tt < tt, так
что
J J x(u)dudv
7-„-7\
Разделив это выражение на £2—tlt получим ту же оценку. Это
завершает доказательство.
Две траектории 1\, Г2 будем называть заметно отклонен-
отклоненными, если им принадлежат соответственно линейные элементы
(<„ xt, p,), (t2, х2, р2), для которых либо \р1—р2|^2б, либо
('li xi) = (ti> хъ)г а \Pi—Рг!^*^-
B8.5) Следствие. Две заметно отклоненные траектории могут
пересекаться не более чем в одной точке.
В самом деле, если существуют две точки пересечения, то
градиент Р соединяющей их хорды удовлетворяет неравенству
леммы B8.4) для каждого из значений x = pt и х — р2. Следова-
Следовательно, \Pi—р2|<2б. Однако остается еще возможность, что
линейные элементы, указанные в определении заметно отклонен-
отклоненных траекторий, имеют вид (tlt х1г pj, (*,, х1г р2). В этом слу-
случае можно считать, что одной точкой пересечения является сама
точка (tu хг), и применить неравенство из леммы B8.4) при
t = t1. Рассуждая как и раньше, получим, что \р1—р2|^б, а
это противоречит определению заметно отклоненных траекторий.
Теперь мы в состоянии установить для уравнения B8.1) суще-
существование решения краевой задачи в локальном угле.
B8.6) Теорема о локальном угле. Пусть (tu, х„, рп) £Е, и
пусть точка (tlt xt) лежит в локальном (б/3)-угле линейного эле-
элемента (t0, х0, р0). Тогда точки (tn, х0), (/,, xj можно соединить
траекторией локального Ь-пучка и нельзя соединить ни одной
траекторией, не принадлежащей этому пучку.
95 Гл. 11. Двойственность и локальное погружение
Для целей вариационного исчисления достаточен более слабый
вариант этого утверждения, в котором тот же результат выво-
выводится при дополнительном предположении, что траектории ло-
локального пучка не имеют второй точки пересечения. Доказатель-
Доказательство этого более слабого варианта повторяет доказательство
сильного, только вместо теоремы о деформации используется
лемма Каратеодори.
Доказательство теоремы B8.6). Достаточно показать, что рас-
рассматриваемые точки можно соединить траекторией локального
F/2)-пучка, так как, заменив в B8.5) б на б/З, мы найдем, что
эти точки нельзя соединить двумя траекториями, начальные
наклоны х которых отличаются один от другого больше, чем
на б/З.
Запомнив это, предположим, что f, > ta, примем точку (t0, x0)
за начало координат, обозначим через x(t, р) траекторию x(t)
'О :<*<;б), определяемую начальными условиями лс(О) = О,-
'х@) = р, положим P = P(p) = x(t1, р)Д, и обозначим через Q и Я
соответственно множества векторов р, таких, что \р—ро\ < 6/2 и
\р—Ро I < б/З. Для точек множества Q, согласно B8.4), выпол-
выполняется неравенство
Ввиду A9.6) образ Q' множества Q при непрерывном отобра-
отображении р—*Р, определенном посредством функции Р{р), удов-
удовлетворяет условию Q'z>H. Отсюда, в частности, следует, что
(*i/^i)€Q'> а это означает, что для некоторого p£Q мы имеем
P = xjt1 и, следовательно, х (tu p) = xt. Это завершает доказа-
доказательство.
При доказательстве более слабого варианта этого утверждения
мы замечаем, что множество Q', будучи взаимно однозначным
образом области Q, само является областью, и далее, что образ
Р{р„) вектора р0 заведомо лежит в Я. Это означает, что здесь
A9.6) можно использовать только в виде леммы Каратеодори.
Вернемся теперь к изучению непараметрической вариационной
задачи. Вместо уравнения B8.1) рассмотрим уравнение Эйлера,
которое запишем в развернутом виде:
и ограничимся неособыми линейными элементами, так чтобы для
матрицы A = L-xx существовала обратная матрица В. Умножив
уравнение Эйлера на матрицу В, можно представить его в ви-
виде B8.1) с функцией g, равной
B(LX— Lit-Lxx'x).
§ 28. Локальная теория существования решений 97
Линейный элемент (t0, ха, р0) назовем сильным, если для всех
(t, х, р) из некоторой его узкой окрестности и для всех хфр
функция Вейерштрасса <§(t, x, р, х) удовлетворяет условию
B8.7) <§ > 0.
Пусть задан сильный неособый линейный элемент (t0, х0, р0);
экстремаль Со, расположенную в достаточно малой широкой
окрестности точки (*0, х0), будем называть хорошо направленной
локальной экстремалью, если Со содержит линейный элемент,
принадлежащий достаточно малой узкой окрестности линейного
элемента (ta, х0, р0).
B8.8) Теорема (свойство минимальности хорошо направленных
локальных экстремалей). Пусть (t0, х0, р0)—сильный неособый
линейный элемент. Тогда существуют:
(i) широкая окрестность W точки (t0, x0),
(П) узкая окрестность N линейного элемента (t0, x0, рй),
такие, что для любой экстремали Со, лежащей в W, хотя бы
один из линейных элементов которой содержится в N, и для лю-
любой другой допустимой непараметрической
кривой С, лежащей в W и имеющей те же
концы, что и Со, справедливо неравенство
Э(С)>Э(СВ)-
Доказательство. В качестве окрестности
No из теоремы B7.1) возьмем узкую окрест-
окрестность линейного элемента (*0, х0, р0), в ко-
которой определено уравнение B8.1), и при-
применим теорему о погружении. Тогда труб-
трубка, в которую мы погрузим экстремаль Со,
будет ввиду A6.2) точным семейством экстремалей, так как она
состоит из экстремалей x(t, и, v) с фиксированным начальным
импульсом v, а область пространства (t, и), которая взаимно
однозначно отображается на W, односвязна. Далее, это семейство
однократно покрывает W, и линейные элементы его экстремалей
удовлетворяют уравнению B8.1). Таким образом, доказываемое
неравенство следует из формулы Вейерштрасса A2.6).
Заметим, что окрестности W, N, для которых справедливо
заключение теоремы, будут обладать тем же свойством и тогда,
когда мы их сузим; для теоремы B7.1) это, вообще говоря, не
так. Используя это замечание, мы в дальнейшем сделаем так,
чтобы N имела вид WxM.
Свойство минимальности, доказанное в B8.8), сразу приводит
к единственности: две различные хорошо направленные локаль-
локальные экстремали могут пересекаться в IF не более чем в одной
точке. В противном случае их дуги ylt уг, расположенные между
4 N, 1274
98
Гл. П. Двойственность и локальное погружение
двумя пересечениями, можно было бы упорядочить так, чтобы
3 (Yi) <i 3 (y2), и тогда, взяв в качестве Со экстремаль, содержа-
содержащую дугу v2> а в качестве С—допустимую кривую, отличную
от Со и полученную из Со заменой дуги у2 на дугу ylt мы полу-
получили бы, что 3 (С)^Э{Се), вопреки свойству минимальности.
Это означает, что дуги хорошо направленных локальных экстре-
экстремалей однозначно определяются своими концами.
В этом параграфе мы докажем еще одну теорему; она свя-
связана с только что установленным свойством единственности и
является вариационным аналогом теоремы B8.6). Мы уже нашли
вариационный аналог функции g из B8.1). К этому добавим,
что в качестве множества G в пространстве линейных элементов,
на котором определена функция g, берется множество неособых
линейных элементов. Легко видеть, что это множество открыто.
В множестве G, так же как и раньше, выдечим открытое под-
подмножество G_, в котором величины g, x, x, t ограничены.
(В качестве G и G_ можно было бы взять аналогичные множе-
множества сильных неособых линейных элементов.) Наконец, удобно
обобщить приведенное выше определение локального угла. Пусть
заданы угловая окрестность Af — WxM и точка (tlt xx)£W\ на-
назовем углом с вершиной (tlt xj, определенным окрестностью N,
множество точек (/, x)f-W, для которых t > t0 (или / < /0)
и (х—xo),'(t — ta)£M. (Будем говорить об угле, направленном
вперед или назад, в зави-
.Угол.определяемый симости от знака разности
окрестностью N f f \
B8.9) Теорема о малом
угле (непараметрический
вариационный вариант).
Пусть {to,xo, р0)—сильный
неособый линейный эле-
элемент, и пусть множество
G_ (открытое множество
линейных элементов, в ко-
котором величины g, х, х, t
ограничены), выбрано так,
что (tBl x0, po)£G_; далее,
пусть NczG_ — узкая окре-
окрестность линейного элемента (t0, х„, р0). Тогда существует такая угло-
угловая окрестность N = IF X УИ с N линейного элемента (t0, x0, р0), что
любую точку (tt, xt) из W можно соединить с любой точкой
(t2, x2), лежащей в угле с вершиной (tv xj, определенном окрест-
окрестностью N, экстремалью, линейные элементы которой лежат в N,
и нельзя соединить никакой другой экстремалью, которая лежала
W
§ 29. Локальная параметрическая теория существования 99
бы в W, а все ее линейные элементы принадлежали бы множе-
множеству G_.
Доказательство. Сначала выберем угловую окрестность No =
= WoxMo линейного элемента (t0, х0, р0) так, чтобы окрестно-
окрестности Wo, No содержались соответственно в окрестностях W, N из
теоремы B8.8) и чтобы Nocz Nf)G_. Кроме того, предположим,
что было выполнено предварительное изменение масштаба, обес-
обеспечивающее справедливость неравенств B8.2). Затем выберем в N,,
ограниченную замкнутую окрестность Е, представляющую собой
замкнутый шар с центром (*0, х0, р0). Далее, выберем число
6 > 0, меньшее радиуса шара Е и настолько малое, чтобы окрест-
окрестность No содержала множество Е+, состоящее из линейных эле-
элементов, удаленных от множества Е на расстояние, не превы-
превышающее 36. Наконец, обозначим через N = WxM множество
линейных элементов (t, x, х), для которых все три разности
\t — to\, \х—хо\, \х—ро\ меньше чем 6/6.
Пусть теперь (tlt хг), (/2, х2) такие две точки из W, что
(t2, x2) лежит в угле с вершиной (/„ хг), определенном окрест-
окрестностью N. Очевидно, что линейный элемент (tlt xlt p0) лежит
в Е, а точка (t2, х2)—в его локальном F/3)-угле. Значит, можно
применить теорему B8.6).
Далее, линейные элементы экстремалей локального б-пучка,
соответствующего линейному элементу (/„ xlt p0), принадлежат
множеству Е+. а значит, и окрестности Nn. Следовательно, экстре-
экстремали этого пучка не могут пересекаться дважды. Это означает,
что отображение р—*Р, использованное при доказательстве
теоремы B8.6), взаимно однозначно, так что при желании можно
применить указанный там частный случай этой теоремы, не за-
зависящий от теоремы о неподвижной точке.
Итак, мы видим, что точки (tlt xt), (t2, x2) можно соединить
точно одной экстремалью локального пучка и нельзя соединить
никакой другой экстремалью, линейные элементы которой лежат
в G_. Это завершает доказательство.
§29
Локальная параметрическая теория существования решений
для эллиптического случая
Для параметрических задач, удовлетворяющих условию, ко-
которое мы называем условием эллиптичности, будут доказаны
значительно более сильные утверждения. Мы получим их как
прямые следствия результатов, относящихся к непараметриче-
непараметрическому случаю.
4*
100 Гл. П. Двойственность и локальное погружение
Термином «эллиптический» мы заменяем здесь бесцветное прилагательное
«регулярный», используемое обычно в литературе. Оно и так перегружено: ведь
его заставляют работать в теории -регулярных фигур, теории регулярных анали-
аналитических функций, теории регулярных и особых точек обыкновенных дифферен-
дифференциальных уравнений и т. д.
Для того чтобы использовать наши непараметрические построения, введем
опять вспомогательный лагранжиан L*= V2ZA Это почти сразу приведет нас к ис-
искомым результатам. Другой способ применения непараметрического аппарата
можно найти в книге Каратеодори; он сводится к такому выбору осей, что одну
из них можно принять за локальную ось t. Однако полученные на этом пути ре-
результаты сначала будут только простыми аналогами непараметрических резуль-
результатов, и чтобы прийти к более сильным утверждениям, потребуется дополнитель-
дополнительная работа.
В некоторых более старых исследованиях авторам приходилось преодоле-
преодолевать значительные трудности потому, что они старались рассматривать парамет-
параметрическою и непараметрическую задачи независимо одну от другой. В те времена
вообще считалось несколько неэтичным использовать одну" область или раздел
математики для изучения другой. Это «правило игры» возникло отчасти благодаря
тирании экзаменов; разумеется, не входящий в программу вопрос является на
экзамене «ударом ниже пояса», н конечно же неразумно представлять экзамена-
экзаменатору на рассмотрение работу, выходящую за рамки его компетенции: Галуа убе-
убедился в этом на собственном горьком опыте. Сегодня, однако, со столь искус-
искусственными преградами не считаются — их выкидывают на свалку.
Никто уже больше не колеблется, решаясь применить непараметрнческне
методы в параметрическом случае и наоборот, или же использовать теорию функ-
функций действительного переменного в комплексном анализе. Это происходит не
потому, что мы стали более практичными: согласно А. Пуанкаре, сама суть мате-
математики состоит в преобразовании задачи. Точно так же музыкант может свободно
переходить из одной тональности в другую, и красота и глубина музыки во многом
определяются этой свободой.
Мы будем, как и раньше, обозначать через А = А(х, х) мат-
матрицу Lyx; напомним, 4TOtсогласно § 24, Лл: = 0. Линейный эле-
элемент (х, х) называется неособым, если для него ранг матрицы А
равен п—1, а точка х называется неособой, если это свойство
имеет место при всех хфЪ. Линейный элемент (х, х) удовлетво-
удовлетворяет параметрическому условию Лежандра, если квадратичная
форма |Л£ положительна всюду, где | не представимо в виде
Кх с действительным Я,. Назовем точку х эллиптической, если
в этой точке условие Лежандра выполняется для всех хфО.
Эквивалентное требование состоит в том, что для этого значе-
значения х функция \А\ имеет положительный минимум на ограни-
ограниченном замкнутом множестве |х| = 1,£2—(£х)г=1 в пространстве
(х, £). (Это следует из положительной однородности по g и х
соответственно степени 2 и 0.) Очевидно поэтому, что множество
эллиптических точек открыто.
В любой эллиптической точке, согласно формуле Тейлора
с остаточным членом,
£{х, р, x) = L{x, x)—L(x, p)—(x—p)Lp{x, p) = -jt&l.
§ 29. Локальная параметрическая теория существования JQ1
где | = х—р, А — А(х, р), р = р + 8(х—р) и 8—некоторое число
из интервала О<0<1. При этом предполагается, что р ФО
и множество векторов вида р не содержит нуля (для кото-
которого А, вообще говоря, не существует). Следовательно, если
р Ф О, то £ (х, р, х) > 0, за исключением того случая, когда х = кр
при некотором действительном К, а в этом случае £~^0 ввиду
непрерывности. Конечно, £ = 0, если х = Хр, где К > 0. Если же
х = "Кр и А,<0, то £ получается из L(x, p) + L(x, —р) умно-
умножением на |А.|, а значит, и эта сумма неотрицательна; кроме
того, она не может обращаться в нуль при всех рфО, так как
в противном случае, дифференцируя дважды по р, мы получили
бы, что А (х, р)-\- А (х, —р) = 0, а это противоречит нашему пред-
предположению относительно квадратичной формы £,А%. Следовательно,
для некоторого р0ф0 (не нарушая общности, можно считать,
что IPol=l) должно выполняться неравенство
£{х, а,, х)>0,
если хфкр0, К^О. Если мы обозначим через q0 значение Lp(x, p)
при р = р0, сократим в £ члены —L(x, pa) + poqn и используем
однородность по х, то увидим, что это неравенство эквивалентно
неравенству
L(x, x)—xq0 >0 при |х| = 1, хр„ф\.
Рассуждая так же, как в § 13 гл. I, и вводя обозначение с =
E = mjn\L(x, x) — xqo\, когда \х\ = 1, лгро<у,
X
мы найдем, что L—сх^-^е в точке х для всех единичных век-
векторов х, и, значит, при тех же значениях постоянных с, е мы
имеем
L—сх > х
для всех единичных векторов х и всех точек, близких к х.
Ограничившись окрестностью эллиптической точки и заменив L
эквивалентным лагранжианом, можно, таким образом, не только
предположить, что все рассматриваемые точки эллиптические,
но и что в этих точках L>0 для всех хфО. Поскольку теперь
в этих точках равенство L(x, p)+L(x, —р) = 0 имеет место
только при р = 0, приведенные выше рассуждения показывают,
102 Гл. II. Двойственность и локальное погружение
что для всех таких х
B9.1) <£(*, р, 'х)>0
при условии, что рФО и хф"кр, Х>0.
Теперь выберем параметр t на допустимой кривой так,чтобы
линейные элементы (х, х) этой кривой удовлетворяли условию
L(x, х) = 1. Далее, так же как в § 24, введем непараметрический
лагранжиан
L*(x, *)=Il*(*. x),
который не зависит явно от /. Обозначим через G область ли-
линейных элементов (t, x, х), в которой t мало, точка х располо-
расположена вблизи эллиптической точки, a L(x, x) принимает значе-
значения, близкие к единице, и отождествим множество G. с С.
Функция Вейерштрасса &*(х, р, х), соответствующая лаг-
лагранжиану L*, не зависит явно от t, и, как легко видеть, ее
связь с функцией Вейерштрасса <§, соответствующей лагран-
лагранжиану L, выражается простым тождеством
<£* = у {/.(*, x)-L(x, p)\* + £L(x,p).
Значит, согласно B9.1), <£*>0, если хфр. Таким образом,
все линейные элементы (t, x, x)£G являются сильными; они
являются также и неособыми, потому что, согласно § 24, для
каждого такого элемента матрица A* = L*- невырожденна. Не
нарушая общности, мы будем предполагать, что все это остается
справедливым и в замыкании области G. Тогда детермчнант
матрицы А* отделен от нуля, так что функция g из B8.1) огра-
ограничена в G. Следовательно, для лагранжиана L* любой линей-
линейный элемент (t0, x0, po)£G удовлетворяет всем условиям тео-
теоремы B8.9). Наконец, вспоминаем из § 26, что экстремальные
кривые для лагранжиана L* в пространстве (t, x)—это кривые,
проекции которых на лг-пространство являются экстремалями
для лагранжиана L и для которых t вдоль каждой такой экстре-
экстремали отличается лишь постоянным множителем от соответствую-
соответствующего стандартного параметра.
Теперь мы можем использовать теорему B8.9) для доказа-
доказательства следующей леммы.
B9.2) Основная лемма. Пусть хп—эллиптическая точка.
Тогда существуют такие окрестности W, Wu, что xo^WczWo
и каждую пару точек xlt x2 из окрестности W можно соеди-
соединить в окрестности U^o точно одной экстремалью.
§ 29. Локальная параметрическая теория существования ЮЗ
Доказательство. Все рассматриваемые ниже окрестности в про-
пространстве (t, х, х) (соответственно в пространстве (t, x)) можно
взять в виде прямого произведения открытых множеств в про-
пространствах (t, л:) и л: (соответственно открытых множеств в про-
пространствах t и х). В частности, можно добиться того, чтобы
множество G = G_, описанное выше, было прямым произведением
окрестности Wn точки ха на некоторое множество в пространстве
(t, x). Применим теорему B8.9) к лагранжиану L* и линейному
элементу @, х0, рп), где р0—любой вектор, удовлетворяющий
условию L{xn, />„) = = 1. Эта теорема ставит в соответствие век-
вектору рп некоторую угловую окрестность линейного элемента
(О, .г,„ р„), обладающую определенными свойствами. Эта угловая
окрестность имеет вид W*xM*, где М*—некоторая окрестность
вектора р0. Согласно геореме Бореля, можно выбрать конечное
число таких окрестностей М*, соответствующих векторам р0,
так, чтобы они покрыли все множество векторов р, удовлетво-
удовлетворяющих условию L(xn, p) = l. Обозначим через TxW окрест-
окрестность точки @, х„), которая содержится в пересечении соответ-
соответствующего набора окрестностей W*\ здесь Т—открытый /-интер-
/-интервал, a W—окрестность точки xQ. Можно считать W настолько
малой, что для каждой пары х1ъ х2 из W интервал Т содержит
число t=L(x0, а'2—лг1). Это означает, что можно положить
х2—xx = tp, где L(xa, p) = \ и, следовательно, вектор р лежит
в одной из (конечного числа) окрестностей М*.
Но тогда точка (t, x,) лежит в угле с вершиной @, jq), опре-
определенном окрестностью W*xM*, так что точки @, х,), (t, x2)
можно соединить одной и только одной экстремалью лагран-
лагранжиана L*, линейные элементы которой принадлежат множеству G.
Проекция этой экстремали лагранжиана L* является экстре-
экстремалью лагранжиана L, соединяющей точки xlt x2 в окрестности Wo.
Эта последняя экстремаль единственна, так как если бы их было
две, то, выбрав на них параметры, отличающиеся лишь постоян-
104 Гл. II. Двойственность и локальное погружение
ным множителем от стандартных, мы получили бы, что эти
экстремали являются проекциями различных экстремалей лаг-
лагранжиана L*, соединяющих точки @, л:,), (/, х2). Это завершает
док азател ьство.
Наша основная теорема B9.5) существенно уточняет лем-
лемму B9.2). Ключом к ее доказательству является следующая
лемма.
B9.3) Лемма о малой сфере. Пусть х0—неособая тонка.
Тогда существует такая ее окрестность U, что каждая сфера 2
с центром в U, пересекающая экстремаль Г, расположенную в U,
содержит не более двух точек экстремали Г. Кроме того, замк-
замкнутый шар, ограниченный сферой 2, пересекается с экстре-
экстремалью Г вдоль связной дуги.
Доказательство. Вблизи точки х0 уравнение Эйлера приво-
приводится к виду x — g(x, x). Возьмем окрестность U так, чтобы
в ней было возможно это приведение и чтобы функция g была
ограниченной при |х| = 1; если потребуется, мы сузим в даль-
дальнейшем окрестность U так, чтобы она имела достаточно малый
диаметр. Затем выберем в U центр сферы 2, который примем
V
за начало координат, и любую экстремаль Г, на которой пара-
параметром является длина дуги и которая пересекается со сферой 2.
Так как х2=1 на экстремали Г, то вторая производная
функции ф = х/2*2 вдоль этой экстремали имеет вид <р= 1 + хх н,
следовательно, положительна, ибо х ограничено, а х достаточно
мало. Поэтому для любой пары различных абсцисс /, /0
B9.4) Ф@
ибо разность двух частей этого неравенства, согласно формуле
Тейлора с остаточным членом, равна
Таким образом, ф — выпуклая функция (в соответствии с опре-
определением «касательная под дугой» из § 13 гл. I), и, следова-
§ 29. Локальная параметрическая теория существования
105
тельно, согласно определению «хорда над дугой» (доказатель-
(доказательство эквивалентности этих определений выпуклости мы отложим
до гл. IV), график этой функции должен пересекаться с гори-
горизонталями либо вдоль целого отрезка, что, очевидно, несовме-
несовместимо с B9.4), либо не более чем в двух точках, между кото-
которыми функция ф принимает только меньшие значения. Отсюда
сразу следует наше утверждение.
Доказанная только что лемма позволяег нам избавиться от
неприятного предположения о «геодезической выпуклости»,
используемого в книге Каратеодори (см. § 385 главы XVI: су-
существование некоторого р'). Однако это предположение все-таки
появится в гл. V.
Теперь мы в состоянии доказать основной результат этой
главы.
B9.5) Локальная параметрическая теорема существования для
эллиптического случая. Пусть Е—ограниченное замкнутое мно-
множество эллиптических точек. Тогда существует такое число
р > 0, что каждый замкнутый шар 2 радиуса ^р, который
пересекается с множеством Е, обладает следующими свойствами:
(i) каждую пару точек хх, х2 шара 2 можно соединить точно
одной экстремалью Г, все точки
которой, кроме, может быть,
концов xlt x2, принадлежат вну-
внутренности шара 2; (П) для не-
некоторой области Wzd~L (если
функция L положительно опреде-
определена в Е, то для каждой об-
области Ц7э1, в которой L^Q)
выполняется неравенство
B9.6) Э(Г)<Э(С),
где С—допустимая кривая в W,
отличная от экстремали Г, но
имеющая те же концы.
Доказательство. Возьмем по-
ложительное число 6^ 1/3.
(В случае положительной определенности функции L в £ обозначим
через т, М минимум и максимум функции L (х, х) при х G Е,
1*1 = 1 и затем оговорим, что Q(m + М)^Ч3т.) Каждой точ-
точке х0 £ Е поставим в соответствие шар \х—*0|<р0, на-
настолько малый, чтобы он лежал в окрестностях W и U, суще-
существование которых утверждается в леммах B9.2) и B9.3). (Если
функция L положительно определена в Е, то сузим этот шар
так, чтобы в нем выполнялись неравенства C/4) т < L (х, х) <
< C/2) М при | а| = 1.) Согласно теореме Бореля, можно выбрать
106
Гл. //. Двойственность и локальное погружение
конечное число открытых шаров, концентричных только что по-
построенным, но с радиусами 6р0, так, чтобы они покрывали мно-
множество Е. Обозначим через р наименьший из конечного числа
радиусов 6рС) и возьмем любой замкнутый шар 2 с радиусом, не
превышающим р, который пересекается с Е. Надо показать, что
шар 2 обладает указанными
свойствами. По построению,
шар 2 содержит точку одно-
одного из конечного числа откры-
открытых шаров\х^хо\ <ер„.Зна-
<ер„.Значит, все его точки удалены
от А'„ на расстояние, меньшее
чем 2р -р 6р„ j^ p0. Следова-
Следовательно, они лежат в окрест-
окрестностях. W и U, рассмотрен-
рассмотренных в леммах B9.2), B9.3);
в частности, центр шара 2
лежит в окрестности U. По-
Поэтому свойство (i) выполня-
выполняется.
Для доказательства свой-
свойства (ii) выберем окрестность
W так же, как в лемме B9.2), и
вспомним, что для точек окре-
окрестности W выполняется неравенство B9.1). Тогда из формулы
Вейерштрасса A2.7), приведенной в гл. I, следует справедли-
справедливость неравенства B9.6), так как экстремали, исходящие из
начальной точки экстремали Г, однократно покрывают область
в окрестности \Vn, содержащую окрестность W.
Если же функция L положительно определена в Е, то в ка-
качестве окрестности W возьмем любую область, содержащую
шар 2, в которой L ^3= 0. Тогда, согласно только что доказанному,
неравенство B9.6) безусловно справедливо для любой допусти-
допустимой кривой С, расположенной в шаре | л:—х„ | < р„. В частности,
это неравенство выполняется, когда С—хорда длины ^2р, сое-
соединяющая концы экстремали Г, так что
B9.7)
3 (Г) < 2Мр.
Предположим теперь, что допустимая кривая С содержит по
крайней мере одну граничную точку шара \х—хо|<р„ и, зна-
значит, содержит две дуги между 2 и сферой \х—*0| = рп, длины
которых, очевидно, не меньше р„ — Щ\, — 2р. Таким образом,
B9.8)
§ 29. Локальная параметрическая теория существования JQJ
Для доказательства неравенства B9.6) остается только про-
проверить, что
B9.9) 2/и(Ро —ер0—2р) —
Так как р<6р0, то B9.9) имеет место, если т{1—Щ — Мд^и О,
т. е. если 0(Зт + М)^.щ, а согласно выбору 6, это последнее
неравенство справедливо. Значит, неравенство B9.9) выпол-
выполняется, а следовательно, выполняется и неравенство B9.6). Это
завершает доказательство.
Глава ///
Погружении в целом
§ зо
Введение
Ряд удивительных совпадений, на которые мы обратили внимание, решая
примеры во вступлении, нашел теперь свое объяснение; сейчас эти совпадения уже
не кажутся нам случайными И все же одна тайна осталась нераскрытой. Мы уже
знаем, что малые дуги экстремалей, исходящие из некоторой точки, обязаны по-
покрывать однократно малую же область. Однако выбранные нами дуги экстремалей
отнюдь не были малыми; наоборот, из всех дуг, которые имело смысл рассматри-
рассматривать, были взяты наибольшие. Может быть, нам случайно повезло, что оии дали
искомое однократное покрытие? Это было бы слишком невероятно. Несмотря на
кажущуюся простоту этот вопрос уведет нас довольно далеко.
Для ответа на него приходится привлечь целый ряд так называемых «вторич-
«вторичных» понятий, а именно, рассмотреть вторичную задачу с вторичным лагран-
лагранжианом, вторичным гамильтонианом и вторичными экстремалями. В данном слу-
случае слово «вторичный» отнюдь ие означает «второстепенный», а указывает на
более глубокое понимание существа предмета. Ведь обычно лишь более внима-
внимательный (не первый, а второй) взгляд позволяет проникнуть в глубину, а
именно глубина выше всего ценится в математике.
Вторичные понятия, о которых пойдет речь, возникают в связи с так называе-
называемой второй вариацией, так что они являются вторичными еще в одном смысле.
С этим, однако, связана и еще одна — не последняя — страница летописи матема-
математических заблуждений: дело в том, что первоначально вторую вариацию вводили
даже на более шатком основании, чем первую. В основу всех рассуждений была по-
положена наивная аналогия с минимумом функции одного переменного. Не все благо-
благополучно уже с необходимостью обращения в нуль первой вариации (см. § 9 вступ-
вступления). Еще хуже обстоит дело с заблуждением, что прн выполнении этого усло-
условия имеет место минимум, если вторая вариация положительна. Это заблуждение
поддерживается отчасти незаконной аналогией, а отчасти — порочным кругом,
возникающим из-за банальной аналитической ошибки.
Однако одно из самых удивительных качеств «королевы наук» заключается
в том, что идеи, порожденные грубой ошибкой, могут порой оказаться весьма
плодотворными. Подобная ситуация мыслима в шахматах, когда один из партне-
партнеров, «зевнув» ферзя, может случайно натолкнуться на совершенно неожиданную
блестящую комбинацию, из тех, которые остаются на века. В реальной жизни
грубая ошибка, приводящая в конце концов к успеху,— ие такая уж редкость:
в одном популярном анекдоте рассказывается, как никуда не годная конструкция,
отвергнутая иа конкурсе технических проектов, где первая премия составляла
100 долларов, получила приз в 1000 долларов на выставке произведений абстракт-
абстрактного искусства.
В математике не раз случалось, что допущенная вначале ошибка в конечном
итоге оказывалась, пожалуй, даже полезной. Безумец отличается от математика
не столько своими ошибками, сколько своей неспособностью извлекать из инх
уроки. Стремление двигаться только вперед, не обращая внимания на непреодо-
непреодолимые препятствия, едва ли способствует достижению намеченной цели, ибо можно
оказаться в положении начинающего шахматиста, пешка которого, достигнув
восьмой горизонтали, становится добычей неприятельского короля по той простой
причине, что ои понятия ие имеет, что с ней дальше делать. В нашем случае вторая
§ 31. Первая и вторая вариации и условие трансверсальности J09
вариация и связанные с ней вторичные понятия могут найти (и найдут) гораздо
более эффективное применение, если мы освободим их от ошибочно возложенной
на них роли и выясним, что оии представляют собой на самом деле. Так оживает
ранее беспомощная пешка, когда шахматист узнает, что она превратилась
в ферзя.
После введения первой и второй варнаций формальное изложение вторичных
понятий будет для нас всего лишь несложным упражнением в использовании
гамильтонианов. Обширную литературу, посвященную этим вопросам, можно
просто игнорировать. Далее, при помощи элементарной геометрической интер-
интерпретации понятия точности мы сможем почти сразу же заняться теорией сопряжен-
сопряженных точек Якоби, в которой содержится ключ к разгадке упомянутой нами
тайны. Затем мы перейдем к изучению показателя устойчивости, которому одно
время отводили (и, вполне возможно, снова будут отводить) важную роль в теории
собственных значений в разных областях прикладной математики. После этого
будет дано краткое введение в теорию Морса, которая находит применение в самых
различных областях и которая во многих отношениях выходит далеко за рамки
вариационного исчисления как такового.
Что касается математического аппарата, то нам понадобятся некоторые про-
простые факты, относящиеся к векторам, матрицам, квадратичным формам и много-
многогранникам. В основном эти сведения будут обсуждаться по мере необходимости.
Предполагается, что читателю известны понятие собственного значения, а также
приведение квадратичной формы к диагональному виду при помощи ортогональ-
ортогонального преобразования. В некоторых книгах по вариационному исчислению приво-
приводятся сведения об экстремумах функций нескольких переменных н, в частности,
квадратичных форм; в таком случае изложение вопроса о собственных значениях
и т. п. становится оправданным, однако в настоящей книге мы этого делать не
будем.
§ 31
Первая и вторая вариации и условие трансверсальности
В этой главе мы ограничимся рассмотрением непараметричес-
непараметрического случая, так что лагранжиан имеет вид L(t, х, х), а допу-
допустимые кривые являются графиками функций х (t), определенных
в интервале t1 < t < t2. Никаких точно сформулированных пред-
предположений о гладкости мы сейчас не делаем. Кое-что о них будет
сказано в этой главе далее, а пока мы будем считать все рас-
рассматриваемые функции достаточно гладкими для того, чтобы все
выполняемые операции имели смысл.
Рассмотрим однопараметрическое семейство кривых
x(t, a), <,(«)««•(«).
в котором а = 0 отвечает заданной кривой х(/). Здесь мы пред-
предполагаем, что а—действительный параметр, область изменения
которого содержит 0 в качестве внутренней точки. Величины
L, y = Li и H = xy—L можно считать функциями от (t, а) даже
в тех случаях, когда гамильтониан Н (t, x, у) не определен одно-
однозначно или определен только локально. Для того чтобы удобнее
было отличать значения лагранжиана L, соответствующие кри-
кривым семейства x(t, а), от произвольных значений функции
L(t, х, х), первые будут обозначаться L*(t, а) или просто L*.
110 Гл. III. Погружение а целом
Далее, символом 3 или 3 (а) будет обозначаться интеграл от L*,
взятый по t от t1(a) до *а(а). Во всех функциях от а или от
(t, а) можно положить а = 0, исключая те случаи, когда мы диф-
дифференцируем по а.
Назовем первой и второй вариациями, 63 и 623, производ-
производные #'@), 3"@) функции 3 (а) по а, вычисленные приа = 0.
Начнем с того, что приведем эти вариации к более удобному
для исследования виду. Обозначим через X, Y, X, Y частные
производные по а от х, у, х, у (считая их функциями от (t, a)).
Далее, буквами а, Ь, с обозначим здесь матрицы Lxx, Lx-x, L-x-xt
рассматриваемые как функции от t. Раньше мы обозначали мат-
матрицу с через А, однако теперь этот символ понадобится нам для
других целей. Пусть А, В, С—квадратичные формы ХаХ, ХЬХ,
ХсХ; назовем вторичным лагранжианом функцию L (t, X, X), опре-
определенную равенством
Вычисляя частные производные La, Z.aa функции L*. находим
Эти выражения можно преобразовать еще и так:
C1.1)
Действительно, легко видеть, что первое из соотношений C1.1)
сразу следует из написанного выше выражения для La, а второе
получается из выражения для Laa с использованием тождества
-fa(yX) = — уХа + -gl (уХа) + YX,
где YX = X (dL-Jda) = В + С.
Если теперь мы продифференцируем по а сложную функцию
^(а), в которой подинтегральная функция и пределы интегриро-
интегрирования зависят от а, то получим
t2 (a)
§ 31. Первая и вторая вариации и условие трансверсальности Щ
Отсюда, полагая а = 0 и используя C1.1), находим, что если
кривая x(t)—экстремаль, то
C1.2) ' '
? (О2 + 2О' +уХа]Ъ + 2L dt.
Если же x(t) не является экстремалью, то к эгим выражениям
следует добавить соответственно интегралы от (Lx—у)Х и от
{Lx—у)Ха- В связи с этим часто оказывается удобным сохра-
сохранить для 63 исходную формулу, подставив вместо L« первона-
первоначально полученное выражение, а не преобразованное из C1.1).
В случае семейства x(t, а) с фиксированными концами, т. е.
когда t1(a) = tl, t2(a) = t2 и ХA1) = ХAг) = 0, это дает
t,
C1.3) 63 = §
Обозначим это выражение для 8# через 6,5, а выражение для 63
из C1.2) —через 6иЗ.
Определением экстремали мы считаем не уравнение Эйлера,
а непосредственно условие 6,3 = 0, которое должно выполняться
для всех допустимых X, обращающихся в нуль в точках tu /2.
Назовем его слабым определением экстремалей. Оно не требует
от нас никаких преждевременных обязательств и, в част-
частности, позволяет не уточнять класс рассматриваемых кривых,
чем мы и воспользуемся позднее в этой главе. Доказать,
что из условия 6,3 = 0 следует уравнение Эйлера и что в дей-
действительности эти условия эквивалентны, можно так же, как во
вступлении, и нет нужды повторять здесь эти рассуждения. (Еще
более слабое определение можно получить, если, как это было
сделано во вступлении, ограничиться функциями X, которые,
скажем, бесконечно дифференцируемы и обращаются в тождест-
тождественный нуль вблизи концов.)
Что же касается 6Н3, то ее можно записать следующим образом:
Здесь L*—ух = — Н, и мы обозначим через 8£, 6х соответственно
величины dt/da и X + xdt/da. Тогда вектор (—Н, у) можно на-
назвать вектором (обобщенного) импульса М, а векторы (б/, 6х),
вычисленные в точках /,, t2, —виртуальными перемещениями 6Р
и 6Q концов Р и Q кривой x(t). Таким образом,
C1.4) 6U3 = MQ6Q — МР6Р,
112 Гл. III. Погружение в целом.
где МР, MQ—значения вектора М в точках Р, Q. В вариацион-
вариационных задачах, в которых концы кривой меняются в заданных мно-
множествах, мы будем называть условием трансверсальности следую-
следующее условие: выражение C1.4) обращается в нуль при всех вир-
виртуальных перемещениях бР, 6Q концов Р, Q в пределах задан-
заданных множеств. Это такое же необходимое условие минимума,
как и уравнение Эйлера. Таким образом, условие обращения
в нуль первой вариации распадается на два независимых, а именно,
на уравнение Эйлера и условие трансверсальности. В теории
оптимального управления такой независимости уже не будет.
§ 32
Как обманчива вторая вариация!
Современный студент знает, что при отсутствии равномерной сходимости
следует проявлять осторожность, ибо с нарушением этого правила связано боль-
большинство классических ошибок. Вот две типичные ловушки:
(i) Пусть f — функция двух переменных (х, у). Предположим, что для каждой
прямои / на плоскости ограничение функции f на I непрерывно. Будет ли сама
функция f непрерывной иа плоскости?
(п) Пусть функция / такая же, как н в (i). Предположим, что для каждой
точки (х, у) существует интервал действительных чисел / с центром в 0, в котором
вспомогательная функция
ty)
является суммой своего ряда Тейлора
p'@) + • • •+-^ Ф(М
Будет ли тогда функция f(x, у) суммой своего ряда Тейлора по степеням х, у
в окрестности точки @, 0)?
Эти вопросы обычно задают студентам старших курсов; ответ на них отрица-
отрицательный. Если читатель до сих пор не сталкивался с подобными явлениями, то,
пожалуй, ему стоит отложить книгу в сторону и поразмыслить над ними с неделю.
Испытать свои силы на этих вопросах очень полезно, и если попытка окончится
неудачей, в этом нет ничего зазорного: возможно, что и сам Лагранж оказался бы
здесь не в лучшем положении. В конце этого параграфа мы приведем некоторые сооб-
соображения, объясняющие, почему ответ отрицателен. Между прочим, это излюблен-
излюбленные вопросы, которые обычно предлагают математики аспирантам других спе-
специальностей.
Вопрос (п) можно видоизменить: предположим, что для каждой точки (х, у)
вспомогательная функция ф удовлетворяет условиям ф'@)=0, ф"@)>0. Верно
ли, чю функция / имеет локальный минимум в начале координат? Ответ снова
отри 1ятелы1ыи.
Сохранив обозначения предыдущего параграфа, рассмотрим теперь фиксиро-
фиксированную кривую x(t), погруженную в семейство х(t,а), удовлетворяющее заданным
условиям. Предположим, что условия 3'@)=0,3"@)>0выполняются для каждого
такого семейства, исключая тривиальный случай, когда функция X(t) тождест-
тождественно равна нулю. Следует ли отсюда, что на кривой x(t) достигается минимум
в классе кривых, удовлетворяющих условиям задачи и лежащих в некоторой
окрестности множества точек кривой х(/)? Лагранж был уверен, что на этот вопрос
следует отвечать утвердительно. Однако приведенный выше пример заставляет
Сильно усомниться в этом. Подробный анализ ошибочности рассуждений Лаг-
§ 33. Вторичный гамильтониан
113
ранжа вместе с примером, показывающим, что ответ отрицательный, приведен
в книге Адамара (§§38—43). Мы приглашаем читателя обратиться прямо к перво-
первоисточнику, в котором все это необычайно ясно изложено одним из великих мысли-
мыслителей минувших дней. Широкий кругозор можно приобрести лишь в тиши биб-
библиотек, постигая математические идеи, так сказать, «из первых рук».
Для того чтобы огветить иа вопросы (i) и (И), рассмотрим изображенные на
рисунке дуги окружностей Cv C2, Ся, которые касаются в начале координат и со-
соединяют его с тремя точками,
лежащими в первом квадранте.
Соединим вторые концы дуг Си
С3 дугой Г так, чтобы оиа лежа-
лежала в этом же квадранте и не пе-
пересекала дугу С2. Теперь мы
без труда можем построить функ-
функцию f\x. у), которая равна нулю
на дугах Сх, Ся, Г и вне области,
ограниченной этими дугами, не-
непрерывна внутри этой области
@,0)
и принимает постоянное значение
I на дугеС2 всюду, кроме начала
координат. Такая функция / раз-
разрывна в начале координат. Одна- ——— ■
ко она удовлетворяет предположениям, в которых ставятся вопросы (i) и (ii). Следо-
Следовательно, ответ на оба эти вопроса отрицательный. Далее, можно сделать так,
чтобы функция f была неотрицательной. Тогда функция х2-\-у —f(x, у) удовлет-
удовлетворяет условиям второго варианта вопроса (ii), но в начале координат не имеет
локального минимума. Чтобы функция / обладала указанными выше свойствами,
можно, например, взять ее в виде произведения fxf2, где f2 — непрерывная функ-
функция, равная единице на С2 и нулю иа Г, а /х — такая функция, что линии /х=
=const внутри области, ограниченной кривой Cj+Сз+Г, являются дугами ок-
окружностей, касающимися С,- в начале координат. Внутри этой области в качестве
fi можно взять элементарную функцию радиуса таких дуг, которая обращается
в нуль для радиусов дуг С1 и С3 и равна единице на С2.
§ зз
Вторичный гамильтониан
Предположим теперь, что кривая x(t), рассмотренная в §31,
имеет неособые линейные элементы. Тогда матрица, которую мы
обозначили через с, невырожденна, и можно считать, что Н
является локальным гамильтонианом Н (t, x, у), определенным
так же, как в § 22 гл. II. Это означает, что любому семейству
x(t, а), в которое погружена кривая x(t), соответствуют векто-
векторы х, х, у, удовлетворяющие локально следующим уравнениям:
C3.1) LX = ~HX, Lk=y, Hv = x.
Обозначим через а', Ъ', с' матрицы, составленные из частных произ-
производных второго порядка гамильтониана Н вдоль кривой х (t):
а'=НХХ, Ь' = Нху, с'—Нуу соответственно. Обозначим через А',
В', С квадратичные формы Ха'Х, Xb'Y, Yc'Y и назовем вто-
вторичным гамильтонианом функцию Н = Н(*. А", К), определенную
равенством
2Н=А' + 2В'+С\
114 Гл. III. Погружение в целом
Вскоре мы увидим, что вторичный гамильтониан Н не зависит
от выбора локального гамильтониана Н.
Вектор-функции X, X, Y аргумента t, порожденные, как выше,
семейством x(t, а), также связаны между собой уравнениями,
являющимися следствиями уравнений C3.1). Используя элемен-
элементарные правила вычисления частных производных сложных функ-
функций, мы находим сначала, что при а = 0
/'
Это уравнение можно записать следующим образом:
— Н — Н
Аналогично
JL н — н —L— L — L = L •
Следовательно, взяв частные производные по а в C3.1), мы по-
получим соответствующие соотношения для X, X, Y, a именно:
C3.2) Lx= — Hx, lx=Y, Hr=X.
Если соотношения C3.2) выполняются, то, с одной стороны
-Л У = У Ну = Xli yt
а с другой, применив к квадратичным формам L, Н тождество
Эйлера для однородных функций, получим
Два первых члена правой части этого равенства сокращаются,
а каждый из остальных равен XY. Следовательно,
C3.3) L + Н = XY.
Для того чтобы понять смысл этих формул, вспомним, что
с и с'—обратные матрицы, как уже отмечалось в конце § 22 гл. II.
Дифференцируя по х тождество
Lx(t, х, i) + Hx(t.x,L][) = 0,
мы получаем соотношение
C3.4) Ь + Ь'с = О.
Умножив его на с', находим, что
C3.5)
§ 33. Вторичный гамильтониан JJ5
Поэтому каждое из векторных уравнений
C3.6) Xb+Xc=Y, X^Xb'
является следствием другого, а это означает, что два последних
соотношения из C3.2) эквивалентны.
Установив это, возьмем произвольную тройку (t0, Xo, Yn),
где Хп, Yo—векторы и t1<Ct0<t2. Согласно только что сделан-
сделанному замечанию, существует единственный вектор Ро, для кото-
которого Y0 = L^(t0, Хо, Ро). Рассмотрим семейство
x(t, a)=x{t) + aX0 + a{t-t0)P0.
При t = t0 соответствующими этому семейству частными произ-
производными по а функций х, х, у будут X = Хо, Х = Р0, Y = Yo.
Значит, для произвольно выбранной тройки (t, X, Y) = (t0, Х„, Yo)
выполняются соотношения C3.2), C3.3), если только X—единст-
X—единственный вектор, удовлетворяющий уравнениям C3.6). Следова-
Следовательно, равенство C3.3) определяет вторичный гамильтониан
Н(/, X, Y) для всех троек, а это в соответствии с нашим общим
определением (§22 гл. II) означает, что Н — единственный гамиль-
гамильтониан для задачи с лагранжианом L. Здесь, таким образом,
определение перестало быть локальным.
Назовем задачу с лагранжианом L вторичной задачей, а ее
экстремали—вторичными экстремалями. Канонические вторичные
экстремали определяются тогда уравнением
Y = -Hx.
Отметим, что это уравнение можно получить непосредственно,
дифференцируя по а уравнение у —— Нх. Это означает, что
если каждая кривая x(t, а) является экстремалью, то кривая
X(t)—вторичная экстремаль.
Этот результат стоит подчеркнуть; дифференцируя семейство
x(t, а) экстремалей первоначальной задачи по а и полагая а = О,
мы получаем вторичную экстремаль, канонические уравнения
которой имеют вид
C3.7) Х=Ну, Г = — Нх.
Эти уравнения, линейные и однородные по X, Y, с коэффициен-
коэффициентами, зависящими от /, известны под названием дифференциаль-
дифференциальных уравнений Якоби- Обратно, любое решение X(t), Y(t) урав-
уравнений C3.7) можно получить как частную производную по а
при а = 0 для семейства экстремалей x(t, a), y(t, а), определен-
определенного первоначальными каноническими уравнениями Эйлера и на-
начальными условиями x(to)-{-<xX(to), y(tv)-\-aY(t0) при t = t0.
Гл. Ill. Погружение в целом
Так как Н — однородная квадратичная форма по X, Y, то вдоль
вторичной экстремали
= — XY + YX,
и, следовательно, ввиду C3.3),
Таким образом, интегрируя по t вдоль вторичной экстремали
X (t) в пределах от f, до t2, мы получаем
C3.8) j 2L dt = X (/,) Y (/,) -X (tt) Y (f,).
'■
Это простое свойство, позволяющее' выполнить интегрирование
в явном виде, очень поможет нам в дальнейшем.
§34
Геометрическая интерпретация понятия точности
Теперь мы рассмотрим одну элементарную задачу комплекс-
комплексной аналитической геометрии, решение которой позволяет очень
просто интерпретировать обращение в нуль скобок Лагранжа.
Рассмотрим комплексный вектор X-\-iY, состоящий из п комп-
комплексных компонент. Такой вектор назовем чисто комплексным,
если X и Y получаются из одного и того же действительного
единичного вектора е умножением на действительные скаляры.
Вектор е определен этим однозначно, если только X и Y одновре-
одновременно не равны нулю; мы будем называть его направлением
чисто комплексного вектора X + iY. Множество чисто комплекс-
комплексных векторов будем называть независимым, если их направления
ортогональны. Множество, состоящее из действительных линей-
линейных комбинаций п независимых чисто комплексных векторов,
будем называть отмеченной гиперплоскостью1*.
Расширенным скалярным произведением двух комплексных
векторов X-\-iY и Х* + iY* назовем комплексное число
C4.1) XX* + YY* + i(YX*—XY*),
где выражения XX* и т. д. являются обычными скалярными
произведениями действительных векторов. Выражение C4.1), кото-
которое в общем случае не коммутативно, является формальным
произведением векторов X+iY и X*—iY*, но нам кажется более
удобным обойтись без изменения знака перед мнимой частью.
Действительная часть выражения C4.1) является обычным ска-
Х) Следует обратить внимание на то, что приставка «гипер» не означает
здесь «коразмерности I». То же нужно иметь в виду и далее.— Прим. ред.
§ 34. Геометрическая интерпретация понятия точности tl7
лярным произведением векторов (X, У), {X*, У*) с удвоенным
числом компонент, а мнимая часть этого выражения с точностью
до знака равна скобке Лагранжа этих двух векторов. Очевидно,
что произведение C4.1) коммутативно, если скобка Лагранжа
обращается в нуль. В этом случае мы называем C4.1) точным
скалярным произведением. Множество комплексных векторов,
для каждой пары которых расширенное скалярное произведение
является точным, будем называть множеством точности.
C4.2) Теорема. Для того чтобы множество комплексных век-
векторов было множеством точности, необходимо и достаточно,
чтобы оно лежало в некоторой отмеченной гиперплоскости.
Доказательство. «Достаточность» следует из четырех простых
замечаний: (i) Расширенное скалярное произведение не меняется
при действительном ортогональном преобразовании; значит, мы
можем взять в качестве заданной отмеченной гиперплоскости мно-
множество, состоящее из действительных линейных комбинаций п чисто
комплексных векторов, каждый из которых принадлежит своей
(комплексной) координатной плоскости1', (ii) Эти п чисто комп-
комплексных векторов образуют множество точности, так как для
них все произведения C4.1) равны нулю, (iii) Действительные
линейные комбинации векторов из множества точности также
образуют множество точности, так как скобки Лагранжа били-
билинейны. Следовательно, отмеченная гиперплоскость является мно-
множеством точности, (iv) Свойство точности множества сохраняется
для любого его подмножества. Значит, подмножество отмеченной
гиперплоскости является множеством точности.
Перейдем теперь к доказательству «необходимости». Для того
чтобы применить метод индукции, рассмотрим сначала случай
п = 1. В этом случае отмеченную гиперпло-
гиперплоскость, в которой лежит данное множество
точности, найти очень легко — ею будет прямая,
проходящая через начало координат и задавае- f~~ -*- ае +
мая уравнением
ХУ*~ YX* = 0, I " (^ Е
где X*-\-iY*—любой фиксированный элемент
данного множества, отличный от нуля. Пред-
положим теперь, что п> 1, и будем рассуждать по индукции.
Пусть Е — множество точности в пространстве С„ комплексных
векторов из п компонент. Рассмотрим две возможности:
(а) Предположим сначала, что существует гиперплоскость
Пэ£, которая проходит через начало координат, является мно-
множеством точности и содержит по крайней мере один чисто комп-
!» То есть имеет вид @, 0 г, 0 О). — Прим. ред.
Гл. III. Погружение в целом
лексный вектор ae-\-i$e. Здесь е—действительный единичный
вектор, а действительные числа а, р не равны одновременно
нулю; мы можем считать вектор е координатным единичным
вектором. Пусть IIj и П2 — подмножества гиперплоскости П,
состоящие из векторов X \-iY, для которых соответственно Xe — t
и Уе — Ь. Так как гиперплоскость П является множеством точ-
точности, то EХе—аУе равно нулю и, следовательно, по крайней
мере в одном из подмножеств nif П2 выполняются оба равенства
Хе = 0, Ye = O. Обозначим это множество через Ег1У. Оно явля-
является множеством точности и лежит в пространстве Сп_х\ в соот-
соответствии с предположением индукции оно должно лежать в отме-
отмеченной гиперплоскости пространства Cn_!- Взяв действительные
линейные комбинации элементов этой отмеченной гиперплоскости
и вектора ae-\-i$e, мы получим отмеченную гиперплоскость
пространства С„, которая содержит П, а следовательно, и "мно-
"множество Е.
(Ь) Допустим теперь, что предположения пункта (а) не выпол-
выполняются, и приведем это допущение к противоречию. Заменив
множество Е его (действительной) линейной оболочкой, мы можем
считать, что Е—гиперплоскость, проходящая через начало коор-
координат. Пусть, далее, R обозначает множество действительных
векторов X, для которых X-\-iY£E. Множество R должно
совпадать со всем и-мерным пространством, так как в противном
случае оно было бы ортогонально некоторому единичному век-
вектору е, и тогда чисто комплексный вектор X* + iY* = 0-\-ie удов-
удовлетворял бы условию XY*—УХ* = 0 для всех X + iY£E, т. е.
предположения из пункта (а) выполнялись бы для гиперплос-
гиперплоскости П, состоящей из (действительных) линейных комбинаций
элементов множества Е и вектора 0-fie.
Заметим теперь, что для каждого X £ R может существовать
только один Y, такой, что X-\-iY£Е, так как в противном
случае вопреки допущению множество Е содержало бы разность
двух таких векторов, которая является чисто комплексным век-
вектором 0 + iY.
В частности, беря в качестве X поочередно координатные
единичные векторы ек, k=\, .... п, мы получим векторы
Yk = 2алЛ» такие, что eh-\-iYР£ Е. Ввиду точности множества Е,
= елК4—esYk = ask—a
ks.
Следовательно, матрица A = (aks) симметрична. Значит, сущест-
существует такая ортогональная матрица Т, что
ТАТ'1
1} Либо оба множества П,, П2 совпадают с £1? либо одно из них есть Elt
а другое П.
§ 35. Отмеченные семейства 7/9
является диагональной матрицей; пусть Кк—ее диагональные
элементы.
Обозначим через (trs) и (т„) соответственно матрицы Т и Т~1;
существуют п ортогональных единичных векторов е*,, для которых
Но тогда
2 trsYs = 2 <,АА = 2 trsaskTkleJ =
s s, к s, к, I
и, таким образом, для любого г гиперплоскость £ содержит
комбинацию
которая является чисто комплексным вектором, что противоре-
противоречит допущению.
Это завершает доказательство.
§ 35
Отмеченные семейства
Предположим теперь, что для каждого линейного элемента
первоначальной экстремали x(t) лагранжиан L удовлетворяет
условию Лежандра, т. е. квадратичная форма С из § 31 поло-
положительно определена. (Связь этого условия с обманчивым усло-
условием положительности второй вариации рассматривается в книге
Адамара в § 259—262.) Для изучаемой нами вторичной задачи
условие Лежандра означает, что каждый линейный элемент
(t, X, X) является сильным (гл. II, § 28). Вторичная постановка
задачи, которой мы здесь будем заниматься, дает нам удобный
язык; к тому же, в ней многое упрощается. Лагранжиан явля-
является квадратичной формой, уравнения Эйлера (называемые теперь
уравнениями Якоби) линейны, интеграл от лагранжиана L вдоль
кривой С, который мы обозначим через I (С), можно вычислить
в явном виде, когда С—вторичная экстремаль.
Во вторичной задаче точку, линейный элемент и каноничес-
каноническую точку будем, как и прежде, обозначать символами (t, X),
(t, X, X) и (/, X, Y). Если же t отсутствует, то заглавные
буквы обозначают соответствующие функции от t. Так, пара
(X, Y), или (X + iY), обозначает каноническую вторичную
экстремаль, которая может зависеть еще от дополнительного
параметра и. Верхний индекс ° обозначает «начальное» значение
при некотором t — t0.
Ввиду линейности уравнений Якоби, канонические вторичные
экстремали образуют 2л-мерное линейное семейство, члены кото-
120 Гл. Ill. Погружение в целом
рого определяются своими начальными значениями. Говоря «опре-
«определяются», мы подразумеваем также, что соответствие между
начальными значениями и членами семейства линейно. Можно
выразить это еще и так: наше 2и-мерное линейное семейство
изоморфно 2п-мерному евклидову пространству. Следовательно,
любое семейство канонических вторичных экстремалей, или, как
мы будем говорить, любое вторичное семейство, можно изобра-
изобразить в виде подмножества 2и-мерного евклидова пространства.
Чтобы отличить само семейство от его образа, мы будем гово-
говорить иногда о движущемся подмножестве. В основном нас будут
интересовать линейные подсемейства, которые изображаются
гиперплоскостями, и, в частности, «-параметрическое линейное
семейство, состоящее из членов вида
C5.!) X + iY^uk{Xk + iYk),
где ик (k=\, ..., п) — компоненты n-мерного параметра и,
a (Xft, Yk) — канонические вторичные экстремали с линейно неза-
независимыми начальными значениями при t = t0. Это семейство, опре-
определенное формулой C5.1), будем обозначать X(t, и), Y(t, и).
Одним из следствий линейности является возможность вклю-
включения любых двух канонических вторичных экстремалей (X, Y),
(Л*, Y*) в семейство
*Х*. aY+a*Y*),
для которого скобки Лагранжа [а, а*], относящиеся ко вторич-
вторичной задаче, имеют такой же вид, как и для первоначальной,
а именно XY* — YX*. Это выражение назовем скобками Лаг-
Лагранжа двух канонических вторичных экстремалей. Заметим, что
C5.2) Т
Это равенство является частным случаем соотношения A5.3) из
§ 15 гл. I (когда наклон u = p(t, и) равен нулю во всей рас-
рассматриваемой области (t, и)). Равенство C5.2) можно также полу-
получить непосредственно. А именно, в обозначениях § 33 произ-
производная
равна билинейной форме —Xa'X*-\-Yc'Y*, которая ввиду сим-
симметрии равна также производной от X*Y.
Из C5.2) следует, что вторичное семейство, в котором скобки
Лагранжа равны нулю, изоморфно множеству точности, образо-
образованному начальными значениями X° + iY° принадлежащих ему
экстремалей. Такие семейства будем называть семействами точ-
§ 35. Отмеченные семейства 121
ности. Семейство точности назовем отмеченным, если оно явля-
является «-параметрическим семейством.
Согласно теореме C4.2), множество начальных значений отме-
отмеченного семейства содержится в отмеченной гиперплоскости комп-
комплексных векторов. Следовательно, оно совпадает с этой отме-
отмеченной гиперплоскостью при любом t0, для которого множество
начальных значений n-мерно, и уж заведомо хотя бы для одного
такого t0. Помимо прочего, это означает, что семейство нельзя
расширить, не нарушив свойство точности, ввиду теоремы C4.2).
Поэтому если мы сдвинем ^0, то множество начальных значений
опять должно быть отмеченной гиперплоскостью комплексных
векторов; в противном случае мы могли бы расширить новое мно-
множество начальныл значений, а с ним и семейство.
Таким образом, если F—отмеченное семейство канонических
экстремалей и t0—любое значение, для которого F определено,
то существуют такие ортогональные единичные векторы ек
(k=l, ...,n) и соответствующие пары действительных чисел
ак, Ьк, не равных одновременно нулю, что члены семейства F
являются линейными комбинациями вида C5.1) п канонических
вторичных экстремалей Xk-\-iYk с начальными значениями
C5.3) Xl + iY% = akek + ibkek.
Положим cft = 0, если ак — 0, и ск — Ьк/ак, если акф0. Кроме
отмеченного семейства F, мы будем рассматривать отмеченное
семейство F*, члены которого являются линейными комбинациями
второй системы из п канонических вторичных экстремалей
Xk + iYZ с начальными значениями
C5.4) X? + iY?=ell + iclfih.
Важной величиной, набор значений которой одинаков для чле-
членов обоих семейств F и F*, является скалярное произведение XY
при / = /0. Ввиду C5.3) ее значения для членов семейства F
равны
C5.5) Х°Г° = 2 fl A («*)'
к
где X°k — (X°ek) зависит только от X" для каждого к. Если все
акФ0, то семейства F и F* совпадают с точностью до изменения
параметров. Однако в общем случае эти семейства различны, хотя
они могут иметь общие члены.
Обозначим через G, G* семейства, составленные из действи-
действительных частей членов X-\-iY семейств F, F* соответственно.
C5.6) Лемма. Существует такое б > 0, что семейство G* одно-
однократно покрывает полосу \t — to\ <б пространства (/, X).
122 Гл. III. Погружение в целом
Доказательство. Так как члены семейства Т7* являются реше-
решениями линейных уравнений Якоби, то они имеют вид
X*{iY* = X*(t, u) + iY*(t, u) = u(Z
где и—параметр из C5.1), а 3 и в—матрицы порядка п. Началь-
Начальными значениями этих решений являются, согласно C5.4),
2
к
Поэтому при t — tn матрица 2 превращается в единичную мат-
матрицу и, значит, она невырожден на в некотором интервале
\t — /0|<6. В этом интервале уравнение
X*(t, u)-^v
разрешимо для любого произвольного вектора v, а именно
Очевидно, что для каждого / это отображение взаимно однозначно
и, следовательно, семейство G* однократно покрывает указанную
полосу.
C5.7) Следствие. Семейство G* является геодезическим покры-
покрытием той же по.юсы.
Доказательство. Для того чтобы из семейства G* получить
семейство F*, нужно просто положить Y = Lx- Так как скобки
Лагранжа равны нулю и полоса (t, и) односвязна, то G*—инду-
G*—индуцированное точное семейство, а значит, оно является точным
семейством в полосе {t, X), на которую полоса (t, и) отображена
взаимно однозначно.
C5.8) Теорема. Семейство G однократно покрывает полосы
t0—б <t <t0 и t0 <t < /0 + 6 в пространстве (t, X), причем б
здесь такое же, как в лемме C5.6).
Доказательство. Так как отображение, определяемое для каж-
каждого t семейством G, тоже линейно, то нужно только проверить,
что в указанных полосах никакие два члена этого семейства не
могут пересекаться; по линейности это равносильно тому, что
никакой ненулевой член семейства не пересекается с осью t.
Предположим противное. Тогда существует дуга у, принад-
принадлежащая семейству G, соединяющая точки вида (t0, X") и (tlt 0),
гДе 1^1 — ^о|<^> и не являющаяся отрезком оси t. Ввиду C5.5)
и C3.8)
где e = sign(/0—tj.
§ 36. Каноническое погружение и фокальные точки 123
Используя, далее, инвариантный интеграл Гильберта для се-
семейства F*, можно определить в полосе \t—fo|<6 функцию
S(t, x), обращающуюся в нуль в точке Aи, 0). При t~t0, интег-
интегрируя YdX вдоль прямой, исходящей из точки {t0, 0), мы полу-
получаем с учетом C5.4)
Далее, разность значений функции S в концах любой дуги y*£G*,
лежащей в полосе |/ — /0|<б, равна \(у*). В частности, взяв в
качестве у* отрезок оси t, получим
S(tly 0) = 0. Поэтому разность AS зна-
значений функции S в концах дуги у, с
которой мы начали наши рассуждения,
равна
Это противоречит формуле Вейерштрасса
A2.6) из § 12 гл. I, так как вторич-
вторичная функция Вейерштрасса должна
иметь положительный интеграл вдоль дуги у, которая не является
дугой семейства G*. Это противоречие завершает доказательство.
C5.9) Следствие. Если X(t, u)-\-iY{t, и)—семейство F, то
в той же паре полос X{t, и)Ф0 при ифО.
Действительно, если X(t, и) = 0 для некоторого t, то, согласно
теореме C5.8), X(t, u) = 0 для всех t, принадлежащих интерва-
интервалам оси t, попадающим в эти полосы. Но тогда из уравнений
Якоби следует, что Y(t, и) = 0, а потому и и = 0.
§ 36
Каноническое погружение и фокальные точки
Рассмотрим первоначальную задачу с лагранжианом L и пред-
предположим, что Г—каноническая экстремаль, вдоль которой вы-
выполняется условие Лежандра и которая погружена в семейство
канонических экстремалей
x(t, и), y(t, и), ы = (и„ .... ип),
определенное на подходящем ^-интервале для всех достаточно
малых постоянных значений «-мерного параметра и, причем
сама Г получается, если положить и = 0. Предположим, что
семейство достаточно гладкое и что для некоторого t = t0 оно
удовлетворяет следующим начальным условиям: скобки Лагранжа
равны нулю и для н = 0 матрица Якоби (дг„, у„) имеет ранг п.
Когда эти предположения выполняются, мы называем погружение
каноническим.
124 Гл. 111. Погружение в целом
Каноническому погружению поставим в соответствие семей-
семейство F вторичных канонических экстремалей
X(t, u) + iY(t, u) = ^uk(Xk(t) + iYk(t)),
к
где Xk, Yk—частные производные функций x(t,u), y(t, и) по ик,
вычисленные при ы = 0. Таким образом, строками матрицы Якоби
(*н. Уи) являются векторы (Xk, Yk). Тем самым последние линейно
независимы в ta и их скобки Лагранжа равны нулю в этой точке,
а значит, F — отмеченное семейство; следовательно, начальные
условия, которые, согласно первоначальной формулировке, должны
были выполняться для t = tn, выполняются для всех рассматри-
рассматриваемых значений /. Любог отмеченное семейство, определенное
на том же /-интервале, что и каноническая экстремаль Г, задает
в свою очередь каноническое погружение для вторичной задачи,
а именно, погружение канонической вторичной экстремали
X(/) = Y(t) = О, другими словами,— того же самого интервала
оси t.
Обозначим через у экстремаль, порождающую каноническую
экстремаль Г. Это означает, что для перехода от у к Г нужно
просто построить функцию y(t) — l.x, определенную вдоль у.
Экстремаль у погружена в семейство экстремалей x(t, и), которое
аналогичным образом порождает наше первоначальное семейство;
назовем x(t, и) действительной частью рассматриваемого канони-
канонического погружения. Так же как и раньше, мы будем часто
пользоваться комплексным обозначением x-\-iy вместо обозначе-
обозначения (х, у). Семейство экстремалей х (t, и), образующее действи-
действительную часть канонического погружения, будем для краткости
и простоты называть связкой экстремалей, окружающей у. Дей-
Действительные части X(t, и) соответствующих членов семейства F
образуют вторичную связку, которая всегда окружает соответ-
соответствующий отрезок оси t.
Назовем фокальной точкой нашего канонического погружения
точку экстремали у, в которой матрица Якоби ха вырожденна.
Соответствующее значение t определяет на оси / фокальную
точку вторичного канонического погружения, заданного семей-
семейством F; последнюю можно также охарактеризовать как точку,
в которой определитель, составленный из векторов Хк, равен
нулю. Другими словами, точка t является фокальной, если су-
существует такая линейная комбинация
X(t, и)=
2«
что X(t, и) равно нулю для этого значения Л Вспоминая C5.9),
выводим отсюда следующую теорему:
§ 36. Каноническое погружение и фокальные точки 125
C6.1) Теорема. Если вдоль экстремали у выполняется условие
Лежандра, то фокальные точки каждого канонического погруже-
погружения канонической экстремали Г изолированы.
(Однако, как показывает пример, приведенный в § 328 книги Каратеодори,
экстремаль у может содержать неизолированные фокальные точки погружений
других экстремалей семейства X(t, и) в то же самое семейство; даже вся экстре-
экстремаль у может состоять из точек ее пересечения с такими «родственными» экстре-
экстремалями в их фокальных точках. Когда мы говорим, что экстремаль у не содержит
фокальных точек, то подобные «посторонние» фокальные точки во внимание не
принимаются.)
В дальнейшем условие Лежандра, как правило, будет заме-
заменяться более жестким условием: экстремаль у состоит из силь-
сильных неособых линейных элементов, или, как мы будем говорить,
экстремаль у—сильная и неособая.(Заменив функцию Вейерштрасса
остаточным членом ряда Тейлора, мы довольно легко обнаружим,
что матрица c = Lxx не имеет отрицательных собственных значе-
значений; будучи невырожденной, она не может иметь и собственное
значение 0. Это означает, что квадратичная форма С положи-
положительно определена, т. е. выполняется условие Лежандра.)
C6.2) Теорема. Пусть у—сильная неособая дуга экстремали,
погруженная в связку экстремалей без фокальных точек, и пусть
А—полоса t'^.t^.t" значений t, для которых определена дуга у.
Тогда эта связка осуществляет геодезическое покрытие сильными
дугами экстремалей пересечения некоторого открытого множе-
множества W^y с полосой А, причем для каждой другой допустимой
непараметрической кривой CcW Л А с теми же концами, что и у,
выполняется неравенство
3(у)<Э(С).
Доказательство. Сузив, если это потребуется, область измене-
изменения параметра и, мы можем предположить, что каждая экстре-
экстремаль связки сильная и неособая. Далее, поскольку матрица
xa(t, 0) невырожденна для каждого рассматриваемого значения t,
уравнение x(t, u) = x однозначно разрешимо относительно и
вблизи ы = 0. Следовательно, сузив, если понадобится, область
изменения и еще раз, мы получим, что наша связка однократно
покрывает часть некоторого открытого множества W^y, попав-
попавшую в полосу А. Тем самым эта связка осуществляет геодези-
геодезическое покрытие пересечения Wf)A, так как скобки Лагранжа
равны нулю. Значит, искомое неравенство следует из формулы
A2.7) § 12 гл. I.
Позднее (см. C7.6)) мы увидим, что такой же вывод справедлив и в предельном
случае, когда один из концов дуги у является фокальной точкой, но других
фокальных точек на ней иет.
126 Гл. III. Погружение в целом
В дальнейшем наиболее важным примером связки будет се-
семейство экстремалей, проходящих через одну и ту же точку
(t0, х0). В этом случае мы будем говорить о пучке экстремалей,
а точку (/0, х0) будем называть его вершиной. Нас в основном
будут интересовать пучки с вершинами в общем начале или об-
общем конце всех экстремален; такие пучки мы будем называть со-
соответственно прямыми или обратными. Эта терминология согла-
согласуется с терминологией гл. II, в которой мы ограничились
рассмотрением локальных пучков (§ 28).
В канонических переменных мы будем рассматривать погру-
погружения следующего вида. Пусть Г—каноническая экстремаль,
определяемая заданной экстремалью у, содержащей точку (t0, х0),
причем вдоль у выполняется условие Лежандра. Обозначим
через у0 начальное (в точке /0) значение сопряженного канони-
канонического вектора. Назовем каноническим пучком с вершиной
(/0, х0) семейство канонических экстремалей
x(t, и), y{t, и),
определенных на /-интервале, содержащем ta, и удовлетворяющих
начальным условиям
x(t0, и) = х0, y(t0, u) =
При этом мы ограничиваемся здесь рассмотрением достаточно
малой области изменения и, содержащей точку ы = 0. Заметим,
что при ы = 0 ранг матрицы (хи, уи), как и полагается, равен п,
а скобки Лагранжа обращаются
в нуль в точке /0. Отсюда сле-
у дует, что канонический пучок
всегда задает каноническое по-
погружение экстремали Г. Соот-
Соответствующие семейства вторич-
вторичных экстремалей (канонических
wx ч вторичных экстремалей) будем
01 ° называть вторичным пучком
Прямой пучок вокруг у. (вторичным каноническим пуч-
пучком). Все эти пучки зависят
) у ст
только от ^-интервала, вершины и начального значения вектора
у на канонической экстремали Г. Зависимость от у0 не влияет на
отдельные члены семейства, но влияет на его состав и определя-
определяет, в частности, способ его сужения.
Очевидно, что вершина пучка является фокальной точкой
погружения. Другие фокальные точки на дуге у, если они суще-
существуют, образуют прямое или обратное сопряженное множество
точки (/„, х0) в зависимости от знака / — /0. На экстремали у
можно одновременно рассматривать оба эти множества, но в
основном мы будем работать только с одним из них, так как
§ 37. Теория сопряженных точек по Якоби 127
нас будет интересовать либо прямой пучок, либо обратный
пучок. Ближайшую к точке (t0, x0) точку прямого (обратного)
сопряженного множества будем называть прямой (обратной)
сопряженной точкой точки (tn, ха) на экстремали у; соответствующие
значения / обозначим t1 и <_,. Они являются прямой и обратной
сопряженными точками точки ta на оси t для вторичной задачи.
Конечно, любое из сопряженных множеств или оба они могут
оказаться пустыми.
§ 37
Теория сопряженных точек по Якоби
Используя только что введенное понятие сопряженной точки, мы сможем
в этом параграфе глубже проникнуть в сущность классической теории. Для кчас-
сической теории, так же как для теории аналитических функций, характерны пред-
предположения о гладкости, которые в нашем случае дополняются так называемым
условием регулярности, исключающим все, кроме сильных неособых линейных
элементов. Так же как в теории аналитических функций, эти предположения
(современный анализ в значительной степени освободился от них) заставляют нас
снова обратить внимание на связи с топологией, о которых мы уже несколько
раз упоминали и которые снова проявятся в последних параграфах этой главы.
В последующих главах мы постараемся освободиться от части классических
предположений и таким образом получим возможность вернуться в главное русло
идей и методов теории функций действительного переменного и функционального
анализа с целью исследования более общих ситуаций, близких к задачам опти-
оптимального управления.
Тем не менее уже для доказательства основной теоремы этого параграфа,
которое отнимет у нас некоторог время, потребуется аппарат, разработанный
Тонелли и весьма современный по своей идее. В сущности он позволяет объединить
результаты, полученные при рассмотрении двух различных геодезических покры-
покрытий смежных областей, а это аналогично процедуре, используемой в оптимальном
управлении. Доказательство этой теоремы будет довольно длинным, ибо мы прово-
проводим его во всех подробностях, так сказать, исследуем под микроскопом.
C7.1) Основная теорема Якоби. Пусть у—сильная неособая
дуга экстремали, a (t0, х„)—один из ее концов. Предположим,
что у не содержит точки, сопряженной точке (tn, х(). Тогда
существует такое открытое множество Woz>y, что для каждой
другой допустимой непараметрической кривой CcW0, имеющей
те же концы, что и у, выполняется неравенство
3(у)<3 (С).
Доказательство. Достаточно рассмотреть случай, когда точка
(t0, xn) является началом дуги у. Предположим, что 7 задана
функцией х (t) (/„ ^ t ^ /"), и пусть р0 обозначает начальный
наклон x(t0). Погрузим дугу у в прямой пучок, состоящий из
сильных и неособых экстремалей (последнего всегда можно до-
добиться, сужая, если это необходимо, рассматриваемую область
изменения и).
Открытое множество Wo определим как множество точек,
расположенных на расстоянии, меньшем некоторого положитель-
128
Гл. III. Погружение в целом
ного р, от дуги у. Число р выберем следующим образом. Возь-
Возьмем некоторое /' в интервале /„</'< t" и обозначим через А',
А" и Т соответственно полосы to^.t^t', t'^.t^.t" и гипер-
гиперплоскость t — t'. Части дуги у, попавшие в А' и А", обозначим
через у' и у", а точку дуги у на гиперплоскости Т — через Q.
Д'
т
Д"
г
Подмножества множества Wo, состоящие из точек, расположен-
расположенных на расстоянии, меньшем р, от у', у" и Q, обозначим соот-
соответственно через W'o, W"o и Vn. В качестве р можно взять любое
положительное число, достаточно малое для того, чтобы выпол-
выполнялись следующие три условия: подмножества W'o, W^ и Vo должны
лежать в окрестностях W, W" и V соответственно дуг у', у" и
точки Q. Окрестности W, W" и V сейчас будут определены.
Сначала возьмем в качестве окрестности W ту окрестность
точки (/„, х0), которая вместе с некоторой узкой окрестностью
линейного элемента (t0, x0, р0) рассматривается в теореме B8.8)
из § 28 гл. II. Для того чтобы W была также и окрестностью
всей дуги у', достаточно взять V близким к /0. Так автомати-
автоматически и получится, если мы будем выбирать /' из интервала
^о<^'<*о + 6. где б > 0, /0 + б<Г и б достаточно мало для
того, чтобы для каждого /' из этого интервала и каждого век-
вектора р, для которого | /э — р01 <б, множество W содержало дугу
экстремали у', соответствующую интервалу ^0^/<1/' и имеющую
начальный линейный элемент (/„, х0, р). Ввиду непрерывности
это безусловно справедливо для достаточно малых б.
§ 37. Теория сопряженных точек по $коби
129
Возьмем число б настолько малым, чтобы все такие началь-
начальные линейные элементы A0, х0, р) лежали в узкой окрестности
линейного элемента (/„, х0> р0), которую в теореме B8.8) мы обо-
обозначили через N. В этой ситуации, согласно упомянутой теореме,
каждая из наших экстремальных дуг у' обладает следующим
свойством минимальности: если (/', х')— второй конец дуги у' и
Г
жо)
(f. X)
С"
Свойство минимальности дуги у' в W.
если С—любая допустимая непараметрическая кривая, соеди-
соединяющая точки (t0, х0) и (f, x'), расположенная в окрестности W
и не совпадающая с у', то справедливо неравенство
C7.2)
Э(у')<Э(С).
Уменьшим теперь число б, если это потребуется, так, чтобы
в соответствии с теоремой B8.6) о локальном угле (снова
из § 28 гл. II) экстремаль у' локального б-пучка можно было
однозначно определить, задавая ее второй конец (/', х'), а не на-
начальный наклон р, при условии, что этот конец лежит в локаль-
локальном (б/3)-угле с вершиной (/„, х0, р0). Внутренность этого ло-
локального угла обозначим через V.
Так как начальное направление экстремали у и начальные
направления членов локального (б/6)-пучка в вершине ведут
внутрь множества V, то можно взять f настолько близким к t0,
что дуги, соответствующие интервалу to^t^t', будут лежать
в V, за исключением начальной точки. Тогда и у' безусловно
лежит в V, за исключением начальной точки, и, значит, V—окрест-
V—окрестность ее конца Q. Далее, для любой точки Q£Tf\V существует
точно одна экстремаль у нашего пучка, которая проходит через Q
и начальная дуга у' которой, пересекающая полосу А', обладает
свойством минимальности C6.2).
Наконец, рассмотрим дуги у" экстремалей у нашего пучка,
соответствующие интервалу Д". Мы будем рассматривать лишь
5 № 1274
130
Гл. Ill. Погружение в целом
настолько малые значения и, чтобы начальные дуги у' экстре-
экстремалей у принадлежали локальному (б/6)-пучку и, следовательно,
лежали в V. Дуги у" образуют связку экстремалей, окружающую
у" и не имеющую фокальных точек. Здесь можно применить тео-
теорему C6.2) и обозначить через W" открытое множество, содер-
содержащее у", существование которого утверждается в этой теореме.
Пучок с начальной частью в V.
Таким образом, дуги у" образуют сильное геодезическое покры-
покрытие множества W" Л А". Объединяя это покрытие с покрытием
множества V локальным б-пучком, исходящим из точки (/„, ха),
мы покроем дугами экстремалей нашего локального пучка не-
некоторое стреловидное множество. В этом множестве при помощи
инвариантного интеграла Гильберта можно определить функцию
{t0, х0)
Пучок, в котором определена S.
S(t, x), равную нулю в вершине. Эта функция совпадает с интег-
интегралом от L вдоль экстремалей у, которые полностью лежат
в указанном стреловидном множестве.
Теперь мы можем определить открытое множество Wo так,
как это было объяснено в начале доказательства. Обозначим
§ 37. Теория сопряженных точек по Якоби 131
через С произвольную допустимую непараметрическую кривую,
расположенную в Wo и имеющую те же концы, что и у. Обо-
Обозначим, далее, через С", С" две дуги кривой С, соединяющиеся
при t — t'. Если С" не совпадает с у", то, согласно формуле
Вейерштрасса A2.6) из § 12 гл. I,
3(C")>S2-Slt
где 5, и S2—значения функции S в концах дуги С. С другой
стороны, St равно значению 3 (у') на дуге экстремали, соединяю-
соединяющей вершину с общим концом дуг С', С", и, следовательно,
ввиду C7.2), 3{C')>Slt если только С" не совпадает с у'. Из
двух указанных неравенств сразу получается утверждение тео-
теоремы, поскольку S2 = 3 (у).
Аналогичными рассуждениями можно доказать ослабленные
варианты теорем C6.2), C7.1), если отказаться от условия, что
у—сильная экстремаль, и потребовать только, чтобы вдоль нее
выполнялось условие Лежандра. Первоначальные же, более силь-
сильные, варианты этих теорем будут в таком случае применимы ко
вторичной задаче. Здесь у превращается в отрезок оси /, I (v) = 0,
а множество Wo ввиду однородности совпадает со всем простран-
пространством (t, X). В этом вторичном варианте теоремы C7.1), если мы
устремим /" к сопряженной точке, мы получим неравенство
I (С) ^ О для любой кривой С, соединяющей tn и t1 или /_t.
Кроме того, по определению фокальной точки, существует такая
кривая С Фу, которая является вторичной экстремалью и на
которой 1(С) = 0 ввиду C3.8).
Обозначим теперь через tt и /_, соответственно наименьшее
/ > t0 и наибольшее t < /0, для которых / и/, можно соединить
такой кривой С, что I (С) = 0. Если выполняется условие Лежан-
Лежандра, то, как легко видеть, справедлива следующая теорема.
C7.3) Теорема. Точка t0 является обратной сопряженной точ-
точкой точки tu и t0, tl одновременно строго и непрерывно возрастают.
Если у~отрезок /0< /</" оси /, где Г> tlt то по-прежнему
очевидно, что существует кривая С с теми же концами, что и у,
для которой I (С) = 0. Нужно только
дополнить уже полученную кривую С
отрезком оси t от tt до /". Однако мы
можем уменьшить значение интеграла
I (С) и получить тем самым I (С) < 0.
Для этого нужно несколько изменить
кривую С вблизи tu а именно заме-
нить дугу, соединяющую точки Р, Q и проходящую через tu ма-
малой дугой PQ вторичной экстремали. Из этого результата для
вторичной задачи мы выведем следующую теорему, относящуюся
к первоначальной задаче.
132 Гл. HI. Погружение в целом
C7.4) Теорема. Пусть у0—непараметрическая дуга экстремали
с концами А, В, на которой выполняется условие Лежандра.
Предположим, что у0 содержит прямую сопряженную точку конца А
или обратную сопряженную точку конца В. Тогда в любой узкой
окрестности дуги у0 существует такая допустимая кривая С,
соединяющая А, В, что 3(С)<Э(у0).
Доказательство. Рассмотрим следующее погружение дуги у0:
x(t, u) = x{t) + uX{t) (/„
где Г >1,иХ (/) определяет кривую С„ для которой 1 (Cj) < 0.
Тогда для достаточно малых и кривая С. определенная посред-
посредством x(t, и), обладает требуемыми свойствами.
C7.5) Следствие I. Пусть Р, Q—две последовательные фокаль-
фокальные точки канонического погружения непарпметрической экстре-
экстремали у, удовлетворяющей условию Лежандра. Тогда ни одна со-
сопряженная точка точек Р и Q не может быть внутренней
точкой дуги с концами Р, Q экстремали у.
Доказательство. Если бы это было не так, то, согласно C7.3),
внутри соответствующего /-интервала (f ^t^t") нашлась бы
пара сопряженных точек /0, tt вторичной задачи. Так как эти
точки лежали бы и в слегка уменьшенном /-интервале, то утверж-
утверждения теорем C6.2) и C7.4) в применении ко вторичной задаче
противоречили бы одно другому.
C7.6) Следствие II. Пусть у—сильная неособая дуга экстре-
экстремали, погруженная в связку экстремалей. Предположим, что мно-
множество фокальных точек на у либо пусто, либо состоит только
из одной точки—конца у. Тогда существует такое открытое
множество Wn z> у, что для любой другой допустимой непарамет-
непараметрической кривой CcWu с теми же концами, что и у, справедливо
неравенство 3 (у) -С 3 (С).
Это утверждение непосредственно следует из C7.5) и C7.1).
C7.7) Замечание. В двумерном пространстве (/, х) последова-
последовательные фокальные точки всегда являются сопряженными.
В этом случае семейство зависит только от одного параметра и,
и если для вторичной задачи равенство ыХ(/) = 0 выполняется
при некотором ифО, то оно выполняется и для каждого и в той
же точке t. Таким образом, справедливость нашего замечания
следует из второго определения сопряженной точки для вторич-
вторичной задачи, которое мы привели перед теоремой C7.3).
Это замечание еще раз показывает, что по двумерным зада-
задачам нельзя судить о состоянии дел в пространствах высших
§ 38. Индекс устойчивости экстремали /311
размерностей, где, например, нет подобного соотношения между
фокальными и сопряженными точками.
Тем не менее мы предлагаем читателю пересмотреть решение
задачи (с) из вступления в свете результатов этого параграфа.
§ 38
Индекс устойчивости экстремали
В последних параграфах этой главы мы позволим себе употреблять термин
«устойчивость» в том несколько обманчивом смысле, какой придал ему математик-
прикладник Лихтенштейн. Несмотря на то что Лихтенштейн основывался на со-
соображениях, в которых отчасти желаемое заменяло действительное, введенное им
понятие вытеснило на десяток-другой лет более старое понятие устойчивости
по Ляпунову. Впрочем, в последнее время устойчивость по Ляпунову снова в ходу
в теории дифференциальных уравнений. Не совсем ясно, подходит ли наша трак-
трактовка понятия устойчивости к задачам надежности. В вариационном исчислении
важные понятия иногда появляются как бы не на своем месте. Пожалуй, свое
основное применение лихтенштейновское определение устойчивости нашло
совсем в другой области — в теории Морса.
Пусть V—дуга экстремали, на которой выполняется условие
Лежандра. Мы будем называть прямым сопряженным множеством
на у прямое сопряженное множество ее начала. Аналогично,
обратным сопряженным множеством будет обратное сопряженное
множество ее конца. Каждой точке Р сопряженного множества
поставим в соответствие кратность т(/), где /— соответствующая
точка оси /. Число m(t) является, кроме того, кратностью точки /,
рассматриваемой как элемент сопряженного множества на оси /
для вторичной задачи на соответствующем /-интервале. Положим
по определению кратность m(t) равной максимальному числу
линейно независимых вторичных экстремалей прямого или обрат-
обратного пучка с вершиной в выбранном конце /-интервала. Это
определение эквивалентно следующему: кратность m(t) равна
максимальному числу линейно независимых вторичных экстре-
экстремалей, пересекающих ось / в точках t, /', где /' — выбранный
конец /-интервала. Отсюда сразу следует, что число m(t) равно
нулю, если точка / не принадлежит сопряженному множеству
конца /'.
Для экстремали, определенной на интервале/'<!/<!/", назо-
назовем прямым индексом устойчивости сумму кратностей m(t) внут-
внутренних точек / интервала определения, принадлежащих прямому
сопряженному множеству. Аналогично можно определить обрат-
обратный индекс устойчивости, который, как мы позднее убедимся,
совпадает с прямым.
Можно дать и ряд других эквивалентных определений подобного индекса
устойчивости. Первое из них принадлежит Лихтенштейну; оно связано с числом
отрицательных собственных значений, некоторым образом соответствующих ва-
вариационной задаче. Кое-что по этому вопросу можно найти в книге Куранта и
134 Гл. Ill. Погружение в целом
Гильберта. Определение Лихтенштейна приводится среди других определений
в книге Морса. Мы не будем повторять его здесь, а вместо этого воспроизведем
два других определения, принадлежащих Морсу, и назовем соответствующие
понятия индексом Морса и а-индексом Морса.
Так как на экстремали у выполняется условие Лежандра, то,
используя C5.9) (или теорему B8.9) из § 28 гл. II), можно найти
такое положительное число р, что если вторичная экстремаль,
отличная от отрезка оси t, пересекает эту ось в двух различных
точках, то расстояние между ними не меньше р. Для этого ука-
указанные выше результаты следует просто дополнить теоремой
Бореля о конечном покрытии. Это условие можно сформулиро-
сформулировать еще и так: ни один содержащийся в интервале t'^Lt^Lt"
подинтервал длины меньше р не может содержать пару сопря-
сопряженных точек.
Имея это в виду, обозначим через о какое-нибудь разбиение
интервала V ^.t-^.f на подинтервалы длины меньше р и рассмот-
рассмотрим класс непрерывных дуг Сг (в дальнейшем мы будем их на-
называть ломаными вторичными экстремалями), соединяющих точки
t', t" оси t и составленных из конечного числа дуг вторичных
экстремалей. Эти дуги соответствуют различным подынтервалам
разбиения о, а их концы, которые мы будем называть углами
кривой Cz, находятся в точках, ^-координаты которых совпадают
с точками разбиения а.
Так как ни один подинтервал разбиения а не содержит пары
сопряженных точек, то каждая дуга вторичной экстремали, соот-
соответствующая одному из таких подинтервалов, вполне определена
t'
своими двумя концами. Тем самым Cz вполне определена своими
углами и, следовательно, индекс г в обозначении кривой Сг
можно отождествить с конечномерным вектором, компонентами
которого являются Х-координаты этих углов. Таким образом,
Cz—ломаная вторичная экстремаль, углы которой заданы век-
вектором z, а концами являются точки Г, t" оси t.
Очевидно, что вторичный интеграл 1 вдоль одного звена ло-
ломаной вторичной экстремали Cz представляет собой квадратичную
функцию Х-координат его концов. Складывая по всем звеньям,
получаем
§ 38. Индекс устойчивости экстремали 135
где Q (г) — некоторая квадратичная форма, зависящая от выбран-
выбранного разбиения о. Назовем Q (г) индекс-формой Морса, соответ-
соответствующей разбиению о.
Обозначим через Ма максимальную размерность гиперплоско-
гиперплоскостей г-пространства, на которых Q (г) отрицательно определена,
т. е. на которых Q(z)<0 при г^=0. Через Ма обозначим мак-
максимальную размерность гиперплоскостей, на которых Q (z) ^ 0.
Числа Ма и Ма назовем соответственно а-индексом Морса и верх-
верхним о-индексом Морса.
Индексом Морса М назовем максимальное число линейно не-
независимых непрерывных и кусочно-непрерывно дифференцируемых
вектор-функций Xk(t), равных нулю в концах С, t" и удовлет-
удовлетворяющих такому условию: для каждой линейной комбинации
X (t, и) =2ил^л@спостояннымикоэФФиц#ентамиы —("i. ••-."*).
не равными одновременно нулю, вторичный интеграл I (С), где
С—кривая, определенная функцией X(t, и) для t'^.t^.t", от-
отрицателен. Если мы заменим строгое неравенство нестрогим
1(С)г^0, то получим определение верхнего индекса Морса М*.
Эти линейные комбинации порождают то, что Морс образно на-
называет гиперплоскостью допустимых дуг, а М—это максималь-
максимальная размерность подобной гиперплоскости, на которой интеграл I
отрицательно определен.
C8.1) Лемма. Имеем
а) М^М0, Ъ)М'=М'О, с) М'о—Мс = т,
где т = т (Г).
Доказательство. Заметим, что гиперплоскость допустимых кри-
кривых, на которо й. 1^0, не может содержать двух различных
элементов, совпадающих во всех точках разбиения а. В против-
противном случае разность этих элементов была бы элементом той же
гиперплоскости, который пересекал бы ось / в каждой точке
разбиения, а согласно вторичному варианту теоремы C7.1), на
такой кривой I > 0.
Таким образом, каждому элементу рассматриваемой гипер-
гиперплоскости можно п оставить в соответствие единственную ломаную
вторичную экстремаль Cz, которая совпадает с этой кривой в
своих углах. При этом линейно независимые элементы соответ-
соответствуют линейно независимым ломаным вторичным экстремалям,
а следовательно, линейно независимым векторам z. Очевидно,
что при замене кривых, принадлежащих рассматриваемой гипер-
гиперплоскости, ломаными экстремалями интеграл I не возрастает.
Поэтому из гиперплоскостей, на которых 1^0, максимальную
размерность имеет та, которая состоит из ломаных вспомогатель-
136 Гл. III. Погружение в целом
ных экстремалей Сг. Аналогичный вывод справедлив и для гипер-
гиперплоскостей, иа которых I отрицательно определен. Следовательно,
эти размерности совпадают с максимальными размерностями гипер-
гиперплоскостей пространства г, на которых Q ^ 0 или Q отрица-
отрицательно определена, и тем самым равенства (а) и (Ь) доказаны.
Осталось доказать равенство (с). Ортогональным преобразо-
преобразованием г-пространства квадратичную форму Q можно преобра-
преобразовать в сумму квадратов. Тогда легко видеть, что d = M.'a—Ма
является кратностью собственного значения 0 формы Q и, значит,
d равно числу линейно независимых векторов z, критических
для Q, т. е. таких, что все частные производные от Q равны
нулю для этих г. С другой стороны, т — это число линейно не-
независимых вторичных экстремалей, соединяющих точки /', Г оси t,
т. е. число линейно независимых ломаных вторичных экстрема-
экстремалей Cz, которые превращаются во вторичные- экстремали. Значит,
для того чтобы доказать равенство (с), достаточно показать, что
Cz превращается во вторичную экстремаль тогда и только тогда,
когда вектор z является критическим для Q.
Для этого воспользуемся применительно ко вторичной экст-
экстремали слабым определением, приведенным после формулы C1.3).
Это возможно потому, что для кусочно-непрерывно диффе-
дифференцируемых кривых слабое определение выделяет те же самые
экстремали при условии, что из непрерывности L-x следует непре-
непрерывность х. Во вторичной задаче это как раз так и есть, ибо
X—линейная функция от X, Y с непрерывными коэффициентами.
Введем для краткости временное обозначение I (X) вместо
I (С), где С—кривая, заданная функцией X вида X(t) на интер-
интервале t'^.t^.t", и обозначим через Xz, Xa функции, определяю-
определяющие ломаную вторичную экстремаль Cz и кусочно-непрерывно
дифференцируемую кривую Са, которая пересекается с осью t
в каждой точке разбиения а. Используя замечание, сделанное
при доказательстве равенств (а) и (Ь), мы заключаем, что
Следовательно, частная производная по а при ее = 0 всегда равна
нулю для (Х-{-аХа), где X—ломаная вторичная экстремаль с
углами, определенными некоторым вектором г0 из нашего г-про-
г-пространства. Отсюда вытекает сразу, что выражения
имеют равные частные производные по а при сс = О, и, значит,
необходимым и достаточным условием превращения ломаной вто-
вторичной экстремали X во вторичную экстремаль является обра-
обращение в нуль частной производной по а от выражения I (X-{-aXz)
при сс = О, т. е. обращение в нуль частной производной по а от
§ 38. Индекс устойчивости экстремали 137
функции Q(zo + az) для каждого г. Очевидно, что это последнее
условие эквивалентно тому, что вектор г0 является критиче-
критическим для Q, и тем самым доказательство"равенства (с) завершено.
Теперь перейдем к доказательству второй леммы.
Обозначим через o(t) разбиение интервала (/', t) попавшими
в него точками разбиения о интервала (/', t"), причем предпо-
предполагается, что t'^it^it". Квадратичную форму Q(z) и целые числа
М, М*, Ма, Ма, которые мы получим при замене интервала
(/', t") на интервал (/', t) и разбиения о на разбиение a(t), обо-
обозначим соответственно через Q(z, t), M(t), M*(t), Ma(t), All(t).
C8.2) Лемма, (a) M (t), M*(t) — неубывающие функции, (b)
Ma(t), Ml (t)—функции, полунепрерывные соответственно снизу
и сверху.
Доказательство. Гиперплоскости допустимых кривых, которые
служат для определения функций М (I) или M*(t), превратятся
в гиперплоскости допустимых кривых, соответствующие интер-
интервалу (f, t-\-h), если мы просто присоединим к каждой кривой
отрезок (/, t-\-h) оси t. На этих гиперплоскостях 3 также будет
отрицательно определенной функцией (или неположительной
функцией, в зависимости от того, какой случай мы рассматри-
рассматриваем), и, следовательно, M(t +h)^M(t), M*(t + h)'^M*(t) для
Л^О. Это доказывает утверждение (а).
При доказательстве утверждения (Ь) мы можем предположить,
что для рассматриваемого значения t квадратичная форма Q(z, t)
задана диагональной матрицей.
На гиперплоскости z-пространства, определенной теми осями,
которым соответствуют отрицательные элементы матрицы, Q < О,
и этот знак сохранится, если к Q (z, t) добавляется квадратич-
квадратичная форма Q' (г), такая, что | Q' \ ^ е | г |2 при достаточно малом е.
Ввиду непрерывности коэффициентов формы Q(z, t) no t
отсюда вытекает существование такой окрестности точки t, что
в ней максимальная размерность гиперплоскости, на которой Q
отрицательно определена, не меньше, чем в точке t. Это озна-
означает, что Мо (t) полунепрерывна снизу. Аналогично можно по-
показать, что M*a(t) полунепрерывна сверху.
C8.3) Первая теорема Морса. Пусть Е—экстремаль, на ко-
которой выполняется условие Лежандра. Тогда прямой и обратный
индексы устойчивости, индекс Морса и а-индекс Морса равны
между собой.
Доказательство. Применяя лемму C8.1) к интервалу (f, t)
вместо интервала (/', /"), а также используя лемму C8.2), по-
получим, что функция М (t) равна Ma(t), полунепрерывна снизу
238 Гд- Ш- Погружение в целом
и не убывает, тогда как M*(t) равна Ma(t), полунепрерывна
сверху и также не убывает. Кроме того, согласно C8.1) (с), M(t)
и M*(t) равны всюду вне прямого сопряженного множества, ко-
которое, ввиду C6.1), состоит из изолированных точек. Отсюда
следует, что функции M(t) и M*(t) непрерывны всюду, кроме
изолированных точек, и, значит, являются ступенчатыми функ-
функциями, так как их значения равны целым числам. В точках раз-
разрыва M(t—0) = M(t) и M(t + 0) = M*(t), следовательно, заменяя
в C8.1) (с) t" на t, получаем, что скачок M(t + 0)—М (/—0) равен
m(t).
Так как M(t) = 0 для значений /, близких к начальной точ-
точке V, то M{t) равно сумме скачков между V и t — 0 и, следо-
следовательно, число M = M(t") равно прямому индексу устойчивости.
Ввиду симметрии оно также равно обратному индексу устойчи-
устойчивости. Это завершает доказательство теоремы.
Таким образом, теорема Морса сводит различные определения
индекса к элементарной алгебраической величине, а именно, к
числу отрицательных характеристических чисел, или собственных
значений, квадратичной формы. Это очень похоже на классиче-
классический анализ, в котором для функции многих действительных
переменных различие между максимумами, минимумами и сед-
ловыми точками определяется квадратичной формой, составлен-
составленной из членов второго порядка в формуле Тейлора. Однако в
теории Морса по сравнению с классической теорией седловых
точек появляется совершенно новая черта: алгебраическое поня-
понятие индекса получает очень красивую геометрическую интерпре-
интерпретацию, основанную на топологии симплициальных фигур.
Пусть задана невырожденная квадратичная форма Q (z), зави-
зависящая от N переменных z = (zl3 .... zN)\ тогда число М отрица-
отрицательных собственных значений этой формы полностью характе-
характеризуется следующей системой чисел:
I Mft = 0, когда кфМ, 1</г<Л/,
C8.4) \ * , и ал
\ Мк= 1, когда k = M.
Эти числа однозначно определяют число М и в свою очередь
определяются им. Именно этим числам, а не самому М мы дадим
геометрическую интерпретацию в следующем параграфе.
§ 39
Вторая ступень теории Морса
Мы ограничимся здесь только самым грубым наброском. Мно-
Множество точек г назовем утопленным, если оно целиком лежит
в области Q(z)<0. Будем называть множество подвешенным,
если оно содержит, кроме своей утопленной части, еще только
§ 39. Вторая ступень теории Морса 139
начало координат г = 0. Нас будут интересовать элементарные
полиэдры, т. е. конечные суммы симплексов данной размерности;
когда размерность равна единице или двум, мы будем говорить
о многоугольнике и многограннике. Напомним, что 6-мерный
симплекс—это выпуклая фигура с k-\-\ линейно независимыми
вершинами, и что его можно ориентировать ровно двумя спосо-
способами, фиксируя порядок вершин с точностью до четной пере-
перестановки. Ориентация /г-мерного полиэдра определяется заданием
ориентации каждого из входящих в него симплексов; мы будем
считать, что полиэдр не изменяется при сокращении двух сим-
симплексов, отличающихся только ориентацией.
Граница симплекса является в таком случае полиэдром, раз-
размерность которого на единицу ниже, а правило ориентации гра-
граней определяется следующим образом: если вершина имеет нечет-
нечетный номер, то для противолежащей, грани порядок ее вершин
сохраняется, а в противном случае он преобразуется посредством
нечетной подстановки. Граница полиэдра определяется по адди-
аддитивности, и легко видеть, что граница границы всегда равна
НуЛЮ1>.
Будем считать, что полиэдр не изменяется при подразделе-
подразделении его симплексов на более мелкие симплексы, ориентирован-
ориентированные таким образом, что граница тоже не изменяется.
Полиэдр, граница которого (после сокращений) представляет
собой утопленное множество, назовем относительным циклом.
Полиэдр, представляющий собой сумму некоторой границы и
утопленного полиэдра, назовем относительной границей. Так как
граница утопленного полиэдра является утопленным множеством,
а граница границы равна нулю, то легко видеть, что граница
относительной границы является утопленным множеством и, сле-
следовательно, каждая относительная граница является относитель-
относительным циклом.
При определении полиэдра ничто не мешает нам взять один
и тот же симплекс более одного раза. Отсюда следует, что поли-
полиэдр можно умножить на любое положительное целое число и
при этом опять получится полиэдр. Так как изменение ориен-
ориентации эквивалентно умножению на —1, то мы можем умножать
11 Таким образом, под Л-мерным полиэдром (автор употребляет термин poly-
tope) здесь понимается ие геометрическая фигура, а свободная абелева группа,
образующими которой являются всевозможные ^-мерные симплексы, причем
симплекс, отличающийся от а лишь ориентацией, отождествляется с —а. В по-
подобной ситуации обычно говорят о Ar-мерных симплициальных цепях.
В следующем же абзаце автор фактически переходит к факторгруппе группы
цепей по подгруппе, порожденной соотношениями вида
где ст,- образуют симплициальное подразделение симплекса а (см., например,
П. С. Александров, Комбинаторная топология, Гостехиздат, 1947).— Прим. ред.
140 Гл. III. Погружение в целом
на любое целое число. Следовательно, любая конечная линейная
(с целыми коэффициентами) комбинация полиэдров является по-
полиэдром. Легко видеть, что граница такой линейной комбинации
будет комбинацией границ, а потому комбинация относительных
циклов или относительных границ будет также относительным
циклом или относительной границей.
Систему относительных циклов назовем независимой, если из
них нельзя составить линейную комбинацию с целыми коэффи-
коэффициентами, не равными одновременно 0, которая была бы отно-
относительной границей. Заметим, что это понятие в конечном счете
опирается на понятие утопленного полиэдра, а следовательно,
определяется квадратичной формой Q (г).
Теперь мы можем сформулировать геометрическое свойство
чисел Мк из C8.4), обнаруженное Морсом
C9.1) Вторая теорема Морса. Число Мк равно максимальному-
числу независимых относительных k-мерных циклов.
На основании теоремы C9.1) число Mh называют k-м типо-
типовым числом функции Q (г). Если вспомнить значения чисел Мк,
то теорему C9.1) можно сформулировать следующим образом:
C9.2) Теорема. Пусть Q (г)—неособая квадратичная форма
от N переменных, имеющая ровно М отрицательных собственных
значений. Тогда при кфМ. каждый k-мерный относительный цикл
является относительной границей, а при k = M существует один
и только один независимый относительный k-мерный цикл.
Здесь мы ограничимся лишь тем, что укажем (см. пункты (с)
и (d)), как при доказательстве используются некоторые стандарт-
стандартные идеи и методы элементарной топологии, которые мы пере-
перечислим ниже в пунктах (а) и (Ь).
(а) Рассматриваемые в топологии понятия обычно инвариантны
относительно деформаций, а наши относительные понятия инва-
инвариантны при деформациях специального вида, преобразующих
утопленное множество в утопленное. Назовем понижающей де-
деформацией отображение точек z рассматриваемого множества в
точки г*, или, точнее, отображение (z, t) —> z*, при котором
образ г* непрерывно зависит от г и параметра t на отрезке
*о^ь*^=^1> причем г* совпадает с z при t = t0 и Q (г*) является
невозрастающей функцией от t при каждом фиксированном z.
В нашем случае мы ограничимся кусочно-линейными понижаю-
понижающими деформациями. Они преобразуют полиэдр в полиэдр, если
не обращать внимания на то, что образы некоторых симплексов
могут быть вырожденными, т. е. иметь линейно зависимые вер-
вершины. Наши относительные понятия инвариантны при таких де-
деформациях.
§ 3$. Вторая ступень теории Морса
(Ь) Не нарушая общности, предположим, что в рассматривае-
рассматриваемой системе координат Q (г) имеет диагональный вид
где ак < О при /г^ М и ак > 0 при М < /г^С N. Тогда для любого
ограниченного множества, в частности для полиэдра, очевидно
существует такая кусочно-линейнал понижающая деформация,
что конечный образ этого множества, соответствующий t = t1,
содержится в подпространстве первых М переменных zlt ..., zm .
в котором форма Q (z) отрицательно определена. Если же М=Ь,
то следует считать это подпространство состоящим из единствен-
единственной ТОЧКИ 2 = 0.
(c) Из (а) и (Ь) мы видим, что можно ограничиться случаем,
когда k^M = N. (Можно также предположить, что МфО, так
как случай k = M — 0 станет тривиальным, если мы вспомним,
что одна точка, расположенная где угодно, имеет пустую гра-
границу, которую мы считаем утопленным множеством.) Заметим,
что при таких предположениях каждый полиэдр является либо
подвешенным, либо утопленным множеством. В случае k < М
легко получить кусочно-линейную понижающую деформацию под-
подвешенного полиэдра в утопленный, так что в этом случае неза-
независимых относительных /г-мерных циклов не существует.
(d) Остается рассмотреть только случай k=M--N. В этом
случае ни один /г-мерный полиэдр не является границей, если
он не равен тождественно нулю. Если полиэдр является отно-
относительным подвешенным циклом, то он безусловно не является
относительной границей. С другой стороны, сразу видно, что из
двух таких подвешенных относительных циклов можно составить
линейную комбинацию с ненулевыми коэффициентами, которая
будет уже не подвешенной, а утопленной. Таким образом, в этом
случае может существовать только один независимый относи-
относительный цикл.
На этом мы закончим обсуждение теоремы C9.2). Если чи-
читатель хочет разобраться в этом подробнее, ему следует обра-
обратиться к специальной литературе.
Глава IV
Глобальные гамильтонианы,
выпуклость^ неравенства
и функциональный анализ
§ 40
Введение
Одна из наших главных целей состоит в том, чтобы привлечь внимание чита-
читателя к фундаментальным понятиям современной математики, возникшим благодаря
вариационному исчислению. Для большей части тех из них, которые встретятся
нам в этой главе, предшественником является гамильтониан. Этн понятия пона-
понадобятся нам сами по себе, вне всякой связи с историей их возникновения. Вся-
Всякое понятие — это что-то вроде средства общественного-транспорта: оно помогает
добраться до намеченной цели. Правда, некоторые люди предпочитают ходить
пешком, но ведь жизнь слишком коротка, чтобы можно было позволить себе такую
роскошь!
Одно из основных понятий этой главы — выпуклость. Мы уже вскользь
упоминали о ием в § 13 гл. I при интерпретации условия Вейерштрасса. Теперь
нам предстоит заняться им вплотную, чтобы освободиться от локальных ограниче-
ограничений в нашем определении гамильтониана. Для этого необходимо изучить двойст-
двойственность, которая имеет место для выпуклых функций или для выпуклых фигур.
Эта двойственность выражается неравенствами Шварца и Юнга 1). В то же время
она вплотную подводит нас к самым основам современного функционального
анализа. Таким образом, различные понятия этой главы оказываются тесно свя-
связанными между собой.
Читатель, хорошо знакомый с понятием выпуклости или с функциональным
анализом, может, разумеется, опустить значительную часть материала, однако
тем, кто встречается с этими вопросами впервые, придется по ходу дела дополнять
содержание этой главы сведениями нз других источников. К сожалению, обе
категории читателей будут вынуждены составить для себя словарь терминов: дело
в том, что мы поддались соблазну провести реформу принятой терминологии. Уже
давно пора сделать это. И вообще, раз уж даже Англия способна в конце концов
перейти к метрической системе, то можно отважиться и на реформы в области
математических канцеляризмов, не дожидаясь, пока это сделает кто-нибудь
вроде Бурбаки. А чтобы свести к минимуму связанные с этим неудобства, мы на-
настойчиво призываем всех наших читателей, студентов, друзей и коллег стать
ярыми пропагандистами новых терминов всюду, где только возможно.
Тот небольшой экскурс в функциональный анализ, который мы предполагаем
предпринять, может показаться трудноватым для начинающего. Однако отчасти
это зависит от склада характера. Здесь есть некоторое сходство с альпинизмом:
одни иовички сразу чувствуют себя в горах, как рыба в воде, а у других начинает
кружиться голова. В данном случае для головокружения нет никаких оснований:
в основном все делается точно так же, как в евклидовом пространстве, а остальное
можно либо опустить, пока читатель не почувствует себя увереннее, либо пройти
«размеренной поступью человека гор».
Для определения глобальных гамильтонианов, разумеется, нет необходимости
привлекать функциональный анализ. Мы вполне могли бы обойтись я-мериым ев-
евклидовым пространством. Однако здравый смысл подсказывает, что пора перехо-
переходить к изложению всего нашего предмета на том языке, который больше всего
подходит для этой цели. При решении вариационной задачи мы имеем дело не
f> См. примечание редактора иа стр. 15.— Прим. ред.
§ 41. Центр тяжести и зона рассеивания /43
с евклидовым пространством, а с пространством, элементами которого являются
кривые; именно в таком пространстве мы ищем минимизирующие элементы, при-
принадлежащие соответствующим множествам или семействам. По существу вариа-
вариационное исчисление н заиимается исследованием определенных задач в пространст-
пространстве кривых, а следовательно, в пространстве функций ж(<) (/'</</"), определяю-
определяющих эти кривые. А раз так, то чем скорее мы введем в рассмотрение функциональ-
функциональное пространство, тем лучше. Что же касается головокружения, то вся абстракция
в сущности сводится здесь к отказу от некоторых ненужных предположений, а ведь
вряд ли разумный человек потеряет голову от того, чго ему придется перестать
думать, будто земной шар покоится на четырех слонах.
По поводу понятия выпуклости надо заметить, что даже хорошо знакомые
с ним читатели не всегда до конца осознают, почему же оно так важно. Мы попы-
попытаемся восполнить здесь этот пробел с помощью довольно простых рассуждений.
Для этого мы прежде всего напомним, сколь принципиальным является в элемен-
элементарном анализе и в других областях математики переход от изучения функций
одного переменного к изучению функций нескольких переменных. Без этого мате-
математик оказался бы столь же беспомощным и расплывчатым в своих высказыва-
высказываниях, как те экономисты, которые говорят только о «тенденциях» и прикрываются
выражениями типа «при прочих равных условиях». Математически это равно-
равносильно рассмотрению функции двух переменных f(x, у) только при постоянном у
или при постоянном х.
Стандартная процедура перехода от одного переменного к нескольким состоит
в нахождении правильного обобщения тех понятий, которые играли важную роль
в случае одной переменной. В этом отношении линейность является адекватным
обобщением равенства, что хорошо известно любому алгебраисту. Впрочем, со-
современный анализ гораздо чаще имеет дело с отношением Ss, нежели с равенством.
Важная роль выпуклости связана с тем обстоятельством, что она представляет
собой обобщение этого отношения на случай большего числа измерений.
§ 41
Центр тяжести и зона рассеивания
Обозначим через z переменную точку, или вектор, в вектор-
векторном пространстве. Под векторным пространством мы понимаем
пространство или просто множество, в котором определена и
является точкой сумма произвольной линейной комбинации
конечного числа точек z,- с отличными от нуля скалярными
коэффициентами а,-.
Скаляры мы будем отождествлять с действительными числами.
При этом мы не вводим никаких ограничений на размерность и
не предполагаем существование метрики или топологии. Мы пред-
предполагаем только, что справедливы обычные законы векторной
алгебры; в сущности они сводятся к одной аксиоме, хотя обычно
принято расщеплять ее на серию более элементарных. Это ак-
аксиома перегруппировки членов двойной суммы
которая утверждает, что конечная двойная сумма определяет
одну и ту же точку нашего векторного пространства, когда
J44 Гл. IV. Глобальные гамильтонианы, выпуклость, неравенства
суммирование производится сначала относительно k, а потом
относительно i, и наоборот. Кроме того, мы предполагаем, что
наши скаляры могут быть любыми действительными числами.
Существование точки 0, называемой началом, его единственность
и равенство 0 = Oz для всех z сразу следуют из аксиомы пере-
перегруппировки.
Кроме понятия векторного пространства, удобно ввести еще
понятие линейного пространства v. Последнее определяется ана-
аналогично векторному пространству, но в качестве линейных ком-
комбинаций рассматриваются лишь те, для которых
D1.1) 2fl.-=1;
такие линейные комбинации назовем унитарными. .От линейного
пространства можно перейти к векторному пространству, если
принять за начало произвольную точку. Это означает, что мы
не включаем соответствующий член в унитарную линейную ком-
комбинацию и таким образом получаем возможность приписать зна-
значение произвольной линейной комбинации, а следовательно,
получаем рассмотренное выше векторное пространство.
В линейном пространстве (и, в частности, в векторном про-
пространстве) мы называем линейным подпространством такое мно-
множество G, что для векторов Z;£G унитарные линейные комби-
комбинации 2°izi также принадлежат G. Функцию 1(г), определенную
для z£G, где G—линейное подпространство, значения которой
являются либо действительными числами, либо векторами (из
некоторого векторного пространства), назовем линейной, если
для всех унитарных линейных комбинаций, составленных из
точек линейного подпространства G, выполняется равенство
D1.2) /B «/*.) = 2 «.'(*/)•
В дальнейшем мы будем чаще рассматривать векторное, а не
линейное пространство. Это, конечно, несущественно, за исклю-
исключением тех случаев, когда выбор начала играет какую-нибудь
роль. Однако рассматриваемые здесь линейные подпространства
могут не быть векторными подпространствами, так как они могут
не проходить через начало. Линейную функцию I мы будем на-
называть однородной, если она определена в векторном подпро-
подпространстве G и обращается в нуль в начале. Это определение
согласуется с общим понятием однородности для нелинейных
функций, которое мы приведем в следующем параграфе. Оче-
Очевидно, что в случае однородной линейной функции I соотноше-
соотношение D1.2) выполняется для всех линейных комбинаций 2°i*i
точек из G, а не только для унитарных.
1( Только призыв автора пропагандировать его терминологию удерживает
над в этом месте от термина «аффинный». — Прим. ред.
§ 41. Центр тяжести и зона рассеивания 145
Унитарную линейную комбинацию 2°«z« c положительными
коэффициентами с,- назовем выпуклой комбинацией, или центром
тяжести (барицентром—для тех, кто Предпочитает греческий),
а коэффициенты этой комбинации назовем весами (точек z,-).
Далее, пусть Е—некоторое множество в нашем векторном про-
пространстве; обозначим через Е и назовем выпуклой оболочкой мно-
множества Е множество точек, которые
можно представить в виде выпуклых
комбинаций 2°izf точек zi€£- Анало-
Аналогично, обозначим через £ и назовем ли-
линейной оболочкой множества Е множе-
множество точек, которые можно представить
в виде унитарных линейных комбина-
комбинаций точек из Е. Очевидно, что EczEcE.
Можно определить также понятие ли- g
нейной оболочки нескольких множеств; CашТрИХ0Ва„о м„о-
например, линейной оболочкой <Л, By жество £.)
пары множеств А, В назовем линейную
оболочку объединения этих множеств. При этом мы не будем де-
делать различия между точкой и множеством, состоящим из одной
точки; так, если р—точка и А—множество, то символами
<Л, рУ и </?, Ау обозначается линейная оболочка множества А
и множества, состоящего из одной точки р. Мы будем просто
называть ее линейной оболочкой множества А и точки р.
В связи с этим нам понадобится следующее замечание: если
G—любое векторное подпространство и z0—любая точка вне G,
то <z0, G>—векторное подпространство, каждая точка которого
однозначно представима в виде z-\-tzn, где z£G, a t—действи-
t—действительное число. (Мы будем называть это стандартным представ-
представлением, точки из <z0, G>.) Ясно, что такое представление суще-
существует; оно единственно, так как равенство z + tzo — z'+t'zo
эквивалентно соотношению z—z'~(t'— t)za, в котором левая
часть принадлежит G, а правая не принадлежит G, если только
она не равна нулю. Следовательно, t — t' и z — z'.
При обсуждении основных определений следующего параграфа
важную роль будет играть еще одно понятие—зона рассеивания.
Оно приводится здесь впервые и является в некотором смысле
двойственным (reciprocal) понятию выпуклой оболочки. Пусть
Е—множество в нашем векторном пространстве, и пусть р—точка
или множество точек в том же пространстве. (Нас в основном
будет интересовать случай, когда р—либо точка, либо линейное
подпространство.) Точку г из нашего векторного пространства
назовем уравновешенной в Е относительно р, если существует
выпуклая комбинация 2Jfliz«» Равная Р или принадлежащая р,
такая, что точка z совпадает с одной из точек zh а все осталь-
146 Гл. IV. Глобальные гамильтонианы, выпуклость, неравенства
ные точки z,- принадлежат Е. Подмножество множества Е, со-
состоящее из точек, уравновешенных в Е относительно р, назовем
зоной рассеивания для р в Е и обозначим E(modp). Линейную
оболочку р и Е(тодр) назовем простран-
пространством рассеивания для р, порожденным
^ множеством Е.
1 (На рисунке зона рассеивания пуста,
когда в качестве р берется точка ру вне
Е; она совпадает с множеством Е, когда р
состоит из одной точки р2. Если же точ-
точка р находится в положении р0, то зона
рассеивания для р в Е состоит из пары
точек (р', р").
D1.3) Лемма. Пусть р—любая точка или любое непустое
линейное подпространство, а Е—любое множество в нашем век-
векторном пространстве. Далее, пусть
М = Е(тоАр), р*=<р. My, M* = E{modp*).
Тогда относительно р каждая точка q£p* уравновешена в М,
и каждая точка г£М* уравновешена в Е.
(Эту лемму Можно проверить на приведенном выше рисунке в случае, когда
р=Ро', тогда р* — это прямая, проходящая через р', р", a q — точка иа этой
прямой; М* состоит из двух точек р', р", а г совпадает либо с р', либо с р". В этом
случае обе точки q к г являются уравновешенными в М, а следовательно, и в £
относительно р.)
Доказательство. Можно предположить, что М — непустое мно-
множество и что начало перенесено в точку из р. Тогда для под-
подходящих ро£р, т;£М и действительных коэффициентов с,- точка
совпадает с точкой q или с точкой r + ^akzk, где ^,
В обоих случаях, вычитая подходящие линейные комбинации,
которые равны нулю и имеют положительные коэффициенты,
можно добиться, чтобы все с,- были отрицательными, так как
каждая из точек т( входит в выпуклую комбинацию точек из М,
сумма которой принадлежит р. Отсюда следует, что некоторая
выпуклая комбинация точки q с точками множества М или
точки г с точками множества Е кратна рп и, следовательно,
принадлежит р, а в этом и состоит наше утверждение.
D1.4) Следствие. М (mod р)--Е[)р*--^М* = М.
Доказательство. Применим лемму D1.3) к произвольной точ-
точке q£E(]p* и к произвольной точке г£М*. Тогда г является
точкой множества Е, уравновешенной в Е, значит, г £М; ана-
аналогично q является точкой множества Е, уравновешенной в МаЕ,
§ 41. Центр тяжести и зона рассеивания 147
значит, q£M и, далее, <?€ М (mod/?). Меняя q и г, получаем
включения
£П/>*<=Л1 (mod/?), А1*сМ.
Сравнивая их с очевидными включениями
Er\p*z>Mz>M (mod/?), УИвзЛ1,
получаем доказываемое утверждение.
D1.5) Лемма. В обозначениях леммы D1.3) пусть N—зона
рассеивания E(modp) для р в Ё. Тогда NcM.
Доказагкльство. Каждая точка z£N лежит в £ и, значит,
является центром тяжести некоторой системы точек г:£Е; кроме
того, г уравновешена в Ё, а следовательно, и в Е. Отсюда вы-
вытекает, что каждая точка z,- уравновешена в Е, т. е. z:£M,
а значит, г£М.
D1.6) Следствие. М (mod р) = N = М; кроме того, </?, УУ> =
= </?, М>.
Доказательство. Сначала заметим, что множество М (mod /?)
выпукло. Действительно, оно является подмножеством выпук-
выпуклого множества М, поэтому последнее содержит любой центр
тяжести z точек z,- 6 УЙ (mod /?). Каждая точка г,- уравновешена
в М, и этот факт выражается некоторым уравнением. Беря соот-
соответствующую выпуклую комбинацию таких уравнений, находим,
что и z уравновешена в М, а следовательно, z£M (mod/?).
Значит, множество М (mod /?) выпукло и, очевидно, удовлетво-
удовлетворяет условиям
М = М (mod p)cM (mod p)czE(mod p) = N,
где NcM согласно D1.5). Следовательно, оно должно совпадать
с выпуклой оболочкой М, т. е. с М, а потому и с N. Послед-
Последнее из доказываемых утверждений теперь тоже очевидно, так
как оно принимает вид </?, М> = <.р, My.
Подводя итоги, получаем следующую теорему:
D1.7) Теорема (тождества рассеивания). Пусть р — любая
точка или непустое линейное подпространство, а Е—любое мно-
множество в нашем векторном пространстве. Далее, пусть
М=Е(mod/?), /?* = </?, My, N = E(modp).
Тогда
р* = <р, N>, N^M, M = Eftp* = Е(modp*).
148 Гл. IV. Глобальные гамильтонианы, шлуклость, неравенство.
§ 42
Выпуклость и теорема Хана — Банаха
Мы приведем два определения выпуклости первое и более распространенное
из них основано на понятии центра тяжести, второе двойственно ему. Пока экви-
эквивалентность этих двух определений не будет доказана, мы будем пользоваться пер-
первым. Оба определения по существу принадлежат Мннковскому, а их эквивалент-
эквивалентность составляет суть одного из мощных средств анализа, называемого ныне
«теорема Хана — Банаха»; пропагандируемое нами новое название — «принцип
продолжения». К сожалению, доказательство этого принципа далеко не элемен-
элементарно: оно требует использования трансфинитной индукции. С этим методом,
заменяющим обычную математическую индукцию, сталкивается в наши дни каж-
каждый, кто по-настоящему изучает математику. Трансфинитная индукция основана
иа аксиоме выбора, без которой в анализе мало что можно сделать.
D2.1) Определение I. Действительная функция /, определен-
определенная на множестве Е линейного пространства, называется выпук-
лой в точке г--р^.Е, если для каждой выпуклой комбинации
2o,z,- точек 2,-^f, равной р, выполняется неравенство
2 а.-/ (г,)>Цр).
Точку р, в которой функция f является выпуклой согласно
определению I, назовем суббарицентрической точкой функции /,
*2
D2.2) Определение II. Действительная функция /, определен-
определенная на множестве Е линейного пространства, называется выпук-
выпуклой в точке z~p, если существует линейная функция /, опре-
определенная в линейном подпространстве, содержащем зону рассеи-
рассеивания точки р в Е, такая, что в этой зоне l^f, причем / = /,
когда г — р.
Точку р, в которой f является выпуклой согласно опреде-
определению II, назовем опорной точкой для /. Соответствующую
§ 42. Выпуклость и теорема Хана —Банаха 149
линейную функцию /, которая может быть не единственной, на-
назовем опорной функцией для / в этой точке1'.
D2.3) Теорема. Определения lull эквивалентны.
Доказательство импликации П=>1. Мы должны показать, что
опорная точка р обязательно является суббарицентрической.
Пусть /—соответствующая опорная функция, и пусть 2aizi —
любая выпуклая комбинация, равная р и составленная из точек
г(£Е. Очевидно, что каждая точка Zf£E(modp) и, следова-
следовательно, f(Zj) ^l(z;). Значит,
S "if (*i) > 2 *t (*/) =' B ад)=Чр)'
а так как l(p) = f (p), то отсюда следует, что р—суббарицент-
р—суббарицентрическая точка для f.
Обратное утверждение будет доказано позднее. Пока же мы
будем пользоваться определением I.
Нам понадобятся еще некоторые определения. Пусть дана
действительная функция /, определенная на множестве Е нашего
векторного пространства; обозначим через J и назовем выпуклой
минорантой f функцию, определенную в выпуклой оболочке Ё
следующим образом:
Нижняя грань здесь берется по всем представлениям точки р
в виде выпуклой комбинации 2°izi точек zi€E; среди значений
f может быть и —со.
*■> Автор в этом месте и далее (стр. 161) пропагандирует термины landing
point и landing function вместо обычного supporting linear function, мотиви-
мотивируя это несоответствием с другими случаями употребления слова support.
Не найдя подходящего русского эквивалента, мы в переводе решили сохра-
сохранить традиционные названия, тем более что к русской терминологии аргу-
аргументы автора относятся слабо.— Прим. ред.
150 ГА- IV" Глобальные гамильтонианы, выпуклость, неравенства
Множество Е назовем выпуклым, если Е = Е, а действитель-
действительную конечную функцию назовем выпуклой, если она определена
в выпуклом множестве и / -=/. Далее, из определения выпуклой
миноранты f видно, что функция / выпукла в точке р в смысле
определения I тогда и только тогда, когда f(p)~f(p)-
В общем случае функция / может не быть выпуклой; она
может принимать значение —оо, тогда как, согласно нашему
определению, выпуклая функция конечна. Однако функция /
будет выпуклой (определение I) в любой точке р, в которой
[(р)Ф—оо. В противном случае существовала бы выпуклая
комбинация точек z£ E, равная р, для которой / (р) была бы
больше соответствующего центра тяжести значений f{z), и, сле-
следовательно, можно было бы составить выпуклую комбинацию
точек z£E, равную р, для которой число f(p) было бы больше,
соответствующего центра тяжести значений f{z), а это противо-
противоречит определению функции J.
Из этого замечания, в частности, следует, что если функция /
конечна в точке р, то она конечна и в М, где М = Е (mod p),
и, значит, ограничение функции / на множество М — выпуклая
функция. Этим же свойством, конечно, обладает и функция /,
выпуклая в точке р.
Множестве точек Е из нашего векторного пространства, такое,
что tz£E для всех г € Е и t ^ О, назовем конусом с вершиной
в начале. Функцию f(z) назовем однородной, если она опреде-
определена в конусе Е и удовлетворяет условию f (tz) = tf(z) (слова
«положительно» и «первой степени» здесь подразумеваются). Для
линейной функции это определение, очевидно, совпадает с опре-
определением однородности, приведенным в предыдущем параграфе;
конусом Е в этом случае будет некоторое векторное подпро-
подпространство.
Следующие замечания почти очевидны:
D2.4) Замечания, (а) Для того чтобы конус Е был выпуклым,
необходимо и достаточно, чтобы z + z'£E для всех z£E, z'£E.
(b) Для того чтобы однородная действительная функция была
выпуклой, необходимо и достаточно, чтобы она была определена
в выпуклом конусе Е и чтобы для каждых z£E, z' £E выполня-
выполнялось условие «субаддитивности» f(z + z')^f(z)
Доказательство предоставляется читателю.
Теперь мы в состоянии сформулировать теорему, из которой
будет выведена эквивалентность определений I и II, утверждав-
утверждавшаяся в теореме D2.3).
§ 42. Выпуклость и теорема Хана—Банаха 151
D2.5) Принцип продолжения Хана — Банаха. Пусть f —
выпуклая функция, определенная на множестве Е нашего вектор-
векторного пространства, и пусть I—линейная функция, определенная
на множестве р того же пространства, такая, что
/(z)</(z) для всех z£Ef]p.
Пусть, далее, р*—пространство рассеивания для р, порожденное
множеством Е. Тогда существует линейная функция I*, опреде-
определенная в р*, такая, что l*(z) = l(z) для z£p и
для г
Доказательство импликации D2.5) => D2.3). Нам нужно только
показать, что если теорема D2.5) справедлива, то определение II
является следствием определения I. Пусть fa—действительная
функция, определенная на множестве Ео нашего векторного про-
пространства, и пусть р £ЕВ—суббарицентрическая точка для /0.
Мы собираемся построить линейную функцию /*, определенную
в пространстве рассеивания р* точки р, порожденном множеством
/* )^/) * О
рр
£„, такую, что /* (z)^/,,(z) для всех г£Е„Г\р*. Обозначим
через / ограничение выпуклой миноранты f0 на выпуклую обо-
оболочку множества Evf]p*, которая ввиду тождеств рассеивания
совпадает с множеством Е(]р*, где £ — Ёп. Множество Е(]р*
является зоной рассеивания точки р в Е, а потому, согласно
замечанию на стр. 150, f—выпуклая функция. Далее, для z £ Ео Л р*
выполняется неравенство f (z)^.fn(z). Функция I(z), определен-
определенная только для z=p равенством l(p) = f(p) = fo(p), является
линейной функцией, поскольку ее область определения состоит
из одной точки. Согласно D2.5), существует линейная функция /*,
определенная в р*, такая, что I* (р) = 1(р) и /* (z) ^ / (z) в Е Л р*.
Очевидно, что /* — искомая линейная функция, и, значит, дока-
доказательство завершено.
Редукция теоремы D2.5) к частному случаю. Покажем сначала,
что без ограничения общности можно считать / не только выпук-
выпуклой, но и однородной функцией, определенной в выпуклом конусе
Е, а / — линейной и однородной функцией; таким образом, / опре-
определена в векторном подпространстве р, которое содержит начало 0,
и /@) = 0. Этого можно добиться очень простым способом. Пре-
Преобразуем исходное пространство в линейное пространство следую-
следующим образом. Каждую линейную комбинацию zflizi будем рас-
рассматривать как унитарную линейную комбинацию, полученную
посредством прибавления члена aozo, где а„ = 1—2а,-, a z0—ста-
z0—старое начало. Затем расширим наше пространство, приняв некото-
некоторую точку вне него за новое начало, так что исходное простран-
пространство превратится в линейное подпространство. Затем продолжим
функции / и / так, чтобы они стали однородными.
152 Гл- /V. Глобальные гамильтонианы, выпуклость, неравенства
Доказательство теоремы D2.5) в случае однородности функ-
функций f и I, к которому мы таким способом свели общий случай,
будет основано на следующем «одношаговом» принципе продол-
продолжения:
D2.6) Лемма Банаха. Пусть f—выпуклая и однородная функ-
функция, и пусть Е —конус определения этой функции. Далее, пусть
I—однородная линейная функция, определенная в векторном под-
подпространстве р, такая, что / (z)<I / (z) для г£Е{]р. Далее, пусть
z0 £ £ (mod р)— Е[)р. Тогда существует однородная линейная
функция I* {г), определенная в <z0, po>, такая, что l*(z) = l(z)
для z£p и l*(z)<^f(z) для z£En<z0> />>.
Доказательство леммы D2.6). Для г£р и действительного t
положим по определению I* (z-^-tzo)~l(z) + ta, где а будет
выбрано ниже. Это равенство определяет функцию /* в <z0, ./?>,
причем /*(z)-=/(z) для г£р, и, значит, остается добиться выпол-
выполнения условия /*(z)<I/(z). Если принять во внимание специаль-
специальный вид функции /* и обозначить, как и прежде, переменный
вектор множества <z0, р> через z + tz0, где г£р, то для z + tzo£ E
это условие равносильно неравенству
j[f(z + tzo)-l(z)] при />0
и противоположному неравенству при t < 0. (Для t = 0 условие
выполнено по предположению доказываемой леммы.) Положим
теперь г = /г" при />0 и г— — tz' при t < 0. Ввиду однород-
однородности, неравенства, которые следует проверить, принимают вид
они должны выполняться для любых точек г', z"£p, для кото-
которых г' — г„ и z" + z0 принадлежат конусу Е. Обозначим через и
верхнюю грань выражения, стоящего слева, а через и—нижнюю
грань выражения, стоящего справа. Тогда должны иметь место
неравенства ы^а^и н этого можно добиться посредством
выбора а, если v—«^0. Это последнее условие выполняется,
если участвующие в рассуждении множества векторов z', z"
непусты и для всех них имеет место неравенство
Однако ввиду субаддптивности функции f и аддитивности функ-
функции / [см. D2.4)] это неравенство обязательно выполняется, если
f (z' + z") ^ / (z' + z"); но это последнее неравенство справедливо
по предположениям леммы, так как точка z' + z" принадлежит
множеству ЕГ\р. (Она принадлежит множеству р, поскольку
г'. г'(:Р> и множеству Е, потому что г' — г0, z" + z0 принадле-
принадлежат Е.)
§ 43. Идейное наследие Георга Кантора 153
Итак, осталось доказать, что множества значений г', г" непу-
непусты. Что касается г", то-начало г" — 0—одна из таких точек;
оно принадлежит р и удовлетворяет условию z" + zu£E. Нужно
еще найтн такую точку г' £р, что г' — zn6£.
Согласно предположениям леммы, существуют такие точки
Z{£E и положительные коэффициенты си, ch что сумма coz0-\-
+ 2ciz; принадлежит р. Можно считать, что с0 -1, так как
в противном случае все можно разделить на с0. Тогда точка
г' = zo + 2]c;z(- принадлежит множеству р, а г' — 20 = 2ci^(€£',
так как Е—выпуклый конус.
Тем самым лемма D2.6) полностью доказана.
Теперь можно подвести итоги. Нам нужно доказать D2.5) в случае однород-
однородности функций f и I; вместо этого мы пока доказали одношаговую лемму продол-
продолжения D2.6). Если бы наше векторное пространство было конечномерным, то
доказательство можно было бы завершить методом математической индукции.
Естественно, что мы не хотим ограничиться только таким случаем.
Как уже отмечалось в начале этого параграфа, нам придется поэтому заме-
заменить чем-то метод конечной математической индукции; этим «чем-то» является
метод «трансфинитной» индукции. Он эквивалентен так называемой лемме Цорна,
с которой приходится иметь дело студентам старших курсов. Для тех, кто знаком
с этой леммой или методом трансфиннтной индукции, завершение доказательства
принципа продолжения будет несложным упражнением. Читатель, незнакомый
с этими вопросами, найдет все необходимое в следующем параграфе.
§ 43
Идейное наследие Георга Кантора
Мы с самого начала подчеркивали важную роль понятий в современной мате-
математике, а также тот факт, что многие математические понятия первоначально
возникли в вариационном исчислении. Часто задают вопрос: «А на что, собственно,
человеку дела могут пригодиться понятия?» Если оставить этот вопрос без ответа,
можно создать у читателя психологический барьер, который серьезно усугуб-
усугубляет трудности, связанные с изучением нового. Поэтому мы коротко ответим на
него, прежде чем перейти к рассмотрению тех конкретных понятий, которые нам
понадобятся на данном этапе.
Около 150 лет назад в Париже студенты Политехнической школы устроили
шумную обструкцию в связи с тем, что их заставляют изучать комплексные числа,
которые, дескать, не могут иметь сколь-иибудь разумного практического приме-
применения. А. Пуанкаре (или какой-то другой французский математик) где-то заметил,
что это событие произошло примерно в то же время, что и нашумевшая катастрофа
с судном «Медуза», когда оставшиеся в живых люди соорудили плот н, перенеся
неописуемые страдания, в конце концов почти все погибли от голода. Кто мог
вообразить, что комплексные числа сыграют свою роль в уменьшении числа по-
подобных несчастий? Но ведь это на самом деле так! Инженеры, придумавшие бес-
беспроволочный телеграф, применяли комплексные числа при расчете гармонических
колебаний.
Совершенно очевидно, что положение дел, сложившееся к концу предыду-
предыдущего параграфа, нуждается в коренном пересмотре, причем этот пересмотр немы-
немыслим без привлечения совершенно новых понятий, более того, надо всячески
поощрять умение разрешать проблемы именно концептуально. К сожалению, это
умение невозможно выявить ни на каком обычном экзамене, хотя оно жизненно
необходимо для современного математика Разве когда-нибудь устраивали экза-
154 Гл. IV. Глобальные гамильтонианы, выпуклость, неравенства
мен, на котором экзаменующемуся предлагали бы изобрести что-то новое взамен
математической индукции? Л ведь нам сейчас предстоит решить именно эту
задачу.
К счастью для иас, в даииом случае нам самим решать ее не придется: это
уже сделано. Все. что от нас потребуется,— понять решение, найденное около
75 лет назад.
В данном конкретном случае соответствующие понятия впервые возникли не
в вариационном исчислении; более того, их истоки не удастся обнаружить ни
в чем, что было создано человечеством за предыдущие две тысячи лет. Это, пожа-
пожалуй, единственный пример того, как идеи одного человека неожиданно дали новое
направление развитию математики. Этим человеком был Георг Кантор. Один
математик, которому в юности довелось присутствовать на лекции Кантора, рас-
рассказывал автору этих строк о том колоссальном впечатлении, которое произвел
на него Кантор. Одним из творений Георга Кантора является теория множеств,
элементы которой в наше время преподаются в старших классах средней школы
и даже ранее. Это еще одна область математики, о которой многие думали, что
она не будет иметь ни малейшего практического применения.- Каким это было
заблуждением! Элементы теории множеств сейчас в ходу даже у авторов детектив-
детективных историй. Хорошо известна связь теории множеств с составлением программ
для вычислительных машин, а последние обслуживают несметное количество
практических проектов. Однако сейчас нас будет интересовать только та часть •
творчества Кантора, которая связана с трансфинитными числами и трансфиинт-
ной индукцией.
Поскольку введение этих понятий представляет собой едва ли не величайшее
достижение математики за все время ее существования, было бы просто обидно
скомкать их изложение. Можно хорошо познакомиться с ними по книге Серпнн-
ского о кардинальных и порядковых числах или, если удастся, по его француз-
французской монографии 1928 года, посвященной трансфинитным числам; последняя
ближе по духу к полным глубокой интуиции представлениям самого Кантора и
читается, как увлекательный роман. Еще лучше было бы прочитать обе книги и
сравнить их между собой, а также изучить по крайней мере некоторые из ориги-
оригинальных статей самого Кантора: ведь нет ничего лучше, чем познакомиться
с предметом «из первых рук». Разумеется, все эти работы в наше время относят
к так называемой «наивной теории множеств»; желающие могут найти более чем
достаточно изощренности и лоска в более поздних работах. Для тех, кого интере-
интересует история возникновения идей, хорошим дополнением к названным книгам
будет французская монография Лузина по аналитическим множествам 1К Чита-
Читатели, которые предпочтут изучать траисфннитные числа именно так, как мы реко-
рекомендуем, получат истинное наслаждение и смогут по-настоящему глубоко постиг-
постигнуть существо вопроса.
Однако тем, кто торопится и кому нужен лишь тот минимум информации, без
которого трудно ориентироваться в системе обозначений н следить за приложе-
приложениями, можно порекомендовать целый ряд сжатых руководств; именно так обычно
знакомятся с этим предметом большинство аспирантов (см., например, гла-
главу XIII в книге: Graves, Real Variables).
В приложениях обычно для экономии времени пользуются процедурой,
которая равносильна трансфииитной индукции, но в которой слово «трансфи-
интный» в явном виде не упоминается. Эта процедура (и многие ее приложения)
была описана Куратовским в томе 3 известного журнала Fundamenta Mathemati-
сае. Она восходит к более ранним методам, часть которых появилась одновременно
с теорией Кантора и которые в каком-то смысле являются уступкой тем, кто незна-
незнаком с представлениями Каитора. Основная идея метода, о котором идет речь,
связана с одной теоремой Хаусдорфа (Grundziige der Mengenlehre, Leipzig, 1914 2>).
X) Изданная в 1930 г. в Париже. Русский перевод: Н. Н. Лузин, Лекции об
аналитических множествах и их приложениях, Гостехнздат, М., 1953.— Прим. ред.
2) Русский перевод: Ф. Хаусдорф, Теория множеств, ГТТИ, М.—Л., 1937 г.,
сделан с издания 1927 г., несколько отличающегося от первого.— Прим. ред.
§ 43 Идейное наследие Георга Кантора 155
Значительно позднее одно из следствий метода Куратовского, резюмирующее
предложенную нм процедуру, заслужило официальное признание месье Бурбаки
(будучи, как утверждают, приятным воспоминанием о его недолгом визите в штат
Индиана). «Многоголовый» провозгласил, что этот кратчайший путь к трансфнни-
там неизбежен как «день страшного суда» и по справедливости называется леммой
Цорна 1(. В настоящее время почти все аспиранты имеют дело именно с этой лем-
леммой, тогда как ознакомление с гораздо более глубокими фактами сводится к ми-
минимуму.
Подобное «сгущение» неминуемо приводит к обеднению курса математики и
лишает учащихся возможности постичь всю глубину и творческий характер этой
науки. Так предаются забвению ее корнфен. Между тем именно это богатство идей
необходимо студентам, если они хотят научиться мыслить, а не изощряться в со-
софистике. Крупное сооружение нельзя строить на слабом фундаменте.
Не только творчество, но и сама жнзнь Георга Кантора заслуживает того,
чтобы о ней помнить. Его судьба поистине трагична. При жизни его объявили
безумным после того, как он опубликовал памфлет, содержащий мысль (которую
сейчас разделяют многие деятели церкви), что христианское учение выглядит
гораздо привлекательнее без догмы о непорочном зачатии. Для злейших врагов
Кантора, которые не могли простить ему его революционных математических
идей, это было последней каплей, переполнившей чашу. Его заточили в одну
из ужасных лечебниц того времени, где он н провел около двадцати последних
лет своей жизни.
Мы покажем вкратце, как введенные Кантором понятия позво-
позволяют завершить доказательство теоремы D2.5). Как уже отме-
отмечалось, при этом будет использована аксиома выбора. Теория
трансфинитных чисел предоставляет нам возможность дать
этой аксиоме следующую очень сильную формулировку:
D3.1) Аксиома выбора. Любое множество Е можно упорядо-
упорядочить так, чтобы каждое непустое подмножество имело первый
член.
Множество Е, упорядоченное согласно аксиоме D3.1), назы-
называется вполне упорядоченным. Утверждение D3.1), известное под
названием теоремы Цермело,—это лучшее, чего мы можем
добиться, пытаясь перечислить элементы множества Е, подобно
тому, как перечисляются натуральные числа. Просто перенуме-
перенумеровать элементы множества Е — значит убедиться в его счетности,
а ведь существуют и несчетные множества.
Принимая эту очень сильную форму аксиомы выбора, мы
в действительности обходим трансфинитные числа. Тот факт, что
возможность вполне упорядочить произвольное множество допу-
допустимо принять в качестве аксиомы, имеет большое значение
в связи со следующим принципом:
D3.2) Трансфинитная индукция. Пусть Р{х)—некоторое
утверждение, зависящее от элемента х^Е, где Е—вполне упо-
упорядоченное множество. Предположим, что
11 Игра слов: по-немецки Zorn (Цорн) означает гнев; Dies Irae (лат.)—день
гнева, день страшного суда. — Прим. перев.
156 Гл. IV. Глобальные гамильтонианы, выпуклость, неравенства
(a) Р(х) справедливо, когда х—первый член множества Е;
(b) для любого элемента хп£Е из справедливости утверждения
Р(х) при всех х<х0 следует, что Р(х) верно и для х^х0.
При этих предположениях утверждение Р (х) имеет место для
каждого элемента х£Е.
[Заметим, что здесь и в дальнейшем символом < обозначается
то отношение, по которому множество £ является вполне упо-
упорядоченным.]
При доказательстве -принципа D3.2) будем рассуждать от
противного. Пусть х0—первый член того подмножества, на кото-
котором утверждение Р (х) неверно. Ввиду (а), хп не является пер-
первым членом множества Е. Далее, для всех х < х„ утверждение
Р(х) справедливо, так как х„ — первый член упомянутого под-
подмножества; ввиду (Ь) отсюда следует справедливость Р (х) и для
х^х0. Это, однако, противоречит определению х0 как первого
члена подмножества, на котором Р (х) неверно.
Мы не собираемся обсуждать здесь ни философские выводы
из аксиомы D3.1) и принципа D3.2), ни точный смысл слов
«можно упорядочить», которыми постулируется существование
отношения порядка <. Это очень важные вопросы, особенно для
вариачионного исчисления в его абстрактной форме, поскольку
основной задачей вариационного исчисления в сущности и
является нахождение первых членов некоторых подмножеств.
Однако пока оно еще ограничивается изучением наиболее эле-
элементарных случаев. Во всяком случае на этой стадии ясно, что
D3.1) и D3.2) снабжают нас мощным средством обращения
с произвольными множествами.
Будет удобнее, если мы вкратце подготовим читателя к появ-
появлению неизбежной леммы. Для этого нам понадобится понятие
частично упорядоченного множества; так называется множество,
в котором отношение порядка < определено только для некото-
некоторых пар элементов. Это отношение должно быть транзитивным,
и никакой элемент не может предшествовать самому себе. Если
принять аксиому D3.1), то оказывается, что каждое отношение
частичного порядка может быть получено сужением отношения
порядка, определенного для всех пар, и что его можно получить
из целого класса таких отношений порядка, которые не совпа-
совпадают ни для каких других пар (см. книгу Серпинского, стр. 188).
D3.3) Теорема. (Хаусдорф, loc. cit., стр. 140".) В любом
частично упорядоченном множестве существует максима иьное упо-
упорядоченное подмножество.
Упорядоченное подмножество называется максимальным, если
оно не является подмножеством никакого другого упорядоченного
11 Имеется в виду издание 1914 года.— Прим. ред.
§ 43. Идейное наследие Георга Кантора J57
подмножества. Мы пока отложим доказательство теоремы D3.3),
которое опирается на D3.1) и D3.2), и перейдем к следующему
очевидному следствию:
D3.4) Лемма Цорна. Пусть Е—частично упорядоченное мно-
множество, такое, что каждое его упорядоченное подмножество имеет
верхнюю грань. Тогда в Е существует слабый максимальный элемент.
Слабым максимальным элементом множества Е мы называем
здесь такой элемент г£Е, что соотношение z < х не имеет места
ни для какого х£Е. Элемент z££ называется верхней гранью
подмножества А множества £, если для каждого у£А, не рав-
равного г, имеем у < ?. Для того чтобы вывести D3.4) из D3.3),
предположим, что Л—максимальное упорядоченное подмноже-
подмножество множества Е, a z— верхняя грань подмножества А. Если
бы элемент z не был слабым максимальным элементом множества Е,
то существовал бы такой элемент х £ Е, что z < х. Этот элемент х,
очевидно, удовлетворял бы соотношению у < х для каждого у £ А,
а это противоречило бы предположению, что А—максимальное
упорядоченное подмножество.
Ясно, что лемма Цорна—это еще одно утверждение, пред-
представляющее интерес для абстрактной теории вариационного
исчисления.
Доказательство теоремы D2.5). Теперь мы можем доказать
теорему Хана — Банаха. Ее доказательство сводится к про-
простому упражнению в применении леммы Цорна. Тем самым дока-
доказательство использует теорему D3.3), которую мы пока еще
не установили, и в конечном счете аксиому выбора D3.1).
Мы должны изучить только однородный случай и можем,
не нарушая общности, предположить, что р*—все пространство,
так что множество Е совпадает с пересечением
Рассмотрим множество линейных функций К, определенных
в векторных подпространствах Пзр, совпадающих с I в р, так
что, в частности, все они равны нулю в начале, и, кроме того,
удовлетворяющих условию
) для г
Частично упорядочим множество таких функций следующим
образом: А,г<А,2, если Г^сП,,, Пх=^П2 и функция Кг совпадает
с ограничением функции А,2 на П^
Очевидно, что каждое упорядоченное подмножество Л имеет
верхнюю грань; эта верхняя грань будет линейной функцией Я*,
определенной в векторном подпространстве и И, где объединение
берется для всех А,£Л, а функция X* задается следующим обра-
158 Гл. IV. Глобальные гамильтонианы, выпуклость, неравенства
зом: A,* (z) = А, (г) для любого А,, для которого г £ П. Значит,
согласно D3.4), множество функций К имеет слабый максималь-
максимальный элемент. Это свойство противоречит лемме D2.6), если этот
элемент не определен во всем векторном пространстве. Следова-
Следовательно, теорема D2.5) доказана при условии, что справедлива
теорема D3.3).
Доказательство теоремы D3.3). Мы оставили его напоследок
потому, что это единственное доказательство такого рода, кото-
которое нам потребуется.
Пусть Е—заданное множество, a R—отношение частичного
порядка. Далее, пусть <—то отношение порядка, которое пре-
превращает Е во вполне упорядоченное множество согласно аксиоме
D3.1). Обозначим через s любое множество, которое либо совпа-
совпадает со всем Е, либо состоит из элемента х € Е и всех предшест-
предшествующих ему в смысле отношения <; обозначим через £(s) мно-
множество, состоящее из последних членов множеств s (в смысле
отношения <), где s=£E.
Множество S всех множеств s указанного вида является вполне
упорядоченным по отношению строгого включения (в теоретико-
множественном смысле), которое мы снова обозначим символом
<. Множество S имеет последний член Е. Обозначим первый
член множества S (который представляет собой первый член
множества Е в смысле отношения <) через s0 и используем
букву / для обозначения переменного элемента множества S,
удовлетворяющего условию / < s, где s € S задано.
Определим теперь для sgS такие функции ц>, я|) от s, чтобы
(f(s) для каждого s было максимальным упорядоченным (в смысле
отношения R) подмножеством множества s и чтобы vp(s)= 11ф(/),
t <s. (Для s~s0 по определению ^(so) — пустое множество.)
Для этой цели введем следующие правила:
(a) <p(s0) = s0 = £(s0);
(b) <p(s) = £ (s)UiMs), если это —максимальное упорядоченное
множество элементов s в смысле отношения R и s0 < s;
(c) cp(s) = \l)(s), если условие (Ь) не выполнено и so<s.
Из D3.2) легко получить, что для каждого элемента
справедливо следующее утверждение Р (s): рассматриваемые
функции однозначно определяются приведенными выше правилами
и <p(s) — максимальное упорядоченное подмножество элементов s
в смысле отношения R. Очевидно, что P(s0) справедливо. Поэ-
Поэтому нужно только проверить, что если P(t) справедливо для
всех / < s, то P(s) также справедливо. Допустим противное для
некоторого s=?^s0.
Тогда очевидно, что ty(s), а с ним и q>(s) определены
и, кроме того, cp(s) = \l)(s). Далее, cp(s) упорядочено в смысле
отношения R, так как любые два элемента из <р (s) принадлежат
§ 44. Двойственность выпуклых фигур 159
Ф @ для некоторого t < s. Так как Р (s) несправедливо, то суще-
существует такое / < s, что £ (t) не пересекается с ц>(s), a £(/) U Ц- (s) —
упорядоченное множество. Следовательно, если f—первый из
таких элементов t, то, с одной стороны, ф(/') —я)) (/'), а с другой
стороны, гр(Г)и£(О — максимальное упорядоченное подмноже-
подмножество элемента V в смысле отношения R. Это противоречит пра-
правилам (Ь) и (с).
Таким образом, теорема D3.3) доказана.
§ 44
Двойственность выпуклых фигур
Эта двойственность будет полезна нам в нескольких отноше-
отношениях, и особенно при определении глобальных гамильтонианов.
Пространство г остается тем же, что и раньше, но выбор начала О
будет влиять на наши определения. Обозначим через у произ-
произвольную действительную однородную линейную функцию от г,
определенную для всех г. Пространство, точками которого яв-
являются такие функции у, назовем дуальным пространством про-
пространства г. Началом дуального пространства служит линейная
функция, равная тождественно нулю. Линейные комбинации функ-
функций у определяются очевидным образом. Далее значение, при-
принимаемое функцией у в точке г, записывается в виде произведения
уг или zy.
На ^-пространстве с указанным выше началом рассмотрим
в свою очередь однородные линейные функции и от у, и таким
образом определим дуальное пространство «/-пространства, или
второе дуальное пространство г-пространства, в котором точками
будут функции и. Среди этих линейных функций и, в частности,
находится каждая функция от у вида гу, где z—точка исходного
г-пространства. В наших мультипликативных обозначениях по-
подобные функции и удовлетворяют соотношению иу = гу для всех у;
мы будем говорить, что эта функция и сводится к точке г. Если
каждую функцию и можно представить таким образом, то исход-
исходное z-пространство называется рефлексивным.
В г-пространстве назовем лучом полупрямую /, исходящую
из начала 0, которое считается принадлежащим /. Назовем
выпуклой фигурой, окружающей 0, или просто выпуклой фигурой
выпуклое множество Е, пересечение которого с каждым лучом
является конечным замкнутым отрезком. Очевидно, что одним
концом этого отрезка будет само начало 0; это следует из вы-
выпуклости пересечения множества Е с прямой, содержащей два
противоположно направленных луча. Второй конец называется
граничной точкой множества Е на рассматриваемом луче; и,
вообще, точка г называется граничной точкой множества £, если
она является граничной точкой на луче, исходящем из 0 и про-
160 Гл. IV. Глобальные гамильтонианы, выпуклость, неравенства
ходящем через г. Для произвольной отличной от 0 точки г гра-
граничная точка на луче, проходящем через г, имеет вид Яг, где
Я>0. Положим <2(г)=1Д и Q@) = 0. Функцию Q (г), опреде-
определенную таким образом, назовем калибровочной функцией 1) выпук-
выпуклой фигуры Е.
D4.1) Замечание, (i) Калибровочная функция положительно
определена, однородна и выпукла, (и) Обратно, любая однородная
выпуклая положительно определенная функция Q (г), определенная
для всех г, является калибровочной функцией выпуклой фигуры Е,
причем Е—это множество точек г, для которых Q(z)^L 1.
Доказательство. Пусть Е—выпуклая фигура, и пусть Q (z)—
ее калибровочная функция. Очевидно, что множество £ совпадает
с множеством точек г, для которых Q(z)^.l, так как пересече-
пересечения множества Е и этого множества с каждым лучом совпадают.
Таким образом мы доказали последнюю часть утверждения (ii).
Очевидно также, что Q (z) > 0, если гфО, т.е. Q—положи-
Q—положительно определенная функция. Далее, покажем, что Q (tz) = tQ (z)
для t > 0. Для этого нужно только заметить, что при замене г
на tz граничная точка Кг должна остаться той же самой; следо-
следовательно, К заменяется на Kit. Если z — z' + z" и
то
Точка £, определяемая левой частью этого равенства, лежит на
луче, проходящем через z, и является выпуклой комбинацией
точек K'z', Vz" из Е\ следовательно, ввиду выпуклости, точка £
принадлежит множеству £, а значит, лежит на отрезке, соеди-
соединяющем 0 и Kz. Отсюда
k'k" 1 1.1
те- х<т-+т;
значит, отношение субаддитивности выполняется и, согласно D2.4),
функция Q выпуклая. Таким образом, утверждение (i) доказано.
Наконец, докажем начальную часть утверждения (ii). Для любой
однородной выпуклой положительно определенной функции Q
определим Е как множество точек г, удовлетворяющих условию
Q (z)^l. Легко проверить, что Е—выпуклая фигура, для кото-
которой Q служит калибровочной функцией. Итак, замечание D4.1)
полностью доказано.
1} Или функцией Мннковского (в оригинале: function of distance). —
Прим. ред.
§ 44. Двойственность выпуклых фигур 161
В дальнейшем иногда будет удобно изображать точки у ду-
дуального пространства посредством гиперплоскостей первоначально
заданного z-пространства. Любая такая гиперплоскость —это мно-
множество точек z, для которых некоторая действительная линейная
функция l(z), отличная от тождественной константы, принимает
постоянное значение. Можно предположить, что /(г)—однородная
функция, поскольку, вычитая / @), этого всегда можно добиться.
Мы будем рассматривать только те гиперплоскости П, которые
не содержат 0, и назовем их полярными гиперплоскостями в z-npo-
странстве. Разделив l(z) на соответствующую постоянную, мы
найдем, что каждой полярной гиперплоскости отвечает ровно одна
точка у дуального пространства, такая, что П является множе-
множеством точек г, для которых уг = \. Эта точка у называется полю-
полюсом гиперплоскости П, и, обратно, гиперплоскость П называется
полярой точки у. Аналогичным образом можно определить поляр-
полярные гиперплоскости «/-пространства и поставить их в соответствие
точкам и второго дуального пространства, которое сводится
к исходному z-пространстзу, если последнее рефлексивно.
Для заданной выпуклой фигуры Е гиперплоскость П, опре-
определенную уравнением 1(г) — с, назовем неразделяющей, если лишь
одно из двух «открытых» полупространств l(z)<.c, /(z)> с со-
содержит точки фигуры Е. Очевидно, что неразделяющая гипер-
гиперплоскость не может проходить через 0. Значит, она является
полярной и ее можно задать соответствующим ей полюсом у.
Из всех неразделяющих гиперплоскостей отберем те, которые
имеют общие точки с фигурой £; такие гиперплоскости назовем
опорнымии. Легко видеть, что точка выпуклой фигуры Е, при-
принадлежащая опорной гиперплоскости, всегда является для Е гра-
граничной точкой. Из теоремы Хана — Банаха получаем обратное
утверждение:
D4.2) Замечание. Через каждую граничную точку выпуклой
фигуры Е должна проходить по крайней мере одна опорная ги-
гиперплоскость.
Доказательство. Пусть z0 — граничная точка, a G—прямая,
соединяющая ее с началом. На прямой G определим линейную
функцию /0, полагая /0 (tz0) = t для всех действительных /. На луче,
проходящем через z0, эта функция, очевидно, совпадает с калиб-
калибровочной функцией Q фигуры £ и, значит, не превосходит Q.
На противоположно направленном луче функция /0 отрицательна,
а функция Q положительна. Следовательно, lo(z)^Q(z) в С
Согласно теореме Хана—Банаха, функция /0 имеет продолжение
(его мы обозначим той же буквой /0), которое определено во всем
11 В оригинале «landing». См. по этому поводу примечание редактора на
стр. 149. — Прим. ред.
6 м 1274
162 Га. IV. Глобальные гамильтонианы, выпуклость, неравенства
z-пространстве и для всех z удовлетворяет условию /0
Так как продолженная /0 осталась линейной и к тому же равна
нулю в 0, ее можно отождествить с точкой у0 дуального прост-
пространства. Заметим, что, с одной стороны, t/ozo=l, а, с другой
стороны, yoz^.\ при z£E, так как yoz^Q(z). Следовательно,
гиперплоскость П, заданная уравнением yoz= 1, является опорной
гиперплоскостью, проходящей через точку z0, и наше утвержде-
утверждение доказано.
Мы говорим, что множество F двойственно выпуклой фигуре Е,
или является ее полярой, если F—множество полюсов неразде-
ляющих гиперплоскостей П. Очевидно, что F состоит из таких у,
для которых yz ^ 1, когда z £ Е. (Для того чтобы понять это,
нужно помнить, что точка z -U лежит в £ и что в этой точке
не выполняется неравенство yz^l.)
D4.3) Теорема, (i) Поляра F выпуклой -фигуры Е в г-прост-
ранстве является выпуклой фигурой в у-пространстве, (ii) Если
Q{z), Н (у)—калибровочные функции соответственно фигур Е, F, то
(а) И (у) — sup yz для всех у;
геЕ
D4 4) ■( (Ь) Q (z) = sup yz для всех z;
' ' yeF
(с) уг^.Н (у) Q (z) для всех у, z.
(iii) Верхняя грань, равная Q(z) в D4.4) (Ь), достигается на не-
некотором y=yo£F; кроме того, если z-пространство рефлексивно,
то верхняя грань, равная Н (у) в D4.4) (а), достигается на неко-
некотором г = го£Е.
Доказательство. Для удобства определим сначала Н не так,
как это сделано в (ii), а посредством формулы D4.4) (а). Тогда
можно сразу проверить, что Н—однородная и выпуклая функ-
функция, так как очевидно, что, с одной стороны, Н (ty) — tH(y)
для t^O, а с другой стороны,
sup угг + sup y2z = Н {ух) + Н (у2).
Помня это, обозначим через t/_ любое значение у, для которого
Н(у)^0. Тогда zy-z^.0 для каждого z£E, и, следовательно,
ввиду однородности функции Н это же неравенство имеет место
и для каждого г из г-пространства. Заменив z на —г, получим,
что ху_ = 0 для всех г, т. е. t/_ может быть только нулевой
линейной функцией — началом дуального пространства. Таким
образом, Н—положительно определенная функция.
В соответствии с D4.1) Я является калибровочной функцией
множества Н(у)^\, т. е. множества F, и, значит, F—выпуклая
фигура. Далее, согласно формуле D4.4) (а), которую мы считаем
§ 45. Двойственность выпуклых функций J63
определением функции Н, (Кг) у^Н (у) для Кг € Е, и, взяв К= 1 IQ (г),
получаем неравенство D4.4) (с) (для гФО; при г = 0 оно очевидно).
Остается проверить D4.4)(Ь) и показать, что верхняя грань
достигается (тогда второе утверждение из (iii) справедливо ввиду
симметрии). Можно предположить, что гфб, и ввиду однород-
однородности достаточно изучить только тот случай, когда z удовлетво-
удовлетворяет условию Q(z)=l, т.е. когда г есть некоторая граничная
точка z0. Ввиду неравенства D4.4)(с), доказанного выше, yz0^. 1
для каждого y£F, тогда как, согласно D4.2), существует такая
точка у0 € F, что yozo = 1. Значит, искомая верхняя грань равна 1,
т. е. равна Q (г0). Таким образом, теорема D4.3) полностью
доказана.
Попутно мы установили, что, когда z-пространство рефлексивно
и, в частности, евклидово, между выпуклыми фигурами и их
полярами существует взаимное соответствие. Такие фигуры (и их
калибровочные функции) назовем полярными преобразованиями
или просто полярами друг для друга.
§ 45
Двойственность выпуклых функций
Конечной снизу назовем функцию, значения которой лежат
в расширенной числовой прямой и которая, с одной стороны, не
равна тождественно -f», а с другой — никогда не принимает
значение —оо. Модифицировав несколько определение выпуклости,
мы приспособим его и к функциям, конечным снизу; а именно,
функцию f назовем выпуклой, если для каждой точки zn число
/(z0) равно верхней грани значений в точке z0 таких конечных
выпуклых функций, которые нигде не превосходят функцию f.
Тогда число f(z0) равно верхней грани значений в точке z0 таких
линейных функций, которые нигде не превосходят функцию f,
так как, согласно определению выпуклости (определение II), каж-
каждая конечная выпуклая функция имеет в точке z0 такое же зна-
значение, как и некоторая линейная функция, нигде ее не превос-
превосходящая. Отсюда мы можем вывести следующее замечание:
D5.1) Замечание. Функция, конечная снизу, будет выпуклой
тогда и только тогда, когда она является точной верхней гранью
некоторого семейства линейных функций.
Теперь перейдем к определению и обсуждению двойственности
между выпуклыми функциями. Как мы увидим ниже, это обоб-
обобщение понятия выпуклости, распространяющее его на функции,
конечные снизу, оказывается весьма полезным, так как без этого
симметрия наших соотношений была бы существенно нарушена.
По-прежнему мы будем считать фиксированным начало z-npo-
странства, фиксируя тем самым и дуальное пространство. Однако
164 Гл. IV. Глобальные гамильтонианы, выпуклость, неравенства
буквой Q мы будем теперь обозначать не только калибровочную
функцию, а произвольную выпуклую функцию, конечную снизу
и определенную для всех г. Дуальной функцией, или преобразо-
преобразованием Лежандра, функции Q назовем такую функцию Я, кото-
которая определена в дуальном пространстве равенством
Н(у) = sup {yz-Q{z)\.
2
Для калибровочной функции Q определенная так дуальная
функция будет совсем другой,нежели ее полярное преобразование,
рассмотренное в предыдущем параграфе1'. Однако и здесь имеет
место результат, аналогичный теореме D4.3). Для того чтобы
подчеркнуть эту аналогию, мы включим в формулировку опре-
определение дуальной функции в виде формулы D5.3){а).
D5.2) Теорема, (i) Функция Н, дуальная к.выпуклой функции Q,
конечной снизу и определенной в z-пространстве, определена
в у-пространстве и является выпуклой функцией, конечной снизу.
(и) Имеют место следующие соотношения:
(а) Н (у) = sup \yz— Q (г)} для всех у;
2
D5.3) { (b) Q(z) = sup{yz —H(y)\ для всех г;
(с) уг ^ Н (у) + Q (г) для всех у, г.
(iii) Если Q—конечная функция, то верхняя грань в D5.3) (Ь)
достигается в некоторой точке у = у0 (зависящей от г). Анало-
Аналогично если z-пространство рефлексивно и Н—конечная функция,
то верхняя грань в D5.3) (а) достигается в некоторой точке
г = г0, зависящей от у.
Доказательство. Выпуклость функции Я и ее конечность
снизу следуют из замечания D5.1), так как, согласно D5.3) (а),
Н является точной верхней гранью семейства линейных функций
от у. Значит, утверждение (i) доказано. Кроме того, D5.3) (с)
является очевидным следствием определения D5.3) (а). Таким
образом, доказательство утверждения (ii) сводится к проверке
равенства D5.3) (Ь). Для этого в свою очередь достаточно пока-
показать, что если заданы любая точка z0 и любое конечное дейст-
действительное число a <Q(z0), то существует у0, для которого yozo —
— Н(уо)^а. Ввиду D5.1) существует линейная функция /0(z),
которая нигде не превосходит Q(z) и для которой Z0(z0)>a.
1} Имеется в виду функция Н (у) из D4.4) (а). Преобразованием Лежаидра
Н[_ калибровочной функции выпуклой фигуры £ будет индикаторная функция
ее поляры F: #£(#) = 0 для yeF и Hi(y)=co для у ( F (см. ниже стр. 165—
166). В то же время, согласно D4.3), полярное преобразование Ир этой же
функции есть калибровочная функция поляры F фигуры Е. — Прим. ред.
§ 45. Двойственность выпуклых функций J(j5
Представим эту линейную функцию в виде /ОBо) + УоB—z0), где
у0 принадлежит нашему дуальному пространству. Тогда
z—z0),
и потому уог—Q(z)^yozo—а для всех г. Взяв точную верхнюю
грань левой части по г, получаем отсюда неравенство Н (уп) ^
<Iyozo—а, т.е. G^yozo—Н(у0), что и требовалось. Это рассуж-
рассуждение доказывает D5.3) (Ь) или, точнее, показывает, что Q (z0) не
превосходит искомой верхней грани; противоположное неравен-
неравенство следует из D5.3) (с). Значит, утверждение (ii) тоже доказано.
Осталось доказать (iii), причем ввиду симметрии для этого до-
достаточно рассмотреть только D5.3) (Ь). Согласно предположению,
Q теперь конечная функция, так что ввиду определения II для
любой заданной точки z0 существует такая линейная функция
ln(z), что Q(zo) = /O(zo) и Q(z)^lo(z) для всех г. Используя
первое из этих соотношений, можно положить
где у0 принадлежит дуальному пространству. Таким образом,
yo(z~zo), т.е. yoz-Q(z)^yozo-Q(zo).
По определению функции Я из этого последнего соотношения
следует, что Я(yo) = y0zo—Q(z0), т.е.
Q(zo) = yozo—Н(у0).
Далее, согласно D5.3) (с),
Q.(zo)^yzo — H{y) для всех у.
Значит, верхняя грань правой части достигается при у = у0, что
мы и утверждали.
Читатель заметит, что определение функции Н имеет смысл
и в том случае, когда Q—невыпуклая функция; при этом оста-
остаются справедливыми неравенство D5.3) (с) и утверждение, что
Я—выпуклая функция, конечная снизу. Однако ив этом случае Я
оказывается дуальной к некоторой выпуклой функции, конечной
снизу, а именно к наибольшей такой функции, не превосходя-
превосходящей Q. Эту функцию можно найти посредством перехода ко
второй дуальной, как в D5.3) (Ь).
Мы завершим этот параграф рассмотрением нескольких при-
примеров.
A) Пусть Е, F—двойственные выпуклые фигуры, и пусть
Q —калибровочная функция фигуры Е. Тогда Q—конечная вы-
выпуклая функция и даже довольно гладкая, но, как мы сейчас
увидим, ее преобразование Лежандра будет всего лишь конечным
снизу; в самом деле, это преобразование Лежандра равно нулю
166 Гл- IV. Глобальные гамильтонианы, выпуклость, неравенства
в точках фигуры F и равно +оо в остальных точках. (Подобные
факты частично объясняют, откуда берется то ощущение смутного
страха, которое испытывают, занимаясь гамильтонианами и двой-
двойственностью.) Для того чтобы показать, что преобразование
Лежандра равно нулю в F, достаточно заметить, что, согласно
D4.4) (с), для любой точки уп £ F выражение yoz— Q (z) не может
быть больше 0, и оно равно нулю при 2 = 0. Для того чтобы
показать, что преобразование Лежандра равно +оо для любой у0,
не принадлежащей F, аналогично замечаем, что существует точка г,
для которой yoz > Q (г); заменив z на tz и устремив t—юо,
можно сделать разность yoz—Q(z) сколь угодно большой, и,
следовательно, верхняя грань равна +оо.
B) Вместо функции Q из предыдущего примера рассмотрим
теперь функцию Q* — l/2Q2. Тогда преобразованием Лежандра Я*
функции Q* будет г/2Н2, где Н—полярное преобразование функ-
функции Q. Чтобы доказать это, вычислим, используя теорему D4.3),-
supyz для Q(z) = t; ее значение равно tH(y), следовательно,
sup {yz—V»Q*B)} п0 г равняется верхней грани по t выражения
которая, очевидно, равна Ч2Н2(у).
C) Рассмотрим более общий случай. Пусть Ф—выпуклая
конечная снизу функция, определенная на действительной прямой
и такая, чтоФ@) = 0. Пусть, далее, Ч—дуальная к Ф. Положим
Q* = O(Q), H* = W(H), где Q, Н—те же, что и в предыдущих
примерах. Тогда Н* будет преобразованием Лежандра для Q*.
Доказательство этого факта предоставляется читателю. Неравен-
Неравенство D5.3)(с) принимает здесь вид уг<Ф(С2 (г))+ Y(#(#)).
Оно является следствием D4.4)(с), так как QH^.Q)(Q)+yV(Я).
§ 46
Глобальные гамильтонианы и обновленное
вариационное исчисление
В этом параграфе двойственные пространства у и г будут
евклидовыми и, значит, рефлексивными, и мы отождествим
z с х. ПустьL(t, х, х)—непараметрический лагранжиан, Q (г)—
функция, получающаяся из него, когда tux фиксированы,
a x — z, и пусть И (у)—преобразование Лежандра функции Q (г);
Н можно рассматривать как функцию от (t, x, у), и как таковая
она будет обозначаться H(t, x, у). Функцию H(t, x, у) мы будем
называть непараметрическим глобальным гамильтонианом, соот-
соответствующим лагранжиану L(t, x, х). Аналогично, если L(x, x)—
параметрический лагранжиан и Q (г) — функция, получающаяся
§ 46. Глобальные гамильтонианы 167
из него, когда х фиксировано, a x = z, то Н(х, у) обозначает
функцию, которая при фиксированном х является полярным пре-
преобразованием Q (г). Функцию Н(х, у) назовем стандартным
параметрическим глобальным гамильтонианом, соответствующим
лагранжиану L(x, x). Иногда мы будем опускать слова пара-
параметрический, стандартный, непараметрический и глобальный.
Заметим, что в наших определениях подразумевалась выпуклость,
а в параметрическом случае также и положительная определен-
определенность функции Q (г). Воспользовавшись формулой Тейлора с оста-
остаточным членом, мы найдем, что функция Q (г) будет выпуклой
(определение II), если лагранжиан L удовлетворяет условию
Лежандра применительно к непараметрическому или соответ-
соответственно к параметрическому случаю.
D6.1) Теорема. Предположим, что лагранжиан L дважды не-
непрерывно дифференцируем. В непараметрическом случае предпо-
предположим также, что матрица Lxx, составленная из частных про-
производных второго порядка по х, положительно определена. В па-
параметрическом случае предположим соответственно, что лагран-
лагранжиан L положительно определен и удовлетворяет условию Лежандра
из § 41. Тогда локальный гамильтониан совпадает с глобальным
вблизи каждой точки (t, x, у) или (х, у), в которой у имеет вид Lx.
Ввиду однородности в параметрическом случае это справедливо
для любой точки (х, у), тогда как в непараметрическом случае
эти гамильтонианы совпадают и у имеет вид Lx вблизи каждой
точки (t, х, у), в которой глобальный гамильтониан конечен.
Доказательство. Параметрический случай можно не рассматри-
рассматривать: согласно § 41 и примеру 2 из § 45, его можно свести
к непараметрическому, взяв в качестве лагранжиана 1/iL2. Пусть
функция К, определенная вблизи точки (t0, x0, у0), где уA имеет
указанный в теореме вид, является локальным гамильтонианом.
Для всех точек (t, x, у), лежащих вблизи (/„, х0, у0), у имеет
вид L-x, в самом деле, достаточно положить х — Ку- Следовательно,
линейная функция от г, а именно zy—K(t, x, у), касается вы-
выпуклой функции от г, т. е. L(t, x, г), в точке х = г. Так как
ввиду выпуклости касательная лежит под графиком функции L,
то для всех z
L(t, х, z)^zy—K, т. е. fC^zy—L(t, x, г),
а при г = х в этих формулах имеем равенство. Следовательно,
К совпадает с верхней гранью, определяющей глобальный га-
гамильтониан в точке (t, х, у). Для завершения доказательства
остается заметить, что, согласно утверждению (iii) из теоремы
D5.2), в любой точке (t, x, у), в которой глобальный гамиль-
168 Гл- IV. Глобальные гамильтонианы, выпуклость, неравенства
тониан конечен, максимум по г выражения уг—L(t, х, г) дости-
достигается при г = х, а тогда в соответствии с элементарной теорией
максимумов и минимумов y — L-x.
Из теоремы D6.1) и симметрии преобразований Лежандра,
или полярных преобразований, в рефлексивном пространстве
непосредственно вытекает, что мы можем определить лагран-
лагранжиан L, коль скоро мы знаем дуальную L функцию, т. е. га-
гамильтониан Н. Следовательно, мы можем не упоминать о лагран-
лагранжиане при формулировке нашей задачи и считать гамильтониан Н
первичной функцией, как это и делают в теории уравнений
с частными производными. Напомним, что при этом подразуме-
подразумевается конечность и выпуклость t по х, а также его положи-
положительная определенность в параметрическом случае.
Ввиду теорем D5.2) и D4.3) наша задача применительно
к непараметрическому и параметрическому случаям формула
руется теперь следующим образом:
(a) Г max \xy — H(t, x, y)\ dt = Minimum,
D6.2) I J * .
(b) \ max {xy/H(x, y)\ dt = Minimum.
у
При такой минимаксной формулировке мы предполагаем, что
точно указано, какие функции x(t), удовлетворяющие заданным
граничным условиям, являются допустимыми. Исходя из этого
назовем пару функций х (t), y(t) подходящей, если x(t)—допу-
x(t)—допустимая функция и если при x = x(t) соответствующее выражение
D6.3) (a) xy—H{t, х, у) или (Ь) ху/И(х, у)
достигает своего максимума по у, когда y~y(t). Таким образом,
наша задача состоит в нахождении минимума интеграла от вы-
выражений D6.3) (а) или (Ь) в классе подходящих пар.
Сформулированная по-другому, она станет задачей об услов-
условном минимуме. Если гамильтониан Н непрерывно дифференци-
дифференцируем и выражение D6.3) (а) достигает своего максимума, то,
согласно элементарной теории максимумов и минимумов, х = Ну.
Обратно, из этого соотношения следует, что выражение D6.3) (а)
достигает максимума, так как график выпуклой по у функции Н
не может иметь параллельных касательных гиперплоскостей.
Аналогичные замечания справедливы и для выражения D6.3) (Ь)
при условии, что максимум равен единице, т. е. t—стандартный
геодезический параметр. Следовательно, нашу задачу можно
сформулировать так: найти минимум интеграла от выражения
D6.3) (а) или (Ь) при дополнительном условии, заданном в виде
дифференциального уравнения х' — Иу, причем если мы рассмат-
§ 46. Глобальные гамильтонианы 169
риваем параметрический случай, то t должен быть еще стандарт-
стандартным геодезическим параметром.
В этой новой формулировке мы получаем вариационную за-
задачу с дополнительным ограничением такого же типа, с которым
мы встретимся в задачах оптимального управления. В некоторых
отношениях она требует более деликатного обращения, чем ис-
исходная задача с ее лагранжианом, особенно в том, что касается
необходимых условий.
Однако никогда не следует пугаться кажущихся трудно-
трудностей. Читатель уже понял, что необходимые условия имеют
в лучшем случае только эвристическую ценность, если они
не подкреплены теоремами существования. При новой форму-
формулировке они не понадобятся нам даже в качестве наводящих
соображений, так как наши рассуждения будут очень близки
к методу характеристик Коши. Тем самым по отношению к до-
достаточным условиям следует предпочесть новую формулировку.
К тому же она позволяет нам быть более экономными в смысле
гладкости: вместо трехкратной дифференцируемости функции L
мы требуем лишь наличия непрерывных вторых производных
у Н, и, кроме того, требование невырожденности матриц Lxk или
Нуу становится менее существенным. Мы сможем охватить даже
некоторые случаи, когда L не будет непрерывно дифференцируе-
дифференцируемой, например случай, когда L имеет вид <p(f, x)t|j(x), где
Ф—дважды непрерывно дифференцируемая функция, a if (г) равна
наибольшему из значений г2, 2—г2, или когда в параметри-
параметрической задаче L имеет индикатрису наподобие фигуры F, изобра-
изображенной на рисунке в §24 гл. II. Опишем вкратце соответствую-
соответствующую теорию.
Сопряженной функцией наклона назовем такую векторную
функцию q(t, х) (мы рассматриваем непараметрический случай),
что подстановка у = q превращает ydx—Hdt в полный диффе-
дифференциал dS, и обозначим через /(С) интеграл D6.2)(а) вдоль
кривой С. Так как в подинтегральной функции берется макси-
максимум по у, то, очевидно,
причем равенство выполняется только для тех С, которые удов-
удовлетворяют дифференциальному уравнению х — Ну при у = Ц- Это
замечание заменяет алгоритм из § 12 гл I. Дальнейший анализ
понятия точности и скобок Лагранжа теперь можно провести без
введения лагранжиана L; для этого нужно только применить
рассуждения из § 23 гл. II,
UQ Гл. IV. Глобальные гамильтонианы, выпуклость, неравенства
Замечания о классических неравенствах
Основные неравенства—это те, которые приведены в опре-
определении выпуклости D2.1) и утверждениях D4.4) (с) и D5.3) (с),
являющихся фактически определениями полярного преобразова-
преобразования и преобразования Лежандра. Эти три вида неравенств
являются соответственно обобщением неравенства Минковского
(в сущности все они принадлежат Минковскому), неравенства
Шварца (известного, конечно, значительно раньше) и неравенства
Юнга (У. Г., а не Л. Ч."). Классические неравенства представ-
представляют собой частные случаи, которые получаются при проверке
выпуклости некоторой функции и вычислении ее дуальных. Более
сложные неравенства и применения понятия выпуклости можно
найти в литературе по неравенствам, диофантовым приближениям
и родственным вопросам. Неравенства встречаются также в теории
функций комплексного переменного и в теории гармонических
и субгармонических функций, в теории дифференциальных урав-
уравнений с частными производными и т. д. Мы ограничимся рас-
рассмотрением классических неравенств.
В приводимых ниже рассуждениях мы будем использовать
следующие пять простых правил:
(a) Пусть ф—дважды непрерывно дифференцируемая функция
действительного переменного и, удовлетворяющая условию
ф"(ы)>0 для всех и; тогда ф—выпуклая функция.
(b) Предположим, что ф, ■ф—выпуклые функции; тогда функ-
функции ф + гр и тах(ф, г])) тоже выпуклые.
(c) Пусть /—выпуклая функция, а ф — возрастающая выпук-
выпуклая функция действительного переменного и; тогда ф (/)—вы-
(/)—выпуклая функция.
(d) Пусть /—выпуклая функция; тогда множество точек х,
для которых /(х)^1, выпукло.
(e) Предположим, что действительная положительно опреде-
определенная функция / удовлетворяет следующим двум условиям:
f(tx) — tf(x) для tZ^O; множество точек х, в которых /(х)^1,
выпукло и содержит начало координат в качестве внутренней
точки. Тогда /—выпуклая функция.
В приведенных выше правилах подразумевается, что функции
определены в «-мерном евклидовом пространстве, если не огово-
оговорено противное. Правило (е) сразу вытекает из определения
калибровочной функции, а остальные являются непосредствен-
непосредственными следствиями определения выпуклости.
11 См. примечание на стр. 15. —Прим. ред.
§ 47. Замечания о классических неравенствах 171
Заметим, что, согласно правилу (а), показательная функция
выпукла. Значит,
Полагая в этом неравенстве ехры^д,, получаем
D7.1) Д«Г <53«Л К>0. «i >0. S«/=
Это неравенство называют неравенством среднего арифметического
и среднего геометрического (теорема 9 из книги Харди, Литтль-
вуда и Полна, стр. 29). Случаи равенств можно рассмотреть,
используя тот же метод.
Перейдем теперь к неравенству Минковского для степеней
(теорема 24 на стр. 44 из той же книги). Пусть х = (х13 ..., х„);
линейная функция от х, равная v-й координате xv, безусловно
выпукла; выпуклой будет и функция —xv. Следовательно, ввиду
правила (Ь) выпукла функция |xv|, а ввиду правила (с) — и | jcv Iя,
если только pZ^l. Значит, согласно (b), Sl-^vl^—выпуклая
функция от х для р^ I, а потому, в силу (d), множество точек х,
в которых 21х\ \р^г 1. выпукло. Наконец, ввиду (е) однородная
v
функция
будет выпуклой, а следовательно, и субаддитивной. Таким обра-
образом, получаем искомое неравенство
D7.2) B3kv+i/vr"I/p<(Sl*vhl/p+(Sli/vrBI/p (Р>1)-
Для той же функции f(x) вычислим теперь полярное преобразо-
преобразование Н (у). Для простоты предположим, что р>1, и введем
обозначение q = p/(p—1), так что 1/р + 1/<7= 1.
Сначала заметим, что гиперплоскость, касающаяся поверхно-
поверхности 2ljcvr" = l B точке #v = av» имеет вид ^yvxv = \, где
yv = ]av\P~1sgnav (символ sgnu обозначает здесь знак действи-
действительного числа и, т. е. ±1 или 0). Ввиду непрерывности это
свойство нужно проверить только в том случае, когда все av от-
отличны от нуля, а для этого в свою очередь достаточно заметить,
что при ифО функция |u|^ = (u2)p/2 имеет производную
^ (ы»)(р/«- 12и = р | и \р~1 sgn и.
Далее, множество (^| А>|рI/Р^ь 1 выпукло, а потому его опорные
гиперплоскости будут касательными в граничных точках. Таким
образом, значение функции
H() для /
172 Гл- 'У- Глобальные гамильтонианы, выпуклость, неравенства
где f(x) = Bi\xv\PI/p, равно 1, если yv имеет вид lavl^'
и av удовлетворяют условию 2lGv|p = l; кроме того, верхняя
грань в этой формуле достигается при xv=av. Другими слова-
словами, если yv — lavl^'sgnav. TP H(y) = l при условии, что
2|0у|р=1, т-е- чт0 2l#vle = *- Так как Н(у) очевидным обра-
образом положительно однородна и так как на каждом луче найдется
точка у указанного выше вида, то Н является калибровочной
функцией множества точек у, для которых У|^|?^1; отсюда
2\"
y 2i\y\)
Таким образом, неравенство D4.4) (с) принимает в нашем
случае вид
D7.3)
Это неравенство называют неравенством Гёльдера (теорема 13-
из книги Харди, Литтльвуда и Полна, стр. 39). Случаи равенств
и предельные случаи р=\, q — oo и р = оо, q—\ можно изучить
аналогичным способом.
Мы не будем рассматривать соответствующие частные случаи
неравенства Юнга, так как они частично охватываются приме-
примером C) из § 45.
§ 48
Дуальный единичным шар в функциональном пространстве
В дальнейшем нам понадобятся некоторые свойства одного
специального векторного пространства и дуального к нему про-
пространства. Эти свойства аналогичны очевидным свойствам евкли-
евклидова пространства, за исключением того, что в этом случае
отношение, связывающее выпуклую фигуру (единичный шар)
с ее дуальной, может не быть взаимным. Пространство, о кото-
котором идет речь, было первым изученным функциональным
пространством; в вариационном исчислении оно возникает самым
естественным образом. Это пространство #0(Л), элементами кото-
которого являются непрерывные действительные функции f(x), опре-
определенные в фиксированном ограниченном замкнутом подмно-
подмножестве А евклидова пространства. (Если мы хотим избавиться
от всякой евклидовости, то можно предположить, что А является
бикомпактным подмножеством полного метрического простран-
пространства; см. ниже замечание после теоремы D8.1). Однако пока
наша терминология подразумевает, что пространство евклидово.)
Наши элементы / образуют векторное пространство, так как
любая составленная из них линейная комбинация с постоянными
коэффициентами является элементом того же пространства. Нор-
Норму |/| вектора / в этом пространстве мы определяем как мак-
§ 48. Дуальный единичный шар
симум абсолютной величины |/(л:)| для х£ А. Эта норма, согласно
§ 44, является калибровочной функцией,, так как для постоянного
действительного числа t и любых элементов /, Д, /2 из #0 (Л) мы
имеем
Соответствующее выпуклое множество задается условием
и называется единичным шаром U в пространстве #0(Л).
Учитывая симметрию |/| = | — /|, можно ввести метрику
в пространство <60(А), приняв за расстояние между двумя любыми
элементами flt f2 величину |/2—/,|. В любом метрическом про-
пространстве последовательность элементов fn (n = l, 2, ...) назы-
называют сходящейся в себе, если расстояние между элементами /n, fm
стремится к 0, когда пит стремятся к оо; она называется
сходящейся к элементу /, если расстояние между /„ и / стремится
к 0, когда п—*оо; пространство называется полным, если в нем
всякая сходящаяся в себе последовательность сходится. В про-
пространстве #0 (А) сходимость в себе последовательности /п равно-
равносильна равномерной сходимости последовательности tn(x) на
множестве А; в любом курсе математического анализа доказы-
доказывается существование непрерывной предельной функции / (х) для
такой последовательности. Значит, #„(/4) — полное метрическое
пространство с топологией равномерной сходимости и выполня-
выполняются соотношения вида
lim (alf1 + ajz) = (lim at) (lim /,) + (lim a2) (lim /2),
где элементы пространства и коэффициенты пробегают сходящиеся
последовательности.
Эта топология для пространства #0 (А) соответствует в вари-
вариационном исчислении введенной нами топологии широких окрест-
окрестностей, тогда как узкие окрестности соответствуют второй топо-
топологии (она нам тоже понадобится), которая определена только
для множества непрерывно дифференцируемых элементов из #0 (Л).
Кроме того, так как множество А не предполагалось открытым,
то непрерывная дифференцируемость относится не к самим
элементам f £ <ё0 (Л), а к их продолжениям на открытые мно-
множества. Здесь для удобства мы будем рассматривать только
продолжения }(х) на такие открытые множества, которые содер-
содержат выпуклую оболочку Л множества Л. Обозначим через ^(Л)
класс функций / £ #0 (Л), обладающих таким непрерывно диффе-
дифференцируемым продолжением, а через 53 обозначим его счетный
подкласс, состоящий из многочленов с рациональными коэффи-
коэффициентами. Любая непрерывная функция, определенная в Л, яв-
является равномерным пределом многочленов (теорема Вейерштрас-
са, доказательство которой можно найти в большинстве книг
J74 Гл. IV. Глобальные гамильтонианы, выпуклость, неравенства
по математическому анализу), а стало быть, и многочленов из
Таким образом, имеет место следующая теорема:
D8.1) Теорема. Множество !Р с: ^(Л) плотно в #„(.D).
В %i(A) определим новую норму |/|' («штрих-норма») следу-
следующим образом: |/|' равна наименьшему из действительных чисел
k^O, таких, что для некоторого непрерывно дифференцируемого
продолжения /функции /на открытое множество, содержащее А,
для всех х£А, с одной стороны, выполняется неравенство
|f(x)|<:fc, а с другой — неравенство \Df{x)\^Lk, где Df—гра-
Df—градиент функции /. Множество элементов / £#, (А), для которых
|/|'<11, назовем «штрих-единичным» шаром и обозначим W,
Множество Е полного метрического пространства называется
секвенциально компактным, если каждая последовательность его
элементов содержит сходящуюся подпоследовательность. Если
к тому же Е замкнуто, то в честь Бурбаки мы будем называть
его Б.. .и-компактом, или просто бикомпактом, как это и было
прежде, так что все будут довольны, словно при игре «музы-
«музыкальные стулья»1'. (Когда А — Б...и-компакт, пространство <ё1 (А)
заменяется классом функций /, удовлетворяющих условию
\f(xi)—/(xi)I^Kf"IX2—xi\ Для некоторого К/ и всех пар хх,
х2 из А. Штрих-норма в этом случае равна max{|/|, min/C/f,
где min/C/ равен наименьшему из чисел К/, для которых спра-
справедливо приведенное выше условие. Счетное всюду плотное
подмножество 5* можно в этом случае составить из рациональных
линейных комбинаций функций вида ц>аъ{\х—с\), где а, Ъ—ра-
Ъ—рациональные числа, удовлетворяющие условию 0 < а < Ь, а с
пробегает счетное плотное в А подмножество; при этом функция
Ф«ь(л) определена при л^О, линейна при а<1л<1Ь и принимает
постоянные значения 1 при г^аиО при гZ^b.) Известно, что
в евклидовом пространстве класс секвенциально компактных
множеств совпадает с классом ограниченных множеств (принцип
Больцано—Вейерштрасса).
Один из наиболее ранних результатов, относящихся к i?0(/4)
(и, как мы увидим в следующей главе, один из первых резуль-
результатов, который можно применить в вариационном исчислении),
1( В одном из вариантов этой игры дамы сидят на коленях кавалеров, но при
первых же звуках музыки встают и кружатся. Когда музыка прекращается, они
часто ухитряются усесться на те же колени.
[Более молодому поколению математиков, вероятно, нелишне будет напом-
напомнить, что термин «бикомпакт», как и само это понятие, введены в двадцатых го-
годах П. С. Александровым и П. С. Урысоном. Затем, в значительной степени
под влиянием Бурбаки, этот термин был вытеснен термином «компакт». Пре-
Предлагая свое нововведение, Л. Я иг, кажется, рассчитывает примирить всех. Но
ведь в метрических пространствах (а другие случаи в книге не рассматрива-
рассматриваются) понятия бикомпакта и компакта совпадают...— Прим. ред.\
§ 48. Дуальный единичный шар 175
характеризует секвенциально компактные множества в этом
пространстве. Чтобы его сформулировать, введем следующее
определение: множество функций f(x), где х£А, называется
равностепенно непрерывным, если для любого е > 0 существует
такое 6>0 (не зависящее от /), что для каждой функции /
из этого множества и каждой пары точек хх, хг из А, расстоя-
расстояние между которыми меньше б, имеем |/(х2)—/ (jcx) ] < е.
D8.2) Теорема о секвенциальной компактности. Множество
Е с: #0 (А) секвенциально компактно тогда и только тогда, когда
оно равностепенно непрерывно и равномерно ограничено.
Так как функции f£U' равномерно ограничены и, согласно
теореме о среднем, равностепенно непрерывны, то из теоремы D8.2)
вытекает
D8.3) Следствие. Штрих-единичный шар V секвенциально
компактен.
Доказательство теоремы D8.2). Докажем сначала необходи-
необходимость. Для этого предположим, что Е—секвенциально компакт-
компактное множество и что оно либо не является равномерно огра-
ограниченным, либо не является равностепенно непрерывным. Тогда
в множестве Е существует последовательность элементов fn, a
в множестве А—соответствующая последовательность либо пар
точек х1п, хгп, либо просто точек хп, таких, что
либо |/„ (х„) | > п + 2, либо | /„ (x2n)—fn (xIn) | > Зе,
где е>0 фиксировано, тогда как |х2„—xln|<l/n. В каждом
из этих случаев, переходя, если нужно, к подпоследовательности,
мы можем предположить, что последовательность fn равномерно
сходится к непрерывной функции / и что для больших п погреш-
погрешность при замене /„ на / будет не больше единицы, соответственно
не больше е. Значит, либо \f(xn)\> п, либо |/(х2п)—f(xln)\>s
для всех больших п, а это противоречит непрерывности функции f.
Осталось доказать достаточность. Для этого обозначим через
\АП) такую расширяющуюся последовательность конечных под-
подмножеств из Л, что каждая точка х£А удалена от некоторой
точки из Ап на расстояние, меньшее \/п. Далее, обозначим
через Ао объединение множеств Ап. Очевидно, что Ао—счетное
множество; обозначим его точки через а1г а2
Распорядившись таким образом, предположим, что множество
Е состоит из равномерно ограниченных и равностепенно непре-
непрерывных функций, и обозначим через {/„} любую последователь-
последовательность элементов из Е. Нам нужно показать, что последователь-
последовательность {/„} содержит равномерно сходящуюся подпоследователь-
подпоследовательность. Для этого сначала покажем, что последовательность {/„(*)}
Гл. IV. Глобальные гамильтонианы, выпуклость, неравенства
содержит подпоследовательность, которая сходится в каждой
точке х £ Ло. Этого можно достичь, используя так называемый
«диагональный процесс».
Так как числа {fn(a^\ равномерно ограничены, то последо-
последовательность {/„(*)} содержит подпоследовательность {fni{x)\,
которая сходится при х = а,. Аналогично, из этой подпоследо-
подпоследовательности можно извлечь вторую подпоследовательность
\fn2(x)\, которая сходится и при х = а2. Вообще, из (г—1)-й
последовательности можно выбрать r-ю последовательность
функций от х, которая сходится как при х = аг, так и во всех
предыдущих точках аи а2, ..., аг_х. Диагональная последо-
последовательность
Ф„ = /пп (л = 1, 2, ...),'
за исключением первых своих г—1 членов, будет подпоследо-
подпоследовательностью нашей г-н последовательности, и, следовательно,
она сходится при х = аг для каждого г. Значит, последователь-
последовательность {ф„(*)} сходится в каждой точке множества Ао.
Покажем, что подпоследовательность {ф„(*И из {/„(*)} равно-
равномерно сходится в А. Для этого возьмем любое е> 0 и выберем
б > 0, соответствующее этому е по определению равностепенной
непрерывности множества Е. Пусть k—такое целое число, что
б > IJk; обозначим через В конечное множество Ak. Тогда для
каждой точки х £ А можно найти точку b£B, такую, что
\х—6|<б. Далее, так как последовательность {ф„(х)} сходится
в В и множество В конечно, то можно так выбрать число п0,
что | Ф„(Ь)—утф) | < е Для каждого b £ В, когда п > па, т > п0.
Однако ввиду равностепенной непрерывности разность значений
функций фп(х) или фя(х) при замене точки к соответствующей
точкой из В будет меньше е. Следовательно, для каждой точки
А
когда п > п0, т > п0, т. е. последовательность {ф„} сходится
равномерно. Таким образом, теорема D8.2) доказана.
Вещественные линейные функции g(f), где /£ %0(А), являются
элементами g дуального пространства. Вместо g(f) мы будем писать
gf и будем рассматривать gf как скалярное произведение вектора f
на дуальный вектор (или ковектор) g. (Это скалярное произведение
не следует путать с операцией умножения двух функций.) Мы
ограничимся рассмотрением класса дуальных векторов g, для
которых gf ограничено при f£U. Обозначим этот класс через
Ч£% (Л) и назовем его правильно дуальным пространством про-
пространства #0(Л). Дуальные элементы, не принадлежащие этому
§ 48. Дуальный единичный шар /77
классу, будут довольно «нецивилизованными» и не понадобятся
нам здесь11.
Для элемента g из правильно дуального пространства нормой
по определению будет величина |g|—supg/ для f£U. Согласно
§ 44, эта норма будет калибровочной функцией множества |g|<l I,
которое мы назовем дуальным единичным шаром и обозначим
через U*. Введем также понятие штрих-нормы |g|'=supg/
для f£U'. Множество W меньше, чем множество U, поэтому
\§\'^1^1- В частности, в классе 1(А) штрих-норма конечна.
Следовательно, в правильно дуальном пространстве мы имеем
на выбор две метрики, соответствующие их нормам \g\ и \g\'.
Впрочем, это только мешает, ибо мы не выберем ни одну из них.
В самом деле, понятие предела в %l(A) принято определять
иначе; соответствующую сходимость называют слабой * сходи-
сходимостью.
D8.4) Определение. Пусть g и gn (л = 1, 2, ...)—элементы
из %t(A). Тогда £ = Пт£п, если для каждого /6#О(Л) мы имеем
f \\j
Положительным конусом пространства #0(Л) назовем мно-
множество неотрицательных непрерывных функций, определенных
в Л, а положительным конусом пространства #*(Л) назовем
множество функций #€#£(Л), для которых gf^O, когда / при-
принадлежит положительному конусу пространства #0(Л). Далее,
множество элементов g(z%i(A) назовем ограниченным, если
множество норм \g\ этих элементов ограничено. В следую-
следующих главах нам придется рассматривать только такие ковек-
торы g, которые принадлежат либо фиксированному ограничен-
ограниченному множеству, либо положительному конусу; при этом мы
будем пользоваться понятием сходимости, определенным в D8.4).
На первый взгляд кажется, что это повлечет за собой
неприятные осложнения. Любой студент, изучающий теорию
функций действительного переменного или теоретико-множест-
теоретико-множественную топологию, уверен в том, что с понятием сходимости, ос-
основанным на метрике, легко работать, в то время как определение
вида D8.4) приводит к таким сложным процедурам, как транс-
трансфинитное замыкание, трансфинитные повторные пределы и вся
классификация Бэра.
Таким образом, весьма примечателен тот факт, что для по-
последовательности {gn\, принадлежащей либо ограниченному
множеству, либо положительному конусу из нашего правильно
дуального пространства, сходимость в смысле определения D8.4),
т. е. слабая * сходимость, совпадает со сходимостью по штрих-
11 Автор использует здесь термины dual of ^g(i4) и dutiful dugl
Of %o(A)-— Прим. ред.
/75 Гл. IV. Глобальные гамильтонианы, выпуклость, неравенства
метрике в ЧёЦА). Это следует из леммы о метризации для
дуального единичного шара U*, которую мы докажем ниже. (Еще
более примечателен тот факт, хотя мы и не будем доказывать
его здесь, что соответствующая лемма о метризации, а также
аналоги или обобщения других свойств шара U*, которые мы
установим ниже, остаются справедливыми для единичных шаров
в пространствах, дуальных к пространствам из гораздо более
общего класса нормированных векторных пространств, называе-
называемых банаховыми пространствами.)
D8.5) Лемма о метризации для U*. Пусть gn € 11* для
п—\, 2 Тогда каждое из соотношений (i) limgn = 0,
(ii) lim|gn|' = 0, (iii) HmgJ = 0 для каждого f^P эквивалентно
двум другим.
Доказательство. Очевидно, что из (i) следует (iii). Далее, из
(ii) следует, что gJ—*0 для каждого f£U', а значит, и соот-
соотношение (iii), поскольку можно взять q> = ±f€U' так, чтобы
\gj\ = ^пФ^|^пГ> а каждый член $> равен с точностью до по-
постоянного множителя некоторому f£U'. Значит, осталось дока-
доказать, что из (iii) следует (i) и что из (i) следует (ii).
Предположим, что соотношение (iii) выполняется. Согласно
теореме D8.1), для заданного /£#0(Л) и каждого е>0 можно
найти такой элемент /е g 5\ что | /—/Е| < е. Обозначая /—/е =
и выбирая знак надлежащим образом, находим отсюда, что
Так как gje—>-0 при п—»-оо ввиду (iii), то \gj\ < 2e для боль-
больших п и, следовательно, gj—>-0. Поскольку это соотношение
выполняется для каждого /€#0(Л), соотношение (i) имеет место.
Наконец, предположим, что соотношение (ii) не выполняется.
Тогда для некоторого фиксированного е > 0 и бесконечного
множества индексов п существуют такие fn£U', что gjn>2e.
Согласно D8.3), из этих fn можно выбрать сходящуюся подпо-
подпоследовательность с пределом f^'eo(A). Для этой подпоследова-
подпоследовательности при больших п имеем
и, следовательно, gj>gjn—z>£- Отсюда видно, что gj
не стремится к 0; значит, соотношение (i) не выполняется, если
не выполняется (ii), т. е. из (i) следует (ii). Таким образом,
теорема полностью доказана.
D8.6) Теорема. Пусть Е*—либо положительный конус, либо
ограниченное множество в t>o(A), и пусть g и gn (n = l, 2, ...)
принадлежат Е*. Тогда соотношения \\mgn = g и \im\gn—g\' = Q
эквивалентны.
§ 48. Дузльный единичный шар /79
В дальнейшем будет показано, что вместо g£E* достаточно
предположить только, что g€%o(A).
При доказательстве теоремы D8.6) мы используем следующее
замечание:
D8.7) Замечание. Для элемента g, принадлежащего положи-
положительному конусу в ^о(^). норма \g\ = gflt где /, (х) = 1 в А.
Действительно, с одной стороны, очевидно, что \g\^gflt
а с другой стороны, g/x—\g\ равно нижней грани выражения
g-(fi—/) для f£U. Но g(f1—/)^0, так как /г—/ принадлежит
положительному конусу в Л)
Доказательство теоремы D8.6). Если Е*—положительный ко-
конус в "&1 (А), то ввиду D8.7) каждое из двух соотношений
[imgn = g и Hm|gn—g\' = 0 влечет за собой сходимость, а потому
и ограниченность последовательности норм \gn\ = gJi. Тем самым
можно ограничиться рассмотрением случая, когда £*—ограни-
£*—ограниченное множество в %% (А). В этом же случае можно, не нару-
нарушая общности, считать, что g = 0, и изменив, если нужно, мас-
масштаб, положить E* = U*\ тем самым теорема D8.6) сводится
к теореме D8.5).
D8.8) Теорема. В штрих-метрике U*является Б...и-компактом,
причем сходимость по этой метрике эквивалентна в U* сходи-
сходимости в смысле D8.4).
Доказательство. Пусть gn£U* при /г = 1, 2 Используя
диагональный процесс, описанный при доказательстве теоремы
D8.2), можно выбрать такую подпоследовательность индексов п,
для которой числа gj стремятся к пределу /(/) для каждого f,
принадлежащего счетному множеству 53 из теоремы D8.1), а сле-
следовательно, и для f из линейной оболочки F множества 5У.
Далее, так как |£„/|^|/|, то *(/)^1Л Аля все* /€^- Согласно
теореме Хана—Банаха, существует g£U*, т. е. дуальный вектор,
удовлетворяющий условию gf^\f\, такой, что g/ = /(/) для
всех f£F.
Значит, если дана любая последовательность \gn\czll*, то
существуют подпоследовательность {gm\, где т пробегает подпо-
подпоследовательность целых чисел п, и элемент g£U*, такие, что
Hmgmf = gf для каждого f^S*. Если теперь лемму D8.5) о мет-
метризации U* применить к функциям 1/2{gm—g), то окажется, что
подпоследовательность \gm\ имеет предел в смысле D8.4), а также
и предел в штрих-метрике, равный g. В частности, если {gn\ —
последовательность, сходящаяся в себе относительно штрих-мет-
штрих-метрики, то для любого заданного е > 0 при всех больших п вы-
выполняется неравенство
180 Гл. IV. Глобальные гамильтонианы, выпуклость, неравенства
если только т взято из подпоследовательности соответствующим
образом. Значит, \gn\ сходится в штрих-метрике, и поэтому
U*—полное множество. Поскольку, кроме того, мы уже дока-
доказали, что U* секвенциально компактно, это завершает доказа-
доказательство.
Из Б...и-компактности шара U* следует, что можно слегка
ослабить условие теоремы D8.6), как это и утверждалось в за-
замечании, сопровождающем эту теорему.
§ 49
Риссопекое представление
Результаты предыдущего параграфа можно применить, в частности, когда
А — конечное множество, состоящее, скажем, из точек 1,2,..., и действительной
прямой. В этом случае пространство ^0 (Л) превращается в n-мерное евклидово,
пространство, причем компонентами вектора /£$о (Л) будут п зиачений функции
f(x) (х=1,2 п). Если ввести п единичных векторов flt f2, ..., fn< каждый из
которых имеет одну компоненту, равную единице, а все остальные, равные нулю,
то легко видеть, что линейная функция g задается набором из п действительных
чисел gf,, gft, ...tgfn, которые можно рассматривать как ее компоненты fclt b2,...
....Ь„; произведение gf равно тогда сумме
b1f0)+b3fB)+...+bnf(n).
В этом параграфе мы хотим найти аналогичное представлеиие произведеиия
gf, когда А — любое ограниченное замкнутое множество в евклидовом прост-
пространстве, a g£i?o(/4). Вместо конечной суммы мы получим интеграл от функции
f(x), взятый по обобщенной *' мерец, играющей роль системы коэффициентов fct,
b2 Ьп. Это и есть риссовское представление; его возможность мы докажем
ниже.
Согласно этой теореме Рисса, существует асимметрия между пространством
1ё0 (А) и его правильно дуальным. Элементы первого— непрерывные функции, а
элементы второго задаются обобщенными мерамиц. На самом деле такая асиммет-
асимметрия возникает и в рассмотренном выше конечномерном случае, если принять во
внимание нормы двух соответствующих пространств. А именно, норма |fl=|fl'
равна наибольшему из п чисел |/(х)|, а норма |g|=lg|' равна сумме п чисел \ЬХ\.
Однако топологии, индуцированные этими метриками, совпадают с обычной
евклидовой топологией.
Чтобы придать риссовскому представлению дуального вектора g£1et(A)
наиболее элементарную форму, мы воспользуемся не понятием обобщенной меры,
а более простым понятием аддитивной функции интервала с носителем в А и с
ограниченной вариацией. В нашем случае эти понятия эквивалентны (переход
от функции интервала к обобщенной мере с тем же носителем легко осуществить
при помощи стандартных приемов теории иитегрироваиия, приведенных, напри-
например, в гл. III книги С. Сакса «Теория интеграла»).
Линейная оболочка множества А будет евклидовым простран-
пространством; в этом пространстве обозначим через До фиксированный
интервал, для которого все точки из А внутренние, а через Д
обозначим переменный интервал, содержащийся в Ао (подразу-
2) В оригинале signed. Имеется в виду, что мера множества ие обязана быть
неотрицательной. Употребляется также термин «заряд». — Прим. ред.
§ 49. Риссовское представление 181
мевается, что все интервалы замкнуты, если не оговорено про-
противное). Обозначим через у вещественную функцию интервала А,
а через Ду значение у (А). Назовем у функцией интервала. Будем
говорить, что функция у имеет носитель в А, если Ay = 0, когда
А не содержит ни одной точки из А. Функцию у назовем адди-
аддитивной, если
когда интервал А разбит на два неперекрывающихся интервала
А]. А2-
Аддитивную функцию интервала у с носителем в А назовем
функцией с ограниченной вариацией, если существует такая
постоянная К, что для каждой конечной системы неперекры-
неперекрывающихся интервалов АсДи имеем 21 Ду|^^- Нижнюю грань
множества таких постоянных К назовем полной вариацией функ-
функции у на множестве А и обозначим
D9.1)
Под разбиением а интервала А будем понимать представле-
представление этого интервала в виде объединения конечного числа N
непересекающихся подинтервалов; через |о| обозначим наиболь-
наибольший из диаметров пересечений множества А с этими подинтер-
валами; разбиение назовем простым, если N— 2. Произведением
аа, двух разбиений о, ot одного и того же интервала А назы-
называется разбиение интервала А на подинтервалы, являющиеся
пересечениями интервалов из о с интервалами из о,. Аналогично
определяется произведение любого конечного числа разбиений
интервала Д. Разбиение, которое можно представить в виде про-
произведения простых разбиений, назовем регулярным. Разбиение о
назовем измельчением разбиения oL того же интервала, если о
совпадает с аа1. Очевидно, что каждое разбиение обладает ре-
регулярным измельчением.
Если y—аддитивная функция интервала, а о — регулярное
разбиение интервала А на подинтервалы Afc (k= I, 2, ..., N),
то по индукции получаем, что Ду = 2]Д*Т- Мы предоставляем
читателю проверить, что, используя сказанное выше, можно
обобщить это соотношение до следующего общего свойства адди-
аддитивности: если у—аддитивная функция интервала и одно и то же
подмножество из Ао можно представить двумя способами в виде
конечного объединения неперекрывающихся интервалов А, то два
значения суммы 2^V равны. (При желании читатель может
принять это свойство за определение аддитивности.)
Пусть, кроме аддитивной функции интервала у с носителем
в Л и ограниченной вариацией, задана также непрерывная
182 Гл. IV. Глобальные гамильтонианы, выпуклость, неравенства
функция f(x) в А. Определим интеграл Стильтьеса
D9.2) /
Для этого предположим, что о—разбиение интервала Ао,
и пусть
— такие подинтервалы разбиения о, каждый из которых со-
содержит по крайней мере одну точку из Л, а
— точки из А, принадлежащие соответственно этим подинтерва-
подинтервалам. Интеграл Стильтьеса / равен пределу суммы
D9.3) 2
когда | о | —*- 0, т. е. /—интеграл Стильтьеса, если для любого
е > 0 существует такое б > 0, что при | а | < б мы имеем \I—S\ < е
(здесь мы выбираем разбиение а, удовлетворяющее условию
|о|<б, и точки £ft в подынтервалах этого разбиения).
D9.4) Теорема Стильтьеса. (i) Интеграл Стильтьеса D9.2)
существует. (И) Для /6#0(Л) он является линейной функцией gf,
где g£%*0{A) и \g\ не превосходит полной вариации D9.1).
Доказательство. Мы докажем только утверждение (i), так как
утверждение (ii) проверяется непосредственно. Достаточно дока-
доказать, что для любых двух сумм Slt S2 вида D9.3), которые
соответствуют разбиениям olt
а2, удовлетворяющим условию
| а, | -f-1 а21 < 6, выполняется не-
неравенство
Для этого положим 0 = 0^2, а
■ через Ak (k =--1, ..., N) обозна-
обозначим подинтервалы разбиения о, которые содержат точки из А.
Каждый такой подинтервал ДА лежит в некоторой паре подин-
тервалов разбиений о\ и о2; обозначим через Ц, £| соответст-
соответствующие точки I, участвующие в выражениях для сумм Slt S2,
аналогичных D9.3). В силу общего свойства аддитивности функ-
функции у и того, что Ду^О, если Д не содержит ни одной точки
из А,
N
§ 49. Риссовское представление 183
Так как Ц|—ii | ^ | ох | +1 cr21 < б и можно выбрать такое
б > 0, что | / (Ц)-/ (й) | < е, когда | Ц-U |< б, то | S,-Sl | < е*.
где К—любая постоянная, не меньшая-чем D9.1). Тем самым
теорема доказана.
Теперь мы подошли к нашей главной теореме, которая об-
ратна теореме D9.4).
D9.5) Теорема о риссовском представлении. Пусть
Тогда существует такая аддитивная функция интервала у с но-
носителем в А, что
(jj) gf = J f (x)dy для каждого / € tf 0(A).
Доказательство. Начнем с того, что погрузим пространство
4ро(Л) в более широкое векторное пространство Ф. Элементом
ф£Ф будет система конечного числа непрерывных функций <pft
(k— I, 2, ..., N), в которой каждая функция cpft определена
в пересечении множества А с соответствующим интервалом Дй,
где hk (k—\, 2 N)—неперекрывающиеся интервалы, обра-
образующие вместе с конечным числом интервалов, не содержащих
ни одной точки из А, разбиение а интервала До. Будем считать,
что такой элемент ф не изменится, если любой интервал Дл за-
заменить его разбиением, а функцию ц>к заменить системой огра-
ограничений этой функции на интервалы разбиения. Тем самым
любые два элемента из Ф всегда можно рассматривать как две
системы непрерывных функций, определенных на одной и той же
системе пересечений множества А с интервалами Дл. Это дает
возможность определить естественным образом сумму двух эле-
элементов из Ф, которая также будет элементом из Ф. Очевидно
также, что элемент из Ф можно умножить на действительное
число. Значит, Ф—векторное пространство. Нормой |ф| в этом
пространстве будет наибольшая из норм |фй| в "ёо(Аг\ Ак). Оче-
Очевидно, что эта норма—выпуклая и однородная функция. Оче-
Очевидно также, что #0(Л)—векторное подпространство простран-
пространства Ф, а норма [ф| равна норме |/|, когда ф сводится к эле-
элементу /€»„И).
Пусть теперь g€#oH)> |g| = /C и Q (у) = К-\ц>\. Согласно
теореме Хана —Банаха, линейную функцию l(f)=gf, определен-
определенную в #0(Л) и удовлетворяющую условию l{f)^LQ(f), можно
продолжить до линейной функции 1(ц>), определенной в Ф и
удовлетворяющей условию | / (ф) | <I Q (q>). Обозначим через Д
элемент из Ф, который состоит из функции, тождественно равной
единице в АГ\А, и конечного числа нулевых функций в пересе-
пересечениях множества А со всеми другими интервалами. Функцию
J84 Гл. IV. Глобальные, гамильтонианы, выпуклость, неравенства
интервала у определим, полагая Ду = /(Д). Очевидно, что у— ад-
аддитивная функция с носителем в А. Далее, если Дй—неперекры-
Дй—неперекрывающиеся интервалы, то элемент ф, полученный из них посред-
посредством линейной комбинации соответствующих элементов из Ф
с коэффициентами ± I, имеет норму, равную 1 (или 0), и знаки
можно выбрать так, чтобы / (ф) = 2]1 Д*?1- Так как /(ф)<
«g; Q (ср) =/f, то отсюда следует, что
D9.6) $
D
Если /—любой фиксированный элемент из %0(А), а а — раз-
разбиение, для которого \а\ меньше некоторого положительного
числа б, то разность между gf и суммой 5 в D9.3) можно за-
записать как /(ф), где ф—элемент из Ф, заданный равенством
выбирая подходящее 6, получаем |<р|<е. Значит,
а потому gf — интеграл Стильтьеса D9.2). Таким образом, утверж-
утверждение (ii) доказано, а утверждение (i) можно получить, объеди-
объединяя неравенство D9.6) с противоположным неравенством, которое
выводится из последней части теоремы D9.4).
D9.7) Следствие. Пусть с—пространство, элементами f ко-
которого являются сходящиеся последовательности действительных
чисел {cv}, v = l, 2, .... а норма равна |/| = sup|cv|. Тогда
V
любой элемент g из правильно дуального пространства с* за-
задается набором действительных чисел С, Cv (v = 1, 2, ...), для
которых |g| |C| 2|C|
2
V
для каждого f — \cv\ (v=l, 2, ...) в с.
Для того чтобы убедиться в этом, достаточно отождествить
пространство с с пространством #0(Л), обозначив через А под-
подмножество действительной оси, образованное нулем и точками
I/v (v = l, 2, ...), и положив cv=f(l/v), liracv =/@). Дейст-
Действительные числа С, Cv будут тогда весами, которые мера у на
множестве А сопоставляет нулю и точкам 1/v (v = l, 2, ...).
Замечание. Если Л—любой Б...и-компакт, а не просто множе-
множество в евклидовом пространстве, то, согласно Бурбаки, мера у на
множестве Л—это элемент §€#оИ), а интеграл \fdy отожде-
отождествляется с gf по определению. Теорема D9.5) утверждает, что
в евклидовом пространстве это определение согласуется с более
старым определением.
Глава V
Теоремы существования
и их следствия
§ 50
Введение
Мы уже не раз подчеркивали, что нет смысла говорить о необходимых усло-
условиях, пока не решен вопрос о существовании решения. Поэтому мы избегали рас-
рассуждений, ведущих лишь к необходимым условиям, и изучали вместо этого доста-
достаточные условия. Именно на этом пути мы пришли к методу геодезических покры-
покрытий, который помог нам доказать теорему существования в малом, а также
построить более общую георню, связанную с понятием сопряженных точек. Од-
Однако это еще не есть настоящая теория существования «в целом», которая как
раз и нужна для решения практических задач; к тому же по ходу дела от функ-
функций приходилось требовать такой гладкости, которую мы не в состоянии обес-
обеспечить в задачах оптимального управления.
В связи с этим настало время испытать другой подход, иными словами,
вплотную заняться вопросами существования. А уже после этого мы сможем за-
заняться не только необходимыми условиями, но н такими вопросами, как един-
единственность.
Итак, проблема существования (если только нам удастся подобрать ключи к ее
решению) оказывается весьма важной, хотим мы того или иет. Это обстоятельство,
возможно, придется по душе тем, кто имеет склонность к логике, однако другие
воспримут его совсем иначе. Многие убеждены, что подобного рода отвлеченные
материи не должны играть основной роли в такой сугубо практической дисцип-
дисциплине, как вариационное исчисление, и то же относится к оптимальному управле-
управлению, а если на то пошло, то и ко всей математике вообще. Эти люди не придают
факту своего собственного существования той первостепенной важности, которую
придавал ему Декарт, с гордостью провозглашавший: «Я мыслю, значит, я су-
существую». Разве существованием хвастаются? Одна домохозяйка объясняла свой
переезд из Чикаго в Айдахо тем, что «в Чикаго не живут, а только существуют».
Необходимость бороться за существование рассматривается как признак бед-
бедности!
От подобного взгляда иа существование нельзя просто отмахнуться. Необ-
Необходимость может заставить нас заняться проблемой существования, однако после
того, как все, что нужно, сказано и сделано, существование означает просто при-
принадлежность к некоторому непустому множеству — не больше и не меньше. Это не
то чтобы совсем ненужная вещь; просто это первый шаг, необходимая формальность,
вроде получения паспорта. И право, ни к чему становиться в позу, если кому-то
приходит в голову мысль, что эти вопросы ие должны играть в математике перво-
первостепенной роли. В самом деле, как бы нам понравилось путешествие за границу,
если бы мы провели время ие в большом турне по таким местам, как Лувр, Сик-
Сикстинская капелла, Виндзорский замок, Тадж Махал, а главным образом в очереди
за получением заграничного паспорта?!
Так что, пожалуй, не следует считать непрактичным того, кто позволяет себе
размышлять не столько над теоремами существования, сколько над тем, какой
должна быть математика. Кое-кто, возможно, сочтет подобные мысли проявлением
нездорового желания пофилософствовать даже тогда, когда это совсем ни к чему.
Однако за этим кроется нечто большее. Действительно, излишнее мудрствование
всегда таит в себе опасность, и в вариационном исчислении оно было источником
большинства ошибок. Как правило, при этом затушевывалось различие между
Гл. V. Теоремы существования и их следствия
представлением о том, какой должна быть математика, н тем, какой она является
иа самом деле. Самое серьезное заблуждение здесь — считать, будто математика
создана совершенной и мы уже не имеем права ничего в ней менять. Как раз
наоборот, размышления о том, какой должна быть математика, и попытки соответ-
соответствующим образом видоизменить ее не содержат в себе ничего предосудительного
и могут оказаться весьма плодотворными. В астрономии подобные размышления
привели к отказу от неуклюжей догмы, будто Земля — плоский диск, покоящийся
на шестнадцати слонах, так почему же в математике такие размышления ие могут
привести к успеху?
Было бы прекрасно, если бы нам удалось так построить всю математику,
чтобы существование стало в ней столь же естественным и очевидным фактом, как
и в окружающем нас мире. Весь вопрос в том, возможно ли осуществить такое
построение математики и, в частности, вариационного исчисления.
Как только наш вопрос о существовании будет поставлен в таком сугубо
практическом аспекте (за что инженер проголосует обеими руками), ответ на него
станет до смешного простым. Он содержится в знаменитом высказывании Гиль-
Гильберта: «Всякая задача вариационного исчисления имеет решение, если только
слову «решение» придать соответствующий смысл».
Разумеется, здравый смысл и не мог подсказать ничего другого!" Ведь концеп-
концептуальные методы порождены практикой и неотделимы от нее.
Работы Гильберта — яркая демонстрация триумфа концептуальных методов.
Пусть другие пишут необъятные статьи, в которых почти невозможно разобраться
(хотя порой в них содержатся замечательные результаты); не таков был стиль
Гильберта. Даже фразы у него были короткими, что весьма нетипично для не-
немецкого языка. Техническая сторона его доказательств была столь безупречной,
что его работы меньше всего походят на первые изыскания в совершенно новой
области (каковыми они были на самом деле). Наоборот, создается впечатление,
будто в этих работах излагаются окончательные результаты давно устоявшихся
теорий, а само это изложение доведено до совершенства.
Сейчас, два поколения спустя, всем известны достижения математики в тех
направлениях, которые наметил Гильберт.
Однако поразительная ясность и мастерство гильбертовских работ в наше
время известны далеко не каждому." все это было, к сожалению, безвозвратно утра-
утрачено впоследствии в потоке псевдопростых словесных изощрений, в котором Гиль-
Гильберт едва ли узнал бы свои идеи. Как-то раз Гильберт даже задал вопрос: «А что
это такое — гильбертово пространство, о котором вы говорите?»
Каждый серьезный студеит-математик обязан прочитать хотя бы одну из
многочисленных книг, статей илн курсов лекций Гильберта. Кроме того, всегда
полезно видеть за сухнмн строчками статьи живой образ ее автора; поэтому сту-
студентам рекомендуется как можно больше узнать о личности самого Гильберта, тем
более что еще живы некоторые математики, знавшие его лично (среди иих автор
этих строк), а некоторым (например, Рихарду Куранту г)) довелось даже сотруд-
сотрудничать с ним.
Подход Гильберта к вопросам существования в вариационном исчислении
изложен в его нзвесгной работе «О принципе Дирихле». Вместо того чтобы разви-
развивать общую теорию, он иллюстрирует свои методы на конкретных примерах.
По этой причине его теоремы существования формулируют по-разному, причем
каждый автор приводит свой вариант. Например, можно применить методы Гнль-
берта не в евклидовом пространстве, а иа некотором гладком многообразии; одной
из наиболее интересных формулировок является общая «минимаксная» формули-
формулировка теоремы существования, принадлежащая Марстону Морсу. Мы не приводим
ее здесь, однако рассматриваем несколько других вариантов гильбертовских тео-
теорем существования и следствия из них.
*> Эта книга вышла в свет в 1969 г. К сожалению, теперь Р. Куранта уже
нет в живых...— Прим. ред.
§ 51. Гильбертова конструкция и некоторые ее следствия 1&7
В ряде следующих параграфов мы будем пользоваться конструкциями самого
Гильберта; они сопряжены с довольно ограничительными предположениями, ко-
которые на протяжении нескольких десятилетий считались существенными. Однако
идейная сторона гильбертовского подхода ясна из приведенной выше цитаты и не
связана с такими ограничениями. Смысл этого высказывания Гильберта сводится
к тому, что для теорем существования важны ие столько процедуры доказательств,
сколько тщательно продуманные определения. Это делает Гильберта родоначаль-
родоначальником метода, который сейчас широко используется во всем анализе и известен
под названием «метода слабых решений». В результате такого подхода возникла,
например, теория обобщенных функций (распределений) Шварца. Кроме того, это
высказывание Гильберта послужило толчком к возникновению ряда теорий, кото-
которые мы будем обсуждать в этой и последующих главах и которые имеют целью
освободить гнльбертовские построения от упомянутых ограничений. В частности,
эта фраза привела автора данной книги к понятию обобщенной кривой.
Просто не верится, что все это явилось результатом одного-единственного
высказывания! (Это вообще весьма характерно для творчества Гильберта; так,
понятие пространства Хаусдорфа впервые появилось в подстрочиом примечании
в одной из работ Гильберта, что лишний раз показывает, насколько неточной
стала наша современная терминология.) Однако именно эта общность упомяну-
упомянутого высказывания имела курьезные последствия: перепечатывая его в собрании
трудов Гильберта, издатели сочли нужным подправить его фразу, снабдив слово
«задача» эпитетом «регулярная». Можно подумать, что эта фраза, словно скульп-
скульптура, нуждалась в фиговом листке! Подобное «исправление» — образец безвку-
безвкусицы и трусости.
§ 51
Гильбертова конструкция и некоторые ее следствия для
стандартной параметрической задачи
Рассмотрим параметрическую задачу с положительно опреде-
определенным лагранжианом L. Задачу назовем вполне эллиптической,
если множество ее эллиптических точек совпадает со всем х-про-
странством. Будем говорить, что задача имеет «дешевые» экстре-
экстремали, если для заданного е > 0 существует пара точек xlt х2,
которые находятся друг от друга на расстоянии \хг—х2\> 1/е
и могут быть соединены такой экстремалью С, что Э (С) < е.
Положительно определенный лагранжиан и соответствующую ему
параметрическую задачу назовем положительно экстраопределен-
экстраопределенными, если такие «дешевые» экстремали отсутствуют, т. е. если
для некоторого е > 0 ни одна пара точек xlt x2 не обладает
указанным выше свойством.
Наличие «дешевых» экстремалей заметно отражается на задаче; мы проиллю-
проиллюстрируем это в одном из следующих параграфов. Сходное явление знакомо путеше-
путешественникам: при выборе маршрута между отдаленными городами заметное влияние
иа пассажира оказывает наличие скоростных и в то же время дешевых линий,
связывающих крупные центры.
Обозначим через дС упорядоченную пару концов (xlt x2) кри-
кривой С, а через Q—непустое ограниченное замкнутое множество
в пространстве упорядоченных пар различных точек (xlt x2). До-
Допустимую параметрическую кривую С назовем приемлемой кри-
J88 Гл. V. Теоремы существования и их следствия
вой, если дС£&. В этом параграфе мы будем рассматривать за-
задачу нахождения минимума функционала 3 (С) относительно
класса приемлемых кривых С, когда лагранжиан L вполне эллип-
эллиптический и положительно экстраопределенный; мы назовем ее
стандартной параметрической задачей. Если множество Q состоит
из одной упорядоченной пары, то мы имеем задачу с закреплен-
закрепленными концами. Через йС будем обозначать диаметр кривой С.
Допустимая кривая Со называется минимизирующей, если
3 (Со)—минимум для 3 (С) относительно допустимых кривых С,
для которых дС — дС0. Приемлемую кривую С назовем 0,-мини-
мизирующей, если 3 (Со)—минимум для 3 (С) относительно всех
приемлемых кривых С. Последовательность приемлемых кривых
Cv(v=l, 2,...) назовем О,-минимизирующей, если 3(Cv) стре-
стремится к нижней грани 3 (С) в классе всех приемлемых кривых'С
Последовательность допустимых кривых, для которых dCv —
фиксированная пара (xlt хг), назовем минимизирующей, если 3 (Cv)
стремится к нижней грани 3 (С) в классе всех допустимых-кри-
допустимых-кривых С с той же парой концов.
Приемлемую кривую С назовем Q-экстремалью, если она яв-
является экстремалью и удовлетворяет условиям трансверсально-
трансверсальности1'. Эти условия для непараметрического случая были рассмот-
рассмотрены в § 31 гл. III; в параметрическом случае (которым мы
сейчас занимаемся) они вполне аналогичны и мы приведем их
позднее в этом параграфе.
E1.1) Основная теорема Гильберта о существовании решений.
Стандартная параметрическая задача имеет решение.
E1.2) Необходимые условия, основанные на первой вариации.
Каждое решение стандартной параметрической задачи является
Q -экстремалью.
Под решением мы здесь подразумеваем Q-минимизируюшую
кривую. В дальнейшем, в соответствии с известным высказыва-
высказыванием Гильберта, мы расширим понятие решения, но это не по-
повлияет на приведенные выше теоремы. Заметим, что, кроме E1.2),
имеются и другие необходимые условия, не основанные на пер-
первой вариации. Автоматически выполняется условие Вейерштрасса,
так как все точки эллиптические. В следующей главе мы рас-
рассмотрим параметрическую форму условия Якоби, что соответст-
соответствует вопросам, изученным в гл. III; это подготовит нас к иссле-
исследованию единственности.
Основным понятием, на котором основывается теорема E1.1)
и ее следствия, будет понятие минимизирующей последователь-
последовательности, или, точнее, Q-минимизирующей последовательности. Та-
J) Определение трансверсальности будет дано в E1.6),
§ 51. Гильбертова конструкция и некоторые ее следствия JS9
кую последовательность назовем ограниченной, если все кривые Cv
лежат в фиксированном кубе. Нам понадобится следующая лемма:
E1.3) Лемма об ограниченных Q-минимизирующих последова-
последовательностях. Если эллиптическая и положительно определенная
в открытом множестве W задача имеет Q-минимизирующую по-
последовательность, расположенную в замкнутом ограниченном под-
подмножестве Е czW, то эта задача имеет решение, доставляемое
экстремалью, расположенной в Е1'.
Доказательство. Пусть Cv(v= 1,2,.. .) — указанная Q-миними-
зирующая последовательность. Выберем число р > 0 в соответ-
соответствии с локальной теоремой существования B9.5) из § 29 гл. II
и обозначим через т, М соответственно минимум и максимум
функции L(x, х) на множестве | х | = 1, х£Е. Обозначим через
|CV| длину кривой Cv, а через Nv—наименьшее целое число,
превосходящее Зр~* (С^, |.
Так как последовательность значений Э (Cv) имеет конечный
предел, то длины ICvl^/n^S^Cv) равномерно ограничены, а
значит, ограничены и целые числа Nv. По крайней мере одно
целое N встречается бесконечно много раз среди чисел Nv; ог-
ограничимся рассмотрением соответствующих значений индекса v.
Разделим кривую Cv на N дуг так, чтобы длина каждой дуги
была меньше р/3. Это возможно потому, что N > 3p~l | Cv |. Точ-
Точки деления кривой Cv обозначим через
«voi avl, в\2, • • • . Ov/V-
Когда v меняется, каждая из точек avk пробегает ограниченную
последовательность, содержащуюся в Е. Выберем такую подпо-
подпоследовательность номеров v, чтобы каждая последовательность aVk
стремилась к пределу. Присоединим к кривой Cv пары противо-
противоположно направленных отрезков, соединяющих avh с их преде-
пределами ак при k=l, 2, . . . , N — 1 и по одному такому отрезку
при 6 = 0 и k~N. На модифицированных таким образом кривых
в качестве точек деления возьмем aft = IimaVft> так что они будут
общими для всех Cv из нашей подпоследовательности. Так как
N—фиксированное число, а длины 2W + 2 присоединенных от-
отрезков стремятся к нулю, и так как 3 (Cv) может при этом при-
присоединении увеличиться самое большее на длину этих отрезков,
умноженную на М, то это увеличение стремится к нулю. Таким
образом, модифицированные кривые Cv по-прежнему образуют
й-минимизирующую последовательность. Далее, опуская конечное
число значений индекса v в нашей подпоследовательности, можно
u При применении леммы E1.3) в этом параграфе в качестве Е мы будем
брать некоторый куб Q, а в качестве W—все .«-пространство.
190 Гл. V. Теоремы существования и их следствия
предположить, что длина дуги кривой Cv между ак.г и ак мень-
меньше р/2. Очевидно, можно предположить также, что ак-1фа11 для
каждого k.
После этих изменений обозначим через С кривую, проходящую
через точки деления и составленную из N экстремальных дуг ук.
Модифицированная кривая С„
н модифицированные точки раз-
разбиения ак.
Каждая дуга yk определяется здесь в соответствии с теоремой
B9.5) из § 29 гл. II, т. е. yh—единственная минимизирующая
кривая, для которой дуь является парой (afc_It ak). Ввиду свой-
свойства минимальности дуг yk мы получаем (суммированием по k)
соотношение 3(С)^3(Cv). Устремив v—»-оо, заключаем, что
С—минимизирующая кривая.
Ясно, что и каждая дуга кривой С будет минимизирующей,
и в частности дуга Yft+Yft+i- Так как концы этой дуги удалены
друг от друга на расстояние, меньшее р, то, согласно B9.5), для
каждого к дуга y*+Ya+i будет экстремальной и, следовательно,
С—экстремаль. Таким образом, доказательство завершено.
Для того чтобы получить теорему E1.1) из только что дока-
доказанной леммы, установим следующий результат, который будет
полезен и для других целей:
E1.4) Теорема. Пусть для стандартной параметрической за-
задачи Cv (v = I, 2, ... , N)—такие допустимые кривые, что числа
3 (Cv) ограничены. Тогда
(i) диаметры dCv кривых Cv ограничены;
(и) если кривые Cv пересекают ограниченное множество Q, не
зависните от v, то длины |CV| ограничены.
Редукция E1.1) к E1.4). Ввиду леммы E1.3) и очевидного
существования Q-минимизирующей последовательности нужно
только показать, что последняя ограничена, а это следует из
утверждения E1.4) (i).
Доказательство теоремы E1.4). Сначала заметим, что утверж-
утверждение (ii) следует из (i). Действительно, если (i) справедливо,
то можно так расширить множество Q, чтобы оно содержало
§ 51. Гильбертова конструкция и некоторые ее следствия 191
кривые Cv. Тогда |CV|^ пг~1 3 (Cv), где tn—минимум L(x, х) на
множестве |х|=1, x£Q.
Затем докажем, что общий случай~утверждения (i) следует
из частного случая, когда Cv — экстремали. Для этого достаточно
сопоставить каждой допустимой кривой С экстремаль Г с тем же
диаметром, удовлетворяющую уело
вию 3(r)<J(C)- Пусть а, Ь—две
точки кривой С, причем точка а
предшествует точке Ь и \Ъ—a\ = dC.
Обозначим через Я* множество пар
(xlt x2), где xl = a, а х2 лежит на
окружности с центром в точке а,
проходящей через точку Ь.
Очевидно, что для задачи мини-
минимизации, в которой Я заменено на Я*,
существует ограниченная Я*-миними-
зирующая последовательность, при-
причем даже состоящая из кривых, не пе-
пересекающих указанную выше окруж-
окружность. Следовательно, согласно E1.3),
существует экстремаль Г, соединяющая точку а с окружностью
и имеющая диаметр dT~^dC, для которой 3 (Г) <; 3 (С). Укоро-
Укоротив Г, если это потребуется, так, чтобы dY = dC, получим иско-
искомую экстремаль.
И наконец, чтобы доказать утверждение (i) в частном случае,
предположим противное. Тогда для любого достаточно малого
е>0 существует экстремаль C = CV с диаметром dC > 2е~3, для
которой 3 (С) < е. Разбив экстремаль С на N равных дуг, где
1 <; кг* < 2, по крайней мере для одной из этих дуг мы полу-
получим соотношения dy > г'1, 3 (у) < е. Значит, дуга у будет «де-
«дешевой» экстремалью, что по нашему предположению для малых г
исключено. Это противоречие доказывает теорему E1.4), а сле-
следовательно, и теорему E1.1).
Доказательство части теоремы E1.2). ПустьС — некоторая Я-ми-
нимизирующая кривая. Очевидно, что С—минимизирующая кри-
кривая и что этим же свойством обладает любая ее дуга. Выберем р
так же, как при доказательстве леммы E1.3), и пусть Q—лю-
Q—любой куб, содержащий кривую С. Рассмотрим любую дугу у кри-
кривой С длины |у|<|р. Так как у—минимизирующая дуга, то,
согласно теореме B9.5) из § 29 гл. II, она является экстремаль-
экстремальной дугой. Значит, кривая С—тоже экстремаль. Осталось по-
показать, что кривая С удовлетворяет условиям трансверсальности,
которые мы сейчас сформулируем.
E1.5) Определение допустимых вариаций в Q. Пусть (jclf x2) £ Q.
Пару векторов (Xlt X2) называют допустимой вариацией для
J92 Гл- V. Теоремы существования и их следствия
(xlt xa) в Q и обозначают через Fxlf бх2), если на интервале оси а,
содержащем а = Ов качестве внутренней точки, можно опреде-
определить такую непрерывно дифференцируемую пару функций (^(а),
х2(а)) со значениями в Q, что при а = 0 пара (х1(а), х2(а)) ц ее
производная по а совпадают с (jq, x2) и (Xlt Х2) соответственно.
E1.6) Условие трансверсальности. Пусть С—такая экстре-
экстремаль, что
С
и пусть (xlt у,), (х2, у2) — начальная и конечная канонические
точки соответствующей канонической экстремали. Будем гово-
говорить, что кривая С удовлетворяет условию трансверсальности, если
для каждой допустимой вариации Fх,, бх2) пары (xlt x2) в Q.
Теперь можно продолжить прерванное доказательство.
Доказательство оставшейся части теоремы E1.2). В соответствии
с введенными ранее обозначениями пусть л: (f), y(t) @<j/<!l) —
параметрическое представление канонической экстремали, отве-
отвечающей кривой С, и пусть через Са обозначена кривая, пара-
параметрически заданная на том же ^-интервале при помощи функции
где
Так как С есть Q-минимизирующая кривая, то производная 6J
от 3 (Са) по а при а = 0 обращается в нуль. Значит, нужно
только удостовериться, что эта производная равна </2Х2—УхХ^
Так же как в § 31 гл. III,
ЬЭ = I (LXX + yX) dt = [Xy]l + l(Lx-y)X dt,
где X—частная производная от x(t, а) по а приа = 0. Так как
С—экстремаль, то 63 сводится к разности значений величины Ху
в концах ^-интервала, а это и есть искомое выражение. Таким
образом, теорема E1.2) доказана.
В этом параграфе мы докажем еще один результат.
E1.7) Принцип выбора для параметрических экстремалей.
Пусть Cv(v=l, 2, ...)—экстремали стандартней параметри-
параметрической задачи, начальные точки которых расположены в ограни-
ограниченном, множестве. Предположим далее, что последовательность
чисел 3 (Cv) ограничена. Тогда существует такая подпоследова-
§ 51. Гильбертово конструкция и некоторые ее следствия 193
тельность индексов х, что Cv стремятся к экстремали С, кото-
которая, возможно, сводится к одной точке, а числа Э (Cv) стремят-
стремятся к 3(С).
Доказательство этого принципа основывается на упрощенном
варианте гильбертовой конструкции.
Доказательство принципа E1.7). Согласно E1.4), экстремали Cv
лежат в ограниченном множестве и имеют равномерно ограни-
ограниченные длины. Обозначим через Q куб, содержащий экстремали Cv.
Так же как при доказательстве леммы E1.3), можно теперь оп-
определить р > 0, подпоследовательность индексов v и целое число N
так, чтобы для каждого v это N было наименьшим целым чис-
числом, для которого экстремаль Cv можно разбить на N дуг, каж-
каждая из которых имеет длину <р/2. Теперь выберем из подпоследо-
подпоследовательности v такую подпоследовательность, чтобы точки деления
на Cv стремились к пределам, которые мы обозначим через
а0, alt ..., aN.
Обозначим через yk такую минимизирующую экстремальную
дугу (возможно, одну точку), что dyk = (ah_1, ak), а через С обо-
обозначим сумму дуг yh{k — 1, 2, ..., N).
Так как расстояние между точками ah^lt ak+1 не больше р и
эти точки являются пределами соответствующих точек экстрема-
экстремалей Cv, расстояние между которыми тоже не больше р, то ми-
минимизирующая экстремальная дуга, которая соединяет эти точки,
будет пределом последовательности соответствующих экстремаль-
экстремальных дуг кривых Cv, длины которых не превосходят р. Значит,
эта дуга должна совпадать с дугой Y* + Yft+i» так как> в силу
тех же соображений, ук и ук+1—пределы соответсгвующих дуг
экстремалей Cv- Таким образом, каждая у* + Т*+1—экстремаль-
Т*+1—экстремальная дуга. Аналогично v* + Yfc—экстремальная дуга, если у,-сво-
дится к точке при &<i<&'. Следовательно, мы доказали, что
С—экстремаль. Далее, так как каждая дуга yk—предел соответ-
соответствующих дуг экстремалей Cv, то экстремаль С—предел экстре-
экстремалей Cv.
И наконец, легко видеть, что ввиду свойства минимальности
дуги 7л и соответствующей дуги экстремали Cv интегралы от L
по этим дугам будут отличаться самое большее на величину
суммы интегралов от L по паре отрезков, соединяющих концы.
Следовательно, 3 (yk) — предел соответствующих интегралов на
Дуге экстремали Cv; просуммировав, получим, что 3 (С)—предел
чисел S'(Cv) для нашей подпоследовательности индексов v. Тем
самым доказательство принципа E1.7) завершено.
^ N> I274
194 Гл. V. Теоремы существования и их следствия
§ 52
Параметрическая теория сопряженных точек и
параметрическое условие Якоби
Теория сопряженных точек, развитая нами в гл. III, относилась только к не-
непараметрическому случаю. При переходе к параметрическому случаю мы в основ-
основном используем процедуру из §24 гл. II (а также замечание, приведенное в конце
§ 26), не исключая, однако, возможности появления экстремалей, имеющих само-
самопересечения.
Мы постараемся без излишних сложностей включить в рас-
рассмотрение кривые с самопересечениями и определим окрестности
таких кривых. Это потребуется нам для изучения параметриче-
параметрического аналога теории сопряженных точек Якоби. Мы можем
условиться считать точку х0, в которой кривая пересекает самое
себя, за две или более совпадающих точек, которые мы будем
Самопересе- Окрестность,
кающаяся
кривая.
различать и упорядочивать в соответствии с возрастанием зна-
значений параметра / вдоль этой кривой. В окрестности такой кри-
кривой нам придется вблизи точки х0 различать два или более
слоев. Можно считать, что эта окрестность порождается малень-
маленьким движущимся вдоль кривой шаром, который заметает разные
слои, когда его центр, перемещаясь вдоль кривой, приближает-
приближается к различным точкам, в которых х = хй.
Мы будем рассматривать случай, когда кривая представляет
собой экстремаль стандартной параметрической задачи или по
крайней мере задачи, в которой лагранжиан L положительно
определен, а все имеющие отношение к делу точки л:-пространст-
ва эллиптические. Если Q — куб, содержащий такую экстре-
экстремаль Г, а число р определено так же, как и раньше, то очевид-
очевидно, что каждая дуга экстремали Г, длина которой ^ р, должна
быть простой и две такие дуги либо совсем не пересекаются,
либо имеют ровно одну общую точку, либо совпадают вдоль
некоторого связного куска. Разбив экстремаль Г на конечное
число таких простых дуг ук и окружив каждую из них обычной
§ 52. Параметрическая теория сопряженных точек
195
окрестностью Wk, мы получим систему сцепленных друг с дру-
другом окрестностей Wk, которую назовем, «цепочной окрестностью
экстремали Г».
Понятие цепочной окрестности заменяет до некоторой степени понятие много-
многослойной окрестности, о которой мы упоминали. Этим понятием постоянно поль-
пользуются в теории аналитических функций в связи с аналитическим продолжением;
обычно звеньями цепочки являются при этом круговые окрестности. Оно служит
основным средством при вейерштрассовском подходе не только к аналитическим
функциям, но и к параметрическому варианту теории сопряженных точек.
Цепочную окрестность W можно рассматривать как «многослойное объедине-
объединение» составляющих ее сцепленных окрестностей Wk- Тогда точка Р £ W характери-
характеризуется не своим положением в ^-пространстве, а задается парой (х, Wk), гдел:£ Wk.
Две такие пары отождествляются тогда и только тогда, когда в них входит одна
и та же точка х и при этом они имеют вид (х, Wk')t (x,ifWk"), где х£ W'^ для всех
целых k, удовлетворяющих условию &'<&<&" или&"<ft<&'.
Аналогично, кривая С лежит в цепочной окрестности W тогда и только тогда,
когда ее можно разбить на дуги Cv (v=l, 2 /V), упорядоченные по возрастанию
индекса V, и существует целочисленная функция &(v),
обладающая свойством
и такая, что CvcUPfc при k=k(\). ДугиС„, рассматривае-
рассматриваемые как множества точек, не обязаны быть различными, а
некоторые из них или все могут состоять из одной точки.
Пусть теперь у—внутренняя дуга экстрема-
экстремали Го, погруженной в семейство F параметри-
параметрических экстремалей Гк вида х (/, и) и соответ-
соответствующей в нем значению и = 0. Здесь t —
геодезически» параметр, имеющий такую об-
ласть определения, что для каждой внутренней точки и она
содержит интервал А, на котором (при ы = 0) определена ду-
196 Гл. V. Теоремы существования и их следствия
га у. Конечно, дуга у вполне может здесь иметь самопересече-
самопересечения.
E2.1) Определение. Будем говорить, что семейство F одно-
однократно покрывает цепочную окрестность дуги у, если существует
разбиение интервала Д на интервалы Aft и для каждого k су-
существует открытый интервал o>ftz>AA, такие, что если обозначить
через Fk семейство, полученное сужением семейства x(t, и) на
t €<<>*. а через yk—часть дуги у, соответствующую значени-
значениям x(t, 0), <€Aft. то у* для каждого k — простая дуга и семей-
семейство Fh однократно покрывает обычную окрестность дуги yk.
Нам нужно далее рассмотреть также переход от параметри-
параметрических кривых к непараметрическим и от параметрических задач
к непараметрическим, чтобы можно было приспособить теорию
гл. III к параметрическому случаю. Этот переход тесно связан
с предыдущими замечаниями о кривых, имеющих самопересече-
самопересечения, и многослойных окрестностях. Наш метод, позволяющий
различать совпадающие точки и совпадающие части окрестностей,
на самом деле равносилен превращению параметра t в дополни-
дополнительную координату, направленную вверх, и редукции вопросов,
относящихся к параметрическим кривым, к соответствующим
вопросам о непараметрических кривых, расположенных в про-
пространстве (t, x) большей размерности.
Каждому допустимому представлению x(t) параметрической
кривой С поставим в соответствие непараметрическую кривую С*.
определенную в пространстве (t, x) посредством той же функ-
функции *(/). Так как мы условились считать ось t направленной
вверх, то кривую С* мы будем называть восходящей кривой,
расположенной над С, или поднятием кривой С. (Конечно, С
является проекцией кривой С*. Однако в пространстве (t, x)
могут существовать и невосходящие кривые, имеющие такую же
проекцию.)
Для восходящих кривых, т. е. для непараметрических кри-
кривых в пространстве (/, х), будем по-прежнему обозначать через 3
криволинейный интеграл от первоначального лагранжиана L(x, x).
Таким образом,
когда С* —поднятие кривой С. Вместе с тем мы будем обозна-
обозначать через 3* (С*) соответствующий криволинейный интеграл от
§ 52. Параметрическая теория сопряженных тачек 197
непараметрического лагранжиана L*, который задается равен-
равенством
Этот лагранжиан есть не что иное, как непараметрический лаг-
лагранжиан, введенный в § 24 гл. II и удовлетворяющий условию
Лежандра (впрочем, здесь мы сочли удобным отбросить множи-
множитель 1/2).
Восходящую кривую С* назовем выровненной, если вдоль нее,
т. е. для линейных элементов (х, х) кривой С*, мы имеем
L(x, x)= const; кривую С* назовем калиброванной, если эта по-
постоянная равна единице. Очевидно, что калиброванная восходя-
восходящая кривая С* соответствует геодезической параметризации ее
проекции С; все калиброванные восходящие кривые с одной и
той же проекцией получаются друг из друга параллельным
переносом вдоль оси t\ соответствующие выровненные кри-
кривые С* с той же проекцией можно получить посредством изме-
изменения масштаба на оси t.
Вспомним, что в соответствии с замечанием, приведенным в
конце § 26 гл. II, экстремали лагранжиана L* — выровненные
восходящие кривые, которые проектируются в параметрические
экстремали лагранжиана L\ другими словами, это выровненные
восходящие экстремали лагранжиана L.
В этом параграфе нам нужно рассмотреть только те пара-
параметрические экстремали, которые исходят из фиксированной на-
начальной точки, которую мы примем за начало jc-пространства.
Мы будем считать, что соответствующие параметры t синхрони-
синхронизированы, так что в начальной точке / = 0; это означает, что мы
ограничиваемся рассмотрением только тех экстремалей лагран-
лагранжиана L*, которые исходят из начала 0* пространства (/, х).
Обозначим через ГТ и П* соответственно пучки таких экстрема-
экстремалей лагранжианов L и L*, имеющие вершины в 0 и 0*, причем
некоторая параметрическая экстремаль Со погружена в П, а со-
соответствующая ей калиброванная восходящая экстремаль погру-
погружена в П*. Будем предполагать, что элементы пучка П задают-
задаются параметрически функцией x(t, и), где t — геодезический па-
параметр, изменяющийся на некотором фиксированном ^-интервале,
а и изменяется в малой области, содержащей начало и-мерного
«-пространства. (Здесь, так же как и в § 36 гл. III, можно
считать, что и — это разность начальных значений сопряженного
вектора y(t) на соответствующей экстремали и на Со.) Элементы
пучка П* (согласно замечанию из § 26 гл. II, о котором мы
уже упоминали) задаются функцией вида
x*(t, u*) = x((l+uo)t, и),
J98 Гл. V. Теоремы существования и их следствия
где и*—точка (я+1)-мерного пространства с теми же коорди-
координатами, что и, и дополнительной малой координатой ы0.
E2.2) Лемма о переходе. Пусть у—внутренняя дуга пара-
параметрической экстремали Со, погруженной в пучок II, и пусть
через у* обозначена соответствующая дуга соответствующей ка-
калиброванной восходящей экстремали пучка П*. Тогда, для того
чтобы пучок П однократно покрывал цепочную окрестность дуги у,
необходимо и достаточно, чтобы пучок П* однократно покрывал
обычную окрестность дуги у*.
Доказательство. Можно предположить, что элементы пучка П
целиком лежат внутри фиксированного куба Q. Этим фиксируется
наше положительное число р. Далее, обозначим опять через т
нижнюю грань лагранжиана L на множестве линейных элементов.
(х, х), для которых x£Q, |дг|=1, и предположим, что область
значений и0 в пучке П* содержит интервал вида |ыо|^б, где
б2 < тр, б < 1, и что 26 меньше расстояния от начала до интер-
интервала Д на оси t, на котором определена дуга у.
Так же как в определении E2.1), разобьем интервал Д на
конечное число подинтервалов Ak и каждый из них заключим
в открытый интервал ak. Через yk обозначим часть дуги у, соот-
соответствующую Дл, а через IIft—семейство, полученное из П огра-
ограничением t на шА. Определим соответственно часть у% дуги у*
и семейство П|, полученное из П* ограничением / на Дл в первом
случае и на множество значений t, удовлетворяющих условию
A+ыо)/€<йл, во втором.
Предположим сначала, что П однократно покрывает цепочную
окрестность дуги у, a &k, wfc определены так, что каждый пучок
ПА однократно покрывает обычную окрестность соответствующей
дуги yh. Отсюда следует, что никакие два элемента пучка Щ не
могут пересекаться, так как в противном случае их проекции
либо являются различными элементами пучка IIft, которые пере-
пересекаются друг с другом, либо будут одним и тем же элементом
пучка Пл, который тем самым оказывается самопересекающимся;
обе эти возможности исключены нашими предположениями. Мы
видим также, что пучок ГЦ покрывает некоторую окрестность
дуги у%. Действительно, если (£0, х0)—любая точка, достаточно
близкая к дуге у%, то существует элемент пучка IIft, который
проходит через х0 при некотором значении t, близком к t0, и, сле-
следовательно, можно выбрать малую координату ы0 так, чтобы
соответствующий элемент пучка Щ удовлетворял условию
x*(t0, ы*) = дс0, т.е. чтобы он проходил через (/0, х0). Значит,
пучок П| однократно покрывает окрестность дуги у*- Это спра-
справедливо для каждого k, и так как наши кривые непараметри-
§ 52. Параметрическая теория сопряженных точек 199
ческие, то отсюда следует, что пучок П* однократно покрывает
окрестность дуги у*.
Обратно, предположим, что П* однократно покрывает окрест-
окрестность дуги у*. Тогда, если мы выберем Ak и coft указанным выше
способом, то семейство Щ будет однократно покрывать окрест-
окрестность дуги у% для каждого к. При этом указанные интервалы
можно выбрать так, чтобы длина каждого интервала шк была
меньше, чем б2 < тр. Отсюда следует, что каждый элемент каж-
каждого пучка Uk имеет длину <р и, значит, является простой
дугой. Отсюда следует также, что отношение любых двух значений
параметра t, принадлежащих одному и тому же и>к, заключено
между максимумом величины A+6*/0 и минимумом величины
A -t^/t)'1, а значит, между 1+6 и 1—6. Таким образом, два
таких значения всегда можно представить в виде / и A+ы„)/,
где |ыо|<6. Следовательно, если два элемента пучка ПЛ пере-
пересекаются в точке х, то мы сразу же можем найти два элемента
пучка Щ, которые пересекаются в точке (t, х). Но это невозможно
ввиду наших предположений. Следовательно, никакие два эле-
элемента пучка ПА не могут пересечься. Очевидно, что пучок ITft
покрывает окрестность дуги ук, полученную посредством проекти-
проектирования из окрестности дуги ук, которую покрывает пучок Щ;
поэтому пучок ПЛ однократно покрывает обычную окрестность
дуги yk. Это справедливо для каждого k, и, значит, пучок П
однократно покрывает цепочную окрестность дуги у.
Тем самым наша лемма доказана.
Теперь мы готовы к тому, чтобы дать определение сопряжен-
сопряженных точек.
E2.3) Определение. Пусть С„—параметрическая экстремаль,
исходящая из 0, и пусть Со—соответствующая калиброванная
восходящая экстремаль, исходящая из 0*. Точку Р экстремали
Со назовем сопряженной с 0, если соответствующая точка Р*
экстремали CJ сопряжена с 0* для непараметрической задачи
с лагранжианом L*. Если ни одна такая сопряженная точка Р
не лежит строго внутри экстремали Со, то мы будем говорить,
что экстремаль Сп удовлетворяет условию Якоби.
E2.4) Необходимость условия Якоби. Пусть экстремаль Сп —
минимизирующая параметрическая кривая. Тогда Со удовлетворяет
условию б
Доказательство. Определим Со так же, как в E2.3). Наше
утверждение можно свести к соответствующему утверждению
Для С» с лагранжианом L*, т. е. к теореме C7.4) из § 37 гл. III.
Предположим, что Со не удовлетворяет условию Якоби. Согласно
только что упомянутой теореме, существует непараметрическая
допустимая кривая С*, для которой дС* = <ЭСо и 3* (С*) О* (С^);
200 Гд- V. Теоремы существования и их след:твия
кроме того, здесь 3*(CJ) = 3 (Со) = 3 (С„) = Т, где Г—значение
параметра t в правом конце экстремали, поскольку L = L*—1
вдоль С%. Следовательно, согласно неравенству Шварца, вдоль
кривой С*
L*dtX''<T\
» /
поэтому для проекции С кривой С*, концы которой совпадают
с концами С*, имеет место неравенство 3 (С) <3'(С.,), а это про-
противоречит предположению, что Со — минимизирующая кривая.
E2.5) Теорема о параметрическом погружении и тонкое нера-
неравенство треугольника. Пусть у—внутренняя дуга параметрической
экстремали Сп, где Сп исходит из 0 и удовлетворяет условию Якобы.
Тогда Со можно погрузить в такой узкий пучок П экстремалей,
исходящих из 0, что П однократно по-
покрывает некоторую цепочную окрест-
окрестность W дуги у. Далее, если Л—любая
допустимая кривая, лежащая в W, то
E2.6) Э(А)^Э(С,)~3(С1),
где С„ С2—единственные дуги экстре-
экстремалей, принадлежащих пучку П, такие,
что Си С2 соединяют 0 с концами Я,,
Р2 кривой Л соответственно. В E2.6)
равенство имеет место только тогда,
когда Л—часть дуги С2.
Цепочная окрестность дуги у Доказательство. То, что пучок П одно-
экстремали Со. кратно покрывает некоторую цепочную
окрестность дуги у, следует из теоремы
C6.2) (§36 гл. III) ввиду леммы о переходе E2.2). В остальных
утверждениях можно дополнительно предположить, что кривая Л
лежит в одной из обычных окрестностей Wk, посредством которых
определена окрестность W. Тогда эти утверждения следуют из
формулы Вейерштрасса A2.6) из § 12 гл. I.
§ 53
Теорема единственности Тонелли — Каратеодори
Гильбертовская теория не только позволила придать смысл необходимым
условиям и, в частности, параметрическому условию Якоби; наряду с этим она
предоставила в наше распоряжение новые важные методы, которые можно приме-
применять и в других вопросах, помимо теорем существования. Такое положение дел
типично для математики. Не раз случалось,что глубокое проникновение в вопросы,
казавшиеся очевидными или не существенными, неожиданно помогало распутать
другие вопросы, важность которых не вызывала сомнений. Так, например,
в штыки было встречено опубликоваиное Камиллом Жорданом пространное дока-
доказательство такого, казалось бы, вполне очевидного факта, что простая замкнутая
§ S3. Теорема единственности Тонелли — Карапгеодори 201
плоская кривая разделяет плоскость на две части. Однако это доказательство
помогло обнаружить новые глубокие факты и способствовало развитию новых
методов, что в конечном итоге привело к созданию современной топологии —
области математики, имеющей бесчисленные приложения.
Именно теперь, когда в нашем распоряжении есть параметрические теоремы
существования, имело бы смысл рассмотреть отдельно параметрическую теорию
сопряженных точек. Далее можно было бы аналогичным образом перевести на
параметрический язык теорию Морса, о которой говорилось в гл. III, и тем самым
придать ей законченный вид. Все это подробно проделано в книге Морса; мы не
будем вдаваться в эти вопросы. Тем не менее мы приведем здесь близкое по духу
и очень важное деформационное рассуждение. Деформации фактически лежат
в основе теории Морса; при этом они совершенно справедливо рассматриваются
в пространстве кривых, а не в исходном координатном пространстве; кроме того,
особо важное значение придается «понижающим» деформациям. Мы же, однако,
будем заниматься здесь старой разновидностью деформаций. Мы поступаем так
отчасти потому, что это не лишено интереса само по себе, а отчасти по той причине,
что такая разновидность деформаций имеет весьма общин характер. Примеча-
Примечательно, что она фактически не связана с предположениями о гладкости, а потому
в принципе годится и для оптимального управления.
Деформационное рассуждение, о котором пойдет речь, восходит к теории ана-
аналитического продолжения по Вейерштрассу. Его можно весьма эффективно приме-
применять в вариационном исчислеиии в сочетании с параметрическим вариантом теории
сопряженных точек Якоби, который также принадлежит Вейерштрассу. Однако
такое приложение у Вейерштрасса не встречается; впервые о нем говорится
в письме Каратеодори к Тонелли, которое обсуждается в тонеллиевских «Fonda-
menti» (том II, стр. 274). Все это было задолго до теории Морса и в конечном
счете привело к важной теореме единственности.
Мы не будем формулировать эту теорему в ее наиболее общем виде. Чита-
Читателю предоставляется возможность самому попытаться модифицировать предпо-
предположения и заключения. Как и в предыдущих параграфах, сам ход доказательства
на деле гораздо важнее той конкретной ситуации, в которой мы его применяем.
Это доказательство, в сущности, ие очень трудное и даже не такое уж новое, если
не считать двух-трех моментов. Искушенный читатель задолго до конца доказа-
доказательства опознает знакомую схему рассуждений; они напоминают не только про-
процесс аналитического продолжения, но даже некоторые стандартные рассуждения
из анализа, такие, скажем, как доказательство теоремы Бореля о конечном по-
покрытии для отрезка и плоской фигуры. Впрочем, стандартные доказательства
постоянно находят все новые применения.
Поскольку указанные рассуждения иосят, в сущности, элементарный характер,
будущему математику было бы нелишне проверить себя, попробовав провести
доказательство самостоятельно. Не-
сколько потраченных на это недель —
независимо от того, удачной или нет
окажется эта попытка,— послужат для
читателя ценной практикой перед тем,
как он всецело посвятит себя работе над
темой своей диссертации, которая либо yS \J
принесет ему успех, либо доконает его.
Т1 - „ Область измене- Область изменения
Назовем благоприятной экст- ния napaNleTpa параметра при тре-
ремаль, исходящую из 0 и не при обычной де- угольной деформа-
содержащую ни одной точки, со- формации. ции.
пряженной с 0. Под благоприят-
ной задачей мы будем понимать стандартную параметрическую
задачу, в которой каждая экстремаль, исходящая из 0, благо-
202
Гл. V. Теоремы существования и их следствия
приятная. Мы будем производить деформации над точками, отлич-
отличными от 0, и над экстремалями, исходящими из 0. Оба типа
деформаций будут иметь следующие две разновидности: допустимые
обычные деформации и допустимые треугольные деформации.
Первые определяются посредством параметра, область изменения
которого U является отрезком, а вторые—посредством параметра,
у которого область изменения U двумерна
и имеет вид замкнутого треугольника. В
каждом из этих случаев допустимая де-
деформация точки х„Ф0 по определению
должна быть непрерывной, не обращаю-
обращающейся в нуль, кусочно-непрерывно диффе-
дифференцируемой (нлн удовлетворяющей усло-
условию Липшица) функцией
б(«).. иеи,
заданной вместе с некоторой фиксирован--
ной точкой un£U, которую мы называем
начальной точкой для U и в которой
%(и0) — х0 (обычно это конец или вершина
области U). Допустимая (обычная или
треугольная) деформация экстремали С,
соединяющей начало с точкой х0 Ф 0, опре-
определяется семейством экстремалей
Экстремаль С и ее де-
деформация Си.
где каждая экстремаль Си соединяет начало с соответствующей
точкой 1(и)Ф0 и выполняются следующие условия:
(i) £,(u), u£U,— допустимая деформация точки *0;
(ii) функция Т(и) = Э(Си), u£U, непрерывна;
(iii) при и — и0 экстремаль Си превращается в С;
(iv) функция x(t, и), 0^/^Т(и), u£U, которая для каждого
постоянного и £ U задает геодезическую параметризацию экстре-
экстремалей С„, непрерывна по (t, и).
Для заданной таким образом допустимой деформации экстре-
экстремали С ее концевой деформацией будем называть деформацию
точки х0, определенную соответствующей функцией i(u), u£U.
Далее, если для некоторого ul£ll мы обозначим через л;^ и С*
точку £(ы) и экстремаль С„, отвечающие u = ul, то будем гово-
говорить, что деформации точки xl и экстремали С*, заданные посред-
посредством той же функции \(и), u£U, и того же семейства Са, u£U,
индуцируются первоначальной деформацией при переносе началь-
начальной точки в «о- Допустимую деформацию назовем исключительной,
если для каждой точки u^U деформация экстремали С*, инду-
индуцируемая при переносе, будет единственной допустимой дефор-
деформацией экстремали С* с той же самой концевой деформацией.
§ 53. Теорема единственности Тонелли — Каратеодори 203
Деформацию точки х„ или экстремали С назовем малой, если
разность \(и)—х0 или x(t, и)—x(t, ua) мала равномерно по
и или по (t, и). Нам потребуется следующий предварительный
результат:
E3.1) Лемма о малой деформации. Пусть С—благоприятная
экстремаль стандартной задачи, соединяющая начало 0 с точкей
хоф0. Тогда для любой допустимой малой деформации точки х„
существует исключительная деформация экстремали С, для кото-
которой данная малая деформация является концевой.
Доказательство. Пусть Тп = Э (С); обозначим через г]0 начальное
значение в точке 0 сопряженной переменной у на экстремали С.
Обозначим через П пучок экстремалей, исходящих из 0, для кото-
которых начальные значения г) сопряженной переменной у удовлет-
удовлетворяют, кроме условия Я@, ч)=1, неравенству | г)—tjJ^6 для
некоторого фиксированного 6 > 0. Вдоль этих экстремалей обозна-
обозначим через t геодезический параметр, который обращается в нуль
в начале. Далее, обозначим через F семейство дуг экстремалей
пучка П, на которых этот параметр удовлетворяет условию
Согласно теореме E2.5), для достаточно малого б семейство F
однократно покрывает некоторую окрестность А точки х0. Умень-
Уменьшим значение величины б настолько, чтобы новое семейство ле-
лежало в Л, а затем уменьшим окрестность А настолько, чтобы
Семейство F.
она опять покрывалась этим семейством. Тогда элементы семей-
семейства F не будут пересекаться друг с другом и не будут иметь
самопересечений. Более того, это свойство семейства F не нару-
нарушится, если мы несколько увеличим это новое б.
204 Гл- У- Теоремы существования и их следствия
Фиксировав таким образом 6, а значит, П и F, обозначим
через В множество точек (/, •>]), для которых
|'-Т„|<6, |т,-г,0|<6, Я@, i]) = l,
а через
Х = ф(/, Т))
обозначим геодезическую параметризацию элементов пучка П,
различаемых посредством начальных значений tj. В этих обозна-
обозначениях х = ф(/, т)„), 0^ t <T0,— параметрическое уравнение
экстремали С. Теперь очевидно, что множество, покрытое семейст-
семейством F, является образом «p(fl) множества В при взаимно одно-
однозначном отображении <р.
Следовательно, ограничение отображения ф на В'имеет обратное
отображение вида
t = x(x), Tj=g(x).
Конечно, это обратное отображение, как и само ф, непрерывно.
Это можно вывести из теоремы о неявной функции или же по-
получить непосредственно, так как если отображение ограниченного
замкнутого множества В непрерывно и взаимно однозначно, то
таким же будет и обратное отображение.
Пусть теперь £(ы), u£U,— любая допустимая деформация
точки хо = £(м„), такая, что £(ыN А для всех u£U. Для каждого
u£U обозначим через С„ экстремаль с геодезической параметри-
параметризацией
x(t,u), 0<г<Г(«),
где
x{t. u) = q>(t, g
Очевидно, что семейство Сц, u£U, образует допустимую дефор-
деформацию экстремали С, имеющую заданную концевую деформацию.
Остается показать, что эта деформация исключительная.
Пусть r\a = g(E,(u)) для любого фиксированного и£Т. Тогда
т)ц—начальное значение сопряженной переменной у на Си, т. е.
Си—экстремаль вида
При всех этих рассуждениях мы могли взять вместо 6 не-
несколько большее число 6*; при этом множество А можно было
бы сохранить тем же, а множество В заменить большим мно-
множеством В*; отображение <р непрерывно продолжается до взаимно
однозначного отображения ф*. определенного в В*. Тогда для
достаточно малого е > 0 множество В* содержит множество Ва
точек (t, т)), удовлетворяющих условиям
, h-4.|<e. Я@, т,)=1.
§ 53. Теорема единственности Тонелли — Каратеодори
205
Возьмем е настолько малым, чтобыф*(Ви)с:Л; это возможно рвиду
непрерывности отображения <р* в точке (Т (и), т)н), образ которой
£ (и) g A. Следовательно,
и0
Конечно, рассматриваемое значение величины е зависит здесь
от и. При том же е обозначим через Пн семейство экстремальных
дуг Гпт, определенных для постоянных (Г, т))£Ви функцией
х = ф(*. r\), O^.t^.T.
Очевидно, что для каждой точки Е* 6 ф (Ва) существует одна
и только одна экстремаль \\т семейства Пн, которал оканчивается
в точке £*. Здесь множество —•
Ф (Ви) содержит некоторую ^S*
окрестность конца £(и) экст-
экстремали Са.
Теперь мы можем пока-
показать, что наша деформация
исключительная. Предполо-
Предположим противное. Тогда для
некоторого ui^U существует
такая допустимая деформа-
ция
Си, u^U,
экстремали С*, что при и = и^ экстремаль С* совпадает с обеими
деформациями С„ и С,* и для всех и 6 U деформации С„ и Си имеют
одинаковые конечные точки £(«). Кроме того, СифС*и для неко-
некоторого u£U. Обозначим через 0* такой отрезок в U с начальной
точкой и„, что СафС*и для некоторого u£U*. Посредством вы-
выбора осей в «-пространстве отождествим далее U* с интервалом
действительной оси «o^u^"i-
Пусть (о обозначает верхнюю грань таких значений u*£U,
что Си = С*и для ul^u^u*.
Очевидно, что Са — С*п для и1^и^ы.
Однако из определения деформации следует, что для и > ад.
когда и достаточно близко к со, кривые Си, С„ должны принад-
принадлежать семейству Пи, т.е. определенному выше семейству Пн,
в котором и заменено на (о. Как мы видели, в этом семействе
элементы однозначно определяются своими концами, отличными
от 0, а этот конец равен %(и) для обеих кривых С„, С*и. Значит,
для и, немного большего чем (о, мы опять имеем Си = С1, что про-
противоречит определению числа (о как верхней грани.
Таким образом, доказательство завершено.
Для благоприятной задачи можно доказать более общий ре-
результат.
206 Гл. V. Теоремы существования и их следствия
E3.2) Основная лемма о деформации. Пусть С—экстремаль
благоприятной задачи, соединяющая начало с точкой хи Ф 0. Тогда
для любой допустимой деформации точки хв существует исклю-
исключительная деформация экстремали С, для которой данная дефор-
деформация точки х„ является концевой.
Доказательство. Пусть %(и), u£U,— заданная деформация
точки х„, и пусть и0—начальная точка, т. е. £(«0) = х0. Сначала
изучим случай, когда U—отрезок; можно считать, что он распо-
расположен на действительной оси. Для двух различных точек и, и*
из U обозначим через Лы„» следующую
/"*) /*Л допустимую параметрическую кривую в
\/ _\*1_'^и*^ х-пространстве:
+*>S x = l@» u^.t^u*, если и < и*,
Ш) x = l(—t), —u^t^—u*,
Пусть теперь и„^С/, xJ = |(Uo)> и пусть С*—экстремаль, сое-
соединяющая начало с точкой х%. Подинтервал U* интервала И,
содержащий uj, назовем удовлетворительным для «J, С*, если
существует исключительная деформация С£, u£U, экстремали С*
с концевой деформацией I (и), и (Е U*, и если функция
такова, что
E3.3) Т'(и*)~Т*(и)<3(Аии.)
для всех различных и, и* из U*. Ввиду леммы E3.1) и тонкого
неравенства треугольника E2.6) очевидно, что любой доста-
достаточно малый подинтервал U*, содержащий «JJ, будет удовлетво-
удовлетворительным для «о, С*.
Мы хотим показать, что U — удовлетворительный интервал
для «„, С. В соответствующем рассуждении можно считать, что
и0—первая точка интервала U, т. е. интервал U имеет вид
«o^u^ui- Обозначим через Л кривую Лыц*, когда и = и0,
и* = их.
Обозначим через to верхнюю грань тех чисел u*£U, для
которых подинтервал и0^иО* удовлетворителен для и0, С.
Так как малые интервалы такого вида удовлетворительны, то
и0 < to. Тогда очевидно, что каждый интервал вида и0 ^ и ^ E,
где «„ < р < со, будет удовлетворительным для и0, С. Соответ-
Соответствующую исключительную деформацию кривой С обозначим
через Са, uo^u^p; легко видеть, что Си не изменяется, когда
Р возрастает, оставаясь меньше (о, а точка и остается фиксиро-
фиксированной. Таким образом, кривая Си определена для всех и в
интервале uo^u<w. Очевидно также, что каждый интервал
§ 53. Теорема единственности Тонелли—Каратеодори 207
видаа<;и<;р, где u0<Ia<p<(o, будет удовлетворительным
для каждой пары и*, Сц*, где а<!и*<;р\
Пусть теперь Q—часть интервала У, представляющая собой
достаточно малый отрезок, для которого со — внутренняя точка,
и пусть
uv, v = 2, 3
— возрастающая последовательность точек из U, стремящаяся
к (о снизу. Так как uo^u^uv—удовлетворительный интервал.
то для функции Т (и) = 3 (Сн) при u0<ju<(o справедливо нера-
неравенство Т(«vXIT(uB) + 3(Л). Следовательно, ввиду принципа
выбора для параметрических экстремалей E1.7) существует под-
подпоследовательность точек uv, такая, что экстремали CBv стре-
стремятся к экстремали С*. Очевидно, что С* соединяет начало
с точкой ^ (со).
Взяв отрезок Q достаточно малым, можно гарантировать,
что он будет удовлетворительным для to, С*. Обозначим через
Cl, u£Q, соответствующую исключительную деформацию экстре-
экстремали С*, а через U*—объединение отрезка Q с отрезком, состоя-
состоящим из точек интервала U, предшествующих Q. Отрезок U*
имеет вид «„<:«<;«*, где со^ы*, причем последнее неравен-
неравенство превращается в равенство только в том случае, когда
(о = «1, т. е. когда U* = U.
Для того чтобы доказать, что U — удовлетворительный интер-
интервал для «„, С, достаточно показать, что таковым является U*.
В самом деле, вспомнив, что со — верхняя грань, мы найдем, что
и* <!(о и, следовательно, U* = U. Таким образом, мы должны
проверить, что U*—удовлетворительный интервал для и0, С.
Пусть Nv—множество членов нашей подпоследовательности,
значения которых превосходят uv. Для больших v имеем
NvczQ, так что для u£Nv обе экстремали Си и С„ определены
и оканчиваются в \(и). Далее, для больших v обе эти экстре-
экстремали близки к экстремали С* и, согласно теореме E2.5), они
должны совпадать. Это совпадение распространяется тогда и на
все u£Q, для которых и < со, так как соответствующие дефор-
деформации исключительные. Таким образом, можно определить
экстремали С„ для всех u£U*, просто обозначив через С„
экстремали С£ для ugQ. Теперь ясно, что семейство Си, u£U*,
определяет исключительную деформацию экстремали С. Так как
208
Гл. V. Теоремы существования и их следствия
соответствующее неравенство вида E3.3) можно получить за
счет аддитивности, то отсюда следует, что £/* — удовлетворитель-
удовлетворительный интервал для иа, С. Таким образом, лемма E3.2) в случае,
когда U—отрезок, доказана.
Теперь перейдем к случаю, когда U—треугольник. Можно
предположить, произведя, если понадобится, разбиение, что
и0—вершина треугольника U. Тог-
Тогда на любом отрезке 5, соединя-
соединяющем и0 с одной из точек проти-
противоположной стороны треугольника
U, мы можем определить исклю-
исключительную деформацию
Си, u£S,
экстремали С так, как мы это де-
делали в случае отрезка. Варьируя
5, мы определим тем самым семей-
семейство экстремалей
Ctt, u£U.
«о
и
Отрезки S.
Для каждого отрезка 5 построим в точке и0 малый угол Э,
который делится пополам отрезком 5 в окрестности точки и0, и
обозначим через 2 тонкий треугольник, а именно часть U, ле-
лежащую в В. Далее, если S*—некоторый отрезок, содержащий-
содержащийся в 5, a ul—точка этого отрезка, наиболее близкая к и0, то
через U* обозначим треугольник с вершиной в и„, стороны ко-
которого, сходящиеся в вершине и„, параллельны сторонам тре-
треугольника U, сходящимся в вершине и0, а третья сторона про-
проходит через второй конец отрезка S* и параллельна третьей
Тонкий треугольник £, определяемый
углом в.
сторона треугольника U. В точке и% построим угол 8*, который
делится пополам отрезком S* в окрестности точки и*0, и обозна-
обозначим через Е* тонкий треугольник, состоящий из части треуголь-
треугольника U*, лежащей в угле В*.
Отрезок 5* назовем удовлетворительным для точки и*, где
«"G-S*, если существует тонкий треугольник S*, построенный,
как выше, исходя из отрезка S*. с углом В* в вершине «J, такой,
что семейство С„, ы£ Е*, образует исключительную допустимую
§ 53. Теорема единственности Тонелли—Каратеодори 209
деформацию экстремали С* = Си*, когда точка и* принята за на-
начальную точку треугольника X*.
Мы докажем, что любой отрезок & удовлетворителен для
точки и0. Для этого мы повторим в несколько измененной форме
рассуждения, использованные при доказательстве леммы E3.2)
П
А
в случае, когда U — отрезок. Будем считать, что S — фиксиро-
фиксированный отрезок, и будем рассматривать его как отрезок дейст-
действительной оси (для которого и0—первая точка) в комплексной
плоскости. Это равносильно подходящему повороту осей в пло-
плоскости и.
Обозначим через w верхнюю грань таких точек Рб-S, что
uo<;u<g;P—удовлетворительный отрезок для точки и0. Обозна-
Обозначим через Q пересечение малого отрезка действительной оси,
для которого со—внутренняя точка, с отрезком 5. Первую и
последнюю точки отрезка п обозначим соответственно через а
и у, а через SJ обозначим отрезок ив ^ и ^ у. Теперь все све-
свелось к доказательству того, что Sf; — удовлетворительный отре-
отрезок для точки и0 при условии, что отрезок Q достаточно мал.
Заключим отрезок Q в малый треугольник Д, стороны ко-
которого параллельны сторонам треугольника U. Этого можно
добиться, приняв Q за рассмотренный выше
отрезок 5*, а Д — за соответствующий тре-
треугольник О*. Тогда точка а будет верши-
вершиной треугольника Д, а точка у будет лежать
на стороне /v, противолежащей вершине а.
Затем выберем любую точку Р, для которой
а < Р < V» и обозначим через /р отрезок, па-
параллельный стороне 1Ч и соединяющий две Малый никД.
другие стороны треугольника Д.
Предположим, что Q, а следовательно, и
Д настолько малы, что, согласно E3.1), существует такая исклю-
исключительная допустимая деформация экстремали С*^^, заданная
посредством семейства
что ее концевая деформация равна £(и), ы^Д, а со — начальная
точка треугольника Д.
Определив таким образом точки а, у и выбрав р указанным
выше способом, обозначим через SJ" отрезок ио<1ы<1р\ Так как
р<(о, то мы можем определить угол В* с вершиной и0, для
210 Гл. V. Теоремы существования и их следствия
которого семейство
Са, и е 2Г,
образует исключительную допустимую деформацию экстремали С,
где 2*—тонкий треугольник, соответствующий отрезку 5*. Это
остается справедливым и в том случае, когда мы уменьшаем
т.
'
Тонкий треугольник 2* н его продолжение
угол В*, и поэтому можно считать его настолько малым, что
сторона треугольника 2J, противолежащая вершине и0, содер-
содержится в /р. Для этого значения В* обозначим через 2о тонкий
треугольник, так же соответствующий отрезку S£.
Рассмотрим теперь любую точку ugZJ—2J. Обозначим
через 5 отрезок, проходящий через и и соединяющий вершину ы„
треугольника U с противолежащей стороной, а через «р —пере-
—пересечение отрезка 5 с /р. Соединим со с и посредством трех отрез-
отрезков: отрезка Гс5 от со до Р, отрезка Грс/р от |5 до ир и
отрезка Гс5 от щ до и. На каждом из этих отрезков семей-
ство С* образует исключитель-
л ную деформацию любого из своих
Г . элементов, так как они лежат в
-—■—-— """—' #м Д. То же самое справедливо для
семейства Си, так как Г, Г лежат
на отрезках, исходящих из «„, а
Гр лежит на Ъ\. Так как эти два
семейства совпадают в w и концы
•ь> соответствующих элементов одина-
г ковы, то последовательно получа-
ем, что С„ = С* в р, «р и в и.
Значит, Со совпадает с С* для всех и£2*— SJ. Отсюда сле-
следует, что семейство
§ 53. Теорема единственности Тонелли—Каратеодори 211
образует исключительную деформацию экстремали С. Поэтому
отрезок S* удовлетворителен для точки и0. Согласно определе-
определению со, отсюда вытекает равенство у=оо, так что Sg~S. Сле-
Следовательно, 5 удовлетворителен для точки и0.
Отсюда сразу следует, что функция x(t, и), определяющая
геодезическую параметризацию кривой Си, непрерывна по (t, и).
Поэтому семейство
Си, ueU,
образует допустимую деформацию экстремали С. Очевидно, что
эта деформация исключительная, так как ее ограничения
Са,
согласно первой части доказательство, суть исключительные
деформации для каждого S. Таким образом, лемма E3.3) до-
доказана.
E3.4) Теорема единственности. В благоприятной задаче для
каждой точки Р х-пространства существует одна и только одна
экстремаль, соединяющая начало с точкой Р. Эта экстремаль
простая и является единственной минимизирующей кривой, сое-
соединяющей начало с точкой Р.
Доказательство. Обозначим через В шар |х|<[р, а через 5
сферу |х| = р, где р — настолько малое число, что для каждой
точки Р £ В существует одна и только одна экстремаль, лежа-
лежащая в шаре В и соединяющая начало с точкой Р, а значит,
эта экстремаль всегда минимизирующая. (Существование такого
шара обеспечивает теорема B9.5) из § 29 гл. II, в которой
в качестве множества Е надо взять некоторый куб с центром
в начале, а в качестве W—все пространство.)
Пусть теперь Р—любая точка. Согласно теоремам E1.1)
и E1.2), существует минимизирующая экстремаль, соединяющая
начало с точкой Р. Мы утверждаем, что никакая другая экстре-
экстремаль не соединяет начало с точкой Р. Для того чтобы дока-
доказать это, предположим, что две различные экстремали С,, С2
соединяют начало с одной и той же точкой Р, н приведем это
предположение к противоречию.
Очевидно, что по крайней мере одна из этих экстремалей,
скажем С2, имеет точки, не принадлежащие шару В. Обозначим
через Q2 первую точку пересечения экстремали С2 со сферой 5,
а через Г2—дугу экстремали С2, следующую за точкой Q2. Если
Г2 возвращается в В, то укоротим экстремаль С2 до следующей
точки пересечения со сферой 5 и назовем эту точку точкой Р;
в этом случае экстремаль С, заменим единственной минимизи-
минимизирующей экстремалью, которая соединяет начало с точкой Р и
лежит в Б, а значит, отлична от новой экстремали С„. Следо-
212 Гл. V. Теоремы существования и их следствия
вательно, не нарушая общности, можно предположить, что Г2
не содержит ни одной точки, внутренней для В. В частности,
точка Р не лежит внутри В н, значит, экстремаль С, должна
пересечься со сферой 5 первый раз в некоторой точке Qt. Обо-
Обозначим через Г, дугу экстремали С,, следующую за точкой Q,;
можно снова считать, что дуга Г, не содержит ни одной точки,
внутренней для В. Обозначим через Г12 кривую, состоящую из
дуги 1\ и дуги Г2, проходимой в обратном направлении; таким
образом, Г12 соединяет точки Q, и Q2, проходя через точку Р.
Обозначим через Г проекцию кривой Г,2 на 5; при этом каждая
точка кривой Г12 заменяется точкой сферы 5, лежащей на луче,
проходящем через начало и эту точку кривой Г12.
Теперь разными (вполне элементарными) способами можно
определить непрерывную, не обращающуюся в нуль, кусочно-
непрерывно дифференцируемую функцию
где U — некоторый треугольник с вершинами и0, иг, «2, такую,
что когда переменная и описывает его стороны: от и, до ив, от
и2 до и0 и от «! до и2,—функция £(«) описывает
соответственно дуги Г„ Га и Г.
Теперь обозначим через ylt у2 дуги экстрема-
экстремалей С„ С2, предшествующие дугам Г„ Г2 и окан-
оканчивающиеся в точках Qlt Q2. В соответствии с
нашей основной леммой о деформации E3.2) мы мо-
можем определить исключительную допустимую де-
"L формацию
с„
экстремали Vi с их в качестве начальной точки треугольника U
так, что соответствующей концевой деформацией будет деформа-
деформация точки d, задаваемая функцией £(«).
На стороне треугольника, идущей от их до ы2, экстремали Сп
можно сразу отождествить с единственными экстремалями, ле-
лежащими в В и соединяющими начало с точками дуги Г, так как
это семейство допустимое, а деформация на этой стороне тре-
§ 54. Абсолютный и гомотопический минимумы 213
угольника U исключительная. Отсюда следует, что в точке и2
экстремаль Си преобразуется в у2.
На сторонах треугольника, соединяющих и, или ы2 с и0,
экстремали С„ отождествляются аналогично с дугами экстре-
экстремали Clt оканчивающимися в различных точках дуги Г,, или
дугами экстремали С2, оканчивающимися в различных точках
дуги Г2. Но тогда в точке и — ии экстремаль С„ можно отожде-
отождествить как с С,, так и с С,. Отсюда следует, что С, совпадает
с С2, а это противоречит нашему допущению.
Следовательно, для каждой точки Р существует ровно одна
экстремаль, которая соединяет эту точку с началом. Очевидно,
что эта экстремаль будет единственной минимизирующей кривой,
соединяющей эти точки, и, следовательно, она будет простой
экстремалью. Тем самым доказательство завершено.
§ 54
Абсолютный и гомотопический минимумы
на B...ii-компактных областях и многообразиях
В предыдущих параграфах, применяя методы Гильберта к вариационным
задачам, определенным во всем евклидовом пространстве, мы сочли необходимым
ввести допущения, которые по существу не позволяли решениям уходить в беско-
бесконечность иа пути к «месту назначения». Можно обойти эти ограничения, если рас-
рассматривать задачи, в которых допустимые кривые лежат в некоторой фиксирован-
фиксированной ограниченной области G. Обычно такие задачи относятся скорее к оптималь-
оптимальному управлению, поскольку это задачи с дополнительными ограничениями. Од-
Однако существует один случай, когда теория почти не изменяется при введении
ограничений, связанных с областью G, и его-то мы и изучим в этом параграфе.
Назовем этот случай случаем геодезической выпуклости.
Можно также рассмотреть более общие задачи, относящиеся к кривым, рас-
расположенным на данном многообразии, например на поверхности сферы. Такие
задачи тоже можно рассматривать как задачи с дополнительными ограничениями
в евклидовом пространстве, в которое погружено это многообразие. Однако в боль-
большинстве случаев удобнее изучать нх самостоятельно, используя локальные си-
системы координат на многообразии. Особенно это относится к ситуации, когда
многообразие компактно н ие имеет края, так как при этом можно применять
методы Гильберта, не вводя условия геодезической выпуклости.
В этом параграфе мы ограничимся рассмотрением замыкания
G ограниченной открытой области G х-пространства, однако под-
подразумевается, что х-пространство можно заменить любым диффе-
дифференцируемым многообразием. Будем предполагать, что наш пара-
параметрический лагранжиан L положительно определен и что все
точки х-пространства или некоторого содержащего G открытого
множества эллиптические. Тогда, в соответствии с теоремой
B9.5) из § 29 гл. II. можно указать такое р > 0, что любые
две точки Р, Q из G, расстояние между которыми меньше р,
можно соединить единственной минимизирующей кривой CPQ,
которая будет также и экстремалью. Область G назовем геодези-
214 Гл. V. Теоремы сушрствования и их следствия
чески выпуклой, если существует такое положительное б < р, что
для каждой пары точек Р, Q из G, расстояние между которыми
меньше б, CPq с G1'.
Хотя на первый взгляд может показаться, что понятие геодезической выпук-
выпуклости призвано сыграть в теории важную роль, иа самом деле оно вводится только
для того, чтобы не рассматривать кривые, достигающие границы области G. Ис-
Искусственность этого условия очевидна, когда
L{x, i)jLL(x,-x),
так как в этом случае оно требует, чтобы обе кривые СрпкСпр лежали в обла-
области G.
Обозначим через Q замкнутое множество упорядоченных пар
Р, Q, где P£G, Q£G. Будем говорить, что граница кривой С
лежит в Q, и писать dC£Q, если кривая С соединяет пару
точек Р, Q, принадлежащую множеству Q.'Обозначим через Л
такой класс допустимых параметрических кривых С, лежащих в G,
что dCgQ. Задачей на абсолютный минимум назовем задачу
нахождения кривой С£Л, на которой 3 (С) достигает своего
минимума относительно всех кривых из Л. Мы рассмотрим также
еще одну задачу.
Для этой цели введем деформации, которые будут не дефор-
деформациями в классе экстремалей, как в предыдущем параграфе, а
деформациями в классе допустимых кривых, лежащих в С
Понятием треугольной деформации мы пользоваться не будем,
ограничиваясь лишь понятием, соответствующим тому, что мы
назвали обычной деформацией. Кроме того, отрезком, который
мы обозначали раньше через U, будет теперь единичный интер-
интервал 0^ы^1 действительной оси, а роль начальной точки и0
будет играть первая точка этого интервала, т. е. 0. Непрерывной
деформацией в G допустимой кривой Со, где CocG, назовем
семейство допустимых кривых
Си, 0<ы<1,
каждая из которых расположена в G и имеет геодезическую
параметризацию
x(t, и),
где Т(и)—непрерывная функция на интервале 0^ы^1, а
x(t, и)—непрерывная функция в соответствующем множестве
точек (t, и). Кривые Со и Сх назовем соответственно начальной
и конечной кривыми деформации, и будем говорить о деформации
•> Автор употребляет термины geoconvex и geoconvexity. Правильнее, но
гораздо более громоздко, было бы говорить о «равномерно локальной геодези-
геодезической выпуклости».— Прим. ред.
§ 54. Абсолютный и гомотопический минимумы 215
от Со к С,. Эту деформацию назовем гомотопией в G, если все
кривые Си имеют одну и ту же пару различных концов, или
если все они замкнутые кривые. В обоих случаях будем гово-
говорить, что Сх гомотопна Со в С Далее, деформацию в G назовем
0,-гомотопией и будем говорить, что Ct Q-гомотопна СО в G,
если dCu£Q для каждого и из интервала 0^ы^1.
Множество Q назовем локально достижимым, если для каждой
пары (Ро, Q0)€fi и каждого е>0 существует такой шар W из
2/г-мерного произведения пространств, что
для любой пары (Р, Q)€Qf)W существует /О Г\
лежащая в Q непрерывная кривая (^@. •—^*—^—*^о
!2@). O^^^I, длина которой меньше е н
компоненты которой gj (/), 12@ являются ле-
лежащими в G допустимыми кривыми, соеди- О О п
няющими соответственно Р с Ро и Q с Qo. Q *^__^))s»—->с—*чо
Пусть теперь Л — непустой класс допусти-
мых кривых, а С„ —некоторый фиксирован-
ный элемент из А. Обозначим через 33
класс кривых С, Q-гомотопных Со, причем предполагается, что
fi — локально достижимое множество. Задачей на гомотопи-
гомотопический минимум назовем задачу нахождения кривой C$33, на
которой 3 (С) достигает своего минимума относительно кривых,
принадлежащих 33. Это—наша вторая задача.
Так же как и раньше, кривую С из соответствующего класса
(Л или 33), на которой 3 (С) достигает своего минимума, и после-
последовательность кривых из этого класса, на которой 3 стремится
к своей нижней грани, будем называть Q-минимизирующими.
Последовательность назовем строго внутренней, если существует
такое замкнутое подмножество КczG, что все, кроме, быть может,
конечного числа, кривые последовательности лежат в К- Кривую
назовем строго внутренней, если она целиком лежит в G; внут-
внутренней, если она лежит в G, кроме, может быть, концов, и пери-
периферийной, если она целиком лежит на границе G—G множества
G. Теперь мы можем доказать следующий результат:
E4.1) Теорема (существования абсолютного и гомотопического
минимума в ограниченной области), (i) В каждой из двух рассмат-
рассматриваемых задач из существования строго внутренней п-миними-
зирующей последовательности вытекает существование по крайней
мере одного решения, которое является строго внутренней экстре-
экстремалью. (П) Если G—геодезически выпуклое множество и класс Л
непустой, то каждая из двух задач имеет по крайней мере одно
решение, и каждое решение будет внутренней или периферийной
экстремалью.
216
Гл. V. Теоремы существования и их следствия
Доказательство этой теоремы основано на гильбертовской
конструкции и нескольких дополнительных замечаниях, к числу
которых относятся следующие леммы:
E4.2) Лемма. Пусть G—геодезически выпуклое множество.
Тогда любая малая допустимая кривая, лежащая в G, гомотопна
в G малой экстремальной дуге, лежащей в G и имеющей те же
концы.
E4.3) Лемма. Пусть G—геодезически выпуклое множество, и
пусть у—малая экстремальная дуга, лежащая в G и содержащая
по крайней мере одну точку из G. Тогда внутренняя часть дуги
у лежит в G.
Доказательство леммы E4.2). Пусть Yo—заданная допустимая
кривая вида x(t), O^t^l, и пусть Р, Q—ее концы, a R — R(t)—
движущаяся по ней точка с координатами x(t). Обозначим через
у и кривую, составленную из экстремальной дуги PR, где R — R (и),
и дуги RQ, принадлежащей кривой Yo- (Здесь подразумевается,
что PR—единственная экстремальная дуга, расположенная в ма-
малом шаре с центром в точке Р, а кривая Yo достаточно мала,
чтобы обеспечить эту единственность.) Из геодезической выпук-
выпуклости множества G следует, что для достаточно близких точек
Р, R из G экстремаль PR лежит в G. Таким образом, если
кривая Yo достаточно мала, то для каждого и кривые уа лежат
в G и дают искомую гомотопию.
Доказательство леммы E4.3). Предположим, что один из кон-
концов Р, Q дуги y. для определенности пусть это будет Q, лежит
в G, а промежуточная точка R лежит на границе области G.
Так как y—малая экстремаль, проходящая через R, то ее можно
погрузить в узкий пучок, и. следовательно, будет существовать
экстремаль, принадлежащая этому пучку и проходящая через
некоторую точку P*£G, близкую к Р (напомним, что P£G); эта
§ 54. Абсолютный и гомотопический минимумы 217
экстремаль будет проходить также через некоторую точку Q*,
близкую к Q, a Q* лежит в G, так как при помощи выбора
точки Р* можно добиться, чтобы точка "Q* была сколь угодно
близка к точке Q£G. Значит, экстремальная дуга P*Q*, которая
мала вместе с дугой у и имеет концы в G, содержит точку R,
принадлежащую границе области G, а это противоречит опреде-
определению геодезической выпуклости.
Следовательно, дуга у не может одновременно иметь конец
в G и внутреннюю точку, принадлежащую границе области G.
Укорачивая дугу у, мы можем вывести отсюда, что не существует
двух внутренних точек дуги у, одна из которых лежит в G, а
другая на границе области G. Объединив эти факты, получим
требуемое утверждение.
Доказанные выше леммы демонстрируют, насколько удобно понятие геоде-
геодезической выпуклости, введенное Каратеодори. Это понятие оказывается очень
полезным для задач, в которых, как и в задаче о кратчайшем расстоянии,
Цх, x)=L(x,—х). Однако в общем случае геодезическая выпуклость— весьма
ограничительное условие, оно скорее напоминает условие, известное под названием
«сверхвыпуклость», а не просто обыкновенную выпуклость. Обобщение понятия
выпуклости для задач с несимметричным лагранжианом {L{x, х)ф1*(х, —х)),
а также соответствующее обобщение утверждения E4.1) (ii) заслуживают вии-
маиия.
Доказательство теоремы E4.1). Так как доказательство этой
теоремы очень похоже на доказательство теоремы E1.3) (в кото-
котором используется конструкция Гильберта), то мы в основном
выделим те моменты, в которых они различны. Мы должны изу-
изучить два случая (i) и (ii) для каждой из двух задач, и мы сде-
сделаем это одновременно, ch-и две задачи незначительно отличаются
друг от друга: при изучении гомотопического минимума нужно
убедиться в существовании определенных деформаций. Случаи
(i) и (ii) тоже незначительно отличаются друг от друга; в случае
(i) будет очевидно, что операции, которые мы производим с на-
нашими кривыми, выполнимы в несколько расширенном множестве
/C<rG, а в случае (ii) мы докажем, что они могут быть прове-
проведены в G.
Для каждой задачи существует Q-минимизирующая последова-
последовательность Cv, v = 1, 2, ...; в случае (i) эта последовательность
содержится в К, а в случае (ii) она просто лежит в G. Выберем
подпоследовательность индексов v и модифицируем соответст-
соответствующие кривые Cv так же, как при доказательстве E1.3); числа
т, М, р определяются так же, как раньше, только зместо Е
берется К или G, а вместо 6 берется р. Разбив кривую Cv (из
подпоследовательности) на фиксированное число N малых дуг,
отделенных друг от друга точками разбиения а„, alt ..., а^, мы
должны проделать с ними следующие три процедуры.
218 Гл. V. Теоремы существования и их следствия
(a) Модифицируем кривые Cv (из подпоследовательности) так,
чтобы они соединяли фиксированную пару концов Р, Q вместо
переменной пары Pv, Qv. (Это означает, что точки а0 и одг больше
не зависят от v.)
Для того чтобы добиться этого посредством Q-деформации,
определенной на интервале O^u^l, присоединим для каждого
и к кривой Cv дающие искомую модификацию дуги от Р к Pv и
от Qv к Q не целиком, а только их части, связывающие Rv с Рх
и Qv с Sv, где пара Rv, Sv лежит в Q и зависит от и; когда и
возрастает, эта пара описывает в произведении пространств
короткую дугу от Pv, Qv к Р, Q.
(b) Можно сделать так, чтобы и остальные точки ак не зави-
зависели от v.
Пусть k фиксировано, и пусть Xv—точка ak на Cv, а X—ее
предельное положение [для подпоследовательности, выбранной
при доказательстве леммы E1.3)]. Соединим эти две точки (не
имеет значения, в каком порядке) короткой экстремалью. [В слу-
случае (ii) эта экстремаль заведомо лежит в G.] Обозначим через
Кк кривую, которую мы получим, если дважды опишем эту корот-
короткую экстремаль: сначала от Xv до X, а потом в обратном направ-
направлении. Обозначим через hk(u) более короткую кривую, которая
описывает только кусок нашей короткой экстремали от Xv до
некоторой промежуточной точки Zv и обратно; здесь Zv зависит
от параметра и и изменяется от Xv до X, когда и возрастает
от 0 до 1. (Такое сокращение двойного пробега можно пояснить,
напомнив о дурной привычке, свойственной некоторым водителям
городских автобусов: при отсутствии пассажиров они развора-
разворачиваются, не доезжая до конечной остановки, и в результате
на конечной остановке приходится ждать автобус более часа.)
Мы получим искомую модификацию кривой Cv, если присоеди-
присоединим к ней кривые Кк, &— 1,2, ..., N—1. К ней можно перейти
путем деформации, полученной (для O^u^l) посредством при-
присоединения кривых Л,Л(ы).
(с) Заменим N дуг кривой Cv, соединяющих ак_1 с ак при
к — \, 2, ..., N, короткими экстремальными дугами уь. Полу-
Полученная в результате этой замены кривая будет экстремалью С.
§ 55. На пути к автоматической теории существования 219
Ввиду геодезической выпуклости эта модификация, очевидно,
может быть проделана в G в случае (П).-Для того чтобы полу-
получить ее посредством деформации, нужно поступить так же, как
в лемме E4.2).
Таким образом, в результате всех этих модификаций мы
получаем (так же, как и в лемме E1.3)) решение С, которое
представляет собой экстремаль. В случае (i) кривая С лежит
в слегка расширенном множестве Kc:G, а в случае (п) она
лежит в С
Наконец, в случае (П) ни одно решение, которое содержит
точку из G, не может содержать точку границы области G в
качестве внутренней точки, так как тогда оно будет содержать
малую экстремальную дугу, лежащую в G и обладающую тем
же свойством, а это противоречит лемме E4.3).
§ 55
На пути к автоматической теории существования
В этом параграфе мы рассмотрим примеры, иллюстрирующие
трудности, которые нам придется принять во внимание, если мы
захотим, чтобы теоремы существования получались автоматически.
Раньше их рассматривали как контрпримеры, т.е. считали, что
они доказывают невозможность построения теории со столь
общими теоремами существования. Однако у нас другая точка
зрения на этот вопрос. В соответствии с изречением Гильберта
мы попытаемся обобщить понятие решения.
(a) Аналогия. Рассмотрим элементарную задачу отыскания
минимума функции одной переменной, заданной многочленом
х*—х. Согласно правилам математического анализа, эта функция
достигает своего минимума, когда 4х3 =1, т. е. при иррациональ-
иррациональном (хотя и алгебраическом) значении переменной х. Однако
если бы мы сформулировали эту задачу в те времена, когда
никто еще не имел представления об иррациональных числах,
то получили бы задачу без решения. Разумеется, нет никакого
смысла формулировать задачу о минимуме на множестве, которое
даже не замкнуто. Но ведь в вариационном исчислении задачи
были сформулированы в тот период, когда и само понятие кри-
кривой было лишь в зачаточном состоянии.
(b) Бесполезное обобщение. В наше время студенты одним ма-
махом расправляются не только с иррациональными числами, но
и с весьма общими понятиями функций, отображений и т. п.
Поэтому выглядело бы анахронизмом, если бы в вариационном
исчислении мы ограничивались рассмотрением только класса
гладких функций. Конечно, поскольку приходится рассматривать
220 Гл. V. Теоремы существования и их следствия
производные, естественно потребовать, чтобы производные соот-
соответствующих функций существовали по крайней мере почти всюду.
Рассмотрим с этой (по общему мнению, современной) точки зрения
простейшую вариационную задачу—задачу о кратчайшем рассто-
расстоянии в непараметрической форме. Для определенности предпо-
предположим, что мы ищем минимум интеграла
1
в классе действительных непрерывных функций jc (if), удовлетво-
удовлетворяющих граничным условиям лг(О) = О, *A) —I; при этом пред-
предполагается, что функции x(t) удовлетворяют следующему про-
простому и интуитивно оправданному условию: интервал 0<1£<11
можно разбить на конечное число отрезков, на каждом из ко-
которых функция x(t) либо монотонно возрастает, либо монотонно
убывает. Такие функции x(t) имеют производные почти всюду,
и именно этот класс непрерывных функций рассматривался одно
время как наиболее подходящий для теории рядов Фурье. Более
того, введение в обиход этого класса функций, что было сделано
Дирихле, считалось важной вехой в теории рядов Фурье, хотя
ныне эти функции кажутся совершенно банальными.
Во что превратится задача о кратчайшем расстоянии, если
мы примем такое, довольно скромное, обобщение классического
понятия допустимых функций x(t)?
В классе элементарных функций x(t) решением была функция
x(t) = t и минимум интеграла был равен \^2. Sh-o не что иное,
как евклидово расстояние между рассматриваемой парой концов
(О, 0) и A, 1).
Однако уже при столь скромном расширении класса допу-
допустимых функций, какое предложил Дирихле, решение выглядит
иначе. Им будет непрерывная монотонно возрастающая функция
x(t), имеющая почти всюду производную, равную 0". А соот-
соответствующий минимум нашего интеграла теперь будет равен 1.
Все это имеет такое же отношение к классическому варианту
задачи о кратчайшем расстоянии, как задача отыскания самого
большого англичанина к задаче определения самого крупного
позвоночного.
(с) Разрывные непараметрические слабые решения. Во многих
непараметрических задачах с неотрицательным лагранжианом,
удовлетворяющим условию Лежандра, приходится тем не менее
расширить классический класс допустимых кривых, добавляя
некоторые кривые, представленные посредством разрывных функ-
функций. Типичным примером является задача о минимальной поверх-
1} «Канторова лестница». — Прим. ред.
§ 55. На пути к автоматической теории существования 221
ности вращения, рассмотренная во вступлении. На плоскости
(/, х) эта задача имеет следующий вид:
а
\xV]+x2dt=m\n, x@)=I,
Если а здесь достаточно велико, то соответствующий парамет-
параметрический вариант задачи имеет решение в виде ломаной, состав-
составленной из отрезка оси t и двух вертикальных отрезков. В непа-
непараметрическом случае при правильном понимании задачи это
@,1)
решение следует тоже учитывать, потому что значение интеграла
3 (С) для этого параметрического решения равно пределу инте-
интегралов ,7 (Cv) для некоторой минимизирующей непараметрической
последовательности Cv, v=l, 2, ... .
Заметим, что значение 3 (С) нельзя в этом случае получить из написанного
выше интеграла, так как если x(t) — разрывная функция, у которой х@)=1,
х(а)=Ь, х(/)=0 при 0<t<a, то наш интеграл раеен нулю.
(d) Слабые параметрические решения, вытягивающиеся в беско-
бесконечность. Предыдущий пример показывает, что в параметри-
параметрическом случае следует учитывать решения с углами. Теперь
принято учитывать и вообще все спрямляемые параметрические
кривые, т. е. Есе параметрические кривые, имеющие конечную
длину. Этот класс кривых и допускал Тонелли в своих «Fonda-
menti». Однако существование в некоторых случаях «дешевых»
экстремалей (упомянутых в § 51) заставляет учитывать также и
кривые, имеющие бесконечную длину. (В предыдущем примере
именно из-за дешевой экстремали, коей является ось t, пришлось
учитывать решения с углами.)
Рассмотрим отображение комплексной плоскости г в комп-
комплексную плоскость £, заданное функцией
где С —ii + 'i2. z = x1-\-ix2. В плоскости z мы изучим задачу о
кратчайшем расстоянии на плоскости £. Лагранжианом этой
задачи является функция
L = (*>}/ х\ + х\.
222 Гл- У- Теоремы существования и их следствия
Экстремали являются образами прямых а|1 + Ь|2 = с и имеют вид
E5.1) /'"*' cos {х2—х%) = 1,
когда сфО, и х2 = const, когда с = 0; эти экстремали можно по-
получить параллельным переносом одну из другой. Для двух то-
■—- чек г', г", удовлетворяющих условию
минимизирующая кривая, соединяющая г' и г",
имеет указанный вид и является единственной
экстремалью с этими концами. Однако если
то ни одна экстремаль не соединяет заданные
точки, и решением является образ отрезка, про-
проходящего через начало, так что решение состоит
из двух параллельных прямых х2 = const, ко-
которые соединяют соответственно х'г с —оо и
— оо с х\. Мы должны считать, что они со-
соединяются в бесконечности, так же как их
образы соединяются в точке £ = 0; это реше-
решение можно сколь угодно точно аппроксимировать кривой, образ
которой не проходит через начало. И наконец, если
1*2— **|> Я,
то каждая кривая, соединяющая эти две точки, имеет образ,
который описывает угол, больший я, если смотреть из начала,
Экстремали, прохо-
проходящие через задан-
заданную точку.
►г"
так что минимум достигается, когда этот образ представляет
собой ломаную линию, проходящую через £ = 0. Значит, в этом
случае решением опять будет пара параллельных прямых, так
же как при \х'г—х\\ = п. В обоих случаях решение не является
тем, что принято называть кривой.
Рассмотренный выше пример, принадлежащий Каратеодори, показывает,
сколь сильно влияет на решение задачи наличие «дешевых» экстремалей. Не-
Несмотря на то что в этой задаче условие Якоби выполняется на всех эистремалях,
и она всюду эллиптическая и положительно определенная, экстремали, проходя-
проходящие через заданную точку, не покрывают плоскость.
(е) Спиральное закручивание решений вокруг начала. Начнем
с примера, известного еще Эйлеру. Этот пример представляет
§ 55. На пути к автоматической теории существования 223
собой некоторое упрощение примеров (с) и (d): в нем решение
стремится к началу. Рассмотрим отображение
1),
и опять будем считать, что наша задача на плоскости г состоит
в нахождении кривой кратчайшего расстояния на плоскости £•
Лагранжиан имеет вид
а экстремалями снова являются образы прямых линий. В поляр-
полярных координатах z = rew они задаются уравнением
ra cos а F—60) = const
или 6 = const, если образ проходит через точку £ = 0. Так же
как в примере (d), здесь следует различать два случая: когда
|6'—6"| < я/а, пару точек z', г" можно
соединить только одной экстремалью,
которая дает искомый минимум, а когда
16'—6"| ^ я/а, решение состоит из двух
отрезков, соединенных в начале. В этом
примере ситуация очень похожа на
ситуацию в примере (с). Решение можно
описать следующим образом: кроме тех
случаев, когда угловое расстояние
между точками г', г" меньше я/а, мы
выбираем наилучший путь до начала,
а затем наилучший путь до места на-
назначения. (Это очень напоминает пове-
поведение человека, путешествующего поез- _^^__^_^___
дом по Великобритании.) О * V»
Предыдущий пример можно теперь .
несколько изменить (как это предло-
предложил Хан) таким образом, чтобы ломаная линия, соединяющая
г' с г", превратилась в пару спиралей, ни одна из которых не
имеет касательной в начале. Вместо того чтобы ввести г, 6 как
полярные координаты точки z = x1-\-ixa, мы используем их как
вспомогательные переменные в одном из следующих преобразо-
преобразований:
E5.2) £=1(ге№)« (а
E5.3) £ = 1(ле'в)а (а
224 Гл. V. Теоремы существования и их следствия
Соответствующие лагранжианы имеют вид |г[а2^ф, |г|а~11Л|>,
где ф и \|з—на первый взгляд безобидные многочлены:
j хх—fa — х2) х2]2
(х\ + х%) (х\ + х\) + (хл + х2хг)г + 2 (х\ + х\) (хгхг—х2х,) (х.х, + х2х2).
Эти скучные выражения выглядят столь респектабельно, что трудно пред-
предположить, сколь замысловатую картину образуют экстремали этой задачи. Столь
же неожиданным было бы превращение неторопливой рутины, царящей в залах
солидной торговой фирмы или армейского универмага, в очаровательную хоре-
хореографию «Лебединого озера». (Впрочем, можно представить себе, что эта метамор-
метаморфоза вызвана снижением цеи; найти здесь оптимальный вариант, основанный на
должном понимании могучего эффекта дешевой распродажи,— разве это не ва-
вариационная задача?)
Экстремали, образы которых не проходят через начало, ведут,
себя нормально, а экстремали, образы которых содержат начало,
накручиваются спиралью на точку
г = 0. Эта спираль будет логариф-
логарифмической в случае E5.2), и длина
ее конечна, тогда как в случае
E5.3) длина бесконечна, а спи-
спираль накручивается на начало бо-
более стремительно.
Раньше решением была лома-
ломаная линия, а теперь оно превра-
превратилось в спиральную кривую, со-
составленную из пары спиралей, одна
из которых входит в начало, а
другая выходит из него. Это ре-
шение не имеет касательной в на-
начале ни с какой из сторон, а длина его конечна в случае E5.2)
и бесконечна в случае E5.3).
Это дает, пожалуй, довольно точное представление о длине
пути, который нам предстоит пройти для построения по-настоя-
по-настоящему удовлетворительной теории существования. При этом нас
будут подстерегать еще и другие неприятности.
§ 56
Первая ступень абстрактного подхода:
полунепрерывность на Б...и-компактном множестве
В этом параграфе мы вкратце изучим один подход, позво-
позволяющий найти приемлемые условия, которые выполняются для
некоторых вариационных задач и дают возможность получить
надежные теоремы существования абстрактного характера. То-
§ 56. Первая ступень абстрактного подхода 225
нелли использовал этот подход в своей книге «Fondamenti».
В следующей главе мы рассмотрим более общий подход.
Метод Тонелли тесно связан с классическим принципом
Вейерштрасса, согласно которому непрерывная функция / (х),
определенная на ограниченном замкнутом подмножестве евкли-
евклидова пространства, должна достигать своего минимума в этом
множестве. Здесь же вместо функции f(x), определенной на
подмножестве евклидова пространства, мы будем иметь дело с
функцией Э (С), определенной на множестве объектов С, которые
мы почему-то назвали кривыми.
Пример (а), рассмотренный в предыдущем параграфе, пока-
показывает, что было бы полезно, если бы множество кривых было
по крайней мере замкнуто относительно некоторой удобной
метрики. Этого вряд ли удастся достичь, если мы ограничимся
рассмотрением гладких или кусочно-гладких кривых. Кроме
того, обязательно должно выполняться свойство, аналогичное
ограниченности множества в евклидовом пространстве; таким
свойством, согласно § 48 гл. IV, является секвенциальная ком-
компактность. Следовательно, на данной стадии мы можем попытать-
попытаться сформулировать теоремы существования в Б...и-компактном
классе кривых. Таким классом будет класс кривых с равномерно
ограниченными длинами, лежащих в некотором кубе. Этот класс
кривых был изучен Тонелли.
Нам потребуются следующие сведения о спрямляемых кри-
кривых, т. е. о кривых конечной длины. Во-первых, длина опреде-
определяется как верхняя грань элементарных длин вписанных лома-
ломаных; во-вторых, на кривой конечной длины за параметр можно
принять длину дуги s, и тогда функция x(s), определяющая
кривую, когда s меняется от 0 до длины кривой К, удовлетво-
удовлетворяет условию Липшица
И«г)—*(Si)l<|s, — s2|
для каждой пары значений s2, sx из области определения пара-
параметра s. Однако здесь нам удобнее использовать параметр /,
который изменяется от 0 до 1 и удовлетворяет условию s=Kt.
Если x(t) — параметризация кривой, соответствующая этому
параметру, то условие Липшица принимает вид
И*.)—*('i)l</4<,-'il.
где К—по-прежнему длина кривой. Отсюда сразу следует, что
спрямляемые кривые с равномерно ограниченными длинами мож-
можно задать на отрезке 0<1£<11 посредством функций x(t), удов-
удовлетворяющих такому же неравенству с одним и тем же К.,
в качестве которого можно теперь взять верхнюю грань длин
этих кривых. Очевидно, что в этом случае рассматриваемые
функции равностепенно непрерывны (см. § 48 гл. IV), и, значит,
8 Nt 1274
226 Гл. V. Теоремы существования и их следствия
если кривые лежат в фиксированном кубе, то, согласно тео-
теореме D8.2) из § 48 гл. IV, множество их параметризаций x(t),
выбранных выше, секвенциально компактно.
Метризуем пространство спрямляемых кривых, отождествляя
каждую из них с ее параметризацией, определенной выше. Тогда
это пространство превратится в функциональное пространство,
элементами которого будут непрерывные функции х (t), О ^ / <11.
В этом параграфе мы используем в этом пространстве топологию
равномерной сходимости. В множество наших кривых мы вклю-
включим также те кривые, которые вырождаются в точку. В этом
случае функция x(t) равна постоянной, а длина соответствующей
кривой равна нулю.
Почти очевидно, что классический принцип минимума Вейер-
штрасса можно столь же успешно применять и для непрерывной
функции Э (С), определенной в секвенциально компактном замк-
замкнутом множестве. Фактически доказательство упрощается, потому
что Вейерштрассу нужно было доказать секвенциальную ком-"
пактность ограниченных подмножеств евклидова пространства,
а для нас эта часть доказательства излишня. Таким образом,
если Э (С) — непрерывная функция, то она достигает минимума
в любом замкнутом множестве кривых С, расположенных в фик-
фиксированном кубе и имеющих равномерно ограниченные длины.
Может показаться, что это последнее утверждение представ-
представляет собой искомую основную теорему существования в вариа-
вариационном исчислении. Однако мы прервем наши рассуждения для
того, чтобы процитировать следующий маленький анекдот из
книги Лебега «На окраинах вариационного исчисления» (En Mar-
Marge du Calcul des Variations):
«Все мои статьи [по этому предмету] связаны с одной школьной «шуткой».
В колледже Бове мы часто доказывали, что в треугольнике одна сторона равна
сумме двух других. Рассмотрим треугольник ABC. Если точки Alt Blt C\ — сере-
середины сторон этого треугольника, то
ВА+А С=ВС1-\-С1А ,-М i
С каждым из треугольников BCxAlt Л^С поступим так же, как с треугольником
ABC. Мы получим ломаную линию, образованную восемью отрезками и равную
ВА-\-АС. Продолжая этот процесс, мы получим последовательность ломаных ли-
линий, которые все меньше и меньше удаляются от стороны ВС и имеют длину,
равную сумме длин двух других сторон первоначально взятого треугольника.
Ученики колледжа Бове заключали отсюда, что отрезок ВС, являющийся гео-
геометрическим пределом наших ломаных линий, имеет длину, равную сумме длин
двух других сторон ВА-\-АС. Мои школьные товарищи видели в этих рассуж-
рассуждениях только хорошую шутку. А меня эти рассуждения очень тревожили, так
как я не видел разницы между ними и доказательствами, относящимися к объе-
объемам и поверхностям цилиндров, конусов, сфер, а также к длине окружности.»
Урок, который можно извлечь из этой цитаты, таков: ученик,
который находит какой-нибудь вопрос трудным для понимания,
§ 56. Первая ступень абстрактного подхода
227
может вполне оказаться бесспорно лучшим учеником в классе.
Весьма странное совпадение: когда я писал эти строки, Бертран
Рассел рассказывал по радио, что, по -словам его коллеги, Вит-
тгенштейн «выделялся среди других студентов тем, что из всей
аудитории только он один выглядел озадаченным».
В
Однако более уместно отметить здесь, что, согласно истории,
рассказанной Лебегом, длина не является непрерывной функ-
функцией. Другими словами, условия, при которых доказывается
вейерштрассовскии принцип минимума, не выполняются даже в
задаче о кратчайшем расстоянии—простейшей из всех вариаци-
вариационных задач. Значит, этот принцип не может быть фундаментом
вариационного исчисления. Вопрос заключается теперь в том,
чем же можно заменить этот принцип.
W. H. Young", отец автора этой книги, любил вспоминать,
что этот самый вопрос задал ему один молодой итальянский
математик. Ответом был вопрос: «А Вы умеете пользоваться
полунепрерывностью?» Этим молодым итальянцем был Леонида
Тонелли, а полунепрерывность была тогда совсем новым поня-
11 Ну как же тут быть с транскрипцией?!—Прим. ред.
8*
228 Гл. V. Теоремы существования и их следствия
тием, известным лишь немногим. В руках Тонелли это понятие
стало мощным средством, позволившим создать качественно новый
подход к вариационному исчислению.
Напомним, что функция F(P), определенная на множестве
элементов Р, в котором пределы имеют смысл, называется полу-
полунепрерывной снизу на элементе Ро, если она удовлетворяет сле-
следующим условиям: (i) F (Р) принимает значения на расширенной
действительной оси, т. е. кроме действительных чисел ее значе-
значениями могут быть +оо и —оо; (п) для Рв эта функция опре-
определена и F(PB)^— оо; (Hi) F(P0)<liminfF(P) при Р — Ро.
Если эти условия выполняются для каждого элемента Ро из
области определения, то функция F (Р) называется полунепрерыв-
полунепрерывной снизу.
Конечно же, вейерштрассовский принцип минимума справед-
справедлив и для полунепрерывной снизу функции F (Р), определенной на
секвенциально компактном замкнутом, т. е. на Б...и-компактном,
множестве. Действительно, существует последовательность Pv,'
на которой реализуется нижняя грань функции; далее, существует
такая подпоследовательность индексов v, что Pv стремится к пре-
пределу Ро, и, ввиду полунепрерывное™, F (Po) <Ilim F (Pv) = inf F (P),
а это неравенство возможно только в том случае, если на эле-
элементе Ро достигается минимум.
Приводимый ниже результат показывает, сколь велико зна-
значение идеи Тонелли в вариационном исчислении.
E6.1) Теорема. Пусть L(x, х)—параметрический лагранжиан,
выпуклый по х. Тогда 3 (С)—полунепрерывная снизу функция
в любом классе К кривых равномерно ограниченной длины, распо-
расположенных в некотором кубе.
Учитывая новую формулировку вейерштрассовского принципа
минимума, получаем при тех же предположениях следующее
непосредственное следствие:
E6.2) Теорема. 3 (С) достигает своего минимума в К, если
класс К замкнут.
Строго говоря, эта теорема скорее относится уже к той части
нашего предмета, в которой рассматриваются задачи на минимум
при наличии дополнительных ограничений. Однако во многих
задачах условия таковы, что, не нарушая общности, можно без
особого труда исключить кривые, не принадлежащие некоторому
такому классу К-
Теорема E6.1) сама является следствием более общей теоремы,
которую мы приведем ниже. Пусть задана спрямляемая кривая
Св, параметризованная, как и раньше, посредством функции х0 (t),
зависящей от параметра t (O^/^l), пропорционального длине
§§ 57, 58, 59 229
дуги s вдоль Со. Параметрический лагранжиан L(x, х) назовем
выпуклым вдоль кривой Со, если он удовлетворяет следующим
условиям:
(i) L—выпуклая по х функция при л: = 0 для каждой точки
х кривой С„;
(ii) L—выпуклая по х функция при х= xB(t) для x = xn(t)
для почти всех t из интервала 0^£<11.
Будем говорить, что спрямляемая кривая С„ удовлетворяет
условию Вейерштрасса, если L(x, x) — выпуклый лагранжиан вдоль
Со в этом смысле.
E6.3) Теорема. Для того чтобы функция 3 (С) была полуне-
полунепрерывной снизу на Со в каждом классе К кривых равномерно
ограниченной длины, расположенных в некотором кубе, классе
таком, что либо С0£К, либо каждый элемент из К имеет те
же концы, что и Со, необходимо и достаточно, чтобы для кри-
кривой Св выполнялось условие Вейерштрасса.
Заметим, что если кривая С„ минимизирующая, то 3 (С)—
полунепрерывная снизу функция на Со в классе допустимых
кривых с теми же концами, а значит, и в любом подклассе.
В качестве следствия теоремы E6.3) получаем
E6.4) Необходимость условия Вейерштрасса. Для того чтобы
спрямляемая кривая Со была минимизирующей, необходимо, чтобы
для нее выполнялось условие Вейерштрасса.
Доказательство теоремы E6.3) можно будет легко получить
из теории обобщенных кривых, которой мы посвятим следующую
главу.
§§ 57, 58, 59
Эти параграфы мы оставим без содержания н предоставим читателю возмож-
возможность трижды перевести дух.
Они будут тем «заданием», на которое иногда ссылается автор этих строк
в заявлении о необходимости пропустить лекцию (обычно с целью побывать на
заседании математического общества). Бланк, на котором пишется такое заявле-
заявление, содержит графу: «Занятия в моих группах будут проведены ...», н я обычно
пишу здесь: «с помощью дополнительных заданий». Едва ли нужно объяснять,
сколь существенны такие передышки при изучении математики.
Глава VI
Обобщенные кривые и потоки
§ 60
Введение
В этой главе рассматриваются совсем другие методы, разра-
разработанные сравнительно недавно автором данной книги. Они будут
применяться нами и в теории оптимального управления. Поэтому
настоящая глава в значительной степени независима от преды-
предыдущих, если не считать вспомогательного материала, связанного
с выпуклостью и функциональным анализом; кроме того, она
предъявляет совсем иные требования к читателю в смысле его
знакомства с теорией функций действительного переменного.
Поэтому мы не будем торопиться: мы хотим дать читателю время
постепенно освоиться с этими новыми методами и, с другой сто-
стороны, как можно полнее осветить их место в развитии совре-
современной математики и человеческой мысли вообще.
В данной главе мы собираемся сделать шаг по пути создания
такой теории, в которой теоремы существования выполнялись
бы автоматически. Бессмысленно браться за это дело, не распо-
располагая подходящими средствами, а классических понятий теории
функций для этой цели недостаточно: нужна гораздо большая
общность и гибкость. Они понадобятся нам в еще большей сте-
степени, когда мы вплотную займемся оптимальным управлением.
В связи с этим придется по ходу дела пересматривать некото-
некоторые наши понятия. Мы начнем с ревизии понятия кривой и,
следовательно, понятия решения вариационной задачи или диф-
дифференциального уравнения. Это никоим образом не вызвано
стремлением во что бы то ни стало порвать с традицией: просто
новое здание заслуживает нового фундамента. Понятия, унасле-
унаследованные от предшествующих поколений, не были ниспосланы
с неба; люди придумали их—людям их и менять. Этому по
крайней мере научил нас Галилей.
Рассматриваемое ниже понятие обобщенной кривой естественно
возникает в вариационном исчислении. Как покажут примеры,
это понятие неявно присутствует и во многих вопросах повсе-
повседневной жизни, хорошо знакомых каждому из нас. К тому же
за тридцать пять лет, прошедших с того времени, когда автор
этих строк впервые сформулировал это понятие, оно было дважды
открыто заново: сначала специалистами по теории игр в форме
смешанных стратегий, а позднее—специалистами по дннамиче-
§ 61. Интуитивные соображения 231
скому программированию в форме так называемого скользящего
режима.
Общее понятие потока, также рассматриваемое ниже, связано
с решениями краевых задач в теории дифференциальных урав-
уравнений; оно играет роль в оптимальном управлении, равно как
и в гидромеханике. В § 12 гл. I мы говорили о геодезическом
потоке и о линиях потока вместо прежних терминов, в которых
фигурировало слово «поле». Теперь же смысл, вкладываемый
нами в слово «поток», будет гораздо ближе к его буквальному
значению. Возможно, что введение понятия обобщенного потока
применительно к движению жидкости помогло бы пролить свет
на такие малопонятные явления, как турбулентность, ударные
волны и кавитация, которые гидромеханика пытается интерпре-
интерпретировать как предельные явления при малых значениях вязкости.
(Последнее очень напоминает предельное явление, лежащее
в основе парадокса неравенства треугольника, который мы, цити-
цитируя Лебега, привели в последнем параграфе предыдущей главы.)
Впрочем, мы занимаемся здесь не гидродинамикой—понятие
потока понадобится нам для оптимального управления; разумеется,
мы будзм пользоваться им и в этой главе.
Все эти понятия в какой-то степени родственны «распреде-
«распределениям» Л. Шварца, точнее их обобщению—«потокам» де Рама.
Этими понятиями мы здесь не пользуемся, хотя и заимствуем
из теории де Рама важную интерпретацию понятия границы.
§ 61
Интуитивные соображения
Мы рассмотрим несколько вариантов парадокса неравенства
треугольника («шутки колледжа Бове» из книги Лебега, проци-
процитированной в конце предыдущей главы). Все эти варианты можно
сформулировать в виде вариационных задач, а первый из них
является частным случаем так называемой навигационной задачи
Цермело. Не вдаваясь в аналитические подробности, мы сфор-
сформулируем здесь практическую задачу, с которой может столк-
столкнуться всякий, кто отправляется в плавание под парусами.
(Конечно, речь идет об истинных любителях парусного спорта,
а не о тех, кто нарушает спокойствие водных просторов роко-
рокотом мотора и ядовитыми выхлопными газами.) Задача состоит
в том, чтобы проплыть против ветра от точки А до точки S,
где А и В находятся посередине реки, причем В ниже по тече-
течению. Любители парусного спорта часто сталкиваются с этой
задачей. Если мы для начала не будем учитывать течение и
предположим, что река достаточно широка, то каждому матросу
известно, что следует идти, меняя галсы, например плыть вдоль
ломаной линии АХВ, где АХ и ХВ составляют со стороной АВ
232
Гл. VI. Обобщенные кривые и потоки
в точках А и В определенный, причем один и тот же, угол а,
который следует выбрать оптимальным образом. На этом пути
он действительно может использовать ветер, чтобы плыть против
него в обеих позициях под наиболее выгодным углом а. Следуя
А
В
так, он добирается из Л в В за наименьшее время, если река
достаточно широка и нет течения.
Безусловно это не единственное решение. Наш матрос может
столь же успешно менять галс более одного раза, т. е. дви-
двигаться вдоль ломаной линии, имеющей более одного угла, звенья
ветра
которой по-прежнему составляют угол а с направлением АВ.
Например, он может двигаться вдоль любого из зигзагов, со-
составленных из четырех, восьми или шестнадцати отрезков, кото-
которые изображены на рисунках. Если не учитывать задержки при
изменении направления, то при движении вдоль каждого из
этих зигзагов время, затраченное на перемещение из Л в В,
будет тем же самым, что и при движении вдоль ломаной АХВ.
§ 61. Интуитивные соображения
233
Аналогичный вывод справедлив и для зигзага, состоящего из
2V равных отрезков, параллельных то АХ, то ХВ. На таком
зигзаге при соответствующем выборе числа у судно сколь угодно
мало отклоняется от отрезка АВ. Очевидно, что по такому
маршруту можно двигаться даже и в том случае, когда река
относительно узкая.
В
АЛАЛЛЛАЛ
в
Если мы теперь плывем не в стоячей воде, то на уже опи-
описанное движение будет накладываться дрейф по течению. Мы
предположим, что течение в середине наиболее быстрое (на прак-
практике так и бывает). В этом случае лучше всего двигаться, меняя
галс очень часто, так чтобы все время оставаться вблизи от-
отрезка АВ. В идеальном случае нужно было бы оставаться на
самом отрезке АВ, меняя галс бесконечно часто. Это означает,
что паруса надо постоянно перемещать из одного положения
в другое так, как если бы в каждой точке судно было направ-
направлено попеременно то параллельно АХ, то параллельно ХВ.
Таким образом, мы видим, что существует идеальное решение,
которое следует отличать от отрезка АВ, ибо хотя судно фак-
фактически проходит путь АВ, его направление в каждой точке
параллельно то АХ, то ВХ.
Вторым примером будет известная задача Максвелла о нахож-
нахождении наилучшего пути при подъеме на гору. Б некотором
234
Гл. VI. Обобщенные кривые и потоки
смысле ее можно рассматривать как задачу, стоявшую перед
лыжниками в те времена, когда не существовало подъемников
и горнолыжный спорт был спортом для взрослых, а не детской
забавой вроде того, как подняться на лифте на верхний этаж,
а затем съехать вниз по перилам. Для
положения левой лыжи того чтобы взобраться по крутому скло-
склону, необходимо было переступать «елоч-
«елочкой», располагая лыжи под углом к основ-
основному направлению движения. Точно так
же приходится поступать и при подъеме
на крутой холм без лыж. В этом случае,
положения правой лыжи чтобы не соскользнуть, надо ставить ступ-
— ни под соответствующим углом к направ-
направлению подъема.
Мы снова опустим аналитические подробности и будем счи-
считать, что эта задача отличается от задачи о кратчайшем рассто-
расстоянии только на тех участках местности, где наибольший наклон
превышает определенную постоянную а, которая равна наиболее
выгодному наклону, позволяющему наби-
набирать высоту без соскальзывания. (С такой
задачей сталкивается и инженер при стро-
строительстве автомобильной дороги в горах.)
Мы ищем самый лучший (при этих усло-
условиях) путь из пункта А к определенной
вершине В.
Для случая выпуклой горы Максвелл
.• нашел следующее решение: нужно придер-
живаться пути, который будет обвивать
гору, имея оптимальный наклон а, до
тех пор, пока местность не выровняется настолько, чтобы оста-
остаток пути можно было провести по геодезической до вершины
В. Однако в общем случае, когда перед нами целый горный
хребет, такая процедура может завести не на ту гору.
Альпинисты, лыжники и строители дорог придумали более
надежное решение этой задачи, которое гарантирует восхождение
именно на вершину В, а не на какую-нибудь другую вершину
§ 61. Интуитивные соображения
235
В' или В". Для этого надо сначала провести геодезическую Г
от А до В. Затем лыжник должен просто двигаться вдоль Г, если
наклон не очень крутой, и должен располагать свои лыжи попе-
попеременно в двух направлениях под оптимальным углом а, если
наклон горы превышает угол а. Таким образом, по существу он
должен двигаться бесконечно мелким зигзагом вдоль Г, а не по
самой геодезической Г. Стро-
нтелидорог заменяют крутой
участок геодезической конеч-
конечным зигзагом, составленным
из конечного числа гладких
частей с наклоном а, соеди-
соединенных крутыми поворотами.
Что касается альпинистов,
то для них решением может
быть либо аналогичная кри-
кривая, либо бесконечно мелкий
зигзаг вдоль геодезической
Г. Альпинистам хорошо из-
известно, что при восхождении
на гору, срезая углы на зиг-
Решение Максвелла.
Часть решения,
полученного
строителем-до-
строителем-дорожником.
заге, времени не сэкономишь. Чтобы не соскользнуть, альпинист,
так же как и лыжник, располагает свои ступни под оптимальным
углом а и, таким образом, описывает бесконечно мелкий зигзаг
вдоль кратчайшего пути; при этом он затрачивает на восхожде-
восхождение такое же время, как при движении по конечному аппрокси-
аппроксимирующему зигзагу.
При обсуждении этой задачи мы, конечно, не учитывали
существования отвесных скал, для восхождения на которые
альпинисты применяют специальную технику, а лыжники и
строители дорог должны их избегать.
Перейдем теперь к рассмотрению третьего примера того же
типа, причем в этом случае мы уже проведем подробные вычис-
вычисления. Для простоты представим задачу в непараметрическом
виде. Рассмотрим минимум интеграла
$A
относительно действительных допустимых функций x(t), удов-
удовлетворяющих граничным условиям х@) = хA) = 0.
Вдоль ломаной линии, изображенной на рисунке ниже, на по-
последовательных частях разбиения интервала 0^/^1 начетное
число подинтервалов равной длины е поочередно либо х = 1, либо
х = —1. Соответствующая функция x(t) принимает значения от
236 Гл. VI. Обобщенные кривые и потоки
О до е, и, значит, подинтегральная функция никогда не превос-
превосходит I +£2- Следовательно, значение этого интеграла не больше
чем I + е2.
С другой стороны, очевидно, что для любой допустимой кри-
кривой, определенной на интервале 0^^^ 1, подинтегральная функ-
функция ^ 1 и равна 1 только тогда, когда одновременно выпол-
выполняются оба равенства х = 0 и х = ± 1 • Отсюда следует, что ниж-
няя грань значений нашего
интеграла равна I и что мы
приближаемся к ней, когда
x(t) определяется ломаной,
изображенной на рисунке,
причем длина е подинтерва-
лов разбиения стремится к
нулю.
Мы не получим решения
этой задачи, полагая х = 0,
так как тогда х = 0 и значе-
ние интеграла будет вдвое
большим. Для того чтобы
получить решение, нужно расширить класс допустимых кри-
кривых, т. е. рассмотреть класс л содержащий бесконечно мелкий
зигзаг, для которого х = 0, ах равно то + 1, то —1. Эту новую
«кривую» можно описать следующим образом: она имеет пару
наклонов +1 и —1 в каждой точке, причем вес (или вероят-
вероятность) каждого из этих наклонов раЕен 1/2. Это же описание
применимо с незначительными изменениями и к решениям двух
предыдущих примеров.
Таким образом, чтобы получить теорию, в которой теорема
существования выполняется автоматически, нужно коренным
образом изменить наше представление о допустимой кривой.
§ 62
Немного о семантике
В предыдущих главах читателю была предоставлена свобода вкладывать
в понятие допустимой кривой то содержание, с которым он лучше всего знаком
Однако иам придется самым решительным образом расстаться со всеми традицион-
традиционными интерпретациями этого понятия, если мы захотим включить в число допу-
допустимых кривых тот странный бесконечно мелкий зигзаг, о котором шла речь
в предыдущем параграфе
У читателя может возникнуть законный вопрос: кто дал нам право коренным
образом измеиять значенне такого всем хорошо известного слова, как «кривая»?
Подобный вопрос относится, в сущности, ие к математике, а к семантике. Тем ие
менее и для математики он имеет принципиальное значение, если вспомнить о той
огромной роли, которую играют в ней определения. Такой вопрос способен поста-
поставить в тупик многих читателей, в том числе математиков-профессионалов; дело
в том, что даже специалисты по логике не имеют по этому вопросу еднного мнеиия.
§ 63. Параметрические кривые в Вариационном исчислении 237
Вопрос этот очень неплохо поставлен в книге Льюиса Кэррола «Сквозь зер-
зеркало и что там увидела Алиса».
«Когда я пользуюсь каким-нибудь словом,-—раздраженно пояснил Шалтай-
Болтай,— оно обозначает именно то, что я в данный момент им называю,— не
больше и не меньше.
Вопрос в том.— сказала Алиса,— возможно ли заставить одно и то же слово
обозначать столько разных вещей.
Вопрос в том,— повторил Шалтай-Болтай,— кто распоряжается словом,—
только и всего».
Взгляд, который высказывает Шалтай-Болтай, известен под названием номи-
номинализма. Он восходит к софистике древней Греции и был довольно заметным явле-
явлением в средневековой философии. В математике номинализм снова вошел в моду
в нынешнем столетии. К примеру, Г. X. Харди обычно отстаивал его в своих лек-
лекциях о расходящихся рядах.
С точки зрения иоминалистов, мы имеем полное право изменять любое опреде-
определение, какое только пожелаем. Диаметрально противоположной точки зрения
придерживаются догматики, к которым Харди, несомненно, относил клерикалов
и военных. Их взгляды приблизительно передаются следующими строчками ста-
старинных стишков: «Никто не смеет возражать, когда я говорю» и «То, что я трижды
повторил, оспаривать нельзя». В такой обстановке, конечно, не может быть и
речи о каких бы то ни было изменениях. Однако тем. у кого еще нет никаких пред-
предубеждений и кому пока что в равной степени безразличны как номинализм, так
и догматизм, ситуация отнюдь не кажется столь определенной.
Обсудим промежуточную точку зрения. Уже давно известно, что в матема-
математике истинный смысл теоремы до конца раскрывается лишь в ходе ее доказательст-
доказательства, и если найдется такой болван, который будет заучивать только формулировки
теорем, игнорируя доказательства,— он будет тратить время впустую. То же
'самое относится и к определениям: истинный смысл термина следует искать не
в его формальном определении, а в его употреблении. В этой мысли нет ничего
нового; кстати, она относится не только к математике. Именно таким способом
Платой в своих «Диалогах» пытается выясиить истииное значение некоторых слов.
Его метод можно назвать сократовским анализом. Уместно упомянуть также одно
из эссе Р. Л. Стивенсона, где говорится о литературной героине, которую выда-
выдавали за принцессу. Однако, замечает Стивенсон, как только она начинала гово-
говорить, сразу обнаруживалось, что это всего-иавсего простая торговка рыбой.
Учитывая все сказанное, мы не только имеем право, но просто обязаны под-
подвергнуть критическому анализу все наши определения в свете их употребления
и пересмотреть их (даже коренным образом), если они нас не устраивают.
§ 63
Параметрические кривые в вариационном исчислении
Определение параметрической кривой прошло длительный период эволюции,
и в конце концов из конгломерата идей сформировалось понятие, известное теперь
под названием «кривая Фреше». Существуют также аналогичные определения по-
поверхностей Фреше. Эти определения включают две стадии: на первой стадии
дается определение параметризации кривой или поверхности, а иа второй опре-
определяется эквивалентность двух таких параметризаций, с тем чтобы указать, когда
две параметризации задают одну и ту же кривую или поверхность, а когда нет.
Параметризацией кривой называется непрерывная вектор-функция x(t),
определенная на некотором интервале действительной оси (обычно на конечном
замкнутом интервале /!</</2). Параметризация поверхности определяется ана-
аналогично, только переменная / принимает значения из двумерной фигуры; эта
фигура не обязана при этом лежать иа плоскости, она может быть сферой или
какой-нибудь другой элементарной двумерной поверхностью.
238
Гл. VI. Обобщенные кривые и потоки
Вторая стадия определения кривой или поверхности Фреше более сложна.
Принято считать, что при подстановке непрерывной строго возрастающей функции
/(т), определенной на интервале т,<:тгйт, и удовлетворяющей условиям f(Tj)=f,,
<(т2)=/2, в функцию x(t) мы получаем функцию %(x)=x(t(x)), т1<т<т2, которая
является другой параметризацией той же самой кривой. Для параметризаций
поверхностей таким же свойством обладает непрерывный сохраняющий ориента-
ориентацию гомеоморфизм t(r), отображающий основную фигуру — область изменения
t — иа область изменения т. Однако такие замены параметра доставляют очень
стесняющее понятие эквивалентности, и основная идея Фреше заключается
в том, чтобы использовать их не для определения эквивалентности двух парамет-
параметризаций кривой или поверхности, а для определения расстояния. После этого
фреше называет эквивалентными параметризации, расстояние между которыми
равно нулю.
Определения Фреше имеют то преимущество, что они одновременно задают
метрику. Таким образом, пространство кривых превращается в метрическое
пространство, а в нем возможны многие построения, к которым мы привыкли в ев-
евклидовом пространстве. Тем самым изучение кривых оказывается доступным ме-
методам функционального анализа. В те времена, когда функциональный анализ
только зарождался, каждый воспринимал определения Фреше как «то, что в сущ-
сущности и надо». Однако в наше время в функциональном анализе значительное
место занимают идеи двойственности, которые чужды определениям Фреше.
Для вариационного исчисления и для анализа вообще определения Фреше не
пригодны. В случае кривых необходимые усовершенствования произвел Тоиелли.
В вариационном исчислении нужно уметь определять интеграл от лагранжиана
L(x, x) вдоль кривой С. Это означает, что мы ие можем использовать параметри-
параметризацию* (<).п°ка не убедимся в существовании интеграла отL(x{t), x(t)), и не можем
считать две параметризации эквивалентными, если оии не дают одно и то же зна-
значение этого интеграла. Поэтому Тонелли рассматривает только абсолютно непре-
непрерывные параметризации x(t); интеграл от L понимается при этом в смысле Лебега,
а эквивалентность параметризаций соответствующим образом ограничивается.
Более приспособленным к определениям Фреше оказывается другое понятие
интеграла, а именно интеграл в смысле Вейерштрасса, который ие требует
дополнительных ограничений, ио здесь нас интересует не это.
Щетинистый
квадрат.
Мы хотим подчеркнуть, что определения кривых и поверхностей Фреше в их
первоначальном виде для вариационного исчисления непригодны, и их нужно
модифицировать. Поэтому не следует считать их неприкосновенными. Как только
мы с этим согласимся, останется лишь выяснить, как наилучшим образом выпол-
выполнить необходимую модификацию.
Для того чтобы обсудить этот вопрос, рассмотрим два типичных примера:
«кривую фигуриста» и «щетинистый квадрат». Кривая фигуриста с началом А
и концом В состоит из отрезка АО, восьмерки, две петли которой соединяются
в точке 0, и отрезка ОВ. А щетинистый квадрат состоит из горизонтального квад-
квадрата и некоторого числа вертикальных отрезков, нижние концы которых лежат
на этом квадрате.
§ 63. Параметрические кривые в вариационном исчислении 239
Кривую фигуриста от А до В можно описать двумя способами: (а) так, как
указано на рисунке, т. е. в последовательности I, II, III, IV, где I—отрезок АО,
II—верхняя петля восьмерки, III — нижняд петля и IV — отрезок ОВ;
(Ь) так же как в случае (а), только сначала описывается петля III, а потом пет-
петля II- Эти два способа соответствуют двум элементарным кривым Фреше, кото-
которые мы обозначим Сх и С2.
Описание второго примера можно свести к описанию поверхности чертежной
кнопки, так как щетинистый квадрат получается из обычного квадрата, если мы
вырежем из него несколько маленьких кружков и заменим их кнопками. Поэтому
достаточно описать параметризацию одной кнопки, показав тем самым, что оиа
является поверхностью Фреше. Эту параметризацию мы определим как функцию
на круге 0<г<г2, используя полярные координаты (г, 6). Для описания кнопки
мы применим цилиндрические координаты (р, <р, г) с должным образом выбранным
началом 0.
Искомая параметризация имеет вид
9=1 (г). Ф=е. z=g(r),
где для некоторого положительного числа гх<г^ функции f(r), g(r) определяются
так:
О, 0<г<лг, ( 1-—,
'М=\ г-Г
_ '■ , г1 < л < r2; I 0, лх < г < л2.
В вариационном исчислении «кривая фигуриста» и «щетинистый квадрат»
создают трудности, несоразмерные с их интуитивной наглядностью и простотой.
Поверхность чертежной кнопки.
Согласно определению Фреше, как уже было сказано, существуют две кри-
кривые фигуриста: С! и С2, в соответствии с тем, в каком порядке он описывает петли
восьмерки. В то же время в любой вариационной задаче
Тем самым если Ct — одно ее решение, то С2 обязательно будет вторым решением
той же задачи. Это «феномен идентичных близнецов»: близнецы отличаются друг
от друга только пробором в волосах и никогда не показываются на глаза в одно
240 Гд- Vt- Обобщенные кривые и потоки
и то же время, даже в разных местах. Кто поверит, что их двое? Разве это не то же
самое, что дать одному и тому же человеку два имени и называть его, в зависи-
зависимости от прически, то одним именем, то другим? Конечно, можно было бы допу-
допустить, что имя человека меняется, когда он меняет пробор, но вряд ли нас прель-
прельстит такая возможность.
Перейдем теперь к рассмотрению второго примера. Обозначим через Sj щети-
щетинистый квадрат, а через S2 — квадрат без щетины. Рассмотрим следующую дву-
двумерную вариационную задачу: найти в классе поверхностей S минимум интеграла
по поверхности S от некоторого лагранжиана L (х, J), где J — нормальный вектор,
опредгляемый матрицей Якоби в каждой точке поверхности S. (В пространстве
большей размерности J — ие вектор, а так называемый бивектор.) Если обозна-
обозначить через 3 (S) двойной интеграл от L по поверхности S1*, то легко видеть, что
для каждого такого лагранжиана
Sf(S1)=Sf(S2).
Значит, различие между квадратом и щетинистым квадратом ие ощущается в ва-
вариационных задачах. Так как щетину можно «вырастить» иа любой поверхности,
то отсюда следует, что любая вариационная задача, имеющая решение S, где S —
двумерная поверхность Фреше, имеет также бесконечно много других решений,
которые отличаются от S одной или несколькими щетинками. Но ведь различать
такие решения — все равно, что считать человека новой личностью всякий раз,
когда у него вырастет новый волос. Поистине не следует впадать в крайность,
заботясь о различении таких подробностей!
Мы решительно отметем здесь эти искусственные различия. Две параметри-
параметрические кривые мы будем называть эквивалентными тогда и только тогда, когда
будут одинаковыми значения интеграла вдоль них от любого лагранжиана L.
При этом класс параметрических кривых x(t), /!</<;/2, эквивалентных данной,
мы назовем кривой С.
Таким образом, параметрическая кривая С полностью определена тогда и
только тогда, когда для каждого лагранжиана L(x, x) известно соответствующее
значение криволинейного интеграла 3(С). В дальнейшем мы будем отождест-
отождествлять понятие параметрической кривой С с соответствующей операцией 3 (С)
криволинейного интегрирования вдоль С, так как С и 3 (С) определяют друг
друга. Такое отождествление очень удобно и часто применяется в математике.
Строго говоря, оио приводит к некоторой путанице в терминологии, подобно
тому как не совсем корректно обозначать одним и тем же символом точку Р и
множество, состоящее из одной точки Р. В анализе, говоря о кривой x(t), часто
подразумевают класс параметризаций, эквивалентных x(t). Допуская аналогич-
аналогичную неточность, мы будем говорить о кривой 3(С), подразумевая под этим кри-
кривую С, для которой 3 (С) — операция криволинейного интегрирования.
§ 64
Допустимые кривые — элементы дуального пространства
Мы ограничимся рассмотрением кривых конечной длины,
расположенных в фиксированном кубе, и будем учитывать только
такие параметризации x(t), t^^t^t^, этих кривых, для которых
11 Если х(и, v), (u,v) £ D,— параметризация поверхности S, то речь идет
об интеграле
3 (S) = \ \ L (х (и, v), х'и X x'0)dudv,
D
где х=(хх, х2, Хв) и х'и X л£— векторное произведение. (В многомерном про-
пространстве следует написать х'и Л х'о.) — Прим. ред.
§ 64. Допустимые кривые—элементы дуального пространства 241
x(t)— абсолютно непрерывные функции. Можно считать теперь,
что лагранжиан L(x, x) определен только для точек х, распо-
расположенных в этом фиксированном кубе, так как значения лагран-
лагранжиана в других точках нас не интересуют. Далее, мы будем
пользоваться символом / для обозначения сужения лагранжиана L
на множество пар (х, х), для которых х лежит в нашем фиксиро-
фиксированном кубе, а х—на единичной сфере |jtj = l, и обозначим это
множество через А. Функцию /, которая ввиду свойства одно-
однородности определяет лагранжиан L, назовем подинтегральной
функцией; она может быть любой непрерывной действительной
функцией, определенной на множестве А. Другими словами,
согласно обозначениям § 48 гл. IV, /—любой этемент простран-
пространства £0(Л).
Для каждой отдельной вариационной задачи, относящейся
к спрямляемым кривым, расположенным в нашем фиксирован-
фиксированном кубе, мы фиксируем лагранжиан L, или, что то же самое,
фиксируем подинтегральную функцию /. Однако сейчас нас инте-
интересует не конкретная вариационная задача, а понятие кривой,
которое должно быть пригодным для всех вариационных задач.
Следовательно, теперь должна изменяться функция /, а нашу
кривую С мы будем считать фиксированной.
Для любой допустимой кривой С величина 3 (С), рассматри-
рассматриваемая при изменяющемся лагранжиане L, т. е. при изменяю-
изменяющейся подинтегральной функции /£4эо(Л), превращается в функ-
функцию g(f). Эта величина, рассматриваемая как функция от лагран-
лагранжиана L при фиксированной кривой С, обладает довольно
простыми свойствами. Она имеет следующий вид:
(x{t), x(t))dt,
где x(t)—любая абсолютно непрерывная параметризация кри-
кривой С, определенная на отрезке t1 г£С t ^ /2. Очевидно, что если
L представлен в виде с,Lt-{-ctLai где сис2—константы, a Llt L2—
лагранжианы, то
SQ3(O(C)
где 3lt Э2—соответствующие интегралы от лагранжианов L,, L2.
Так как ввиду однородности подинтегральные функции /, /lf f2,
соответствующие лагранжианам L, Lu L2. удовлетворяют соот-
соотношению / = с,/1-|-с2/:2, то g(/) = c1g(/1) + c2g(/2), т. е. g—линей-
g—линейная функция. Далее, приняв длину дуги на кривой С за пара-
параметр, мы убеждаемся в том, что когда / принадлежит единич-
единичному шару U пространства й?0(Л)(т. е. |/|^1), величина |3(О|
не превосходит длины кривой С. Следовательно, функция g(f)
ограничена, когда f^U.
242
Гл. VI. Обобщенные кривые и потоки
Отсюда следует, что g—элемент правильно дуального про-
пространства ^*0(А). Значит, в соответствии с обозначениями § 48
гл. IV значение функции g(f) на некотором элементе / можно
обозначить через gf.
Мы договорились отождествлять кривую С с величиной 3 (С),
рассматриваемой как функция от L, т. е. от f. Это означает,
что теперь кривая С представляет собой функцию g(f) и, сле-
следовательно, элемент g пространства ^*„(А). Таким образом,
допустимые кривые превратились в некоторые элементы g£ ¥>\ (А),
а именно в те из них, для которых существует по крайней мере
одна такая абсолютно непрерывная функция x(t), t^t ^t
что для каждого f^A
F4.1)
L{x(t), x(t))dt.
где L—лагранжиан, соответствующий подинтегральной функции/.-
Незначительная неаккуратность, возникающая при таком отождествлении
кривой С с соответствующей операцией 3(С) криволинейного интегрирования
вдоль С, т. е. с соответствующим элементом g£i?o(i4)> вполне терпима вматема-
тике (если вообще считать это неаккуратностью). Мы предпочитаем думать, что
наша точка зрения вполне корректна и что нам удалось найти очень удачную ин-
интерпретацию, которая позволяет лучше понять, что же такое кривая.
Дух современной математики можно понять и объяснить, используя сравне-
сравнение с пещерой Платона. Согласно Платону, то, что мы изучаем,— всего лишь
Дорага
Костер'
последовательность теней, которые на стены нашей пещеры отбрасывает большой
костер, зажженный снаружи: тени людей, например, проходящих по дороге,
расположенной позади нас.
Эта аллегория лежит в основе метода, который Платон называет диалектиче-
диалектическим: мы должны воссоздать в нашем сознании простые явления, происходящие
вне пещеры. Этот метод стал современным научным методом, а в математике ои
лежит в основе современных понятий. Следовательно, для нас суть вещей проста
не потому, что мы ее видим, ибо мы видим только тени на стене пещеры, и ие по-
§ 65. Аналогия с человеческой жизнью 243
тому, что мы можем постигнуть ее, а потому, что сами эти вещи подчиняются про-
простым законам. Можно также считать, что эта точка зрения является логическим
продолжением учения Коперника, которое снабдило астрономию простыми за-
законами, отвергнув представление о Земле как о центре мироздания. Мы должны
искать понятия, простые именно в этом смысле.
Классическое понятие кривой С очень точно соответствует кривым, которые
мы видим и рисуем; такие кривые могут извиваться и изгибаться вперед, назад и
зигзагом; кроме того, оии могут иметь очень сложные самопересечения. Но это
Теиь в пещере. Реальный объект в %%(А) (ли-
(линейная функция от /).
всего лишь тень. Если же мы заменим это поиятие понятием криволинейного инте-
интеграла 3{С), то кривая превратится в элементу дуального пространства 'eof.A).
Коиечно, мы ие можем непосредственно увидеть этот элемент', мы видим только
его тень С. Однако именно элемент g, а не его теиь С подчиняется критерию про-
простоты, так как g — это линейная функция новой переменной f£$o(A).
§ 65
Аналогия с человеческой жизнью
Мы уже ие раз отмечали тесиую связь вариационного исчисления с идеями,
оказавшими глубокое влияние на другие разделы математики. Предыдущий пара-
параграф показывает, что эта связь не ограничивается одной лишь математикой; она
простирается гораздо шире, затрагивая самые общие вопросы. Мы хотим оста-
остановиться иа этом подробнее и глубже понять природу и роль дуального прост-
пространства и кривых, которые мы в него поместили.
С этой целью мы будем рассматривать кривые не как математические поня-
понятия, а как живые существа вроде нас с вами, а лучше сказать, как человеческие
жизни (жизни наши и в самом деле чем-то похожи на кривые). Тогда можно пред-
представлять себе, будто в вариационной задаче «заветной целью» кривой является
достижение желанного минимума и что кривая изгибается и извивается, чтобы
достичь этой цели. Читатель может возразить, что кривая — это неодушевленный
объект, который мы сами рисуем на бумаге или определяем при помощи бес-
бесстрастных символов, так что это мы заставляем кривую изгибаться и извиваться.
Ну что ж, и математик имеет право иногда выражаться слегка туманно. Впрочем,
это возражение можно обратить в пользу нашей аналогии, сославшись на когда-то
популярное английское шуточное стихотворение. В нем о человеке говорится
как о машине, которая «движется по заранее проложенным рельсам — не как
автобус, как трамваи». По этому стихотворению выходит, что самостоятельность
линии нашего поведения в жизни тоже иллюзорна.
Итак, человеческая жизнь очень напоминает кривую своей борьбой за порой
недостижимые идеалы 1. При таком взгляде иа вещи вариационное исчисление
оказывается буквально пронизанным подобной борьбой; это очень человечное
исчисление, а наши кривые — очень человечные кривые. И право же, это не
1) Здесь автор приводит следующие строки Роберта Браунинга: «The high
that proved too high, the heroic for earth too hard, the passion that left the ground
to lose itself in the sky». (R. Browning, Dramatis Personae, Abt Vogler, StanzalO).
244 Гл. VI. Обобщенные кривые и потоки
так уж неестественно. Скорее наоборот, было бы иллюзией полагать, будто
человеческую деятельность можно полностью отделить от человека.
Если в свете сказанного еще раз бросить взгляд на остальную математику,
она, возможно, больше не покажется нам такой уж холодной, формальной и изо-
изобилующей условностями, какой ее хотели бы изобразить номиналисты. Абстракция
в сущности тоже очень человечна; она сродни старческой забывчивости. Лит-
тльвуд однажды воскликнул на лекции для студентов Висконсинского универси-
университета: «Как было бы здорово, если бы все эти множители 1/2л были единицей, мне так
надоело писать их!» — н тут же забыл об их существовании. Вот что на деле
представляет собой абстракция — это освобождение от всего незначительного
и несущественного.
Так давайте же отныне думать о наших кривых не как о математических
понятиях, а как о живых существах. В таком случае мы сможем говорить о мо-
стнжениях» кривой g, подразумевая под этим значения, принимаемые выраже-
выражением gf в F4.1) при различных подинтегральных функциях /. В предыдущем
параграфа мы условились характеризовать кривую ее достижениями, подобно
тому, как во вступлении, говоря о «распределениях» Шварца, мы характеризовали
функцию тем влиянием, которое оиа оказывает на другие функции. Нечто подоб-
подобное можно сказать и о появлении дуальности н дуальных функциональных про-
пространств в других областях анализа.
Согласно нашему правилу, о кривой нли о любом другом элементе g£i?J(.A)
мы теперь судим только по значениям gf для всех /^^0(^)- Никакая другая
информация не регистрируется. Обитатели пространства %*(А) не имеют сви-
свидетельства о рождении или удостоверения личности; не выдаются им н свиде-
свидетельства о смерти. Если нам требуется такого рода информация, мы не просим
заполнить анкету в трех экземплярах. Мы просто черпаем эту информацию из
фактов, которые на виду у каждого, точно так же как в «Пигмалионе» профессор
Хиггинс мог по выговору определить, откуда родом говорящий.
Совсем не так радужно обстоит дело в исходном пространстве кривых, под-
подчиняющихся определениям Фреше, или, как мы будем говорить, в королевстве
Фреше. Там с бюрократической скрупулезностью регистрируются не только рож-
рождение и смерть кривой, но и все без исключения ее промежуточные состояния.
Между тем достижения кривой там абсолютно нигде не отражаются. Для властей
важно лишь, чтобы между двумя любыми кривыми соблюдалась установленная
дистанция для предотвращения беспорядков и волнений. Кроме того, в этом
королевстве не должно быть детей и животных-любимцев — абсолютно никого,
кроме кривых. Это королевство столь же необычно, как, скажем, страна, населен-
населенная одними только миллионерами, илн как армия, состоящая из одних генералов.
Поэтому такое королевство выглядит до смешного беспомощным, когда перед ним
встают задачи, к выполнению которых кривые совершенно не приспособлены,
как бы оии ни старались. В частности, в нем ие могут быть решены многие вариа-
вариационные задачи. Словом, несмотря на свою экзотичность (а точнее, именно бла-
благодаря ей), королевство Фреше на самом деле очень бедное в прямом смысле слова,
чересчур бедное, чтобы служить подходящей ареной для вариационного исчис-
исчисления.
Напротив, пространство Ч@о (А) в этом отношении является очень богатым.
Помимо кривых, в нем есть еще много других существ. В частности, оио содержит
бесконечно мелкие зигзаги, описанные в примерах § 61. Чтобы убедиться в этом,
достаточно распространить на них понятие интеграла, который можно определить
как предел криволинейных интегралов от наших лагранжианов по конечным
аппроксимирующим зигзагам; тогда указанный интеграл будет представлять
собой элемент пространства %%{А). Далее окажется, что в ^l(A) любая из наших
вариационных задач имеет решение. Можно сказать, что в Ч@*й{А) есть все, к чему
стремится кривая и чего она не может найти — это, так сказать, рай для кривой.
Теперь, когда наш читатель, возможно, чувствует себя в f J (Л) более уве-
уверенно, мы продолжим изучение этого пространства.
§ 66. Обобщенные кривые и потоки и их границы 245
§ 66
Обобщенные кривые и потоки^и их границы
Лагранжиан L или соответствующую ему подинтегральную
функцию / назовем линейной формой или просто формой, если
существует такая непрерывная векторная функция а (х), что
F6.1) L(x, х) = х'а{х),
где в правой части стоит скалярное произведение двух я-мерных
векторов. Эту форму будем называть точной и обозначать через дф,
если существует такая непрерывно дифференцируемая скалярная
функция ф (х), что
F6.2) a(x) = grad(p(x).
Напомним, что, согласно определению D8.4) из § 48 гл. IV,
в пространстве 'Sl(A) последовательность gv, v=l, 2, .... схо-
сходится к элементу g, если для каждого f£%0(A) значения gvf
сходятся к gf. Такое понлтие сходимости особенно удобно в ва-
вариационном исчислении, так как в каждый данный момент мы
рассматриваем только одну задачу, а значит, имеем дело только
с одной подинтегральной функцией. Отсюда автоматически сле-
следует, что 3 (Cv) стремится к 3 (С), если Cv — последовательность
кривых, имеющая предел С (в этом новом смысле). Таким обра-
образом, мы одним ударом избавились от необходимости вводить
специальные ограничения, аналогичные условию полунепрерыв-
полунепрерывности интеграла 3 (С), как у Тонелли. Относительно такой схо-
сходимости (которую мы будем называть тонкой в отличие от
рассмотренной раньше обычной сходимости кривых) 3 (С) превра-
превращается в непрерывную функцию от С.
В то же время тонкая сходимость помогает выяснить парадокс,
который не давал покоя Лебегу в колледже Бове: в смысле
тонкой сходимости ломаная линия уже не стремится к третьей
стороне треугольника; она сходится к элементу пространства %о (А),
который нельзя представить в виде допустимой кривой. Этим
тонким пределом будет как раз бесконечно мелкий зигзаг. Сле-
Следовательно, нужно так сформулировать нашу вариационную
задачу, чтобы не только кривые, но и их тонкие пределы стали
допустимыми.
Элемент пространства #о(Л) назовем обобщенной кривой, если
его можно представить в виде тонкого предела последователь-
последовательности кривых. Далее, обобщенным потоком назовем любой
элемент положительного конуса пространства ^(A), т. е. любой
элемент g£'&t{A), для которого при /£#0(.Д) из соотношения
/^0 следует, что gf^tO. Очевидно, что каждая обобщенная
кривая представляет собой частный случай обобщенного потока.
246 Гл. VI. Обобщенные кривые и потока
Отметим, так же как в §48 гл. IV, что для любого обобщен-
обобщенного потока g и, в частности, для любой обобщенной кривой
норма |g| равна значению функции gf, когда /=1. Поскольку
в этом случае лагранжиан L(x, x) — \x\, мы называем эту норму
длиной обобщенного потока g, точно так же как и в случае
спрямляемой кривой.
Границей dg элемента g € 41 (А) назовем ограничение gdy
функции g(f) = gf на множество тех подинтегральных функций
f <E#0(j4), которые представляют собой точные формы д<р.
В том случае когда g—кривая, мы временно будем обозна-
обозначать символом dg то, что можно назвать элементарной границей
кривой g: dg—О, если g—замкнутая кривая, и dg — это упоря-
упорядоченная пара х,, х2 концов кривой g, если g—незамкнутая
кривая. Проверим, что dg и dg определяют друг друга.
Для этой цели сначала заметим, что если g—кривая, а ф(х)—
непрерывно дифференцируемая функция, то
F6.3) £дф = ф(*2)—Ф (*,).
где xv x2—упорядоченная пара концов кривой g. Полагая по-
поочередно функцию ф(х) равной различным компонентам вектора х,
получим, что dg определяет разность х2—хг и что последняя
равна нулю, когда dg = 0. Отсюда следует, что соотношения
dg = 0 и dg = O эквивалентны, и, кроме того, из F6.3) следует,
что dg определяет dg. Осталось показать, что в случае, когда
dg^O, dg определяет пару х1У х2. Для этого достаточно выразить
через dg сумму
Ф(-
Искомым выражением будет
где я])—любая непрерывно дифференцируемая функция, для ко-
которой gdty=^0, а Ф и Ч получены умножением этой функции
соответственно на <р и я]). Для того чтобы показать, что выра-
выражение F6.4) действительно равно указанной сумме, достаточно
представить его как функцию от xlt x2, используя F6.3) и соот-
соответствующие формулы, содержащие ty, Ф, W вместо ф.
Аналогичные рассуждения можно применить к последователь-
последовательности кривых gv, v=l, 2, ..., которая стремится к обобщенной
кривой g. Применив F6.3) к gv, получим, что если dg = 0, то
разность концов кривых gv должна стремиться к нулю; если же
dg=7^O, то, выбрав я]) так, чтобы gdty^O и, значит, gvdty^O
для всех больших v, мы увидим, что концы кривых gv стремятся
к определенным пределам х„ хг. Присоединив к кривым gv малые
пары направленных отрезков, получим, что каждая обобщенная
§ 66. Обобщенные кривые и потоки и их границы 247
кривая g есть предел последовательности кривых gv, v = 1, 2, ...,
для которых dg = dgv при всех v. Таким образом, обобщенные
кривые имеют такие же границы, что и традиционные допустимые
кривые. Если dg = 0, то мы будем называть обобщенную кривую
замкнутой, а если dg^O, то dg определяет концы xlt х2 обоб-
обобщенной кривой g точно так же, как и в традиционном случае.
Напомним, что, согласно теореме D8.6) из § 48 гл. IV, в по-
положительном конусе пространства 'el (А) тонкая сходимость сов-
совпадает со сходимостью по штрих-метрике. Отсюда получаем
важное следствие: множество обобщенных кривых замкнуто; оно
равно замыканию множества обычных спрямляемых кривых.
Так, если g—тонкий предел обобщенных кривых и е—любое
положительное число, то g находится на расстоянии < е от
обобщенной кривой и, значит, на расстоянии < 2е от обычной
кривой (здесь расстояние понимается в смысле штрих-метри-
штрих-метрики). Следовательно, g—тонкий предел обычных кривых.
Мы видим, как легко работать в дуальном пространстве с понятием тонкой
сходимости, хотя это всего лишь сходимость последовательности наших функций
g(f) для каждого /, а каждый студент, изучающий анализ, знает, какие ловушки
расставляет такая неравномерная сходимость. Это наводит на мысль, что при
правильном построении математической теории можно избежать таких ловушек.
Введение строгих различий между тесно связанными вещами не всегда соответ-
соответствует духу математики, особенно если «судить по большому счету». Математика
создана не для юристов и ботаников.
Теперь перейдем к рассмотрению структуры обобщенного
потока, т. е. произвольного элемента из положительного конуса
пространства #о(/4), и его границы. Самым простым элементом
этого конуса будет не обобщенная кривая и даже не обычная
кривая, а линейный элемент. Линейным элементом мы называем
такой элемент g^"St(A), что существует пара (х, х)£А, для
которой gf = f(x, x) для каждой функции f£1eo(A). Легко ви-
видеть, что если такая пара существует, то она однозначно опре-
определяется элементом g; в самом деле, подбирая соответствующим
образом функцию f, мы можем найти каждую координату век-
вектора х или вектора х. Заметим, что раньше мы называли линей-
линейным элементом пару (х, х), а теперь называем так соответствующий
элемент g; разница несущественна, потому что эти объекты опре-
определяют друг друга, и на самом деле можно иногда позволить
себе некоторую неаккуратность, отождествляя линейные элементы
в старом и новом смыслах.
Линейные элементы являются не только простейшими, но и
самыми основными элементами пространства ^l(A). Действи-
Действительно, можно считать, что риссовское представление позволяет
выразить любой элемент g^.'el(A) через линейные элементы.
Если мы временно обозначим через а пару (х, х), а через ga —
248 Гл. VI. Обобщенные кривые и потоки
соответствующий линейный элемент из 'ёв(А), то в согласии
с риссовским представлением любой функции ё^ЦА) можно
сопоставить такую обобщенную (не обязательно положительную)
меру |х в Л, что
F6.5) |gr| =
для каждой функции f£%e(A). Второе из этих соотношений
удобнее записать в виде
F6.6) g=)gadii,
А
и тогда можно сказать, что оно выражает следующий факт: любой
элемент g€^o(^) является смесью линейных элементов ga.
К этому следует добавить, что элементы.g, принадлежащие по-
положительному конусу пространства %1(А),—это как раз те
элементы из 'eZ(A), для которых соответствующие меры ц^О,
т. е. это положительные смеси линейных элементов.
Справедливость последнего замечания можно установить,
применив упрощенное доказательство теоремы D9.5) из § 49
гл. IV. С другой стороны, ее можно вывести из утверждений
(i) и (и) этой теоремы, т. е. из F6.5). В самом деле, когда g
лежит в положительном конусе, \g\=g-\, и это соотношение
можно записать в следующем виде:
Отсюда и из неравенств
которые всегда справедливы, если 0^/^1, вытекает, что для
функций f, удовлетворяющих условию (Х;/^ 1, а следовательно,
ввиду линейности и для всех / £ %0 (А)
Значит, в представлении элемента g меру ц можно заменить ее
полной вариацией, т. е. неотрицательной мерой.
Простейшими элементами из %Z(A) после линейных элементов
будем считать, во-первых, взвешенные линейные элементы, кото-
которые получаются из линейных элементов умножением на неотри-
неотрицательные константы, а во-вторых, обобщенные линейные элементы,
представляющие собой положительные смеси вида F6.6) линейных
элементов ga, соответствующих парам (х, х) с одним и тем же х.
$ 66. Обобщенные кривые и потоки и их границы 249
О таких линейных элементах мы будем говорить, что они про-
проходят через точку х или сосредоточены в точке х; их смеси —
это обобщенные линейные элементы, преходящие через точку х
или сосредоточенные в точке х. Обобщенный линейный элемент
будем иногда называть турбулентным или, более пространно,
взвешенным турбулентным линейным элементом. Термин «турбу-
«турбулентный» должен здесь подчеркивать аналогию с движением
жидкости, которую мы вкратце обсудим ниже.
Взвешенные линейные элементы, так же как сами линейные
элементы, из которых они получены, сопоставляются парам (х, х).
В качестве постоянного множителя мы будем брать теперь мо-
модуль |х|. Это означает, в частности, что теперь взвешенный
линейный элемент равен тождественно нулю, если х = 0. Если
же х =^0, то он равен произведению элемента, отвечающего паре
(х, х/\х\), на \х\.
Обобщенному линейному элементу, заданному формулой F6.6)
и сосредоточенному в точке х, мы сопоставим взвешенный линей-
линейный элемент, который назовем результантом. Вот его определение:
пусть 6а—направление*, соответствующее линейному элементу ga,
и пусть
Тогда результант равен произведению величины ц и взвешенного
линейного элемента, соответствующего паре (х, 6). Другими сло-
словами, результант задается парой (х, х), где х-=ц6.
Часто бывает удобно считать, что пара (дг, дг) представляет мгновенное состоя-
состояние частицы жидкости или газа, расположенной в данное время в точке х и дви-
движущейся с импульсом х. Тогда можно привести две эквивалентные интерпретации
обобщенного линейного элемента в точке дг. Согласно первой из ннх, можно счи-
считать, что наша жидкость состоит из множества струй разреженного газа, которые
движутся друг сквозь друга в разных направлениях 6О вблизи точки дг; тогда
обобщенный линейный элемент F6.6) представляет собой суперпозицию импуль-
импульсов мгновенных состояний различных частиц газа, находящихся в этой точке, и,
таким образом, описывает движение смеси разных струй.
Вторая интерпретация более обыденна, но с математической точки зрения
менее проста. Представим себе, что мы, стоя на мосту, наблюдаем за текущей под
ннм водой. Мы виднм, что средняя скорость течения вблизи точки х равна век-
вектору дг, т. е. нашему результанту; относительное же движение вблизи точки х
таково, что частицы воды описывают малые замкнутые кривые. На этих кривых
направления совпадают с направлениями векторов ви—в, причем пропорции,
в которых распределяются эти направления, зависят от модулей векторов и от
меры р.. Для рассмотрения этого явления в общем виде нужна теорема, которую
мы здесь не будем доказывать, а потому мы ограничимся рассмотрением частного
случая, когда ц — дискретная мера, которая приписывает некоторые веса |хи
конечному множеству направлений, соответствующих только некоторым значе-
значениям а. В этом случае замкиутые_ кривые будут иметь вид замкнутых ломаных,
составленных из векторов ца Fа—6). Общий случай фактически сводится к случаю
250
Гл. VI. Обобщенные кривые и потоки
с не более чем /1+1 весами, так как мерац на единичной сфере n-мерного прост-
пространства, удовлетворяющая условию J6djiF)- 0, является суперпозицией неко-
некоторого множества обладающих тем же свойством дискретных мер, каждая из
которых соответствует не более чем я+1 значениям вектора 6.
Относительное движение вдоль этих малых замкнутых кривых (мы должны
фактически считать, что эти кривые бесконечно малы, но частицы движутся по
ннм много раз) мы называем турбулентно-
j~ стью. Конечно, на самом деле мы не можем
;ру наблюдать такое предельное состояние в воде,
.^--^ ~---^^^ и, конечно, относительное движение в воде
^* не является движением вдоль лсманой лнннн.
Но даже и такой крайний случай, когда замк-
^^- —-^^ нутая ломаная вырождается в два равных, но
^^ ^^>» противоположно направленных вектора, мож-
можно наблюдать визуально в вязких жидкостях;
турбулентность в этом случае сводится к ко-
колебанию частиц жидкостн взад-вперед-около
точки х.
Теперь распространим эту аналогию с
движением жидкости и газа на произвольные
обобщенные потоки.
Для простоты рассмотрим мгновенное
состояние движущейся жидкости нли устано-
установившееся течение. Тогда, согласно Эйлеру,
движение полиостью определено, если нам
известны скорость х и плотность жидкости
в каждой точке х. Однако чтобы не делать
априорных предположений, мы будем гово-
говорить не о плотности, а о мере ц (конечно, эта
мера должна быть неотрицательной). Здесь мы
рассмотрим только случай, когда мера (.1 ко-
конечна и ее носитель ограничен. Как видно нз
прецыдущнх рассуждений, эйлерова концеп-
концепция движения жидкости, чтобы стать при-
пригодной для описания рассмотренных выше
явлений, нуждается в обобщении.
Определение Эйлера эквивалентно за-
заданию такой меры ц на множестве пар
(дг, дг), чтобы в носителе меры |л для каж-
дой точки х существовала в точности одна
скорость х. Для того чтобы можно было подобным же образом описать множество
струй разреженных газов, проникающих друг сквозь друга, очевидно, нужно
задавать на множестве пар (х, х) меру(х, свободную от указанного ограничения.
Здесь, так же как и раньте, предполагается, что мерац неотрицательна, конечна
и ее носитель ограничен. Если мы введем более сильное условие, предположив,
что|дг|=1, то в соответствии с рисссвским представлением наше обобщенное эйле-
ровское движение жидкостн будет определяться в точностн теми же велнчинами,
что и обобщенный поток. Ограничение |дг|=1 носит здесь второстепенный харак-
характер, так как, с одной стороны, при рассмотрении движения жидкости скорости
следует умножать на массы, которые могут быть любыми, т. е. это ограничение
не сказывается на импульсах; а с другой стороны, оно вводится здесь в связи с ис-
исследованием параметрических задач и не понадобится нам в теории оптимального
управления.
Другое обобщение эйлеровского движения жидкостн можно получить из
второй интерпретации обобщенного линейного элемента; это обобщение окажется
эквивалентным приведенному выше. Для этого надо задать меруц в дг-пространстве
Водоворот.
§ 66. Обобщенные кривые и потоки и их границы 251
и определить в каждой точке х проходящий через нее обобщенный линейный
элемент. Таким образом, теперь мы имеем в каждой рассматриваемой точке х не
только среднюю скорость х, но и то, что мы назвали турбулентностью. Интуиция
подсказывает, что аналогичным способом можно описать произвольный обобщен-
обобщенный поток g; этого можно достнчь, заменив в F6.6) а переменной точкой х, a gv —
переменным обобщенным линейным элементом, проходящим через эту точку.
Однако для того, чтобы получить подобное представление из риссовского, потре-
потребуется такая форма теоремы Фубини, которая редко встречается в учебниках
анализа1', и поэтому мы не будем этого делать.
Итак, читатель получил приемлемое описание или по крайней мере первое
представление о существах, живущих в положительном конусе пространства
<ё0(А) бок о бок с нашими кривыми н обобщенными кривыми.
Что касается элементов из if J (А), не лежащих в положитель-
положительном конусе этого пространства, то мы только отметим, что они
имеют такие же границы, как и обобщенные потоки. В соответ-
соответствии с риссовским представлением любой такой элемент имеет
вид g = gi—g2, где g, и g2 лежат в положительном конусе2'.
Пусть g = gx-\-g2, где g2—такой элемент положительного конуса,
что для каждого fS{A)
gj = gj. где f(x,x') = f (х, — х).
Тогда очевидно, что dg2 —— dg2, и, значит, dg — dg, где g лежит
в положительном конусе пространства #о(Л).
Это означает, что элементы положительного конуса нельзя
отличить от элементов, не лежащих в этом конусе, по их гра-
границам. Однако очевидно, что многие из них можно отличить
таким способом от кривых.
J> Соответствующие теоремы и относящиеся к ним понятия легче найти
в учебниках по теории вероятностей. Представление, о котором говорит автор,
носит там название «формулы полной вероятности».
Поясним вкратце, о чем идет речь. Без ограничения общности можно счи-
считать, что носитель меры ц из F6.6) имеет вид XxS. где X—множество
в х-пространстве, a S— сфера |х|=1. При весьма общих предположениях на
каждом слое Sx прямого произведения XxS, т. е. на множестве Sx^={(at, дг);
х фиксировано, x£S}, можно задать такую меру ц% («условное распределение
вероятностей»), что для любой f£%0(A) имеет место формула
XXS X[Sx
(Здесь ц — мера на X, определяемая для Х,сХ соотношениями \i {XY) =
= (.i(A'!XS).) Поскольку мере ц^ отвечает обобщенный линейный элемент —
обозначим его gx, — эту формулу можно переписать в виде, аналогичном F6.6):
. —Прим. ред.
2> Здесь используется не столько риссовское представление, сопоставляющее
элементу g обобщенную (не обязательно положительную) меру ц, сколько так
называемое жорданово разложение аддитивной функции ограниченной вариацнн
в разность двух неотрицательных аддитивных функций. — Прим. ред.
252 Гл. VI. Обобщенные кривые и потоки
§67
Параметрическое задание обобщенных кривых
Элементы пространства ^ЦА) или положительного конуса
в этом пространстве выступают в качестве решений вариацион-
вариационных задач только в том случае, если они могут быть отождест-
отождествлены с кривыми или с обобщенными кривыми. Тем не менее
рассмотрение таких пространств дает нам некоторое преимуще-
преимущество: мы знаем, как выглядят окрестности (малые или большие)
этих элементов. В этом параграфе мы покажем, что обобщенные
линейные элементы играют для обобщенных кривых такую же
роль, как линейные элементы для обычных кривых. Таким обра-
образом, обобщенные кривые отличаются от обычных только тем,
что их линейные элементы обладают свойством турбулент-
турбулентности.
F7.1) Теорема о параметризации. Для того чтобы элемент
g£%Z(A) был обобщенной кривой, необходимо и достаточно,
чтобы существовала вектор-функция x(t), 0^.t^.\, удовлетво-
удовлетворяющая условию Липшица, и чтобы для почти каждого t суще-
существовал такой обобщенный линейный элемент gt с результантом
(x(t), x(t)), для которого норма \gt\ равномерно ограничена и
F7.2) g
Напомним, что функция x(t) удовлетворяет условию Липшица,
если существует такая постоянная К, что
для всех рассматриваемых пар tlt t2. Далее, равенство F7.2)
означает, что для каждого / € #0 (А)
F7.3) gf=\gtfdt,
о
\
о
где правую часть равенства можно рассматривать как обобщение
традиционного криволинейного интеграла от лагранжиана L,
соответствующего функции f. Действительно, если gt—взвешен-
gt—взвешенный линейный элемент, соответствующий указанному выше ре-
результанту, то gtf превращается в L(x(t), x(t)).
Мы докажем отдельно необходимость и достаточность этих
условий. Начнем с необходимости; соответствующий кусок дока-
доказательства в значительной своей части является упражнением
§ 67. Параметрическое задание обобщенных кривых 253
на применение равностепенной непрерывности и диагонального
процесса.
Доказательство необходимости. По условию теоремы g является
тонким пределом кривых gv, v = l, 2 Длина Kv — \gv\
кривой gv стремится к длине |g| ввиду тонкой сходимости1', и,
следовательно, \gv\ остаются меньше некоторой фиксированной
постоянной /С- Для кривой g\, можно выбрать такую параметри-
параметризацию xv(t), 0^.t^l, чтобы величина Kvt была длиной дуги.
Тогда функции xv(t) удовлетворяют равномерно по v условию
Липшица
для каждой пары значений *„ ta параметра t. Кроме того, почти
всюду выполняется неравенство
Так как функции xv(t) оказались равностепенно непрерывными,
а их значения лежат в фиксированном кубе, то существует под-
подпоследовательность, равномерно сходящаяся к некоторой функ-
функции x(t), 0^*<Г1. Ограничимся рассмотрением этой подпосле-
подпоследовательности.
Для любого подинтервала А интервала O^^^l обозначим
через Agv дугу кривой gv, определенную ограничением функции
xv@ на *£Д. Тогда длина |Agv| равна /CV|A|, где |А|—длина
подинтервала А. Таким образом,
F7.4) |Agv|=tf|A|, т.е. | Agv/|<tf| f\-\ Д|
для каждой функции f £ {ё0(А). Значит, к последовательности Agv,
где А—любой фиксированный подинтервал, можно применить
теоремы D8.6) и D8.8) из § 48 гл. IV (только вместо единичного
шара мы будем иметь шар радиуса /С в пространстве #„ (^)) и
выделить тонко сходящуюся подпоследовательность. Покажем,
что можно выбрать такую подпоследовательность индексов v,
чтобы соответствующая подпоследовательность дуг Agv тонко
сходилась для каждого подинтервала А.
Сначала осуществим такой выбор для счетной последователь-
последовательности Al А2, .. . интервалов Д. Для этого применим метод ин-
индукции. Из данной последовательности индексов v можно выде-
выделить такую подпоследовательность, чтобы соответствующая под-
подпоследовательность дуг Agv тонко сходилась при А = А^, по ин-
индукции для каждого k можно выделить из k-й подпоследовательно-
ститакуюF+ 1)-юподпоследовательность, чтобы соответствующая
Х) Напомним, что jgv|=gY/ для f^l. — Прим. ред.
254 Гл. VI. Обобщенные кривые и потоки
подпоследовательность дуг Agv тонко сходилась при Д = Ak.
Диагональная подпоследовательность будет тогда тонко сходиться
для каждого Д = ДЙ, k—l, 2 Теперь будем рассматривать
только эту диагональную последовательность, причем предполо-
предположим, что началом интервалов ДА служит 0, а концами — все ра-
рациональные числа из интервала 0 < / < I. /Мы покажем, что по-
полученная таким образом подпоследовательность индексов v об-
обладает требуемым свойством для каждого подинтервала Д. Для
этого достаточно рассмотреть интервалы Д с началом в нуле
(любой подинтервал из 0 <! t <! 1 можно представить в виде раз-
разности таких интервалов). Обозначим любой такой интервал через At,
где t—его конец.
Для /€#0(Л) и O^/^l введем обозначение
Приращение функции (pv для двух значений параметра t и одного
и того же элемента f имеет вид hgvf, где Д — интервал, концы
которого равны этим значениям параметра t. Из F7.4) следует,
что при фиксированном / функции (pv равностепенно непрерывны
по /. Так как эти функции при v—>-0 сходятся к некоторому
пределу в рациональных точках t, то, используя рассуждения,
примененные при доказательстве теоремы D8.2) из § 48 гл. IV,
получим, что в интервале 0<С£<11 они равномерно сходятся
к пределу q>(/, /). Значит, &tgvf—>ф(/, /) для каждых t и / и,
следовательно, Agv тонко сходится для каждого Д, что мы и
утверждали выше.
Продолжая доказательство, покажем, что существует такое
подмножество Т меры 1 из интервала 0<!£<Г I, что для каждой
точки t £Т построенная выше функция ф(*. /) имеет производ-
производную ф(*,/) по / при каждом /. Это утверждение мы докажем
постепенно, так же как предыдущее, т. е. сначала для одной
функции /, затем для счетного множества функций / и, наконец,
для всех /. (И все это совершенно безболезненно!)
Для этого обозначим через Д# тонкий предел последователь-
последовательности hgv. Тогда ф(/, f) = (htg)f, а (Д§) /—это приращение Дф
функции ф между концами интервала Д. Если в F7.4) перейти
к пределу по v, получим
F7.5) |Д£|<К|Д|, |(Д£)/|</(|/|.|Д|.
Из этого последнего соотношения следует, что при фиксирован-
фиксированном / функция <p(t,f) удовлетворяет условию Липшица относи-
относительно t и, значит, имеет производную ф(/,/)для каждой точки
интервала Д/, кроме точек некоторого множества EfcAt нуле-
нулевой меры Лебега. Следовательно, если fk, k— I, 2, ... ,—счетное
семейство функций из #0 (Л) и через Т мы обозначим дополнение
§ 67. Параметрическое задание обобщенных кривых 255
объединения множеств Ef, f = fk, то очевидно, что мера Лебега
множества Т равна I и для каждой точки t0 £ Т существует про-
производная <p(tf0, /fc) для каждой функции fk из этого семейства.
Теперь будем считать, что это счетное семейство представляет
собой класс 9* из теоремы D8.1) § 48 гл. IV. Тогда для каждой
точки t0 соответствующего множества Т производная ф(/0, /) су-
существует для каждой функции /£#0(Л). Чтобы доказать это,
следует убедиться в том, что выражение
где Д—подинтервалы отрезка 0^/^1, имеющие один конец
в точке t0, имеет предел, когда длины этих подинтервалов стре-
стремятся к 0, т. е. что разность между верхним и нижним преде-
пределами меньше любого наперед заданного положительного числа.
Эта разность не изменится, если мы заменим функцию / функцией
/—fk, так как первый член в правой части F7.6) имеет предел
Ф (/„,/>). Поэтому, в силу F7.5), она не может превзойти 2K-\f—fk\,
а уж эту величину можно сделать сколь угодно малой посред-
посредством выбора индекса k, так как множество 5* плотно в #0 (А).
Значит, производная ф (/„,/) должна существовать, что и утвер-
утверждалось выше.
Продолжим наше доказательство дальше. Для каждой точки
t = tu£T предел выражения F7.6) существует при каждом f, т. е.
существует тонкий предел элементов Д#/|Д|. Обозначим этот
тонкий предел через gt. Тогда для каждой функции / имеем,
очевидно,
1 1
Значит, равенство F7.3), а следовательно, и F7.2) справедливы.
(Опять все сделано совершенно безболезненно!)
Осталось только выяснить, какими свойствами обладает эле-
элемент gt 6#?(Л). Для простоты положим gt = 0, когда t не лежит
в Т. Обозначим снова через t0 любую фиксированную точку мно-
множества Т, а через Ао и Лр обозначим части множества А, в ко-
которых соответственно х= x(t0) или х находится от этой точки на
расстоянии, не превосходящем р. (Здесь р положительно и до-
достаточно мало.) Обозначим через |/|ои1/1р верхние грани функ-
функции \f (х, t)\ соответственно в Ао и в Ар. Очевидно, что для
любого достаточно малого интервала Д, содержащего точку t0,
при всех больших v дуга xv(t), /£Д. лежит в шаре радиуса р
с центром в точке x(t0). Значит, для такого интервала Д в со-
соотношениях F7.4) и F7.5) |/| можно заменить числом |/|р. Сле-
Следовательно, при * = *0 предел gtf левой части равенства F7.6)
256 Гл- VI. Обобщенные кривые и потоки
при |Д|—>0 по абсолютной величине не превосходит /С-|/|рдля
любого р, и, значит,
F7.7) \gtf\<K\f\0 "Ри t = h-
Если мы обозначим через fo(x, х) функцию /(*(/„), k), то полу-
получим, что gt(f—fo) = O при t = tu, т. е. gtf = gtfo- Таким образом,
элемент gt полностью определяется значениями gtf0 для функций
/0 (х), не зависящих от л; и определенных на единичной сфере
|jc| = 1. Эти значения образуют элемент дуального пространства
iaoF), где В—единичная сфера. Ясно, что gt лежит в положи-
положительном конусе, и, значит, существует такая мера \i ^ 0, что
gtfo = ^fo(x)d\i и. ввиду F7.7), Jcf[x</C. Таким образом, gt
в
является обобщенным линейным элементом, сосредоточенным
в точке x(t0), и \gt |^/С. Для того чтобы показать, что резуль-
результант этого элемента равен (x(t0), x(t0)), возьмем в качестве
f(x,x) любую компоненту вектора х и проверим, что величина
g,/= Ф (/„,/) равна этой компоненте вектора x(t0). Но q>v(t, f) —
соответствующая компонента вектора xv(t)—xv@), значит, ее
предел ф(/, /)—соответствующая компонента вектора х(t) — х@),
и, следовательно, y(to,f) — искомая компонента вектора x(tj).
Таким образом, необходимость доказана.
Такого рода доказательства, где используется сравнительно немного идей,
зато много раз, следовало бы в конечном счете поручить вычислительным маши-
машинам. Однако современные вычислительные машины еще не способны справиться
с подобной рутиной, и поэтому приходится запастись терпением и проделывать
эту работу вручную. В данном случае результат представляет гораздо больший
интерес, ч«-м само доказательство, и составляет основную часть нашей теоремы.
Этот результат показывает, сколь мало отличаются обобщенные кривые от обыч-
обычных. Вся разница заключается в том, что мы назвали турбулентностью. Можно
считать, что турбулентность — это нечто вроде пульсаций, которые нельзя уви-
увидеть, но можно почувствовать илн услышать. Человеческий глаз имеет тенден-
тенденцию суммировать одновременные восприятия, так что, например, смесь желтого
и синего цветов мы воспринимаем как зеленый цвет. Слух и в еще большей степени
осязание способны различать одновременные ощущения, поэтому, скажем, группа
нот воспринимается нами как аккорд, а не как одни усредненный звук. Конечно,
глаз способен воспринять нечто близкое к турбулентности; ведь чередующиеся
желтые и синне полосы не кажутся нам зелеными.
Доказательство достаточности. Теперь покажем, что если эле-
элемент g имеет указанные в теореме вид и свойства, то он является
тонким пределом кривых. Для этого покажем, что сколь угодно
близко к g в смысле штрих:метрики можно найти обычную кри-
кривую. Для этой цели построим поочередно элементы glt g2, gs,
находящиеся в штрих-метрике близко друг к другу, причем
последний элемент gs будет кривой, а точнее, даже ломаной
линией.
Чтобы получить элемент gu заменим функцию x(t) функцией
(I—e)x(t) и одновременно для почти каждого t заменим меру \i,
§ 67. Параметрическое задание обобщенных кривых 257
определяющую gt, мерой A—е)ц. Очевидно, что gj—*gf для
каждой функции/, когда е—>0. Значит, g1 стремится Kg, и по-
поэтому элемент gx можно выбрать так, чтобы в штрих-метрике он
находился на сколь угодно малом расстоянии от g. Элемент g1
вводится для того, чтобы убедиться, во-первых, в том, что наша
конструкция может быть проведена в одном и том же основном ку-
кубе ^-пространства, и, во-вторых, в том,что постоянная K—sup\gt\
не возрастает. С этой целью и проводится предварительная ап-
аппроксимация элемента g, при которой функция x(t) и постоянная К
умножаются на 1 —е. В остальном же gl ничем не отличается
от g, и мы будем просто писать x(t) и \л, не вспоминая о мно-
множителе A—е).
Для того чтобы получить элемент g2, оставим функцию x(t)
прежней, а меру ц. заменим для почти всех t дискретной мерой,
которая фиксированному конечному множеству единичных векто-
векторов 6а ставит в соответствие веса ц«@- Такую замену можно
произвести так, чтобы величина \ 8djx не изменилась и осталась
равной х (t), а величина \ d\\. изменилась сколь угодно мало;
действительно, для каждого /(8) величина \ fd\i изменяется сколь
угодно мало, когда /—непрерывная функция. Построение весов
[ia(t) (которое совсем несложно) приводится ниже. Такая конст-
конструкция дает нам элемент g2, причем можно распорядиться так,
чтобы он тонко сходился к glt и, значит, g2 можно выбрать так,
чтобы в штрих-метрике он находился на сколь угодно малом
расстоянии от g1. Элемент g2 будет иметь точно такой же вид,
как g, только меры ц, определяющие его обобщенные линейные
элементы, будут удовлетворять описанным выше условиям. Кроме
того, для удобства можно сделать так, чтобы все веса pa(t) были
строго положительны.
Изменения в любой из наших мер нужно произвести следую-
следующим образом. Выберем б > 0 и разобьем единичную сферу на-
направлений G «-мерного пространства на достаточно большое ко-
конечное число N малых частей, т. е. на непересекающиеся множе-
множества в„ малого диаметра, где а= 1, 2, ..., N. В каждой из этих
частей выберем некоторое направление 6„. Все это построение
можно выполнить так, чтобы |G—6а| < б при б£в„, а=1, 2,..., N.
Далее, пусть т-= N + 2п, и пусть Qa, a = N+l, N+ 2, .... т,
суть 2п дополнительных направлений, каждое из которых либо
параллельно, либо антипараллельно одной из п координатных
осей. Теперь определим веса ца сначала для <х=1, 2, ..., N
следующим образом:
5li (a=l, 2, ...,N).
1274
258 Гл. VI. Обобщенные кривые и потоки
Для определения остальных [ia положим
N N N
-£евцв=£ f (е-адФ—£
a=l a=lg a=l
Вектор | имеет модуль |||^б(^Г+ I), где \i, так же как и рань-
раньше, равно j d\i. Теперь определим остальные \ia следующим об-
образом:
Qa, 0) (а = # + 1 т).
где |6а—скалярное произведение, a max (a, b) обозначает боль-
большее из двух чисел а, Ъ. Из этих определений следует, что
Суммируя по всем <х = 1, 2, .... т, получим
а, согласно условиям теоремы, величина \ Qdn почти всюду рав-
равна x(t). С другой стороны, если мы обозначим через R множе-
множество, состоящее не более чем из п значений а > N, для которых
|6а > 0, то получим
F7.8) (и) 2^а-£ 2
aeR
Кроме того, для любой непрерывной функции /@), которая оп-
определена при |G|<I1 и для которой М—максимум модуля, а
еб—колебание, т. е. sup|/F)—/(8*)| при |0—6*|<;б, имеем
где
■5-2/F.)+ 2 /(ва)|еакл1(б+б1/Я).
т
Таким образом, получаем
F7.8) (iii)
§ 67. Параметрическое задание обобщенных кривых 259
и, значит, при переходе к дискретной мере с весами ца величина
}f(Q)dn изменяется сколь угодно мало (равномерно по t). Те-
Теперь построение элемента g2 почти закончено: остается лишь
убедиться втом, что эти веса, рассматриваемые как функции от/,
измеримы.
Эта мелочь ужасно раздражает, ибо неизмеримые функции встречаются!
пожалуй, еще реже, чем пресловутый снежный человек. Однако настоящий про-
профессионал — будь то солдат, космонавт, гонщик, акробат или проводник в го-
горах — никогда не пренебрегает любой, даже маловероятной возможностью. Ана-
Аналогично и в математике нельзя исключать логическую возможность, как бы
маловероятна она ни была, до тех пор пока не доказано, что она не может встре-
встретиться. Поэтому не стоит увиливать от преодоления этой небольшой дополнитель-
дополнительной трудности; никто не должен из-за такой мелочи лишать себя характерной
для профессионала полной уверенности в свонх силах, которая так часто состав-
составляет единственное различие между первоклассным и средним специалистами.
Согласно условиям теоремы, функция gtf= \ fd[i интегрируема
и, значит, измерима по t для каждого /€#0(Л). В частности,
С /F) d\i измерима по t для каждой непрерывной функции/,
зависящей только от G. Однако если fv, v—I, 2, ...,—функции
от 6, для каждой из которых величина \ fvd\i измерима по t,
и если /v стремится к пределу / в смысле ограниченной сходи-
сходимости, то, интегрируя почленно, получим, что [ fd\x есть предел
последовательности измеримых функций от t и, следовательно,
также является измеримой функцией от t. Отсюда вытекает, что
[ fdn будет измеримой функцией от t, когда /—любая борелев-
ская измеримая функция от t. В частности, полагая /=1, когда
6€в«, и / = 0, когда 6 не принадлежит 0а, получаем, что
\ djx (o=I, 2 N)
ва
есть измеримая функция от t при условии, что каждое множе-
множество 0« достаточно элементарно и уж во всяком случае является
борелевским. (Мы предполагаем, что множества ©а, выбранные
нами выше, удовлетворяют этим условиям.)
Тогда очевидно, что первые N весов \ia—измеримые функ-
функции от t; отсюда следует, что £—измеримая вектор-функция
от t\ то же самое справедливо для проекций |8„, а > N, а зна-
значит, и для величин max (|6Ki 0) и, следовательно, для остальных
весов ц«.
Для удобства введем обозначение
260 Гл- VI. Обобщенные кривые и потоки
Мы покажем, что наш элемент g2G#S(i4) можно теперь оп-
определить, используя только его начальное значение х@) и функ-
функции Ka(i). Действительно, ввиду F7.8) (i), x(t) почти всюду
равно 2j6a!*a. а потому
Из этого равенства можно получить выражение для х (t) и под-
подставить его в выражение для функции g2. Таким образом, для
каждой функции /€#„(/4)
Z
о «
Заметим, что ввиду F7.8) (i), (ii), (iii) элемент
удовлетворяет всем условиям, которые мы-для него сформули-
сформулировали; в частности, б можно выбрать так, чтобы элемент g2.
находился на сколь угодно малом расстоянии (в смысле штрих-
метрики) от glt так как очевидно, что gj—*gj при б—«-0 для
каждой функции f^'eo(A).
Аппроксимируем теперь равномерно функции Яа(/) посред-
посредством кусочно-линейных монотонно возрастающих функций sa(t),
0<Itf<Il. Для этого сначала разобьем интервал 0<1<<11 на
большое число v разных интервалов Д, а затем каждый из ин-
интервалов Д разобьем на т интервалов Д„, <х= 1, 2 т, кото-
которые в общем случае могут быть неравными. Это последнее раз-
разбиение должно быть таким, чтобы отношение длины |Да| интер-
интервала Да к длине |A| = l/v интервала Д равнялось
где АКа—прирост функции Ka(t) в интервале Д, а ДХ—соот-
ДХ—соответствующий прирост функции
Так как функции Ха(<) строго возрастающие, то никакой из ин-
интервалов Да не вырождается в точку.
Теперь определим функции sa(t) следующим образом: sa@
совпадает с Ka(t) в двух концах каждого интервала Д; sa(t) не-
непрерывна; sv(t) линейна при /^Д«; sa(t) постоянна в каждой
§ 67. Параметрическое задание обобщенных кривых
261
из двух частей интервала Д, лежащих слева и справа от Да.
Таким образом, sa(t) — кусочно-линейная функция для каждого Д,
и ее наклон равен нулю всюду в Д, кроме интервала Да, на
котором наклон принимает значение
Это значение не превосходит нашей
есть неопределенный интеграл от 2 Цен
не превосходит К, поскольку
мало. Таким образом, sa(t)^K в
функции sa(t) интервале Д«, и sa(t)-
интервалах. Далее, разность
\sa(t)—ha{t)\, равная нулю в
концах каждого интервала Д,
не превосходит величины /±Ха,
которая не больше чем /С|Д«|-
Эта разность стремится к нулю
равномерно по /, когда v—>-оо;
в самом деле, если просуммиро-
просуммировать по а эти разности, то по-
получится величина, не превосхо-
превосходящая Kfo-
ИсПОЛЬЗуЯ фуНКЦИИ Set (/),
мы теперь определим вектор-
функцию х (t) точно так же,
как мы выразили функцию х (t)
через Xa(t), т. е. положим при
постоянной К, так как Я
а эта сумма ввиду F7.8) (ii)
е)^С. а S достаточно
каждом соответствующем
О, когда t не лежит в этих
Функции Х,„ s, в Д.
Очевидно, что x(t), 0^£<Il, является параметризацией неко-
некоторой ломаной, и сторона, соответствующая любому интервалу Да,
имеет направление 0„. Обозначим эту ломаную через g3. Это
означает, что элемент g3 определен посредством отождествления
выражения gj для каждого f с соответствующим криволинейным
интегралом, а последний можно вычислить, просуммировав по а
члены, соответствующие сторонам с направлениями Qa. Таким
образом,
i
/(*('), Qa)dsa(t).
Заметим также, что значения функции x(t) равномерно аппро-
аппроксимируют соответствующие значения функции x(t) и, значит,
лежат в нашем основном кубе, а длина 2S«(^) нашей ломаной
262
Гл. VI. Обобщенные кривые и потоки
не превосходит К- Осталось только показать, что в штрих-мет-
штрих-метрике элемент ga находится на сколь угодно малом расстоянии
от элемента glt т. е. что gj—*gj для каждой функции /, когда
v—>-оо. Так как в данном случае элемент g2 и число т фикси-
фиксированы, то нужно только показать, что
1 1
Так как очевидно, что величина
i
(которая меньше чем К, умноженное на максимум выражения
в фигурных скобках) стремится к 0, то достаточно показать, что
при v—>-оо. А для этого достаточно доказать, что для каждой
непрерывной функции f(t), O^/^l
1
lf(t)dka(t).
Это последнее соотношение представляет собой частный случай
леммы Римана—Лебега в теории рядов Фурье; его можно также
рассматривать как частный случай одной теоремы об интегралах
Стильтьеса. Для доказательства сначала заметим, что это верно,
когда f(t) заменено ступенчатой функцией <p(t). Следовательно,
при v —* оо верхний предел выражения
не изменится, если заменить функцию /(/) функцией f(t)—ф{/).
Выбрав функцию ф так, чтобы \f(t)—<р(О|<т), гДе Ч—наперед
заданная положительная постоянная, получим, что этот верхний
предел не превосходит 2/Ст]. Поскольку эта величина сколь угодно
мала, верхний предел равен нулю.
Таким образом, теорема полностью доказана.
§ 68. Существование минимума 263
§ 68
Существование минимума
Введение обобщенных кривых, а также доказательство того,
что они аналогичны обычным кривым и отличаются от последних
только турбулентностью, доставляют нам вполне удовлетвори-
удовлетворительные основания для применения в вариационном исчислении
методов Эйлера и Лагранжа, по крайней мере к таким задачам,
в которых заранее ясно, что можно ограничиться кривыми,
лежащими в фиксированном кубе и имеющими равномерно огра-
ограниченные длины. В самом деле, мы увидим, что в такой ситуации
теорема существования выполняется автоматически.
Задачи, которые мы изучали до сих пор,—это задачи сле-
следующего типа: заданы множество Во границ кривых и некоторая
подинтегральная функция /0£#0(Л); ищется нижняя грань ве-
величины gfn на классе допустимых кривых g, удовлетворяющих
условию dg£B0. Предположим сейчас, что рассматриваются
только такие кривые g, которые расположены в фиксированном
кубе и имеют равномерно ограниченные длины. Искомую нижнюю
грань обозначим через /0.
Обобщенный вариант этой задачи можно сформулировать так:
пусть В1 —замыкание множества В„; нужно иайти нижнюю грань 1г
величины gfn на классе обобщенных кривых g, которые лежат
в том же кубе, имеют равномерно ограниченные длины и удов-
удовлетворяют условию dg^B^ Однако легко видеть, что /, = /„,
т. е. эти два варианта задачи эквивалентны. Действительно,
с одной стороны, /,<!/„, так как /,—нижняя грань на более
широком классе; с другой стороны, очевидно, что множество
обычных кривых g, удовлетворяющих условию dg£Bn, плотно
в рассматриваемом множестве обобщенных кривых g (если рас-
расстояние измеряется в штрих-метрике), а величина gf0 непрерывна
по g в соответствующей топологии. Таким образом, замена пер-
первоначальной задачи ее обобщенным вариантом вполне оправданна.
Очевидно, что при такой обобщенной формулировке /t—это
минимум, который всегда достигается. Действительно, так как
/„ = /!, то существует такая минимизирующая последовательность
gv, v=l, 2, ..., что dgv£Bn и йЧ-/0 —> /х. По предположению,
кривые gv лежат в фиксированном кубе и имеют равномерно
ограниченные длины \gv\, так что они являются элементами
сопряженного единичного шара, умноженного на некоторое по-
положительное число, а такое множество бикомпактно. Следова-
Следовательно, существует сходящаяся подпоследовательность, для кото-
которой пределом будет обобщенная кривая g. Ясно, что gf0 =
=lim^v/:0 = /1 и dg^,B1. Значит, при такой обобщенной форму-
V
лировке наша задача всегда имеет решение.
264 Гл. VI. Обобщенные кривые и потоки
Однако легко заметить, что аналогичное утверждение спра-
справедливо для гораздо более широкого класса задач. Совсем
не обязательно рассматривать минимум только для величин
специального вида gf0; вместо этого можно взять любую непре-
непрерывную действительную функцию Фо(&), где непрерывность мы
понимаем в смысле штрих-топологии. Также не обязательно учи-
учитывать все кривые или все обобщенные кривые, удовлетворяющие
граничным условиям. Например, можно рассмотреть только такие
обобщенные кривые g, для которых gfi = a, где а—заданная
постоянная, a fx—заданная подинтегральная функция. Такую
задачу называют изопериметрической. В дальнейшем мы увидим,
что в теории оптимального управления теорема существования
тоже будет выполняться автоматически.
Обобщенные решения имеют очень большое значение и с прак-
практической точки зрения, в частности и тогда, когда уже известно,
что рассматриваемая задача имеет обычное решение. В качестве
примера возьмем задачу Максвелла о кратчайшем пути на вер-
вершину горы, которую мы рассмотрели выше. Если гора выпук-
выпуклая, то эта задача всегда имеет решение, состоящее из обычной
кривой, которая спирально обвивается вокруг горы до тех пор,
пока не уменьшится наклон вблизи вершины. Однако для этой
задачи существует и совсем другое обобщенное решение, которое
мы уже описали. Это решение можно аппроксимировать зигза-
зигзагообразным путем.
Вообще, любое обобщенное решение g представляет собой
предел приближенных решений gv, v=l, 2, ..., а для практи-
практических целей вполне достаточно иметь такие приближенные
решения. Эти приближенные решения сходятся не к «видимому»
решению первоначальной задачи, а, так сказать, к «скрытому»
решению, которое имеет смысл только при обобщенной форму-
формулировке.
Аналогичное явление встречается в различных областях, на-
например в гидромеханике, где скрытое решение оказывается пре-
пределом решения, обладающего вязкостью, когда вязкость стре-
стремится к нулю. В действительности и сама теория обобщенных
кривых возникла на основе сугубо практических соображений.
§ 69
Свойства обобщенных решений
Теперь уже имеет смысл говорить о необходимых условиях,
и так как наши обобщенные кривые характеризуются локальной
турбулентностью и параметризацией х (t), О ^ t <: 1, то мы будем
рассматривать необходимые условия двух видов: те, которые
касаются локальной турбулентности, и те, которые касаются
§ 69. Свойства обобщенных решений 265
свойств кривой С, определенной посредством функции x(t),
О ^ t ^ 1. Подинтегральная функция /0 £ #„ {А) снова фиксирована.
Для того чтобы сравнить наши условия с классическими
условиями вариационного исчисления, мы в виде исключения
допустим здесь, что С—кривая Фреше, и, значит, она может быть
иеединственной. Назовем С траекторией, описываемой нашей
обобщенной кривой. Задачей о турбулентности вдоль С будем
называть задачу минимизации величины gf0 в классе обобщенных
кривых g, каждая из которых описывает заданную траекторию С.
Будем говорить, что обобщенная кривая g из указанного выше
класса удовлетворяет условию Вейерштрасса вдоль траектории С,
если для некоторой параметризации x(t), O^lt^i 1, траектории С
(где x(t) удовлетворяет условию Липшица) и для некоторого
подмножества Т, состоящего из почти всех точек t интервала
0^/^1, обобщенную кривую g можно представить в виде
интеграла
g=
6
где gt для t£T является обобщенным линейным элементом рав-
равномерно ограниченной длины \gt\ с результантом {x(t), x(t)).
Кроме того, должны выполняться неравенства
(О gh>o. (И) gfo>gtf*
соответственно при Oj^j^I и t£T, причем первое из них
должно быть справедливым для каждого обобщенного линейного
элемента g с результантом (*(/), 0), а второе—для каждого
обобщенного линейного элемента с результантом (x(t), x(t)).
Приведенное выше определение не изменится, если мы пред-
предположим, что в обоих неравенствах обобщенный линейный эле-
элемент g имеет вид
где (i—мера, которую мы получили, поставив в соответствие
веса ца конечному множеству индексов a, a ga—линейные эле-
элементы (x(t), 6a) в точке x(t), для которых мы выбираем
направления 6а на единичной сфере направлений либо произволь-
произвольным образом, либо из некоторого плотного счетного подмно-
подмножества. В любом случае такая замена приводит лишь к необ-
необходимости аппроксимации нашего обобщенного линейного элемента
линейными элементами указанного специального вида, которые
имеют тот же результант; такую аппроксимацию можно получить
точно так же, как при доказательстве достаточности в теореме F7.1).
266 Гл. VI. Обобщенные кривые и потоки
Поэтому приведенное выше неравенство (i) для каждой точки
х£С выражает не что иное, как выпуклость по х при х = 0
лагранжиана L (х, х), определяемого функцией fa. Аналогично
неравенство (И) выражает условие выпуклости этого лагран-
лагранжиана по х для каждой точки x — x(t), t£T, но только в том
частном случае, когда gt— взвешенный линейный элемент, т. е.
совпадает со своим результантом (x(t), x(t)), другими словами,
когда g—кривая. В этом частном случае из леммы о замене
переменной F9.1), которую мы докажем ниже, следует, что усло-
условие (i) гарантирует выполнение условия (ii) для любой парамет-
параметризации x(t) траектории С на интервале O^^^l (где x(t) —
функция, удовлетворяющая условию Липшица), если (ii) выпол-
выполняется для одной из таких параметризаций. Когда g—кривая,
мы получаем здесь условие Вейерштрасса вдоль С, сформулиро-
сформулированное перед теоремой E6.3) в § 56, где параметр t был выбран
так, что он отличался от длины дуги только постоянным мно-
множителем.
Заметим, что в общем случае условие (i) относится только
к С и f0, а не к gn; однако его следует рассматривать как
неотъемлемую часть определения, потому что это условие так же
сильно влияет на соотношение (ii), как и в рассмотренном выше
частном случае, когда g—кривая, ибо оно позволяет выполнять
некоторые простые замены переменной в соответствии со следую-
следующей леммой:
F9.1) Лемма о замене переменной. Пусть s(t),
неубывающая функция, удовлетворяющая условию Липшица и гра-
граничным условиям s@) = 0, s(l)= 1, и пусть То—множество значе-
значений t, для которых производная этой функции равна нулю. Тогда
существует борелевское множество Т, которое состоит из почти
всех точек t интервала О ^ t ^ 1, не принадлежащих множеству
ТП, и обладает следующими свойствами:
(а) Функция s(t) взаимно однозначно отображает множество Т
на множество S, состоящее из почти всех точек s интервала
0l
(b) На множествах Т и S производные ds/dt и dt/ds функции
s (t) и обратной функции t (s) существуют и не равны нулю, а их
произведение равно единице.
(c) Если функция q>@i O^tf^l, измерима по Борелю, огра-
ограничена и равна нулю в То, a ty(s), O^s<Il,—измеримая функ-
функция, равная 4>{t(s))-fc на множестве S, то
§ 69. Свойства обобщенных решений 267
Доказательство. Пусть Е—любое подмножество единичного
интервала; обозначим через s(£) множество значений функции
s(t), t£ £, а через s~x(E)—множество-значений t, для которых
s(t)€E. Заметим, что для любого интервала / значений пере-
переменной t, а следовательно, по аддитивности и для любого откры-
открытого множества О этих значений мера | s (/) | или | s (О) | множества
образов равна интегралу от (ds/dt) соответственно по / или О.
Таким образом, взяв в качестве О открытое множество s"'(£),
находим, что для любого открытого множества £ значений пере-
переменной s
ЧЕ)
Эта формула имеет место и тогда, когда Е—единичный интервал,
и посредством вычитания мы устанавливаем, что она справедлива
для любого замкнутого множества Е. Отсюда последовательным
переходом к пределу получаем, что оиа справедлива для любого
борелевского множества Е значений переменной s. Более того,
правая часть формулы не изменится, если мы будем рассматривать
интеграл только на множестве 7\ точек, для которых ds/dt > О,
т.е. будем интегрировать по множеству Tl(]s~1(E); поэтому ее
можно записать в виде
В частности, из этой формулы следует, что мера множества Е
равна нулю тогда и только тогда, когда мера множества Tl{]s~1 (£)
равна нулю. Ввиду существования производной ds/dt почти всюду,
это утверждение эквивалентно следующему: мера множества Е
равна нулю тогда и только тогда, когда мера множества s^)—То
равна нулю.
Далее, обозначим через t(s), O^s^l, обратную функцию
для s(t). Тогда t(s)— строго возрастающая однозначно опреде-
определенная функция всюду, кроме множества точек разрыва, которое
не более чем счетно. Точки разрыва функции t (s) соответствуют
интервалам, где функция s(t) постоянна. Тем самым очевидно,
что функция t{s) однозначно определена в s(r,), и, значит, ото-
отображение, задаваемое функцией s(t), /£7\, взаимно однозначно.
Заметим также, что, согласно полученной выше формуле для
меры множества значений переменной s, мера дополнения к s G\)
равна нулю. Так как функция t (s) имеет производную почти
всюду, то в s(F,) можно найти такое борелевское подмножество S,
что мера его дополнения в единичном интервале равна нулю,
и поэтому функция t (s) имеет производную dt/ds в S. Если
потребуется, мы так сузим множество S, чтобы его образ при
t(s) был борелевским множеством. (На самом деле это получается
268 Гл. VI. Обобщенные кривые и потоки
автоматически, но указанный способ позволяет легко установить
это, не меняя меры, поскольку множество меры нуль остается
таким же при отображении s(t) в 7\.) Итак, S—взаимно одно-
однозначный образ при отображении s(t) борелевского множества Т,
и обе производные dt/ds, ds/dt существуют в соответствующих
точках, а потому их произведение равно единице. Тем самым
мы доказали утверждения (а) и (Ь). Теперь проверим утвержде-
утверждение (с) сначала в том случае, когда г[з—характеристическая
функция множества Е. В этом случае соответствующая формула
эквивалентна полученной выше формуле для | Е |. Общий случай
получается отсюда путем составления конечных линейных ком-
комбинаций и перехода к пределу (этот способ хорошо знаком тем,
кто читал книгу Сакса «Теория интеграла»).
F9.2) Следствие. Пусть С—спрямляемая кривая Фреше, не
вырождающаяся в точку, и пусть g—обобщенная кривая, опреде-
определяемая так же, как в теореме F7.1), при помощи обобщенных
линейных элементов gt и параметризации х (t), О ^ t ^ 1, кри-
кривой С, где функция x(t) удовлетворяет условию Липшица. Далее,
предположим, что gt = 0, когда х (t) — 0. Тогда параметр t можно
выбрать так, чтобы он отличался от длины дуги вдоль С только
постоянным множителем.
Доказательство. Для любой подинтегральной функции f £ #„ (Л)
введем обозначение
функция y(t) равна нулю почти всюду на множестве, в котором
s(t) имеет равную нулю производную. Применяя F9.1) (с) к экви-
эквивалентной функции, получим, что
и обобщенный линейный элемент имеет вид
Обозначим этот обобщенный элемент через gs; мы видим, что он
обладает требуемыми свойствами.
Теперь мы подготовлены к обсуждению задачи о турбулент-
турбулентности. Мы докажем два результата, очевидным следствием кото-
которых является теорема E6.3).
F9.3) Теорема. Для того чтобы обобщенная кривая g была
решением задачи о турбулентности вдоль траектории С, опи-
описываемой кривой g, необходимо и достаточно, чтобы она удовлет-
удовлетворяла условию Вейерштрасса вдоль С.
§ 69. Свойства обобщенных решений 269
F9.4) Теорема. Для того чтобы обобщенная кривая g была
решением задачи о турбулентности вдоль траектории С, описы-
описываемой кривой g, необходимо и достаточно, чтобы величина gf0
равнялась нижней грани чисел с, каждое из которых является
пределом последовательности 3 (Cv) для некоторой последователь-
последовательности кривых Cv, v = 1, 2, ..., равномерно ограниченной длины,
сходящейся к траектории С в смысле Фреше.
Из теорем F9.3) и F9.4) видно, что условие Вейерштрасса является одно-
одновременно необходимым и достаточным. Хотелось бы, чтобы все условия были
такими!
Доказательство теоремы F9.3). Сначала проверим необходи-
необходимость двух неравенств (i) и (ii) условия Вейерштрасса. Если (i)
не выполняется в некоторой точке х0 6 С, то можно уменьшить
величину gf0 при помощи следующей процедуры. Сначала введем
кусочно-линейное (линейное на каждом из трех отрезков) отобра-
отображение ^-интервала на себя, так что после замены параметра функ-
функция x(t) будет принимать постоянное значение х0 в некотором
интервале ^^f^^I представление кривой g в виде \gtd/npn
этой замене, конечно, сохранится. Далее, можно определить такой
обобщенный линейный элемент g с результантом (х0, 0), что gf0 < 0;
складывая g и gt на интервале /,^^^/г» можно уменьшить вели-
величину gf0, прибавив к ней (t2—^)g/0, при этом параметризацию
x(t) менять не нужно.
Величину gf0 можно уменьшить и в том случае, когда на неко-
некотором множестве £ положительной меры условие (ii) не выпол-
выполняется для соответствующего обобщенного линейного элемента g,
зависящего от t £ Е. В этом случае нам нужно, чтобы обобщен-
обобщенный линейный элемент g был измеримой функцией t и имел рав-
равномерно ограниченную норму для t £ Е.
Для того чтобы добиться этого для некоторого множества Е
положительной меры, заметим, что, как указывалось выше, если
неравенство (ii) не выполняется для какого-то g, то оно не вы-
выполняется и для обобщенного линейного элемента g специального
вида, описанного выше. Аналогично, можно считать, что g имеет
ВИД £i + g2. т- е- равен сумме двух обобщенных линейных эле-
элементов, где первый gt ставит в соответствие рациональные ве-
веса \ia конечному числу N—п направлений 6О, выбранных из неко-
некоторого фиксированного счетного плотного множества, а вто-
второй g2 ставит в соответствие действительные веса цо остальным п
ортогональным направлениям 6О, выбранным из направлений,
параллельных и антипараллельных п координатным осям. Таким
образом, обобщенный линейный элемент g2 определяется элемен-
270 Гл. VI. Обобщенные кривые и потоки
том gx и результантом элемента g, a gt описывает не более чем
счетное множество. Значит, мы можем разложить множество Е
на счетное число таких частей, что в каждой из них условие (ii) не
выполняется для обобщенного линейного элемента g, норма кото-
которого меньше некоторого фиксированного целого числа и который
имеет вид g, + git где gt теперь фиксирован. По крайней мере
одна из этих частей имеет положительную меру, и через Е мы
обозначим теперь эту часть. Тогда указанный обобщенный эле-
элемент g удовлетворяет требуемым условиям в новом множестве Е.
Если заменить теперь gt на g в Е, то величина gf0 умень-
уменьшится.
Обратно, покажем, что если условия (i) и (п) выполняются,
то величину g/0 нельзя уменьшить. Пусть g равно gt в условии
(i) и равно 0 в условии (ii); тогда g,/0 равно нулю для почти
каждого t, где x(t) — Q>. Значит, gt можно заменить на 0, когда"
x(t) = 0, и при этом величина gfa не изменится. Так как случай,
когда С вырождается в точку, тривиален, то, ввиду F9.2), можно
предположить, что t = s, т. е. параметр отличается от длины дуги
вдоль С только постоянным множителем. Пусть теперь g—лю-
g—любая другая обобщенная кривая, описывающая ту же траекторию С.
Представим g в виде интеграла ^ gt dt, соответствующего опреде-
определенной параметризации x(t) траектории С, где x(t) удовлетво-
удовлетворяет условию Липшица. Согласно условию (i), gtf0 ^ 0, когда
x(t) = O. Следовательно, мы не увеличим gf0, заменив gt на 0 там,
где x(t) = O, и поэтому для доказательства неравенства gfo^gfo
можно считать, что gt = 0, когда x(t) =0. Значит, мы можем,
как и раньше,считать, что t = s. Тогда, по условию (ii), gtf0^gtf0
для почти всех t и, значит, gfo^efo- Таким образом, теорема
полностью доказана.
Доказательство теоремы F9.4). Достаточно показать, что класс
чисел с можно отождествлять с классом значений величины gf0,
где g—обобщенная кривая, описывающая траекторию С. Оче-
Очевидно, что каждое такое значение принадлежит рассмотренному
классу чисел с. Значит, нужно доказать обратное утверждение,
а именно, что каждое число с можно представить в виде g/0. Для
этой цели предположим, что g—тонкий предел подпоследователь-
подпоследовательности кривых Cv, определяющей с; такой тонкий предел сущест-
существует, потому что длины ограничены, и по определению тонкого
предела gf0 совпадает с пределом с величины 3(CV). Далее, как
было показано при доказательстве необходимости в теореме F7.1),
§ 69. Свойства обобщенных решений 271
существуют такие параметризации xv(t), O^tf^l, кривых Cv,
что подпоследовательность этих параметризаций равномерно схо-
сходится к параметризации x(t), Q)^Lt^L\, траектории, описываемой
обобщенной кривой g. Очевидно, что этой траекторией может быть
только траектория С. Таким образом, теорема доказана.
Из теорем F9.3) и F9.4) мы получаем следующий результат:
F9.5) Следствие. Пусть L(x, х)—нижняя грань величины gf0
для обобщенных линейных элементов g с результантом (х, х), и
пусть L(x, 0) = 0, или (что то же самое) L(x, 0)Ф — оо для
всех х. Тогда минимум величины gf0 для обобщенных кривых g,
описывающих заданную траекторию С, а также нижняя грань
множества чисел с из теоремы F9.4) равны
F9.6) )L(x, x)dt.
с
Таким образом, обобщенную задачу минимизации можно свести
к традиционной задаче с лагранжианом L, сформулированной
Тонелли. Конечно, во многих практических задачах лагранжиан
L не обладает гладкостью, требуемой при классической поста-
постановке задачи.
Теперь мы можем применять классический алгоритм Эйлера —
Лагранжа, который позволяет получить экстремали как для
задачи минимизации F9.6), так и непосредственно для обобщен-
обобщенных криволинейных интегралов от gf0. В действительности же
только теперь мы, наконец, достигли той точки, начиная с кото-
которой вариационное исчисление можно развивать так, как это было
задумано Лагранжем и Эйлером.
Именно этим мы и собираемся заниматься. Однако мы сде-
сделаем это для более общих задач оптимального управления,
которым будет посвящен второй том данной книги.
Приложение I
Егще немного об основных понятиях
выпуклого анализа и теории
интегрирования
§70
Введение
Вопросы, рассматриваемые в этом приложении, скорее относятся
к концу главы IV. Результаты, которые мы приведем здесь, будут
частично использованы в приложении II. Однако основная цель
этого приложения—дать читателю возможность пополнить
свой багаж и тем самым помочь ему справиться с современной
литературой по многим вопросам, родственным изучаемым в этой
книге. В частности, это приложение поможет ему осилить допол-
дополнительную литературу по функциональному анализу и выпуклому
анализу. А изучение этой литературы совершенно необходимо
для тех, кто желает заняться исследованиями в нашей области.
Вопросы, которые мы здесь затронем, не будут рассмотрены
с исчерпывающей полнотой. К ним относятся теоремы отдели-
отделимости для некоторых выпуклых конусов, векторное интегриро-
интегрирование непрерывных функций и описание замкнутой выпуклой
оболочки в терминах центров масс.
§71
Теорема отделимости для выпуклого конуса в #0(Л)
Пусть через А обозначено (так же как в конце главы IV)
любое ограниченное замкнутое множество в евклидовом прост-
пространстве. Мы будем рассматривать функциональные пространства
#0(Л) и #о(Л). Эти пространства можно заменить некоторыми
более общими пространствами, не изменяя при этом наших рас-
рассуждений. Например, теорему отделимости, которая будет дока-
доказана в этом параграфе, можно сформулировать и доказать ана-
аналогичным способом для любого векторного пространства, в котором
задана (в качестве полунормы) неотрицательная однородная
выпуклая функция \\\ элемента /, удовлетворяющая условию
четности |— f\ = \f\.
Расстоянием
<?(/„, Е)
от элемента /0€#0(Л) до множества £с#„(Л) мы называем ве-
величину
f|f/|
§ 71. Теорема отделимости для выпуклого конуса в 1$0(А) 273
G1.1) Лемма, (i) Если Е—конус, то Q(f, E)—однородная
функция относительно f. (ii) Если Е-^выпуклое множество, то
Q(f, E)—выпуклая функция относительно f.
G1.2) Теорема отделимости в %0(А). Пусть Е—выпуклый
конус в #0(Л), и пусть /0—элемент из %0(А), находящийся на
положительном расстоянии Q (f0, E) — d от Е. Тогда существует
такая линейная функция gf, f£%0(A), где g^liA), что
для всех f£E.
Доказательство леммы G1.1). Справедливость утверждения (i)
очевидна, и поэтому нужно доказать только утверждение (ii).
Пусть /„ = #; + (!— О/о. где 0< * < 1 и f'o, fl лежат в #0(Л).
Для заданного е > 0 определим в Е два элемента /', /", для
которых расстояния \f — f'0\, \f"—fo\ отличаются от соответст-
соответствующих нижних граней Q (f'o, £), Q (/„, £) на величины, мень-
меньшие е. Если через f обозначим элемент rf/'-f-(l—t)f" из Е, то
Q(/o. E)^\f-f0\^t\r-f'ol + V-t)\f"-n\-
Наконец, устремив е к нулю, мы получим соотношение, выражаю-
выражающее требуемое свойство выпуклости, а именно соотношение
Q{f0, E)<tQiF'o, E) + (l-t)Q(T0. E).
Доказательство теоремы G1.2). Введем для краткости обозна-
обозначение q(f)— Q (f, E)/d. Так как начало принадлежит множеству Е,
то, очевидно, Q (/, £)^|/|, и, значит, q(f)^\f\/d. Кроме того,
согласно G1.1), q(f) — выпуклая однородная функция от /.
В соответствии с определением D2.2) из § 42 гл. IV для эле-
элемента /0 существует линейная функция l(f) (которую называют
опорной функцией и которая может не быть однородной), такая,
что l(fo) = el(fo) и ^(/)^<7(/) Для всех /. Очевидно, что /(О)г^
^ q @) = 0. Далее, если 0 < t < 1, то из линейности функции
/ (/) следует, что
A -01 @) + tl (fjt) = I (/„) = q (/„) = tq (fo/t).
Так как tg(fo/t)^tl(fjt), то из этого соотношения получаем, что
/@)^=0 и, значит, / @) = 0. Таким образом, доказано, что/(/) —
однородная функция. Значит, можно ввести обозначение /(/)= gf,
%;{A
ge;{)
Очевидно, что |g|^l/d и gfo=\. Кроме того, для
имеем gf^q{f) = O. Остается только показать, что \g\^\/d.
Для этой цели, имея заданное е > 0, мы определим / £ £ так,
чтобы расстояние Q (f0, Е) отличалось от |/—fo\ на величину,
274 Приложение I. Еще об основных понятиях выпуклого анализа
меньшую е. Кроме того, имеем
Устремив е к нулю, получим, что \g\Q(f0, Е)~^\, т. е. \g\d"^ 1.
Таким образом, теорема полностью доказана.
§ 72
Лемма о недостаточном радиусе
Для доказательства соответствующей теоремы отделимости в дуальном про-
пространстве нам понадобится одна важная лемма Банаха. Здесь мы приведем эту
лемму только для пространства 'ёо(А), так как ее доказательство в общем случае
основано на использовании трансфинитного замыкания, которое нам в дальнейшем
не потребуется. Однако мы настоятельно советуем читателю разыскать ее в книге
Банаха (стр. 119—121й), где общий случай этой леммы рассматривается при дока-
доказательстве теоремы отделимости для линейного подпространства.. Книга Банаха
все еще остается «библией» функционального анализа, а лучший способ обучения—
это чтение истинно великих книг и статей. Такие работы не стареют. Изучая так
называемые «современные» книги, получаешь гораздо меньше. В этом смысле
великие книги никогда не бывают «современными», так как они проникнуты твор-
творческим духом, и автор отнюдь не пытается сам извлечь из своих идей все воз-
возможное.
В этом параграфе мы будем рассматривать множество Г с %\ (А),
элемент go€%Z(A), не принадлежащий множеству Г, и положи-
положительное число R. Это число R назовем недостаточным радиусом
в точке g0, если
R <\g—go\ Для каждого g£T.
Для заданных g0, Г и недостаточного радиуса R значащим мно-
множеством назовем такое множество Ес%0(А), что для каждого
элемента g£T существует по крайней мере один элемент f£E,
для которого
R\f\<\(g-go)f\-
G2.1) Лемма о недостаточном радиусе. Пусть заданы g0, Г
и недостаточный радиус R; предположим, что множество Г
ограничено и замкнуто в смысле слабой* сходимости. Тогда су-
существует конечное значащее множество Е.
Эта лемма связана с понятием разрешимости, применяемым в
основаниях математики и теории вычислительных машин. Сфор-
Сформулируем эквивалентное утверждение, также принадлежащее
Банаху.
G2.2) Секвенциальный вариант леммы. Пусть заданы g0, Г
и недостаточный радиус R, причем множество Г слабо* замкнуто.
Тогда в единичном шаре U пространства #0 (А) существует такая
последовательность fv, v = l, 2 что fv->0 и ни один из
*> Стр. 103—105 украинского перевода.—Прим. ред.
§ 72. Лемма о недостаточном радиусе 275
элементов g £ Г не может удовлетворять неравенствам \(g—go)fv\^R
одновременно для всех v.
Доказательство эквивалентности лемм G2.1) и G2.2). Предпо-
Предположим, что лемма G2.2) справедлива, и пусть g0, Г, R удовлет-
удовлетворяют условиям леммы G2.1). Так как множество Г ограничено,
то существует такое конечное число М, что \g—gJ^Al для
всех g$T. Пусть /v, v—1, 2 — последовательность из лем-
леммы G2.2); поскольку она сходится к 0, можно указать такое
число v0, что | /v | ^ R/M для v > v0. Очевидно, что тогда каждый
элемент g (;Г удовлетворяет неравенствам
для v > v0. Следовательно, согласно лемме G2.2), ни один из
элементов g£V не может удовлетворять этим неравенствам при
^ и тем более он не может удовлетворять неравенствам
Это означает, что множество Е, состоящее из /v, v^v0, пред-
представляет собой значащее множество, и, следовательно, лемма G2.1)
в этом случае справедлива.
Обратно, предположим, что лемма G2.1) справедлива, и пусть
g0, Г, R удовлетворяют условиям леммы G2.2). Выберем воз-
возрастающую последовательность действительных чисел Rk, k=l,
2, ..., стремящуюся к оо, первый член которой /?, равен R.
Обозначим через Гй подмножество из Г, для которого
Согласно лемме G2.1), для g0, Гк, Rk существует конечное зна-
значащее множество Ек. Умножая элементы Ек на соответствующие
постоянные, можно предположить, что \f\= R/Rk или f£Ek.
В этом случае ни один из элементов g £ Гк не может удовлетво-
удовлетворять неравенствам
\(g-go)f\<R
для всех f€Ek. Ввиду того что Г= UTft, ни один из элементов
g£ Г не может удовлетворять этим неравенствам для всех f g U Ек.
Так как [}Ек—счетное множество, то, упорядочив его в после-
последовательность, получаем утверждение леммы G2.2). Тем самым
эквивалентность лемм G2.1) и G2.2) доказана.
Доказательство леммы G2.1). Если бы лемма G2.1) была не-
неверна, то для каждого целого положительного числа k можно
было бы указать такой элемент gk€.T, что
276 Приложение I. Еще об основных понятиях выпуклого анализа
для каждого / из множества Ек, состоящего из первых k элемен-
элементов плотного счетного подмножества !Рс'во{А). (Подмножество53
было введено в § 48 гл. IV, и здесь предполагается, что оно
упорядочено в последовательность.) Так как множество Г огра-
ограничено, то можно выделить подпоследовательность элементов gk,
стремящуюся к пределу g (в смысле слабой* сходимости),
а последний, очевидно, удовлетворяет неравенству
\(g-go)f\<R\f\
для каждого f^P, а значит, и для каждого f^^(A). Из пос-
последнего утверждения следует неравенство \g—go\^R, которое
противоречит условиям леммы, так как g—слабый* предел после-
последовательности gk и, следовательно, g£V.
§ 73
Дуальная теорема отделимости
Эта вторая теорема отделимости для выпуклого конуса представляет собой зна-
значительно более глубокий результат, чем теорема, доказанная в § 71 Она приме-
применяется в пространстве, дуальном к банахову пространству Здесь мы сформули-
сформулируем эту теорему для пространства %*,(А), так как именно этот результат пона-
понадобится нам в дальнейшем. В общем случае эта теорема доказывается тем же ме-
методом, только лемма о недостаточном радиусе используется при доказательстве
в более сильной формулировке, приведенной в книге Банаха Эта пара теорем
отделимости вместе с теоремами о неподвижной точке составляет математический
аппарат, без которого не сможет обойтись ни один аналитик.
G3.1) Теорема отделимости для выпуклого конуса в о()
Пусть Г—слабо* замкнутый выпуклый конус в 'el (A), g0—элемент
из "ёЦА), не принадлежащий Г, a R—такое положительное
число, что
R < \g-goI для каждого g£V.
Тогда существует такой элемент f^^0(A), что
1Л<1/Д, Я/=1. gf<0 для всех g£T.
Доказательство. Так как R — недостаточный радиус, то суще-
существует последовательность элементов fv£U, v=l, 2, .... удов-
удовлетворяющая условиям, перечисленным в лемме G2.2). Пока-
Покажем, что искомый элемент f € #0 (А) можно взять в виде суммы ряда
где коэффициенты Cv, v = l, 2, ....— вещественные константы,
удовлетворяющие следующим условиям:
G3.2) 2|Cv|
для каждого элемента g£ Г. В самом деле, так как fv£U, то из
первого соотношения следует, что ряд, определяющий элемент /,
§ 73. Дуальная теорема отделимости 277
сходится в #0(Л) и что справедливо соотношение |/|^1//?. Два
других соотношения G3.2) показывают, что gj = 1 и^/=0для g£ Г.
Следовательно, осталось только доказать существование посто-
постоянных Cv, v = l, 2, .., удовлетворяющих соотношениям G3.2).
Для этого заметим, что так как fv -»- 0, то gfv -*■ 0 для каждого
элемента g^^l(A) и, значит, последовательности {gfv} можно
погрузить в пространство с сходящихся последовательностей.
Обозначим через Е подмножество пространства с, состоящее из
всех таких последовательностей {gfv}, соответствующих элемен-
элементам gGT, а через е„—элемент пространства с, являющийся
последовательностью {gjv\. Очевидно, что Е — выпуклый конус
(так же как и Г).
Однако пространство с, в которое теперь помещены Е и е0,
будет уже не дуальным, а банаховым пространством". Дейст-
Действительно, как мы отметили в конце § 49 гл. IV, с—это про-
пространство вида #„(/4) для некоторого другого множества А.
Кроме того, согласно лемме G2.2), ни один из элементов е£Е
не может удовлетворять неравенству \е—eo\^R, так как \е—ео\
является верхней гранью для \(g—go)fv\ no v. Используя обоз-
обозначения из G1.2), получаем, что Q (е0, Е) ^ R, и, значит, можно
применить первую теорему отделимости. Используя представле-
представление для элемента дуального к с пространства, полученное в
D9.7) из § 49 гл. IV, мы заключаем, что существуют посто-
постоянные С„ Сг, С3, ..., удовлетворяющие следующим соотноше-
соотношениям:
= O для
Так как Hmg/v = 0 для каждого элемента g^.'SHA), то первое
из этих соотношений имеет следствием первое соотношение из
G3.2), а остальные два прямо сводятся к соответствующим соот-
соотношениям из G3.2). Тем самым теорема полностью доказана.
*> Эта фраза может показаться неясной, ибо пространство, правильно
дуальное к банахову (например, £?* (А)), само является банаховым. По-видимому,
автор хотел сказать следующее: применение первой теоремы отделимости, которое
далее последует, связано с переходом к дуальному пространству. Так как мы
находимся в g* (А), то вместо элемента f^Wo(A) мы получили бы при этом
f**^l* (А). Заменяя W^iA) пространством с, дуальное к которому нам
известно (в отличие от %'* (А)), мы получаем возможность сконструировать f
в самом g0 (A). — Прим. ред.
278 Приложение I. Еще об основных понятиях выпуклого анализа
§ 74
Лемма локализации для Б...и-компактного множества
В остальных параграфах этого приложения мы попытаемся
описать замкнутую выпуклую оболочку Б...и-компактного множе-
множества в банаховом пространстве, и для этого нам потребуются неко-
некоторые сведения о векторном интегрировании. В следующих далее
рассуждениях буквой Б обозначается любое Б...и-компактное мно-
множество в метрическом пространстве.
Напомним, что для такого множества справедлива теорема
Бореля о конечном покрытии. Нам понадобится лишь весьма
частный случай этой теоремы: пусть е—заданное положительное
число; тогда множество В можно покрыть конечным числом
открытых шаров радиуса е. Это утверждение можно без труда
доказать, заметив, что в В существует такое конечное подмно-
подмножество Е, что каждая точка из В находится от Е на расстоянии,
меньшем е.
(Если бы такого подмножества не существовало, то можно
было бы построить последовательность точек из В, каждая из
которых находилась бы на расстоянии ^ е от всех предыдущих,
а потому и от всех остальных точек последовательности, вопреки
свойству компактности. В самом деле, начав с любой точки Plt
можно выбрать любую точку Р2, находящуюся на расстоянии ^ е
от Р,, затем любую точку Р3 на расстоянии ^ е от Р, и Рг и т. д.)
Используя этот частный случай теоремы Бореля, мы получим
следующую «лемму локализации»:
G4.1) Лемма. Пусть Весть Б.. .и-компактное подмножество ме-
метрического пространства, и пусть е > 0. Тогда существует конечное
число таких непрерывных функций hh определенных на В и удов-
удовлетворяющих условиям Os^ft,^ 1 и 2ft,- = 1 ", что каждая функция
hi равна нулю вне некоторого соответствующего ей шара радиуса е.
Доказательство. Пусть ц>(г)—непрерывная монотонно убываю-
убывающая функция, определенная при г ^ 0 и удовлетворяющая
условиям
Ф(г) = 1,
Далее, пусть
Вх, В2, ..., BN
— пересечения подмножества В с шарами радиуса е/2, образую-
образующими покрытие подмножества В, a S,(a)—пересечение подмно-
подмножества В со сферой радиуса г, концентричной шару, который
') Ввиду этого равенства подобные леммы теперь чаще называют «леммами
о разложении единицы».— Прим. ред.
§ 75. Риссовские меры 279
определяет В,-. Обозначим через ср,- функцию, определенную на В
и принимающую постоянное значение ф (г) на сфере S{(r) для
каждого г ^ 0. Далее, положим
и, вообще, определим А,- для / — 2, 3,.... N следующим образом:
А/ = A—Ф,)-Ф„ где ф, = 2
Из этих соотношений получаем
и, следовательно, имеем
Таким образом, значения функций Л,-, i)),-, так же как значения
функций ф,-, должны лежать в единичном интервале, и, кроме
того, в множестве В,-, где ф,- = 1, имеем
Так как множества В,- покрывают В, то отсюда следует, что ^А,- == 1
во всем В. Наконец, заметим, что Н{ — A—^,)-ф,-, а ф,- равны
нулю для точек, находящихся на расстоянии ^е от центров
шаров, определяющих множества В,-, поэтому все утверждения
леммы G4.1) доказаны.
§ 75
Риссовские меры
В дальнейшем нам потребуется только поверхностное знаком-
знакомство с понятием меры, так как мы будем интегрировать только
непрерывные функции. Поэтому мы примем здесь определение,
принадлежащее Бурбаки и приведенное в конце § 49 гл. IV.
Согласно этому определению и в полном соответствии с риссовским
представлением, мерой \i на В просто называется некоторый
элемент g € #0* (#)•
Мы будем рассматривать только тот случай, когда мера не-
неотрицательна, т. е. является элементом положительного конуса
в дуальном пространстве. Такую меру будем называть риссовской
мерой. Конечно, ее можно было бы продолжить до борелевской
меры, применяя метод монотонных последовательностей У. Г. Юнга,
но мы этим не воспользуемся.
Для риссовской меры мы автоматически получаем линейность
операции
280 Приложение I. Еще об основных понятиях выпуклого анализа
для функций ф€^о(^)"- Кроме того, из соотношения ф<1я|з сле-
следует, что
Далее, последовательность риссовских мер u.v, v= 1, 2, ..., схо-
сходится к риссовской мере ц, если она сходится в смысле слабой*
сходимости пространства #„ (В), т. е. если для каждой функции
В § 48, 49 гл. IV было отмечено, что доказанные там результаты
(при незначительной их модификации) применимы и в том случае,
когда ограниченное замкнутое подмножество А евклидова прост-
пространства заменяется произвольным Б...и-компактным множеством В.
Таким способом или же сославшись на аналогичный, но еще более
общий результат, относящийся к любым пространствам, дуальным
к банаховым, мы получим, что из любой ограниченной последо-
последовательности риссовских мер можно извлечь сходящуюся подпо-
сл едовател ьность.
В связи с этим заметим, что вместо функций фаЬ(|дс—с\),
линейные комбинации которых мы использовали для образования
плотного подмножества 9" из ^а(В), удобнее взять счетное мно-
множество систем функций hh введенных в предыдущем параграфе,
для которых e=l/v, v=l, 2, ... . Доказательство плотности
подмножества !Р сводится при этом к упрощенному варианту рас-
рассуждений следующего параграфа.
§ 76
Евклидова аппроксимация банаховой вектор-функции
Обозначим через ¥ некоторое банахово пространство, а его
элементы / будем называть векторами. Норму элемента / будем
обозначать |/|, а иногда Q(f), если потребуются различия в обо-
обозначениях. Непрерывную функцию f (x), х£ В, со значениями в ¥
следует теперь отличать от элемента f€¥, и поэтому мы обозна-
обозначим ее символом /(•). Для единообразия в обозначениях будем
аналогичным образом обозначать через ср(-) действительную
непрерывную функцию ср(х), х£В. Функции f(-) назовем бана-
банаховыми вектор-функциями, или просто вектор-функциями. Они
1( Напомним, что мерой называется элемент g^^Sl (В). Для любой функции
Фб^о(/3) интегралом I (j(x)d(x по определению называется число gq>.—Прим.ред.
§ 77. Элементарная оценка нормы 281
образуют банахово пространство <F (•), в котором мы определим
норму следующим образом:
Евклидовой вектор-функцией мы назовем конечную линейную
комбинацию векторов /,€^"t для которой коэффициентами будут
непрерывные действительные функции <?,•(•)• Эту комбинацию
можно записать в виде
или
Мы называем ее евклидовой потому, что она составлена из
конечного числа векторов пространства if.
G6.1) Аппроксимационная лемма. Пусть f(-)—банахова век-
вектор-функция, а б—положительное число. Тогда существует такая
евклидова вектор-функция f(-), что
Доказательство. Выберем е>0 так, чтобы колебание вектор-
функции /(•) на расстоянии е было меньше б, и построим функции
Л,(-) в соответствии с леммой локализации G4.1). Обозначим
через fi значение функции f(x) в центре шара, определяющего
множество Bh которое появилось при доказательстве леммы G4.1),
и положим
/Ч-)
Тогда для х £ В
и, значит, для любого такого х норма левой части меньше ве-
величины
Следовательно, максимум левой части относительно х меньше б,
что и утверждалось.
§ 77
Элементарная оценка нормы
Нам понадобится следующее простое неравенство:
G7.1) Лемма. Пусть \i—рйссовская мера на Б...и-компактном
множестве В, и пусть через М(х) и М обозначены соответственно
норма постоянного вектора xgJF и норма евклидовой вектор-
функции ^,fi4>i{') в <F(-). Тогда справедливы неравенства
282 Приложение I. Еще об основных понятиях выпуклого анализа
Доказательство. Обозначим через bt и Ь величины
и
S
в
Можно предположить, что ЬфО. Тогда вектор uo = ^lfibi/b удов-
удовлетворяет условию Q(«„)=!. Следовательно, в дуальном к W
пространстве существует элемент уп, для которого уои0 — 1 и
J^Q{f) при всех /GdF. Положим ^i = yj,- Тогда
= У» 2 fft, (х
= ya(ujb)=^b. Следовательно,
J
что и утверждалось в лемме.
§ 78
Векторное интегрирование
Построение векторного интеграла мы проведем в два этапа.
Сначала определим интеграл по мере \i для евклидовой вектор-
функции
выражением
2 f,
в
так как для евклидовой вектор-функции, заданной двумя раз-
различными способами, можно по лемме G7.1) получить оценку
нормы разности двух выражений для интеграла, причем в этой
оценке М=0. Указанным способом интеграл определяется на
плотном подмножестве пространства W(■), состоящем из евкли-
евклидовых вектор-функций.
Теперь оценку G7.1) можно интерпретировать следующим обра-
образом: она означает, что интеграл по мере [i, рассматриваемый
как функция от/(-), определенная на этом подмножестве, рав-
равномерно непрерывен по порожденной нормой метрике простран-
пространства W (•).
Из равномерной непрерывности мы заключаем, что эта функция
имеет единственное продолжение на все пространство <F(*),
сохраняющее свойство равномерной непрерывности. В самом деле,
если /v—интеграл по мере [х от евклидовой функции fv(-), стре-
стремящейся к /(•), то из леммы следует, что нормы разностей /v—/v»
в пространстве ¥ малы, когда малы нормы разностей /v(-)—/V'(")
в пространстве ¥{•). Таким образом, lim/v существует н пред-
§ 79. Замыкание выпуклой оболочки 283
ставляет собой вектор в пространстве W'. Легко видеть, что этот
предел не изменится, если аппроксимировать вектор-функцию/(•)
другой последовательностью евклидовых вектор-функций. Значе-
Значение этого предела lim/v обозначим через
S
в
Предельным переходом можно теперь получить, что этот ин-
интеграл представляет собой линейную операцию в пространстве
¥ (•) и что его норма удовлетворяет неравенствам
Q [S f (x)d[i\ < S Q [f (x)]dp^\f(.)\ l 1ф.
\-B -I В В
Таким образом, мы получили искомое равномерно непрерывное
продолжение; очевидно, что оно единственно.
Приведем также следующий результат:
G8.1) Теорема. Пусть последовательность риссовских мер
[iv, v = 1, 2, ..., сходится к риссовской мере \х, т. е. для каждого
Ф(-)€*.(Д)
\ Ф (х) d\i = lim J Ф {х) d[iv.
в v в
Тогда для каждой вектор-функции /(-)€<F(-) справедливо ра-
равенство
В самом деле, очевидно, что это равенство имеет место для
евклидовых вектор-функций. Следовательно, вычитая подходящую
евклидову вектор-функцию из произвольной банаховой вектор-
функции, легко получить, что для последней при v—>оо верхний
и нижний пределы интеграла по мере \iv отличаются на сколь
угодно малую величину от интеграла по мере \i. Значит, предел
существует и равен интегралу по мере \i, что и утверждалось
в теореме.
Используя векторное интегрирование, можно сформулировать вариацион-
вариационную задачу довольно общего вида. Для подобной задачи автор этой книги пост-
построил лет тридцать назад теорию, которая была основана на применении понятия
обобщенных кривых и в которой теорема существования выполнялась автома-
автоматически. В следующем параграфе мы используем векторное интегрирование для
совсем других целей.
§ 79
Замыкание выпуклой оболочки
Рассмотрим частный случай, когда BcW, и предположим,
что /(•)—тождественная функция f(x)^=x, x£B. Пусть на В
задана нормированная риссовская мера [х, т. е. такая риссовская
284 Приложение I. Еще об основных понятиях выпуклого анализа
мера, что
Jld,l=l.
в
Центром меры fi назовем точку пространства <F, отвечающую
вектору
Мы умышленно избегаем здесь использования термина «центр тяжести», ре-
резервируя его для соответствующих конечных комбинаций. Кроме того, слово
«тяжесть» совершенно неуместно там, где отсутствуют веса.
G9.1) Теорема. Замыкание выпуклой оболочки Б...и-компактного
подмножества В банахова пространства <F состоит из центров
нормированных риссовских мер, сосредоточенных на В. .
Доказательство. Заметим, что множество центров, о котором
идет речь, замкнуто. В самом деле, если х0—предел центров xv
нормированных риссовских мер \iv, v = 1, 2, ..., в пространстве cF',
то, как указывалось в § 75, можно выбрать последовательность,
для которой jiv сходится к нормированной риссовской мере ц,
и тогда, согласно теореме G8.1), центр меры \л. равен пределу
х0 центров xv. Таким образом, множество центров нормированных
риссовских мер, сосредоточенных на В, которое, очевидно, со-
содержит выпуклую оболочку В, должно содержать и замыка-
замыкание этой оболочки.
Осталось только показать, что каждый такой центр лежит
в этом замыкании. Для этого аппроксимируем тождественную
функцию /(х)=х, х£В, евклидовыми вектор-функциями 2/А (•).
где /,-—точки из В, а Л,-(-)—функции из леммы локализации.
Если точкам /,• поставить в соответствие веса
то, согласно предыдущим рассуждениям, конечная сумма 2/А
стремится к'центру меры ц. Эта конечная сумма принадлежит
выпуклой оболочке подмножества В, так как очевидно, что 6, ^ О,
2Ь,= 1. Таким образом, теорема полностью доказана.
Только что доказанная теорема представляет собой элементарный вариант
значительно более тонких результатов, в которых нормированные меры рассмат-
рассматриваются на подмножестве крайних точек множества В. Эти результаты, полу-
полученные главным образом Шоке, играют значительную роль в теории потенциала.
В связи с теорией Шоке и крайними точками см. также статью Бишопа и де Лю х>.
*• А также книгу Р. Фелпса «Лекции о теоремах Шоке», М., 1968.— Прим,
ред.
Приложение II
Структура обобщенных потоков
и их роль в вариационном исчислении
§ so
Введение
Расширение класса допустимых кривых за счет введения обоб-
обобщенных кривых—это лишь первый шаг на пути к дальнейшему
расширению этого класса, когда вводятся в рассмотрение также
все обобщенные потоки, удовлетворяющие заданным граничным
условиям. Лишь после такого расширения появляется возмож-
возможность в полной мере использовать современные методы, основан-
основанные на понятии двойственности.
Разумеется, мы докажем, что в результате такого расширения
класса допустимых кривых минимум не уменьшается. Это может
показаться странным, поскольку среди получивших теперь право
гражданства новых элементов из %t(A) есть «существа», весьма
не похожие на кривые, причем некоторые из них выглядят совсем
непривычно. И действительно, в данном случае гораздо легче
доказать, чем объяснить. Доказательство связано с фундамен-
фундаментальным алгоритмом Гюйгенса, на котором зиждется значитель-
значительная часть развитой в этой книге теории.
Впрочем, приведя доказательство этого факта, мы не избавим
себя от необходимости дать ему разумное объяснение. Именно
этому и посвящена большая часть настоящего приложения (кстати,
нам понадобятся при этом результаты, установленные в прило-
приложении I). Истинная причина упомянутого обстоятельства состоит
в том, что многие обобщенные потоки фактически исключены
самим характером накладываемых граничных условий. Чтобы
убедиться в этом, нам понадобится теорема, характеризующая
обобщенные потоки, обладающие границей определенного типа.
Эту теорему мы будем называть теоремой о лагранжевом пред-
представлении (для рассматриваемых обобщенных потоков); дело в
том, что необходимость подобного представления заставляет нас
вернуться к работе Лагранжа по гидромеханике.
Используемое нами понятие обобщенного потока наиболее
близко к эйлерову описанию движения жидкости. Однако клас-
классическая гидромеханика требует, чтобы выполнялось еще допол-
дополнительное условие, известное под названием уравнения нераз-
неразрывности. В нашем случае ему соответствует ограничение, нала-
налагаемое на границу. В книгах по гидромеханике показывается,
что с учетом уравнения неразрывности и классических предпо-
286 Приложение II. Структура обобщенных потоков
ложений о гладкости движение жидкости допускает другое опи-
описание, принадлежащее Лагранжу. (Как раз это описание и ис-
используется в тех задачах, решение которых иллюстрируется
хорошо известными гидромеханикам красивыми картинками, изо-
изображающими линии тока.) Лагранжево описание сводится к раз-
разложению движения жидкости на семейство линий тока. Именно
такое разложение или, если угодно, восстановление картины
движения жидкости по заданным линиям тока и лежит в основе
нашей теоремы о представлении. Для полной точности нам нужно
знать, в каких пропорциях жидкость распределяется по разным
линиям тока, иначе говоря, нам нужно представить лоток жид-
жидкости как бы в виде смеси линий тока, взятых в соответствую-
соответствующих пропорциях.
§ 81
Полигональные потоки
Понятие смеси и теорему нужного нам типа для начала удобно
проиллюстрировать на одном простом частном случае обобщен-
обобщенного потока. Кроме того, результаты, относящиеся к этому част-
частному случаю, понадобятся нам, прежде чем мы сможем произвести
дальнейшее расширение класса допустимых кривых в задачах
вариационного исчисления, о котором было сказано ранее.
Понятие смеси будет определено для некоторых множеств
мер, или, что то же самое, для некоторых подмножеств поло-
положительного конуса пространства Чёо(В), где В выбрано подхо-
подходящим образом. В частности, это понятие будет определено для
некоторых множеств кривых и обобщенных кривых. В этом па-
параграфе мы ограничимся рассмотрением смесей конечных мно-
множеств. Пусть задано конечное множество мер |ыд, ji2, ..., ^д,;
смесью этого множества мер мы назовем любую меру вида ^с^,
где с,- — неотрицательные постоянные. Здесь мы будем рассмат-
рассматривать меры, определенные на множестве А из главы VI, т. е.
на прямом произведении куба х-пространства и единичной сферы
^-пространства.
В частности, отрезок, лежащий в этом кубе, будет такой
мерой. Отрезок подразумевается при этом ориентированным. Это
есть не что иное, как кривая, обладающая параметризацией x(t),
Q^Lt^Ll, где x(t)—линейная по / функция, не равная постоян-
постоянной. В соответствии с главой VI каждая такая кривая и, в част-
частности, рассматриваемый отрезок отождествляется с некоторым
элементом положительного конуса пространства 'Gl(A). Иначе
говоря, отрезок—это риссова мера. Значит, мы можем опреде-
определить смесь конечного числа отрезков s,- н записать ее в виде
конечной суммы 2C/Si» гл>е а< — неотрицательные константы.
Безусловно в этой сумме можно не учитывать члены с коэффи-
§ 81. Полигональные потоки 287
циентами й, = 0. Такую смесь отрезков мы будем называть по-
полигональным потоком. Мысленно его можно представлять себе
как движение жидкости по конечному числу очень узких трубок,
расположенных вдоль этих отрезков; при этом скорость жидкости
равна единице, а о/—линейная плотность на st. Конечно, эти
трубки могут существовать лишь в нашем воображении и не обя-
обязаны соединяться друг с другом. Например, они могут расходиться
веером из одной точки, подобно воде, льющейся из садовой лей-
лейки; вода при этом делится на конечное число струй и для этого
совсем не нужно, чтобы каждая из них действительно была за-
заключена в отдельную трубку. Конечно, в этом случае струи из-
изгибаются, но можно вообразить, что они прямолинейны.
Полигональный поток назовем полигоном, если коэффициенты
af^0—целые числа. Самым простым случаем будет дигон: он
состоит из суммы s,-|-s2 пары равных и противоположно направ-
направленных отрезков. Читателю может быть трудно представить себе
такое движение жидкости; скорее это похоже на поток автомо-
автомобилей, движущихся по двум сторонам прямого шоссе. Однако
с большого расстояния поток транспорта трудно отличить от
потока частиц жидкости. Кроме того, посредством разбиения наш
дигон можно представить в виде суммы очень большого числа
совсем маленьких дигонов, и в пределе его можно свести к вы-
вырожденной форме локальной турбулентности. Такое явление можно
реализовать в природе, хотя обычно мы говорим в таком случае
не о движении жидкости, а о продольных колебаниях вдоль от-
отрезка. Такие колебания могут иметь место, например, вдоль
упругого стержня или при прохождении по проводнику перемен-
переменного электрического тока.
Кроме дигонов, мы рассмотрим также следующие частные
случаи полигонов: простую полигональную дугу и простой замк-
замкнутый полигон. Эти понятия не нуждаются в уточнении. Заметим
только, что простой замкнутый полигон замкнут в смысле эле-
элементарной геометрии, в то время как термин «замкнутый» при-
применительно к произвольному обобщенному потоку g означает
здесь, что граница dg равна нулю. Легко видеть, что простой
замкнутый полигон будет замкнутым и в этом смысле, так что
наша терминология не противоречит терминологии, принятой в
элементарной геометрии. Описывая полигональный поток как
движение жидкости, мы молчаливо соглашаемся с одной услов-
условностью, привычной специалистам по гидродинамике. Она состоит
в том, что жидкость может возникать из ничего в одной точке
(источнике), двигаться вдоль кривой или отрезка и исчезать в
другой точке (стоке). Значительно легче представить себе дви-
движение жидкости, соответствующее простому замкнутому полигону,
так как фиктивные источники и стоки в углах уничтожают друг
Друга, и поэтому можно считать, что их вовсе не существует.
2S8 Приложение II. Структура обобщенных потоков
Таким образом, мы имеем два вида полигональных потоков,
которые наша интуиция четко различает: потоки, обладающие
фиктивными источниками и стоками, и потоки, не содержащие
их, т. е. замкнутые. Приводимая ниже теорема одновременно
упрощает и уточняет это различие.
(81.1) Теорема. Полигональный поток р замкнут тогда и
только тогда, когда его можно представить в виде смеси 2С/Р/
дигонов и простых замкнутых полигонов pt с положительными
коэффициентами ct.
Доказательство. Сформулированное условие, очевидно, является
достаточным, и нужно доказать только его необходимость. Пред-
Представим данный замкнутый полигональный поток р в виде смеси
2Jsas конечного множества S отрезков s с коэффициентами as > 0.
Обозначим через Е конечное множество точек, состоящее из вер-
вершин полигонального потока р, т. е. из'начальных точек Ps и
концов Qs отрезков s$S. Произведя, если нужно, предвари-
предварительное разбиение, можно считать, что два отрезка из S имеют
общие внутренние точки только в том случае, когда они равны
и противоположно направлены.
Так как интеграл от точной подинтегральной функции xgrad<p(x)
на каждом отрезке s£S равен <p{Qs) — ф^), где Ps, Qs—концы
отрезка s, то условие др = О можно выразить соотношением
которое должно иметь место для любой непрерывно дифферен-
дифференцируемой действительной функции ф. Выбирая функцию ф таким
образом, чтобы она равнялась нулю на Е всюду, кроме одной
из вершин, мы получим, что каждая вершина является началом
по крайней мере одного отрезка sgS (а также концом какого-то
другого отрезка).
Следовательно, для любой вершины х±£Е существует отрезок
s,gS с началом xt; далее, если через хг обозначен конец отрезка
sx, то существует по крайней мере один отрезок s2 с началом х2;
вообще, из полученной таким образом v-й вершины xv£E можно
провести по крайней мере один отрезок svgSK (v+l)-fl вер-
вершине xv+i €£•
Так как Е — конечное множество, то последовательность вер-
вершин xv содержит повторяющиеся члены. Отбросив начальные
члены, предположим, что первой повторяется вершина х1 и что
при первом повторении она имеет вид Хц+\- В таком случае
выражение q = 2s/» i^N, будет, очевидно, либо дигоном, либо
простым замкнутым полигоном, и можно положить
§ 82. Основы современной двойственности 289
где А,—наименьший из коэффициентов as для s — s^ s2, ..., вц,
а г—замкнутый полигональный поток, состоящий из смеси от-
отрезков, принадлежащих собственному -подмножеству St множе-
множества S.
Так как в подмножестве St меньше членов, чем в S, то наше
утверждение доказывается далее индукцией по числу элементов
множества S.
Теорема (81.1) показывает, сколь сильные структурные ограничения содер-
содержатся неявно в граничном условии. Разумеется, справедливо и Л-мериое обобще-
обобщение этой теоремы в /г-мерном пространстве, и по существу это лишь другая фор-
формулировка фактов, хорошо знакомых всем, кто изучает топологию.
§82
Основы современной двойственности
в вариационном исчислении
Под современной двойственностью мы здесь понимаем исполь-
использование дуального пространства #£(Л), в отличие от гамильто-
новой двойственности, имеющей классическое происхождение.
Предыдущую теорему, которая в сущности относится к элемен-
элементарной топологии, можно незначительно видоизменить, и она
станет ключом к использованию этой двойственности. Мы при-
применим эту теорему к замкнутому полигональному (п + 1)-мерному
потоку p + q, где р—полигональный поток в «-мерном прост-
пространстве, имеющий такую же границу ds0, как отрезок s0, a q
имеет границу —ds0 и состоит из пары отрезков, соединенных
в дополнительной вершине, лежащей вне n-мерного пространства.
Удалив <7, мы получим выражение для р, и таким образом при-
придем к следующей теореме:
(82.1) Теорема. Пусть р—полигональный поток с такой же
границей dp = ds0, как у отрезка s0. Тогда р — р' +р", гдедр"=0,
а р'—смесь ^с,-/?,- конечного числа простых полигональных дуг
ph для которых dpi~ds0.
Очевидно, что в (82-0 мы должны иметь 2ci==^» или> как
мы будем говорить, 2jCiPt—нормированная смесь; в самом деле,
dsB = dp' = ^др! = 2 с А,.
(82.2) Следствие. Пусть Q —класс простых замкнутых поли-
полигонов, Р—класс таких полигональных потоков р, что dp = ds0,
где s0—заданный отрезок, а Р'—подкласс из Р, состоящий из
простых полигональных дуг. Далее, пусть элемент /0 £ #0 (А) та-
таков, что для всех q£Q справедливо неравенство qf^O. Тогда
infp/0 для р£Р' совпадает с infpf0 для
Ю Кг 1274
290 Приложение II. Структура обобщенных потоков
Доказательство. Сначала заметим, что неравенство qfa ^ О,
справедливое но условию для простых замкнутых полигонов д,
остается верным при переходе к пределу, а значит, и в случае,
когда q—дигон, так как последний является предельным
(в 'el(A)) случаем простого замкнутого треугольника. Тогда
ввиду (81.1) это же неравенство выполняется, когда q—любой
замкнутый полигональный поток. Следовательно, введя обозна-
обозначение m—mlpf0 для р£Р', мы получим из теоремы (82.1), что
для любого р£Р справедливо неравенство
где с,-—те же коэффициенты, что и в (82.1), а значит, согласно
замечанию, сделанному после (82.1), они удовлетворяют соотно-
соотношению 2с/=1- Следовательно, pfo^tn, т. е. нижняя грань для
р £ Р не меньше т. Очевидно, что она не межет быть и больше т,
так как Pz)P'. Таким образом, наше утверждение доказано.
§ 83
Элементарная форма вариационного принципа выпуклости
Границу $ = др полигонального потока р назовем симплщи-
альной границей. Легко видеть, что если р — симплициальная
граница, то —р тоже симплициальная граница, так как все
отрезки смеси р можно заменить противоположно направленными.
Кроме того, любая смесь конечного числа симплициальных гра-
границ есть симплициальная граница, так как она является грани-
границей соответствующей смеси полигональных потоков, которая
также представляет собой полигональный поток. Таким образом,
любая линейная комбинация симплициальных границ будет сим-
плициальной границей. Иначе говоря, симплициальные границы р
образуют векторное пространство.
Обозначим временно это пространство через Qo и определим
в нем норму |Р| как нижнюю грань длин |р| полигональных
потоков р, для которых р = др. Значит, Qo—нормированное век-
векторное пространство. Однако это пространство не является пол-
полным; его пополнение мы рассмотрим позднее.
Обозначим снова через /0 подинтегральную функцию, такую,
что qfn^O для каждого простого замкнутого полигона q. Обоз-
Обозначим через тф) нижнюю грань величины pf0 в классе полиго-
полигональных потоков р, удовлетворяющих условию Р = др. Следу-
Следующий результат представляет собой фундаментально важный
принцип.
(83.1) Принцип выпуклости, тф)—выпуклая однородная
функция от р в пространстве Qo. Кроме того, Р||/|
§ 84. Первое расширение 291
Доказательство. При доказательстве следствия (82.2) мы пока-
показали, что qfo^0 для каждого замкнутого полигонального пото-
потока q. Следовательно, т@)^0, а тогда'очевидно, что /н@) = 0,
так как существуют сколь угодно короткие замкнутые полиго-
полигональные потоки. Далее, легко видеть, что т(ф) = стф) при
с>0 и /n(P + p')<m(P)-f m(P')- Взяв р" = — Р, получим, что
тф) не может равняться —оо. Далее, очевидно, что соотноше-
соотношение т(ф) = ст (Р) справедливо при с = 0. Значит, тф)—одно-
тф)—однородная выпуклая функция. Наконец, неравенство т(Р)^|р|-|/0|
мы получим, если перейдем к нижней грани в обеих частях
неравенства /J/o^lpl'l/ol- Тем самым принцип полностью до-
доказан.
(83.2) Следствие. При тех же предположениях пусть Ро6^о-
Тогда существует такая линейная однородная действительная
функция 1ф), определенная для Рбй0, что 1фп) = тф0) "
(83.3) 1ф)<тф) для всех р€Ro.
Это утверждение непосредственно следует из (83.1) и второго
определения выпуклости или теоремы Хана — Банаха.
§ 84
Первое расширение
В этом параграфе мы покажем, что нижняя грань тф) вели-
величины pfn в классе полигональных потоков р с границей р £ Qo
не изменится, если мы рассмотрим эту величину в более широком
классе, включив в него все обобщенные потоки g с той же самой
границей; иначе говоря, мы покажем, что тф) является нижней
гранью величины gf0 для всех обобщенных потоков g с грани-
границей р. Для этой цели можно предположить, как и раньше, что
9/о^0 Для каждого простого замкнутого полигона q. В против-
противном случае мы находим сразу, что т@)= —оо и, следовательно,
т(Р)=—°° Для каждого Рб^о. а в этом случае справедливость
нашего утверждения очевидна. Далее, достаточно доказать, что
для каждого обобщенного потока gc границей dg = p имеет место
неравенство
(84.1) £/о>/(Р)
(здесь мы пользуемся обозначениями из (83.2)). В самом деле,
если dg = p0, то, в силу (84.1), gf0 > / (р„) = т ф0) и, значит,
т ф0) не превосходит нижней грани величины gf0 для обобщен-
обобщенных потоков g с границей dg = fi0; следовательно, эта нижняя
грань равна тф0), так как полигональные потоки образуют
подкласс множества всех обобщенных потоков. Поскольку наши
рассуждения справедливы для любого ро€-о. мы свели доказы-
доказываемое утверждение к (84.1).
10*
292 Приложение II. Структура обобщенных потоков
Итак, остается проверить неравенство (84.1). Его доказа-
доказательство будет основано на одном варианте классического алго-
алгоритма Гюйгенса, который уже не раз помогал нам в этой книге.
Соотношение (83.3) по существу выражает этот алгоритм в наи-
наиболее общей форме, но при этом не видно, будут ли рассматри-
рассматриваемые величины столь гладкими, чтобы этот алгоритм было
удобно применять. Поэтому мы дополним его стандартной про-
процедурой сглаживания, которая заключается в усреднении по
малым кубам.
Процедура сглаживания приводит к незначительному сужению
исходного куба в ^-пространстве, в котором лежат допустимые
кривые и все остальное. Это означает, что часть наших рассуж-
рассуждений проводится для обобщенных потоков, .принадлежащих
дуальному пространству #о(Л_), где А_— прямое произведение
слегка уменьшенного куба и единичной сферы х-пространства.
Однако это не повлияет на конечный результат.
Пусть S (х) — значение функции /(|3), когда C — граница от-
отрезка, соединяющего фиксированную точку (начало) с точкой х.
Для точек х из уменьшенного куба обозначим через S(x) и fo(x, 0)
следующие выражения:
где е—малое положительное число, а интегрирование произво-
производится по единичному кубу. Заметим, что если E = ds, где s—от-
s—отрезок с началом х' и концом х", то
Отсюда (объединяя это неравенство с соответствующим неравен-
неравенством для противоположно направленного отрезка и замечая,
что s/o^|s|-|/o|), находим, во-первых, что функция S удовлет-
удовлетворяет условию Липшица, а следовательно, функция S непре-
непрерывно дифференцируема. Во-вторых, усредняя обе части преды-
предыдущего неравенства, находим, что
Левую часть этого неравенства можно обозначить через s\j>, где
г])(лг, 0)—точная подинтегральная функция GgradS(x). Следова-
Следовательно, sip^.sf0. Разделим обе части этого неравенства на длину
отрезка s и устремим эту длину к нулю, оставляя фиксирован-
фиксированными начало и направление отрезка s; получим, что
*(*. ех7в(*, в)
для всех (х, 0)£А_. Отсюда следует, что
§ 85. Принцип расширения и первая теорема замыкания 293
для любого обобщенного потока g(z%Z(A_). Предположим, что
в этом последнем неравенстве dg — dp = fi, где р—полигональный
поток. Так как ф—точная подинтегральная функция, то gty
можно отождествить с рур, где pty—смесь величин яф для под-
подходящего конечного множества отрезков s. Поэтому gify можно
представить в виде смеси соответствующих приращений функции
S, которые стремятся к приращениям S, когда е—*0. Значит,
gty—+l($). Очевидно также, что gfo—*gfo при е—+0; следова-
следовательно, мы получили искомое неравенство (84.1) при дополни-
дополнительном условии, что g€#o(i4-)- Однако от этого дополнитель-
дополнительного условия легко избавиться, представив g в виде предела
аналогичных обобщенных потоков, полученных из g изменением
масштаба.
§ 85
Принцип расширения и первая теорема замыкания
для обобщенных потоков
Обозначим снова через /0 подинтегральную функцию из %0(А),
такую, что qfo^0 для каждого простого замкнутого полигона
qdА, а через ро—границу некоторого отрезка, лежащего в А.
Тогда, согласно (82.2), величина /н(|Зв) будет нижней гранью
величин pf0 для простых полигональных дуг р с границей |30.
В то же время, согласно предыдущему параграфу, m($0) = inlgf0
для всех обобщенных потоков g с границей |30. В частности,
/н(р0) есть нижняя грань величин gf0 для любого класса обоб-
обобщенных потоков g с границей ро, который содержит по крайней
мере простые полигональные дуги с той же границей. Например,
тф0) является нижней гранью величин gf0 в классе спрямля-
спрямляемых кривых с границей р*0, а также в классе обобщенных кри-
кривых с той же границей. Конечно, здесь предполагается, что эти
кривые и обобщенные кривые лежат в А, т.е. что они принад-
принадлежат пространству 'ёЦА). Однако мы не налагаем здесь усло-
условия равномерной ограниченности длин рассматриваемых кривых.
Таким образом, если /0 удовлетворяет сформулированному выше
условию, то нижняя грань значений интеграла от f0 вдоль спрям-
спрямляемых кривых, лежащих в Л и имеющих заданные концы,
равна нижней грани в классе обобщенных кривых и даже в
классе обобщенных потоков с той же границей. Это свойство мы
назовем принципом расширения.
Совпадение нижних граней для полигональных и для обоб-
обобщенных потоков с одинаковой симплициальной границей Р можно
выразить в виде теоремы замыкания, которая показывает, что
такое граничное условие налагает существенные ограничения на
обобщенный поток.
294 Приложение II. Структура обобщенных потоков
(85.1) Теорема. Для того чтобы обобщенный поток g0 обла-
обладал симплициъгьной границей ро, необходимо и достаточно, чтобы
он был пределом полигональных потоков с той оке границей.
Доказательство. Очевидно, что это условие достаточно, так
как предел мы понимаем здесь в смысле слабой* сходимости.
Остается доказать необходимость. Пусть Го—множество полиго-
полигональных потоков р, таких, что dp — kpo, где k— неотрицательное
действительное число, и пусть 1\—слабое* замыкание множества
Го. Очевидно, что Г„ и Г, — выпуклые конусы.
Для доказательства нашего утверждения достаточно показать,
что £0€Г\. В самом деле, если Р„ —0, то мы сразу получаем
наше утверждение, если же Ро^О, то соотношение &,€!", рав-
равносильно существованию такого элемента р' €Г0, что р' —*go\
здесь граница др', которая имеет вид &р„, представляет собой
ограничение функционала р' на множество точных подинтеграль-
ных функций и, значит, стремится к dgo= ро. Отсюда следует,
что k—>-1, поэтому теперь мы можем представить g0 в виде
предела полигонального потока p^=p'/k с границей |30.
Итак, осталось доказать, что g0 £ Г,. Предположим противное.
Так как из сходимости по норме следует слабая* сходимость,
то существует такое положительное число R, что
\g—g»\> R Для всех
Значит, можно применить теорему отделимости G3.1) в прост-
пространстве 'ёо(А), которую мы доказали в § 73 приложения I. Обо-
Обозначим через /„ подинтегральную функцию —/, где / — элемент
из #0(Л). существование которого доказывается в G3.1); тогда
существует такая подинтегральная функция Д, € %>о М). что gf0 ^ О
для всех g£Tlt a gnf0= — 1 и l/ol^l/^- В частности, с одной
стороны, мы имеем неравенство qfa ^ 1 для каждого простого
замкнутого полигона q, так как k может равняться 0, а с дру-
другой стороны, мы получаем аналогичным образом, что т(Р„)^0.
Согласно рассуждениям предыдущего параграфа, отсюда следует,
что gofo^O, а это противоречит равенству go/o= — 1. Тем самым
теорема полностью доказана.
§ 86
Дальнейшее расширение: плотные потоки и их границы
До сих пор, изучая обобщенные потоки и их границы, мы
пользовались только штрих-метрикой, которая эквивалентна сла-
слабой* сходимости. Однако мы определили норму для границ Р€^о
и теперь обобщим это определение.
Пусть р—граница некоторого обобщенного потока, и пусть
Gg—класс всех обобщенных потоков с границей р*. Введем обо-
§ 86. Дальнейшее расширение: плотные потоки и их границы 295
значение
Выбрав в качестве /0 из § 84 подинтегральную функцию, равную
тождественно единице, получим, что в случае симплициальной
границы Р эта нижняя грань не изменится, если класс Ср заме-
заменить на подкласс, состоящий из полигональных потоков. Значит,
наше обозначение не противоречит использованному ранее в Qo.
Теперь определим для любого g^^l(A) норму
r, ]dg\}.
Эту норму назовем плотной" и отметим, что соответствующее
понятие предела совместимо как со слабым* пределом для обоб-
обобщенных потоков (эквивалентным сходимости в штрих-метрике),
так и с пределом по норме для их границ. Плотными назовем
также соответствующие метрику, топологию, предел и замыкание.
Наконец, обобщенные потоки, принадлежащие плотному замы-
замыканию класса полигональных потоков, будем называть плотными
потоками, а границу такого плотного потока будем называть
плотной границей. Обозначим через Q пространство плотных
границ.
Тот факт, что граничное условие налагает очень жесткое
ограничение на класс рассматриваемых обобщенных потоков, еще
раз иллюстрируется следующей теоремой:
(86.1) Теорема. Класс плотных потоков совпадает с классом
обобщенных потоков g, таких, что dg£Q.
В самом деле, эта теорема является обобщением теоремы
замыкания, и ее можно сформулировать аналогично теореме
(85.1):
Для того чтобы соотношение dg0 £ Q выполнялось для обоб-
обобщенного потока g0, необходимо и достаточно, чтобы g0 был пре-
пределом полигонального потока р, для которого |dgn—др\—*0.
Доказательство. Нужно доказать только необходимость этого
условия. Допустим, что dgn£Q. Согласно предположению, суще-
существует такой плотный поток glt что dga = dgl и gr является сла-
слабым* пределом полигонального потока рх, для которого др1—dgt
11 Употребляемый здесь автором термин consistent означает, с одной стороны,
«твердый, плотный», а с другой — «совместимый, согласующийся». При переводе
мы остановились на первом значении, так как consistent flow сохраняет черты
кривых, т. е. потоков с бесконечной плотностью (точнее, с плотностью
типа 6-функции на кривой), а не «размазан» по всему множеству А, как в случае
произвольного обобщенного потока. К тому же «плотный», в отличие от «совмести-
«совместимый», не предполагает наличия дополнения (совместимый с чем?). Однако при
этом в переводе пропала игра слов.— Прим. ред.
296 Приложение 11. Структура обобщенных потоков
является границей некоторого g с малой нормой. Так как
где dpi—симплициальная граница, то, согласно теореме (85.1),
gn-\-g—предел полигонального потока р с границей др = др1.
Выбрав этот поток р так, чтобы штрих-норма для go + g—р
была меньше \g\, получим тогда, что \\g0—p||<2|g|, т.е. эта
величина сколь угодно мала.
Теперь мы перейдем к обобщению результатов §§ 83—85 и, в
частности, принципа выпуклости.
(86.2) Расширенный вариационный принцип выпуклости. Пусть
/o€i?o(^)i для Р€& обозначим через Ср класс обобщенных пото-
потоков g, таких, что dg = $. Далее, пусть ffi(P) = infg/0 для g£G$.
Тогда для Р £ Qo величина т (Р) совпадает с нижней гранью вели-
величин pf0 в классе полигональных потоков р £ Ср. Кроме того,
т@) = 0 тогда и только тогда, когда qfo^O для каждого про-
простого замкнутого полигона q. В этом случае тф)—выпуклая
однородная функция для P£fi; в противном случае тф) посто-
постоянна и равна —оо.
Доказательство. Случай, когда P(Efio> был доказан в § 84, и
его можно, в частности, применить, когда Р = 0. Остальные
утверждения из (86.2) доказываются точно так же, как для (83.1).
Легкость, с которой мы установили (86.1) и (86.2), может навести некоторых
читателей на мысль, что при таком расширении класса допустимых кривых мы
ничего не выигрываем, подобно тому как большое количество пены в кружке
вовсе не означает, что в ней много пива. Действительно, новая форма принципа
выпуклости ничего не даст нам при решении классических задач, в которых
функция тф) рассматривается только для случая, когда Р — граница отрезка.
Однако этот принцип делает возможным изучение гораздо более общих задач,
в которых, например, начальные направления минимизирующих дуг распреде-
распределены в соответствии с некоторой мерой на единичной окружности.
Иногда даже от выдающихся математиков можно услышать, что математиче-
математическая теория тем более ценна и интересна, чем больше тяжелого труда в нее вло-
вложено. Это, несомненно, совершенно правильно, но следует помнить, что весь этот
тяжкий труд выполняется за кулисами и большая его часть затрачивается на то,
чтобы придать материалу доступную форму. Если читатель ценит только то, что
находит трудным для восприятия, он рискует получить весьма превратное пред-
представление о современной математике. Аналогично на заре автомобилизма шофер
мог судить о мощности мотора по шуму и пыли, которые поднимала машина,
но такой критерий вряд ли пригоден в наше время. Тем, кто определял значение
результата в математике, взвешивая страницы, занятые его доказательством, или
засекая секундомером время, затраченное на его освоение, пришлось пережить
несколько сильных потрясений, когда были найдены простые доказательства
теорем, которые раньше требовали длинных и запутанных рассуждений. По
правде говоря, математик похож на художника: его труд полон страданий, хотя
конечный результат не содержит и намека на них. Точно так же, созерцая произ-
произведение искусства, мы думаем о том, что хотел сказать автор, а не о-том, каких
усилий это ему стоило.
§ 87. Предварительные сведения о смесях 297
Принципы выпуклости (83.1) и (86.2) являются основными, и
различие между ними проявляется только в задачах, содержа-
содержащих более общие граничные условия, чем те, которые встреча-
встречаются в классической теории. Своим значением они обязаны двой-
двойному определению выпуклости. Из них сразу вытекает существо-
существование (как в (83.2)) некоторой линейной функции /(|3) с теперь
уже привычными нам свойствами. На этом пути условие суще-
существования минимума можно выразить в виде необходимого и
достаточного условия на функцию / (|5). Соответствующую теорему
можно рассматривать как современную форму вариационного
алгоритма Гюйгенса:
(86.3) Теорема. Пусть f<,£4S0(A), и пусть gn—обобщенный
поток с границей ^go = Po€^; далее, пусть функция тф), P£Q,
определена так же, как в (86.2). Тогда для того, чтобы
необходимо и достаточно, чтобы существовала однородная линей-
линейная функция /(Р), Р£&, такая, что /(р\.) = £„/о " /(PXg/o для
всех обобщенных потоков g с границей dg—$£Q.
Достаточность здесь очевидна, а необходимость следует из
(86.2), так как ясно, что т($0)^=—оо и, значит, qfo^O для
каждого замкнутого полигона q.
§ 87
Предварительные сведения о смесях и о лагранжевом
представлении
Для изучения следствий теоремы (86.3) нам понадобятся
некоторые сведения о структуре плотных потоков, для этого-то
и предназначено лагранжево представление. Однако сначала
нужно обобщить понятие смеси.
Пусть ц—нормированная риссовская мера на Б...и-компактном
множестве В, состоящем из риссовскихмер на Б...и-компактном
множестве А, которое здесь, как обычно, является прямым про-
произведением куба в х-пространстве и единичной сферы в х-про-
странстве. Нормированной риссовской смесью из множества В назо-
назовем центр меры ц. Так как множество В состоит из обобщенных
потоков, эту смесь можно записать в виде интеграла
$
в
где gb—тождественная функция от элемента Ь£Ви.
11 То есть gb==b. Справа здесь Ъ является элементом из В, т.е. риссов-
риссовской мерой, а слева стоит отвечающий этой мере обобщенный поток, т.е. эле-
элемент из Ч@1(А). — Прим. ред.
298 Приложение II. Структура обобщенных потоков
В общем случае смесью из некоторого множества В наших
обобщенных потоков назовем любой обобщенный поток, который
можно представить в виде конечной или счетной суммы
где cv—действительные неотрицательные числа, a gv—нормиро-
gv—нормированная риссовская смесь из бикомпактного подмножества BvcB.
Конечно, это означает, что для каждого элемента f€"eB(A)
в частности, взяв вместо / функцию, тождественно равную еди'
нице, получим
Если g—смесь из множества В, то элементы из В называют
ее компонентами. По аналогии с лагранжевой интерпретацией
движения жидкости (в которой используется понятие линий тока
и которая была рассмотрена в § 80), представление обобщенного
потока g в виде смеси некоторого множества компонент будем
называть (в тех немногих случаях, которые мы здесь изучим)
лагранжевым представлением. Для того чтобы подчеркнуть это
сходство, мы будем временно называть обобщенную кривую тече-
течением. Далее, если обозначить (так же, как в теореме F7.1) из
§67 гл. VI) через gt, 0^f<Il, систему обобщенных линейных
элементов, которая определяет обобщенную кривую
а через Е—замкнутое подмножество положительной меры из
интервала 0 ^ t ^ 1, то обобщенный поток
можно назвать прерывистым течением или струей. Течения или
струи единичной длины будем называть единичными течениями
или струями.
В основном мы будем рассматривать смеси, в которых мно-
множество компонент В является одной из следующих систем:
(а) плотные потоки; (Ь) единичные течения или струи либо течения
или струи меньшей длины; (с) замкнутые течения.
Сначала рассмотрим случай (с), т. е. выясним вопрос о ла-
гранжевом представлении обобщенного потока g, когда компо-
компонентами являются замкнутые обобщенные кривые. Ясно, что
такое представление может существовать только в том случае,
когда обобщенный поток g по меньшей мере замкнут. Однако
§ 87. Предварительные сведения о смесях
299
мы увидим, что одной замкнутости не достаточно. В этом можно
убедиться на простом примере, построенном Э. Бишопом. Мы
приведем здесь этот пример, так как ой поможет понять, какого
рода трудности нам придется преодолевать. Однако мы несколько
модифицируем его, чтобы обойтись без использования мощных
эргодических теорем.
Рассмотрим классическое представление тора, лежащего в трех-
трехмерном пространстве, посредством вектор-функции х(и, v) с пе-
периодом единица по каждому из действительных аргументов и, v.
Функция х(и, v) элементарная, но ее явный вид нам здесь не
понадобится; конечно, она дифференцируема столько раз, сколько
нужно, и задает взаимно однозначное отображение полуоткры-
полуоткрытого единичного квадрата на тор. Обозначим через К фиксиро-
фиксированное иррациональное число. В каждой точке (и, v) возьмем
х = х(и, v)
вектор, параллельный прямой v — Ku, а в соответствующей точке
х = х(и, v) на торе обозначим через 6^(х) единичный касательный
вектор, направление которого соответствует направлению вектора,
взятого в точке {и, v).
Теперь определим обобщенный поток g следующим образом:
каждой подинтегральной функции /6#0(Л) сопоставим соответ-
соответствующий лагранжиан L(x, x) и положим gf равным значению
интеграла
(87.1)
])L[x(и, v), xB+Xxv] dudv
на единичном квадрате плоскости (и, v). Конечно, интеграл
(87.1) можно записать в виде интеграла на торе от функции
}(х, ®к(х)) по соответствующей мере. Отсюда следует, что, пред-
представляя обобщенный поток g в виде смеси течений, нужно рас-
рассматривать только обычные параметрические кривые, удовлетво-
удовлетворяющие дифференциальному уравнениюdx/ds=Q},(x), где s—длина
дуги. Эти кривые являются образами линий y=^.u+const,
и, ввиду иррациональности числа К, ни одна из них не замкнута.
Таким образом, обобщенный поток g не является смесью замк-
замкнутых течений.
С другой стороны, можно убедиться, что g—замкнутый обоб-
обобщенный поток, т. е. dg = 0. Для этого воспользуемся периодич-
300 Приложение II. Структура обобщенных потоков
ностью функции х(и, v) и представим интеграл (87.1) в виде
дроби /v/v, где /v—соответствующий интеграл по параллело-
параллелограмму, ограниченному прямыми ы = 0, u—v-\-\, v=Ku, v = Ku-\-\.
Если лагранжиан L(x, х) соответствует точной подинтегральной
функции /, т. е. имеет вид
L{x, x) =
и если мы положим Ф(и, v) = y[x(u, v)], то получим, что
интеграл вдоль отрезка, параллельного прямой v — Ku, от подин-
подинтегральной функции из (87.1) равен разности значений функции Ф
в концах отрезка, которые конгруэнтны двум точкам единичного
квадрата. Следовательно, этот интеграл остается ограниченным
при больших v. Значит, для нашей точной подинтегральной
функции величина /v ограничена по v, и поэтому /v/v стремится
к нулю. Отсюда следует, что gf — О для точной подинтегральной
функции /, т. е. что dg = 0.
§ 88
Дополнительные сведения о мерах, смесях
и плотных потоках
Нам понадобится несколько общеизвестных фактов, в основе которых ле-
лежат понятия и рассуждения, восходящие к самым ранним работам создателей
современной теории меры и интегрирования. В частности, нам понадобится
некоторая разновидность аппроксимации риссовской меры. Мы начнем с одной
элементарной леммы, которая встречается в ранней работе У. Г. Юнга в не-
несколько более сильной формулировке. Согласно этой лемме, точки неравно-
неравномерной сходимости можно в некоторых случаях «наблюдать невооруженным
глазом», так как они являются точками разрыва предельной функции. Лемма
У. Г. Юнга была сформулирована для функций, определенных на отрезке, но
те же рассуждения можно применить и при доказательстве этой леммы для
функций, определенных на любом бикомпактном множестве.
(88.1) Лемма наблюдаемости 1}. Пусть fv, v=l, 2 —непрерывные не-
неотрицательные функции,определенные на Б...и-компактном множестве В, и пусть
*> В учебниках анализа ее обычно называют «теоремой Дини». — Прим.ред.
§ 88. Дополнительные сведения о мерах и смесях 301
ряд ^\fv(x) сходится в каждой точке х£В, а сумма этого ряда—непрерыв-
ряда—непрерывная функция. Тогда этот ряд -сходится равномерно в В.
Доказательство. Это всего лишь упражнение на применение теоремы
Бореля о конечном покрытии. По условию, функции гт (х), х£В, равные
соответствующим суммам для v > т, непрерывны. Пусть задано е > 0; опре-
определим для каждой точки х0 такое число т0, что г„о (х0) < е, и такую окрест-
окрестность Д, что в ней гто (х) < 2е для этого числа тл. Конечное число окрест-
окрестностей Д покрывает множество В; обозначим через М наибольшее из соответ-
соответствующих им чисел т0. Так как величина гт (х) убывает при возрастании т,
() 2 ^ М х. Сл
у 0 т () у р р ,
то гт (х) < 2е для всех т^= М и для всех х. Следовательно, ряд сходится
равномерно, что и требовалось доказать.
Теперь перейдем к понятию ограничения риссовской меры. Пусть В' —
замкнутое подмножество Б...и-компактного множества В, и пусть В" = В — В'
Далее, пусть ц — риссовская мера на В. Мы определим две риссовские меры
ц' и |л", которые назовем ограничениями меры ц соответственно на В' и В",
причем эти меры будут удовлетворять условию |л'+|л" = |л. Вместо интегралов
от непрерывной функции / на В относительно мер ji', ц" мы будем писать
\f(x)dit, \f(x)dii.
В' В"
Первый из этих интегралов мы определим сначала в случае, когда f(xK?0,
х£В'. В этом случае значение этого интеграла равно
inf \ ф (х)
» в
в
где нижняя грань берется в классе непрерывных неотрицательных функций
Ч (*)> х£В, совпадающих с функцией f (х) на подмножестве В'. В случае
произвольной непрерывной функции / на В мы полагаем
В'
где /, (x) = max (f(x), 0), f2 (x) = max ( — f(x), 0). Далее, второй из наших
интегралов определим равенством
В" В В'
Очевидно, что при этих определениях
J f(x)rfn=c$ f(x)dlx.
В' В'
Прежде чем доказывать соответствующее соотношение аддитивности, установим
следующую лемму:
(88.2) Лемма. Пусть f(x)SsO, x£B', и пусть /v (x), x£B, v = l, 2 —
монотонно убывающая последовательность непрерывных функций, совпадающих
с функцией f(x) для х£В', стремящаяся к нулю для каждой точки х£В".
Тогда
Доказательство. Пусть <p(*), х£В,—любая непрерывная функция,
которая совпадает с f(x) при х£В' и неотрицательна при х£В", и пусть
<PV(*)—большее из двух чисел <р(ж) и /v(jc) для каждой точки х£В. Тогда
302 Приложение II. Структура обобщенных потоков
последовательность функций q>v монотонно убывает, и ее пределом является
непрерывная функция ср. Так как функции tpv непрерывны, то можно приме-
применить лемму (88.1) к последовательности разностей (pv — <PV+|- Таким образом
мы найдем, что <pv равномерно сходятся к функции <р. Следовательно,
lim J /v (х) Aц < lim J <pv (х) ф = J ср (*) ф,
в в в
и, взяв нижнюю грань относительно ф, получим
. lim J £
в в-
Так как противоположное неравенство очевидно, то лемма доказана.
Из леммы (88.2) мы сразу получаем теорему аддитивности:
S ft м+/■ w} ф=j л w ф+j
В' В' В'
в случае, когда fu ^ — неотрицательные функции; значит, аналогичное равен-
равенство имеет место и для интегралов от любого конечного числа непрерывных"
неотрицательных функций. Затем можно распространить это равенство на слу-
случай конечного числа функций, каждая из которых непрерывна и имеет посто-
постоянный знак, перенося члены с отрицательным знаком в другую часть равенства.
Это дает нам сразу теорему аддитивности и в случае, когда flt f2—любые
непрерывные функции без всяких ограничений на их знаки. Тем самым мы
наконец доказали, что
J
В'
определяет риссовскую меру ц' на В. Если мы теперь положим ц" = (А—ц' и
заметим, что для неотрицательной непрерывной функции f интеграл
В"
неотрицателен, как и соответствующий интеграл на В', то получим, что ц"—
риссовская мера на В. Отсюда легко выводится, что
/МФ
\в-
Ф.
В'
где | f\B.—верхняя грань функции f (х) для х£В'. Действительно, если мы
добавим это число к f(x) или вычтем его из f (x), то получим функцию
постоянного знака. Аналогично можно вывести и соответствующее неравенство
с В" вместо В'.
(88.3) Лемма. Пусть В' пробегает расширяющуюся последовательность
замкнутых подмножеств из В, таких, что В—их объединение, и пусть, как
и раньше, В есть B...u-компакт, а ц—риссовская мера на В. Тогда
jj 1ф—«-О.
В-В'
Доказательство. Из приведенного выше определения видно, что
В-В' * В
§ 88. Дополнительные сведения о мерах и смесях 303
где верхняя грань берется в классе непрерывных функций 4> (*), х£В, таких,
что tjj(x) = O для х£В' и ф(х)<1 для х£В — В'. Обозначим через Bv по-
последовательность множеств В — В', а через \|)v -*г соответствующую последова-
последовательность функций ijj, выбранную так, что для заданного е > О
(88.4) J ф„ (х) ф
В
меньше соответствующей верхней грани на величину 2~ve. Обозначим через
Xv (x) значение Ц\(х) при v = l и меньшее из значений /v_, (дг), ifv (х) при
v > 1. Очевидно, что
J $5 S
Bv B Bv Bv
Далее, функции /v (x) образуют монотонно убывающую последовательность_
предел которой, очевидно, равен нулю, так как эти функции равны нулю вне
множеств Bv , а эти множества стягиваются к пустому множеству. Рассуждая
так же, как при доказательстве предыдущей леммы, и используя лемму (88.1),
мы получим, что выражение (88.4) стремится к нулю. Следовательно, величина
Ijm \
v в
v
1
не превосходит е и, значит, обращается в нуль, что и требовалось доказать.
Риссовская мера ц на В имеет носитель, содержащийся в замкнутом под-
подмножестве ВосВ, если \ f (x) d[i = 0 для каждой функции /£ёо (В), такой,
что / (х) равна нулю на всем Во. Отсюда следует, что если fJt /2 —непрерыв-
—непрерывные функции в В, удовлетворяющие на Во соотношению f1 (x) < /2 (х), то
J (х) d|x < ^ f2 (x) ф.
в в
В самом деле, можно считать, что ft =0 (этого всегда можно добиться вычита-
вычитанием). Тогда, положив / (д:) = тах {/2 (ж), 0} —ft (х), получим, что \ / (х) ф = 0,
т. е. что интеграл от f2 совпадает с интегралом от неотрицательной функции
maxjM*). 0}.
Заметим здесь, что ограничение ц' любой меры ц, заданной на В, на
замкнутое подмножество В' с В имеет носитель, содержащийся в В'. По ин-
индукции легко получить следующую лемму:
(88.5) Лемма локализации. Пусть В' —объединение конечного числа замк-
замкнутых подмножеств Ву Б...и-компактного множества В. Тогда ограничение за-
заданной на В риссовской меры на подмножество В' можно представить в виде
суммы риссовских мер u.v , имеющих носители в соответствующих подмножест-
подмножествах Bv .
До сих пор в этом параграфе мы рассматривали только интегралы
от скалярных функций. Теперь мы можем интегрировать по ограничению ц'
и любую вектор-функцию / (х), так что символы
f{x)dp
304 Приложение II. Структура обобщенных потоков
распространяются и на этот случай. Напомним, что мы рассматриваем непрерыв-
непрерывные вектор-функции. Здесь нам понадобится только тот случай, когда и мно-
множество В, и значения векторов / лежат в пространстве %\ (А) со штрих-
нормой. Мы будем пользоваться буквой Ъ вместо х для обозначения
элемента множества В и буквой g вместо f для обозначения вектора,
т. е. элемента пространства Ч&\ (А). Таким образом, теперь вектор-функция
будет обозначаться g (b), Ь£В. Однако в основном нас будут интересовать
смеси, в первую очередь случай тождественной функции g(b)ssb, или более
общий случай, когда g (b) отличается от тождественной только на евклидову
вектор-функцию. Далее, все рассматриваемые векторы будут лежать в мно-
множествах с ограниченной (обычной, т. е. без штриха) нормой, так что штрих-
топология будет снова эквивалентна слабой* топологии.
Кроме штрих-нормы, в наших рассуждениях будут играть роль величины
\В\> |dg|, и мы должны выяснить их взаимосвязь со слабой* топологией
и с понятием векторного интеграла.
(88.6) Лемма. В слабой* топологии пространства 4st(A) величины \g\,
| dg | полунепрерывны снизу. Кроме того, они выпуклы и однородны.
Доказательство. Нуждается в доказательстве только первое утвержде--
ние. Сначала рассмотрим величину \g\. В положительном конусе она совпа-
совпадает с g-1 и непрерывна; однако во всем пространстве if J (А) она лишь полу-
полунепрерывна снизу и не будет, вообще говоря, непрерывной. Предположим,
4TOg—слабый* предел для gv . Для заданного е > 0 выберем элемент /б^М)
удовлетворяющий условиям |/0|<1> l£l<g/o + e- Тогда
limgv/0<lim inf|gv|,
V V
откуда |g|<lim inf |gv |. Это доказывает, что |g| полунепрерывна снизу.
Теперь займемся величиной | dg |. Выберем элемент gv так, чтобы Он
удовлетворял условиям
Тогда можно выделить такую подпоследовательность индексов V, вдоль кото-
которой, во-первых, нижний предел величины | dgv | превращается в предел, а,
во-вторых, gv имеет слабый* предел g. Для любой точной подинтеграль-
ной функции / в этой подпоследовательности имеем
так что dg=dg. Кроме того, для этой подпоследовательности справедливы
неравенства
так что |dg |<lim inf |dgv|, т. е. величина \dg\ полунепрерывна снизу.
Таким образом, лемма полностью доказана.
Нам понадобятся также некоторые стандартные неравенства. Их вы-
вывод не совсем тривиален, поскольку при определении векторного интеграла мы
пользовались штрих-нормой. Обозначим через g(fc), Ъ£В, слабо* непрерывную
функцию на слабо* бикомпактном множестве В С i?o (А), значения которой
лежат в if о (Л), а через ц — риссовскую меру на В. Обозначим через М и М
верхние грани соответственно величин \g(b) | и | dg(fc) | при условии, что Ь£В
§ 88. Дополнительные сведения о мерах и смесях 305
и положим
(88.7) Лемма. При введенных выше условиях и обозначениях (i) | g | < Мс и
(И) \dg]<Mc.
Доказательство. Интеграл, выражающий g, является слабым * пределом
конечной суммы gv вида Vc,-gF/), где с/—интеграл от локализующей функ-
функции h; F);5s 0 и ]£] й,-(&) = 1. Поэтому 2с/=с и с,-5^0. Ввиду выпуклости
и однородности соответствующие неравенства справедливы для gv, а следова-
следовательно, ввиду полунепрерывности — и для g.
Из предыдущего доказательства видно, сколь важное значение имеет
лемма о полунепрерывности (88.6). Другим следствием этой леммы является
полунепрерывность снизу в слабой * топологии плотной нормы \\ g \\.
Из этого последнего утверждения получаем важное следствие: если Е —
конечное множество обобщенных потоков и е—любое положительное число,
то множество ЕЕ обобщенных потоков, находящихся от Е на плотном рас-
расстоянии <е, слабо* замкнуто.
Итак, если Е — конечное множество полигональных потоков, то для лю-
любого е' > 0 множество ЕЕ. обобщенных потоков, находящихся от Е на плот-
плотном расстоянии <е', слабо* замкнуто. Если зафиксировать е', то можно
иайти такую расширяющуюся последовательность конечных множеств Е по-
полигональных потоков, что каждый плотный поток принадлежит объединению
соответствующих Ее'. Пусть Q^—класс полигональных потоков q = ^jsas,
представляющих собой смесь не более чем N отрезков s суммарной длины
2lsl<N. и пусть Oj^O—коэффициенты, сумма которых не больше N.
Далее, пусть Р^— подкласс из Qjv, полученный при условии, что коэффи-
коэффициенты as принадлежат достаточно густому конечному подмножеству интер-
интервала [О, N] действительной оси и, кроме того, концы отрезков s лежат
в достаточно густом конечном подмножестве основного куба ж-пространства.
В качестве v-ro множества из наших множеств Е можно взять объединение
первых v множеств Ядг, N=\, 2, ..., v.
Согласно выбору Яде, каждый полигональный поток q^Qt/ находится
\\\\ '/2 ( й )
ру д q^t
на расстоянии \\р—q\\ < e'/2 (в смысле плотной нормы) от некоторого эле-
эле£Р- По (861) й й
р \\рq\\ ( р) р
мента р£Рм- По теореме (86.1), каждый плотный поток g удовлетворяет
соотношению \\g—q\]<e'/2 для некоторого полигонального потока q. Так
как q£Qw при некотором N, то легко видеть, что ||g—p]\ < е' для некото-
некоторого р^Ядг. значит, g лежит в соответствующем множестве Ее,.
Используя это замечание, мы покажем, что класс плотных потоков
замкнут относительно операции образования смеси. Это свойство можно
сформулировать следующим образом:
(88.8) Теорема. Пусть g—смесь плотных потоков. Тогда g является плот-
плотным потоком.
Именно для доказательства этой теоремы нам и понадобились приведен-
приведенные выше сведения из теории меры. Они позволят нам избавиться от не-
неприятной проверки свойства измеримости.
Доказательство. Если смесь состоит из конечной суммы
306 Приложение //. Структура обобщенных потоков
то легко видеть, что для заданного е > 0 существует полигональный по-
поток р, такой, что || g—p\\ < е; достаточно взять вместо р соответствующую
смесь с теми же коэффициентами cv полигональных потоков pv, таких, что
нормы || gv— pv || достаточно малы. Если же смесь состоит из бесконечной
суммы того же вида, то норма суммы от N до оо равна сумме членов cvgv ■ 1
для этих v и потому меньше е/2 для больших N. Так как плотная норма
не больше этой нормы, то, используя (с е/2 вместо е) результат, доказанный
в случае конечной суммы, легко видеть, что снова существует полигональный
поток р, такой, что ||g—p \\ < е.
Если же смесь задана в виде интеграла
gbdy,
где £(,— тождественная функция в В, т.е. gb=b для Ь£В, В— бикомпакт-
бикомпактное (в слабой* или штрих-топологии) множество плотных потоков, а ц —
нормированная риссовская мера на В, то этот интеграл можно разложить
в сумму
В' В"
где В" —В —В' и В' — пересечение множества В с множеством вида Е£. для е' =
=е/3. Здесь множество ЕЕ> построено так же, как в замечании перед теоре-
теоремой (88.8).
Так как В ограничено по норме, то существует такая постоянная М,
что | g(, | < М и потому
ldfi
В" / В"
для каждого элемента /ёёо(^). такого, что |/|<1. Согласно лемме (88.3),
норму интеграла
В"
можно сделать сколь угодно малой, н a fortiori можно добиться, чтобы его
плотная норма была меньше е'.
В множестве В' каждый элемент находится на расстоянии <е' (относи-
(относительно плотной метрики) от конечного множества Е. Значит, В' — объединение
конечного числа множеств flv, которые представляют собой пересечения мно-
множества В' с замкнутыми шарами радиусов е' (также в смысле плотной мет-
метрики). Согласно (88.6), эти шары слабо * замкнуты, а их центрами являются
полигональные потоки pv £ Е. Согласно (88.5), существуют соответствующие
риссовские меры |iv с носителями в Bv, такие, что их сумма равна ограни-
ограничению ji' меры (г на В'. Обозначим \ 1фу через cv. Очевидно, что
Используя лемму (88.7) для величины \dg\ и соответствующее тривиальное
неравенство для штрих-нормы, получим, что плотная норма записанной выше
§ 89. Лагранжево представление плотного потока 307
разности не превосходит 2cve'. Следовательно, складывая, получим
и наконец
11
Последнее неравенство означает, что наша смесь находится (в плотной метрике)
на сколь угодно малом расстоянии от полигонального потока и, следовательно,
сама является плотным потоком, что и требовалось доказать.
§ 89
Лагранжево представление плотного потока
Мы уже объяснили, что для выявления аналогии с движением
жидкости мы будем называть обобщенные кривые течениями.
В частности, обобщенную кривую единичной длины будем назы-
называть единичным течением. Кроме того, нам понадобится понятие
прерывистого течения, или струи. Под струей мы подразумеваем
обобщенный поток, полученный из обобщенной кривой выбрасы-
выбрасыванием счетного множества ее дуг.
Не менее важна аналогия между плотными потоками и геодезическими пото-
потоками, рассмотренными в гл. I, которые тоже напоминают потоки жидкости. Если
наш плотный поток является достаточно гладкой (в некотором смысле) смесью
кривых, то последняя соответствует потоку кривых геодезического покрытия.
Это соответствие имеет место и в более общих ситуациях, когда обобщается
понятие геодезического покрытия, как это будет сделано нами в теории опти-
оптимального управления.
Здесь мы докажем следующий основной результат:
(89.1) Теорема, (i) Каждый замкнутый обобщенный поток
является смесью единичных течений, (и) Каждый обобщенный
поток с симплициальной границей является смесью ограниченных
течений. (Hi) Каждый обобщенный поток с плотной границей
является смесью ограниченных прерывистых течений.
Учитывая предыдущие результаты, получаем, что утвержде-
утверждение (Hi) равносильно совпадению следующих трех классов обоб-
обобщенных потоков:
a) класса плотных потоков,
b) класса потоков с плотной границей,
c) класса смесей ограниченных струй.
Доказательство утверждения (89.1)(i). Можно ограничиться
рассмотрением единичного потока g, прибегнув во всех осталь-
остальных случаях к умножению на подходящую константу. Согласно
308 Приложение II. Структура обобщенных потоков
теоремам (85.1) и (81.1), такой поток является тонким пределом
замкнутых полигональных потоков вида
N
<? = 2 см,
где р,:—замкнутые полигоны, а коэффициенты с,-—положитель-
с,-—положительные действительные числа. Можно считать, что с,-—рациональные
числа, которые выражаются дробями с большим общим знамена-
знаменателем v, зависящим от q. Число v выберем достаточно большим
по сравнению с N, так чтобы N/v—»0, когда q—*g.
Числители чисел с,- теперь можно включить в р(, заменив каж-
каждый замкнутый полигон р, его целочисленным кратным, поскольку
это кратное само будет замкнутым полигоном. Далее, к каждому
полигону pt присоединим дигон, соединяющий его со следующим
полигоном. Общая длина присоединенных дигонов. не больше,
чем произведение числа N/v на константу, так что после этих
модификаций g останется тонким пределом для q. Теперь сум-
сумма 2 Pi превратилась в один замкнутый полигон р. Присоединяя
один или большее число дополнительных дигонов (так, чтобы это
не повлияло на предел), можно добиться того, чтобы длина \р\
равнялась целому числу X.
Таким образом, g является пределом потоков p/v, т. е. gf=
= limp//v для каждого элемента /6#0(Л). Взяв /=1 и вспом-
вспомнив, что g-\= \g\ = \, получим, что k,'v—>-l. Следовательно,
g=lim pA, так что теперь можно отождествить X с v, т. е. пред-
предположить, что |p| = v. Это означает, что g есть тонкий предел
полигонального потока q вида p/v, где |p| = v—целое число.
Разобьем замкнутый полигон р на v дуг yk, где |т*1= '• Тогда q
будет выпуклой комбинацией дуг yk единичной длины.
Обозначим теперь через В множество обобщенных кривых
единичной длины. Это множество слабо* замкнуто и содержит
дуги yk. Значит, q лежит в выпуклой оболочке множества В.
Следовательно, g лежит в слабом* замыкании или в тонком
замыкании множества В. Но слабые* пределы эквивалентны пре-
пределам по штрих-метрике в пространстве #£ (А), и поэтому В,
будучи замкнутым подмножеством единичного шара, является
Б...и-компактом в этой метрике. По теореме G9.1) из приложения I
получаем, что g—центр некоторой меры на В, т. е. g есть нор-
нормированная риссовская смесь из множества В. Таким образом,
утверждение (i) доказано.
Заметим, что множество В, фигурирующее в только что за-
законченном доказательстве, содержит обобщенные кривые, вырож-
вырождающиеся в обобщенные линейные элементы, т. е. такие, что
каждая из них сосредоточена в одной точке. Легко видеть, что
в этом случае результант обобщениого линейного элемента равен
нулю.
§ 89. Лагранжево представление плотного потока 309
Прежде чем перейти к доказательству остальных утвержде-
утверждений теоремы (89.1), мы разработаем аппарат, который позволит
вывести их из утверждения (i). Назовем" а-полигональным пото-
потоком обобщенный поток, который можно представить в виде счет-
счетной смеси отрезков.
(89.2) Лемма. Пусть P6Q. Тогда существует о-полигональ-
ный поток р, такой, что fi = dp.
Доказательство. Согласно предположению, Р = д£для некото-
некоторого g, являющегося плотным пределом полигональных пото-
потоков. Следовательно, если задан сходящийся ряд 28v с поло-
положительными членами, то существует полигональный поток qv,
такой, что \\g—qv\\ < ev. Положим pl = q1 и для v> 1 опреде-
определим полигональный поток pv так, чтобы
dpv=dqv—dqv^1, \pv\ <2||<7V —<7v-i||-
Очевидно, что | pv I < 4ev, поэтому ряд ^pv =p сходится (по всем
нормам) и дает искомый а-полигональный поток с границей fi = dp.
Нам понадобится также лемма о смесях ограничений мер. Фак-
Фактически она представляет собой некоторую разновидность тео-
теоремы Фубини.
(89.3) Лемма локализации для смесей. Пусть у—нормирован-
у—нормированная риссовская смесь
составленная из риссовских мер уа на Б.. м-компактном множестве
В, и пусть у', у'а—ограничения мер у, уа на замкнутое подмноже-
подмножество В'с:В. Тогда у' — нормированная риссовская смесь ограни-
ограничений у'а.
Если считать, что fi—это мера на множестве индексов се, а
не на множестве мер уа, то ясно, что речь идет о справедливости
формулы
(89.4) y'
К сожалению, даже в хороших учебниках по анализу фор-
формулировка теоремы Фубини оказывается не настолько общей,
чтобы включить этот простой результат.
Доказательство леммы (89.3). Согласно лемме (88.2), рассмат-
рассматриваемые ограничения мер можно определить при помощи моно-
монотонно убывающей последовательности непрерывных функций /v,
соответствующих любой неотрицательной функции /£#0(Б), сле-
следующим образом:
310 Приложение II. Структура обобщенных потоков
Однако ясно, что
и тогда, поскольку последовагельность монотонно убывает, полу-
получаем
lim y/v=
и, значит, y'f = \yifdii. Если мы представим произвольную функ-
функцию /6#0(В) в виде разности двух неотрицательных функций,
то найдем, что последняя формула справедлива для любой функ-
функции /6#0(В), т. е. получим формулу (89.4). Тем самым лемма
доказана.
Теперь мы можем закончить доказательство основной теоремы
этого параграфа.
Доказательство утверждений (89.1) (ii) и (iii). Эти утвержде-
утверждения доказываются аналогично; мы начнем с (iii). Погрузим наше
х-пространство в евклидово х-пространство на единицу большей
размерности, а множество А—в соответствующее множество А,
размерность которого больше на 2. Будем считать, что старые
пространство и множество являются сужениями новых, т. е. по-
получаются при обращении в нуль дополнительных координат.
Отрезок в пространстве .v, который содержит не более одной
точки х-пространства, будем называть внешним; аналогично, будем
называть внешними полигон, полигональный поток или а-поли-
гональный поток, которые можно представить в виде смесей внеш-
внешних отрезков. Ясно, что, заменяя отрезок в jc-иространстве лома-
ломаной линией, можно любой a-полигональный поток заменить
внешним a-полигональным потоком с той же границей. Анало-
Аналогичная замена возможна для полигона и полигонального потока.
Пусть теперь g—любой обобщенный поток с границей dg£il.
Любой такой обобщенный поток является риссовой мерой на А,
и его можно рассматривать как риссову меру на Л с носителем
в А. Далее, согласно лемме (89.2) и замечанию, сделанному выше,
существует такой внешний a-полигональный поток р, что др =
= —dg. Таким образом, g^-ресть замкнутый обобщенный поток
в х-пространстве, а g—его ограничение на множество А. Ввиду
утверждения (i) и леммы (89.3), g-\-p является смесью единич-
единичных течений, а g—смесью их ограничений на А.
Каждое из этих единичных течений обладает представлением
вида F7.1), а его ограничение на А можно получить, считая,
что параметр t принимает значения из замкнутого множества,
для которого соответствующая точка x(t) попадает в х-прост-
ранство. Значит, это ограничение является прерывистым течением,
т. е. утверждение (iii) доказано.
§ 89. Лагранжево представление плотного потока 311
Для доказательства утверждения (и) мы используем анало-
аналогичные рассуждения в сочетании с методом математической индук-
индукции. Допустим, что обобщенный поток g, граница которого сов-
совпадает с границей смеси, составленной не более чем из N—1
отрезков, мы можем представить в виде смеси течений, длина
которых не превышает 1. Согласно (i), это допущение справед-
справедливо при N—1. Считая его верным для N—1, выведем соответ-
соответствующее утверждение для N. Для этого присоединим Kg поли-
полигональный поток р, являющийся произведением внешней ломаной L
на положительное действительное число. Обозначим через/.под-
через/.подмножество из Л, состоящее из пар, для которых х принадле-
принадлежит L и направление совпадает с направлением вдоль L в точке .v.
Выберем р так, чтобы граница обобщенного потока g+p совпа-
совпадала с границей смеси, составленной не более чем из N — 1 отрез-
отрезков. Тогда
где каждое ga—течение, длина которого не превышает 1. Далее,
так как g + p имеет носитель в множестве А и L, то, ввиду леммы
(89.3), можно добиться, чтобы и каждое течение ga имело носи-
носитель в этом множестве. Кроме того, так как g—ограничение
обобщенного потока g-\-p на А, то g представляет собой смесь
ограничений течений ga на А. Еще раз используя представление
нашего течения ga, доставляемое теоремой F7.1), заключаем, что
это ограничение можно получить, удалив не более чем две дуги
ломаной L. Тем самым утверждение (ii) доказано.
Том II
Теория
оптимального
управления
Вступление
Что такое задачи оптимального управления
Введение
Теперь мы начнем все заново. Лучше всего пока забыть о су-
существовании тома I и просто оглядеться вокруг. Взявшись за
изучение нового предмета, не следует поначалу гнушаться самых
примитивных средств. Точно так же, отправляясь в какую-либо
страну впервые, не следует брать с собой бульдозеры. Аспирант,
приступающий к работе над диссертацией, тоже должен сначала
выработать какие-то рабочие гипотезы и проверить их на простых
примерах путем самых элементарных вычислений. Пока еще не
настало время искать возможности для применения теоремы Хана —
Банаха, и мы должны быть готовы к некоторым неудобствам.
Ведь инженеры, да и не только инженеры, занимаясь зада-
задачами оптимального управления, далеко не сразу осознали, что
это задачи вариационного исчисления. Однако, и это очень важно,
не будучи скованными традицией, они по-новому подошли к этим
задачам, сняв искусственные предположения о гладкости.
На самом деле задачи оптимального управления являются
задачами более общего вида, чем изученные в томе I. Безусловно,
методы, изложенные в последних главах и приложениях тома I,
применимы к более общим задачам, чем те, которые были там
рассмотрены. Например, теоремы существования, основанные на
использовании обобщенных кривых, были доказаны автором этой
книги для задач вида
, k)dt)=m\n.
где /—функция, принимающая значения в некотором банаховом
пространстве, Ф—действительная функция, определенная в этом
пространстве, а переменные х, х такие же, как в задачах тома I.
В литературе можно также найти задачи, в которых требуется
минимизировать интегралы следующих видов:
$$/(/, и, x(t), хA), х(и), x(u))dtdu,
J f{t, x(t), x(t), x*(t))dt.
Соответствующие задачи называют задачей Фубини—Тонелли
и задачей Чезари—Санчеса.
316 Вступление. Что такое задачи оптимального управления
Задачи оптимального управления возникают из других сообра-
соображений, и для их изучения потребуются более существенные изме-
изменения методов тома I. Это задачи с дополнительными ограни-
ограничениями. Они столь же древни, как и само вариационное исчис-
исчисление. Впервые такая задача встречается в легенде об основании
Карфагена.
Все мы знаем рассказ о том, как Дидона выторговала клочок
земли, который она сможет ограничить воловьей шкурой. Никогда
не следует недооценивать способности женщины! Аккуратно раз-
разрезав шкуру и получив очень длинный и тонкий ремешок, она
определила наибольший участок земли, который им можно было
ограничить. При этом она решила так называемую изоперимет-
рическую задачу; конечно, ее решением оказался круг1*. Так что
покончим с мифом о неспособности женщин заниматься матема-
математикой!
Изопериметрическая задача состоит в нахождении минимума
(в задаче Дидоны максимума) одного вариационного интеграла
в классе кривых, для которых другой такой интеграл (в ее задаче
длина) принимает заданное значение, или, иначе, значение вто-
второго интеграла не превосходит некоторой заданной величины;
именно в этой последней форме такая задача (так же как задача
Дидоны) возникает на практике.
Изопериметрические задачи подробно рассматриваются в книге
Тонелли Fondamenti. Эти задачи были тщательно изучены Эйле-
Эйлером, который сформулировал то, что теперь называют изопери-
метрическим правилом Эйлера.
К классу задач о нахождении минимума при дополнительных
условиях, или ограничениях, принадлежит также и классическая
задача Лагранжа. В этой задаче нужно найти минимум интеграла
х, x)dt
в классе допустимых кривых x(t), удовлетворяющих дифферен-
дифференциальному уравнению
A.1) ФA, х, х) = 0.
В более общем случае ограничения могут быть выражены
несколькими дифференциальными уравнениями или, что то же са-
самое, функция Ф может быть векторной. Можно также добавить
1} Согласно «Энеиде», тирнйцы, предводительствуемые Дидоной, «столько
купили земли, . .. сколько воловьей шкурой могли окружить на прибрежьи»
(перевод Н. Квашнина-Самарина).
Можно думать, что концы ремешка не совпадали друг с другом, а должны
были примыкать к линии побережья, и, таким образом, Дидоне пришлось ре-
решать ие просто изопериметрическую задачу, но еще и задачу со свободными
концами.—Прим. ред.
§ 2. Правило множителей 317
«изопериметрическое» ограничение, состоящее в том, чтоинтеграл
A.2) $¥(*,*,*) Л
должен принимать заданное значение. Задача такого общего
вида также была рассмотрена Лагранжем. В практических прило-
приложениях, как и в случае изопериметрической задачи, иногда огра-
ограничения-равенства заменяются неравенствами.
§2
Правило множителей -
Для решения своей задачи Лагранж ввел метод множителей,
который, как он думал, позволит свести ее к задаче без огра-
ограничений. Множители Лагранжа в этой ситуации аналогичны
множителям, которые он использовал для решения задачи об
условном экстремуме в дифференциальном исчислении.
Сначала Лагранж просто заметил, что для кривых, удовлет-
удовлетворяющих ограничениям, задача минимизации с лагранжианом L
эквивалентна задаче минимизации с любым лагранжианом
B.1)
где к —постоянная, а X, у—функции от t, причем \|) имеет за-
заданное конечное значение и равное нулю начальное значение.
Если Ф, *¥—вектор-функции, то х, Я, и яр—векторы из соответ-
соответствующих пространств, и в этом случае произведения в B.1) —
это скалярные произведения векторов. Новый лагранжиан B.1)
можно рассматривать как функцию
B.2) 1A, х,к;н, К г>)
и изучать более общую задачу минимизации для вариационного
интеграла от L в пространстве, расширенном посредством добав-
добавления новых переменных, с дополнительным ограничением
B.3) х = 0.
Однако, как заметил Лагранж, если в этой новой задаче и
не принимать во внимание ограничений, то уравнения Эйлера
будут иметь вид
B.4)
"Я
318 Вступление. Что такое задачи оптимального управления
причем последние три уравнения приводятся к уравнению
и к уравнениям A.1) и B.3). Таким образом, согласно Лагранжу,
вся задача с первоначально заданными ограничениями сводится
к задаче минимизации для соответствующих граничных значений
функции ip нового вариационного интеграла уже без ограничений,
ибо сами уравнения Эйлера для этой задачи содержат уравнения-
ограничения.
Крайне неприятно придираться к таким простым и красивым
рассуждениям. Однако этими достоинствами никак нельзя оправ-
оправдать столь частое появление подобных рассуждений в так назы-
называемых «обзорах» в справочниках, предназначенных для того,
чтобы познакомить с вариационным исчислением инженеров и
других лиц, которые предполагаются не способными к критике.
В действительности в сформулированном выше виде утверждение
Лагранжа неверно, и даже весьма простодушные его современ-
современники имели сомнения по этому поводу. Тем не менее дело можно
поправить, внеся довольно незначительные изменения, на которые
сам Лагранж, возможно, не обратил бы внимания.
Даже поверхностный анализ показывает, что рассуждения
Лагранжа содержат несколько заблуждений и несуразностей.
Во-первых, они подвержены парадоксу Перрона, и в них не про-
проведено должное различие между необходимостью и достаточностью.
Во-вторых, при этих рассуждениях делается основное и ничем
не обоснованное допущение, что либо введенные новые величины
гладкие, либо их гладкость несущественна.
Если мы перейдем к сколько-нибудь подробному анализу, то
эти рассуждения будут выглядеть еще хуже. Так, если исходить
из того, что на кривой x(t) достигается минимум при наличии
ограничений, то рассуждения не гарантируют, что эта кривая
является проекцией в пространство (t, х) кривой из расширенного
пространства (t, х, к, X, ty), на которой достигается минимум в
новой задаче. Утверждается только обратное: если новый мини-
минимум достигается на кривой в расширенном пространстве, то на
проекции этой кривой достигается минимум в первоначальной
задаче с ограничениями и эта кривая удовлетворяет некоторым
уравнениям. Однако эта проекция может не совпадать с кривой
x(t), а ее существование опирается на дополнительное предпо-
предположение, что новая задача без ограничений имеет решение. Спра-
Справедливость этого последнего предположения не следует ни из
какой известной теоремы; в самом деле, поскольку начальное и
конечное значения вектора X не заданы, мы здесь опять сталки-
сталкиваемся с явлением, на которое уже указывал» во вступлении
к тому I, когда кривая исходит из линии, а не из определенной
§ 3. Оптимальное управление и задача Лагранжа 319
точки этой линии п, следовательно, может бесконечное число раз
колебаться вблизи этой линии, но не иметь начальной точки.
Это означает, что любая теорема существования для новой задачи
без ограничений должна учитывать возмож-
возможность появления обобщенных решений, вы-
вытягивающихся в бесконечность, подобно
тому как это было в §55 (d) гл. V в томе
I. Однако такая автоматическая теорема
существования нигде не доказана.
В наше время математики тоже иногда
выступают с простыми и красивыми теоре-
теоремами. Однако многие из этих теорем оста-
остаются неопубликованными.
§ 3
Оптимальное управление и задача Лагранжа
Если исключить изопериметрические ограничения, то задача
Лагранжа превратится в задачу нахождения минимума в классе
кривых, удовлетворяющих дифференциальному уравнению
C.1) Ф(г, х, ~х) = 0.
Здесь Ф есть /л-мерный вектор; в частности, если /п = 1, то Ф —
скаляр. Таким образом, уравнение C.1) задает некоторое мно-
множество, или многообразие, в пространстве (t, x, к). Мы будем
рассматривать это множество при постоянных (I, х) как много-
многообразие по х и обозначим последнее через с£.
В наше время никто уже не определяет многообразие <Л по-
посредством уравнений вида C.1). Один из недостатков такого оп-
определения состоит в том, что не существует простого способа
узнать структуру и размерность многообразия <Ж по виду функ-
функции Ф. Так, например, хотелось бы иметь возможность сказать,
что размерность многообразия <Ж равна п—т. Но уравнение C.1)
эквивалентно уравнению |Ф| = 0, а для последнего /п=1. Было
бы разумно определить аМ, по крайней мере локально, разрешив
уравнение C.1) относительно некоторых компонент вектора к.
Однако можно предложить более симметричную-и во всяком
случае столь же (если не более) удовлетворительную процедуру,
которая теперь общепринята. Она состоит в параметрическом
описании многообразия <Ж при помощи параметра и. В общем
случае предполагается, что и — вектор, который изменяется в не-
некотором множестве U. Тогда многообразие <Ж задается уравнением
C.2) x = <p(t, х, и).
Таким образом, в современной формулировке задача Лагранжа
состоит в нахождении минимума вариационного интеграла для
320 Вступление. Что такое задачи оптимального управления
кривых x(t) и параметров u(t), удовлетворяющих уравнениям
C.2). Кроме того, удобно подставить в лагранжиан L(t, x, х)
вместо х функцию <p(/,,v, и). Мы позволим себе обозначить ре-
результат этой процедуры просто L(t, x, и), забыв о первоначаль-
первоначальном значении этого символа.
Итак, в новой формулировке задача Лагранжа состоит в на-
нахождении минимума интеграла
(t, х, u)dt
для кривых x(t) и параметров u(t), удовлетворяющих уравне-
уравнению C.2). Это и есть основная задача оптимального управления.
Параметр и или его компоненты, рассматриваемые как ска-
скалярные параметры, называют управляющими параметрами, или
просто управлениями. Инженеры представляют их себе как по-
положения рычагов управления, регистрируемые показаниями Стре-
Стрелок на соответствующих шкалах, а математики принимают их
за параметры. Конечно, многообразие с/И можно задать при по-
помощи другого параметра v, положив u = u(v), где и (у)—взаимно
однозначное отображение. Эта замена параметра соответствует
снабжению объекта новым управляющим устройством v, которое
позволяет управлять первоначальными регуляторами и, подобно
тому, как дистанционный пульт управления телевизором позво-
позволяет настраивать его, не вставая с кресла.
Теперь видно, что задача Лагранжа по существу не отличается
от задачи оптимального управления; просто последняя представ-
представляет собой более современную формулировку первой. Иногда
указывают на небольшие видимые различия, но на самом деле
они совсем несущественны. Например, как было отмечено, управ-
управление и принимает значения из множества t/ и это множество
обычно задается не уравнениями, а неравенствами; но ведь нули
функции Ф тоже могут заполнять целые области. Кроме того,
может показаться, что лагранжиан L(t, x, и) является более об-
общим, чем тот, который получится после подстановки выражения
для х в соответствующий лагранжиан от (t, x, х), но ведь,
с другой стороны, лагранжиан L(t, x, и) является частным слу-
случаем обычного'лагранжиана, только вариационная задача рас-
рассматривается в пространстве (t, x, и), а не {t, x). Наконец, воз-
возможны различия в требованиях гладкости, которым должны
удовлетворять рассматриваемые функции в этих двух задачах;
но эти различия носят временный характер, так как мы уже
знаем, что первоначальную постановку вариационных задач сле-
следует менять в соответствии с нуждами теорем существования.
Во всяком случае ясно, что при изучении задач оптимального
управления нам пригодится опыт тех, кому досталась нелегкая
доля иметь дело с задачей Лагранжа.
§ 4. Печальные факты жизни 321
§4
Печальные факты жизни
Мы уже получили представление о грозящей нам опасности
увязнуть в трясине «правдоподобных» выводов. Поэтому лучше
сначала разобраться в тех трудностях, с которыми следует счи-
считаться, а уж потом пытаться их одолеть. Рассмотрим примеры,
иллюстрирующие эти трудности.
а. Жесткость. Пусть в трехмерном пространстве (t, xlt x2) ось хй
вертикальна, a t, хх горизонтальны. Рассмотрим кривую, про-
проходящую через точку Р и определяемую функциями x^t), x^{t),
имеющими кусочно-непрерывные производные, удовлетворяющие
условию
Для фиксированной точки Р любую такую кривую можно опре-
определить, если известна ее проекция на плоскость (t, jq). При этом
разность координат х2 в концах этой кривой совпадает с длиной
ее проекции. Значит, если мы предположим, что проекция яв-
является отрезком, то получим кривую, удовлетворяющую условию
D.1) и такую, что второй ее конец Q нельзя соединить с точкой
Р никакой другой кривой, удовлетворяющей этому условию.
Этот пример, взятый из книги Каратеодори, иллюстрирует
очень неприятное свойство, которое мы называем жесткостью.
Классический алгоритм Эйлера—Лагранжа, который мы рассма-
рассматривали во вступлении и в других разделах тома I, и даже само
название нашего предмета «вариационное исчисление» предпола-
предполагает возможность «варьировать» кривые, а в рассмотренном при-
примере это невозможно, если точки Р и Q фиксированы.
Ь. Аномалия. Пусть кривая х (I), t1^.t^. t2, удовлетворяет
уравнению C.1). Обозначим через Р, Q концы (tlt x{tt)), (t2, x(t2))
этой кривой. Пару векторов ЬР, 6Q назовем допустимой вариа-
вариацией концов Р, Q, если она состоит из производных при а = 0
пары точек Р (a), Q (а), являющихся концами кривых x(t, a),
t1(a)^.t^.ti(a). При этом предполагается, что а—действитель-
а—действительный параметр, для области определения которого а = 0 является
внутренней точкой, а кривые x(t, а), во-первых, являются ре-
решениями уравнения C.1) и, во-вторых, гладко сводятся к кри-
кривой x(t), /1^/<^2, приа = 0. Решение x(t), (г^.1^.12, назы-
называют анормальным (или аномальным), если не существует 2п
линейно независимых допустимых вариаций ЬР, 6Q его концов.
Исторически возможность такой аномалии оказалась очень до-
досадной помехой при попытках обосновать правило множителей.
Легко видеть, что пример, рассмотренный в пункте (а), обладает
этой неприятной особенностью.
11 № 1274
322 Вступление. Что такое задачи оптимального управления
С. Отсутствие желательных свойств замкнутости. Превратим те-
теперь тот же самый пример в задачу управления. Рассмотрим
дифференциальные уравнения
D-2) il = Ut *, = /
где — l^u^l. В плоскости (xlt хг) эти уравнения определяют
дугу гиперболы Ж- Траекторией назовем теперь непараметри-
непараметрическую кривую x(t) в пространстве (t, x) = (t, xlt хг), которая
(скажем) непрерывна и кусочно-непрерывно дифференцируема и
у которой производная x = (xlt ,v2) принадлежит 5^ для каждого
рассматриваемого значения /.
X"
Дуга гиперболы Ж и ее выпуклая оболочка.
Задача оптимального управления для таких траекторий со-
состоит в нахождении минимума некоторого интеграла при неко-
некоторых начальном и конечном условиях на x(t). Однако мы уви-
увидим, что множество кривых, в котором ищется минимум, не
замкнуто, а согласно рассуждениям из § 55(а) гл. V тома I, эта
задача вообще не имеет смысла. Рассмотрим в пространстве (/, х)
кривую xo(t), которая является отрезком и задана линейной
функцией, такой, что производная ,v0 не лежит в Ж, а является
некоторой точкой X выпуклой оболочки множества Ж. Таким
образом, х0 имеет вид аХ' + (\—а)Х", где 0<а< 1 и где X',
X" лежат на Ж. Такая кривая х0 (t) является пределом равно-
равномерно сходящейся последовательности кусочно-линейных функ-
функций, изображенных на рисунке (стр. 323) в виде зигзага, имеющего
попеременно наклоны X' и X" на интервалах оси t, причем от-
отношение длины интервала с наклоном X' к длине интервала
с наклоном X" равно а:A—а).
§5
Первая поправка к уравнению Эйлера и правилу множителей
Более ста лет усилия математиков были направлены на спа-
спасение ошибочных рассуждений Лагранжа. В основном они ста-
старались доказать, что минимизирующая кривая удовлетворяет
уравнениям B.4). Второе из этих уравнений просто фиксирует ф,
а последние два сводятся к A.1) и B.3), поэтому мы можем не
рассматривать их, если будем предполагать, что и—постоянная
и что заданная кривая удовлетв ряет уравнению A.1). В этом
§ 5. Первая поправка к уравнению Эйлера 323
случае можно отбросить член, содержащий ф, и ввести обозна-
обозначение
E-1) L(t, х, х, к, Я) = 1 + ХФ + к'Р;
тогда основное утверждение состоит в следующем: для некоторого
постоянного вектора и и некоторой вектор-функции X (t) кривая х (t)
удовлетворяет уравнению Эйлера
E.2) £A;)-1. = 0.
К сожалению, это утверждение не-
неверно.
В этом легко убедиться, рассмот-
рассмотрев пример (а) предыдущего парагра-
параграфа. В этом примере существует
только одна кривая, удовлетворяю-
удовлетворяющая уравнению A.1) и соединяющая
две заданные точки; конечно, на ней
и достигается минимум, так как это
единственная кривая в рассматривае-
рассматриваемом классе. Поэтому утверждать, что
она должна для произвольной функ-
функции L удовлетворять уравнению вида
E.2), было бы абсурдом.
Тот факт, что в множестве, состоящем
только из одного элемента, минимум автома-
автоматически достигается иа этом самом элементе,
напоминает о прискорбном случае с одним
незадачливым экспертом по эффективности.
Когда крупная фирма обратилась к нему за
консультацией, он собрал сведения об эф-
эффективности работы служащих различных
отделов и составил список, в который внес по
одному наименее эффективно работавшему
служащему из каждого отдела. В некоторых '
случаях было трудно решить этот вопрос, и тогда имя в списке определялось бро-
бросанием монеты. Затем он представил свой список главе фирмы, и по его совету
все указанные в ием служащие были уволены. Случилось так, что в одном из от-
отделов работал только один служащий, столь способный и усердный, что при по-
помощи обычных механических устройств он отлично справлялся со всей работой
отдела. Конечно, в результате визита эксперта по эффективности он был автома-
автоматически уволен, а фирма потерпела крах.
В примере, который разбил вдребезги утверждение Лагранжа,
мы имели
Ф = х2—Vl+x\,
И*
324 Вступление. Что такое задачи оптимального управления
Отсюда видно, что кривая, проекция которой на плоскость (t, xt)
является отрезком, удовлетворяет некоторому уравнению Эйлера,
но не для функции L, а для функции Ф, т. е. уравнению
На основе таких примеров возникла идея модифицировать
уравнение Эйлера E.2), положив вместо E.1)
E.3) L(t,x, х, к0, к, K) = x0L + M> + x4,
где к0—еще одна действительная постоянная; при этом к урав-
уравнениям E.2) нужно добавить требование, что к0, и и X не все
равны нулю. Эту модификацию мы будем называть исправленной
формой уравнения Эйлера E.2) и правила множителей Лагранжа.
В задаче оптимального управления нас интересуют napbi,v(£),
и (t), удовлетворяющие уравнению C.2) и включению и g U. Тогда
функция L из E.3) имеет вид
KaL(t, х, u) + K(x—q>(t, x, и)),
а уравнение Эйлера относительно х превращается в уравнение
E-4) k=x0Lx-XVx.
Соответствующее уравнение относительно и обычно не рассмат-
рассматривается, и его на самом деле следует заменить неравенством,
если только и не является внутренней точкой множества U. Од-
Однако об этом мы узнаем больше в свое время. Что касается
уравнения E.4), то в дальнейшем оно будет нам часто встречаться,
и поэтому следует знать, откуда оно появилось, ибо многие ав-
авторы книг по оптимальному управлению склонны вводить его
без всяких объяснений.
Но вернемся к модифицированной функции L, определенной
равенством E.3). Может показаться обидным, что столько волне-
волнений и продолжавшиеся более ста лет исследования свелись к та-
такому пустяку, как включение постоянной х0 в выражение для L
и к тому же все это из-за таких редких явлений, как жесткость
или аномалия. Если у читателя создалось такое впечатление, то
он совершенно прав, ибо, хотя доказательство необходимости
исправленного уравнения Эйлера было в конце концов получено,
все эти усилия оказались напрасными, потому что все пришлось
сделать заново и по-другому, чтобы получить более сильный ре-
результат.
§ 6. Условие Вейерштрасса, трансверсальность, гамильтонианы 325
И вот теперь, когда все сказано и сделано, теория опять
разваливается, как карточный домик; рна остается бессодержа-
бессодержательной до тех пор, пока у нас нет теоремы существования. Все
это время мы были заняты ошибкой, которая только вела нас по
ложному следу: ведь из-за парадокса Перрона совершенно бес-
бессмысленно говорить о необходимых условиях, пока не станет
известно, что решение существует.
Серьезной трудностью на нашем пути является не жесткость
и не аномалия — явления довольно редкие; главное препят-
препятствие, которое свойственно почти всем задачам,—это отсутствие
нужных свойств замкнутости. Действительно, если мы присмот-
присмотримся к примеру (с) из § 4, то обнаружим, что это злосчастное
обстоятельство никак не связано с конкретным примером, оно
вытекает из нелинейности уравнений D.2).
Если нам удастся преодолеть эту основную трудность, у нас
будет достаточно времени для доказательства так называемых
необходимых условий. А пока, если мы даже и докажем их, то
получим не более чем мотивировку для догадок, но ведь для
догадок доказательства излишни.
§6
Условие Вейерштрасса, трансверсальность, гамильтонианы
и усовершенствованный рецепт Эйлера
Если мы откажемся от изопериметрйческих ограничений, то
получим
FЛ) l(t,x, х, х0Д) =
мы будем считать здесь, что дополнительная постоянная х0 не-
неотрицательна, причем, когда она равна нулю, вектор X(t) отли-
отличен от нуля. Вместо L мы будем писать иногда L (х), желая
подчеркнуть, что меняется только к. Таким образом, для фикси-
фиксированных t, х, и0, X можно написать
£ (х, x)=L(x)—L (x)-(x-x) Lk ;
так выглядит теперь функция Вейерштрасса $, или полностью
t, х, к, к, и0, К),
причем всегда подразумевается, что х, х удовлетворяют соотно-
соотношениям
d>(t,x, ~k) = ®{t, x,k) = 0.
•Линейный элемент (/, х, к), дополненный множителями и0, К и
Удовлетворяющий указанному ограничению, будем называть силь-
326 Вступление. Что такое задачи оптимального управления
ным, если $(х, х)^0 для всех х, также удовлетворяющих огра-
ограничению. Это и есть условие Вейерштрасса.
Будем считать экстремалью решение уравнения Эйлера
й 1 -Т
и дополнительного дифференциального уравнения C.1). Тем са-
самым экстремаль соответствует определенной паре множителей и0,
к @, первый из которых постоянен. Назовем экстремаль сильной,
если ее линейные элементы (/, x(t), x(t)) вместе £ соответствую-
соответствующими парами множителей являются сильными.
Наконец, если Р, Q — концы кривой, то обозначим через цР,
t\q значения вектора «импульса» ^соответственно в точках Р, Q,
где г\ есть (п-\- 1)-мерный вектор, составленный из скаляра L—xL'K
и вектора L^ опять-таки для соответствующей пары множителей.
Будем говорить, что экстремаль удовлетворяет условию транс-
трансверсальности для задачи с граничными условиями, если для всех
допустимых вариаций 8Р, 8Q концов Р, Q мы имеем (по анало-
аналогии с § 9 из вступления к тому I)
Договорившись обо всем этом, мы сформулируем следующий
аналог рецепта Эйлера, о котором шла речь во вступлении к тому I:
В задаче отыскания минимума при наличии ограничений C.1)
ищите решение среди сильных экстремалей, удовлетворяющих
условию трансверсальности v.
Назовем это правило усовершенствованным рецептом Эйлера.
То, что теперь в нем содержится гораздо больше условий, помо-
помогает нам сузить класс подозреваемых решений, хотя, конечно,
настоящая работа после этого только начинается.
Мы уже объяснили в предыдущем параграфе (и более пространно в томе I),
почему этот рецепт не нуждается в доказательстве. Применяя его, мы должны
проверить, обладают ли найденные по этому рецепту экстремали свойством мини-
минимальности; никакое доказательство любого из так называемых необходимых усло-
условий не спасет нас от этой проверки. Доказательство этих условий будет иметь
смысл только в том случае, если (как в томе I), несмотря на, казалось бы,
непреодолимые трудности, перечисленные в § 4, нам удастся в одной из после-
последующих глав продвинуться настолько, чтобы получить приемлемые достаточные
условия.
Пусть Е—множество пар г0, г, удовлетворяющих соотноше-
соотношениям
F.2) ф(*, х, г) = 0, L(t. х, г) = г0
11 Несколько более сильное условие трансверсальности будет сформулиро-
сформулировано в виде принципа максимума Понтрягина, который будет доказан в кон-
конце гл. Ш.
§ 6. Условие Вейерштрасса, трансверсальность, гамильтонианы 327
при фиксированных (t, х), а Ео—подмножество из Е, для кото-
которого матрица из частных производных по z от вектор-функции Ф
имеет максимальный ранг. Далее, предположим, что рассматри-
рассматриваемая задача минимизации при наличии ограничении является
непараметрической. Истинным гамильтонианом задачи назовем
(величину
■. F.3) ЖA, х, у, t/0)= sup (y0z0 + yz),
где у есть n-мерный вектор, а у0—скаляр, удовлетворяющий
условию уо^0. Если мы положим уп-=—1 и опустим ограни-
ограничение Ф = 0 из F.2), то Ж превратится в (глобальный) [непара-
метрнческий гамильтониан, определенный соотношением типа
неравенства Юнга в § 46 гл. IV т. I. В литературе, посвященной
задаче Лагранжа, вместо этого истинного гамильтониана рассма-
рассматривались различные локальные гамильтонианы. Однако эти
локальные определения могут ввести в заблуждение; мы обсудим
их в следующем параграфе.
В дальнейшем мы для краткости будем пользоваться обозна-
обозначением lo = L(t, х, х), где (t, х, х)—линейный элемент. Линейный
элемент назовем неособым, если (/„, х)£Е0. Линейный элемент
вместе с множителями и0, X будем именовать пополненным ли-
линейным элементом или просто пополнением.
Четверку (t, x, у, у0) аргументов гамильтониана Ж назовем
сильной канонической точкой, отвечающей неособому линейному
элементу (t, x, х), если на паре (/„, х)£Е0 в F.3) достигается
максимум; при этом для фиксированных (t, x) пара {у, у0) назы-
называется сопряженным наклоном для наклона х. Это означает, что
в пространстве (z0, г) множество Е имеет опорную гиперпло-
гиперплоскость yozoJt-yz = S% в точке (/„, х) подмножества Ео. Конечно,
эта опорная гиперплоскость будет также и касательной гипер-
гиперплоскостью в этой точке; значит, она принадлежит линейному
семейству таких гиперплоскостей, являющихся касательными
в точке (/0, х) к различным гиперповерхностям вида
в пространстве (г0, г).
Вот отсюда-то, а не при помощи какого-то фокуса и возни-
возникают на самом деле множители Лагранжа. В написанном выра-
выражении можно так подобрать множители, чтобы отождествить коэф-
коэффициенты с учетом требований о знаках величин у0, х0. Это дает
F.4) f/o = — ис y = U(t, х, х, и0, I).
Теперь мы можем сформулировать следующее утверждение:
328 Вступление. Что такое задачи оптимального управления
F.5) Каноническая форма условия Вейерштрасса. Для того
чтобы (t, х, у, у0) была сильной канонической точкой, отвечаю-
отвечающей неособому линейному элементу (t, х, х), необходимо и доста-
достаточно, чтобы некоторое сильное пополнение (t, x, х, и0, К) удов-
удовлетворяло уравнениям F.4).
Чтобы убедиться в этом, достаточно заметить, что если
уравнения F.4) выполняются и мы положим S% = yol0 + yx, то
получим тождество
Практически это означает, что условие Вейерштрасса можно сформулировать
в терминах нашего гамильтониана. То же самое можно проделать с условием транс-
трансверсальности, так как, когда F.4) выполняется, соответствующий функции L
вектор импульса равен (у, ffl). Однако мы пока еще не нашли канонического ана-
аналога уравнений Эйлера и не приспособили все формулировки к задачам оптималь-
оптимального управления. Прежде чем заняться изучением конкретных задач, желательно
ввести этот формализм, в надежде что он позволит сократить объем нашей работы.
§7
Классические гамильтонианы с ограничениями
Как и для задач без ограничений, в литературе рассматри-
рассматриваются только локальные определения гамильтонианов. В пара-
параметрическом случае их следует сравнить с параметрическим
истинным гамильтонианом, а последний удобно определять для
положительно определенной функции L(x, x) и ограничения
Ф (х, х) = О, где L и Ф положительно однородны по х. В этом
случае дополнительный скаляр у0 нам не понадобится, и мы опре-
определим истинный гамильтониан следующим образом:
y) = supyz,
где верхняя грань берется относительно векторов г, удовлетво-
удовлетворяющих соотношениям L (х, г) = 1, Ф (х, г) = 0.
Рассмотрим сначала простой пример, являющийся параметри-
параметрическим аналогом примеров D.1) и D.2) из §4. Пусть х = (х0, х1У х2)
и требуется найти минимум интеграла длины J \x\dt при наличии
ограничения
G.1) *! = й
•
Для этой задачи индикатриса, т. е. множество векторов х,
для которых L=\, Ф = 0, состоит из двух окружностей, по
которым единичная сфера в пространстве векторов х пересекается
с конусом G.1). Выпуклая оболочка индикатрисы представляет
собой часть цилиндрического тела, заключенную между этими
двумя окружностями. Фигуратриса, т. е. граница двойственной
§ 7. Классические гамильтонианы с ограничениями 329
выпуклой фигуры, состоит из двух склеенных вместе симметрич-
симметричных частей прямых круговых конусов. Две вершины этой фигуры
соответствуют двум граничным кругам цилиндрического тела,
а окружность, по которой пересекаются две части конусов,—
его боковой поверхности. Все остальные точки фигуратрисы
соответствуют двум круговым ребрам. Это совершенно стандарт-
стандартный случай соотвехствия между двойственными выпуклыми фи-
фигурами, когда они имеют ребра, плоские грани и т. д.
Наш параметрический гамильтониан Ж совпадает с гамиль-
гамильтонианом, полученным в § 44 и 46 гл. IV т. I, если считать,
что значение функции L для запрещенных значений наклона х
равно +оо. Значит, Ж есть калибровочная функция двойствен-
двойственной выпуклой фигуры. Так как она равна единице на фигура-
трисе и является однородной функцией первого порядка, то про-
простым вычислением получаем
В точности ту же самую функцию мы получили бы и в задаче
без ограничений, в которой индикатрисой для L служит граница
выпуклой оболочки нашей пары окружностей. Найденный гамиль-
гамильтониан является гладкой функцией для значений у, не лежащих
на оси уг или в плоскости (у0, у,). В локальных определениях
такие значения переменной у исключались бы из рассмотрения,
а ведь именно они играют решающую роль при построении
О
Индикат- Выпук- Фигурат-
риса. лая обо- рнса.
лочка.
фигуратрисы как границы выпуклой оболочки двух вершин и кру-
кругового ребра. По этой причине локальные определения имеют
тенденцию создавать неверное впечатление гладкости, которая
в действительности не имеет места.
Для того чтобы ввести эти классические локальные определе-
определения, нужно вернуться к классической геометрической интерпре-
интерпретации двойственности. Мы опять обратимся к непараметрическому
случаю, так как именно он интересует нас в данный момент.
Отбросим изопериметрические ограничения, положи^, где
330 Вступление. Что такое задачи оптимального управления
нужно, ио = 1, у0 ——1 и зафиксируем переменные (/, х). Назовем
Ф-множеством множество точек г, для которых Ф(г) = 0. Тогда
мы должны подвергнуть классическому преобразованию Лежандра
ограничение функции L(z) на Ф-множество.
Для этого нужно определить линейные функции, являющиеся
касательными к этому ограничению, т. е. найти гиперплоскости,
касательные к его графику. Здесь мы имеем дело с сингулярным
случаем двойственности, и поэтому размерность не обязана сохра-
сохраняться. Рассматриваемый график может иметь «мало точек»,
однако, в соответствии с классической точкой зрения, он имеет
много касательных гиперплоскостей. Например, для множества,
состоящего из одной точки, все гиперплоскости, проходящие
через эту точку, являются касательными. Дело в том, что, так
же как и в рассуждениях, приведших к соотношениям F.4), мы
считаем касательной гиперплоскостью в данной точке г = х нашего
графика любую гиперплоскость, проходящую через эту точку
и содержащую каждую прямую, касательную в этой точке. Эти
гиперплоскости являются касательными гиперплоскостями для
графиков функций вида L(z)-\-XQ>(z). (Точнее, мы должны были
бы написать x0L вместо L, номы условились считать, чтои„=1;
это равносильно допущению, которое обычно делают геометры,
что "К может принимать бесконечные значения.)
Для того чтобы получить наш гамильтониан, мы должны
теперь интерпретировать эти гиперплоскости, или, точнее, линей-
линейные функции, графиками которых они являются, как точки
дуального пространства. Мы получим дуальное множество, состоя-
состоящее из этих точек, и должны представить его локально в виде
графика гамильтониана &С. Сингулярность, связанная с этим
преобразованием, не влияет на размерность дуального множества.
Однако она все-таки сказывается: дуальное множество является
линейчатой гиперповерхностью; на нем лежат отрезки прямых
и даже линейные многообразия той же размерности, что и век-
вектор Ф. Это происходит потому, что гиперплоскости, проходящие
через одно и то же (я—&)-мерное касательное подпространство,
преобразуются в точки одного и того же ^-мерного линейного
многообразия.
До сих пор все это было только локальным вариантом гло-
глобальных рассуждений предыдущего параграфа. Мы нашли, что
уравнения F.4) должны выполняться локально, и больше ничего.
А основной вопрос по-прежнему заключается в том, как выразить
уравнения Эйлера на языке гамильтонианов и как восстановить
значения множителя Лагранжа X, который, помимо всего прочего,
в физических задачах может быть интерпретирован как сила
реакции связей. Эта интерпретация и служит ключом к ответу.
Аналитики и геометры классического толка предложили другое
§ 7. Классические гамильтонианы с ограничениями $31
решение: вместо заданного ограничения Ф = 0 рассмотрим целое
их семейство Ф = сдля постоянных значений переменной с; тогда
наряду с рассматриваемыми величинами и уравнениями при
с —0 можно рассматривать их производные по с. Вот прекрасный
случай пояснить, что мы называем концептуальным методом:
мы ищем решение, используя новые понятия, а аналитики-клас-
аналитики-классики ищут решение, используя дополнительные переменные.
Перейдем к аналитическим деталям. Ограничимся рассмотре-
рассмотрением окрестности в пространстве четверок (t, х, х, К) пополнен-
пополненного линейного элемента (t0, х0, х0, "Ко). Рассмотрим в этой окрест-
окрестности семейство лагранжианов
t, х, х, X) = L(t, х, x) + KO(t, х, х)
и предположим, что блочная матрица
G 2) (
невырожденна. Конечно, мы предполагаем, что размерность вектора
Ф меньше п, как это и вытекает из невырожденности матрицы G.2).
Однако в основном условие невырожденности введено для того,
чтобы исключить случаи, в которых из-за (скажем так) некоторой
неуместной линейности нужные уравнения не имеют локально
единственных решений.
Семейству лагранжианов L, зависящему от параметра X, по-
поставим в соответствие семейство гамильтонианов &£, зависящее
от параметра с. Для этого введем переменные у, с, положив
G.3) y = Lx(x,K), с--=Ф{х).
Будем обозначать через у„ значение переменной у, заданной
первым из этих соотношений, когда пополненный линейный эле-
элемент равен заданному (t0, х0, х0, к0). Мы можем временно поль-
пользоваться этим обозначением, так как пока символ у0 свободен.
Начальным значением для переменной с будет, разумеется, 0.
Вблизи точки (f0, х0, у0, 0) уравнения G.3) имеют локальное
решение следующего вида:
x = l(t, х, у, с), k = r\(t, х, у, с),
так как матрица G.2) невырожденна. Положим
G.4) #(/, х, у, с) = у% + щ-1A, х, |, г]).
Второе из уравнений G.3) можно записать в виде с=
что все это аналогично теории локальных гамильтонианов, рас-
рассмотренной в § 22 гл. II т. I. Нужно только изменить обозна-
332 Вступление. Что такое задачи оптимального управления
чения переменных. Проведенные там вычисления показывают'
что если выполняются уравнения G.3), то справедливы соотно-
соотношения
G.5) #« + £, = #, + £, = (), Жу = х, ЖС = Х.
Определение G.4) является наиболее удобным определением
для Ж. Его можно записать короче: у\—L(t, х, £), так как
члены, содержащие т\, сокращаются. Положив с = 0, мы теперь
получим Ж из семейства Ж и можем обозначить через Жс зна-
значение производной Жс при с = 0. Так как, согласно G.5), Жс—
это значение параметра к, то его можно подставить вместо функ-
функции т), а £, разумеется, равно Жу. Из этих вычислений не видно,
что график гамильтониана Ж содержит линейные подмногообра-
подмногообразия по переменным у; однако можно заметить, что матрица Жуу
вырожденна и ее ранг равен разности числа п и размерности
вектора Ф. Чтобы убедиться в этом, заметим, что так как |
равно Жу, то
х, Жу) = 0;
взяв частную производную по у, получаем
Ф-хЖуУ = 0, когда х'=Жу.
Здесь ранг матрицы Ф^ равен размерности вектора Ф, так как
матрица G.2) невырожденна; значит, ранг матрицы Жуу не пре-
превосходит разности числа п и размерности вектора Ф. Он не может
быть меньше этой разности потому, что (так же как в конце
§ 22 гл. II т. I) произведение матрицы G.2) и некоторой блочной
матрицы, содержащей Жуу, равно единичной матрице.
Все это легко распространить и на тот случай, когда в вы-
выражение для L входят и0, х, т. е. когда семейство лагранжианов
имеет вид
L(t, х, х, и0, и, ty = x0L + K(b + 7W.
В соответствующем семействе гамильтонианов
ЖA, х, у, с, —и, — и0)
мы сохраняем для простоты параметры х, и0, вместо того чтобы,
изменив их знаки, обозначить их другими символами.
Заменим лагранжиан L лагранжианом L в матрице G.2) и
уравнениях G.3). Тогда решения х, К уравнений G.3) будут
функциями от (t, х, у, с, —х, —х0), которые мы опять обозна-
обозначим через £, т). Введем теперь дополнительные переменные я|>, я|>0,
удовлетворяющие соотношениям
G.6) ij> = ¥(*, х, х), qo = L(t, x, i);
§ 7. Классические гамильтонианы с ограничениями 333
подставив вместо х функцию g, получим, что г]}, г}>0 можно пред-
представить в виде функций to, too от переменных (t, х, у, с, — и, —и0).
Тогда семейство гамильтонианов можно определить как семей-
семейство функций от этих переменных следующим образом:
$б = yl + (— х) со + (— и0) со0.
Как и раньше, значения Ж, Жс при с = 0 будем обозначать
через Ж, Ж с. Конечно, мы могли поступить точно так же, как
раньше, т. е. ввести дополнительные параметры е, е0 в G.6) и
приравнять их нулю только в конце. Однако это не имело бы
смысла, так как сопряженные переменные, соответствующие мно-
множителям и, и0, уже были отождествлены с —и, —х0. Эти пере-
переменные являются сопряженными для переменных, введенных
в G.6), и так как последние не присутствуют явно в Ж, то из
уравнений Эйлера получаем и = 0, ио = 0, так что на любой экст-
экстремали и и и0 постоянны. Это означает, что на любой экстре-
экстремали мы можем вместо L назвать нашим лагранжианом выраже-
выражение x0L + x¥, так что гамильтониан Ж будет иметь такой же
вид, как в предыдущих рассуждениях.
Точно так же, как в § 46 гл. IV т. I, теперь можно отожде-
отождествить наш локальный гамильтониан с гамильтонианом из § 6,
если отказаться от изопериметрических ограничений. Таким об-
образом, в случае когда матрица G.2) невырожденна, мы получили
именно те результаты, о которых упоминали в конце предыду-
предыдущего параграфа. В действительности это дополнительное предпо-
предположение вынуждает нас рассматривать только окрестности «хо-
«хороших» канонических точек, что, как подсказывает пример
с ограничением G.1), портит глобальную картину. Поэтому нам
придется снова заняться этим вопросом, имея в виду задачи
оптимального управления; как бы то ни было, все сказанное до
сих пор в этом вступлении предназначено только для того,
чтобы подготовить читателя к теории оптимального управления.
Все эти замечания относились к классической задаче Лаг-
ранжа, так как она встречается также в механике и родственных
вопросах. Однако с незначительными изменениями их можно
применить и к так называемой задаче Больца, которая является
несколько более общей, так как состоит в нахождении минимума
в классе кривых С, удовлетворяющих заданным ограничениям
вида A.1) и A.2) и подходящим граничным условиям, не для
интеграла 3 (С) от нашего лагранжиана L вдоль кривой С, а для
суммы 3 (С)-\-^-(дС), где ^—непрерывная функция границы
кривой С. На самом деле и задача Больца является весьма
частной по сравнению с задачами, упомянутыми во введении,
которые тоже можно формулировать для такого же класса
кривых.
334 Вступление. Что такое задачи оптимального управления
§8
Унранления и принцип максимума
В § 3 мы показали, что задача оптимального управления
представляет собой современную форму задачи Лагранжа. Теперь
ограничения имеют вид
(8.1) x = (f(t, x, и),
где и принимает значения в области U, которая является ограни-
ограниченным и замкнутым множеством в некотором евклидовом про-
пространстве, или, в более общем случае, Б... и-компактом (ком-
(компактом в смысле Бурбаки). В простейших случаях U может
быть отрезком, окружностью или прямым произведением конеч-
конечного числа отрезков и (или) окружностей. На практике эти
отрезки или окружности являются шкалами на пульте управ-
управления. Однако при управлении космическими полетами возни-
возникают более сложные случаи, когда из одного пункта управления
нужно передать управление во второй пункт, расположенный
в другой части земного шара. В таком случае управления подобны
локальным координатам на дифференцируемом многообразии.
Пока мы ограничимся рассмотрением кривых x(t) и управле-
управлений u(t), таких, что u(t) кусочно-непрерывны, a x(t) кусочно-
непрерывно дифференцируемы. Позднее мы ослабим эти предпо-
предположения, и при желании читатель может сразу считать x(t) и
u(t) функциями более общего вида. Кривую x(t) называют
траекторией, a u(t)—соответствующим ей управлением, если они
удовлетворяют уравнению (8.1) всюду, где производная x(t) и
управление u(t) непрерывны. Здесь мы будем предполагать, что
функция ф непрерывно дифференцируема.
Нас интересует минимум интеграла
, х, u)dt
для траекторий x(t) и соответствующих управлений u(t), таких,
что концы траекторий x(t) удовлетворяют заданным граничным
условиям. Сейчас мы предположим, что лагранжиан L(t, x, и)
является непрерывно дифференцируемой функцией. Мы называем
здесь лагранжианом функцию L(t, x, и), хотя раньше лагран-
лагранжиан имел вид L(t, х, х). Однако разница между ними не суще-
существенна, и к тому же, имея L(t, x, и), можно определить
(8.2) L{t, х, x) = inf L(t, x, и),
и
где нижняя грань берется относительно значений параметра и,
удовлетворяющих ограничениям (8.1) при фиксированных (t, x, х).
§ 8. Управления и принцип максимума
335
Вообще говоря, как это и было уже отмечено, различия между
задачей Лагранжа и рассматриваемой задачей не принадлежат
к числу важных. Однако определение (8.2) и рассмотрение огра-
ограниченной и замкнутой области U значений параметра и (на
практике это означает, что она задается неравенствами) влияет
на характер рассматриваемых величин,
делая их менее гладкими, чем это было
обычно. Если прежде можно было счи-
считать, что опорная гиперплоскость рас-
рассматриваемого графика содержит по
крайней мере одну касательную пря-
прямую, то теперь это уже не обязательно
так. Например, в вершине конуса опор-
опорная гиперплоскость вовсе не является
касательной. Значит, множители, кото-
которые появились из рассуждений о каса-
касательных гиперплоскостях, в данном слу-
случае не могут полностью описать геомет-
геометрическую картину, и условие Вейер- Опорная гиперплоскость в
штрасса нужно теперь сформулировать с вершине конуса.
использованием выпуклости или га-
мильтонианов; при этом особенности, присущие гамильтонианам,
проявляются даже как-то отчетливее.
На данном этапе ни один из этих фактов нас не волнует,
так как мы ищем только удобную замену для нашего исправ-
исправленного рецепта Эйлера; но мы должны постараться учесть их.
Ясно, что нужно начать с введения гамильтонианов. При этом
напрашиваются несколько возможностей их определения.
а. Управляемый гамильтониан ffl(t, x, у, у„, и). Будем назы-
называть тройку (/, х, и) точкой и введем канонические переменные
у, v, сопряженные к х, и, а также множители и постоянные
ио = — i/os^O- Тогда можно положить
L(t, х, и,
v = L-u = 0,
х, у, у0, u) =
Гамильтониан Ж, который мы называем управляемым, потому
что он зависит от аргумента и, есть не что иное, как рассмот-
рассмотренный в предыдущем параграфе локальный гамильтониан в
новых переменных. Однако, поскольку он зависит от х только
линейно и совсем не зависит от и, неявные уравнения можно
336 Вступление. Что такое задачи оптимального управления
решить глобально. Кроме того, очевидно, выполняются тождества
Lx = — 3%х, La = — Жа и Lt = — Sftt-
Так как переменная v тождественно равна нулю, то соотно-
соотношение u = §tv не будет иметь смысла, если мы не воспользуемся
некоторым специальным аппаратом, аналогичным рассмотрению
производной Жс в предыдущем параграфе. Остальные уравнения
Эйлера имеют вид
(8.3) (i) i = &y, (ii) у = — Йя. (iii) 0 = 5?..
Третье из этих уравнений следует отбросить, так как в боль-
большинстве задач оказывается, что и лежит на границе области U.
Первое уравнение совпадает с (8.1). Таким образом, мы полу-
получили одно уравнение, а именно уравнение (8.3) (ii), которое
можно записать в виде
(8.4) y = — y0Lx—yyx.
b. Другой гамильтониан. Так как мы ничего не доказываем,
то наши рассуждения могут быть столь правдоподобными, сколь
мы этого пожелаем. Однако, может быть, и в самом деле разумнее
было бы считать, что управления и играют роль производных
по времени. Положив ы = £, мы предположим тогда, что t,(t)
должны быть (так же как x(t)) непрерывными функциями. Если
мы теперь рассмотрим нашу задачу в пространстве (t, x, £), то
произойдет странная вещь! Наивный подход пункта (а) не будет
улучшен, наоборот, мы получим более слабый результат. Лагран-
Лагранжиан L сохранит свой вид, только вместо и будет стоять £,
а сопряженной к дополнительной переменной £ будет переменная
r\ = La. Значит, этот метод сразу вводит дополнительное требо-
требование разрешимости последнего уравнения относительно и и,
следовательно, в лучшем случае является только локальным.
В гамильтониане появится дополнительный член ■ци, который
в соответствии с уравнением (8.3) (iii) был бы равен 0; но это
последнее уравнение, которое в силу найденного выше выраже-
выражения для т) можно записать в виде ц = 0, теперь заменяется более
слабым уравнением tj = 0. В остальном уравнения Эйлера оста-
остаются такими же, как и раньше.
c. Истинный гамильтониан. Для того чтобы получить аналог
гамильтониана F.3), заменим L функцией С, определенной при
помощи (8.2). Очевидно, что это эквивалентно следующему опре-
определению:
(8.5) $V(t, х, у, yo) = sup{yz + yaL(t, x, и)},
и, г
§ 8. Управления и принцип максимума 337
где верхняя грань берется относительно всех пар и, г, удовлет-
удовлетворяющих условиям
u£U, z = <p(t, х, и),
и где уо = — и0 и уо^О. (Последнее объясняет, почему в (8.5)
берется верхняя грань, а не нижняя.) Легко заметить, что между
гамильтонианом Ж и управляемым гамильтонианом ^существует
очень простая связь, а именно:
(8.6) ЯГ = тах5?(/, х, у, у0, и),
причем максимум достигается для некоторого u = uo£U, так
как U—ограниченное замкнутое множество (или Б...и-компакт).
Тем самым, если мы обозначим через Е множество простран-
пространства (z, z0), заданное параметрически при фиксированных (t, x)
соотношениями
zo = L(t, х, и), г = <р(/, х, и)
(и—параметр), то для (z, zo)£E выполняется неравенство
1, х, у, {/„),
причем равенство имеет место для точек (z, z0) g E, которые соот-
соответствуют значению и = и0. Следовательно, уравнение y0z0 + уг = Ж
является уравнением опорной гиперплоскости множества Е в этой
точке. Именно это условие мы и назовем новым условием Вейер-
штрасса; оно ограничивает наши рассмотрения только теми зна-
значениями параметра и, на которых в (8.6) достигается максимум.
Так как пара у, —Ж определяет импульс, то мы сразу полу-
получаем условие трансверсальности
[уЬх—ЖЫ]\ = 0,
где 1, 2—это концы траектории, а (Ьх, б/)—возможные переме-
перемещения каждого из концов.
Таким образом, истинный гамильтониан опять дает нам усло-
условие Вейерштрасса и условие трансверсальности. Но, с другой
стороны, он может оказаться менее гладким, чем в задаче Лаг-
ранжа, и трудно, по крайней мере с первого взгляда, ожидать,
что он даст нам также и уравнения Эйлера.
Итак, мы снова оказались перед той же дилеммой, что и
в задаче Лагранжа. Отбросив гамильтониан из пункта (Ь), как не
представляющий интереса, мы имеем два гамильтониана: какой
из них выбрать?
В действительности решение сразу бросается в глаза. Здесь,
так же как во многих других случаях, первая пришедшая в го-
338 Вступление. Что такое задачи оптимального управления
лову мысль оказывается самой лучшей, несмотря на чрезмерное
упрощение, лежащее в ее основе. Это значит, что нужно выби-
выбирать не более изысканный «истинный» гамильтониан, а наш пер-
первый наивный управляемый гамильтониан. Но в то же время
следует заменить уравнение (8.3) (iii) условием, что значение
управляющей переменной и должно быть таким, чтобы на нем
достигался максимум в выражении (8.6)".Это условие представ-
представляет собой знаменитый принцип максимума Понтрягина. Если
это условие добавить к очень простому управляемому гамиль-
гамильтониану, то он будет обладать всеми преимуществами истинного
гамильтониана.
Доказательство необходимости принципа максимума приводится в книге
Понтрягииа, Болтянского, Гамкрелидзе и Мищенко, которую мы будем в даль-
дальнейшем называть просто «Оптимальные процессы»; это в некотором смысле куль-
кульминация усилий математиков, которые свыше столетия пытались исправить
правило множителей Лагранжа. Кроме того, и сам этот принцип имеет огромнее
значение; он образует фундамент всей теории оптимального управления. С другой-
стороны, как уже было отмечено, из-за отсутствия теорем существования его
можно подвергнуть критике с тех же общих позиций, как и алгоритм Эйлера —
Лагранжа (вступление к тому I), который тем не менее играет важную роль в сов-
современном анализе и теории распределений Шварца. К тому же в данном случае
при доказательстве существования следует учитывать основную трудность, на
которую мы обратили внимание в пункте (с) § 4. Поэтому любое заявление
о том, что существование решения очевидно из физических соображений, можно
опровергнуть, используя замечания Лебега из § 56 гл. V т. I. С нашей точки зре-
зрения, доказательство необходимости без существования иллюзорно; оио не дает
ничего, кроме рецепта, требующего проверки; в лучшем случае оно доставляет
мотивировку, а это мы сделали и без доказательства. Поэтому мы, так же как
в томе I, отложим обсуждение необходимых условий до тех пор, пока не сформу-
сформулируем задачу оптимального управления так, чтобы иметь возможность доказать
существование решения.
§9
Принцип максимума и его частные случаи как определения
В томе I мы пользовались уравнением Эйлера в основном
для определения экстремали, а не как необходимым условием.
Здесь мы аналогичным образом воспользуемся принципом макси-
максимума, но при этом не будем заботиться об изобретении новых
терминов.
Пусть рассматривается задача оптимального управления,
описанная в предыдущем параграфе; будем говорить, что траек-
траектория x(t) и соответствующее управление u(t) удовлетворяют
принципу максимума, если существуют постоянная уо^О и не-
непрерывная кусочно-непрерывно дифференцируемая вектор-функ-
11 Значит, выбирая значение ы, мы максимизируем «мгновенное воздейст-
воздействие», задаваемое функцией $.
§ 9. Принцип максимума и его частные случаи 339
ция y(t), удовлетворяющие следующим условиям:
(i) Для любого / хотя бы одна из величин y(t), y0
отлична от нуля,
(ii) Для фиксированных (t, x(t), y(t), y0) функция
(9.1)
х, У, Уо, ") = !
достигает своего максимума Ж относительно и
при u = u(t).
(iii) Величины t, x(t), y(t), y0, u(t) удовлетворяют ка-
каноническим уравнениям Эйлера
(iv) На концах выполняется условие трансверсаль-
трансверсальности и
[уЬх—5£6/]? = 0.
В приведенном определении все ясно, кроме точного смысла
условия трансверсальности. Это условие мы поясним для не-
нескольких частных случаев, так как в данный момент только они
нас интересуют. Было бы желательно интерпретировать условие
трансверсальности в самом общем случае, когда пара концов
может описывать замкнутые множества в Bл + 2)-мерном прост-
пространстве, но данное вступление—не очень подходящее для этого
место.
A) Предположим сначала, что концы закреплены. Тогда усло-
условие трансверсальности отпадает.
B) Затем предположим, что лг-координаты концов закреплены,
а временная координата свободна. Тогда условие принимает вид
в частности, если временная координата фиксирована для одного
конца Р и не фиксирована на другом конце Q, то гамильто-
гамильтониан &С равен нулю в точке Q.
C) В конце Р пространственные и временная координаты
фиксированы, а во втором конце Q время t не фиксировано,
а пространственные координаты х лежат на гиперповерхности,
которая имеет в точке Q непрерывную касательную гиперпло-
гиперплоскость П. Тогда в точке Q гамильтониан Ж равен нулю, а век-
вектор у ортогонален касательной гиперплоскости П. (Аналогично,
если х лежит на пересечении конечного числа таких гиперповерх-
гиперповерхностей, то вектор у ортогонален пересечению соответствующих
касательных гиперплоскостей.)
11 Несколько более сильное условие трансверсальности будет сформули-
сформулировано в виде принципа максимума Понтрягина, который будет доказан
в конце гл. III.
340 Вступление. Что такое задачи оптимального управления
D) Концы Р, Q лежат на гладком многообразии, заданном
параметрически в Bм + 2)-мерном пространстве соотношением
(<i, *i, U, xa) = R(v),
где R—непрерывно дифференцируемая вектор-функция, a v —
скалярный или векторный параметр, такой, что пара (Р, Q)
соответствует внутренней точке его области определения. В этом
случае, если через tj обозначить Bга + 2)-мерный вектор, состав-
составленный из значений величин Ж, —у в первом конце и значений
величин —Ж, у во втором конце, то условие трансверсальности
будет означать, что для каждой частной производной Rt от R
по одной из компонент вектора v выполняется соотношение
т,Я, = 0.
При использовании условия трансверсальности могут ока-
оказаться полезными следующие замечания.' В случаях B) и C)
вместо того, чтобы проверять, равно ли нулю значение функ-
функции Ж в конце Q, можно вычислить ее значение в любой другой
момент времени, так как она удовлетворяет дифференциальному
уравнению
(9.2) & = &t(t, x(t), y(t), yn, u{t)).
Поскольку функция u(t) кусочно-непрерывно дифференцируема,
достаточно вывести уравнение (9.2) только для тех дуг, для
которых она непрерывно дифференцируема. Используя элемен-
элементарные правила анализа, мы найдем полную производную. При
этом ввиду свойства максимальности (ii) производная Жа равна
нулю, а согласно уравнениям Эйлера (ш), члены хЖх-{-уЖу
сокращаются. Таким образом, мы получаем уравнение (9.2).
Например, если гамильтониан Ж не зависит явно от времени,
или, как мы будем говорить, задача автономна, то функция Ж
равна нулю в конце Q тогда и только тогда, когда Ж = 0
в каждой другой точке траектории. А в случае C), если траек-
траектория x(t) расположена по одну сторону гиперповерхности
вблизи Q и не касается ее, можно определить направление век-
вектора у в конце Q: оно совпадает с направлением нормали (внут-
(внутренней или внешней), и, кроме того, в конце Q мы имеем
(9.3) yx = SK—y0L = — yttL,
и потому знак величины ух совпадает со знаком L.
Рассмотрим отдельно задачи, в которых ф не зависит явно
от t, a L=l. Такие задачи мы будем называть задачами об
оптимальном быстродействии. Далее предположим, что гранич-
граничные условия имеют вид C), т. е. начальное положение и на-
начальный момент времени заданы, конечное положение должно
§ 9. Принцип максимума и его частные случаи 341
принадлежать заданной гиперповерхности или быть заданной
точкой (такую гиперповерхность или точку называют целью),
а конечный момент времени не фиксирован.
Согласно (9.2), для такой задачи 5? = О, так как 5^ = 0
во втором конце. Условие (9.1) (i), согласно которому y(t), уи
не равны одновременно нулю, преобразуется в условие у^)фО,
так как из равенств $? = 0, y(t) = O следует, что уо — О. В этом
случае мы поступим так же, как это сделано в «Оптимальных
процессах», и вычтем из управляемого и истинного гамильто-
гамильтонианов постоянную у0. Введем обозначения
Мы будем говорить, что в такой задаче траектория x(t)
и соответствующее ей управление u{t) (ti^t^.t2) удовлетво-
удовлетворяют принципу максимума, если существует не равная нулю
непрерывная кусочно-непрерывно дифференцируемая вектор-функ-
вектор-функция y(t), удовлетворяющая следующим условиям:
' (i) Для фиксированных (t, x(t), y(t)) функция
H(t, x, у, ы) = 1/ф
достигает своего максимума Н относительно и
при u = u(t).
(ii) Величины /, x(t), y(t), u(t) удовлетворяют ка-
(9.4)
ноническим дифференциальным уравнениям Эйлера
х = Ну, у = — Нх.
(Hi) H равна неотрицательной постоянной.
(iv) В случае когда целью служит гиперповерхность,
в конечный момент t — t2 вектор у—это нормаль
к гиперповерхности, направленная так, что ух^О.
Имея эти определения, мы можем теперь просто указать
рецепт, которым следует пользоваться для выявления подозре-
подозреваемых на оптимальность траекторий и соответствующих управ-
управлений: они должны удовлетворять принципу максимума.
Вряд ли нужно повторять (мы это уже объясняли во вступ-
вступлении к тому I), что подозрение такого рода ни в коей мере
нельзя рассматривать как доказательство. Поэтому решение кон-
конкретной задачи разбивается на два этапа: (а) нахождение подо-
подозрительных траекторий и управлений и (Ь) доказательство того,
что они в самом деле дают искомый минимум. Так же как
в томе I, главным является это доказательство. Однако, по-
поскольку пока мы не располагаем общей теорией, то приходится
надеяться, что свершится чудо, благодаря которому нам удастся
доказать этот факт для двух частных задач, рассматриваемых
в следующем параграфе.
342 Вступление. Что такое задачи оптимального управления
§ Ю
Решение двух элементарных задач об оптимальном быстродействии
Мы рассмотрим две задачи о материальной точке, движу-
движущейся с управляемым ускорением вдоль прямой (которую мы
примем за ось х) и обладающей заданными начальными положе-
положением и скоростью. Переменную управления обозначим через и
и предположим, что —l^u^l.
A. Простейшая задача управляемой остановки. Ищется наимень-
наименьшее время, за которое можно привести материальную точку
в состояние покоя в начале координат, если ускорение х равно
переменной управления и.
B. Управляемое замедление осциллятора. Положение мате-
материальной точки определяется в этой задаче уравнением х-\-х = и.
Мы будем называть материальную точку осциллятором, а вели-
величину 1/ix2 + 1/2x2—ее энергией.\ Нужно определить наименьшее
время, за которое энергия уменьшается до заданного уровня или,
в частности, до нуля (в этом случае материальную точку нужно
привести в состояние покоя в начале координат).
Обе эти задачи относятся к задачам об оптимальном быстро-
быстродействии, рассмотренным в предыдущем параграфе, нужно только
ввести обозначение х = Х и изучать их на плоскости (х, X).
Сопряженный вектор обозначим аналогично через (у, Y). Вектор
(х, X) будем называть фазовой точкой, а вектор (х, X, у, Y) —
канонической фазовой точкой. Кроме того, вместо начального
значения времени t можно фиксировать конечное значение и
принять его за начало отсчета на временной оси.
В качестве упражнения мы предлагаем читателю попытаться решить задачу,
аналогичную (А), в которой ускорение х равной—g, где g — постоянная, удовлет-
удовлетворяющая условию 0<g<l.
Прежде чем перейти к нашим дальнейшим рассмотрениям, читателю было бы
полезно обратиться, с одной стороны, к «Оптимальным процессам», а с другой —
к книге Беллмана «Динамическое программирование». Мы уже не раз подчеркива-
подчеркивали, сколь важно изучение оригиналов, а не только более поздних упрощенных
изложений. Конечно, оба эти примера рассматривались и раньше, но в этих кни-
книгах они используются только для иллюстрации. В «Оптимальных процессах»
приводится также критика основной идеи Беллмана. Однако эта основная идея
(которая встречается и в более ранних работах Каратеодори, а также широко
используется в книге Харди, Литтльвуда и Полна) вполне здравая, так как необ-
необходимые условия сами по себе ничего не означают. Все что требуется — это дока-
доказать, что полученные условия являются достаточными. В «Оптимальных процес-
процессах» такое доказательство приводится сотней страниц позже и только для того
случая, когда цель вырождается в точку. Возможность применения этих резуль-
результатов основана на том, что задачи (А) и (В) линейны. Ниже мы приведем полное
и прямое решение этих задач, используя подход Каратеодори и Харди—Литтль-
Харди—Литтльвуда — Полна, который был применен и Беллманом (и который, кстати говоря,
мы применили во вступлении к тому I).
§ 10. Решение двух элементарных задач о быстродействии 343
Траектории и управления, удовлетворяющие принципу максимума, мы будем
сейчас называть подозрительными на оптимальность. При их вычислении чита-
читателю очень помогут «Оптимальные процессы», где, кроме того, приводятся пре-
прекрасные рисунки. Наши рассуждения, конечно, будут длиннее, так как мы дока-
докажем, что подозрительные на оптимальность траектории и управления в самом деле
являются искомыми решениями.
Подозреваемые в задаче А. В этом случае функция ф равна
производной по времени от (х, X), т. е. (X, и). Следовательно,
H = yX + \Y\.
Из уравнений Эйлера
получаем
у = const, Y = — yt + const,
и, значит, подозрительное на оптимальность управление имеет вид
и — sign (У) = sign (— yt + const) = ± 1.
Величина yt может менять знак только один раз. Далее, так
как гамильтониан Н равен неотрицательной постоянной, то
||t
Итак, согласно принципу максимума, подозрительные на опти-
оптимальность траектории составлены из дуг, на которых управление
и равно постоянной +1 или —1, и, поскольку управление и
может менять знак только один раз, любая такая траектория
содержит не более двух таких дуг. Для нахождения этих дуг
нужно проинтегрировать уравнения х--Х, Х = ы при ы = ±1.
Мы получим дуги парабол
х = -^их2-{- const, Х = ит,
где и = ±1 и т = <-|-const; Они образуют два семейства
X2
В одном из них (ы = + 1) X возрастает вместе с /, и параболы
из этого семейства будем называть направленными вверх; во вто-
втором (и—-—1) X убывает, когда t возрастает, и параболы
из второго семейства будем называть направленными вниз.
Две параболические дуги являются подозрительными на опти-
оптимальность гладкими траекториями. Это дуги, которые заканчи-
заканчиваются в начале координат (при t — О). Они определяются урав-
уравнениями
344
Вступление. Что такое задачи оптимального управления
где и = ±1. Обозначим дугу, соответствующую управлению
ы = + 1, через Р, а дугу, соответствующую управлению ы = —1,
через а.
Очевидно, что если начальная фазовая точка Р = (р, р) рас-
расположена выше дуги а + Р, то ее можно соединить с дугой а Р
Парабола, направлен-
направленная вниз.
Парабола, направленная
вверх.
только одной параболой, направленной вниз, и конечная точка
дуги этой параболы будет фазовой точкой Q=(q, q) дуги р.
Аналогично, если начальная фазовая точка расположена ниже
дуги a + Р, то ее можно соединить
с этой дугой только одной па-
параболой, направленной вверх, и
конечная точка дуги этой пара-
параболы будет фазовой точкой дуги а.
Отсюда следует, что для каж-
каждого положения фазовой точки Р
существует в точности одна по-
подозрительная на оптимальность
траектория, выходящая из Р и за-
заканчивающаяся в начале. Если Р
находится на дуге а (или Р), эта
траектория совпадает с соответ-
соответствующим участком дуги а (или
Р). Если Р находится выше дуги a + Р, траектория состоит из
направленной вниз параболической дуги PQ и части QO дуги
р. Если же Р расположена ниже a-fP, траектория состоит из
направленной вверх параболической дуги и части дуги а.
Доказательство оптимальности в задаче А. Это самая важная
часть, так как все сказанное выше было лишь более или менее обо-
обоснованными догадками. Обозначим через —Т(р, р) начальный
момент времени в фазовой точке Р на нашей подозрительной
траектории; так как конечный момент времени, отвечающий при-
§ 10. Решение двух элементарных задач о быстродействии 345
бытию в начало, равен 0, то Т — это подозреваемое наименьшее
время перехода из Р в начало. Мы вычислим Т в явном виде.
Предположим сначала, что фазовая точка Р расположена выше
дуги a-j-P.
На дуге PQ имеем
и = — 1, Х = — /+const,
а на дуге QO —
u = +l, X = t.
Следовательно,
P—<i = tQ—tp, q = tQ
и, значит,
Т(р, p') = — tP = p'-2q.
Кроме того,
значит,
и q—отрицательный корень этого квадратного уравнения, так
как фазовая точка Q расположена в четвертом квадранте. Сле-
Следовательно, для фазовых точек Р, расположен-
P
ных выше дуги a + P, P
Т(р, Р) = Р
Изменив направление обеих осей, получим,
что для фазовых точек Р, расположенных ниже
дуги а + Р,
Т(р, р) = -
Обе формулы дают Т='р на дуге а и Т = — р на дуге р.
Теперь мы будем писать (х, X) вместо (р, р), так что Т
превратится в функцию Т(х, X) от наших первоначальных пере-
переменных. Пусть
g(x, X, и)=
всюду, кроме точек дуги а + р, а на этой дуге положим g = 0.
Тогда при —l^u^l для фазовых точек (х, X) выше дуги
+ р имеем
Х) Например, в четвертом квадранте выше дуги Р имеем 4дс^2Х2, так
что 21 X [ < V2X*+*x.
346 Вступление. Что такое задачи оптимального управления
а для фазовых точек (х, X), расположенных ниже этой дуги,
Следовательно, при — 1 ^ и <1 + I для всех (х, X) выполняется
неравенство g^O. Это основной факт, на который опирается
наше доказательство. Разумеется, он вовсе не является очевидным
следствием принципа максимума.
Далее, заметим, что ни одна допустимая траектория не может
описывать какую-либо часть дуги а или |3 в обратном направ-
направлении. В самом деле, записав уравнение для дуги а или Р
в виде Х2 = 2иох и вычислив полную производную вдоль такой
траектории, мы получим, что ХХ = иох, а отсюда ввиду урав-
уравнений-ограничений Хи = и0Х, так что ы = ы0. Значит, управление
будет тем же самым, как и для дуг а'или |S, которые ведут
в начало, и, следовательно, направление нельзя изменить на
обратное.
Таким образом, на любой дуге, расположенной выше, ниже
или на самой кривой a-f|3 и принадлежащей допустимой траек-
траектории x(t), X(t), удовлетворяющей уравнениям-ограничениям,
g = i\t + T(x, Х)\.
Разложив произвольную допустимую траекторию на части, рас-
расположенные выше дуги а + Р, ниже нее и на ней самой, получим,
что для такой траектории
В частности, для траектории, соединяющей фазовую точку Р
с началом О, выполняется неравенство tp + T^O. Тем самым
наше утверждение доказано.
Легко показать, что это решение единственно.
Подозреваемые в задаче В. Функция <р, равная производной
по времени от (х, X), в этом случае равна (X, и—х). Значит,
(u—x), H = yX—Yx + \Y\.
Уравнения Эйлера имеют вид
следовательно, Y = Asin(t — tf0), где А > 0 и t0—постоянные.
Управление и, на котором гамильтониан Н достигает максимума,
имеет вид
и = sign Y = sign {A sin (/—/0)} =sign {sin (/ — /„)}.
§ 10. Решение двух элементарных задач о быстродействии 347
Это означает, что u(t)—периодическая функция с периодом 2я,
равная —1 и +1 соответственно на интервалах t0—п < t < t0
и <0</<<0 + я. Значит, подозрительные на оптимальность
траектории опять составлены из дуг, на которых и равно одной
из постоянных ± I. Дифференциальные уравнения для этих дуг
можно записать в комплексной форме
z = — iz, где z = x— u-{-iX, и = ±1.
Решение этого уравнения имеет вид
z==re-tu-v),
где у и г > 0—постоянные. Таким образом, указанные дуги
лежат на концентрических окружностях с центром z = 0, что
соответствует точке (и, 0) оси х. Мы получаем два семейства
таких дуг, соответствующих значениям ± 1 управления ы, причем
переход от дуги одного семейства к дуге другого семейства
совершается при перемене знака управления и. Материальная
точка описывает эти дуги по часовой стрелке, а время t на каждой
дуге только на постоянную отличается от стягиваемого этой дугой
центрального угла.
Таким образом, задача нахождения подозрительных траекто-
траекторий свелась к соединению подходящих дуг из двух семейств
окружностей. Мы будем двигаться назад от конечного момента
t = 0, когда осциллятор достигает заданного уровня энергии,
скажем 1/2R2. Эго означает, что в момент t = 0 фазовая точка
должна находиться на окружности
A0.1) x* + X* = R*,
или, в частности, в начале, если R = 0. Конечным положением
является фазовая точка Q, заданная уравнением
Если RфO, то, согласно правилу C) и формуле (9.3) из § 9,
условие трансверсальности состоит в том, чтобы вектор (у, Y)
был направлен вдоль радиуса в точке Q внутрь круга, если
только производная х не является касательной к цели A0.1)
в этой точке. Последнее может произойти только в том случае,
когда окружность A0.1) касается окружности с центром (±1, 0)
в точке Q, т. е. когда Q лежит на оси х; такую возможность
мы пока исключим. Кроме того, по симметрии мы можем тогда
считать, что 0<а<я. Таким образом,
= — ceia' (c>0)
при / = 0. Случай # = 0 можно теперь тоже включить в рас-
рассмотрение—это не повлияет на последнюю формулу. Очевидно,
348 Вступление. Что такое задачи оптимального управления
что постоянная t0 в выражении для Y{t) равна а, и потому
и (t) = sign {sin (t—а)}.
Это выражение для u(t) остается пригодным и для а = 0, так
как в этом случае У = 0 при ^=0; по соображениям симметрии,
оно будет иметь место и для — л ^ а < 0, но мы опять ввиду
симметрии ограничимся случаем, когда 0<1а<л. В этом слу-
случае при *=0 (или, если а = 0, при всех малых отрицательных t)
Л' R
u(t) равно —1. Это означает, что последняя дуга окружности
нашей подозрительной на оптимальность траектории, заканчиваю-
заканчивающейся в точке Q, имеет центр в точке О' = (—1, 0).
Опишем эту дугу в обратном направлении от Q до ближай-
ближайшей предшествующей фазовой точки Q', в которой u(t) меняет
знак. Это означает, что мы двигаемся против часовой стрелки
по дуге, стягивающей угол л—а с вершиной в О'. Используя
геометрическое построение, можно получить точку Q' более
простым способом. Для этого обозначим через Q' точку — R—I
оси х. Треугольники OQO' и Q'O'Q' имеют равные углы в вер-
вершинах Q и О', и пары прилежащих сторон тоже равны. Следо-
Следовательно, эти треугольники конгруэнтны. Это означает, что
точка Q' расположена на единичной окружности с центром Q'
и угол в вершине Q', образованный направлением Q'Q' с осью х,
равен опять л—а. Если мы продолжим движение в обратном
направлении по нашей траектории за точку Q', то будем описы-
описывать попеременно полуокружности с центрами
0" = A, 0) и О' = (-1. 0).
Первая из этих полуокружностей приведет нас в точку Q", рас-
расположенную на другом конце диаметра, проходящего через
центр О". Ввиду симметрии относительно центра О", легко сооб-
сообразить, что точка Q" расположена на нижней половине единич-
единичной окружности с центром в точке fi" = (/?-|-3, 0) и что
радиус Q"Q" образует угол —ас положительным направлением
оси х (против часовой стрелки).
10. Решение двух элементарных задач о быстродействии
349
Теперь обозначим через Г круг хг + Ха<1 R*, а через Г' и Г"—■
дуги во втором и четвертом квадрантах, состоящие соответственно
из единичных верхних полуокружностей с центрами в точках
оси х
— Я—1, — R-3, ...
и нижних полуокружностей с центрами в точках оси х
R + l, R + 3, ... .
Из наших построений следует, что для любой подозрительной
на оптимальность траектории, которая оканчивается на границе
ft"
О' О О"
/а
V
круга Г, управление u(t) всегда равно —1 выше Г' + Г + Г" и
равно +1 ниже этого множества. Значит, дуги окружностей
с центром в О' всегда расположены выше этого множества, а дуги
окружностей с центром в О"—ниже него. Назовем первые дуги
верхними, а вторые—нижними.
Легко видеть, что существует только одна подозрительная
на оптимальность траектория, проходящая через заданную фазо-
фазовую точку Р. Нужно просто двигаться из точки Р по часовой
стрелке вдоль верхней или нижней дуги до ее пересечения с мно-
множеством Г' + Г + Г", причем это пересечение для подходящего а,
удовлетворяющего условию 0^а<я, совпадает с одной из
построенных выше точек Q, Q', Q", ..., а для а, удовлетворяю-
удовлетворяющего условию —я^а<0,— с точками, которые получаются
аналогично при помощи симметричных построений.
Доказательство оптимальности в задаче В. Мы опять вычислим
подозрительное на оптимальность время Т, точнее, определим Т
по модулю 2л, так как этого достаточно для наших целей. Сна-
Сначала предположим, что конечная фазовая точка Q лежит на верх-
верхней полуокружности круга Г.
350 Вступление. Что такое задачи оптимального управления
Если фазовая точка Р расположена ниже множества Г' -f Г + Г",
то обозначим через 6 угол с вершиной О", стягиваемый дугой ниж-
нижней полуокружности, которая соединяет Р с точкой Q* на дуге Г'.
Если же точка Р расположена выше множества Г"-j-Г + Г", то
обозначим через —6 угол с вершиной О', стягиваемый дугой
верхней полуокружности, которая соединяет точку Я с дугой Г',
т. е. дугой, дополняющей до этой полуокружности кусок траек- *
тории, соединяющий Р с множеством Г + Г". Таким образом,
— я<0<я. Обозначим через Os = (us, 0) точку О', если 0<О,
и точку О", если 6 > 0. Далее, обозначим через Q* центр еди-
единичной окружности, верхняя полуокружность которой принадле-
принадлежит Г' и содержит точку Q*, а через tos—расстояние от точки Q*'
до точки Os.
Между точкой Q* и последним пересечением Q' с дугой Г''
наша траектория (или ее продолжение до точки Q*, описываемое
в обратном направлении) состоит из четного числа полуокруж-
полуокружностей и заканчивается дугой Q'Q, стягивающей угол я—а с вер-
вершиной О'. Таким образом, сама траектория получается посредст-
посредством присоединения (или изъятия) дуги Q*P, стягивающей угол ± 0.
Значит, подозрительное на оптимальность время равно сумме
всех этих углов, т. е.
7=0+я—а (mod 2л).
Построим этот угол геометрически. Единичный радиус Q*Q*
образует с осью х угол я—а. Обозначим через 02 угол в вер-
вершине Os треугольника Q*OSQ*; тогда для этого треугольника
внешний угол в вершине Q*, образованный продолжениями
сторон OSQ* и Q*Q*. равен я—a-f 02. Теперь уже легко при-
прибавить сюда еще угол 0t = 0—02.
Для этого построим на единичной окружности с центром Os
угол 6, с вершиной в 0^, образованный продолжением отрезка Р0х за
точку Os и осью х. Согласно приведенным выше рассуждениям,
мы получим угол л—a-j-б, если построим треугольник, конгру-
конгруэнтный треугольнику Q*OSQ*, заменив сторону 0sQ* равным ей
отрезком P0s, а третью вершину Q*—точкой W на нашей еди-1
§ 10. Решение двух элементарных задач о быстродействии
351
ничной окружности; при этом из двух возможных положений
точки W следует выбрать то, для которого угол я—а -f 02 между
продолжением отрезка POS и радиусом 6SW отсчитывается против
часовой стрелки. Тогда этот радиус образует с осью х искомый
угол 0 + л—а.
Точка W, определяющая этот угол, находится на расстоя-
расстоянии о», от точки Р, а угол в вершине W треугольника PWOS
it -a +
равен я—а. Следовательно, эту точку легко построить с точ-
точностью до отмеченной выше неоднозначности. Из этого построе-
построения следует, что если Р—любая фазовая точка (х, X), лежащая
вне Г, и через Т мы обозначим число Т (х, X), то
A0.2)
—sin Т)* =
так как расстояние WP равно tos. Соответствующее уравнение
в том случае, когда конечная точка Q расположена на нижней
полуокружности круга Г, можно получить, обратив направления
осей и изменив знаки величин us. Оно имеет следующий вид:
A0.3) (х—us + cos ТJ+ (Х +sin Т)* = (ol
Входящие в уравнения A0.2), A0.3) величины us, ws остаются
постоянными в соответствующих областях фазового простран-
пространства (х, X), которые образуют две системы областей, в совокуп-
совокупности покрывающие дополнение множества Г. При движении от Г
мы сначала имеем два криволинейных треугольника с нулевыми
углами, ограниченные дугами окружностей, как показано на
рисунках на следующей странице, а затем две последовательности
фигур, каждая из которых ограничена четырьмя дугами окруж-
окружностей (на рисунке указана первая из них).
352
Вступление. Что такое вадачи оптимального управления
В каждой из этих областей можно дифференцировать по t
уравнение A0.2) или соответственно A0.3) вдоль любой траекто-
траектории, отвечающей допустимому управлению u(t). Так, для уравне-
уравнения A0.2)
(х—us—cos T) (X + f sin T) + (X—sin T) (u—x—tcos T) = 0.
Полагая g=l + 7\ мы находим, что в случае, когда выполняется
уравнение A0.2),
A0.4) ^К-")
аналогично, в области, где выполняется уравнение A0.3),
,,„ _. . ч sin T4-X
A0.5) e=(us~u)XcosT_(x_Us)sinT.
Кроме того, функцию g=\+t можно'записать в виде
g(x, X, и)=
ее = — it
Для того чтобы х>бсудить выражения, полученные для функ-
функции g, предположим сначала, что в рассматриваемой области
1 Г'
выполняется уравнение A0.2). Это означает, что подозрительная
на оптимальность траектория, которая начинается в точке Р —
= (х, X), оканчивается в точке Q, расположенной на верхней
5 10. Решение двух элементарных задач о быстродействии 353
полуокружности круга Г. Тогда знаменатель в выражении A0.4)
можно интерпретировать,. с точностью до знака, как удвоенную
площадь рассмотренного выше треугольцика PWOS. Эта площадь
равна площади конгруэнтного треугольника OSQ*Q* и обращается
в нуль тогда и только тогда, когда точка Q* лежит на оси х,
т. е. когда а = 0. Значит, рассматриваемый знаменатель имеет
постоянный знак; положив Р = й*, получим, что если область
расположена ниже множества Г' + Г + Г", то он положителен,
поскольку тогда Т равно п—а-|-02, а этот угол расположен
между 0 и я, и поскольку Х = 0, —(х—us) > 0. Если же область
расположена выше множества Г'+Г + Г", то все остается в силе,
так как рассматриваемое выражение не обращается в нуль на Г'.
Площадь треугольника PWOS остается положительной и даже
постоянной, когда точка Р движется по своей дуге к точке Q*\
отсюда по непрерывности получаем, что циклический порядок
вершин не изменяется и, значит, этот треугольник собственно
конгруэнтен (т. е. получается только переносом и вращением,
без симметрии) соответствующему треугольнику, в котором точка Р
совпадает с Q*, а значит, и треугольнику OSQ*Q*. В частности,
если отрезок PW горизонтален, то, поскольку соответствующая
сторона треугольника OSQ*Q* тоже горизонтальна, сторона POS
параллельна стороне Q*OS, а значит, совпадает с ней, т. е. точка Р
лежит на Г'. Отсюда сразу получаем, что знаменатель sin (Г—X),
который равен нулю тогда и только тогда, когда сторона PW
горизонтальна, может равняться нулю только в случае, когда
точка Р лежит на дуге Г'. Легко видеть также, что этот знаме-
знаменатель меняет знак, когда точка Р пересекает дугу Г', причем
ниже Г' он положителен. Так как величина (us—и) тоже меняет
знак, то g^O.
Аналогично можно вывести, что это последнее утверждение
справедливо и для областей, в которых выполняется уравнение
A0.3). Далее, g=0 только тогда, когда u = us или когда (х, X)
лежит на дуге Г' + Г".
Теперь можно рассуждать так же, как в задаче (А), с одним
небольшим изменением: функция нравна нулю на Г' + Г" и рав-
равна + оо или не определена на траекториях а = 0, а = —я.
Последний факт может внести некоторые неудобства. Но если мы
рассмотрим на любой траектории С, соответствующей допусти-
допустимому управлению u(t), функцию
где с—постоянная, то получим, что вдоль С
Взяв c = us, мы видим, что если X имеет такой же знак, как
12
354 Вступление. Что такое задачи оптимального управления
s Q^ и, следовательно, траектория С если и может
пересекать окружность Q= const, то только наружу. В част-
частности, эта траектория может только так пересекать круговые
дуги траекторий, соответствующих а = 0 или а = п. Следовательно,
эти дуги образуют односторонние барьеры. Точно так же, если
взять с = ю, где©—координата х центра некоторой полуокружности
из Г' или из Г", то оказывается, что эта дуга не только образует
односторонний барьер, но также и что траектория С может
касаться ее только в том случае, когда Х = 0 или и=с=±1;
однако последний случай следует исключить, если R^O; если
же R = 0, то он имеет место только на последней дуге подозри-
подозрительной на оптимальность траектории а = 0 или а = — п.
Отсюда следует, что траекторию С можно разложить на
конечное число дуг, каждая из которых является либо дугой
подозрительной на оптимальность траектории, либо дугой, цели-
целиком лежащей во внутренности одной из наших областей, кроме,
может быть, своих концов. На любой такой дуге разность зна--
чений величины t-\-T равна интегралу от gn, значит, она ^0;
складывая, получим, что эта разность ^0 на всей траектории С.
Беря траекторию С оканчивающейся на окружности круга Г,
получаем, что Т — оптимальное время.
Глава I
Наивная теория оптимального управления
§ 11
Введение
Мы будем называть «наивными» те разделы вариационного
исчисления и теории оптимального управления, которые обхо-
обходятся лишь необходимыми условиями, не подкрепляя их сколь-
сколько-нибудь общими теоремами существования. В принципе на
этом пути неизбежно столкновение с парадоксом Перрона, и
потому к полученным так результатам приходится относиться
как к эвристическим, если только не дополнить их, как это
было в примерах, рассмотренных во вступлении к этому тому,
прямым доказательством того, что они приводят к искомым
решениям. Этот принципиальный недостаток иногда затушевы-
затушевывается аналогией со случаем дискретных задач. В вариационном
исчислении эта аналогия была главным источником серьезных
ошибок, поскольку она не учитывает отсутствия компактности.
В оптимальном управлении идеям, которые мы называем
наивными, понадобилось довольно много времени, чтобы изба-
избавиться от путаницы, порожденной ошибкой Лагранжа. В насто-
настоящее время эти идеи группируются вокруг принципа максимума
Понтрягина или его многочисленных вариантов и аналогов, пред-
предложенных Валентайном, Хестенсом и Мак-Шейном или же Белл-
маном, Куном — Таккером и другими. Не так давно были
предложены, например, абстрактные формулировки Гамкрелидзе
и Нейштадта, а также «теория максимина» в книге Данскина.
Характеризуя все эти исследования как наивные, мы в то же
время хотели бы напомнить читателю, что такая характеристика
относится и к методике Эйлера и'Лагранжа, имевшей огромное
значение для математического анализа (о чем говорилось во всту-
вступлении к тому I). Кроме того, сейчас тот же эпитет применяют
и к эпохальным идеям Георга Кантора, лежащим в основе так
называемой «наивной теории множеств».
Наивный вариационный подход в задачах оптимального упра-
управления большей частью указывает нам лишь «подозрительные»
объекты. Однако в данной главе мы ограничимся в основном
задачами, в которых эти «подозреваемые» автоматически оказы-
оказываются искомыми единственными решениями. Такое замечатель-
12*
356 Гл- 1- Наивная теория оптимального управления
ное по своей простоте положение дел почти невероятно для ва-
вариационного исчисления. Подобные результаты в гл. V т. I
удалось получить для благоприятной задачи, лишь опираясь на
теорему единственности Каратеодори—Тонелли с ее изящными
деформационными леммами, теорему существования Гильберта и
понятие сопряженных точек. Здесь же, напротив, мы только
приступаем к оптимальному управлению и пока чго располагаем
небогатым арсеналом методов. Разумеется, нам не обойтись без
ограничений: браться за дело в противном случае имеет не боль-
больше смысла, чем подстегивать старую клячу. Эти ограничения
будут довольно серьезными и малоприятными; ясно, что без них
было бы гораздо лучше. И тем не менее, как это ни удивитель-
удивительно, мы сможем решать некоторые типы задач.
Наиболее важным случаем (именно этим случаем мы и ограни-
ограничимся) являются так называемые «линейные» задачи, в которых
дифференциальные уравнения линейны по "фазовым переменным
и управлениям. В собственно вариационном исчислении им.
соответствуют задачи с квадратичным лагранжианом («квадратич-
(«квадратичные» задачи); последние рассматривались в гл. III т. I, во вто-
вторичной теории Якоби. Однако одной линейностью нам здесь не
обойтись. Потребуется еще условие общего положения; если его
не вводить, то в поведении решения обнаруживается какая-то
странность: оно «виляет» подобно старой расхлябанной автома-
автомашине. Хорошо еще, что мы вправе рассчитывать на выполнение
этого условия в большинстве задач. Но и это еще не все: вдоба-
вдобавок мы потребуем, чтобы цель была так называемой точкой
равновесия. Последнее требование никогда в точности не выпол-
выполняется. Тем самым возникает разрыв между тем, что постули-
постулируется математически, и тем, что физически осуществимо, по-
поскольку ни одна реальная физическая цель не может быть мате-
математической точкой. Ну, а если нашей целью является, например,
Луна, то считать ее точкой уж совсем нелепо.
Несмотря на эти неприятные ограничения, задачи формально
все еще остаются довольно сложными, и мы рассмотрим лишь
простейший случай, а именно автономную задачу быстродейст-
быстродействия. Это означает, что коэффициенты наших линейных диффе-
дифференциальных уравнений не зависят от t, т. е. постоянны. Мы
применим наши результаты к нескольким простейшим примерам,
которые можно найти буквально в каждой книге, посвященной
линейным задачам управления с непрерывным временем. Эти
примеры, восходящие к Фельдбауму и Бушоу, опять-таки дос-
достаточно сложны, и их решения лучше всего иллюстрировать
при помощи красивых картинок, которые можно найти в книге
«Оптимальные процессы» и в других источниках и которые по
своей прелести вполне могут соперничать с классическими ри-
рисунками из учебников по гидромеханике.
§ 12. Дискретное время и программирование 357
§ 12
Дискретное время и программирование
В томе I у нас не было необходимости обращаться к элемен-
элементарной теории максимумов и минимумов функций конечного числа
действительных переменных. Однако теперь мы вкратце рассмот-
рассмотрим эти вопросы, в основном для того, чтобы разъяснить читателю
некоторые выражения технического жаргона, которые он может
встретить в литературе, и помочь ему понять их основной смысл.
Для многих из тех, кто занимается сейчас оптимальным управ-
управлением, исходным пунктом были задачи вычислительной матема-
математики, техники, экономики и других областей, в которых время
измеряется в целых единицах. Этими единицами могут быть мил-
миллионные доли секунды, а могут быть месяцы или даже годы.
Например, в задаче о капиталовложениях можно предположить,
что дивиденды выплачиваются только раз в год. С другой сто-
стороны, для приближенного решения повседневных задач оптималь-
оптимального управления, в которых время изменяется непрерывно, часто
используются вычислительные машины с дискретным временем.
Типичную задачу оптимального управления с дискретным вре-
временем можно получить из нашей основной задачи оптимального
управления, если воспользоваться очевидной дискретной интер-
интерпретацией производной и интеграла. Для этого нужно заменить
производную x(t) разностью x(t + 1) — x(t), где t принимает
только целые значения, а интеграл от функции F (t) заменить
суммой значений этой функции для соответствующего множест-
множества целых t.
Формальное сходство между дискретной задачей и соответст-
соответствующей задачей с непрерывным временем часто служит поводом
для рассуждений по аналогии и применения выводов, полученных
для дискретной модели, к аналогичным задачам с непрерывным
временем. Точно так же и в собственно вариационном исчисле-
исчислении Эйлер и Лагранж без колебаний использовали рассуждения
по аналогии, основываясь на теории максимумов и минимумов
функций конечного числа действительных переменных. Такая
аналогия была бы вполне оправданной, если бы задачи с непре-
непрерывным временем обладали теми же свойствами компактности,
что и дискретные задачи. К сожалению, как мы уже объяснили
в § 4 вступления к этому тому, на это рассчитывать не приходит-
приходится, во всяком случае в рассматриваемой здесь наивной постановке.
Поэтому рассуждения по аналогии могут ввести нас в заблуж-
заблуждение так же, как это произошло с Эйлером и Лагранжем. Для
реабилитации этих рассуждений нам понадобится обобщенная
теория, подобная той, которую мы построили в гл. VI т. I.
Описанную выше дискретную задачу теперь обычно называют
задачей «динамического программирования». Легко видеть, что
358 Гл- I- Наивная теория оптимального управления
она является задачей минимизации функции конечного числа пере-
переменных при наличии ограничений типа равенств и неравенств. Спе-
Специалисты-прикладники называют такую задачу «задачей про-
программирования»1' или просто «программой», хотя, несомненно,
в будущем эти термины будут менее узкими и охватят также
и более общие дискретные задачи (как, например, задачу о ми-
нимаксе). Конечно, задача о нахождении максимума является
задачей динамического программирования, так как она превратит-
превратится в задачу о минимуме, если изменить знак функции, но задача
о минимаксе является более общей.
Здесь мы не будем рассматривать специальные приемы, которые
обычно применяются в динамическом программировании, а
только прокомментируем те методы, которые использовались по
аналогии для задач с непрерывным временем. Здесь достаточно
сослаться на «Оптимальные процессы», где приводится исчерпы-
исчерпывающая критика подобных методов. Условия, полученные этим
путем, не являются ни необходимыми, ни достаточными, и они
подразумевают наличие такой гладкости, которая на практике
никогда не имеет места. Вот пример опасной обманчивости таких
аналогий.
Более общие задачи программирования сравнительно мало
отличаются от классических задач Эйлера—Лагранжа о нахожде-
нахождении минимумов функций конечного числа действительных пере-
переменных при наличии ограничений. Разница состоит в том, что
кроме (или вместо) ограничений типа равенств вводятся огра-
ограничения-неравенства. Соответствующая модификация вариацион-
вариационной задачи Лагранжа с ограничениями, а также правило мно-
множителей Лагранжа для этой модифицированной задачи были
получены Валентайном около 30 лет назад. Ясно также, что
Лагранж и его последователи хорошо понимали, какие изменения
повлечет за собой введение ограничений типа неравенств. В самом
деле, Лагранж применял свой метод множителей и к задачам
статики, для которых эти множители можно интерпретировать
как силы реакции связей (описываемых ограничениями). В этом
случае единственное различие, появляющееся из-за ограничения-
неравенства g (х) ^ 0, состоит в том, что для точек х, в которых
g{x)=0, сила реакции направлена наружу и, следовательно,
отвечающий этому ограничению множитель должен иметь соответст-
соответствующий знак. Конечно, в точке, где g(x)<0, это ограничение не
порождает никакой силы реакции.
Во вступлении к этому тому мы отметили, что вариационный
метод множителей Лагранжа не учитывает таких явлений, как
11 Конечно, термин «программирование» не выглядит здесь особенно удач-
ньм. Однако в сочетании с прилагательными «линейное», «выпуклое», «дина-
«динамическое» он закрепился довольно прочно. — Прим. ред.
§ 12. Дискретное время и программирование 359
жесткость и аномалия. В действительности соответствующие за-
затруднения при решении задач статикиЛи отыскании минимумов
функций конечного чцсла действительных переменных известны
с классических времен. Они возникают в переопределенных за-
задачах о равновесии (например, для стола, имеющего более трех
ножек). В таких случаях силы реакции связей неопределимы.
В задачах программирования такие возможности обычно исклю-
исключаются (так же, как и в задачах статики) посредством специаль-
специального допущения о природе ограничений. Мы опишем его ниже:
в том случае, когда оно выполняется, говорят об ограничениях
кунотаккеровского типа.
Основная задача программирования состоит в нахождении
минимума функции f(x) на множестве Gf)H точек «-мерного ев-
евклидова пространства, где G—множество точек л:, удовлетворя-
удовлетворяющих т неравенствам gj(x)^0, а Н—множество точек х,
удовлетворяющих р равенствам Ау-(х) = 0; здесь £=1, 2 т,
/" = 1, 2, ..., р. Пусть jeo€Gn//; предположим, что функции
g, упорядочены так, что g( (х„) = 0 для £ = 1, 2, ...,mougl (х0) < О
для t=mo + l, mn + 2, ..., т. Тогда говорят, что в точке х0
ограничения будут кунотаккеровского типа1', если функции /, gh
hj непрерывно дифференцируемы в точке х0 и, кроме того, гра-
градиенты функций hf, /'=1, 2 р, и тех функций gh для ко-
которых 1 = 1, 2, ..., та, линейно независимы.
Незначительная модификация результата, который можно най-
найти (с доказательством или без) в учебниках по дифференциаль-
дифференциальному исчислению, приводит к следующему утверждению:
A2.1) Элементарное правило множителей. Пусть функция f дос-
достигает локального минимума в G П Н при х -х0, и пусть ограни-
ограничения в х0 принадлежат кунотаккеровскому типу. Тогда су-
существуют действительные числа цл KJt i=\, 2, ..., т, /=1,
2, .... р, называемые множителями, удовлетворяющие соот-
соотношениям
{г,->0, £ = 1, 2, .... /л0; fi, = 0, £ > то,
и такие, что функция
fix, и, а.)=/ (*) + 2 n/ft (*) + 2 Vv (x)
имеет в точке х0 равный нулю градиент по х.
Здесь мы не будем доказывать это правило, так как оно нам
не понадобится. Но мы уверены, что в будущем это доказа-
доказательство непременно будет приводиться в учебниках математиче-
математического анализа. В настоящее же время трудно найти книгу, в
11 В оригинале: Kuhn-Tucker constraint qualification. Иногда в этой ситу-
ситуации говорят, что ограничения удовлетворяют условию регулярности.—Прим.
ред.
3(jO Гл. I. Наивная теория оптимального управления
которой рассматривается дискретная теория управления или про-
программирование1' и в которой не приводится доказательство это-
этого правила.
Возможно, более интересным, чем само правило, которое в конце
концов есть лишь необходимое условие для задачи минимизации
при наличии ограничений, является исследование некоторых слу-
случаев, в которых оно является одновременно и достаточным услови-
условием, притом не только для локального минимума, но и для гло-
глобального. Следующий результат также можно найти во многих
книгах:
A2.2) Частичное обращение элементарного правила множите-
множителей. Откажемся от условий теоремы A2.1) и допустим, что выполня-
выполняются ее заключения. Далее, предположим, что функции f, g{ выпуклы,
а функции hf линейны. Тогда функция f достигает своего минимума
на множестве Gf)H в точке х = х0.
Это обратное утверждение доказывается совсем тривиально.
В точке х0 мы имеем f=f, а так как f^.f на множестве Gf)H,
то отсюда следует справедливость нашего утверждения.
Таким образом, при некоторых естественных предположениях
мы располагаем довольно простыми необходимыми и достаточными
условиями минимума для задачи программирования, а следователь-
следовательно, в частности, и для дискретного аналога нашей задачи опти-
оптимального управления. Более того, создается впечатление, что
достаточность доказывается тривиально.
Такое, казалось бы, идеальное состояние дел обладает всего
одним недостатком: те, кто после изучения дискретных задач обра-
обращаются к задачам оптимального управления, оказываются непод-
неподготовленными к совершенно новой обстановке, в которой значение
необходимых условий иллюзорно и самыми важными являются
вопросы о существовании решения и достаточных условиях. Та-
Таким образом, аналогия с дискретными задачами и на этот раз
вводит в заблуждение.
Методы, опирающиеся на теоремы A2.1) и A2.2), имеют еще
одно слабое место, которое обнаруживается при попытках пере-
перенести их на задачи с непрерывным временем. Ограничения куно-
таккеровского типа исключают возможность появления жесткости
или аномалии не только на рассматриваемых траекториях, но
также и на кусках этих траекторий. А на практике жесткость и
аномалия встречаются во многих даже простейших задачах, и одно
из основных преимуществ принципа максимума состоит в том, что
он не исключает эти случаи. Например, в задаче об осцилляторе
из § 10 вступления к этому тому полное исследование невозможно
11 См. примечание на стр. 358.—Прим. ред.
§ 13. Замечания о линейных дифференциальных уравнениях 361
без рассмотрения аномальных траекторий, которые касаются цели
в своих конечных точках.
Правило множителей A2.1) основано на идеях, восходящих
к Эйлеру и Лагранжу. Что же касается идей, лежащих в основе
принципа максимума, то они являются продуктом более чем сто-
столетней эволюции, о чем мы уже отчасти говорили во вступлении
к этому тому. Именно с этого принципа мы и начнем построение
нашей наивной теории.
§ 13
Некоторые замечания о линейных дифференциальных уравнениях
Мы сочли нужным пополнить здесь те немногие сведения из
теории дифференциальных уравнений, знание которых подразуме-
подразумевается у читателя. Мы уже дважды касались этой теории: первый
раз в § 19 гл. I т. I и второй раз в § 28 гл. II того же тома.
Однако теперь наши замечания будут более непосредственно от-
относиться к свойствам решений и притом только линейных диффе-
дифференциальных уравнений. Мы будем применять их только к урав-
уравнениям с постоянными коэффициентами, но удобнее рассмотреть
здесь и более общий случай, когда коэффициенты зависят от
времени.
В дальнейшем иам будет удобно пользоваться языком и обра-
образами га-мерной геометрии. Их не всегда легко себе представить,
и к тому же мы будем пользоваться своими собственными обо-
обозначениями, так что читателю довольно часто придется возвра-
возвращаться к определениям. Однако основные факты, которые мы
здесь приводим, довольно простые, и лучше всего, если, изучая
этот параграф, читатель перепишет его в той форме, которую
он предпочитает. Да и вообще это хороший способ для изучения
чего бы то ни было в математике.
В этом параграфе рассматриваются векторы га-мерного про-
пространства, зависящие от t. Скалярное произведение двух векторов
vlt v.2 обозначается (vlt u2); оно также зависит от t. Обозначим
через А фиксированную пх га-матрицу, элементами которой яв-
являются достаточное число раз непрерывно дифференцируемые
функции от t, а через Л*— матрицу, которая получается из А
транспонированием строк и столбцов. В этом параграфе опреде-
определения в основном будут относиться к фиксированной матрице Л
или к транспонированной матрице Л*.
Символы ф, -ф употребляются для обозначения векторов, удов-
удовлетворяющих дифференциальным уравнениям
A3.1) (а) <р=ЛФ, (b) ip=—Л*ф,
причем предполагается, что вектор i|> не равен тождественно нулю.
Через Y обозначим (п—1)-мерное подпространство, зависящее
362 Гл. I. Наивная теория оптимального управления
от t и состоящее из векторов га-мерного пространства, ортогональ-
ортогональных К 1|).
Непрерывно дифференцируемым подпространством назовем соб-
собственное подпространство га-мерного пространства (тоже зависящее
от t), точками которого являются линейные комбинации системы
непрерывно дифференцируемых векторов. Если такое подпрост-
подпространство является (га— 1)-мерным для всех значений t, то обозначим
его через П. Будем писать и^П и говорить, что вектор v лежит
в подпространстве П, если он лежит в П при каждом t.
Подпространство П назовем ковариантным, если для каждого
непрерывно дифференцируемого вектора и£П
A3.2) I—Av£l\.
A3.3) Критерий ковариантности. Подпространство П ковари-
антно тогда и только тогда, когда оно совпадает с. некоторым
подпространством Ч*", а это имеет место тогда и только тогда,
когда оно состоит из векторов вида
где ak—скаляры, зависящие от t, а {<рА}—система изп—1 линейно
независимых решений уравнения A3.1) (а), ортогональных к вектору
\р при некотором t = t0.
Доказательство. Покажем сначала, что любое подпространство
Ч*" ковариантно. В самом деле, для дифференцируемого вектора
О = (d/dt) (v, i|>) = (v, q) — (v, Л*-ф) = (v-Av, i|>),
следовательно, у—Лу^Чг. Чтобы получить A3.4), отметим сна-
сначала, что для любого ф имеет место равенство
A3.5) 4i <ф- *)= (Лф' *> ~(ф> А*^ = °«
а значит, если соотношение (ф, -ф) = 0 справедливо при t = t0, то
оно справедливо и при всех t, т.е. ф^Ч*". Следовательно, для
п—1 линейно независимых векторов фй мы имеем ФйбЧ1". так что
подпространство W должно состоять из векторов вида A3.4).
Обратно, если векторы фл выбраны так, что они ортогональны
к ^ при t = t0, то система векторов A3.4) образует подпрост-
подпространство V.
Наконец, если П — ковариантное подпространство, а т1} —
1} Мы надеемся, что буква от («пи скорописное») вместо обычного л, как
в английском издании, реализует здесь неосуществленное намерение автора,
о котором он говорит в своем примечании, добавляя при этом, что в остальных
ыестах книги л имеет свой обычный смысл. — Прим. ред.
§ 13. Замечания о линейных дифференциальных уравнениях ЗбЗ
нормальный к нему единичный вектор, то для дифференцируемого
вектора уg П
(у, от) + (у, ™)=~u (v, от) = О,
0 = (у—Av, от) = — (у, го)—(Лу, от) = — (у, от + Л"от),
а значит, вектор от + Л*от ортогонален к каждому дифференци-
дифференцируемому вектору у ^ П. Следовательно, этот вектор ортогонален
к подпространству П и потому отличается от нормального вектора
от только скалярным множителем q. Подберем скаляр X так, чтобы
^- (Хот) + Л "Хот = (X + ql) от = 0.
Тогда вектор Хот равен некоторому \f, и поэтому П совпадает
с соответствующим У. Таким образом, утверждение A3.3) доказано.
Если при t=tl вектор у принадлежит подпространству W
(наполним, что оба эти объекта зависят от t), то мы будем го-
говорить, что вектор у пересекает ¥ при t — tu и будем обозначать
это следующим образом:
Вообще, если дано положительное целое число k, то мы будем
говорить, что у имеет при t = tl пересечение порядка k с под-
подпространством W или касание порядка (k — 1) с этим подпрост-
подпространством, и писать
если вектор у дифференцируем k—1 раз по t и скалярное про-
произведение (у, \р) вместе со своими производными по t до порядка
k—1 равно нулю при t = tt. Введем обозначение
где Т—множество, состоящее из значений ta, которым соответ-
соответствуют положительные целые числа ka(^l), такие, что
Будем говорить, что п—1 раз дифференцируемый вектор у,
зависящий от t, является вектором общего положения, если не
существует такого значения t0 переменной / и такого подпрост-
подпространства V, для которых вектор v имеет пересечение порядка п
с подпространством Ч*" при t = t0.
A3.6) Критерий общего положения. Для того чтобы п—1 раз
дифференцируемый вектор v являлся вектором общего положения,
364 Гл. I. Наивная теория оптимального управления
необходимо и достаточно, чтобы для каждого t0 значения векторов
A3.7) Dг~A)"v (* = 0, 1, ..- п-1)
при t = t0 были линейно независимы.
Доказательство. Для каждого вектора г|з
так как при k — 1 это равенство очевидно, а по индукции легко
находим, что оно справедливо и при любом k. Теперь для того,
чтобы доказать A3.6), достаточно заметить, что линейная зави-
зависимость векторов A3.7) при t = t0 эквивалентна тому, что они
одновременно ортогональны начальному значению при t = t0 не-
некоторого вектора -ф.
A3.8) Теорема об изолированных пересечениях. ЕслиТ—огра-
ЕслиТ—ограниченное бесконечное множество значений переменной t, то соот-
соотношение v € (Г) W1} не может выполняться для векторов v общего
положения.
Доказательство. Предположим противное. Тогда из множества
Т можно выбрать последовательность значений tv, имеющую пре-
предел t*. Для этой последовательности /v, а значит, и для I* имеет
место равенство (v, rp) — O. Между любыми двумя значениями tv
находится нуль производной (djdt)(v, г))), так что ввиду непре-
непрерывности последняя равна нулю при t = t*. Аналогично, при t — t*
последовательные производные порядков 0, 1, ..., п—1 тоже
равны нулю и, следовательно, v не является вектором общего
положения.
A3.9) Более тонкий результат в частном случае. Пусть А —
постоянная матрица с действительными собственными числами,
a v—постоянный вектор. Тогда соотношение yg"G'Lr не может
выполняться ни для какого множества Т, если не выполняется
соотношение v£W, т. е. если скалярное произведение (v, i|>) не
равно тождественно нулю.
Доказательство. Матрицу А можно преобразовать в вырожден-
вырожденную, заменив А матрицей А = А—X/ и \р—вектором if = \$еи, где
X—собственное число матрицы А, а /—единичная матрица, и за-
заметив, что
1} Согласно определению, следовало бы написать v£°° (ГI?.—Прим. ред.
§ 14. Подозрительные на оптимальность решения $65
Отсюда следует, что наше утверждение справедливо при п=\.
Предположим, что оно справедливо, когда вместо п стоит п — 1.
Так как теперь матрица А сырожденна, то существует посто.
янный единичный вектор а, такой, что аА* = 0, следователь^
aty ——aA*ty = 0. Повернув оси, можно предположить, что направ-
направление вектора а совпадает с направлением оси л^. Обозначим
через v и А соответственно (п—1)-мерный вектор и (п—1)Х
Х(п—1)-матрицу, полученные из v и А вычеркиванием первой
компоненты и первых строки и столбца. Теперь вектор г|> лежит
в (п—1)-мерном подпространстве, ортогональном к оси xlt и мы
имеем
Далее, выражение (v, i]5) = (i', г|з), рассматриваемое как функция
от /, имеет по крайней мере п—1 нулей (каждый из которых
считается столько раз, какова его кратность), так как это выра-
выражение равно производной от (v, i|>). По предположению индукции,
это выражение равно тождественно нулю, значит, скалярное про-
произведение {v, г|>) равно постоянной, а тогда очевидно, что оно
равно нулю.
§ 14
Подозрительные на оптимальность решения
в простейшей задаче об оптимальном быстродействии
Рассмотрим в n-мерном пространстве материальную точку,
положение которой x(t) описывается линейным дифференциальным
уравнением с постоянными матричными коэффициентами
A4.1) х=Ах + Ви,
где А и В—соответственно пхп- и пхr-матрицы, а и есть г-мер-
ный вектор со значениями в выпуклом многограннике г-мерного
пространства, содержащем начало; этот многогранник обозначим
через U. Наша задача заключается в нахождении кусочно-непре-
кусочно-непрерывно дифференцируемого управления u(t), переводящего за
кратчайшее время эту точку из заданного начального положения
х0 в цель, которая состоит из одной точки — начала в х-про-
странстве.
В качестве цели можно было бы взять вместо начала любую
точку равновесия, т. е. любую точку хи для которой существует
траектория, вырождающаяся в эту точку для всех t. Это равно-
равносильно существованию точки ut^U, такой, что Ах1-\-Ви1 = О;
следовательно, снова обозначив х—xlt и — их через х, и и сдви-
сдвинув U так, чтобы точка ых совпала с началом, мы преобразуем
366 Гл- I- Наивная теория оптимального управления
эту задачу в задачу, для которой целью является начало в х-про-
странстве. Наши результаты останутся справедливыми и в том
случае, когда А, В—достаточно хорошие матричные функции
от /, a U—любая выпуклая фигура, необязательно многогран-
многогранник. Незначительные изменения, которые требуются в этом слу-
случае, указаны в «Оптимальных процессах».
В дальнейшем мы потребуем, чтобы выполнялось условие
общего положения, которое заключается в следующем: каждый
вектор v, имеющий вид Bw, где w—направление одного из ребер
многогранника U, является вектором общего положения. Это
условие относится только к конечному числу векторов v, и на
практике всегда можно добиться его выполнения, слегка повернув
многогранник, если это потребуется. Но все-таки оно существенно
ограничивает наш метод. В соответствии с критерием A3.6) из
предыдущего параграфа это условие можно сформулировать сле-
следующим образом: для каждого такого направления w векторы
A4.2) Bw, ABw An~lBw
линейно независимы. Вскоре мы увидим, для чего понадобилось
это условие.
Что касается предположения о кусочно-непрерывной диффе-
ренцируемости управления u(t), то оно является естественным
для наивной теории, так как решения действительно оказываются
именно такими, а в данный момент нас не волнуют вопросы
существования и компактности. Однако, само собой разумеется,
что эти требования можно ослабить. Для линейных задач, которые,
собственно говоря, являются квадратичными вариационными зада-
задачами, естественно рассматривать управления как элементы про-
пространства функций, интегрируемых с квадратом, и именно такие
управления используются в «Оптимальных процессах». Но мы
предпочитаем не связывать пока себя подобными обязательствами,
ибо в данный момент мы рассматриваем, и притом довольно бегло,
только задачу весьма частного вида, тогда как в «Оптимальных
процессах» к соответствующему моменту уже доказана теорема су-
существования, использующая аппарат гильбертовых пространств.
Вряд ли стоит вдаваться в подробности, если задача содержит
столь неприятные ограничения.
Перейдем к изучению наших «подозреваемых».
Согласно определению, подозрительное на оптимальность
решение, т. е. пара, состоящая из подозреваемой траектории x(t)
и соответствующего подозреваемого управления u{t), удовлетво-
удовлетворяет принципу максимума. А последний утверждает, что сущест-
существует не обращающееся в нуль решение y = ^{t) сопряженного
дифференциального уравнения
A4.3) У = — А'у,
^ 14. Подозрительные на оптимальность решения 367
где А*—матрица, полученная транспонированием матрицы А,
такое, что выражение
Н(х, у, и) = (у, Ах'Ц-Ви)
достигает своего максимума по и при x = x{t), y — ty(t), когда
u = u(t). (Здесь мы пользуемся введенным раньше обозначением
скалярного произведения двух векторов, a t—любая точка рас-
рассматриваемого интервала времени.) Кроме того, должны выпол-
выполняться следующие граничные условия: в начальный момент вре-
времени, который мы обозначим через tOl вектор x(t) должен при-
принимать значение х0, а в конечный момент времени, который мы
условились считать равным нулю, во-первых, должно быть
x(t) =0, а во-вторых, должно выполняться условие трансверсаль-
трансверсальности по t, согласно которому Я^О для аргументов (х, у, и) =
= @, ij) @), и @)). (Это последнее условие можно проверить в любой
момент времени t вместо конечного момента * = 0, поскольку,
как мы уже отметили во вступлении к этому тому, из принципа
максимума вытекает, что Я постоянно на любом подозрительном
на оптимальность решении.)
Прежде чем идти дальше, нужно удостовериться, что подо-
подозрительные на оптимальность решения удовлетворяют требуемым
условиям, т. е. что u(t)—кусочно-непрерывно дифференцируемые
функции. В действительности мы найдем даже, что u(t) — кусочно-
постоянные. Момент времени, в который у подозрительного на
оптимальность решения «(/) терпит разрыв, назовем моментом
переключения управления.
Заметим, что для любого фиксированного / выражение
H(x(t), я|>@> ") достигает максимума относительно и, когда
скалярное произведение (т|з (t), Ви) максимально, а так как послед-
последнее линейно по и, то оно достигает максимума в некоторой вер-
вершине многогранника U. Оно достигает максимума только в этой
вершине, если ни на одном из проходящих через нее ребер наше
скалярное произведение не равно постоянной; в противном случае
путем вычитания находим, что направление w такого ребра
удовлетворяет соотношению
A4.4)
Согласно теореме A3.8), последнее соотношение может выпол-
выполняться только для конечного множества Т значений t, лежащих
между tf0 и 0, так как Bw—вектор общего положения. Ввиду
непрерывности ij), подмножество из дополнения к Т, на котором
максимум по и достигается в одной и той же вершине, относи-
относительно замкнуто. Значит, выражение H(x(t), $(*)> и) достигает
максимума только в одной такой вершине, когда t принадлежит
связной компоненте дополнения множества Т, так что все моменты
переключения лежат в Т.
368 Гл. I. Наивная теория оптимального управления
Если матрица А имеет только действительные характеристи-
характеристические числа, то из A3.9) следует, что решение имеет не более
п—1 моментов переключения, в которые значение управления u(t)
перескакивает с одной вершины многогранника U на другую и
в которые ребро, соединяющее эти две вершины, имеет фиксиро-
фиксированное направление хю. Значит, общее число переключений не пре-
превышает произведения (п—1) на число непараллельных ребер
многогранника U. В частности, если U — куб, то число переклю-
переключений не превосходит г- (п— 1). Но в общем случае для матриц А
с действительными собственными числами такая оценка числа
переключений оказывается весьма завышенной, а более тонкие
оценки неизвестны.
§ 15
Единственность и оптимальность
Перейдем теперь к рассмотрению отношений между решениями,
подозрительными на оптимальность, и настоящими решениями.
Для этого нам понадобится следующая лемма:
A5.1) Лемма. Пусть u(t)—управление, подозрительное на оп-
оптимальность, a u(t)—произвольное управление, такие, что оба
они переводят нашу материальную точку из начального положе-
положения х0 в момент tB в начало в момент t = 0. Тогда управление
и (t) совпадает с и (t) почти всюду в интервале t0^. t^.0.
Доказательство. Обозначим через v(t), v(t) соответственно вы-
выражения Bu(t), Bu(t), а через G—матрицу G(t) размера пхп,
которая равна единичной матрице при t = tB и удовлетворяет
сопряженному дифференциальному уравнению
A5.2) G= — GA.
Далее, через G* обозначим матрицу G*(t), которая тоже равна
единичной матрице при t = t0 и удовлетворяет дифференциальному
уравнению G* = AG*. Тогда матрица GG* равна единичной матрице
при t = t0 и имеет производную
GG* + GG* = (— GA) G* + G (AG*) = 0.
Отсюда следует, что G* является обратной матрицей G~l для С
Любое векторное решение ф уравнения ф = Лф можно предста-
представить в виде G*xB, где xo = q(to), и мы будем считать, что урав-
уравнение A4.1) получено из уравнения для ф путем добавления
возмущения Ви, которое мы обозначили через v. Используя клас-
классический метод вариации постоянных, решение уравнения A4.1)
§ 15. Единственность и оптимальность 369
можно записать в виде
где
Если последнее уравнение умножить на G, то оно примет вид
| = Gy, и для решения уравнения A4.1) мы получаем следующее
выражение:
t
A5.3) x = G-l4 xB + \Gvdt
'о
В нашей лемме мы предположили, что концы двух рассмат-
рассматриваемых траекторий совпадают не только в пространстве, но и во
времени. Применив к каждой из этих траекторий уравнение A5.3)
при * = 0, приходим (умножая на G и вычитая х0) к равенству
о о
Умножив скалярно обе части на постоянный вектор ул и вспомнив,
что любая вектор-функция y = ^(t), удовлетворяющая уравнению
A4.3), имеет вид y = y0G, где yo = ip{to), мы найдем, что
о
A5.4) \\yv[t)~yi(t))dt=O.
Но, поскольку u(t) удовлетворяет принципу максимума, в ка-
качестве вектора у можно взять сопряженный вектор вдоль траек-
траектории x(t), так чтобы для x(t), y(t) функция Н (х, у, и) достигала
своего максимума по и при и = u(t). Тогда подинтегральное вы-
выражение в A5.4), которое можно записать в виде разности
H(x.y.u(t))-H(x,y, tt(t)),
будет неотрицательным для x(t), y(t) и, следовательно, будет
равно 0 почти всюду. Далее, на множестве значений /, для ко-
которых эта разность равна нулю, а и{г)Фи{г), максимум функции
Н по и достигается не в одной точке, т. е. для этих значений /
справедливо соотношение A4.4) из предыдущего параграфа, а это
возможно только для конечного множества значений /. Следова-
Следовательно, u(t) — u(t) почти всюду, что и требовалось доказать.
A5.5) Теорема. Пусть u(t)—подозрительное на оптимальность
управление, которое переводит нашу материальную точку из
начального положения х„ в момент /0 в начало в момент t = О,
и предположим, что соответствующая функция x(t), которая
370 Гл- '• Наивная теория оптимального управления
определяет траекторию движения нашей материальной точки,
не равна постоянной ни на каком интервале времени, оканчиваю-
оканчивающемся при t = 0, т. е. что завершающая дуга траектории не вы-
вырождается в одну точку—начало координат. Тогда u(t)—опти-
u(t)—оптимальное управление, причем единственное, которое осуществляет
указанный переход.
В этой формулировке подразумевается, что мы отождествляем
два управления, которые различаются только на множестве меры
О рассматриваемого интервала времени. Далее, заметим, что если
начало в «-пространстве не совпадает с одной из вершин много-
многогранника U, то не нужно специально исключать случай, когда
завершающая дуга траектории вырождается в начало х-прост-
ранства.
Доказательство теоремы A5.5). Пусть u(t), t(l^t^t1, где
*!<С0,— любое управление, которое переводит нашу материаль-.
ную точку из х0 в начало за время, равное или меньшее времени,
которое требуется для управления u(t). Положив u(t) = 0 при
t1 < t ^ 0, мы получим управление, которое осуществляет указан-
указанный переход за такое же время, как и управление и (t). Согласно
лемме A5.1), u(t) = u(t) почти всюду, и, значит, ^ = 0.
Аналогично, в случае, который мы исключили, все траектории, соединя-
соединяющие х„ с 0, совпадают всюду, кроме завершающих дуг, вырождающихся в точку.
Более подробное исследование линейных задач читатель может
найти в «Оптимальных процессах», где рассматриваются как
вопросы существования решений, так и «синтез» оптимальных
управлений1(.
§ 16
Двумерные задачи: моменты переключений
и основные конструкции
В остальных параграфах этой главы мы исследуем случай,
когда А, В—невырожденные 2х2-матрицы, а V — параллелограмм
с центром в начале. (Если матрица В вырожденна, то можно
управлять системой посредством одного параметра, а примеры
таких задач мы рассмотрели во вступлении к этому тому.) Кроме
того, для простоты будем предполагать, что собственные числа
матрицы А имеют отрицательные действительные части. Это озна-
означает, что при u(t) = O траектории приближаются к началу при
больших t; в таком случае мы говорим, что система устойчива.
11 Еще подробнее линейные задачи исследованы в книге В. Г. Болтян-
Болтянского «Математические методы оптимального управления», «Наука», М.,
1969. — Прим. перев.
§ 16. Двумерные задачи 371
Собственные числа могут быть как действительными, так и ком-
комплексными.
Выбирая подходящим образом едитщу времени, можно счи-
считать, что эти собственные числа равны либо A,±i (если они ком-
комплексные), либо А., А,— 1 (если они действительные), где X < 0.
При помощи элементарной замены координат, указанной в «Опти-
«Оптимальных процессах», которая определяется аффинными преобра-
преобразованиями на плоскостях х и и, можно заменить матрицу В
единичной матрицей, а матрицу А—одной из матриц
A6.1) (а) (\ -J); (Ь)
В этих матрицах X < 0, и мы должны еще потребовать, чтобы
они удовлетворяли условию общего положения. Как выяснится
ниже, это условие существенно только в случае (Ь) и не выпол-
выполняется только тогда, когда после наших аффинных преобразо-
преобразований параллелограмм U имеет сторону, параллельную одной
из координатных осей. Согласно теореме A5.5), для полного
и однозначного решения нашей задачи при таких предположе-
предположениях нужно только найти подозрительное на оптимальность
управление, которое переводит заданную точку хв в начало.
Мы будем пользоваться комплексными числами для обозначения
векторов на плоскости.
Согласно принципу максимума, для определения подозритель-
подозрительных на оптимальность управлений и траекторий нужно сначала
решить сопряженное уравнение у =— А*у, где А*—матрица,
полученная транспонированием матрицы (а) или (Ь) из A6.1).
Решение имеет вид у = се~иГ], где
1) = е'<'+а> или т) = cos а + ie* sin а
в зависимости от того, имеем ли мы случай (а) или (Ь); здесь
а, с—постоянные интегрирования, причем с>0. Теперь нужно
определить, когда вектор у направлен ортогонально сторонам
параллелограмма U, т. е. найти значения t, для которых и (t)
переключается с одной вершины на другую. Это проще всего
сделать, определив соответствующие пересечения кривых r\(t),
— оо < tf^O, с прямыми 1Х, /„, проходящими через начало и пер-
перпендикулярными сторонам параллелограмма U. В случае (а)
кривые т) описывают против часовой стрелки единичную окруж-
окружность, и пересечения имеют место для четырех множеств перио-
периодических значений времени t (с периодом 2я); в случае (Ь) кри-
кривые ц—вертикальные отрезки, соединяющие горизонтальный
диаметр единичного круга с его окружностью, причем они на-
направлены вверх в верхней половине круга и вниз—в его нижней
половине; таким образом, в случае (Ь), если прямые llt /2 лежат
в разных квадрантах, а кривая г\ не очень коротка, то она имеет
572
Гл. I. Наивная теория оптимального управления
одно пересечение с этими прямыми, а если /lt /2 лежат в одной
и той же паре квадрантов (как показано на нашем втором ри-
рисунке), то некоторые кривые т| имеют по два пересечения с этими
Пересечения прямых /(, /2 с кривыми г\ в слу-
случаях (а) и (Ь), когда /х, /2 расположены в раз-
разных парах квадрантов.
прямыми, а другие—по одному или вообще не имеют. Далее
отметим, что в случае (Ь) кривые т), вырождающиеся в точки
Л = ±1, а также две кривые tj, расположенные соответственно
на верхней и нижней половинах мнимой оси, могли бы целиком
уместиться на одной из прямых 11У /а, если бы мы не предполо-
Соответствующий рисунок, когда эти прямые
расположены в одной и той же паре квадрантов.
жили, что стороны параллелограмма U не параллельны осям-
координат. Однако мы заранее исключили этот случай, введя-
^ 16. Двумерные задачи 373
условие общего положения, и легко видеть, что это единственная
оговорка, которую нужно сделать.
Для простоты предположим, что пряйая lt расположена в пер-
первом и третьем квадрантах. Этим мы не нарушим общности. Кроме
того, обозначим через aft(£=l, ..., 4) угловые секторы, на ко-
которые пара прямых 1и /а делит плоскость, и используем те же
символы для обозначения соответствующих углов. Далее, обозна-
обозначим через uk(k=l, ..., 4) вершины параллелограмма II. Для
определенности индексы выбраны так, чтобы при движении про-
против часовой стрелки вокруг начала от действительной оси мы
последовательно переходили из сектора at в сектор а9, пересе-
пересекая /lt затем из аа в а3, пересекая /2, и т. д. (как показано на
рисунке). Кроме того, ик—это вершина параллелограмма U в сек-
секторе ак для каждого k. Заметим, что, когда кривая r}(t) нахо-
находится в секторе ак, управление u(t) вдоль нашей подозрительной
на оптимальность траектории принимает значение ик.
Временем пребывания в вершине ик или в секторе ак назовем
промежуток между двумя последовательными переключениями,
в течение которого u(t) = uk или, что то же самое, кривая r\(t)
находится в секторе ак. В случае (а) время пребывания равно ак,
т. е. мере самого угла, и не зависит от момента времени и места,
в которых произошло первое из переключений. В случае (Ь) время
пребывания имеет смысл рассматривать только в том случае,
когда прямые llt /а лежат в одной и той же паре квадрантов;
можно считать, что этот термин относится к пребыванию в аа.
Вычислим соответствующее время т. Для этого обозначим через
t* и ** + т начальный и конечный моменты времени пребывания,
374
Гл. 1. Наивная теория оптимального управления
а через у1г у2—углы, образованные прямыми 1Х, /2 с действи-
действительной осью. Так как точка ц (t) лежит на 1г при t = t* и на /а
при * = /* + т, то
следовательно, x = log(tg<y2/tgYi). так что время пребывания
опять не зависит от момента времени и места, в которых про-
произошло первое из переключений.
Теперь нам нужно вычислить траектории. Для этого обозначим
через хк(k— 1 4) вершины —А~хик параллелограмма, полу-
полученного из U посредством аффинного преобразования и—*х,
заданного уравнением Ах + и = 0, т. е. х = — А'1 и. Тогда траекто-
траектории, соответствующие управлению u(t) = uk, удовлетворяют урав-
уравнению
Их можно получить из соответствующих решений уравнения х= Ах',
т. е. из кривых x = <p(t), путем переноса начала в точку хк.
W
Кривые «р в случае (а) при а= 1.
Кривые ф в случае (Ь) при а— 1.
Кривые ф(£) имеют вид a#-%(t), где £ определяется аналогично
т) выражениями
g(*) = e<-«+P) или I (t) = cos p + ie~f sin p,
в зависимости от того, имеем ли мы случай (а) или (Ь); здесь
а и р — постоянные интегрирования, причем а > 0, если cp(f) —
нетривиальное решение. На рисунках изображены кривые ф для
— <»<*<+оо в случае, когда а = \. Общий случай можно
§ 17. Исследование случая (а) 375
получить из этого умножением на а. Начало достигается при
t= -f-oo. Заметим, что кривые £ и рассмотренные выше кривые х\
совпадают, только в случае (Ь) движение "по | происходит в обрат-
обратном направлении. Кривые ф получаются умножением на мно-
множитель ае*', который деформирует их, направляя к началу.
Мы должны соединить кривые, получаемые посредством соот-
соответствующих переносов найденных кривых ф, когда начало
поочередно сдвигается в соответст-
вующую вершину хк.
Для этого, так же как в приме-
примерах, изученных во вступлении к этому
тому, будем двигаться от цели вдоль
рассматриваемых траекторий в обрат- Ск
ном направлении. Согласно § 14, каж-
каждая из этих траекторий должна со-
содержать завершающую дугу, на
которой управление не переключается. Эта завершающая дуга
может лежать на одной из четырех траекторий, соответствующих
одному из четырех управлений и (t) = ик. На такой траектории,
оканчивающейся в начале, обозначим через Ск ту часть (если
таковая существует), которая может быть завершающей дугой
подозрительной на оптимальность траектории, а через С#—под-
С#—подмножество (если оно существует) дуги Ск, на котором управле-
управление могло переключиться на вершину uk с вершины щ. Теперь
из точки подмножества Си мы можем двигаться в обратном на-
направлении вдоль траектории, проходящей через эту точку, на
которой u(t) — uh и т. д. Заметим, что на этой новой дуге место
предьщущего переключения (если оно существует) полностью опре-
определяется временем пребывания в вершине щ. В дальнейшем мы
увидим, что переключение должно происходить на довольно про-
простом множестве, которое получается аффинным преобразованием
подмножества Сы-
§ 17
Исследование случая (а)
В этом случае дуга Ск, k — \, ..., 4, получается параллель-
параллельным переносом на величину —хк дуги ц>(г), —о^^^^О, той
из кривых ф, которая оканчивается при / = 0 в точке ф @) = хк.
Выбирая х, можно добиться того, что переключение в вершину ик
произойдет в любой точке дуги Ck, но при этом только из верши-
вершины «Л_г (Если k = 1, то под k— 1 мы подразумеваем k— 1 (mod 4),
т. е. 4.) Пусть далее х—любая точка дуги Ск. Обозначим че-
через х предыдущее переключение на траектории, проходящей через
х и соответствующей управлению ик-г, а через ?, t-\-x—моменты
времени, в которые наша материальная точка проходит соответ-
376 Г*' I- Наивная теория оптимального управления
ственно через х н х, двигаясь вдоль этой траектории. Тогда при
соответствующем выборе постоянных а, р*
а для разности х—хк_1 справедливо аналогичное выражение,
в котором t заменено на t-\-х. Следовательно,
Кроме того, т—это время пребывания в ак_г, одинаковое для всех
точек xgCft. Значит, множество точек, в которых происходят
переключения, непосредственно предшествующие переключениям
на дуге Ск, можно получить из Ск растяжением в е~Хх раз и
поворотом на угол —т с центром в хк_х, где х = ак_1. Далее,
начальная точка этого множества, очевидно, совпадает с конеч-
конечной точкой дуги Ск-Х.
Получая таким способом последовательные образы четырех
кривых Ск и соединяя их, мы построим четыре кривые, которые
содержат все возможные точки переключений. Эти кривые не
могут пересекаться, так как мы не имеем кратных переключений.
Они стремятся к бесконечности, так как составляющие их дуги
получаются из соответствующих предшествующих дуг растяже-
растяжением с коэффициентом е~*т > 1. Следовательно, эти четыре траек-
траектории делят плоскость на четыре неограниченные области, в каж-
каждой из которых управление u(t) остается постоянным на наших
подозрительных траекториях.
Иначе говоря, мы теперь можем заменить u(t) соответствую-
соответствующей функцией и(х), которая принимает только четыре значения
ик, й=1, , 4. А это есть решение так называемой задачи син-
синтеза.
Кроме того, мы видим, что построенные таким образом подо-
подозрительные на оптимальность траектории покрывают всю плос-
плоскость, ибо наша конструкция может быть выполнена непрерывной
деформацией дуг Ch в их последовательные образы. Отсюда ввиду
теоремы A5.5) автоматически следует, что наша задача решена,
причем решение единственно для каждого начального положения
ха. Все эти построения, а также аналогичные построения в слу-
случае (Ь), иллюстрируются красивыми рисунками в «Оптимальных
процессах»1'. В связи с этим читатель может заметить, что окон-
окончательную диаграмму, содержащую кривые оптимального управ-
управления, покрывающие плоскость, можно получить очень просто.
Для этого области, ограниченные парами кривых переключения
на подходящем куске простейшей картинки, изображающей кри-
кривые ф, нужно перенести на соответствующие расстояния, а затем
!> Мы сочли возможным дополнить перевод книги Янга несколькими из
этих рисунков.—Прим. ред.
§ 18. Исследование случая (bt) 377
обрезать и склеить с областями в их первоначальных положе-
положениях. Эта конструкция показывает, какую г ользу можно извлечь
из решения задачи синтеза.
Перейдем теперь к рассмотрению случая (Ь), который под-
подразделяется на случай (bj, когда прямые /,, /а лежат в разных
парах квадрантов, и случай (Ь2), когда они лежат в одной и
той же паре квадрантов, а именно в первом и третьем.
§ 18
Исследование случая (Ьх)
Присмотримся к рисункам, на которых изображены кривые т]
и ф. Кривые ф одинаковы в случаях (t^) и (Ь2), но наши по-
построения будут зависеть от положения параллелограмма U, кото-
378 Гл. I. Наивная теория оптимального управления
рое в этих случаях различно. Заметим, что допущение а = I для
кривой ф влияет только на время. Через любую заданную точку,
отличную от начала, проходит только одна кривая ср.
Теперь вспомним определение кривых Ск и их подмножеств
переключения Сы. Каждая кривая Ск является в этом случае
бесконечной дугой, так как в каждом секторе ак имеется по край-
крайней мере одна кривая i\, не выходящая из этого сектора при
всех t^.0. Однако подмножество Сыф§ только при k = 2 или
4 и /=1 или 3, потому что кривая г\, пересекающая одну из
прямых /„ /2, должна начинаться при /=-оо в секторе ах или
а3 и оканчиваться при ^ = 0 в секторе а2 или а4. В дальнейшем
мы увидим, что См совпадает со всей кривой Ск.
Теперь обозначим через Dx и Da области, на которые кри-
кривая C2-\-Ct делит плоскость и которые содержат соответственно
Cj и Cs. Мы решим задачу синтеза, положив и = ы2 на С2, и.= н4
на С4 и и = ии ы = ы3 соответственно в D,, D3. Заметим кстати,
что если каждую из кривых Ск продолжить как траекторию для
положительных значений времени t, то она окончится в соот-
соответствующей вершине хк. Отсюда следует, что области, разделен-
разделенные кривой C2 + Ct, можно различать так: Dx содержит точку х3,
a D3 (по симметрии) содержит точку *,.
Обоснование этого геометрически очевидного утверждения при
помощи вычислений для различных положений и форм парал-
параллелограмма U было бы очень утомительным. Вместо этого мы
воспользуемся теоремой единственности A5.5). Нужно только
показать, что если мы продолжим кривую С, для t > 0, то это
продолжение не пересечет кривые С2 и С4 во второй раз. Допус-
Допустим, что существует второе пересечение. Если оно происходит
при t= +oo, т. е. в самой точке дг„ то, незначительно изменив
положение вершины ult мы получим
О Продолженная заДачУ> Для которой х1 лежит в D,, так
dysctGt что пересечение с С2 или с С4 произой-
произойдет в конечный момент времени t.
Так как в рассматриваемой задаче
время не фигурирует в явном виде, то в
этом последнем случае можно так согла-
согласовать время движения по траектории С„ чтобы при пересечении
С, с С2 или С4 оно совпадало с временем на этих траекториях.
Значит, можно построить следующим образом траекторию С: она
совпадает с продолжением кривой Сг до точки пересечения, а
конечная ее часть совпадает с дугой кривой С2 или С4. Таким
образом, начальная и конечная точки траектории С совпадают
с началом. Но тогда, ввиду теоремы A5.5), траектория С не
может удовлетворять принципу максимума. С другой стороны,
выбрав кривую т] @ так, чтобы она пересекала прямую 1Х или /3
в момент времени t, в который происходит переключение с про-
§ 18. Исследование случая
379
должения кривой С, на кривую С2 или С4, мы получим, что,
согласно предыдущим рассуждениям, траектория С должна удов-
удовлетворять принципу максимума. Это противоречие доказывает
наше утверждение.
Для наших подозрительных на оптимальность траекторий мы
решим задачу синтеза, если положим
на С2> u = ui на С4
Перенесенная
Области Dt
перенесенная
область D&
и и = и1, и — и3 соответственно в Dlt D3. Для того чтобы полу-
получить изображение этих траекторий в областях Dt и D3, нужно
параллельно перенести область Dl на величину —х1У а область
D3—на величину —х3, и тогда эти траектории будут соответст-
соответствующими частями кривых ср.
Здесь существенно то, что окончательная картина, которая
будет получена обратным переносом этих областей, будет пол-
полностью покрыта подозрительными на оптимальность траекториями,
причем подразумевается, что завершающие дуги этих траекторий
лежат на С2 или С4 и, таким образом, оканчиваются в начале.
Следовательно, согласно теореме A5.5), они дают единственное
решение нашей задачи.
Теперь мы приведем другое, аналитическое доказательство
того, что подозрительные на оптимальность траектории покры-
покрывают всю плоскость. Это позволит нам не зависеть столь сильно
от рисунков и отчасти познакомит с методами, которые можно
применять к уравнениям с коэффициентами, зависящими от t, и
случаям большей размерности. С этой целью для любого задан-
380
Гл. I. Наивная теория оптимального управления
ного положительного числа h определим в областях Dt и Da
следующую непрерывную деформацию Г* кривой Сг-]-С^ Пусть
к—любая точка кривой C2 + Ct, a t—соответствующий момент
времени; будем двигаться от точки х в течение времени h вдоль
подозрительной на оптимальность траектории, соответствующей
управлению иг или и3, в обратном направлении, и пусть х*—
точка, в которую мы таким образом попадем, т. е. точка, соот-
соответствующая моменту времени t* = t—h. Множество таких точек
х* в области Dj или D3 обозначим через Г*. Д.г.я того чтобы
показать, что подозрительные на оптимальность траектории по-
покрывают всю область Dt и всю область Ds, достаточно показать,
что при h -*■ оо кривая Г* в каждой из этих областей стремится
к бесконечности, т. е. для любого заданного круга на плоскости
найдется такое значение h0, что для h > h0 кривая Г* лежит
целиком вне этого круга (см. рисунок на стр. 382).
Но это последнее утверждение доказать очень легко. Ведь
кривая Г* получена из C24-Ct очень простым преобразованием Л.
Если мы рассмотрим эту деформацию в области D3, то разность
§ 19. Исследование случая (Ь2)
х—ха будет иметь вид
381
а разность х*—х3 будет определяться аналогичным выражением,
в котором t заменено на t*. Следовательно,
где Л—это матрица (q ен\, умноженная на е~ш. Значит, кривая
Г* получается из кривой Са + С4 аффинным преобразованием, ко-
которое увеличивает обе координаты, и так как для нее началом
является точка х3, лежащая вне D3, то отсюда следует, что Г*
приближается к бесконечности при больших h, что и требовалось
доказать.
§ 19
Исследование случая (Ь2)
Этот случай сложнее предыдущего, так как на одной и той
же траектории могут встретиться два переключения. Согласно
382
Гл. I. Наивная теория оптимального управления
§ 14, два—это максимальное число возможных здесь переклю-
переключений.
Опять присмотримся к рисункам, на которых изображены
кривые г]. В этом случае С1 и С3 будут бесконечными дугами,
поскольку в секторах аг и а3 имеются кривые г\, которые не
выходят из этих секторов в течение
времени от t = — оо до t = 0. Да-
Далее, существуют кривые т|, кото-
которые оканчиваются в секторе ах
или а3 и пересекают обе прямые
lL и /2; эти кривые начинаются со-
соответственно в секторе ая или otlt
и для них время пребывания в
секторе а4 или в секторе а2 равно
введенной выше постоянной т. На-
конец, существуют кривые т|," ко-
I торые оканчиваются в секторе аа
' или а4; они начинаются в секторе
аг или ая, и для них время пребы-
пребывания в а2 или а4 не больше т. (В
х.
самом деле, согласно использованным вы-
выше рассуждениям, это время будет равно
т, если мы продолжим эти кривые для
положительных значений t.) Значит, в
этом случае С2, С4—конечные дуги, со-
соответствующие интервалу времени т»
Далее, легко видеть, что Ckl = Ck при
l — k—1, Ckl = 0 в остальных случаях.
Следовательно, каждая кривая Ск—это
кривая переключения.
Однако имеются еще две кривые пе-
переключения С3, C't. Они состоят из то-
точек, в которых управление на подозри-
подозрительной на оптимальность траектории
переключается из вершины и^ в ы2 или
из вершины и3 в ы4, причем это происхо-
происходит до переключения из ы2в и3 или из ы4
в uL. Кривые С2 и C't тянутся от свобод-
свободС2
можно
А
ных концов соответственно кривых С2
С б И
р
С4 к ч бесконечности. Их
очень просто построить, используя операцию Л, определенную
в случае (bj), только нужно положить й = т. Они будут образами
кривых С3 и Сг при аффинном преобразовании Л с центром со-
соответственно в х3 и xt. В самом деле, чтобы достигнуть точки
на С'2 или С\, нужно двигаться в обратном направлении в тече-
течение времени т вдоль части подозрительной на оптимальность'
§ 19. Исследование случая (Ьг) 383
траектории, которая предшествует ее последнему переключению
на С3 или Сг. Следовательно, здесь можно использовать конст-
конструкцию, аналогичную примененной в случае (bj), только всюду
нужно изменить индексы и вместо h подставить т.
Обозначим через Dlt D2, D3, D4 четыре области, на которые
кривые переключений делят плоскость. Они указаны на рисунке.
Заметим!), что область Dr содержит точки х3, xt, а область Д3 —
точки х13 хг. Задача синтеза будет решена, если мы положим
и = ик в Dk, /г=1, ..., 4. При помощи параллельного переноса
областей Dk на векторы —хк можно получить картину21 подо-
подозрительных на оптимальность траекторий в каждой из этих об-
областей; для этого нужно опять рассмотреть соответствующие части
кривых <р. Таким способом, или используя модификацию рас-
рассуждений в случае (bj, получим, что эти траектории, дополнен-
дополненные завершающими частями кривых Ск, покрывают всю плоскость.
Из теоремы A5.5) опять заключаем, что они дают единственное
решение нашей задачи.
11 Доказательство этого утверждения аналогично доказательству соответ-
соответствующего утверждения в случае (bj).
2) Мы предоставляем читателю выполнить эти рисунки самостоятельно.
|И помещаем иа стр. 380—381 для облегчения его участи «шпаргалку», за-
заимствованную из «Оптимальных процессов».— Прим. редш]
Глава II
Применение стандартных методов
вариационного исчисления
к задачам оптимального управления
§ 20
Введение
После наивной теории, которая и сейчас еще служит предме-
предметом исследований в оптимальном управлении, следующая ступень
отвечает тем вариационным методам, с которыми мы познакомили
читателя в главе I тома I. Это стандартные методы вариацион-
вариационного исчисления, надежный рабочий инструмент для решения
задач, без обиняков направленный на получение доброкачествен-
доброкачественных достаточных условий. Основу этих методов составляют гео-
геодезические покрытия областей, инвариантный интеграл Гильберта
и формула Вейерштрасса. Пока еще, однако, они не используют
более тонкие понятия, такие, как сопряженные точки, индексы
Морса и обобщенные кривые и потоки. В теории оптимального
управления эти методы эффективно применяются впервые. Настоя-
Настоящая глава содержит ранее не публиковавшийся материал, в основу
которого легли работы, выпущенные только в виде отчета Центра
математических исследований1).
Очень важно для теории оптимального управления, что мы
располагаем методами, которые действительно работают на прак-
практике. Этого по существу нельзя сказать о наивных методах. Если
ограничиться линейным случаем предыдущей главы, то область
их применимости оказывается слишком узкой, а попытки рас-
расширить эту область наталкиваются на парадокс Перрона. В ре-
результате мы вынуждены либо налагать ограничения, которые,
если говорить честно, никогда не выполняются, либо вводить
предположения о существовании решения, которые на наивном
уровне невозможно проверить. Иногда заявляют, будто эти пред-
предположения либо очевидны из физических соображений, либо оп-
оправдываются a posteriori согласием полученных на их основе
результатов с тем, чего по каким-то соображениям можно было
ожидать. С точки зрения логики это ничем не лучше утвержде-
утверждения средневековых клерикалов, что Земля является неподвижным „
плоским диском.
Итак, нам явно не хватает стандартной теории. Ее методы,
как отмечалось в томе I, фактически восходят еще к исследова-
11 Отчет MRC № 654, подготовленный при совместной поддержке Центра
математических исследований армии США, НАСА и Национального научного
фонда.
§ 20. Введение 385
ниям Гюйгенса по оптике в связи с принципом наименьшего вре-
времени (принципом Ферма). К сожалению, в ходе развития вариа-
вариационного исчисления в них постепенно -проникли классические
предположения об очень гладких взаимно однозначных покрытиях.
В оптимальном управлении эти предположения не выполняются,
и мы от них освободимся. Это будет в некотором смысле ближе
по духу к тем задачам оптики, с которых все началось, особенно
если учесть, что в данной главе мы ограничимся задачами быстро-
быстродействия. Plus ca change, plus c'est la meme chose1'.
В теории оптимального управления (точно так же, как и в
собственно вариационном исчислении) стандартные методы сво-
сводятся в значительной степени к формализации той процедуры,
которая используется при решении ряда частных задач. Здесь
такими задачами будут главным образом те, которые были рас-
рассмотрены во вступлении к данному тому; однако нам придется
призвать на помощь воображение и попытаться отчетливо пред-
представить себе гораздо более общие случаи, о которых мы будем
постоянно помнить, проводя такую формализацию. По той же
причине мы будем вести рассмотрение в самых общих предполо-
предположениях, чтобы впоследствии иметь возможность перейти к обоб-
обобщенному случаю. Мы совсем не будем конкретизировать природу
пространства управлений; значениями управления будут просто
какие-то величины, обозначаемые через и, a t и х, как и прежде,
будут обозначать соответственно время и текущую евклидову
точку. Кроме того, в отличие от щедрых предположений о дву-
двукратной (или более) непрерывной дифференцируемости, встре-
встречавшихся в нашем классическом варианте стандартных методов,
в настоящей главе ни одна из функций не будет предполагаться
более чем один раз непрерывно дифференцируемой. Функцию
будем называть гладкой, если она непрерывно дифференцируема;
множество будем называть гладким, если оно определяется не-
неравенствами типа /(х)^0, где соответствующие функции f яв-
являются гладкими, а их число конечно. Впрочем, в большинстве
подобного рода предположений будет идти речь лишь о частич-
частичной, кусочной или локальной формах гладкости, а некоторые
весьма важные величины даже не будут предполагаться непре-
непрерывными.
Мы ограничимся автономным случаем задачи о быстродей-
быстродействии. Требуется найти траекторию, которая обеспечивает пере-
перемещение точки из заданного начального состояния к заданной
цели за наименьшее время. Цель может представлять собой либо
точку, либо локально гладкое множество точек, не обязательно
связное. В этой задаче вполне возможна ситуация, когда началь-
*> Чем больше изменений, тем ближе к тому, что было в самом начале
(франц. пословица).
13 Л", 1274
386 Гл. II. Применение стандартных методов вариационного исчисления
ные положения, из которых вообще возможно попасть в цель,
образуют некоторое множество R, которое не обязано представ-
представлять собой все пространство вокруг цели или быть областью.
В сравнительно простых случаях R имеет меньшую размерность,
а иногда может иметь даже более сложную структуру. Не ис-
исключено, что R может состоять из двух конических кусков с
общей вершиной. Простое покрытие такого мно-
множества семейством траекторий, концы которых
лежат в разных кусках, очевидно, невозможно.
Именно поэтому мы должны освободить стан-
стандартные вариационные методы от классических
ограничений.
Между прочим, случай, когда R состоит из
двух конических кусков, не так уж далек от
того, что встречается на практике в простейшем
варианте задачи о попадании в Луну, когда мож-
можно управлять только начальными условиями.
В этом случае, как утверждают астрономы,
космический аппарат, чтобы достичь Луны,
обязан пройти через некоторую совсем маленькую область фазо-
фазового пространства. В случае многоступенчатой ракеты мы рас-
располагаем большей свободой, но и тогда ситуация примерно такая
же, и это обстоятельство объясняет ряд промахов.
Во всяком случае, читатель должен понимать, что общность
определений и методов этой главы в значительной степени дик-
диктуется практическими соображениями. И тем не менее наша тео-
теория все же не столь общая, как нам sjoro бы хотелось, даже
применительно к автономной задаче о быстродействии; в ней при-
присутствует нежелательное условие, которому должны удовлетво-
удовлетворять сопряженные переменные. Условие подобного типа, судя по
опыту буквально всех, кто работает в этой области, по-видимому,
неизбежно появляется в теории достаточных условий. Именно
такое условие когда-то испортило метод множителей Лагранжа,
а в дискретном случае ему соответствует предположение о ку-
нотаккеровском типе ограничений. Оно не фигурирует в принципе
максимума, но ведь принцип максимума не обеспечивает доста-
достаточности. Почти наверняка распространение стандартного клас-
классического метода на задачи со связями невозможно без подобного
условия. Вообще говоря, расширение некоторой теории в одном
направлении часто обусловливает ограничение в другом—за него,
так сказать, приходится платить.
Нам здесь предстоит иметь дело с расширением теории в трех
направлениях: мы ослабим предположения о гладкости, откажемся
от взаимно однозначного покрытия областей и будем учитывать
связи. Первое вынудит нас отказаться от некоторых удовольствий,
второе потребует упорной работы, ну а третье внесет уже явные
§ 21. Траектории и трассы 357
неудобства и заставит нас в каждом отдельном случае специально
обсуждать соответствующее ограничение на сопряженные пере-
переменные. Такова та цена, которую нам придется платить.
§ 21
Траектории и трассы
Обозначим через g(x, и) гладкую функцию от х, зависящую
как-то от управления и (можно считать и просто меткой, при-
присвоенной различным функциям). Далее, назовем допустимым
управлением функцию и (/), определенную на рассматриваемом
интервале времени и принадлежащую произвольному наперед
заданному классу таких функций со значениями в пространстве
управлений. Допустимой траекторией, соответствующей некото-
некоторому допустимому управлению u(t), назовем абсолютно непре-
непрерывную функцию x(t), определенную на том же интервале вре-
времени и принимающую значения в ^-пространстве, такую, что
пара х (/), и (t) удовлетворяет дифференциальному уравнению
B1.1) x = g(x, и)
для почти всех значений t. Для удобства будем предполагать,
что конечной точкой рассматриваемого интервала времени яв-
является / = 0, а соответствующее конечное значение х@) лежит
на заданном множестве, которое мы назовем целью. Как мы уже
объяснили в предыдущем параграфе, цель будет достаточно эле-
элементарной фигурой без внутренних точек.
Так как x(t)—абсолютно непрерывная функция, то ее произ-
производная х измерима по t. На практике это требование сокращает
класс используемых управлений u(t) и возможных функций
g(x, и), но не нужно вводить эти ограничения явно.
Наша задача состоит в том, чтобы определить, если это воз-
возможно, кратчайшее время перемещения из заданного положения
в цель вдоль допустимых траекторий. Мы хотим показать, как
можно приспособить стандартные вариационные методы для ре-
решения этой задачи, обобщив их ценой некоторых ограничений.
Для классической задачи, в которой всюду выполнялось ус-
условие Вейерштрасса, стандартный метод геодезических покры-
покрытий, описанный в гл. I т. I, состоял в нахождении взаимноодно-
взаимнооднозначного покрытия односвязной области семейством кривых,
удовлетворяющих условию точности. Там же мы провели довольно
полный анализ этого условия, предположив достаточно высокую
степень гладкости рассматриваемых величин. При этом мы выяс-
выяснили, что кривыми покрытия должны быть экстремали, на кото-
которых скобки Лагранжа обращаются в нуль в начальных точках.
Обобщение этой части рассуждений, по всей вероятности, не
имеет смысла, когда ослаблены предположения о гладкости, как
13*
388 Гл. II. Применение стандартных методов вариационного исчисления
это должно быть в задачах оптимального управления. Но такое
обобщение нам и не понадобится: ведь мы ищем не необходи-
необходимые, а достаточные условия, которые будут работать на практике.
Доказательство необходимых условий—это роскошь. Мы зай-
займемся достаточностью. Тогда в классической задаче, предполагая
с самого начала, что рассматриваемое семейство состоит из эк-
экстремалей, удовлетворяющих указанному начальному условию об-
обращения в нуль скобок Лагранжа, мы не много теряем в общности.
Аналогично в рассматриваемой здесь задаче оптимального
быстродействия мы отказываемся от каких-либо претензий на
необходимость. Мы ограничиваемся рассмотрением семейства тра-
траекторий, которые подозреваем (причем довольно произвольно и
без достаточных улик) в том, что они дают решение нашей за-
задачи, т. е. переводят точку из начального положения к цели
за кратчайшее время. Эти подозрительные на оптимальность тра-
траектории назовем трассами1*1. Совокупность этих трасс заменит
семейство кривых, рассматривавшееся в классической постановке.
Утверждение классической теоремы, согласно которому это семей-
семейство должно состоять только из экстремалей, превращается теперь
в исходное предположение, которое следует объединить с усло-
условием Вейерштрасса и условием трансверсальности. Аналогом всех
этих условий является принцип максимума. Поэтому мы не будем
подозревать все допустимые траектории без разбора, а только
те из них, которые удовлетворяют этому принципу; итак, каждая
трасса должна удовлетворять принципу максимума. Мы сформу-
сформулировали лишь одно из предположений; это даже не определение,
так как трасса должна будет удовлетворять еще» и дополнитель-
дополнительным условиям.
Первое из этих дополнительных условий состоит в несколько
произвольном усилении принципа максимума; оно и является тем
неприятным ограничением, о котором мы упоминали в предыду-
предыдущем параграфе. Усиленный принцип максимума формулируется
следующим образом: вдоль трассы x(t), соответствующей управ-
управлению u(t), существует сопряженная вектор-функция y(t), абсо-
абсолютно непрерывная по t и принимающая значения в простран-
пространстве, изоморфном х-пространству, такая, что
{ (a) y(t)=-y{t)gx[x(t). "(О]".
(b) y(t)g[x(t), u]<| 1 для всех и, причем
равенство имеет место при u = u(t);
(c) при t = 0 вектор y(t) направлен по
нормали к цели в точке x(t)\
k (d) y(t)=£O для всех t.
*> lines of flight. Терминология автора в этой главе особенно нестаидартна,
и при переводе пришлось изобретать не слишком экстравагантно звучащие тер-
термины.—Прим. ред.
B1.2)
§ 21. Траектории и трассы 389
Условия B1.2) отличаются от принципа максимума Понтря-
гина только тем, что в B1.2) (Ь) в правой части стоит единица
вместо величины Я^О, не зависящей от t. Заменяя Н единицей,
т. е. величину у/Н величиной у, мы не изменяем наши траекто-
траектории, а только исключаем те из них, на которых Н = 0. Значит,
такое усиление принципа максимума равносильно требованию,
чтобы И не обращалась в нуль. Поскольку гамильтониан Ж,
который в этом случае равен ул + Н, обращается в нуль на тра-
траекториях, удовлетворяющих принципу максимума, из этого тре-
требования следует, что у0ф0. Но в соответствии с § 8 из вступ-
вступления к этому тому у0 =—к0; следовательно, предполагая, что
Н Ф О или что И — 1, мы фактически требуем, чтобы к„ — 1. В этом
случае L имеет вид L-\-k(x—g), т. е. множители оказываются
такими же, как и в первоначальном правиле Лагранжа. В ди-
дискретном случае это соотвегствует предположению о кунотакке-
ровском типе ограничений. Мы уже отметили, что такое правило
множителей неверно, если оно формулируется как необходимое
условие. Но сделанное ограничение не помешает нам при полу-
получении достаточных условий, и в течение долгого времени специа-
специалисты по вариационному исчислению единодушно считали, что
нет никакой надежды получить достаточные условия без этого
ограничения. Ведь если мы допустим, что # = 0, т. е. ио = О,
то наши уравнения не изменятся при замене лагранжиана L
другим лагранжианом, например —L, так что любой вывод,
полученный для одной такой задачи, будет справедлив для лю-
любой другой задачи с теми же ограничениями.
Соображения, по которым мы налагаем на подозреваемые тра-
траектории дополнительное условие И Ф 0, на языке судейской канце-
канцелярии выглядели бы так: «На основании полученной информации»
(принципа максимума) подозрение пало на определенные траекто-
траектории. Однако в некоторых из этих случаев основания для подо-
подозрения кажутся весьма спорными. В детективных романах усерд-
усердствующий полисмен, который старается упрятать за решетку
каждую подозрительную личность, арестует, конечно, всех, чье
поведение привлекло его бдительное око, и, в частности, всех
необычных людей, таких, как поэты, математики и шахматисты.
Если один из этих, как правило, невинных индивидуумов будет
введен для допроса, то смущенный судья рассыпется в извине-
извинениях. Впрочем, в детективных романах главным злодеем часто
оказывается именно такой, на первый взгляд безобидный чело-
человек.
В оптимальном управлении траектория, на которой # = 0,
является просто необычной траекторией, удовлетворяющей огра-
ограничениям. Но одно это не может быть веской причиной для подо-
подозрения, так как лагранжиан здесь вообще не принимает участия.
Гем не менее может оказаться, что эта траектория является
390 Гл. II. Применение стандартных методов вариационного исчисления
искомым решением. Именно с такой ситуацией мы столкнулись
в примере (а) из § 4 вступления к этому тому, который иллю-
иллюстрировал свойство жесткости. Аналогично обстоит дело при спе-
специальных начальных условиях и в задаче об осцилляторе из § 10,
где Н обращается в нуль на двух решениях, которые касаются
цели. Так же как в этой задаче, любое такое необычное реше-
решение требует специального исследования. Для того чтобы не упу-
упустить такие решения, мы позднее будем называть определяемые
сейчас трассы стандартными и будем добавлять к ним, если со-
сочтем нужным, некоторые нестандартные трассы, на которых Я = 0.
Но пока мы будем предполагать, что подходящий класс тра-
траекторий выделен и что элементы этого класса удовлетворяют
усиленному принципу максимума. Эти элементы будем называть
трассами. В классе, которому они принадлежат, должны выпол-
выполняться также дополнительные условия, которые мы сформули-
сформулируем в свое время.
Трассе x(t), как правило, будет соответствовать вполне опре-
определенное допустимое управление u(t), и для краткости мы будем
говорить о трассе
*(/), u(t).
Здесь t изменяется на соответствующем интервале времени, окан-
оканчивающемся при /=0. Далее, канонической трассой будем назы-
называть тройку функций
x(t), y(t), u(t),
таких, что x(t), u(t) определяют трассу, a y(t)—соответствую-
y(t)—соответствующая сопряженная вектор-функция, удовлетворяющая условиям
B1.2). Дугой трассы или дугой канонической трассы будем назы-
называть открытую дугу.
Заметим, что, вообще говоря, сопряженная функция y(t) не
определяется однозначно трассой x(t), u(t)\ она может зависеть
от дополнительных параметров jj, которыми могут быть, напри-
например, начальные или конечные условия. Таким образом, трасса
(или дуга трассы) в общем случае является проекцией целого
семейства канонических трасс (или дуг канонических трасс), ко-
которое зависит от дополнительных параметров р. Это один из основ-
основных фактов, которые мы должны учитывать при рассуждениях.
Отметим, что, когда трассы сливаются или расходятся, то же
самое происходит и с множествами значений параметров р.
С практической точки зрения, которой постоянно следует при-
придерживаться при построении стандартной теории, наши рассуж-
рассуждения нужно было бы начать с отыскания всех траекторий,
оканчивающихся в заданной цели и удовлетворяющих принципу
максимума. Это в точности совпадает с процедурой, которую мы
применили при наивном подходе, а также в каждом из рассмот-
§ 22. Условие синхронизации, стандартная проекция 391
ренных примеров. Из полученных таким образом траекторий мы
затем исключим, по крайней мере временно, те траектории, на
которых Я —0, и выберем те, которые'мы хотим назвать трас-
трассами, наложив на них дополнительные условия, которые будут
описаны в следующих параграфах.
До сих пор в этом томе нам не приходилось пользоваться
такой процедурой выбора. Но мы были вынуждены сделать нечто
подобное во вступлении к тому I, в задачах о брахистохроне
и минимальной поверхности вращения.
§ 22
Условие синхронизации, стандартная проекция
и представительное отображение
До сих пор при выборе трасс мы ограничивались только
одним условием: это должны были быть траектории, удовлетво-
удовлетворяющие усиленному принципу максимума. В собственно вариа-
вариационном исчислении такой выбор соответствует рассмотрению
семейства экстремалей, удовлетворяющих условиям трансверсаль-
трансверсальности в конечных точках. В томе I, как в примерах из вступ-
вступления, так и в теории сопряженных точек, построенной в главе III,
мы обнаружили, что следует наложить дополнительное ограни-
ограничение на это семейство: оно должно давать взаимно однозначное
покрытие области. В теории оптимального управления даже для
простейших задач, которые мы до сих пор изучали, такое огра-
ограничение совершенно неприемлемо. Мы должны заменить его дру-
другими, которые выполняются на практике.
Наиболее очевидным дополнительным условием, позволяющим
сократить класс траекторий, которые мы хотим назвать трассами,
является следующее: из двух траекторий, удовлетворяющих уси-
усиленному принципу максимума и приводящих к цели из одной
и той же начальной точки за различное время, отбросим ту,
которая требует большего времени. На самом деле мы будем
поступать не совсем так, ибо этот путь труден с практической
точки зрения; вместо этого мы просто отбросим одну из этих
двух траекторий. Это означает, что устанавливается следующее пра-
правило синхронизации: если две трассы имеют одинаковые началь-
начальные точки, то они приводят из этой точки к цели за одинако-
одинаковое время. Очевидно, что в этом случае нам потребуются еще
некоторые дополнительные условия. Эти условия формулируются
уже совсем не таким бесхитростным способом; они основаны на
нескольких новых понятиях и теоремах, которые займут боль-
большую часть этой главы.
Пусть дано множество Q* пар q* — (q, с), где q, с—точки
двух евклидовых или, скажем, метрических пространств. Опе-
Операцию проектирования множества Q* на соответствующее мно-
392 Гл. II. Применение стандартных методов вариационного исчисления
жество Q значений q будем называть стандартной проекцией,
если выполняется следующее условие:
Для любой точки ql = {q0, с0) £ Q* и лю-
любой достаточно малой кривой yaQ, кото-
которая начинается в точке q0, существует
B2.1)
непрерывная функция c(q), определенная
на у, такая, что c(q0) = c0 и все точки
вида [q. с {q)] при q £ у лежат в Q*.
Операция проектирования такого типа понадобится нам для
того, чтобы справиться с некоторыми посторонними параметрами р,
которые встречаются при рассмотрении семейства дуг трасс; как
было указано в предыдущем параграфе, эти параметры позволяют
различать соответствующие дуги канонических трасс. Вторжение
этих параметров является одной из причин, по которым наши
теперешние рассуждения столь сильно отличаются от приведён-
приведённых в томе I. Они не дают возможности использовать не только
взаимную однозначность, но также и соответствующее локальное
условие, согласно которому некоторые гладкие отображения, рас-
рассматривавшиеся в томе I, должны были обладать невырожден-
невырожденными матрицами Якоби. Следующее определение поможет нам
избавиться от этих условий.
Огображение / множества Q в множество P = f(Q), где Q, Р
лежат в двух евклидовых или метрических пространствах, будем
называть представительным, если для каждой точки q € Q выпол-
выполняется следующее условие:
Для любой спрямляемой кривой СаР с на-
началом в точке f (q) существует спрямляе-
спрямляемая кривая TczQ с началом в точке q,
B2.2)
такая, что каждая малая дуга кривой С
в точке f(q) является образом при отобра-
отображении f малой дуги кривой Г с началом
в точке q.
Термин «представительное»1' отображение был выбран после не-
некоторого размышления. Он должен отразить тот факт, что неко-
некоторая информация об образе Р позволяет получить соответствую-
соответствующую информацию о прообразе Q. На практике именно для этого
и нужны отображения. Короткий путь на карте должен «пред-
«представлять» по крайней мере один короткий настоящий путь.
Это определение полезно пояснить с двух сторон: во-первых,
рассмотрев эффект, производимый вторжением постороннего пара-
параметра, а во-вторых, построив пример отображения, которое не
является представительным.
*> В оригинале descriptive. —Прим. ред.
§ 23. Пучок трасс
393
Пусть задано множество / точек с, и пусть /•—отображение
прямого произведения Q* = QxI, такое, что для каждой точки
q* — (q, с), где q£Q, eg/, значение" f* (q*) совпадает с f(q).
Здесь с можно назвать посторонним параметром. Далее, предпо-
предположим, что Q, / лежат в евклидовых или метрических прост-
пространствах. Если в этом случае f—представительное отображение,
то легко видеть, что таким будет и /*.
с
с
-> г
Плоскость q.
Плоскость р.
В качестве примера отображения, которое не является пред-
представительным, рассмотрим в комплексной плоскости функцию
(q + l, если Re^<—1,
9 — 1, если Req> — 1,
q—Re^, если —l
Кривая С, пересекающая мнимую ось на плоскости р, соответст-
соответствует кривой Г, пересекающей полосу — l^Re^^ 1-
§ 23
Пучок трасс
В каждом из примеров, изученных до сих пор в этом томе,
мы были в состоянии разложить множество, покрытое трассами,
на подмножества, для которых соответствующие части трасс дают
гладкое покрытие. Поэтому мы начнем с рассмотрения семейства
дуг трасс, удовлетворяющих некоторым условиям гладкости.
Предположим, что на открытом множестве точек а некоторого
евклидова пространства определена пара функций t~ (о), t+(о)
со значениями на расширенной числовой прямой, причем
—оо < t~ (a)< t+ (а)< 0.
Точки а, для которых /~ (а) Ф — оо, должны образовывать откры-
открытое множество, и обе функции должны быть непрерывными, за
394 Гл. //. Применение стандартных методов вариационного исчисления
исключением того, что функция t~ (а) будет разрывной в тех
точках а, где она равна —со. Далее, предположим, что локаль-
локальное ограничение функции t+ (а) на малые отрезки, параллельные
осям а-пространства, является на каждом таком отрезке функ-
функцией ограниченной вариации.
Предположим также, что это открытое множество в прост-
пространстве точек а является проекцией некоторого множества, рас-
расположенного в евклидовом пространстве пар (а, р) более высокой
размерности. Излишне считать это множество открытым; вместо
этого мы предположим, что соответствующая операция проектиро-
проектирования является стандартной в смысле определения предыдущего
параграфа.
Обозначим через S~, S, S+ множества пар (/, а), где а про-
пробегает то же множество, что и выше, а / удовлетворяет соответ-
соответственно условиям
— с» <t-(o) = t, или t~(a) <t <t+ (а), или t = t+(o).
Обозначим через [S] объединение этих трех множеств. Анало-
Аналогично, обозначим через S*~, S*, S*+ множества троек (/, а, р),
где / удовлетворяет одному из указанных условий, а (а, р) при-
принимает такие же значения, как выше. Через [S*] обозначим объе-
объединение трех последних множеств.
Имея все это в виду, рассмотрим семейство 2 дуг трасс с соот-
соответствующими управлениями, заданное посредством функций
*(/, a), u(t, а), (/, o)<tS.
Здесь а—это ярлык, позволяющий различать элементы семейства,
т. е. а постоянно на дуге трассы из 2, а сама эта дуга соответ-
соответствует открытому интервалу времени t~ (а) < / < t+ (а). Далее,
обозначим через 2* семейство дуг канонических трасс, соответст-
соответствующих дугам семейства 2 и получаемых присоединением к ука-
указанным выше функциям дополнительной сопряженной вектор-
функции
y(t,a,p), (/, о, p)gS\
Будем предполагать, что функции x(t, a), y(t, а, р) продолжены
на множества [S], [S*]. Это означает, что они определены также
при t = t+(o) и / = £~(а)>—с» и значения величин х, у в этих
точках соответствуют концам наших дуг. Множества значений
функции x(t, а), отвечающих точкам (/, а) из S~, S, S+, [S],
будем обозначать соответственно через Е~, Е, Е+, [Е], а мно-
множества значений пары x(t, a), y(t, а, р), отвечающих точкам
(/, а, р) из S-, S», S*+, [S*], —через Е*~, Е\ £*+, [£•].
Наконец, когда (/, o)^S и х—точка из Е, достаточно близ-
близкая к x(t, а), мы будем обозначать через
h(t, a), g(x, t, о), gx(x, t, a)
§ 23. Пучок tnpacC
395
выражения
g[x(t, о), u(t, о)], g[x, u(t, a\
gx[x, u(t, о)].
Теперь предположим, что выполняются следующие условия:
' (i) Функция h(t, о) и функция g(x, t, о)
для каждого фиксированного х£Е [когда
(/, о) близко к тем значениям, для кото-
которых x(t, а) принимает значение х] являют-
являются гладкими в множестве S и при х —
—x(t, о) удовлетворяют соотношению
B3.1)
dh_
до
dg(x, t, с)
да
(ii) Функция y(t, о, р) непрерывна в [S1
(iii) Функциях {t, о) является гладкой в [S].
(iv) Отображения S~ —+E~, S—*E, опре-
определенные функцией x(t, о), являются пред-
представительными .
Эти условия вместе с определением функций t~ (о), /+ (о)
и условиями, наложенными на соответствующие множества в про-
пространстве троек (/, о, р), играют основную роль в наших рас-
рассуждениях. Если все эти условия выполнены, то семейство 2
будем называть пучком трасс от Е~ до Е+, а семейство 2*—кано-
2*—каноническим пучком трасс от Е*~ до Е*+. Множество Е~ или Е*~
назовем стартовым множеством или просто стартом, множест-
множество Е+ или £*+—финишным множеством или просто финишем
пучка 2 или 2*, а множество £ или Е*—соответствующим кори-
коридором полета. Пользуясь этой терминологией, не следует забы-
забывать, что некоторые из дуг пучка 2, а именно те, которые стар-
стартуют при t——оо, не начинаются на множестве Е~. Все дуги
пучка 2 оканчиваются на Е+, но начинаются на Е~ только те,
для которых момент старта конечен. Следует также подчеркнуть,
что каждому пучку 2 мы ставим в соответствие определенный
канонический пучок 2*; другими словами, мы проводим фор-
формальное различие между двумя пучками, имеющими одно и то
же семейство дуг трасс, но отвечающими различным семействам
канонических дуг. Мы хотим также отметить, что пучок может
396 Гл. П. Применение стандартных методов вариационного исчисления
быть вырожденным. Например, 2 может состоять из кусков не-
некоторой заданной дуги трассы.
Мы будем пользоваться понятием пучка трасс для тех же
целей, для которых мы пользовались понятием геодезического
покрытия в собственно вариационном исчислении.
§ 24
Инвариантный интеграл Гильберта
Основной инструмент для изучения пучков трасс и в конеч-
конечном счете для доказательства главных результатов этой главы
будет тот же, каким мы пользовались для геодезических покры-
покрытий в томе I, а именно интеграл Гильберта. Остальные пара-
параграфы этой главы будут в основном посвящены доказательству
при некоторых разумных предположениях инвариантности этого
интеграла. Однако теперь он будет сильно отличаться от того
интеграла, с которым мы встречались в собственно вариационном,
исчислении: с формальной точки зрения—это естественный ана-
аналог, а с концептуальной — представитель совсем нового направ-
направления. Подинтегральное выражение включает те же самые вели-
величины, что и раньше, но теперь они многозначны, и это абсолютно
неизбежно при распространении нашего метода на задачи с огра-
ограничениями. Тем самым инвариантность для нашего интеграла
должна быть более сильной; она должна иметь место не только
в том смысле, как это было в томе I, но также и относительно
многозначности. Из всего сказанного очевидно, что основные
затруднения носят концептуальный характер. Мы не просто будем
доказывать результаты, но также и разработаем необходимые
понятия. В современной математике такая ситуация возникает
часто, и от таких трудностей нельзя больше увиливать.
Обозначим через R (по крайней мере на некоторое время)
множество, действительно покрытое нашими трассами. Оно может
быть меньше того множества, которое мы обозначали тем же
символом во введении к этой главе. Далее, для любой точки х £ R
обозначим через Т (х) и назовем временем полета из точки х
длину интервала времени, соответствующего трассе с началом
в точке х. Ввиду условия синхронизации время полета зависит
только от х. Подмножество из R, на котором функция Т (х) огра-
ограничена, будем называть множеством с ограниченным временем
полета1}.
Пусть задано подмножество А из R; множество Л# точек (х, у)
2п-мерного пространства будем называть каноническим множест-
11 Далее, как правило, этот термин будет применяться в том случае, когда
подмножество состоит из точек некоторой кривой. В этом случае говорится
о «кривой с ограниченным временем полета». Не надо думать, что «полета про-
происходит по самой этой кривой! —Прим. ред.
§ 24. Инвариантный интеграл Гильберта 397
вом, соответствующим подмножеству А, если каждая его точка
(х, у) лежит на некоторой канонической трассе, а ее проекция х
лежит в А. Под каноническим множеством Л# с ограниченным
временем полета мы подразумеваем каноническое множество,
соответствующее подмножеству AcR с ограниченным временем
полета. Далее, для x£R обозначим через
&(х)
множество значений сопряженного вектора у, для которых (х, у)
лежит в каноническом множестве /?#, соответствующем R.
Итак, &(х)—это функция, значениями которой при x£R
являются множества. Иначе говоря, это в сущности то самое,
что мы называем многозначной функцией. Но так как аналити-
аналитические операции обычно производятся над однозначными функ-
функциями, то мы будем иметь дело не непосредственно с функцией & (х),
а с некоторой однозначной функцией у(х). Под функцией
мы будем понимать однозначную функцию у (х), определенную
в R, значение которой в каждой точке х лежит в соответствую-
соответствующем множестве £У(х). Можно говорить, что функция у (х) состав-
составляет одну ветвь многозначной функции '& (х). Любую такую ветвь
назовем импульсом в R, а &(х) назовем множеством импульсов
в точке х.
Такое понятие ветви многозначной функции не имеет ничего
общего с соответствующим понятием теории аналитических функ-
функций. Здесь мы не налагаем на у(х) условий гладкости или не-
непрерывности, ни даже какой-нибудь измеримости. Например,
если 2/(х)—постоянное множество, состоящее из двух векто-
векторов ± у0, то ветвями соответствующей многозначной функции
будут всевозможные функции вида е(х)у0, где е(х)—любая функ-
функция, принимающая значения ± 1 или одно из этих значений.
Однако введение столь многочисленных ветвей не внесет в наше
исследование заметных усложнений.
До1я заданного пучка трасс 2 нам понадобится аналогичное,
но более точное обозначение. Пусть символы S, £ и т. д. имеют
тот же смысл, что и в предыдущем параграфе. Длях^ [Е] обо-
обозначим через
множество значений вектора y(t, о, р) в точках (/, a, p)£[S],
в которых x(t, а) принимает заданное значение х. Символом
будем обозначать функцию, определенную в [Е], значения кото-
которой в каждой точке х лежат в соответствующем этой точке мно>
398 Гл. П. Применение стандартных методов вариационного исчисления
жестве 2/s (х). Будем называть 2/2 (х) множеством импульсов
пучка 2 в точке х.
На любой спрямляемой кривой С с ограниченным временем
полета, лежащей в R, определим криволинейный интеграл
B4.1)
для любого импульса в R, такого, что y(x)dx/ds—измеримая
функция длины дуги s вдоль С. Определяемый этим интегралом
функционал в классе кривых С и импульсов у(х), x£R, назовем
интегра-чом Гильберта. Наша задача состоит в том, чтобы вы-
выяснить вопрос о его инвариантности, а для этого в свою очередь
нужны дальнейшие определения и понятия.
Хотя подинтегральное выражение в B4.1) зависит от выбора
импульса у(х), т. е. ветви многозначной функции 2/ (х), x£R,
существует один случай, когда этот выбор не влияет на интеграл
Гильберта. Таковым будет случай, когда компонента вектора
у(х), соответствующая направлению касательной dx.'ds к кривой С,
имеет одинаковое значение для всех таких ветвей. Такому на-
направлению, если оно существует, удобно дать специальное на-
название.
В точке х g R мы назовем направмнием унивалентности такое
направление 6, что все векторы у G 2/ {х) имеют одинаковые про-
проекции «/6 на это направление. Далее, унивамнтной кривой назо-
вем такую спрямляемую кри-
кривую С с R, что почти во всех
ее точках направление каса-
касательной к С является направле-
направлением унивалентности. Наконец,
множеством унивалентности на-
назовем такое подмножество А из
R, что все спрямляемые кривые
С <= А с ограниченным временем
полета являются унивалентны-
ми кривыми.
Например, если для каждого
х £ R все векторы у£&(х) имеют
Направление унивалентности В, соот-
соответствующее множеству 2/, состояще-
состоящему из трех векторов у.
одинаковые проекции на неко-
некоторую плоскость П, то каждая
спрямляемая кривая, располо-
расположенная в П, будет унивалентной кривой, а сама плоскость П
или любое множество, лежащее в параллельной ей плоскости,
будет множеством унивалентности.
Понятие унивалентности имеет прямое отношение к изучению
интеграла Гильберта. Для любой спрямляемой кривой С с огра-
§ 24. Инвариантный интеграл Гильберта
ничейным временем полета, расположенной в множестве унива-
унивалентности А, интеграл Гильберта можно выразить при помощи
длины дуги s вдоль С следующим образом:
где x(s)—параметризация кривой С с длиной дуги в качестве
параметра, а
является почти всюду на С направлением унивалентности в точ-
точке x(s). Этот интеграл не зависит от выбора функции
Далее, подмножество А из R назовем множеством точной
интегрируемости или просто точным множеством, если оно яв-
является множеством унивалентности и, кроме того, для каждой
спрямляемой кривой С с: А с ограниченным на ней временем
полета
для каждой функции у(х)£<&(х), x£R, где xlt xs—начало и
конец кривой С.
Кроме приведенных выше понятий унивалентности и точно-
точности, нам потребуются соответствующие относительные понятия
для пучка Б. Необходимые для этого изменения в определениях
производятся по стандартной схеме. В точке х£[£] мы назовем
направлением относительной унивалентности такое направле-
направление 6, что все векторы у£&ъ (х) имеют одинаковую проекцию yQ
на это направление. Относительно унивалентной кривой назовем
такую спрямляемую кривую С с [£], что почти во всех ее точках
направление касательной к С является направлением относитель-
относительной унивалентности. Множеством относительной унивалентности
назовем подмножество А из [£], такое, что все спрямляемые
кривые С с А с ограниченным временем полета являются отно-
относительно уннвалентными кривыми. Далее, подмножество А из [£]
назовем множеством относительной точной интегрируемости, или
просто относительно точным множеством, если оно является
множеством относительной унивалентности и, кроме того, для
каждой спрямляемой кривой С с: А с ограниченным на ней вре-
временем полета
для каждой функции у(х)^&^(х), х£[Е], где хх, х2—начало и
конец кривой С.
400 Гл. II. Применение стандартных методов вариационного исчисления
Исследование относительной точности будет частично опираться
на более жесткую форму этого же условия. Она получается, если
рассматривать только те кривые С, которые являются образами
кривых в пространстве пар (t, о) при отображении х(/, о), и
только те импульсы, которые имеют вид y(t, о,, р) вдоль этих
кривых. Согласно B1.1) и B1.2) (Ь), в этом случае интеграл
Гильберта принимает вид
yxt dt+yxoda = $ dt + $ yxoda,
г
где Г—кривая в пространстве пар (t, о), образом которой яв-
является С, так что условие относительной точности сводится
к обращению в нуль величины j«/xado или, что то же самое,
к обращению в нуль величины уха. Именно по этой причине по-
последнее условие будет играть значительную роль в дальнейшем.
§ 25
Вспомогательные леммы
В этом параграфе мы будем предполагать, что пучок 2 фик-
фиксирован. Первая лемма частично восполнит недостающие пред-
предположения о функциях Т (х), у (х), а две остальные установят
связь между обращением в нуль величины уха и другими нашими
условиями. Здесь и в остальной части этой главы мы для удоб-
удобства будем обозначать через
импульс у (х) € &ъ (х) при х £ [Е] и будем называть его импуль-
импульсом, относящимся к 2.
B5.1) Лемма. Пусть С—спрямляемая кривая, расположенная
вместе со своими концами в Е~ или Е. Тогда С—кривая с ограни-
ограниченным временем полета, и вдоль нее существует ограниченный
измеримый по Борелю импульс j/s (x), относящийся к 2.
B5.2) Лемма. Если Е+—относительно точное множество, то
ухо обращается в нуль в S*+.
B5.3) Лемма. Если уха обращается в нуль в S*~, то Е~—от-
Е~—относительно точное множество. Если ухо обращается в нуль в S*,
то Е—относительно точное множество.
Доказательство леммы B5.1). Согласно B3.1) (iv), каждой точке
кривой С, включая ее концы, можно сопоставить окрестность
на С, которая является образом кривой Г. На каждой такой
кривой Г мы можем считать время t ограниченным, а тогда из
теоремы Бореля о конечном покрытии следует, что Т(х) ограни-
$ 25. Вспомогательные леммы 401
чено на С. Для доказательства второго утверждения можно счи-
считать кривую С настолько малой, что в,пространстве пар (t, о)
существует соответствующая кривая, которую мы опять обозна-
обозначим через Г; на Г можно выбрать непрерывную и, следовательно,
ограниченную функцию вида y(t, о, р(о)). Теперь каждой точке
х£С поставим в соответствие первую точку (t, о) кривой Г,
в которой x(t, o) = x. Подставив ее в y(t, о, р(о)), мы получим
измеримую по Борелю функцию yz (x) на С, которая будет также
и ограниченной, что и требовалось доказать.
Доказательство леммы B5.2). Пусть Г—малая спрямляемая кри-
кривая в S+, которая получается при / = tf+(o), когда о пробегает
малый отрезок, параллельный одной из осей. Пусть С—образ
кривой Г в Е+, a t/s (х)—импульс, относящийся к Е. Так как
Е+—множество унивалентности и, кроме того, оно является
относительно точным, то обе части равенства
у2 (х) dx = ) yxt dt + yxa da
с г
можно приравнять к разности At значений t+ (о) в концах кри-
кривой Г. Здесь у—это y(t, о, р), а р—непрерывная функция от о,
выбранная должным образом; кроме того, ввиду B1.2) (Ь) и B1.1),
yxt = 1. Следовательно,
yxada = 0.
г
Далее, это соотношение должно выполняться для Г при любом
выборе малого отрезка, параллельного одной из осей о-простран-
ства и проходящего через начальную точку о0, и при любом
выборе начального значения Р0 = р(о0) для соответствующей не-
непрерывной функции р (о) вдоль Г. Так как величина уха непре-
непрерывна в [S*], то каждая ее компонента ух$ должна обращаться
в нуль в точке [t+ (о0), о0, р0], т. е. в любой точке множе-
множества S*+, что и требовалось доказать.
Доказательство леммы B5.3). Два утверждения этой леммы
доказываются одинаково, поэтому мы докажем только первое из
них. Предположим, что ухо — 0 в S*~. Обозначим через С любую
малую спрямляемую кривую с ограниченным на ней временем
полета, содержащуюся в Е~. (Если таких кривых не существует,
то нам нечего доказывать.) Пусть кривая С задается функцией X (s)
длины дуги s; обозначим через 6(s) направление касательной,
существующей в соответствующей точке для почти всех s. В ка-
качестве начала отсчета для s выберем точку, в которой функция
6(s) аппроксимативно непрерывна, и обозначим через х, 6 соот-
соответствующие значения функций X (s), 6(s). Далее, обозначим
402 Гл. II. Применение стандартных методов вариационного исчисления
через у любой вектор из 2/2 (х), а через (t, о, р)—точку в S*~,
для которой x(t, о) = х, #(?, о, р) = у.
Под аппроксимативной непрерывностью функции 6(s) мы по-
понимаем следующее: для любого е > 0 существует замкнутое мно-
множество В значений s, такое, что для каждого достаточно малого
интервала / вида 0^s^6
(i) |8(s) — §|<e, когда s£B{]I,
(ii) mes(/—fi)<e-mes/.
Обозначим теперь через Г спрямляемую кривую в S~, такую,
что малые дуги кривой С, начинающиеся в точке х, являются,
в соответствии с B3.1) (iv), образами при отображении x(tt о)
малых дуг у кривой Г, начинающихся в (i, о). Выразим кри-
кривую Г через длину ее дуги К посредством функций t (X), о(Х)
так, чтобы точка (?, о) соответствовала значению к = 0. Теперь
можно определить непрерывную возрастающую функцию s(i),
которая обращается в нуль при Я, = 0 и порождает соответствую-
соответствующую длину дуги вдоль С, т. е. удовлетворяет соотношению
Обозначим через Л множество значений Я,, для которых s (к) £ В.
Пусть теперь через As, AT обозначены разности величин s и
Т (х) в концах малой дуги кривой С. Мы хотим показать, что
(a) отношение AT/As ограничено,
(b) для дуги кривой С, начинающейся в х и стягивающейся
в эту точку,
Заметим, что из условий (а) и (Ь), взятых вместе, следует утверж-
утверждение леммы B5.3). В самом деле, из (Ь) вытекает, во-первых,
что 6—направление относительной унивалентности в точке х, а во-
вторых, что для каждого импульса (/j;(xN%W. *€[£], почти
всюду вдоль С имеет место равенство
dT\X(s)\ ry , dX
ибо х—любая точка кривой С, в которой функция 6(s) аппрок-
аппроксимативно непрерывна, и, значит, х может быть почти каждой
точкой кривой С. Кроме того, из (а) следует, что, интегрируя
это равенство по s, мы можем получить соотношение, являющееся
определением относительной точности. Таким образом, доказа-
доказательство леммы B5.3) сводится к проверке утверждений (а) и (Ь),
что мы теперь и сделаем.
Пусть J — интервал значений К, соответствующий дуге 7 кри-
кривой Г, и пусть у отображена посредством x(t, о) на нашу малую
§ 26. Теорема Малюса 403
дугу кривой С. Очевидно, что AT =— Д*, где А* — разность зна-
значений t в концах дуги у. С другой стороны, по условию леммы,
уха = 0 вдоль 7» a yxt=\, согласно B1.2)(Ь) и B1.1). Следо-
Следовательно,
xtdt (Ц + уха da (к) = lyGds (к).
j
Очевидно, что отсюда следует ограниченность отношения At/As
и, значит, утверждение (а). Далее, если в качестве у взять дугу
с началом в точке (t, о), а соответствующую дугу кривой С вы-
выбрать малой, то дуга у, а значит, и интервал J будут малыми.
Кроме того, в выражении для At вектор у — непрерывная функ-
функция от к, полученная ограничением функции y = y(t, а, р) на
дугу 7, а 0—направление 8(s), где s = s(k). Используя эти функ-
функции и полагая ф = ф(^.) = «/9—1/6, получим
=-к I +75-1 •
^ПЛ J-A
J-A
Для малых J два последних интеграла не могут превосходить
некоторое фиксированное число, умноженное на сколь угодно
малое положительное е: во-первых, функция ф ограничена в J — Л
и это множество имеет меру s(k), которая меньше eAs ввиду
условия (П); во-вторых, вариация функции s(k) на множестве
У Г) Л не превосходит As, а ввиду условия (i) и непрерывности
(и ограниченности) функции у абсолютное значение | ф | подин-
тегрального выражения на этом множестве не превосходит про-
произведения числа е на некоторое фиксированное число. Таким
образом, лемма полностью доказана.
§ 26
Теорема Малюса
Эта теорема геометрической оптики уже была сформулирована
применительно к классическому вариационному исчислению. Те-
Теперь мы еще раз сформулируем и докажем ее, значительно осла-
ослабив предположения о гладкости. Нам понадобится следующая
лемма:
B6.1) Лемма. В каноническом пучке выполняется равенство
д ( дх
{у
Здесь х и у—это функции x(t, о) и y(t, о, р), и написанное
соотношение должно выполняться при (t, о, p)£S*. В лемме
утверждается также, что выражение, стоящее в левой части,
404 Гл. П. Применение стандартных методов вариационного исчисления
существует, хотя мы и не предполагаем существования вторых
производных.
Доказательство леммы B6.1). Обозначим через (?, а, р) и
х, у, и некоторую точку из S* и соответствующие значения
функций х, у, и; далее, через р обозначим любую координату
вектора о, а через с—значение выражения
Уц{Н*> o)—g[x(t, о), и))
в точке A, а, рI(. Интегрируя соотношение B1.1) по /..и диффе-
дифференцируя результат по р\ а затем меняя порядок этих операций
и дифференцируя по t, мы получаем
Это последнее соотношение умножаем скалярно на у, полагая
(t, о, p) = (t, а, р). Сложим затем полученное равенство с ра-
равенством
., , д
которое выполняется в той же точке и при х = х в силу B1.2) (а).
Это дает нам в точке (/, о, р) равенство
д
Осталось только доказать, что с = 0.
Но по определению величины с и согласно B3. l)(i), ее зна-
значение при (t, o) = (t, о) равно значению выражения
цУВ(х, t, о)
в этой точке, а последнее, согласно B1.2) (Ь), обращается в нуль,
так как множество значений о открыто.
B6.2) Следствие. На каждой дуге канонического пучка 2* ве-
величина уха постоянна.
В самом деле, из доказательства леммы B6.1) следует, что
при постоянном о функция *р абсолютно непрерывна по t, так
как ее приращение представляется в виде интеграла. Согласно
1> Напомним, что, согласно § 23, h(t, a) = g(x(t, а), и (<,а)).—Прим. ред.
§ 27. Цепь трасс 405
§ 21, функция у тоже абсолютно непрерывна по /. Следовательно,
функция ухс абсолютно непрерывна по t, а потому ввиду B6.1)
постоянна при постоянных а, р.
B6.3) Теорема Малюса. Пусть 2—пучок трасс с относительно
точным финишем Е+. Тогда 2 имеет относительно точный
старт Е~ и относительно точный коридор полета Е.
Доказательство. Согласно B6.2), величина ухс постоянна на
каждой дуге из 2*. а ввиду B3.1) она непрерывна в [S*].
Согласно B5.2), постоянное значение на каждой дуге равно О,
и тогда справедливость утверждения B6.3) следует из леммы B5.3).
§ 27
Цепь трасс
Связь между классическим вариационным исчислением и гео-
геометрической оптикой, которая проявилась в классической форму-
формулировке теоремы Малюса, оказывается еще более тесной для
задачи быстродействия в оптимальном управлении. В геометри-
геометрической оптике старт Е~ и финиш £+ пучка трасс 2 соответствуют
паре последовательных линз или зеркал, а 2—семейству световых
лучей, проходящих от одной из этих линз к другой. Эта система
должна быть исследована как часть целой совокупности таких
же семейств лучей, соединенных одно с другим частями оптиче-
оптического прибора. Мы соединим различные пучки трасс точно так
же, как соединяются такие семейства лучей в геометрической
оптике.
Конечную или счетную последовательность пучков трасс
в R назовем цепью трасс, а соответствующую последовательность
канонических пучков назовем канонической цепью, если для
/•=1,2, .... N— 1, ..., они «пригнаны» друг к другу в обратном
порядке, т. е. старт каждого 2; содержит финиш пучка 2;+1.
Таким образом, должны быть соединены канонические пучки,
а не только их проекции 2Г.
Финиш пучка 2, назовем финишем цепи. Цепь трасс, для
которой финишем является подмножество цели, будем называть
цепью трасс, ведущей к цели. Конечная цепь, состоящая из N
пучков, имеет также и старт; последний определяется как старт
пучка 2дг. Вообще, стартовые множества и коридоры полета от-
отдельных пучков цепи трасс будем называть ее звеньями. Мы не
упоминаем о финишных множествах: все они являются подмно-
подмножествами стартовых множеств последовательных пучков, кроме
финишного множества пучка 2„ которое является финишным
множеством всей цепи. Если старт или коридор полета отдель-
406 Гл. П. Применение стандартных методов вариационного исчисления
ного пучка 2Г является относительно точным множеством для
этого пучка, то мы назовем его относительно точным звеном
данной цепи. В случае когда речь идет о старте, отсюда, очевидно,
следует, что финиш пучка 2г+1 является относительно точным
множеством для 2Г, и тем более для 2г+1, так как множество
&е(х) для х£Е^+1 сужается, когда пучок 2Г заменяется пу-
пучком 2г+1.
По индукции из теоремы Малюса B6.3) получаем следующий
вывод: если финиш пучка 2t является относительно точным мно-
жеством для 2lt то все звенья цепи трасс являются относитель-
относительно точными множествами для этой цепи. Ввиду условия транс-
трансверсальности B2.2) (с), это, в частности, будет иметь место в том
случае, когда финиш пучка 2, принадлежит цели. Таким образом,
мы доказали следующую теорему:
B7.1) Теорема. Все звенья цепи трасс, ведущей к цели, явля-
являются относительно точными.
§ 28
Соединение фрагментов кривых
Обозначим через Ж класс спрямляемых кривых с ограничен-
ограниченным временем полета, лежащих в R, а через Rv, где v пробегает
множество положительных целых чисел, обозначим конечную или
счетную систему непересекающихся подмножеств из R, объедине-
объединение которых равно R. Кривую С с Ж назовем фрагментом, если
ее внутренняя часть лежит в некотором подмножестве Rv. Класс
таких фрагментов будем обозначать через ЭС0. Вообще, если вы-
выполняются описанные ниже условия, то ЭГ может быть некоторым
заданным классом спрямляемых кривых в метрическом простран-
пространстве, а 9С0—некоторым его подклассом. Мы хотим описать си-
ситуацию, когда класс 5f можно получить из 5^0, используя простые
операции сложения и вычитания кривых.
Эта очень простая процедура позволит нам значительно рас-
расширить результаты предыдущего параграфа. Поэтому мы просим
читателя запастись терпением, пока мы попытаемся сформулиро-
§ 28. Соединение фрагментов кривых 407
вать эту процедуру так, чтобы ее можно было использовать
для этой цели. Сложение й вычитание кривых—это интуитивные
операции. Но нам нужно определить их более точно и, кроме
того, так, чтобы, применяя их к кривым из *ЭС, мы получали
снова кривые из ЭС.
С этой целью будем считать допустимыми только два вида
сложения кривых:
(i) Пусть конец кривой С, является началом кривой Сг; будем
говорить, что кривая С получена наращением кривой Сг кривою Сг,
если она составлена из двух смежных дуг, которыми являются
С, и С2, пробегаемые в указанном порядке.
(ii) Пусть С2—замкнутая кривая, пересекающая Q; будем
говорить, что кривая С получена украшением кривой Ct кри-
кривою С2, если, двигаясь вдоль С, мы проходим сначала дугу
кривой Ct до точки пересечения с С2, затем кривую С2, и на-
наконец оставшуюся часть кривой С,. В каждом из этих случаев
предполагается, что кривые С,, С2, С принадлежат классу 9£\
Определим также две соответствующие операции вычитания.
Скажем, что кривая С, получена отсечением кривой Сг от кривой С
или выравниванием кривой С за счет удаления С2, если кривую С
можно получить соответственно наращением или украшением
кривой Ct кривою С2.
С классической точки зрения введенные операциии не всегда
.однозначны. Так, если Сх, С2 имеют противоположные пары
концов, то наращенную кривую С можно получить двумя спо-
способами: в первом случае, двигаясь вдоль С, мы опишем сначала
Cj от Л до б, а затем С.2 от В до Л; а во втором—сначала Сг
от В до А, а затем С\ от А до В. Однако эти два вида нара-
наращенной кривой С естественно отождествляются как два способа
Наращение.
/о,
/ '-г
Украшение.
А
У
cz
В
описания одной и той же замкнутой кривой, так что это клас-
классическое соглашение уничтожает здесь всякую двусмысленность.
Не так просто обстоит дело, когда мы производим украшение
кривой С, такой кривой Сг, которая пересекает С, не менее чем
в двух точках А, В. Это украшение можно проделать двумя
408 Гл. П. Применение стандартных методов вариационного исчисления
способами: украшенную кривую С можно составить из дуги
кривой Сг до точки А затем из С2 и, наконец, из дуги кривой Сг
от А до конца; с другой стороны, она может состоять из Сг до
точки В, затем из С2 и, наконец, из С1 от точки В до конца.
В классическом анализе эти два вида кривой С не эквивалентны;
в смысле определения Фреше это различные кривые. Тем не
менее мы условимся отождествлять их. Эго означает, что мы
отказываемся от классического определения кривой; вместо него
мы примем определение из § 63, 64 гл. VI т. I: две кривые
отождествляются, если они порождают одну и ту же операцию
криволинейного интегрирования. Это отождествление также унич-
уничтожает всякую двусмысленность.
Эти примеры иллюстрируют также следующий факт: добавляя
одно украшение и удаляя другое, можно заменить дугу АВ кри-
вой С, соответствующей дугой кривой
С2. Для этого достаточно удалить с ук-
украшенной кривой С замкнутую кривую,
которая получена наращением дуги АВ
кривой Ct дугой ВА кривой С2.
В дальнейшем классы ЭС и ЭС0 будут
предполагаться такими, что если неко-
некоторая кривая является элементом одного
из этих классов, то каждая ее дуга и
каждая обратная дуга будут элементами
того же класса. Такие классы кривых
назовем наследственными и обратимы-
ми. В этом случае операцию отсечения
можно опустить; ее можно произвести в два этапа посредством
наращения обратной дугой и последующего выравнивания за счет
удаления замкнутой кривой, составленной из дуги и обратной
дая нее дуги. Кроме того, операция наращения ассоциативна,
и можно определить наращение конечного числа элементов из 5С,
концы которых попарно совпадают так, как этого требует опре-
определение. Эту операцию будем называть конечным наращением.
С другой стороны, мы будем считать, что обе операции укра-
украшения и выравнивания допустимо производить счетное число раз,
и мы будем говорить о не более чем счетном украшении и не
более чем счетном выравнивании. Конечно, каждая из этих опе-
операций ограничена условием, что, применяя ее, мы всегда полу-
получаем из элементов ЭС снова элемент того же класса.
Имея все это в виду, мы будем применять операции конеч-
конечного наращения и счетного украшения к классу фрагментов Э^о.
Подкласс из ЭС, который мы при этом получим, обозначим
через 3f*j, а его элементы будем называть воссозданными кривыми.
Затем определим подкласс ?)f2, элементы которого получаются из
элементов подкласса ЭГ, посредством не более чем счетного вы-
§ 28. Соединение фрагментов кривых 409
равнивания; эти элементы назовем реставрированными кри-
кривыми.
В оптимальном управлении нас интересует задача минимиза-
минимизации во всем множестве R. До сих пор, приняв за образец клас-
классическое вариационное исчисление и еще более старые исследо-
исследования по геометрической оптике, мы изучили только то, что
происходит в определенных подмножествах Rv, объединение кото-
которых равно R. Это означает, что мы имеем информацию о классе
фрагментов ЭС0 и хотим получить информацию о классе первона-
первоначальных кривых ЭС. Метод, который мы здесь разработаем, можно
применять только в том случае, когда ЭС можно восстановить
из ЭГ0, в том смысле, что Ж" = 3(V При изучении задач опти-
оптимального управления до сих пор возникала именно такая ситуация.
Однако справедливость или несправедливость равенства
Э^2 = Stf всецело зависит от способа разбиения множества R на
непересекающиеся подмножества Rv. Так, если R — плоскость,
и мы разобьем ее на три множества Ru R2, R3, состоящие из
рациональных точек, иррациональных точек и точек, у которых
ровно одна рациональная координата, то получим, что подкласс ЭС0
(а также и ЗС2) пуст. С другой стороны, если класс ЭС такой,
как было указано выше, а /—такая прямая, что функция Т(х)
ограничена на каждом ограниченном подмножестве из /, то ра-
равенство ЭС2 = ЭС будет выполняться для разбиения плоскости R
на три подмножества, которыми являются сама прямая / и две
открытые полуплоскости, на которые R разделяется этой прямой.
Чтобы убедиться в этом, покажем, что каждая кривая CgSt*
принадлежит Э^2, причем можно ограничиться случаем, когда
концы кривой С лежат на /. Тогда пересечение кривой С с каждой
из двух открытых полуплоскостей состоит из не более чем счет-
счетного числа открытых дуг Cv, а с прямой /—является замкнутым
множеством. Обозначим через у направленный отрезок с теми
же концами, что и С, через yv—направленный отрезок с теми
же концами, что и Cv, через "Vv—отрезок, противоположный yv,
через Fv—замкнутую кривую, полученную наращением отрезка yv
отрезком Yvi а через Г—украшение отрезка у конечной или
счетной системой замкнутых кривых, которые получены нараще-
наращением кривых Gv отрезками Yv- Очевидно, что все это кривые
с ограниченным временем полета и длина кривой Г не превос-
превосходит утроенной длины кривой С. Следовательно, Г <r 5Clt и,
выравнивая ее за счет удаления кривых Tv, получаем, что С^ЭСг.
Вообще, если 5^2 = 5^, то №0 назовем восстановимым классом
фрагментов, а разбиение множества R на непересекающиеся
подмножества Rv—восстановимым разбиением. В этом случае мы
назовем R правильным объединением множеств Rv. Вообще, о не-
некотором классе подмножеств Р из R, не обязательно счетном и
не обязательно состоящем из непересекающихся элементов, будем
410 Гл. П. Применение стандартных методов вариационного исчисления
говорить, что R является правильным объединением его элемен-
элементов, если их объединение равно R и, кроме того, существует
восстановимое разбиение множества R на не более чем счетное
число непересекающихся подмножеств Rv, таких, что каждое Р
равно объединению тех Rv, которые являются его подмножествами.
§ 29
Фундаментальная теорема и ее следствия
Теперь мы в состоянии заняться значительно более общим
случаем, так как благодаря введенным нами различным понятиям
к нему можно применить стандартные вариационные методы.
Но на этой стадии удобно ввести еще одно дополнительное пред-
предположение, которое будет гарантировать существование некоторого
интеграла вдоль каждой спрямляемой кривой С с ограниченным
временем полета, расположенной в R; а именно, предположим,
что в R существует такой импульс у(х), что величина [у (х) dx/ds]'
вдоль кривой С не превосходит некоторой интегрируемой функ-
функции K(s) длины дуги s кривой С. Назовем это предположением
интегрируемости импульса. (Разумеется, мы не предполагаем,
что у(х) является измеримой функцией длины дуги вдоль С.)
На практике, как мы вскоре увидим, это предположение лишь
незначительно усиливает сделанное нами раньше, и сделанное
неохотно, допущение, которое, как мы уже объяснили в § 21,
исключает из числа трасс те подозрительные на оптимальность
траектории, вдоль которых # = 0. В действительности предполо-
предположение интегрируемости импульса может быть проверено во мно-
многих случаях, причем в более сильной форме. Например, для
трасс, начинающихся в ограниченном подмножестве A cR с огра-
ограниченным временем полета, обычно весь путь до цели лежит
в некотором ограниченном подмножестве BcR, в котором функ-
функция gx(x, и) равномерно ограничена для всех рассматриваемых
значений управления и. Так как сопряженный вектор вдоль
трассы удовлетворяет уравнению B1.2) (а), то в этом случае
легко получить следующее неравенство:
при условии, что у(х)£&(х), x£R и импульс у(х) ограничен
в точках цели, т. е. при / = 0 в конечных точках трасс, начина-
начинающихся в А.
Теперь вспомним, что в § 27 была определена цепь трасс;
стартовые множества и коридоры полета составляющих цепь
пучков были названы звеньями цепи; соответствующие множества
для канонической цепи назовем для краткости каноническими
звеньями.
Сетью трасс назовем конечную или счетную систему цепей
§ 29. Фундаментальная теорема и ее следствия
411
трасс, ведущих к цели, -таких, что R является правильным
объединением звеньев этих цепей, a R^— объединением канони-
канонических звеньев. Основным предположением, на которое опирается
применение наших стандартных методов, является предположение
о существовании такой сети. Понятие правильного объединения
является здесь фундаментальным, так как нет никакой возмож-
возможности избавиться от пересечений различных звеньев, да мы и
Пересекающиеся пучки трасс.
не желаем избавляться от них; таким образом, мы снова исклю-
исключаем взаимную однозначность, которая нужна была в классиче-
классическом случае.
Итак, решение любой практической задачи мы должны начи-
начинать с проверки существования сети трасс. Идеально было бы
располагать полным описанием всех трасс, так как это значительно
облегчило бы проверку существования сети. Впрочем, для над-
надлежащего описания наших трасс почти ничего нельзя сделать,
разве что объединить их в семейства, соответствующие цепям, и
затем разбить на семейства гладких дуг, соответствующие пуч-
пучкам. Такое описание можно рассматривать как предварительную
работу по выявлению подозреваемых и их разумной классифи-
классификации, проделываемую до того, как наш читатель сможет высту-
выступить в роли прокурора, который и в самом деле докажет их
виновность. Разумеется, он должен сначала проверить, что подо-
подозреваемые действительно уличены по тем пунктам, на которых
он намеревается построить свое обвинение.
На практике больше всего хлопот причиняет проверка того,
что множество R является правильным объединением звеньев
рассматриваемых цепей. В соответствии с нашим определением
для этого нужно представить множество R в виде объединения
непересекающихся множеств Rv, каждое из которых полностью
412 Гл. II. Применение стандартных методов вариационного исчисления
содержится в том из рассматриваемых звеньев, с которым оно
пересекается, и доказать, что это разбиение множества R на
подмножества Rv является восстановимым. Построить такое раз-
разбиение, как правило, не очень трудно, а доказательство его вос-
становимости обычно проводится по образцу, приведенному в
предыдущем параграфе, где мы доказали справедливость равен-
равенства 9С1 = ЭС в случае разбиения плоскости R на прямую / и две
открытые полуплоскости. Очевидно, что это доказательство
является шаблонным.
Теперь мы докажем наш основной результат и его следствия.
B9.1) Фундаментальная теорема. Предположим, что суще-
существует сеть трасс. Тогда R—точное множество.-
Доказательство. Согласно предположению, существует восста-
восстановимое разбиение множества R на непересекающиеся множества
Rv, каждое из которых является подмножеством каждого из"
звеньев цепей трасс нашей сети, с которым оно пересекается.
Определим классы кривых Жо, З^ц Э^2> взяв в качестве ЭС класс
лежащих в R спрямляемых кривых с ограниченным временем
полета.
Пусть С^З^о. а 2—любой пучок трасс одной из наших
цепей, такой, что кривая С пересекает либо стартовое множество,
либо коридор полета пучка 2. Тогда из нашего предположения
следует, что С лежит в некотором Rv, содержащемся полностью
в этом стартовом множестве или коридоре полета. Следовательно,
по теореме B7.1)
B9.2)
где xlt х2—начало и конец кривой С. Применяя это соотноше-
соотношение к дугам кривой С, получим, что Т (х) является вдоль С
абсолютно непрерывной функцией длины дуги s, а ее производ-
производная по s почти всюду равна y^(x)dx/ds. Это справедливо одно-
одновременно для всех рассматриваемых пучков 2, так как всего
пучков не более чем счетное число и мы можем исключить из
рассмотрения не более чем счетное число множеств точек s меры
нуль. Это означает, в свою очередь, что для каждого пучка 2 эта
производная почти всюду имеет указанное значение и, значит,
почти каждая точка кривой С является точкой унивалентности
на С; в самом деле, каждый вектор у£&(х) имеет вид ух(х) для
некоторого пучка 2 в точке х, так как по предположению R&—
это объединение всевозможных канонических звеньев цепей нашей
сети. Следовательно, соотношение B9.2) можно переписать в виде
B9.3)
§ 29. Фундаментальная теорема и ее следствия 413
где у(х)—любой импульс в R. Кроме того, этим доказана спра-
справедливость соотношения B9.3) для каждой кривой Cg9T0. По
аддитивности его можно сразу распространить на кривые, полу-
получаемые конечным числом наращений элементов из S^oj в частно-
частности, отсюда следует, что левая часть равна нулю, если С—замк-
С—замкнутая кривая. Значит, соотношение B9.3) не изменится и при
не более чем счетном украшении кривой С, так как ввиду пред-
предположения интегрируемости импульса его левая часть по-преж-
по-прежнему будет существовать. Таким образом, соотношение B9.3)
справедливо для всех C^3fv По той же причине оно останется
верным и при не более чем счетном выравнивании и будет спра-
справедливо для всех С С ЭСг, т.е. для всех С£Ж.
Таким образом, теорема полностью доказана.
B9.4) Следствие. При тех же предположениях пусть С—лю-
С—любая спрямляемая кривая в R с ограниченным на ней временем
полета. Пусть хг, х2—ее начало и конец и у(х)—любой импульс
в R. Тогда
Далее, если, в частности, С—дуга траектории, начинающаяся в
момент tt и кончающаяся в момент /2, то
Доказательство. Нужно доказать только последнее утвержде-
утверждение, а оно следует из того, что вдоль траектории t/(x)x^l
ввиду условий B1.1) и B1.2) (Ь).
В частности, если мы положим хг = х и предположим, что х2
принадлежит цели, то получим такое следствие:
B9.5) Теорема достаточности. При тех же предположениях
пусть х—любая точка из R. Тогда время полета Т(х)—это
кратчайшее время перемещения точки х к цели вдоль траекто-
траектории, лежащей в R.
Глава Ш
Обобщенное оптимальное управление
§ зо
Введение
По названию этой заключительной главы, пожалуй, трудно
догадаться о ее сугубо практическом характере. Представим себе
какой-нибудь по-настоящему важный практический проект (ска-
(скажем, полет к Луне), в котором основной проблемой является
проблема теории управления. Вообразим, будто нас пригласили
в качестве консультантов по этому проекту вместе с известным
физиком (или инженером) Экспериментатором и знаменитым
Логиком. Если это сочетание покажется читателю нелепым, вне-
внесем уточнение, что речь идет не о простом попадании в цель,
а о таком проекте, когда очень важно, чтобы любая возмож-
возможность была тщательно продумана заранее. При этих обстоятель-
обстоятельствах сотрудничество экспериментаторов с математиками и логи-
логиками может оказаться в высшей степени эффективным. Напом-
Напомним, что атомная бомба была создана в результате именно такого
сотрудничества. И хотя в той компании, пожалуй, не было
логика-профессионала, математика С. Улама вполне можно отнести
к логикам, ибо он был наиболее известен своей работой о роли
континуум-гипотезы в некоторых вопросах абстрактной теории
меры.
Успех подобного сотрудничества связан с твердой гарантией
того, что ни один существенный момент не будет оставлен без
внимания. А нынешнее поколение не раз имело возможность убе-
убедиться в том, что подлинного прогресса можно достигнуть не
уклоняясь от принципиальных трудностей и спорных вопросов,
а, наоборот, вступая с ними в открытую борьбу. Мы уже доста-
достаточно долго увиливали от основных трудностей, присущих опти-
оптимальному управлению. Теперь нам на помощь придут обобщен-
обобщенные методы последней части первого тома. Во всяком случае,
гипотезы как первой, так и второй глав данного тома можно
проверить только после выбора механизма управления, а в ответ-
ответственных проектах этот механизм выбирают лишь в результате
теоретического исследования.
Вопрос о том, как лучше всего приспособить наши обобщен-
обобщенные методы к задачам оптимального управления и к другим
задачам с ограничениями, все еще является предметом интенсив-
интенсивных исследований. В связи с этим излагаемый здесь материал
§ 30. Введение 415
относится только к более раннему варианту принадлежащей
автору обобщенной теории, в котором используются обобщенные
кривые, а не обобщенные потоки. Впервые к задачам с ограни-
ограничениями ее применил Мак-Шейн. Филиппову и Варге принадле-
принадлежит разработка этой теории применительно к оптимальному
управлению; однако здесь мы будем излагать эту теорию несколь-
несколько по-иному, чтобы подчеркнуть ее практическую направленность.
Как мы уже неоднократно разъясняли в настоящих лекциях,
принципиальные трудности с математической и логической точек
зрения связаны с вопросами существования; вдобавок эти труд-
трудности усугубляются отсутствием у решений дифференциальных
уравнений свойств компактности и замкнутости. Однако для
Экспериментатора (которому впоследствии не раз будет предо-
предоставлено слово) трудности, связанные с существованием, служат,
помимо всего прочего, тревожным сигналом скрытых неполадок
практического характера, в которых необходимо разобраться.
Именно соображения практического характера и приведут нас
к такой постановке задачи, что теоремы существования будут
выполняться по существу автоматически.
Практический характер нашей постановки проявляется еще
раз, когда мы переходим к необходимым условиям, выражаемым
принципом максимума Понтрягина; дело в том, что все известные ,
сравнительно простые доказательства этого принципа основаны
по существу на таких же идеях, как и те, что приводят к нашей
обобщенной постановке. Более глубокий смысл этого обстоятель-
обстоятельства кроется в необходимом и достаточном условии (86.3) при-
приложения II тома I и в вариационном принципе выпуклости, из
которого выводится это условие. Однако, чтобы убедиться в этом,
необходимо приспособить к задачам оптимального управления
более новую форму нашего обобщенного подхода, произведя
Линеаризацию ограничений точно так же, как было линеаризо-
линеаризовано понятие границы. Этим советом, который автор данных
лекций никогда не устанет повторять, теперь постепенно начи-
начинают пользоваться, а совместная работа автора и У. X. Фле-
Флеминга показывает, что его можно также весьма эффективно при-
применять и в проблемах кратного интегрирования.
Для более старой формы обобщенного подхода, которой мы
здесь пользуемся, связь с необходимыми условиями выглядит,
пожалуй, случайным совпадением, чем-то вроде награды за хоро-
хорошее поведение. Было бы заманчиво продолжить эту мысль, напом-
напомнив известную истину, что преступление не приносит дохода.
Мы были бы рады заявить, что легче доказать принцип макси-
максимума Понтрягина в его более общей форме применительно к
нашей обобщенной постановке, а также доказать теорему суще-
существования, нежели попирать логику, доказывая только сам прин-
принцип и постулируя существование. К сожалению, такое заявление
41$ Гл. III. Обобщенное оптимальное управление
было бы преувеличением, а ведь мы в этих лекциях никогда
не ставили себе цель пощадить читателя, преподнося ему лишь
самый необходимый минимум сведений; наоборот, мы стремились
выработать у него умение хорошо ориентироваться в смежных
областях математики. В этом плане наши требования к читателю
все время нарастали, и теперь, когда он стал закаленным вете-
ветераном, мы просим его предпринять еще одно, последнее усилие.
г"ло усилие, как подтвердит наш приятель Экспериментатор,
необходимо главным образом потому, что недостаточно запастись
обычными или обобщенными траекториями. Мы должны конкретно
задать соответствующие управления. А это сопряжено с непри-
неприятной процедурой определения соответствующих неявных функций.
Эта процедура была достаточно неприятной уже.в классическом
вариационном исчислении; теперь же нам предстоит иметь с ней
дело на гораздо более высоком уровне. Для практических целей
искомые управления как функции времени должны удовлетво-
удовлетворять подходящим условиям измеримости.
Ряд наиболее глубоких проблем анализа связан именно с этими вопросами;
об этом можно прочитать в известной книге Лузина по аналитическим множест-
множествам. В нашем случае дело осложняется еще тем, что при обобщенном подходе
значения наших управляющих функций в некоторый фиксированный момент
времени t представляют собой не просто точки пространства управления U,
а являются мерами на U. В стохастической теории управления, которая здесь не
рассматривается, ситуация еще хуже. Ясно, что для рассмотрения всех этих
вопросов желательно располагать подходящим аппаратом. К счастью, все наши
потребности в этом плане способна удовлетворить одна-единственная лемма, из-
известная под названием леммы Филиппова. Общая форма этой леммы, принадле-
принадлежащая Мак-Шейну и Уорфнлду, сама уже использует мощный аппарат: она осно-
основана на известной континуум-гипотезе.
Вот уже второй раз мы упоминаем об этом глубоком предположении, которое
Кантор первоначально объявил теоремой, обещав привести доказательство в сле-
следующем номере журнала. Так как это предположение, по-видимому, позволит
упростить изложение отдельных разделов нашего курса, иам следует хотя бы рас-
рассеять созданную вокруг него атмосферу мистицизма н развенчать миф о том, что
оно лежит вие пределов человеческого понимания. В свое время аналогичная
атмосфера мистицизма окружала аксиому Евклида о параллельных. То, что одному
поколению людей кажется лежащим вне пределов человеческого понимания,
позднее, возможно, будет довольно банальным фактом, а на некоторой промежу-
промежуточной стадии этот вопрос иногда вдруг становится одной из самых излюбленных
и наименее трудных тем кандидатских диссертаций. Пожалуй, для континуум-
гипотезы эта промежуточная стадия еще не наступила. Впрочем, мы возбудили
любопытство нашего Экспериментатора: нельзя лив двух словах рассказать об
этой гипотезе и осветить современное состояние вопроса?
В качестве ответа мы воспроизведем некоторые замечания д-ра Баркли
Дж. Россера, сделанные им недавно на одном из коллоквиумов. Они указывают на
сходство истории гипотезы Кантора с историей аксиомы Евклида о параллельных.
Сейчас, когда мы знакомы с неевклидовой геометрией и теорией относитель-
относительности Эйнштейна, покров таинственности с аксиомы Евклида о параллельных
снят. Мы теперь знаем, что оиа независима от остальных постулатов Евклида,
тогда как для философа Каита геометрия без этой аксиомы была немыслима. Сам
Евклид в своих «Началах» в основу геометрии положил пять постулатов, которые
мы бы сейчас назвали аксиомами, хотя во времена Евклида этому термину прида-
§ 30. Введение
417
вали несколько иной смысл. При доказательстве первых двадцати восьми предло-
предложений Евклида используются лишь первые четыре постулата. А из последнего из
»тих предложений следует, что через точку Р, не ..лежащую на данной прямой /,
можно провести в данной плоскостн по крайней мере одну прямую /', не пересе-
пересекающую I. Похоже, что на самом деле Евклиду хотелось доказать с помощью своих
четырех постулатов, что существует лишь одна такая прямая /', а когда это ему
• Р
не удалось, он довольно неуклюже добавил к своему первоначальному списку
пятый постулат, чтобы обеспечить это. Так или иначе, но за две тысячи лет было
предпринято немало попыток вывести пятый постулат (который мы называем
аксиомой о параллельных) из четырех остальных. В средние века одному монаху
удалось, по-видимому, продвинуться в втом вопросе настолько далеко, что он
даже сумел получить ряд результатов, заменив
эту аксиому ее отрицанием. Фактически ои за-
занимался тем, что мы сейчас называем неевклидо-
неевклидовой геометрией. Однако его единственной целью
было прийти к противоречию, а когда противо-
противоречия ие получилось, он уничтожил плоды свое-
своего труда. Наконец, Кант предъявил в качестве,
как ои считал, философского доказательства пя-
пятого постулата тот факт, что он, Кант, не в
состоянии представить себе противное. Подобное
унижение оказалось для математиков уже сов-
совсем невыносимым. Во всяком случае через не-
несколько десятков лет независимость пятого по-
постулата от первых четырех была установлена до-
довольно простым методом — методом моделей.
Ои заключается в том, что в рамках евклидовой
геометрии строится модель, удовлетворяющая
только первым четырем постулатам Евклида. Одна из простейших моделей такого'
типа была предложена Кэлн; в ней «точками» называются точки виутренности кру-
круга, а его хорды интерпретируются как «прямые». Очевидно, существует много
«прямых», проходящих через точку Р и не пересекающих J1'.
1( Доказательство независимости пятого постулата построением модели
(приведенную в тексте модель связывают также с именами Бельтрами и Клейна)
порадовало Логика (разумеетси, если он, как и иаш приятель Экспериментатор,
присутствовал при этой беседе на исторические темы). Экспериментатору же,
вероятно, было бы не менее интересно узнать, что за несколько десятилетий до
появления неевклидовых моделей Гаусс, Больяи и Лобачевский нисколько не
14
1274
418 Гл. 111. Обобщенное оптимальное управление
Континуум-гипотеза имеет аналогичную, хотя н более короткую историю.
Работы Кантора написаны так живо н увлекательно, что их до снх пор нельзя
читать без волнения. Он прекрасно осознавал огромную силу н глубину своих"
новых понятий, а также собственной интуиции. Он, должно быть, был абсолютно
уверен в своей способности доказать сформулированную им весьма правдоподоб-
правдоподобную теорему о том, что мощность множества всех действительных чисел является
наименьшей мощностью, превосходящей мощность множества натуральных чисел,
или, как теперь принято писать, что
Все свидетельствовало в пользу этого утверждения. Во-первых, было известно
что
2*°
или, что то же самое,
(и это важное неравенство уже находило применения в анализе). Во-вторых., все
фактически построенные на прямой или в n-мерном- евклидовом пространстве
точечные множества оказались либо не более чем счетными, либо имели ту же
мощность, что вся действительная ось, причем в дальнейшем этот факт всегда под- ■
тверждался.
После Кантора многие пытались доказать его гипотезу. При этом обнаружи-
обнаружилось, что как сама континуум-гипотеза, так и ее отрицание допускают целый ряд.
эквивалентных формулировок, которые порой выглядят довольно странно и при-
приводят к не менее странным следствиям. Обо всем этом подробно говорится в книге
Серпинского, посвященной данному вопросу. Совершенно иной подход предложил
в двадцатых годах нашего столетия Гильберт, который рассчитывал с его помощью
установить справедливость гипотезы Кантора. Этот подход был, пожалуй, наибо-
наиболее близок по духу той величественной простоте, которая свойственна концеп-
концепциям самого Кантора. И все же, по общему мнению, он только лишний раз проде-
продемонстрировал необходимость перевести весь этот вопрос из области математики
в узком смысле слова в область математической логики и метаматематики. Воз-
Возможно, для физика или практика-аналитика это не выглядит упрощением, однако
надо иметь в виду, что до этого вообще никто не удосужился дать определение мно-
множества. Серпинский начинает одну из своих книг словами: «Каждому понятно, что
подразумевается под словом множество. Так, можно говорить о множестве людей
в данной комнате, о множестве книг в некоторой библиотеке и т. п.». Далее он
приводит еще ряд примеров. Все это мы теперь назвали бы наивной теорией мно-
множеств. Чтобы разобраться в вопросе о гипотезе Кантора, мы должны вместо этого
воспользоваться формальной теорией множеств в сочетании с булевой алгеброй,—
теорией, которая целиком основана на аксиомах, точно так же как геометрия
евклидовых «Начал» основана на его постулатах. Это единственный способ рас-
рассеять туман мистицизма.
В рамках такого аксиоматического подхода на континуум-гипотезу можно
смотреть как на новую аксиому. Тогда возникают два вопроса: совместима лн
континуум-гипотеза с остальными аксиомами теории множеств и является ли она
независимой? Ответы на оба эти вопроса оказываются утвердительными, в чем,
можно убедиться, как и в случае аксиомы о параллельных, на подходящей модели.
Эта модель не слишком сложна и строится в рамках самой теории множеств, по-
подобно тому как модель Кэли была построена в рамках евклидовой плоскости. В ре»
зультате оказывается, что после того, как удовлетворены все остальные аксиомы"
сомневались в возможности построения геометрии, в которой пятый постулат не
выполняется; Больяи и особенно Лобачевский далеко продвинулись в этом пост;
роеиии, а Лобачевский предпринял к тому же попытку экспериментально решите
вопрос о том, какая геометрия отвечает пространству, в котором мы живем.—
Прим. ред.
§ 31. Празадача 419
теории множеств, остается еще достаточно свободы, чтобы заставить кардинальное
число 2Ко принять значение ttx или, если угодно, значение К2 — следующее
по величине кардинальное число после ffv Это, очевидно, служит ответом на оба
поставленных вопроса1». За всеми подробностями читателю следует обратиться
к последним работам, например к работе Дана Скотта 2>. Более ранние работы,
в частности классическая работа Гёделя, значительно сложнее.
Итак, статус континуум-гипотезы в достаточной степени прояснился: она
находится на положении независимой аксиомы, как и аксиома о параллельных
в геометрии. Поэтому, применяя эту гипотезу в анализе, мы не должны испыты-
испытывать никаких угрызений совести, так же как при использовании аксиомы выбора
и других удобных аксиом; такой подход близок по духу к подходу самого Каитора.
Конечно, можно было бы попытаться обойтись без нее, раз уж она нас так беспо-
беспокоит, подобно тому как Тонелли систематически избегал явного использования
аксиомы выбора ценой утяжеления формулировок и усложнения доказательств.
Однако мы предпочитаем ею пользоваться.
§31
Празадача
В задаче о попадании в Луну дифференциальные уравнения
траектории зависят от относительного положения Земли и Луны
во время движения, а значит, от постоянных, определяющих их
начальные положения. Они зависят также от массы летатель-
летательного аппарата, который нужно доставить на Луну, и к тому же
эта масса косвенно влияет на управление, поскольку она возра-
возрастает вместе с количеством управляющих устройств. Таким
образом, мы имеем задачу оптимального управления, в которой
ограничения зависят также и от некоторых постоянных пара-
параметров. Такая задача сформулирована в главе IV книги «Оп-
«Оптимальные процессы» следующим образом: требуется найти мини-
минимум интеграла
$/(/, х, и, w)dt
для траекторий x(t), управлений u(t) и постоянных w, удовлет-
удовлетворяющих ограничениям
x = g(t, х, и, w),
« В этом месте Экспериментатор спросил: «Как же все-таки обстоит дело с на-
нашим множеством действительных чисел, есть лн в нем подмножество промежуточ-
промежуточной между Ко н 2^° мощности? Ваши модели показывают лишь, что ответ на этот
вопрос нельзя вывести из аксиом теории множеств посредством правил формальной
логики». Напрасны были ссылки Логика на парадоксы бесконечного и проч.,
Экспериментатор настаивал на своем вопросе.оставаясь в рамках наивной теории
множеств.— Прим. ред.
2> Заинтересованный Экспериментатор так и сделал. С тех пор, основываясь
на принципе Фиинегана, иначе называемом «законом падающего бутерброда», ои
твердо убежден, что когда-нибудь математик, наделенный сверхгениальной интуи-
интуицией, построит эффективно множество промежуточной мощности. Однако на ехид-
ехидный вопрос Логика: «Ну, а как же, по Вашему мнению, мы узнаем истину, если
такого множества в действительности нет?» — ои не в состоянии ответить.—
Прим. ред.
14*
420 Гл. III. Обобщенное оптимальное управление
где «(О, w принимают значения из заданных множеств U, W
и указаны подходящие граничные условия.
Можно сразу избавиться от неудобных постоянных w, рас-
рассматривая пару (х, w) как точку пространства более высокой
размерности и присоединяя к ограничениям дифференциальное
уравнение
которое обеспечивает постоянство w вдоль траектории. Затем
к граничным условиям следует добавить еще такое: начальные
или конечные значения проекции w пары (х, w) должны лежать
в W. Значит, постоянные параметры изменяют только размер-
размерность и граничные условия в нашей основной задаче. Так как
размерность всегда была в нашем распоряжении, то это только
означает, что мы должны теперь рассматривать граничные усло-
условия значительно более общего вида. Таким образом, наша задача
опять состоит в минимизации интеграла
$/(<• х, u)dt
для траекторий x(t) и управлений u(t), удовлетворяющих огра-
ограничениям
x = g(t, х, и),
где u(t) принимает значения в множестве U, a x(t) удовлетво-
удовлетворяет соответствующим граничным условиям.
Удобно ввести еще одно формальное упрощение, которое де-
делает эту задачу похожей на задачу об оптимальном быстродей-
быстродействии. Введем дополнительную координату х0, удовлетворяю щую
дифференциальному уравнению
Xo = f(t, X, U),
и снова обозначим через х и g пары (д;0, х) и (/, g). Далее, до-
добавим условие: л;0 = 0 в конце траектории, о котором, как и
в предыдущей главе, можно предположить, что он соответствует
моменту *=*0. Тогда наша задача превратится в задачу миними-
минимизации величины —х0 для траекторий x(t) и управлений u(t),
удовлетворяющих ограничениям
C1.1) x=g(t, х, и),
где u(t) принимает значения в (/, a x(t) удовлетворяет соответ-
соответствующим граничным условиям. Что касается этих граничных
условий, то, не нарушая общности, можно предположить, что,
с одной стороны, они определяют, как обычно, конечное значение
/ = 0, а с другой стороны, начальное и конечное значения тра-
траектории x{t), рассматриваемые как упорядоченная пара точек,
§ 32. Снова семантика 421
принадлежат некоторому заданному подмножеству В прямого
произведения я-пространства на себя. Иначе говоря, начальное
значение времени t не задается и не-ограничивается никаким
прямым способом. (Чтобы в этом убедиться, достаточно заменить
/ на t + t0 и рассматривать /„ как постоянный параметр и, кроме
того, ввести новую координату хп+1 с конечным значением О,
удовлетворяющую дифференциальному уравнению д:п+1 = 1.)
Задачу минимизации, сформулированную таким образом для
траекторий, удовлетворяющих ограничениям C1.1) и указанным
выше граничным условиям, мы будем в дальнейшем называть
управляемой празадачей. Удобно также рассмотреть несколько
другую задачу, которую мы назовем неуправляемой празадачей.
Обозначим через G(t, х) множество значений, которые принимает
вектор g(t, х, и), когда пара (t, x) фиксирована, а и изменяется
в U. Требуется найти минимум величины—хп для траекторий
x(t), удовлетворяющих указанным выше граничным условиям
и соотношению
C1.2) x£G(t, х).
В этой главе мы займемся не совсем этой празадачей, в управ-
управляемой или неуправляемой форме, а несколько другой, родствен-
родственной ей настоящей практической задачей.
§ 32
Снова семантика
Иногда приходится сталкиваться с задачами или вопросами, содержащими
в себе некоторое существенное предположение, которое может оказаться некор-
некорректным. В таких случаях говорят о некорректно поставленной задаче или непра-
неправильно сформулированном вопросе. За примерами не приходится далеко ходить:
их можно встретить в экзаменационных билетах, в вопросниках, начинающихся
словами: «Это займет у вас всего лишь несколько минут», и уж конечно в провин-
провинциальных газетах, в разделах, посвященных политике или судебной хронике.
Впрочем, чтобы никого не обидеть, упомянем лишь самые популярные примеры
неправильно поставленных вопросов:
«Вы все еще бьете свою жену?»
«Почему это луна сделана из зеленого сыра?»
В первом вопросе содержится оскорбительное предположение, во втором — так-
тактично выраженное неверие. В таких случаях наиболее уместно отвечать встреч-
встречными вопросами:
«Если вы всех мерите на свой аршин, к чему оскорблять людей?»
«А вы бы хотели, чтобы луна была сделана из леденцов?»
Вообще говоря, от некорректных вопросов нельзя просто отмахнуться; они
могут свидетельствовать о неблагополучном душевном состоянии задающего
вопрос илн о ненадежности источников его информации и заставляют нас при-
принять меры к исправлению положения. И хотя последняя задача может оказаться
для нас непосильной, мы все же обязаны подыскать подходящий ответ. Однако
прежде всего необходимо вскрыть истинный смысл вопроса, иными словами,
выяснить, что именно нуждается в исправлении. Вот тут-то и приходит на помощь
семантика.
422 Гл. III. Обобщенное оптимальное управление
Впервые мы встретились с семантикой в гл. VI первого тома. И вот еще одна
встреча, лишний раз показывающая, насколько тесио связаны многие разделы
математики с ее основаниями. Именно поэтому мы и включили в нашу консуль-
консультативную группу Логика. Однако в данном случае не столько Логик, сколько
Экспериментатор поможет нам переформулировать нашу празадачу.
Дело в том, что эта задача, сформулированная нами в том виде, в каком она
обычно встречается в книгах и статьях по вариационному исчислению н оптималь-
оптимальному управлению, содержит некорректные или вводящие в заблуждение допущения
и предположения. Мы ставим вопрос о нахождении минимума, в то время как он
вовсе не обязан существовать. Это напоминает случай с футболистом, у которого
спросили: «Что вы знаете о Пелопоннесской войне?» Его ответ: «Ничего» —был
правильным, но увы, привел к плачевному исходу. Если минимум существует,
мы хотим знать не только его значение, но и хотя бы одну траекторию x(t) н соот-
соответствующее управление u(t), для которых этот минимум достигается. Если же
минимума не существует, мы вместо этого хотим знать соответствующую точную
нижнюю грань н хотя бы одну последовательность таких траекторий и управле-
управлений, которые обеспечивают приближение к этой точной нижней грани. К концу
книги читатель уже настолько свыкся с этими допущениями, что склонен считать
их совершенно естественными. Между тем находящийся в составе нашей группы
Логик справедливо настаивает, чтобы в этот вопрос была внесена полная ясность.
Однако даже после того, как все это выяснено до мельчайших подробностей
н поставлены все точки над «и», остается, подобно некоему «табу», одно существен-
существенное допущение, которое находится в противоречии с фактами реальной жизни.
Чтобы понять это, не требуется ничего, кроме здравого смысла. Все можно объяс-
объяснить, прибегнув к анекдоту. Именно так и следует пользоваться семантикой —
в традиционной непринужденной сократовской манере, особенно если мы немного
устали после четырехсот с лишним страниц годового курса лекций.
Представим себе, что этот анекдот рассказывает наш приятель Эксперимен-
Экспериментатор во время перерыва за чашкой кофе, когда ему ужасно хочется взять реванш
у чистых математиков, подшутив над ними.
Два брата — учитель математики н инженер — задумали совместно при-
приобрести старый охотничий домик на вершине небольшой горы и переоборудовать
его под гостиницу, проложив к нему дорогу от ближайшей железнодорожной стан-
станции, расположенной в долине. Учитель математики когда-то прослушал курс лек-
лекций по вариационному исчислению. Он достал свои старые конспекты, чтобы
с их помощью попытаться отыскать такой путь от станции до домнка, на про-
прохождение которого автобусу потребуется наименьшее время. Учитывая, что авто-1
бус не может преодолевать слишком крутой подъем, он сформулировал соответ-
соответствующую вариационную задачу н, изрядно попотев, сумел-таки решить ее. Выяс-
Выяснилось, что задача имеет единственное решение, которому отвечает обыкновенная
кривая, причудливо извивающаяся вокруг горы, пересекая ущелья, водопады
и т. д. При этом время, которое затратит автобус при движении по такой дороге,
если она будет построена, составит ровно 36 минут. Учитель не пожалел сил на
доказательство того, что если дорогу проложить вдоль любой другой спрямляемой,
кривой, соединяющей станцию с домиком, то движение по ней отнимет больше.
времени. Наконец, ои прикинул, что строительство его дороги, включая возведе-
возведение пары мостов, обойдется, по самым скромным подсчетам, в двести тысяч долла-
долларов.
Тем временем инженер, действуя по шаблонной методике, набросал план не-
незамысловатого зигзагообразного подъема. Он подсчитал, что на поездку по его
дороге уйдет 37 минут, н что стоимость строительства такой дороги составит
только девяносто тысяч долларов. Этот анекдот, заключил рассказчик, показы-
показывает, насколько беспомощными в практических вопросах оказываются иногда
математики, и лишний раз говорит о том, что в любой практической ситуации,
лучше всего сначала провести экспериментальную проверку.
Читатель, наверное, уже заметил, что анекдот Экспериментатора имеет отно-
отношение к задаче Максвелла, о которой наряду с другими задачами шла речь в § 61
§ 32. Снова семантика 423
гл. VI т. I. В данном случае имеет место ситуация, когда наряду с обыкновенным
решением, которое нашел учитель математики, имеется еще и скрытое решение,
определяющее обобщенную кривую. Этого решения-ои не обнаружил. Инженер же,
в сущности, построил аппроксимацию этого обобщенного решения зигзагообразной
ломаной с конечным числом звеньев. Так что этот анекдот фактически говорит
о том, что обобщенные кривые имеют практическое значение даже в такой задаче,
которая уже обладает обыкновенным решением, и причина этого связана с возмож-
возможностью существования скрытого решения.
Такая возможность, конечно, не исключена и в случае непараметрической
вариационной задачи с закрепленными концами. Иными словами, существует
пара подинтегральных функций ft(t, х, х), f2(t, x, х), фиксированная пара точек
P,Q (t, ^-пространства, допустимая непараметрическая кривая Со, соединяющая
точки Р, Q, и последовательность непараметрических допустимых кривых С„,
концы которых Pv, Qv стремятся к Р, Q, причем
J/i«U =1, J/,«U = 1,
с:
J /,<tt —1, J/.Л—0.
С Г
и, кроме того, для любой допустимой непараметрической кривой С, соединяю-
соединяющей Р и Q и отличной от С„, имеет место неравенство
C2.2)
Не останавливаясь на деталях, отметим, что мы в состоянии обеспечить
соблюдение всех перечисленных выше условий и в том случае, когда допол-
дополнительно требуется, чтобы на рассматриваемых кривых значения производной х
лежали внутри некоторого достаточно большого фиксированного куба U. Тогда
можно ввести переменные xlt x2 и управляющие параметры и, удовлетворяющие
дифференциальным уравнениям
C2.3) Xi = h(t, х, и), x2 = f*(t, х, и), i = «.
Обозначим далее (х, xit x2) через х*, а множество упорядоченных пар точек
(t, х*)-пространства — через Во; при этом для начальной точки имеем (t, x) — P,
xl=x2 = O, а для конечной точки должно быть (t, x) = Q, Xj< I.
Теперь для фиксированного промежутка времени, являющегося проекцией
отрезка PQ, рассмотрим минимум ц (В„) значения х2 в конечной точке для
управляемых траекторий (t, х*)-пространства, удовлетворяющих уравнениям
C2.3) (где u£U), таких, что пара концевых точек принадлежит Во. Этот
минимум равен единице, так как класс рассматриваемых траекторий состоит
лишь из одного представителя, который и дает искомое значение для х2.
Однако для траекторий, у которых пара концевых точек лежит сколь угодно
близко к Вр, в качестве соответствующих значений для хй можно взять
интегралы от f2 вдоль Cv стремящиеся к нулю. В случае когда промежуток
времени ие фиксирован, все обстоит совершенно аналогично. Чтобы убедиться
в этом, достаточно, как уже говорилось, ввести дополнительную переменную х0,
такую, что х0 = 1.
Как только нашему другу Экспериментатору растолковали, что именно в этом
и состоит истинный смысл рассказанного нм анекдота, ои воскликнул: «Но тогда
задача оптимального управления в той постановке, которая отняла у нас столько
сил, никуда ие годится! Ведь я не в состояини отличить траектории, концы кото-
которых принадлежат Во, от траекторий с бесконечно мало смещенными концами!
Вы иогда-иибудь слышали, чтобы ракета пролетела мимо Луны на расстоянии
424 Гл. III. Обобщенное оптимальное управление
одной миллиардной доли дюйма?! А уж при мягкой посадке на Луну о такой мелочи
и говорить не приходится!»
После кофе все сходятся на том, что вряд ли стоит возобновлять обсуждение
празадачи: основной прогресс, как часто бывает, достигнут во время перерыва.
Экспериментатор, как наиболее практичный человек в нашей группе, подводит
итог: «Мне кажется, что наши математики убедили нас в пользе идей вроде обоб-
обобщенной кривой. Почему бы не попросить их подготовить сообщение на эту тему,
чтобы потом собраться и обсудить его?»
§ зз
Стандартные управления и скользящие режимы
в дифференциальных уравнениях
Наше определение обобщенной кривой, приведенное приме-
применительно к параметрическому случаю в томе I, включало поня-
понятие локальной турбулентности, которая равносильна замене ка-
касательного вектора х такой мерой на множестве этих векторов,
что результирующий вектор направлен вдоль описываемого пути.
Соответствующее понятие для непараметрического случая не-
несколько проще, и именно его мы должны приспособить к опти-
оптимальному управлению. В непараметрическом случае вектор х
заменяется такой мерой, что производная по времени от точки
(t, x(t)) равна интегралу от A, х) по этой мере. В частности,
полная мера равна единице. Мы будем называть эту меру, ко-
которая, конечно, неотрицательна, нормированной мерой или веро-
вероятностной мерой.
Например, в случае бесконечно мелкого зигзага, расположен-
расположенного вдоль оси t плоскости (t, x) и имеющего наклоны х = ±1,
эту вероятностную меру в любой точке оси t можно получить,
приписав каждому из двух наклонов вес-д-.
Далее, допустимую непараметрическую кривую можно рас-
рассматривать как управляемую траекторию, на которой движу-
движущаяся точка x(t) удовлетворяет дифференциальному уравнению
х = и.
Это означает, что вектор скорости непосредственно управляем
и что он совпадает со значением управления и. Подобно этому
в обобщенном случае управлению и должна соответствовать
вероятностная мера, а действительная скорость x(t) равна инте-
интегралу от и по этой мере; специалист по теории вероятностей
назвал бы эту скорость математическим ожиданием управления
и для этой вероятностной меры. В случае траектории, соответ-
соответствующей в (t, ^-пространстве нашему бесконечно мелкому зиг-
зигзагу, движущаяся точка x(t) может рассматриваться как некий
управляемый объект, скажем корабль или подводная лодка,
у которого регулятор скорости установлен так, чтобы скорость^
§ 33. Стандартные управления и скользящие режимы 425
была максимальной, а направление хода постоянно переклю-
переключается с переднего на заднее, так что объект фактически стоит
на месте. Этот пример может показаться искусственным. Однако
в военное время обычной процедурой является противолодочный
маневр, состоящий в том, что корабль идет полным ходом, быстро
меняя направление и продвигаясь весьма незначительно; очевидно,
что этот маневр тесно связан с рассмотренным выше примером.
По аналогии с этим примером значения управления и £ U
можно вообще рассматривать как частные случаи вероятностной
меры на U. Каждую такую меру мы будем называть мгновен-
мгновенным значением управления типа скользящего режима или просто
значением v скользящего режима и будем говорить, что оно
сводится к значению и стандартного управления, если эта мера
полностью сконцентрирована в точке и. Обозначим через V
множество значений v всевозможных скользящих режимов,
т. е. множество неотрицательных единичных мер на множестве И.
Таким образом, можно считать, что UcV, и это обстоятель-
обстоятельство учитывается в дальнейшем в наших обозначениях следую-
следующим образом. Пусть в U задана непрерывная функция <р(ы);
через ф(у) обозначим интеграл от этой функции по мере v£V.
Тем самым символом ф (i>) обозначено продолжение на V функции,
первоначально определенной в U. Очевидно, что если v вы-
вырождается в значение и стандартного управления, то соответ-
соответствующее значение функции ф (и) совпадает со значением ф (и)
в первоначальном смысле. Мы будем пользоваться аналогичным
обозначением и в том более общем случае, когда функция ф
зависит, кроме и, от других переменных. Например, если функ-
функция ф(^, х, и) непрерывна по (t, х, и), то символом ф(^, к, v)
будет обозначаться при фиксированных (/, х) интеграл от
^, х, и) по вероятностной мере v на U.
Понятие стандартного управления (управляющей функции)
получается посредством введения зависимости значения управ-
управления от времени. Аналогичную функцию v(t), определенную
на интервале оси t и принимающую значения из V, назовем
скользящим режимом; таким образом, ее значения — это вероятно-
вероятностные меры на U. Но из практических соображений мы потребуем
еще, чтобы наши стандартные управления и скользящие режимы
в самом деле чем-нибудь управляли. Ведь существует слишком
много приспособлений и так называемых управляющих устройств,
которые не действуют: стартер, не запускающий мотор; рукоятка
телевизора, поворот которой дает на экране только неясные очер-
очертания; «меланхоличный» кран, из которого весь день каплет вода,
но который пропускает лишь слабую струйку, когда его откры-
открывают. Эффективные1' управления — это управления, которые всегда
11 В оригинале honest. — Прим. ред.
426 Гд- Ш- Обобщенное оптимальное управление
работают, а не являются дойной коровой для ремонтирующего
их мастера. Так вот, стандартное управление и (t) должно управ-
управлять стандартной траекторией при помощи дифференциального
уравнения
C3.1) x(t)=g[t, x(t), u(t)].
Точно так же скользящий режим служит не просто украшением,
а управляет при помощи аналогичного дифференциального урав-
уравнения
C3.2) x(t)=g[t, x(t),v(t)]
более общей разновидностью траектории x(t), которую мы назо-
назовем «мягкой». Если u(t), v(t) — эффективные управления, то
должна существовать по крайней мере одна траектория x(t),
удовлетворяющая соответствующему дифференциальному уравне-
уравнению. В нашем случае производная x(t) всегда измерима, а по-
потому правая часть должна быть измеримой для каждой функции g,
которая (скажем) непрерывна по (/, х, и). Таким образом, эффек-
эффективные управления, будь то стандартные управления или сколь-
скользящие режимы, не совсем произвольны.
Остальная часть этого параграфа будет в основном посвящена
анализу весьма практического требования, состоящего в том,
чтобы наши управления были эффективными. Оказывается, что
это требование сводится к очень умеренному условию измери-
измеримости. Именно поэтому в теории управления приходится теперь
рассматривать вопросы измеримости, к которым даже аналитики
склонны относиться пренебрежительно.
В дальнейшем U будет, как обычно, ограниченным замкнутым
множеством в евклидовом пространстве. Значительно более общие
случаи выбора множества 0 рассмотрены в статьях Варги и Мак-
Шейна — Уорфилда, к которым мы и рекомендуем обратиться
читателю. В предыдущей главе U могло быть множеством весьма
общего вида, и мы шли на это в основном для того, чтобы можно
было подставить вместо U наше множество V. Теперь же мы
одновременно рассматриваем U и V и поэтому не нуждаемся
в такой подстановке. Следовательно, мы можем снова ограничить
общность множества U, так как на практике точки этого множе-
множества задаются просто положениями стрелок на конечном числе
шкал.
При таких обстоятельствах мы называем стандартное управ-
управление и (t) измеримым, если вектор-функция и (t) измерима
в обычном смысле, т. е. если ее компоненты являются действи-
действительными измеримыми функциями. Но мы сразу отождествим
это требование с другим, которое дает более удобное определение:
стандартное управление u(t) измеримо, если для каждого поли-
§ 33. Стандартные управления и скользящие режимы 427
нома р(и) от компонент и сложная функция p(u(t)) измерима.
Взяв в качестве р (и) одну из компонент вектора и, убеждаемся
в том, что это требование является достаточным; оно является
также и необходимым, ибо сумма и произведение измеримых
функций тоже измеримы.
Теперь можно обобщить это определение: скользящий режим
v(t) будем называть измеримым, если для каждого полинома
р(и) от компонент вектора и функция p(v(t)) измерима.
Из этих определений следует, что если стандартное управле-
управление u(t) (или скользящий режим v(t)) измеримо, a g(t, и) —
любая непрерывная по (t, и) функция с действительными или
векторными значениями, то функция g(t, u(t)) (или g(t, v(t)))
измерима. Достаточно убедиться в этом в случае действительной
функции g и конечного интервала Т времени t. Так как на мно-
множестве TxU функция g(t, и) является равномерным пределом
полиномов, то, не нарушая общности, можно предположить, что
сама функция g(t, и) является полиномом, если мы будем иметь
в виду, что предел последовательности измеримых функций всегда
является измеримой функцией. Но если g(t, и)—полином, то
g(t, u(t))—конечная сумма членов вида tvgv(u(t)), где gv(u)—
полином по и; эти члены—измеримые функции, следовательно,
их сумма g(t, u(t)) измерима.
Так же как в случае измеримых функций, мы будем отожде-
отождествлять два измеримых управления (стандартные управления или
скользящие режимы), если они совпадают почти всюду. Далее,
мы будем требовать, чтобы дифференциальные уравнения C3.1) и
C3.2) выполнялись лишь почти всюду; это компенсируется пред-
предположением, что функция x(t) является абсолютно непрерывной.
Если g(t, х, и) — непрерывная функция, то существование такого
абсолютно непрерывного решения x(t) уравнения C3.1) или C3.2)
для измеримого стандартного управления и (t) или измеримого
скользящего режима v(t) можно получить, обозначив через f(t, x)
функцию g(t, х, u(t)) или функцию g(t, х, v(t)) и применив
следующий известный результат:
C3.3) Существование решений задачи Коши для обыкновенных
дифференциальных уравнений. Пусть f (t, x)—вектор-функция
со значениями в х-пространстве, и пусть в некоторой окрест-
окрестности точки (/„, х0) она непрерывна по х для каждого t, изме-
измерима по t для каждого х и равномерно ограничена по (t, x). Тогда
существует абсолютно непрерывная функция x(t), определенная
в некоторой окрестности точки t0, такая, что х (t0) = х0 и
x(t) = f(t, x(t))
почти всюду в этой окрестности.
428 Гл. III. Обобщенное оптимальное управление
Доказательство этой общей теоремы существования для задачи Коши полу-
получается объединением стандартных численных методов с довольно простым случаем
применения понятия равностепенной непрерывности; подобные методы стали шаб-
шаблонными в теории дифференциальных уравнений с частными производными. Эта
теорема, в несколько иной форме, приводится в книге Каратеодори о функциях
действительного переменного, опубликованной более пятидесяти лет назад, так
что она является стандартной и даже классической. Однако эта теорема всегда
казалась какой-то кривобокой, так как в ней предполагается непрерывность по х,
а по / — всего лишь измеримость; только в рамках современной теории оптималь-
оптимального управления это стало естественным, так что в этом смысле она весьма совре-
современна. До последнего времени для приложен»*! было вполне достаточно более
старой теоремы существования, приведенной в § 19 гл. I т. I, и нам самим в томе I
не представилось случая использовать какую-нибудь другую теорему существо-
существования. Подобно этому, до недавнего времени никто ие рассматривал автомобиль
как необходимость, и даже теперь никому не нужен мощный автомобиль для того,
чтобы одолеть расстояние в несколько кварталов; однако необходимо иметь воз-
возможность быстро передвигаться в экстренных случаях, например когда нужно
срочно доставить ребенка в больницу для оказания скорой помощи. В теории
управления теорема C3.3) представляет собой мощное средство той же общей
природы: она необходима для стохастических управлений, которые мы здесь не
затрагиваем, и она необходима для того, чтобы доставить нам «скорую помощь»
в виде теорем существования для задач оптимального управления. Кстати говоря,
методы настоящей главы оказываются иногда очень близкими к стохастическим
методам.
Доказательство теоремы C3.3). Согласно условиям теоремы,
существует такая постоянная М, что \f(t,x)\<M в некоторой
окрестности точки (/0, х0). Для малого а > О эта окрестность
содержит множество Е точек (t, x), для которых
C3.4) |*-*.|<а, |*-дго|<Лф-/,|,
а для малого 6 > 0 она содержит (так как Е замкнуто) множе-
множество Е(, точек, расположенных на расстоянии < 6 от Е. Значит,
в £6 выполняется неравенство |/(/, х)\<М.
Будем считать теперь интервал \t—<0|^а интервалом опре-
определения искомой функции x(t). Мы должны построить на нем
такую функцию x(t), что
C3.5) x(f) = *„ + $/(т. *(T))dT.
Ясно, что достаточно сделать это на интервале to^^o\
Пользуясь методом, который применяют специалисты по чи-
численному анализу, мы сначала решим аналогичную задачу для
конечной сетки, т. е. задачу, в которой /-интервал заменен ко-
конечным числом точек tv, где v —0, 1, ..., N. Предположим, что
эти точки разбивают наш интервал на N равных частей длины < 6,
и что они упорядочены в порядке возрастания, причем tN=t0 + a.;
Наша конечная задача будет состоять в определении значений xv, •*'
v = 0, I, .... TV, соответствующих моментам времени /v (причем'
§ 33. Стандартные управления и скользящие режимы 429
в момент t0 это значение равно заданному х0), таких, что
C3.6) xv—лч,_! =
Это уравнение является конечно-разностным аналогом нашего
дифференциального уравнения. Чтобы решить его, предположим
по индукции, что значение xv_t найдено и что (^v-i> *v-i)££-
Тогда в подинтегральном выражении в правой части (т, jcv_1) € £ei
так что это подынтегральное выражение по абсолютной величине
<Л4 и измеримо по т, поскольку xv_1 — постоянная. Значит, ин-
интеграл существует и равенство C3.6) определяет xv. Легко про-
проверить, что (^v, xv) лежит в Е, и это завершает шаг индукции.
Найдя решение конечно-разностной задачи, обозначим через
Фдг(О ступенчатую функцию, принимающую значение xN в tN и
xv при tv^t <tv+i (v = 0, 1 N—1). Тогда для каждого t
из интервала to^Zt ^to-\-a точка (t, ф#@) лежит в £6. Следо-
Следовательно, f(t, фд,(/)) —измеримая функция, а ее абсолютная
величина < М. Положим
C3.7)
Очевидно, что семейство функций i]),v равностепенно непрерывно
и равномерно ограничено, поэтому существует равномерно схо-
сходящаяся подпоследовательность, вдоль которой N ->оо и пределом
которой является функция х (t), удовлетворяющая условию
Липшица. Из C3.6) видно, что 'Фл'(О = Фл'(О ПРИ ^ = ^v>
v = 0, I, ..., N. Следовательно, при tv^Lt <tv+l
t
C3.8) гМО-<М')= J/(x,
так что по абсолютной величине эта разность не превосходит Ma/N.
Отсюда следует, что ц>^/{(), так же как и tyx(t), стремится
Kx(t), когда N — оо вдоль выделенной подпоследовательности; зна-
значит, ввиду непрерывности f при постоянном /, функция f(t, x(t))
является пределом ограниченной сходящейся последовательности
измеримых функций f(t, (f^(t)), и потому измерима. Кроме
того, по той же самой причине можно в C3.7) перейти к пределу
под знаком интеграла при N ->-оо вдоль той же подпоследова-
подпоследовательности; тогда мы получим C3.5). Это завершает доказатель-
доказательство, так как правая часть равенства C3.5) абсолютно непре-
непрерывна, имеет начальное значение х„ и ее производная почти всюду
существует и равна f{t, x(t)).
430 Гл. III. Обобщенное оптимальное управление
Пример. Наделив V топологией, индуцированной штрих-топологией про-
пространства $о (U), покажите, что измеримость v (/) в смысле данного выше оп-
определения эквивалентна тому, что для каждого бикомпактного подмножества
QdV множествотех значений t, для которых v(t)£Q. измеримо.
Набросок решения. Во-первых, следует отметить, что приведенное выше
условие эквивалентно его частному случаю, когда Q— любой замкнутый шар
в смысле штрих-нормы. Если 5*—множество полиномов р\(и) с рациональными
коэффициентами, такое, что штрих-норма для pv не превосходит I, то это
условие означает, что для каждой точки vo£V и каждого а > 0 множества
значений /, для которых (v(t)—v0) pv < а, имеют при v = l, 2 т. е.
при pv 6^- измеримое пересечение. Но, согласно нашему определению, эти
множества измеримы, если v(t) — измеримая функция, а тогда нх пересечение
тоже измеримо.
Во-вторых, из рассматриваемого условия следует, что если f(v), v£V,—
действительная функция, непрерывная в штрих-топологии множества V, то
сложная функция, которую мы условились обозначать через f(v(t)), измерима
в обычном смысле. Это имеет место, в частности, и тогда, когда f(v) — интег-
интеграл по мере v от непрерывной функции f (и), uQU, как это и было в рас-
рассмотренном здесь случае.
§ 34
Принцип отдыха на полпути и лемма Филиппова
Итак, наше практическое требование, состоящее в том, что скользящие ре-
режимы, и в частности стандартные управления, должны быть эффективными, равно-
равносильно их измеримости. На этой стадии заурядный аналитик был бы склонен счи-
считать вопрос исчерпанным, так как, по его мнению, неизмеримые функции встре-
встречаются довольно редко, если вообще встречаются. Но часто именно практическим
требованиям труднее всего удовлетворить, ибо никакие два человека ие могут до-
договориться, в чем оии должны состоять. Во всяком случае, не каждый сразу сог-
согласится, что те управления, которые мы назвали эффективными, действительно
заслуживают этого названия. Мы потребовали от v(t), чтобы для каждой непрерыв-
непрерывной функции g(t, х, и) существовало решение x(t) соответствующего дифферен-
дифференциального уравнения C3.2). Возражающих можно разделить на две категории.
«Ястребы» будут возражать, что решение х@, которое для заданного скользя-
скользящего режима v(t) только существует, но не является, в некотором смысле, един-
единственным, можно назвать совместимым с этим управлением, но оно вовсе нм не
управляется. Иначе говоря, наше управление в сущности ие является управле-
управлением и потому не может быть названо эффективным. Это возражение мы рассмот-
рассмотрим в следующем параграфе, прежде чем перейти к выяснению связи между всем
сказанным выше и нашей празадачей.
С другой стороны, «голуби» будут возражать, что «эффективность» в нашем
смысле — условие слишком сильное; вместо того чтобы заниматься разреши-
разрешимостью всех дифференциальных уравнений, соответствующих всевозможным
непрерывным функциям вида g(t. x, и), мы могли бы ограничиться требованием
существования решения для одной-едииственной функцииg(t, к, и), которая вхо-
входит в формулировку задачи. Иначе говоря, эта критика относится к универсаль-
универсальности нашего требования, которая напоминает приказ администрации строить
дома в тропиках н на Северном полюсе по тому же проекту, что в Вашингтоне
(округ Колумбия) или в Лондоне, н всюду одевать служащих в одинаковую уни-
униформу. Конечно, ни одна администрация ие издает таких приказов, ио всем нам
хорошо знакомы примеры произвола н бессердечия бюрократической машины.
Достаточно вспомнить случай с британскнмн солдатами в пустыне у Тобрука, когда
оии добывали каждую каплю воды под огием противника н тем ие менее, согласно
приказу, должны были ежедневно бриться. На фоне таких примеров человеческой
§ 34. Принцип отдыха на полпути и лемма Филиппова 431
глупости критика универсальиости иашего требоваиия выглядит весьма уместиой,
и настоящий параграф будет посвящен ответу на это возражение, который ока-
окажется неожиданным: как это ни странно, требование эффективности управления
в нашем смысле оказывается вовсе не слишком суровым; именно в этом суть леммы
Филиппова.
Начнем с одного важного принципа. Для этого обозначим
через Р, Q топологические, а через/?—измеримое пространства,
удовлетворяющие условиям, которые мы сформулируем ниже.
Под измеримым пространством мы подразумеваем множество,
в котором задано о-кольцо (или аддитивное семейство) подмно-
подмножеств, называемых измеримыми подмножествами. Отображение
такого пространства в топологическое пространство назовем изме-
измеримым, если прообраз каждого бикомпактного множества является
измеримым.
Рассмотрим пространство Q, находящееся в некотором смысле
«на полпути» от R к Р. Упомянутый принцип состоит тогда в
следующем:
отображение р**
C4.1) Принцип отдыха на полпути1' (Мак-Шейн и Уорфилд).
Предположим, что заданы непрерывное отображение р* из Q в Р
и измеримое отображение р** из R в Р, такие, что
p»(R)c=p*(Q)c:P.
Тогда существует измеримое отображение q* из R в Q, такое,
что p** = p*q*.
Что касается условий на пространства Р, Q, R, то нам по-
понадобится только тот случай, когда Р есть n-мерное евклидово
пространство, R—интервал действительной прямой, а измери-
измеримость понимается в смысле Лебега. Однако ничего не стоит
взять вместо этого в качестве Р любое хаусдорфово пространство,
а в качестве R—любое измеримое пространство; это мы и будем
11 В оригинале просто Halfway principle. Вместо того чтобы тащиться по
измеримой дороге из R в Р, мы добираемся до Q, останавливаемся на полпути
и затем со свежими силами отправляемся по удобной непрерывной дороге из
Q в Р. —Прим. ред.
432 Гл. III. Обобщенное оптимальное управление
предполагать повсюду. Осталось только указать условия на Q,
и в связи с этим мы рассмотрим три различных случая:
(a) Q — Б...и-компактное метрическое пространство;
(b)Q—сепарабельное метрическое пространство;
(с) Q —замкнутое подмножество множества неотрицательных
действительных чисел.
В тех случаях, когда Q удовлетворяет соответственно усло-
условиям (а), (Ь) или (с), мы будем ссылаться на наш принцип, как
на C4.1а), C4.1Ь) или C4.1с). Для наших целей понадобится
только C4.1а), а C4.1с) будет промежуточным этапом доказа-
доказательства. Что касается C4.1Ь), то это наиболее удобная форма
принципа, но она опирается на континуум-гипотезу, и для озна-
ознакомления с доказательством мы рекомендуем читателю работу
Мак-Шейна и Уорфилда, в которой рассматриваются также неко-
некоторые обобщения случаев (а) и (Ь). Вряд ли нужно говорить,
что C4.1Ь)—весьма замечательная теорема, представляющая
интерес даже в таком частном случае, когда Р и R совпадают,
а р**—тождественное отображение. Читателю обязательно нужно
познакомиться с тем, как Мак-Шейн и Уорфилд используют кон-
континуум-гипотезу для получения такого сильного и осязаемого
аналитического результата. Но и доказательство утверждения
C4.1а), или скорее его редукция к C4.1с), также представляет
интерес; чтобы провести это доказательство, вспомним определе-
определение и основное свойство знаменитого канторова множества.
Большинству читателей канторово множество знакомо, так как оно обычно
приводится в качестве примера в самом начале теории множеств. Однако удиви-
удивительно, что такая глубина обнаруживается уже в самой элементарной из kohcti
рукций, которыми мы обязаны Кантору. Из единичного интервала действительной
оси удалим открытый подинтервал, состоящий нз его средней трети, от 1/3 до 2/з>
Из каждого из двух оставшихся интервалов удалим открытые средние трети.
На n-м шаге у нас останется 2" замкнутых интервалов длины 3~" и мы удалив
их средние трети. Если продолжить этот процесс неограниченно, то оставшиеся
точки составят множество Н, которое называют канторовым совершенным множе-
множеством, или канторовым дисконтинуумом. Оно состоит из точек вида
00
*= 2 °v^"V' где av = 0 или 2.
v=l
§ 34. Принцип отдыха на полпути и лемма Филиппова 433
Поставив в соответствие каждой такой точке сумму
v=l
мы получим непрерывное отображение множества Н на единичный интервал.
Функция g обладает единственным монотонным продолжением иа единичный ин-
интервал, которое непрерывно на этом интервале и, кроме того, постоянно на каж-
каждом подинтервале, дополнительном к Н. В частности, это продолжение имеет
равную нулю производную на удаленных интервалах, а значит, почти всюду, ибо
Н — множество меры нуль (в этом можно убедиться простым вычитанием суммы
длин удаленных интервалов). Все это имеет отношение к вариационному исчисле-
исчислению постольку, поскольку такие функции должны быть исключены при введении
понятия допустимой кривой, как было объяснено в § 55 (Ь) гл. V т. I.
Как и следует ожидать, канторово множество является источником много-
многочисленных контрпримеров в анализе, часто совсем не очевидных. Например,
когда одна теорема автора этой книги была приведена в книге Сакса «Теория инте-
интеграла» с неправильным доказательством (принадлежащим Саксу), автор этой
книги, чтобы навести ясность, как раз построил подобный контрпример и при этом
случайно изобрел метод, который позднее использовал Малхолленд для решения
так называемой задачи Гёце.
Однако гораздо интереснее использовать канторово множество для получе-
получения положительных результатов, а не контрпримеров; это связано с менее оче-
очевидными его свойствами. Одно такое свойство, обнаруженное Урысоном, окажется
здесь весьма полезным. Объединяя отображение g множества Н с гильбертовским
отображением единичного отрезка иа единичный квадрат, получаем отображение
множества Н на этот единичный квадрат; используя аналогичный прием, можно
отобразить Н на бесконечномерный гильбертов параллелепипед. Каждое сепара-
бельное метрическое пространство можно рассматривать как подмножество
гильбертова параллелепипеда, следовательно, оно является непрерывным образом
подмножества из Н. В случае Б...и-компактного метрического пространства спра-
справедливо более сильное утверждение. В обычных книгах по топологии (например,
в книге Дж. Г. Хокинга и Г. С. Янга, теорема 3.28 '•) можно найти следующее
утверждение:
C4.2) Урысоиовское свойство канторова множества. Каждое
Б...и-компактное метрическое пространство является непрерывным
образом канторова множества Я.
Доказательство того, что из C4.1с) следует C4.1а). Обозна-
Обозначим через q непрерывное отображение канторова множества Я
на Q, а через р—отображение p*q. Так как Q=q(H), то
Значит, если"в C4.1с) вместо Q взять Я, то все условия будут
выполнены, и поэтому найдется измеримое отображение h из R
в Я, такое, что р** = рп. Введя обозначение q* — qh, получим,
с одной стороны, что
Р** = (p*Q) h = Р*Я*,
" Или в книге П. С. Александрова «Введение в общую теорию множеств и
функций», Гостехиздат, 1948, гл. VII, теорема 24. Напомню, что Б...и-компакт-
Б...и-компактное метрическое пространство есть не что иное, как компакт в смысле
П. С. Александрова — П. С. Урысона. — Прим. ред.
434
Гл. III. Обобщенное оптимальное управление
а с другой стороны, что q* является измеримым отображением,
так как для Б...и-компактного множества Q с: Q
ЮФ где H = q
так что Н—Б...и-компакт, a (<7*)~Х(Ф измеримо.
Мы видим здесь, сколь мощным орудием является свойство
C4.2).
Прежде чем перейти к доказательству принципа C4.1с), заметим, что в слу-
случае отображения / из R в замкнутое множество Q действительных чисел действи-
действительная функция f(r), r£R, определяемая этим отображением, измерима на Я
в обычном смысле (т. е. множество значений г, для которых f (r)<a, измеримо для
каждого действительного числа а) тогда и только тогда, когда отображение / из-
измеримо в смысле этого параграфа. Это замечание упростит проверку свойства из-
измеримости. Чтобы обосновать его, отметим, что для измеримого отображения /
измеримо множество f(r) <a, так как оио представляет собой счетное объединение
множеств вида — v< f(r) «йа. Обратно, пусть множество /(л) sg а измеримо для
любого действительного а. Тогда при помощи счетного объединения мы получаем
измеримость множества f(r)<b, а при помощи перехода к дополнению — измери-
измеримость множества a<f(r). Отсюда, взяв пересечение, убеждаемся в измеримости
множества a<f(r)<b, и, далее, посредством операций счетного объединения и
перехода к дополнению получаем измеримость прообраза любого замкнутого
(и, в частности, любого бикомпактного) подмножества из Q.
Доказательство принципа C4.1с). Назовем усечением прост-
пространства Q в точке /2~* и обозначим через
где k, I—целые числа, множество точек q£Q, таких, что
Далее, введем обозначения
Здесь некоторые множества могут оказаться пустыми, и тогда
пустыми будут, конечно, и их образы или прообразы. Отметим
§ 34. Принцип отдыха на полпути и лемма Филиппова 435
также, что имеет место тождество
C4.3) Ры~ Pk+i,u U Pk+uti-i'
это следует из того, что правая часть равна объединению разнос-
разностей р*А—р*В и р*В—р*С, где ЛгэВзС, и, следовательно, ее
можно записать в виде р*А—р*С\ здесь А, В, С—усечения про-
пространства Q, соответствующие индексам
{k + \, 21), {k+l, 21-1), (k+1, 21-2).
Далее, заметим, что прообраз разности всегда равен разности
прообразов; например, если через А, В обозначены подмножества
из Р, то (р**)~1(А — В) есть множество точек r£R, таких, что
/?•*(/-)€ Л и р**{г)(£В, или таких, что г ^(р**)'1 А и г^(р**)~1В,
а это и есть множество (р**)'1 А— (р**)'1 В. Отсюда следует, что
множества Rkl являются разностями измеримых множеств и, зна-
значит, измеримы. Очевидно также, что для фиксированного k мно-
множества Rkl (/ = 0, 1, ...) не пересекаются, и то же верно для
множеств Ры и множеств Qkl.
Теперь для непустого множества Qkt положим
qkl = inf Qhl
и определим измеримую функцию qk (r), r £ R, полагая
4k{r) = qkl, когда r£Rkl (/ = 0,1,...)-
Очевидно, что следует рассматривать только те k, l, для кото-
которых Rkl непусто, и тогда Pkl, Qkl тоже непусты. Кроме того,
из C4.3) и соответствующих тождеств для Q, R видно, что мно-
множества Rkl, содержащие заданную точку г £ R, а также соответ-
соответствующие множества Pkl, Qkl, образуют монотонно убывающую
(по включению) последовательность, когда k возрастает. Значит,
с одной стороны, qk(r), как точная нижняя грань такой после-
последовательности множеств, монотонно возрастает при увеличении k\
с другой стороны, значения этой функции никогда не превосходят
точной верхней грани соответствующего начального множества Qo/.
Таким образом, функции qk(r), r£R, образуют возрастающую
последовательность с предельной функцией q*{r), r£R, которая,
очевидно, измерима и принимает значения только в Q.
Осталось показать, что отображение q* из R в Q, определен-
определенное этой функцией, удовлетворяет тождеству p** = p*q*. Предпо-
Предположив противное, мы должны получить противоречие. Для этого
зафиксируем точку r0 £ R, в которой
Для каждого k существует только один индекс /, такой, что
г0 6 Rkn и мы опустим индекс / из наших множеств, когда он
принимает это значение. Далее, для этого / обозначим через Дй
436 Гл. III. Обобщенное оптимальное управление
замкнутый интервал действительной оси с концами (/—1J~*,
/2~*. Из формулы для разности
р*А —р*В<=р*(А — В),
когда А гэ В, получим, что
C4.4) Р,ср*«ЭПД*).
Кроме того, заметим, что ДЛ (в силу соотношения для R,
аналогичного C4.3), определяющего тот способ, по которому /
меняется вместе с к) образуют последовательность вложенных
интервалов, длины которых стремятся к нулю, и так как они
пересекаются с Q, то они имеют в качестве общего пересе-
пересечения единственную точку qo£Q. Напишем pn = p*(q0) и обозна-
обозначим через О любую окрестность точки р0. Для всех больших k
из C4.4) и непрерывности отображения р следует, что
C4.5) ~Рк с О;
здесь черта над буквой обозначает замыкание, и в соотношении
учтено, что множество в правой части C4.4) замкнуто.
С одной стороны, из C4.5) следует, что р**Со)€О, так как
г0 € Rk и P**Rk — Pk< и что Р** (го) = А). так как окрестность О про-
произвольна. С другой стороны, так как <7*(го)—точная нижняя грань
для Qk, то <7*(ro)€Qft и, следовательно, p*(qk(r0))&Pkcz0 для
всех больших k. Но qk{r0)—*q*(r0), и О—любая окрестность;
значит, ввиду непрерывности отображения р*, р* (q*(r0)) = рп.
Таким образом, P**(ro) = p*(q*(ro)), что противоречит нашему
предположению. Следовательно, теорема полностью доказана.
Теперь, после этой замечательной теоремы, возвратимся к на-
нашей задаче оптимального управления и опять обозначим через-
g(t, х, и) фиксированную непрерывную вектор-функцию. Об-*"
ластью U значений и является ограниченное замкнутое множество
евклидова пространства, а V, так же как раньше, есть простран-
пространство вероятностных мер v на U. Обозначим снова через G(t, x)
множество значений функции g{t, х, и), когда (t, л:) фиксированы,
а и изменяются в U. Далее, обозначим через G(t,x) множество значе-
значений функции g(t, х, v), когда (t, x) фиксированы, avизменяется в V.
Согласно теореме G9.1) из § 79 приложения I к т. I, множе-
множество G(t, x) представляет собой замыкание выпуклой оболочки
множества G {t, x). В нашем случае оно просто является выпук-
выпуклой оболочкой, так как выпуклая оболочка замкнутого множества
евклидова пространства замкнута. Однако в дальнейшем эти
свойства множества G(t, x) нам не понадобятся.
Теперь из C4.1а) мы выведем следующие результаты:
C4.6) Первое следствие. Пусть x(t) — непрерывная еектор-
функция, определенная на конечном интерпале времени Т, и пусть
§ 35. Единственность и ключевая лемма об аппроксимациях 437
z(t) —измеримая вектор-функция в Т, такая, что z(t)£G(t, х)
(или z(t)£G(t, х)). Тогда существует^ измеримое стандартное
управление u(t) (или скользящий режим v(l)), такое, что z(t) =
= g(t,x(t), u(t)) (или z(t) = g(t,x(t),
C4.7) Второе следствие (лемма Филиппова). Если, в част-
частности, x(t)—допустимая (неуправляемая) стандартная траекто-
траектория, удовлетворяющая соотношению x(t) £ G (t, x) [или допустимая
(неуправляемая) «мягкая» траектория, удовлетворяющая соот-
соотношению x(t)£G(t, x)] почти всюду, то существует измеримое
стандартное управление u(t) [или скользящий режим v(l)],
такое, что x(t) совпадает с соответствующей управляемой траек-
траекторией, удовлетворяющей дифференциальному уравнению
x(t) = g(t, x(t), u(t)) [или x(t) = g(t, x(t), v(t)))
почти всюду.
Второе следствие можно получить из первого, просто заметив,
что в этом случае хA) по предположению абсолютно непрерывна,
так что ее производная x(t) измерима и, значит, для нее почти
всюду выполняются условия, наложенные на z(t).
Для доказательства следствия C4.6) достаточно взять в C4.1а)
в качестве Р пространство пар (/, х), в качестве R — интервал Т,
а в качестве Q—произведение ТхО или TxV; отображения р*
и р** определяются функциями t, g(t, x(t), и) или t, g(t, x(t), v)
и t, z(t). Измеримое отображение q* определяет функцию /, u(t)
или t, v(t) с указанными выше свойствами.
Следствие C4.7) можно интерпретировать следующим образом:
если uo(t)—любое стандартное управление [или vo(t)—любой
скользящий режим], такое, что x(t)—соответствующая траек-
траектория, удовлетворяющая дифференциальному уравнению х —
= g(t, x(t), uo(t)) [или x = g(t, x(t), vo(t))], то существует такое
измеримое стандартное управление u(t) [или скользящий режим
v(t)], что дифференциальное уравнение остается в силе после
замены uo(t) [или vo(t)] на u(t) [или v(t)].
§ 35
Единственность и ключевая лемма об аппроксимациях
Мы уже ответили на возражения «голубей», теперь настал черед «ястребов».
Последним мы скажем, что они совершенно правы, но ... Они справедливо утверж-
утверждают, что эффективные управления должны на самом деле полностью определять
траекторию, удовлетворяющую заданным начальным условиям. Однако для этого
следует не столько ограничивать общность управлений u(t) или v(f), сколько
налагать дополнительное условие на непрерывную функцию g(t, x, и). Если мы
действительно хотим прибыть в нужное место, то, кроме умелого управления
ы@ или v(t), должен быть исправен управляемый механизму, ведь нельзя обви.-
438 Гл. III. Обобщенное оптимальное управление
нять водителя, если несчастный случай произойдет из-за того, что завод снабдил
автомобиль неисправным рулем. Поэтому мы потребуем, чтобы функция g удов-
удовлетворяла дополнительному условию.
Предположим теперь, что непрерывная функция g{t,x,u),
стоящая в правой части нашего дифференциального уравнения,
удовлетворяет условию Липшица относительно х:
C5.1) \g(t,x2,u)-g(t,xltu)
равномерно по (t, и). В этом случае, если мы введем обозначение
fit, x) для функции g(t,x,u{l)) [или g(t, х, v (/))],
где u(t) [или v(l)] — измеримое стандартное управление [или изме-
измеримый скользящий режим], то единственность траектории, управ-
управляемой дифференциальным уравнением C3.1) или C3.2) при задан-
заданных начальных условиях, вытекает из следующего известного
результата:
C5.2) Теорема единственности решения задачи Коши для
обыкновенного дифференциального уравнения x — f(t, x). Предпо-
Предположим, в дополнение к условиям теоремы C3.3), что для некото-
некоторого постоянного К функция f (t, x) удовлетворяет условию Лип-
Липшица
\f{t,x2)-f{t,xl)\^K-\x2-x1\,
когда (t, х,) и (t, лс2) лежат в некоторой окрестности N точки
(/0, x0). Тогда в некоторой окрестности точки t0 существует одна
и только одна абсолютно непрерывная функция x(t), такая, что
х{х))йт.
Доказательство. Так как мы уже доказали теорему существо-
существования C3.3), то нам остается только установить единственность.
Для этого предположим, что существуют два решения, и приве-
приведем это предположение к противоречию. Если мы напишем
x+xo(t) и f(t,x) вместо х и f(t,x)—f(t,xo(t)), где *„(/)—одно
из решений, то можно считать, что хо = 0, /(/, 0) = 0; кроме того,
положим to — 0. Тогда, согласно предположению, некоторое реше-
решение x(t) интегрального уравнения
x{t)=U{x, x(r))dx
не является тождественным нулем ни в каком интервале вида
||6 Выберем б < 1/К и обозначим через А > 0 максимум
§ 35. Единственность и ключевая лемма об аппроксимациях 439
величины |л:(<)| для |tf|^6. Тогда
и, следовательно, | х(t) | ^ КАЬ < А, что противоречит определе-
определению числа А как максимума.
Таким образом, теорема доказана.
С точки зрения анализа и классической теории дифференциальных уравне-
уравнений, эта известная теорема единственности выглядит еще более кривобокой, чем
теорема существования C3.3), которую она дополняет и которая датируется при-
приблизительно тем же периодом; здесь мы предполагаем еще большую гладкость по
х, а по / — только измеримость. Однако то, что раньше считали недостатком,
теперь превратилось в достоинство, так как эта теорема в точности отвечает зап-
запросам теории управления, где дифференциальное уравнение траекторий содержит
заданное управление, которое редко бывает непрерывным. Действительно, тео-
теорема C5.1) гарантирует, что измеримое стандартное управление или измеримый
скользящий режим и в самом деле обеспечивает движение вдоль траектории,
удовлетворяющей заданным начальным условиям; следовательно, такие управле-
управления можно считать эффективными, точно так же, как если бы они были гладкими
или удовлетворяли каким-нибудь другим ограничениям. Как мы еще увидим
в этой главе, они сыграют весьма важную роль.
Применяя теорему C5.2) к дифференциальным уравнениям
C3.1) и C3.2), в которых g теперь удовлетворяет условию C5.1),
мы можем уже не рассматривать окрестность N; посредством
разбиения можно убедиться в том, что единственность имеет
место для любого заданного интервала времени. На самом деле
условие C5.1) в полном объеме нам ненужно; достаточно, чтобы
оно выполнялось вдоль наших траекторий. Во многих задачах
траектории, которые пересекают заданное ограниченное подмно-
подмножество (t, ^-пространства и соответствуют заданному конечному
интервалу времени, автоматически оказываются равномерно ог-
ограниченными. Например, очевидно, что это справедливо в слу-
случае, когда функция g(t, х, и) равномерно ограничена, так как
t
g(T, *(т), v(x))dx
и правая часть этого равенства не может превосходить |л:(/0)|
более, чем на величину \t—to\, умноженную на постоянное число.
На практике g—непрерывно дифференцируемая функция, так что
если наши траектории равномерно ограничены, то C5.1) вдоль
них выполняется, причем К равно sup|gx| в подходящем огра-
ограниченном множестве (t, х, ы)-пространства.
В этом замечании условие ограниченности также не исполь-
используется в полной мере, оно должно выполняться для g только
вдоль наших траекторий. Интересно отметить, что это последнее
условие можно вывести из C5.1) следующим образом: предполо-
предположим, что g удовлетворяет условию C5.1), и пусть $"—семейство
440 Гл. III. Обобщенное оптимальное управление
траекторий, удовлетворяющих C3.1) или C3.2), которые пересе-
пересекают заданное ограниченное подмножество (t, ^-пространства и
соответствуют заданному конечному интервалу времени; тогда
элементы из <F равномерно ограничены и функция g равномерно
ограничена на этих элементах.
Для доказательства этого утверждения применяется тот же
трюк, который сработал в нашей теореме единственности. Этот
очень ловкий трюк состоит в том, что в рассуждениях происходит
что-то вроде удачного зацикливания: при оценке некоторой ве-
величины та же самая величина появляется в правой части умно-
умноженной на постоянный множитель, который < 1.
Так как ввиду непрерывности функция g ограничена на любом
ограниченном множестве пространства троек (/, х, и), то доста-
достаточно показать, что траектории х(t)£(¥ равномерно ограничены.
Произведя, если нужно, разбиение интервала времени, можно
предположить, что его длина не превосходит 1/2/С, где К—по-
К—постоянная из C5.1). Обозначая через („ момент времени /, в ко-
который траектория x(t) пересекает заданное ограниченное множе-
множество, или первый из таких моментов, мы получим либо равенство
x(t)-x{to)=lg{x,x(tB), u{x))dx + B.
и
где
t
B=\\g(i,x (т), и (x))-g (т, х (t0), и (т))} dx,
либо аналогичное равенство, в котором вместо и(х) стоит v(x).
Согласно C5.1), вторая из написанных формул показывает, что!
В|<1|/ — to\KA, где А—точная верхняя грань по / величины
x(t)—л:(*0)|, и, значит, \В\^А/2. С другой стороны, согласно
первой из написанных формул, А не может превосходить соот-
соответствующей точной верхней грани для | В | более, чем на равно-
равномерно ограниченную величину
x(t0), u{t))\dt,
где интеграл рассматривается на заданном интервале времени,
a u(t) можно заменить на v(t). Таким образом,
так что А^2М, что и доказывает наше утверждение.
При тех же предположениях мы попутно получаем, что эле-
элементы x(t) нашего семейства ¥ равностепенно непрерывны. В са-
самом деле, функция g(t, x(t), и) равномерно ограничена, а потому
§ 35. Единственность и ключевая лемма об аппроксимациях 441
абсолютная величина разности
t+h
x(t + h)-x{t) = [g{T.x\T), u(x))dx
t
не превосходит величины |ft|, умноженной на постоянное число,
причем это справедливо и в том случае, когда и (/) заменено на v(t).
В дальнейшем, когда мы захотим подчеркнуть зависимость
траекторий, определяемых уравнением C3.1) или C3.2) для за-
заданных управлений и начальных значений, от функции g(t, х, и),
удовлетворяющей условию C5.1), мы будем называть их стан-
стандартными или мягкими g-траекториями. В частности, мы будем
сравнивать их с /-траекториями, которые определяются аналогич-
аналогичным образом, когда g(t, x, и) заменяется непрерывной функцией
вида f(t, и), не зависящей от х. Этому сравнению и посвящена
приводимая ниже ключевая лемма, для доказательства которой
опять применяется все тот же ловкий трюк.
C5.3) Лемма об эквивалентных аппроксимациях. Пусть
f(t, u) = g(t, xn(t), и), гдеxn(t)—непрерывная функция на интер-
интервале времени Т; обозначим через xv @ и gv (/) (t € Т), v = 1, 2, ....
мягкие g- и ^-траектории, определяемые одними и теми же на-
начальными значениями xv и одними и теми же измеримыми сколь-
скользящими режимами vv(t). Последовательность xv(t) сходится к х0 (/)
равномерно в Т при v —* со тогда и только тогда, когда |v (О
сходится к xo(t) равномерно в Т.
Доказательство. Используя разбиение интервала Т, можно
предположить, что его длина |Г| не превосходит 1/2^, где К—
постоянная из C5.1). Введем обозначения
av = sup |xv@—*о (О I. *>v =sup||v(O
ttT teT
Применяя C5.1) и интегрируя по нормированной мере vv (t), по-
получаем неравенство
\g{t,xv(t), u)-g{t,xB{t).u)\^Kav,
в которое можно подставить vv(t) вместо и. Так как
t
xv(t)-iv(t) = 5 {g(t, xv(t), vv{r))~g{x, x0 (t), vv(т))} dx,
to
то отсюда
Следовательно,
-bv|<
442 Гл. III. Обобщенное оптимальное управление
так что by, лежит между V2flv и 3/2av, а отсюда, очевидно, сле-
следует справедливость нашего утверждения.
Здесь мы должны прервать наше изложение, чтобы познако-
познакомить читателя с некоторым вспомогательным материалом.
§ 36
Распределенные управлепия
Основные вопросы, рассмотрение которых стоит у нас на оче-
очереди, а именно отношение всего изложенного к нашей празадаче
и вывод автоматических теорем существования, редуцируются при
помощи ключевой леммы к вещам, уже изученным в томе I в связи
с теорией обобщенных кривых (§ 67 гл. VI). На самом деле ма-
материал, который понадобится нам здесь, проще и, как это обычно
бывает в теории управления, относится скорее к непараметриче-
непараметрической нежели к параметрической форме, которой мы там занима-
занимались. Поэтому мы включаем в наше изложение параграф, где'
этот материал представлен в наиболее приспособленном для
наших нужд виде, хотя это и приведет к повторению некоторых
рассуждений из тома I.
Некоторые из наших обозначений будут временными. Отметим,
что вместо вектор-функций f(t,u), о которых шла речь в пре-
предыдущих параграфах, здесь мы будем рассматривать только чи-
числовые функции, но в дальнейшем мы будем применять полу-
полученные в этом параграфе результаты к функциям со значениями
в и-мерном евклидовом пространстве, не оговаривая особо этих
тривиальных обобщений. Итак, через / здесь обозначается эле-
элемент функционального пространства %0(TxU) непрерывных дей-
действительных функций f(t,u), определенных на TxU, где U —
множество значений управления и, а Т — некоторый фиксирован-
фиксированный интервал времени. Обозначим через Д переменный подинтер-
вал из Т.
Для таких f, Д рассмотрим теперь функцию w от f, А, оп-
определенную посредством интеграла
C6.1) w(f,A)--
где v(t), t£T, — измеримый скользящий режим или, в частности,
измеримое стандартное управление. Как и раньше, подинтеграль-
ное выражение f(t, v(t))—это краткая запись для интеграла от/
по вероятностной мере v(t) на U при постоянном t. Точно так
же, как в случае риссовских мер, w можно рассматривать как
меру, a w(f, Д)—отождествлять с интегралом
J fdw.
дхс/
§ 36. Распределенные управления 443
Тогда естественно писать
C6.2) w = v(t)dt,
имея в виду, что в C6.1) мы на самом деле берем двойной
интеграл по v(t) и по dt. Строго говоря, w является не риссовской
мерой, а незначительным ее обобщением, позволяющим рассмат-
рассматривать интеграл от произведения непрерывной функции f(t,u)
и характеристической функции Д (t) интервала времени A s7\
В этом параграфе мы будем называть w распределенным управле-
управлением. Таким образом, каждое распределенное управление опре-
определяется измеримым скользящим режимом v(t). Однако, по-
поскольку мы будем иметь дело с функциями /(/, и), немного
удобнее пользоваться мерами w, а не функциями v(t).
Распределенное управление w назовем симплициальным, если
оно определено формулой C6.1), где v (t) — стандартное кусочно-
постоянное управление и (/). Для того чтобы пользоваться фор-
формулой C6.2) в случае стандартного управления, нужно интер-
интерпретировать u(t) как единичную меру на U, сосредоточенную
в одной точке и (/). В дальнейшем мы будем это подразумевать.
Множество всех распределенных управлений w, или, как мы
будем говорить, пространство распределенных управлений, обо-
обозначим через W. Будем считать его подмножеством множества
риссовских мер на TxU, которые понимаются в указанном
выше несколько обобщенном смысле. Это обобщение оказывает,
однако, некоторое влияние на понятие сходимости, которую мы
по-прежнему будем иногда называть тонкой. Последовательность
распределенных управлений wv, v = l, 2, .... будем называть
сходящейся, если для каждой функции / значения wv(f, А)
стремятся к пределу w(/, Л) равномерно по Д. Ниже мы уви-
увидим, что предел всегда имеет вид ш(/, Д), где w£W [мы назы-
называем это свойством секвенциальной полноты пространства W
(см. ниже C6.3) (i))]; в этом случае мы говорим, что wv схо-
сходится К W.
C6.3) Теорема, (i) Пространство W секвенциально полное.
(и) Для того чтобы действительная функция ю(/, Д) имела вид
w(f, Д), где w£W, необходимо и достаточно, чтобы выполнялась
следующая система условий:
' (a) to (f, А) линейна по f и аддитивна по Д;
C6.4)
(b) если f{t, u)>0 в АхU, то a(f, Д)>0;
(c) если /(/, и)=1 в AxU, то ы([, Д) = |Д|.
C6.5) Теорема, (i) Пространство W секвенциально компактно.
(ii) Симплициальные распределенные управления образуют в W
плотное множество.
444 Гл. III. Обобщенное оптимальное управление
Доказательство теоремы C6.3). Нужно доказать только утверж-
утверждение (ii), поскольку предел функций <о(/, Д), удовлетворяющих
условиям C6.4), также им удовлетворяет. Кроме того, в утверж-
утверждении (ii) нужно доказать только достаточность, так как необхо-
необходимость очевидна. Итак, предположим, что со(/, Д) удовлетво-
удовлетворяет условиям C6.4).
Если m^-f^M в АхU, где т, М — постоянные, то из
C6.4) следует, что со(М—f, Д) и ю(/—т, Д) неотрицательны
и, следовательно,
C6.6) т|Д|<(о(/, Д)<М|Д|.
Поскольку при фиксированном / величина w{f, Д) является
приращением функции <p(f)=(o(/, Д,), где Д,— множество мо-
моментов времени ^/ в Г, то функция <р(t) удовлетворяет усло-
условию Липшица и, значит, почти всюду в Т имеет производную
ф(<), такую, что
C6.7) со(/, А)- $
л
Обозначим через Ef множество точек t (если таковые есть),
в которых производной <p(t) не существует, и пусть Е—объеди-
Е—объединение множеств Ef, соответствующих тем функциям /, которые
являются полиномами с рациональными коэффициентами. Тогда
мера | Е | множества Е равна нулю, так как оно представляет
собой счетное объединение множеств меры нуль. Мы покажем,
что вне множества Е производная ф (/) существует для каждой /.
Действительно, если через Я.(/, /) обозначить разность верхней
и нижней производных функции ф для заданной f, то, с одной,
стороны, ввиду C6.6)
где М(/)—максимум функции /(/, и) в TxU, а с другой сто-
стороны, для любого момента времени t, не принадлежащего Е,
и любого полинома Р с рациональными коэффициентами
K{t, Р) = 0
и, следовательно, ввиду линейности w(f, Д) по /
Ц/, f) = X(t, f-P).
Но поскольку Р можно выбрать так, чтобы величина M(f—Р)
была сколь угодно малой, а из этих соотношений следует, что
М/, /)< 2М (/-/>),
то K(t, /) - 0, т. е. ф(*) существует. Положим теперь для каж-
каждой функции /
v(f, t), t$T-E:
§ 36. Распределенные управления 445
тем самым v будет полностью определено, если мы условимся
считать, например, что для /££
v(/. /) = /(*. и£
где и0 — некоторая фиксированная точка из V'.
Из C6.6) видно, что v(/, t)^0, если f(t, «)^0 при том же
самом t для всех u£U. Далее, рассмотрев разности /х—/2
и /2—/lt мы заключаем, что v(/, t) принимает одинаковое зна-
значение в точке t для двух функций, совпадающих в этой точке.
Далее, согласно C6.4) (с), v(/. 0 = 1, когда / тождественно
равна единице как функция от и при заданном значении t. На-
Наконец, очевидно, что v(/, 0 линейно по /. Из этих фактов сле-
следует, что, как функционал на классе функций f(t, и) при
постоянном t, v является риссовской мерой, зависящей от t,
и что эта мера является вероятностной мерой v(t). Теперь мы
можем написать
v(/, t) = f{t, v(t)).
Наконец, по построению, это последнее выражение можно под-
сгавить в C6.7) вместо <р@> и, в частности, оно является изме-
измеримым для каждой функции /. В соответствии с нашими опре-
определениями, это означает, что v(t) измерима, а также, что со(/, А)
тождественно равна функции w(f. А), определенной в C6.1)
посредством v(t). Это доказывает наше утверждение.
Доказательство теоремы C6.5). (i) Пусть задана последова-
последовательность wv, v = l, 2, ..., распределенных управлений; наша
задача — выделить из нее сходящуюся подпоследовательность.
Используя диагональный процесс, выделим подпоследователь-
подпоследовательность с индексами v=v,, v2, ..., для которой числа wv(f, A)
имеют конечный предел на счетном множестве пар (/, А), со-
составленных из полиномов / — Р с рациональными коэффициентами
и рациональных интервалов Д = /. Покажем, что подпоследова-
подпоследовательность wv (v = vlt v2, ...) сходится.
Для этого определим M(f) как максимум величины |/(f, u)\
и заметим, что, согласно C6.1),
wv(f, Д)<|Д|-М(/).
Отсюда следует равностепенная непрерывность по А и по /.
А из равностепенной непрерывности по / следует, что для нашей
подпоследовательности числа wv(f, I) стремятся к пределу для
каждой пары (/, /), так как множество полиномов Р плотно.
Аналогично из равностепенной непрерывности по А при фикси-
фиксированном / получаем, что числа wv(f, А) сходятся равномерно
по Д. В этом и состояло наше утверждение.
Утверждение (ii) соответствует достаточности в теореме F7.1) из § 67 гл. VI
т. I, и при его доказательстве применяются аналогичные конструкции, которые
446 Гл. III. Обобщенное оптимальное управление
можно образно сравнить с передачей изображения в телевидении или с вос-
воспроизведением звука сложной тембровой окраски. Это делается в две стадии.
На первой непрерывный объект дискретизируется: кадр на телеэкране разбивается
на большое число элементарных частей — светлых и темных точек, сложный
звук — на отдельные ноты, отвечающие определенным клавишам музыкального
инструмента. А на второй стадии происходит развертка во времени элементарных
частей каждого кадра или нот каждого музыкальиого аккорда (как в арпеджио),
так что в каждый момент времени появляется только одна часть или одна нота,
хотя последовательность элементарных частей или отдельных нот может быть
столь быстрой, что человеческий мозг воспринимает их как единый образ.
Используем разбиение множества U на подмножества Uj,
определяемые разбиением (t, ы)-пространства на полуоткрытые
кубы со сторонами 2~v; конечное число таких кубов пересекается
с TxU, и эти пересечения имеют вид T(xUj, где Т{—полу-
Т{—полуоткрытые интервалы времени. В каждом множестве U/ выберем
точку Uj и обозначим через г\ (и) кусочно-постоянную функцию,
которая отображает каждое Uj в соответствующую точку и/.
Это первая ступень нашей конструкции. Вторая ступень, на
которой мы определим для заданного w £ W аппроксимирующее
симплициальное wv, использует также определенные сдвиги во
времени, которые можно описать посредством некоторого ото-
отображения шкалы времени в ее малые части, зависящего от и
и определяемого некоторой функцией т(/, и). Мы устроим так,
чтобы точка (t, и) всегда лежала в том же кубе нашей сетки,
в котором лежит ее образ (т, rj), и чтобы для любого интервала
времени Д, который можно представить в виде суммы интерва-
интервалов Th была справедлива формула
C6.8) wv(f, A)=
где /—любая непрерывная функция на TxU и где для каждого
интервала 7',-, не вырождающегося в точку,
C6.9) /v(*. «) = T5|_J/(T(*, и), n(u))dt.
Из написанной формулы видно, что /v—»•/ равномерно по (/, и)
и, следовательно,
wv{f, A)-~w(f, Д)
для каждой функции / и для каждого интервала А. который
при больших v можно представить в виде суммы интервалов 71,-.
Отсюда, так же как при доказательстве утверждения (i), мы бы
получили, что wv—*ц), ибо такие А образуют плотное множе-
множество. Значит, для доказательства утверждения (ii) осталось
только построить симплициальное распределенное управление wv
так, чтобы для соответствующей функции x(t, и) имело место
равенство C6.8).
§ 36. Распределенные управления 447
Пусть v{t)—скользящий режим, соответствующий w, и пусть
%l(t)—значение меры v(t) на множестве U}. Так как Xj(t)—это
разность значений меры v(t), отвечающих замкнутым множест-
множествам, а эти значения являются пределами интегралов непрерыв-
непрерывных функций от и по мере v(t), то из наших определений
измеримости для v(t) следует, что функции Я,уB) измеримы. Так
как v{t) — нормированная мера на U, то очевидно также, что
, 2^/@= !• Следовательно, для чисел
мы имеем
и, кроме того, когда полуинтервал Т{ не вырождается в точку,
его можно разбить на конечное число полуоткрытых подинтер-
валов Ti/t таких, что 17^1 = ^. Обозначим через vv(t) симпли-
циальное управление, определенное посредством кусочно-постоян-
кусочно-постоянной функции uv(t), равной ыу- в T{j для каждых i, /. Обозначим
через wv соответствующее симплициальное распределенное управ-
управление.
Нам осталось доказать справедливость равенства C6.8); ввиду
аддитивности, достаточно сделать это при Д = 7,-. Определим
функцию т(*, и), считая, что в каждом из множеств Г,х£/,-она
является возрастающей линейной функцией одного t, которая
отображает 71,- на Г,у. В таком случае для u£U,формула C6.9)
эквивалентна формуле
МЛ и) = -т^$/(*.М
и, так как это постоянная,
I fv(t, u)dw=-jJi-j I /(т, uv(x))dx.
Здесь Я,1у=|Г,у|, так что, суммируя по /, получаем
S /v (t,u)i
Ti
т. е. формулу C6.8) при Д==Т,-. Таким образом, теорема пол-
полностью доказана.
448 Гл. III. Обобщенное оптимальное управление
§ 37
Правильная постановка задач оптимального управления
Подведем итоги наших рассуждений и вернемся к нашим
прежним обозначениям. Для простоты снова предположим, что
функция g(t, х, и) удовлетворяет условию C5.1), хотя и другие
условия, упомянутые в § 35, дали бы тот же результат. Связкой
мягких, стандартных или симплициальных траекторий назовем
Некоторые траектории связки и множество, которое все они
пересекают.
семейство всех траекторий соответствующего типа, которые пере-
пересекают заданное ограниченное замкнутое подмножество (t, х)-
пространства и определены на замкнутых подинтервалах (воз-
(возможно, состоящих только из одной точки) фиксированного ко-
конечного интервала времени.
Для работы с этими траекториями, которые могут быть опре-
определены на разных интервалах времени, нам понадобится неболь-
небольшая модификация понятия равномерной сходимости, примем для
этого модифицированного понятия мы сохраним то же н£сЕлние.
О последовательности функций
МО. '€7\, (v = l, 2, ...),
где Tv — замкнутые интервалы, содержащиеся в некотором фикси-
фиксированном интервале времени, будем говорить, что она равно-
равномерно сходится к функции
если, во-первых, То—замкнутый интервал, концы которого
являются пределами концов интервалов Tv, и, во-вторых, при
некотором выборе замкнутого интервала времени Г, содержа-
содержащего То и все, кроме, быть может, конечного числа, интер-
интервалы Tv, для больших v существуют продолжения наших функций
МО. '€7\
которые равномерно на Т сходятся к соответствующему продол-
§ 37. Правильная постановка задач оптимального управления 449
жению предельной функции х0 (t). (Здесь интервал То может,
в частности, состоять только из одной точки.)
Следующая теорема позволяет получить ту правильную по-
постановку задач оптимального управления, которую мы ищем.
Как будет видно из наших рассуждений, она имеет огромное
практическое и теоретическое значение.
C7.1) Теорема. Связка мягких траекторий является секвен-
секвенциально компактным и полным множеством, а соответствующая
связка симплициальных траекторий образует в нем плотное под-
подмножество.
В этом утверждении подразумевается, что понятие сходимо-
сходимости применительно к последовательностям траекторий — это по-
понятие равномерной сходимости, которое мы только что объяс-
объяснили. Это понятие нельзя получить при помощи расстояния
в некоторой метрике, как в случае обычного понятия равномер-
равномерной сходимости, и именно поэтому мы предпочитаем говорить
о секвенциальной компактности, а не о Б...и-компактности.
Доказательство теоремы C7.1). Сначала докажем секвенциаль-
секвенциальную компактность и полноту, т. е. докажем, что для заданной
последовательности
C7.2) xv{t), t€Tv, v=l, 2
траекторий нашей связки существует равномерно сходящаяся
подпоследовательность, предел которой
C7.3) xo(t), t£T0,
также является траекторией нашей связки. Обозначим через Т
замкнутый интервал времени, который содержит все Tv, и про-
продолжим на Т траектории xv (t). Согласно результатам § 35,
функции
C7.4) xv{t), t£T,
равностепенно непрерывны и равномерно ограничены. Следова-
Следовательно, можно выделить равномерно сходящуюся подпоследова-
подпоследовательность с пределом
C7.5) xo(t), t<tT.
Из этой сходящейся последовательности можно выделить подпо-
подпоследовательность, для которой концы интервалов Tv стремятся
к концам некоторого замкнутого интервала Те (возможно,
состоящего только из одной точки). Тогда соответствующая
подпоследовательность из C7.2) будет равномерно сходиться
в нашем смысле к пределу C7.3).
Нужно еще показать, что этот предел —траектория из нашей
связки. Так как он, очевидно, пересекает заданное ограниченное
450 Гл. HI. Обобщенное оптимальное управление
замкнутое множество (/, х)-пространства и является частью кри-
кривой C7.5), то нужно только показать, что C7.5) является мяг-
мягкой траекторией, т. е. существует измеримый скользящий режим
ve{t), t£T, такой, что почти всюду на Т
C7.6) *о@=£(*. *о(О. МО)-
Чтобы упростить обозначения, отождествим последовательность
C7.4) с ее равномерно сходящейся подпоследовательностью.
Через fo(t, и) обозначим вектор-функцию g(t, xo(t), и). Вы-
Выберем точку ЦГ и обозначим xv(t0) через xv, xo.(*o) через х0,
а через vv(t), t£T, обозначим измеримый скользящий режим,
соответствующий траектории C7.4), и положим
t
C7.7) 5v(O = *y+S/o(*. 0v(x))dT, t£T.
to
Согласно ключевой лемме C5.3), bv{t) равномерно сходится к'
xo(t) на Т. Но ввиду C6.3)(i) и C6.4)(i) существуют подпосле-
подпоследовательность индексов v и измеримый скользящий режим ve (t),
такие, что для каждой непрерывной действительной функции
/С и)
t t
C7.8) S f (т, vv (т)) dt — J / (т, с;0 (т)) dx
и и
равномерно по t € Т. Это соотношение справедливо и для непре-
непрерывной вектор-функции f и, в частности, для f = f0. Предпола-
Предполагая, что в C7.7) v пробегает эту подпоследовательность, и пере-
переходя к пределу, получаем
t
S(T. O0(T))dx,
и
откуда следует справедливость уравнения C7.6) почти всюду-
на Г». ч
Наконец, покажем, что симплициальные траектории связки
образуют в ней плотное множество. Для этого обозначим через
xo(t), t£T, любую траекторию связки, а через vo(t) соответ-
соответствующий ей измеримый скользящий режим. Далее, в заданном
ограниченном замкнутом множестве (t, .^-пространства фикси-
фиксируем точку (*„, х0), такую, что x0(te) = x0. Согласно C6.4)(и),
существует последовательность симплициальных управлений
МО, <€7\ v=l, 2
•> А заодно и абсолютная непрерывность xo(t), о чем, конечно, тоже
следует сказать.— Прим. ред.
§ 37. Правильная постановка задач оптимального управления 451
для которой сходимость в C7.8) равномерна по t для каждой
функции /, а значит, и для функции /0, заданной равенством
/о(*> u)—g(t> xo(t)> ")• Если мы теперь" определим ^(t) так же,
как в C7.7), но положим xv—-xn, то получим, что £,v(t) равно-
равномерно сходится к хп (t) на Т. Следовательно, согласно нашей
ключевой лемме C5.3), хе (t) является также равномерным пре-
пределом траекторий х„A), определяемых управлениями uv(t) на Т
и удовлетворяющих условию xv (То) = х0. Тем самым теорема
полностью доказана.
C7.9) Следствие. Предположим, что множество G(t, x) значе-
значений функции g{t, х, и) при фиксированных (t, x) выпукло. Тогда
любая связка стандартных траекторий является секвенциально
компактным и полным множеством, а соответствующая связка
симплициальных траекторий образует в ней плотное подмно-
подмножество.
В самом деле, в этом случае множества G(t, x) и G(t, x)
совпадают, так что, согласно C4.7), каждая мягкая траектория
будет стандартной.
На практике, за исключением тех случаев, когда функция g(t, x, и) линейна
по и, предположения этого следствия выполняются очень редко, так как его вы-
выводы противоречат тем печальным фактам жизни, которые мы обсудили в § 4 (с)
вступления к этому тому. Но благодаря теореме C7.1) нам эти факты уже не ка-
кажутся печальными, так как теперь, вооружившись наряду со стандартными еще
и мягкими траекториями, мы вполне готовы к встрече с ними.
Мы уже заявили ранее, что эти мягкие траектории позволяют правильно по-
поставить задачи оптимального управления, и теперь мы можем объяснить, почему.
Сохраним временно символ х0 для обозначения дополнительной координаты, кото-
которую мы втиснули в переменную х, и предположим, что наша празадача состояла
в минимизации разности значений х0 для траекторий, соединяющих два замкну-
замкнутых множества А и В пространства пар (t, х). Для того чтобы эта задача имела
смысл, нужно несколько расширить А и В, если мы предполагаем, что траектории
являются стандартными, или, точнее, мы должны будем искать нижний предел
разности значений х0 для траекторий, концы которых приближаются к А и В.
На практике рассматриваемые траектории будут все-таки пересекаться с некото-
некоторым ограниченным замкнутым множеством (t, х)-пространства и можно предполо-
предположить, что они соответствуют равномерно ограниченным интервалам времени.
Нижний предел не изменится, если мы будем учитывать мягкие траектории, так
как их можно аппроксимировать симплициальными траекториями. Но введение
мягких траекторий позволяет вернуться к первоначальной формулировке, со-
согласно которой мы просто искали минимум разности значений х0 для траекторий,
соединяющих А с В. Так, если S — последовательность мягких траекторий,
вдоль которой минимизируемая величина стремится к рассматриваемому нижнему
пределу, то S содержит равномерно сходящуюся подпоследовательность с тем же
свойством, и ее пределом будет мягкая траектория, соединяющая А с В. на которой
этот нижний предел достигается.
В «смягченных» таким образом задачах на минимум решение на практике
часто оказывается стандартным или даже элементарным — иногда даже снмпли-
циальным. Поэтому у читателя может создаться впечатление, что на самом деле
мягкие траектории бесполезны, однако в основе этого впечатления лежит пороч-
порочный круг. Ведь подобным же образом во многих задачах о нахождении обычных
максимумов и минимумов решение может оказаться рациональным числом, но
452 Гл- HI- Обобщенное оптимальное управление
тем не менее, определяя его, мы используем также и понятие иррационального
числа. Точно так же в детективном романе преступником может быть одно из не-
нескольких лиц, введенных автором с самого начала, но мы не можем быть уверен-
уверенными в этом до тех пор, пока не докажем, что все остальные вне подозрений.
Кроме того, даже если существует стандартное решение и нам удастся доказать
это, не вводя мягкие траектории, не исключена возможность существования вто-
второго решения, которое мы при этом упустим, так как оно будет мягким. Именно
это и произошло в анекдоте о двух братьях, в котором скрытое решение оказалось
значительно более дешевым.
§ 38
Принцип минимума Гильберта
Понятие мягких траекторий можно рассматривать с точки
зрения знаменитого изречения Гильберта, которое мы процити*
ровали во введении к гл. V т. I. Конечно, то же самое спра*
ведливо и для обобщенных кривых. Теоремы существования будут»
выполняться автоматически; для этого нужно только соответст*-
вующим образом интерпретировать понятие решения. Если мы
правильно переформулировали нашу задачу, то следующий осч
новной принцип должен быть автоматическим следствием опрЫ
делений.
C8.1) Теорема существования мягких решений. Пусть Q—•
ограниченное замкнутое множество в {t, х)-пространстве, Р—•
замкнутое множество в прямом произведении (t, х)-пространства
на себя, а Т—замкнутый конечный интервал времени. Обозна-.
чим через 2 множество мягких траекторий x(t), определенных
на замкнутых подинтереалах из Т, которые пересекают Q и обла-
обладают парой концов, лежащих в Р. Предположим, что функция
g(t, х, и), стоящая в правой части дифференциального уравнения
наших траекторий, непрерывна и удовлетворяет по х условию
Липшица C5.1). Тогда либо 2—пустое множество, либо в 2
существует мягкая траектория, для которой разность значений
координаты х0 вектора х в ее концах достигает своего минимума.
Будет ли эта теорема автоматическим следствием определений?
Безусловно. В самом деле, с одной стороны, очевидно, что 2-—
секвенциально замкнутое подмножество связки мягких траекто-
траекторий; с другой стороны, 2 содержит минимизирующую последо-
последовательность траекторий
v=l, 2, ....
на которой разность значений х0 приближается к своей точной
нижней грани ц в 2. Согласно теореме C7.1), существует равно-
равномерно сходящаяся последовательность, предел которой ввиду
секвенциальной замкнутости лежит в 2. Очевидно, что для этой
предельной траектории точная нижняя грань ц, равна разности
значений х0 в ее концах. Таким образом, теорема доказана.
§ 39. Принцип максимума Понтрягина 453
ЗАМЕЧАНИЯ. Мы последовали примеру Варги, предполагая всюду, 4Tog(t,x,u)
удовлетворяет условию Липшица C5.1). Это условие понадобилось нам для того,
чтобы подтвердить сходство новой постановки с прааадачей, но если такая поста-
постановка задачи принята, то теорему существования можно доказать, предположив
только непрерывность функции g (t, x, и). Эти результаты читатель может найти
в статьях Мак-Шейна. Они заслуживают детального изучения тем более потому,
что точка зрения Мак-Шейна несколько отличается от той, которая принята
в этих лекциях. В самом деле, исследования, приведенные в этих статьях, яв-
являются в некоторых отношениях более полными и более общими, чем те, которые
приводятся в этой книге. Что касается леммы Филиппова, то для ознакомления
с ней можно также рекомендовать работы Джейкобса и Кастенга.
§ 39
Принцип максимума Понтрягина
Последние параграфы этой книги посвящены доказательству
знаменитого принципа, принадлежащего Понтрягину и его кол-
коллегам Болтянскому, Гамкрелидзе и Мищенко, причем мы будем
в основном придерживаться недавнего несколько более общего
варианта, который принадлежит Гамкрелидзе. Для этого нам
понадобятся несколько иные допущения о вектор-функции g (t, х, и)
(или, точнее, о продолженной функции g(t, x, v), которая зани-
занимает ее место теперь, когда мы отказались от празадачи). Для
большей общности мы полностью скроем зависимость от пере-
переменного скользящего режима v(t), обозначая g(t, x, v(t)) через
t, х).
Мы рассмотрим теперь выпуклое семейство % таких функций
g(t, x), т. е. такое семейство, что каждая выпуклая комбинация
конечного числа элементов g,£$ с постоянными коэффициентами
а, ^0, где 2ai='> caMa является элементом семейства %.
(В случае скользящих режимов, который нас интересует в пер-
первую очередь, семейство % состоит из функций g вида#(/, х, v(t))
и выполняется более сильное условие выпуклости, в котором
коэффициенты а{ могут быть измеримыми функциями от /, а не
только константами.) Кроме того, предположим, что каждая
функция g(t, х) из % непрерывно дифференцируема по х при
фиксированном t и измерима по t при фиксированном х, а также
что каждая функция g и ее частная производная gx являются
ограниченными функциями от (t, x) или, в более общем случае,
их абсолютные величины мажорируются некоторой интегрируе-
интегрируемой функцией, зависящей только от t. Эти предположения и
само определение функций g£$ понадобятся только в некото-
некотором ограниченном открытом множестве О пространства пар (t, x).
Комментарии в связи с кажущейся «кривобокостью» таких пред-
предположений были бы теперь излишними: в нашем контексте эти
предположения выглядят вполне естественно. В случае сколь-
454 Гл. III. Обобщенное оптимальное управление
зящих режимов все они будут выполняться, если мы наложим
на g(t, х, и) естественное условие непрерывной дифференцируе-
дифференцируемое™. Гамкрелидзе объясняет, что могут представиться также
и другие столь же естественные случаи, но мы не будем вдаваться
в подробности.
Ликвидация зависимости от и, или, точнее, от v(t), влечет
за собой соответствующее изменение в понятии гамильтониана,
предложенном в § 8 вступления к этому тому. Так как теперь
мы имеем семейство % функций g, то мы получаем также и
семейство
C9.1) Ж = уЪ
функций Гамильтона h(t, х, y) = yg(t, x), где у—переменный
вектор, и каждая функция g£$ порождает соответствующую
функцию Н^Ж-
Здесь мы будем рассматривать только точки (t, x), которые
лежат в достаточно узкой окрестности множества, описываемого
заданной фиксированной траекторией С вида x(t), ti^t^t^
Называя С траекторией, мы подразумеваем, что для некоторого
фиксированного элемента g из Ъ функция x(t) является реше-
решением дифференциального уравнения
C9.2) х (*) = *(/, *(/)),
которое должно выполняться почти всюду на интервале /, ^ / <; tt;
кроме того, функция x(t) должна быть абсолютно непрерывной.
Обыкновенной точкой траектории С назовем точку, для которой
выполняется C9.2); в частности, будем говорить, что С имеет
обыкновенные концы, если производные x(tg) существуют и при-
принимают значения g(th х (/,-)) для * = 1, 2. Наконец, предполо-
предположим, что функция x(t) может быть продолжена, если это пона-
понадобится, за отрезок [tlt /J, причем так, чтобы она удовлетво-
удовлетворяла тому же дифференциальному уравнению и была абсолютно
непрерывной. Вспомним, что в силу теоремы единственности C5.2)
функция x(t) и любое такое продолжение однозначно опреде-
определяются уравнением C9.2), если элемент g£$ и начальное усло-
условие вида x(to) = xo фиксированы.
Обозначим через q упорядоченную пару концов траектории С,
а через Р малую окрестность точки q. Таким образом, Р лежит
в пространстве упорядоченных пар р, т. е. в прямом произведе-
произведении (t, х)-пространства на себя, или, эквивалентно, множества О
на себя. Обозначим через Q подмножество в Р, состоящее из
упорядоченных пар q концов траекторий С в О, достаточно близ-
близких к С. Любая такая траектория С имеет вид x(t), lt^t^^2,
где x(t)—абсолютно непрерывная функция, удовлетворяющая
для почти всех t из ее интервала определения дифференциаль-
'§ 39. Принцип максимума Понтрягина
455
ному уравнению вида C9.2), где вместо g стоит некоторый эле-"
мент g из $.
Далее, предположим, что в Р задано Гладкое множество или
многообразие с£, для которого q—граничная точка. Можно счи-
считать, что <М задано локально (посредством локальных координат)
как гладкий взаимно однозначный
образ хорошей евклидовой области
вместе с ее границей. Мы будем го-
говорить о внутренности многообразия
<Ж и о его границе, подразумевая
образы внутренности и границы этой
области. Предположим, что размер-
размерность многообразия с# не меньше 1,
так что eS не вырождается в точку.
Далее, предположим, что грани-
граница многообразия <М имеет в точке
q касательное подпространство, ко-
которое само является границей каса-
касательного полупространства к с£,
точно так же, как на рисунке полу-
полуплоскость р3 = 0, ра^.О касается по-
лусферы. (Мы получим касательное полупространство, рассматри-
рассматривая лучи, касательные к с£ в точке q.) В дальнейшем касательное
полупространство будет играть значительную роль. Предположим,
что для некоторой окрестности точки q в сМ существует непре-
непрерывное взаимно однозначное отображение на окрестность точки q
в касательном полупространстве, такое, что точка q отображается
в себя и если q + бр—образ точки p£eS, то
где о(р—q) мало по сравнению с р—q, когда р—>q. В част-
частности, можно считать, что локальные координаты являются
координатами на касательном полупространстве. Далее, вектор
0=^0 из рассматриваемого Bп + 2)-мерного евклидова простран-
пространства будем называть внутренней нормалью многообразия е/И>
В точке q, если он, во-первых, ортогонален границе многообра-
многообразия сМ в точке q, т. е. гиперплоскости, проходящей через q и
содержащей касательное подпространство этой границы, и, во-
вторых, направлен по ту сторону от этой гиперплоскости, кото-
которая содержит касательное полупространство многообразия <Л.
В интересующем нас здесь общем принципе никакое свойство
минимальности непосредственно не используется. Вместо этого
мы введем понятие экстремальности относительно сМ. Оно имеет
кстати то преимущество, что сохраняется симметрия переменных.
Траектория С является ^-экстремалью, если Q не содержит
ни одной внутренней точки многообразия е$. Далее, сопряжен-
456 Гл. III. Обобщенное оптимальное управление
ным вектором вдоль С назовем абсолютно непрерывную и нигде
не обращающуюся в нуль вектор-функцию y(t) со значениями
в п-мерном пространстве, определенную на том же интервале
времени, на котором определена х (t). Если h—функция Гамиль-
Гамильтона, соответствующая элементу gG.'S, который входит в диф-
дифференциальное уравнение C9.2) с решением x(t), то соответст-
соответствующим импульсом назовем (п + 1)-меРный вектор, полученный
из у (t) присоединением нулевой компоненты
C9.3) ЛДО =
этот вектор мы обозначим r\(t). Соответствующим трансверсаль-
ным вектором для С назовем Bп + 2)-мерный вектор
C9.4) (-Л(*1), Ч (*,))•
C9.5) Интегральная форма принципа максимума Понтрягина.
Пусть g^S, пусть h—соответствующая функция Гамильтона
yg(tr x), и пусть С есть сМ-экстремаль вида x(t), t1^.t^Lt2,
которая удовлетворяет (почти всюду) соответствующему диф-
дифференциальному уравнению C9.2), которое теперь запишем в виде
х — дп/ду. Если С имеет обыкновенные концы или если с/И состоит
из пар с такими же координатами t, как у q, то существует
сопряженный вектор y(t) вдоль С, такой, что пара (x(t), y(t))
удовлетворяет следующим трем условиям:
(a) она является решением канонических уравнений Эйлера:
• _ ал • _ eh
х~д^' у Ш'
(b) выполняется условие Вейерштрасса (интегральный вариант
Понтрягина): величина
и
[h(t, x(t), y(t))dt
и
как функция от Н£.Ж достигает своего максимума при й = Л1);
(с) выполняется условие трансверсальности: трансверсальный
вектор C9.4) является внутренней нормалью многообразия <М.
(Здесь через q обозначена пара концов кривой С.)
Такую формулировку принципа максимума Понтрягина дал недавно Гам-
крелидзе, но его предположения слегка отличаются от наших в двух пунктах.
Вместо нашего предположения о выпуклости семейства g Гамкрелидзе налагает
условие квазнвыпуклости, которое позволяет применять этот принцип непосред-
непосредственно для стандартных управлений самих по себе. Подобное усовершенствова-
усовершенствование не кажется нам здесь целесообразным, так как рассматривать стандартные
управления независимо, а не как частный случай скользящих режимов, было бы
1) Здесь максимизируется «полное воздействие», т. е. интеграл от нашего
«мгновенного воздействия».
§ 39. Принцип максимума Понтрягина 457
шагом назад. Второе отличие касается трансверсальности: Гамкрелидзе предпо-
предполагает непрерывность функции g(t, х (t)) в концах, а наши требования более
умеренны. Но н они тоже не выглядят вполне естественно, поскольку условие
трансверсальности относится к импульсу г)@. а не к значениям производной х.
На самом деле, наверное, можно было бы вообще обойтись без предположения о
том, что концы траектории С обыкновенные, по крайней мере в интересующем нас
случае скользящих режимов. Ниже мы увидим, что в этом случае нмпульс r\(t)
непрерывен, хотя производная а; может н не быть таковой. Вероятно, это об-
обстоятельство можно использовать.
Заметим, что C9.5) дает необходимые (но в общем случае
не достаточные) условия достижения минимума. Это происходит
потому, что каждая минимизирующая траектория С, удовлетво-
удовлетворяющая гладким граничным условиям, является, в силу самого
факта минимальности, ^-экстремалью для соответствующего
многообразия ail: в качестве <М можно взять множество пар р
точек (t, х), которые ограничивают дуги кривых, удовлетворяю-
удовлетворяющих заданным граничным условиям, и для которых разность
первых пространственных координат не меньше соответствующей
разности для пары q. (Напомним, что наша задача на минимум
была сформулирована именно для этой разности.)
Однако основным новшеством в формулировке принципа мак-
максимума Понтрягина, рассматриваемой в этом параграфе, по срав-
сравнению с формулировками предшествующих глав, является новая
форма условия Вейерштрасса—вариант Понтрягина. Прежде чем
перейти к доказательству, мы хотим показать, что в случае
скользящих режимов, которые нас в основном интересуют, этот
«интегральный» вариант эквивалентен условию, выполняющемуся
в каждой точке траектории С. Как мы уже говорили, будем
предполагать, что основная функция g(t, x, и) непрерывно диф-
дифференцируема.
Сначала покажем, что в этом случае «интегральный» вариант
условия (Ь) из C9.5) эквивалентен выполнению этого условия
почти всюду, т. е. величина
h(t, x(t), y(t)),
рассматриваемая как функция от И.£Ж, достигает своего мак-
максимума при h = h почти для каждого t. Отсюда, очевидно, сле-
следует справедливость «интегрального» варианта. Значит, нужно
доказать обратное. Пусть
gv(t, x) = g(t, x, «v), v = l, 2, ....
где av описывает счетное плотное подмножество в II. Обозначим
через So счетное подсемейство из %, состоящее из gv, а через Жо
соответствующее подсемейство из Ж. Элементами семейства Жй
будут hv, v = l, 2
15 К» 1274
458 Гл. III. Обобщенное оптимальное управление
Далее, обозначим через Т множество точек t из интервала
'i^!'^s^2> таких, что для всех v
C9.6) hy(t, x(t), y(t))^h(t, x(t), y(t)).
Легко видеть, что для каждого к^.Ж
C9.7) h{t, *(/), y(t))^h(t, x(t), y(t)),
когда t£T. Действительно, h(t, x, у)—это интеграл по и отно-
относительно некоторой нормированной меры v(t) на U от соответ-
соответствующего гамильтониана при постоянном и. Следовательно,
нужно проверить C9.7) только в том случае, когда h—это
функция yg(t, х, и) при постоянном и, но тогда, ввиду непре-
непрерывности по и, неравенство C9.7) представляет собой непосред-
непосредственное следствие неравенства C9.6).
Таким образом, чтобы убедиться в справедливости почти
всюду поточечного варианта условия C9.5) (Ь), нужно показать,-
что Т состоит из почти всех точек интервала ^</^/s. Для
этого достаточно показать, что множество £v, в котором C9.6)
не выполняется, имеет меру нуль для каждого v. Обе части
неравенства C9.6) являются измеримыми функциями от t; дейст-
действительно, так как y(t)—(абсолютно) непрерывная функция, то
каждая функция вида y(t)g(t, x(t), v(t)), соответствующая из-
измеримому скользящему режиму v(t), измерима. Отсюда следует,
что множество Ех заведомо измеримо. Если теперь мы предпо-
предположим, что мера множества Ev положительна, то, Выбрав в ка-
качестве v(t) управление, равное uv в Ev и совпадающее 'вне Еч
с уравнением v(t) вдоль С, мы получим гамильтониан h£&C,
для которого неравенство C9.7) будет нарушаться всюду в Еч
и превратится в равенство вне Ev, так что, интегрируя по t,
мы обнаружим, что неравенство C9.5) (Ь) несправедливо.
Поточечный вариант условия (Ь) (неравенство почти всюду),
который является следствием (Ь), можно еще усилить. Для этого
покажем, что, когда он выполняется, r\0(t)= — h(t,x(t), y(t))
эквивалентна непрерывной функции. Достаточно было бы
убедиться в ее равномерной непрерывности в Т, но на самом
деле мы убедимся также в ее абсолютной непрерывности.
Пусть t', t"—любые две точки из Т. Тогда разности
*(О. о (О).
х(Г), о (О)
неотрицательны, так как каждая из них имеет вид h—h. Кроме
того, абсолютные величины разностей
*(П. НП).
'. x(f), v(t"))
§ 39. Принцип максимума Понтрягина 459
равномерно малы, когда мало \t' —1"\; в самом деле, так как
g(t, х, и) — непрерывно дифференцируемая функция, они не мо-
могут превосходить выражения вида
а\Г-Г\+Ь\х{П-х{Г)\+с\у(П-у(П\,
где а, Ь, с—постоянные. Значит, из соотношений
следует, что г\п—равномерно ограниченная и абсолютно непре-
непрерывная в Т функция. Заметим, что ту абсолютно непрерывную
функцию, которой эквивалентна tj0, можно теперь отождествить
с т]0: для этого достаточно подставить вместо v(t) вне Т любой
слабый предел величины v(t'), когда t'—-t для t'£T. Если мы
предположим, что управление v(t) изменено таким образом на
множестве меры нуль с самого начала, то это не повлияет на
траекторию С, но множества Ev окажутся в результате пустыми,
так как обе функции -%(t) и y{t)g(t, x(t), uv) непрерывны по t.
Следовательно, Т будет совпадать со всем интервалом t1^.t^Lt2.
Иначе [говоря, в случае скользящих режимов, если условие
C9.5) (Ь) выполняется, то вместо v(t) можно подставить такое
эквивалентное управление, что величина h(t, x[t), y(t)), рас-
рассматриваемая как функция от h g Ж, достигает своего максимума
при h = h для каждого фиксированного t из интервала t^t^t^
Это можно было бы назвать локальной формой условия (Ь)
вдоль С, и именно в такой форме это условие приводилось
в принципе максимума в предшествующих главах нашей книги.
К тому же оказывается, что из этого условия следует непре-
непрерывность импульса т] (t) вдоль С, так как его компоненты, кроме
r\0(t), образуют абсолютно непрерывную функцию y{t); на самом
деле v)(t) будет абсолютно непрерывной функцией. Далее, мы
можем показать, что компонента r\0(t) удовлетворяет (так же
как и другие компоненты вектор-функции r\(t)) простому диффе-
дифференциальному уравнению; действительно, почти всюду
C9.8) т}0 @ = - у (t) gt(t,x (t), v @).
Последнее достаточно проверить только на совершенном под-
подмножестве, дополнение которого относительно интервала t1^.t^.t2
имеет малую меру, и мы выберем это подмножество так, чтобы
рассматриваемые здесь различные функции от t имели непрерыв-
непрерывные ограничения на это подмножество; этими функциями яв-
являются х, у, г\0, а также те, которые получатся, если подставить
t, x(t), v(t) в качестве аргументов в функции
g(t, х, и), gt(t, х, и), gx(t, х, и).
Тогда справедливость дифференциального уравнения C9.8) еле-
460 Гл. III. Обобщенное оптимальное управление
дует из полученных выше соотношений, связывающих прираще-
приращение функции ц0 с величинами —8', б". Достаточно выбрать
точку t" из нашего совершенного множества так, чтобы она
стремилась к t' = t, не совпадая с последней, подставить t" в эти
соотношения и проверить посредством простых вычислений, осно-
основанных на C9.5) (а), что ввиду непрерывности рассматриваемых
функций разность между каждой из величин —6', 6" и выра-
выражением
-(t"-t')y(t')gt(t', x(t'), v(t'))
не превосходит некоторой величины, малой по сравнению с раз-
разностью t"—V'.
§ 39А
Возмущение
Единственное слабое место теоремы C9.5) заключено в не-
неприятном, хотя и не слишком существенном дополнительном
предположении, которое обеспечивает пункт (с). От этого недо-
недостатка нельзя избавиться, если при доказательстве этой теоремы
использовать, как мы и сделаем здесь, традиционную идею пер-
первой вариации. Применение этой традиционной идеи к доказа-
доказательству теоремы C9.5), с ее весьма «кривобокими» предположе-
предположениями, характерными для современной теории управления, уже
является превышением возможностей классических понятий. Для
этого нам предварительно придется доказать стандартную лемму
о возмущении, которая равносильна вычислению первой вариа-
вариации для пары q концов траектории С. Линейная аппроксимация,
которую она дает, будет использована вместе с теоремой отде-
отделимости для выпуклых множеств евклидова пространства. Это
следует сравнить с рассуждениями, приведенными в приложении II
к тому I, где мы имели дело с линеаризацией и отделимостью
выпуклых множеств хотя и на языке дуальных функциональных
пространств, но применительно к аналогичным объектам.
Лемма о возмущении, взятая сама по себе, фактически не
использует ^-экстремальности. Поэтому мы пока предположим,
что С—это просто траектория
x(t), t^t^tt,
удовлетворяющая уравнению C9.2), где g^. Погрузим С в се-
семейство траекторий Са вида
x(t, a), M
и предположим, что они определены при малых а^О, причем
С = С0. Мы рассмотрим только два случая: первый, когда ^(а),
fj(cc) не зависят от а, и второй, когда С имеет обыкновенные
§ 39A. Возмущение 461
концы. Результат будет сформулирован только для второго слу-
случая, так как в первом случае он несколько проще и необходи-
необходимые изменения очевидны.
Мы будем предполагать, там где это потребуется, что функ-
функция x(t) подходящим образом продолжена за свой интервал
определения, причем уравнение C9.2) по-прежнему удовлетво-
удовлетворяется. Обозначим через tn некоторое фиксированное значение
времени t в этом интервале и будем считать, что начальные
условия задаются при t = t0. Через х0, xlt х2 и хо(а), xl(a),
х2(а) обозначим значения функций x(t) и x(t, а) в точках t0,
/lt t2 и tn, tx (a), t2 (a), а через q (a) —пару концов траектории Са.
В соответствии с теоремой C5.2) будем считать, что кривую С
определяет четверка
w=(x0, tx, t2, g),
состоящая из ее начального условия, концов интервала времени
и функции g£S, стоящей в правой части дифференциального
уравнения C9.2). Аналогично Са определяется четверкой w(a).
Для того чтобы возместить «кривобокость» и отсутствие гладко-
гладкости в некоторых из наших предположений, мы допустим, что
зависимость от а имеет наиболее простой вид, а именно линейна:
w(a)—w-\-aw,
где и—четверка, которую мы обозначим через 8w и назовем
первой вариацией четверки по. Вообще, производную при а —О
некоторой величины, зависящей от а, называют первой вариацией
этой величины при а = 0. Таким образом,
Ю=(&0. Т1. Т2, У),
где
Бо = бх0, т,- = 6/, (i = 1, 2), у = bg.
Итак, траектория Са определяется начальным условием
х = л-0 + а|0, когда t = t0, интервалом времени с концами t((a)—
=t{-\-ar{ (t= 1, 2) и возмущенным дифференциальным уравнением
C9А.1) x=g(t, x) + ay(t, x).
Конечно, мы должны быть уверены, что g + ауб^; для этого
мы потребуем, чтобы при некотором а0 > О
и обозначим через 6S семейство функций y(t, x), удовлетворяю-
удовлетворяющих этому условию1'. Тогда при 0^a^a0 функция g+ay
1( В этом месте перевод несущественно отличается от оригинала (у автора
ао=1). Ниже, в § 39В используется, что 6^ —выпуклый конус с вершиной
в начале, а это неверно, если ограничиться лишь теми у, для которых
Ш+1€$-—Прим. ред.
462 Гл. III. Обобщенное оптимальное управление
будет принадлежать семейству S ввиду его выпуклости, так как
ее можно записать в виде ( 1 — — )£+ — (g + aov). Тем самым
ч «о / «о
выпуклость семейства % играет важную роль: она позволяет
погрузить С в семейство траекторий Со, которое зависит линейно
от а. Такая возможность в задачах управления является чем-то
вроде премии за введение скользящих режимов.
Четверка «данных» dw определяет семейство Со при малых а.
Множество Q таких четверок будем называть ограниченным,
если существует некоторое фиксированное число, превосходящее
модули величин |п, т„ т2, и некоторая фиксированная интегри-
интегрируемая функция от t, превосходящая модули функции y(t, х)
и ее частных производных по х для всех (t, x)£0 и всех
(So» Ti> Т2» т)€^- (Под модулем вектора или матрицы мы под-
подразумеваем квадратный корень из суммы • квадратов его компо-
компонент или ее элементов.)
Мы хотим найти подходящую аппроксимацию первого порядка
для решения x(t, а) возмущенного уравнения C9А. 1). Отчасти
это сводится к решению задачи Коши для линейного дифферен-
дифференциального уравнения
C9А.2) i = A(t)l + %(t), !(*„)=!„,
где A(t)—матрица, a %(t)—вектор, заданные равенствами
Поэтому мы выпишем решение уравнения C9А.2) в явном виде,
как при доказательстве леммы A5.1) в § 15 гл. I этого тома.
Пусть Ф, Y—абсолютно непрерывные nxn-матричные функции
от t, равные единичной матрице при t = t0 и удовлетворяющие
почти всюду уравнениям
C9А.З) Ф=
Тогда решение %(t) уравнения C9А.2) имеет вид
C9А.4) I@ = Ф(t)■ {|0 + J V (s) х(s)dsj,
причем, согласно C5.2), оно является единственной абсолютно
непрерывной функцией, удовлетворяющей уравнению C9А.2)
почти всюду. (Действительно, функция C9А.4) равна |0 при
t = t0; дифференцируя, находим, что ее производная ввиду C9А.З)
почти всюду равна А^ + ФЧ^х, а эта величина равна Л| + х-
Достаточно заметить, что ¥Ф—единичная матрица при t = t0,
а ее производная УФ + Ч^Ф, согласно C9А.З), равна нулю почти
всюду, следовательно, ^Ф, а значит, и ФУ—единичные матрицы
при каждом t.)
§ 39А. Возмущение 463
Нам понадобится не совсем банальный принцип оценки по-
погрешности: пусть X{t), O^Lt^T,— абсолютно непрерывная век-
вектор-функция, удовлетворяющая условиям
и \X(t)\^k(t)\X(t)\ + r(t),
где k (t), r(t) — интегрируемые неотрицательные функции, для
которых
тогда | X (t) | < 4а. Для доказательства этого утверждения можно
использовать применявшиеся выше рассуждения, которые при-
приводят к «удачному зацикливанию». Обозначим через М макси-
максимум величины |Х@|- Тогда из неравенства
t t
получим
откуда следует искомое неравенство М^.4а. В общем случае,
когда все предположения такие же, только значение интеграла
от k(t) меньше или равно N/2 (вместо 1/2), посредством разбие-
разбиения на подинтервалы, на которых этот интеграл не превосхо-
превосходит 1/2, можно получить, что ^(Ol^s^o1'. Кроме того, рас-
рассматриваемый интервал времени t можно заменить любым дру-
другим, если соответствующим образом изменить формулировку.
Мы используем эту оценку погрешности для величины
X{f)=x(t, o)-jc(f)-
где четверка данных, определяющая семейство Со, может при-
принимать значения из некоторого ограниченного множества й.
Применяя теорему о среднем значении к каждой из компонент
вектор-функций, рассматриваемых на отрезках, соединяющих
пары точек треугольника Л с вершинами
(/, *(/)), (t, x(t, a)), (t, x(t) + al(t)),
х> Более точная оценка следует из леммы Гронуолла:
т
Ht)dt, Т
{
°
— Прим. ред.
464 Гл. III. Обобщенное оптимальное управление
получим, что
|[v№oS("
где k(t) — некоторая интегрируемая функция, зависящая только
от й. Аналогично, выражение
'PC. «. lo)-[g]xA^aUt)-^(t)gx(t, x(t))
удовлетворяет при ограниченном |0 неравенству
a,
Кроме того, учитывая вид t,(t} из C9А.4), находим, что р/a—>-0
равномерно по |0 для ограниченных |0 при каждом рассматри-
рассматриваемом t, когда a—>0. Интегрируя неравенство почленног по-
получим отсюда, что, каково бы ни было е > О,
a.
для всех малых а, где малость зависит только от Q и е.
Строго говоря, все это справедливо только тогда, когда
треугольник А не выходит из О. Значит, интегрирование следует
производить на интервале, содержащем t0, меньшем того, на
котором определена функция x(t, а). Следует считать, что даль-
дальнейшие рассуждения относятся сначала только к этому мень-
меньшему интервалу. Однако довольно легко доказать затем, что
для достаточно малых а треугольник А действительно будет
лежать в О при всех нужных t.
Далее,' X(t0) = o(a), поскольку |0 == бх0 = х'а(t0, 0), и мы
сдвинем в t0 начало оси t в нашем принципе оценки погрешно-
погрешности: Объединив очевидным образом дифференциальные уравнения
для x(t, a), x(t), \{t), а затем воспользовавшись полученными
выше неравенствами, найдем, что
\X{t)\^k(t)\X(t)\ + r(t),
где
г(£) = а2/г(£) + |р(Л а, |0)|
и а достаточно мало. Тогда, согласно принципу оценки погреш-
погрешности, |X(OJ не превосходит произведения величины га на не-
некоторую постоянную. Отсюда следует, что равномерна по 6ш £ Q
выполняется соотношение
C9А.5) x(t, a)=x@ + a|@ + o(a),
где о (а) малр по сравнению с а, когда a—>-0; далее, это соот-
соотношение справедливо для интервала времени t, для которого tlt
ta—внутренние точки.
§ 39В. Редукция к теореме отделимости 465
C9А.6) Лемма о возмущении. Предположим, что С имеет
обыкновенные концы, т.е. что C9.2) выполняется при t = t{
(£=1, 2), или же что б/, = 0 (£=1, 2).-Тогда при а—*0
х (tf + аб*,-, а) = х (/,-) + иЬх{ + о (а),
еде i=l, 2 и где [для функции |(/) из C9А.4)]
6*f = £(*,.) + £(*,-, х (/,-)) б/,.
Кроме того, член о (а) -мал по сравнению с а. разномерно отно-
относительно четверки данных bw, которая лежит в ограниченном
множестве.
Иначе говоря, если q(a)—пара концов траектории Са и
6<7 = F/lt бдг„ б/2, 6*s),
то
(равномерно относительно ограниченной четверки данных bw).
Доказательство. Лемма непосредственно следует из соотноше-
соотношения C9А.5), взятого в точке /, + себ/,-, и соотношения
х (t{ + a&ti) = х (tt) + ag (tt, x (t;)) 6t{ + o(a),
которое вытекает из определения обыкновенного конца.
Грубо говоря, эта лемма показывает, что наши несколько кривобокие
предположения не оказывают серьезного влияния на ту аппроксимацию кон-
концов наших траекторий, которую дает классическая первая вариация.
§ 39В
Редукция к теоремо отделимости
Теперь вернемся к предположениям теоремы C9.5). Лемма
о возмущении доставляет нам некоторую линейную функцию 6#
нашей четверки данных bw. Значениями функции &q являются
точки Bп + 2)-мерного евклидова пространства; обозначим через
8Q множество этих значений для всевозможных bw. Легко ви-
видеть, что 6Q—выпуклый конус с вершиной в начале. В самом
деле, функция б^ от bw линейна н однородна, а множество 6W
четверок 6о> является прямым произведением пространств пере-
переменных бд:0, Ы{ (£=1, 2) и выпуклого конуса б$, т. е. прямым
произведением (п + 2)-мерного евклидова пространства и выпук-
выпуклого конуса. Следовательно, 6W — выпуклый конус, а потому
его линейный образ 8Q—тоже выпуклый конус.
В том же Bи + 2)-мерном евклидовом пространстве обозначим
через 8аМ множество касательных векторов к <М> в точке q. Эти
касательные векторы можно рассматривать аналогично как пер-
первые вариации разности р—q, где р^сМ. Значит, 6<^ лежит
466 Га. III. Обобщенное оптимальное^управление
в линейном подпространстве, проходящем через начало и парал-
параллельном касательному подпространству к а/Я в точке q\ но так
как q—граничная точка многообразия а/К, то множество 8с£
представляет собой только половину этого пространства.
Предположим теперь, что в—единичный вектор в Bл + 2)-
мерном евклидовом пространстве переменной р, и пусть в—ги-
в—гиперплоскость 6р = 0, проходящая через начало. Будем говорить,
что 0 отделяет (в широком смысле слова) одно из заданных
множеств А, В от другого, если все точки р одного из множеств
удовлетворяют соотношению Qp^LO, а все точки второго—соот-
второго—соотношению вр^О.
Мы покажем, что принцип максимума C9.5) эквивалентен
следующему утверждению (эквивалентную формулировку и до-
доказательство которого мы приведем в следующих параграфах) *':
C9В. 1) Лемма об отделимости вариаций-. В условиях meopemi
C9.5) и при только что введенных обозначениях существует
гиперплоскость 0, проходящая через начало и отделяющая (в ши-
широком смысле слова) множество 6Q от множества Ьа/И.
Эквивалентность заключений теоремы C9.5) и леммы C9В. 1).
Мы опять в основном придерживаемся рассуждений Гамкре-
лидзе. Сама идея этой леммы подсказывается до некоторой сте-
степени анализом правила множителей Лагранжа, проведенным
Мак-Шейном в 1938 г. Лемма C9В. 1) утверждает, что в
Bи + 2)-мерном пространстве существует ненулевой вектор в,
такой, что
C9В.2)
для всех пар векторов 8q£&Q и 6рg6e£. Здесь в—упорядочен-
в—упорядоченная пара (я + 1)-мерных векторов
(<?«. р/), * = 1, 2,
где а,-—действительное число, a p,- есть л-мерный вектор, точно
так же как 6</ состоит из пары векторов
F*„ 6х,), 1 = 1, 2.
Значит, первую половину неравенства C9В.2) можно записать
в виде
C9В.З) 2 ог/б*, + р,бл;,-<О.
/=1. 2
Если мы подставим вместо 8х{ их значения, являющиеся линей-
линейными функциями от bw, то левая часть неравенства C9В.3)
11 Подробный анализ связи принципа максимума и различных его моди-
модификаций с возможностью отделения некоторых выпуклых конусов проведен
в работах А. Я. Дубовицкого и А. А. Милютина.— Прим. ред.
§ 39В. Редукция к теореме отделимости 467
примет вид
i4I6/I + А2Ы, + В6х0 + L Fg).
где последний член представляет собой линейное выражение
по 8g. Так как знаки величин 6^,-, бд:0 в нашем распоряжении,
а функция 6g может прннимать нулевое значение, то неравен-
неравенство C9В.3) эквивалентно паре соотношений
Члены с 6/lf б/2 выпадают, если кривая С не имеет обыкно-
обыкновенных концов, однако в любом случае из первого уравнения
C9В.4) следует, что В = 0. Пользуясь выражениями из C9А.6)
и C9А.4) для значений Ьх{ и учитывая, что бл:0 = £0, получаем
L Fg) = ( рхФ (fx) J + р2Ф (/2) 5 j ^ (s) x (s) ds,
где %(s)=y(s, x(s)) и у = б^. Если мы учтем, что В = 0р и
положим
C98.5) У @ =~Р2ф (<*)¥(').
то получим
I.
C98.6) L Fg) = J у (t) 6g (t, x @) dt
и
и, кроме того, y(t2) = p2, y{t^) = — рх.
Из C9В.5) следует, что y(t) удовлетворяет уравнению
и, значит, y(t)—сопряженный вектор вдоль С. Далее, покажем,
что из C9В. 1) вытекает соотношение у{г)фО. В случае задачи
с фиксированным интервалом t1 <11 ^ t2 легко видеть, что а{ = 0
при i = 1, 2. А в случае переменного интервала времени, со-
согласно предположению, С имеет обыкновенные концы; тогда
коэффициенты Л, в первом уравнении C9В.4) обращаются в
нуль, и ввиду C9.6) они равны
Следовательно, в любом из этих двух случаев pt, p2 не могут
одновременно обращаться в нуль, так что и ни один из них не
может обращаться в нуль (поскольку В = 0), и, значит, ввиду
C9В.5), y(t)=fcQ, что и требовалось доказать.
4$8 Гл. III. Обобщенное оптимальное управление
Далее, очевидно, что если ввести обозначения g-\-8g=g
и h(t, х, y) = yg{t, х), то, согласно C9В.6), соотношение
LFg-)<I0 совпадает с условием (Ь) из C9.5). Значит, C9В.3)
влечет за собой условия (а) и (Ь) из C9.5); легко видеть, что
при наших предположениях справедливо также обратное. Оста-
Осталось исследовать условие трансверсальности (с) из C9.5) и свя-
связать его со второй половиной неравенства C9В.2). Достаточно
изучить случай, когда С имеет обыкновенные концы, так как
другой случай еще проще.
Обращение в нуль коэффициентов Л,- эквивалентно соотно-
соотношениям
x(t,)), /=1, 2.
Так как yg(t, x) = h(t, x, у), то из C9.3) вытекает, что о,=
=(—l)'iio(^), i — I, 2, и, значит, 8 совпадает с трансверсаль-
ным вектором C9.4). Следовательно, вторая половина неравен-
неравенства C9В.2) эквивалентна условию (с) из C9.5). Таким образом,
мы доказали эквивалентность теоремы C9.5) и леммы C9В. 1).
§ 39С
Эквивалентная форма условия отделимости
Наша лемма об отделимости C9В. 1) как раз и составляет
реальную геометрическую основу принципа максимума. Однако
прежде, чем привести ее доказательство, мы хотим сформулиро-
сформулировать ее иначе. Еще и еще раз напомним читателю, что такая
с виду нескончаемая забота о мелочах часто столь же необхо-
необходима для математического доказательства, как необходима она
перед решающей битвой или при подготовке полета на Луну.
Нам нужно здесь выразить возможность отделения множеств
6Q, Ь<М друг от друга некоторой гиперплоскостью через другое
свойство, которое мы назовем неперекрываемостью. Соответствую-
Соответствующие рассуждения будут геометрическими; мы будем рассматри-
рассматривать множества в фиксированном основном евклидовом прост-
пространстве. При этом для такого множества понятия внутренности,
границы, внутренней точки и граничной точки всегда будут отно-
относиться к (наименьшему) подпространству, образующему линей-
линейную оболочку этого множества.
Обозначим через <£> линейную оболочку множества Е, а через
<Л, By линейную оболочку объединения двух множеств А, В.
Два множества Л, В назовем строго перекрывающимися, если
они имеют общую внутреннюю точку и если, кроме того, <Л, By
является тем самым фиксированным евклидовым пространством,
в котором лежат множества Л, В. Два множества, которые не
являются строго перекрывающимися, назовем неперекрывающи-
неперекрывающимися в широком смысле.
§ 39C. Эквивалентная форма условия отделимости 469
В дальнейшем конусом будем называть конус с вершиной
в начале, который состоит по крайней мере из одной точки (ска-
(скажем, начала). Назовем его вырожденным, если он является под-
подпространством или полуподпространством. Нам понадобится
только следующий частный случай более общего утверждения,
которое не содержит предположения о вырожденности:
C9С.1) Лемма. Пусть А, В—выпуклые конусы, и пусть конус В
вырожденный. Тогда для существования гиперплоскости 6, прохо-
проходящей через начало и отделяющей (в широком смысм слова)
множества А, В друг от друга, необходимо и достаточно, чтобы
А, В были в широком смысле неперекрывающимися.
Доказательство. Наши приготовления подходят к концу, по-
поэтому докажем эту лемму только в том виде, как она сформу-
сформулирована. Кроме того, мы предпочитаем доказать противополож-
противоположное утверждение: для того чтобы такой гиперплоскости не
существовало, необходимо и достаточно, чтобы А, В были строго
перекрывающимися. При такой формулировке достаточность оче-
очевидна. Значит, теперь можно предположить, что такой отделяю-
отделяющей гиперплоскости не существует. Тогда очевидно, что <Л, By —
все пространство, и, следовательно, остается только показать,
что А и В имеют общую внутреннюю точку. Последнее триви-
тривиально (ввиду вырожденности В) в случае, когда <Л> = <Б> = все
пространство, так как, t-сли бы общей внутренней точки не су-
существовало, то В было бы не всем пространством, "а полупро-
полупространством, и его можно было бы отделить от А граничной
гиперплоскостью, вопреки допущению. Покажем, что общий слу-
случай можно свести к этому тривиальному частному случаю.
Для этого обозначим через П пересечение пространств <Л>
и <В> и положим
<Л> = ПхП1, <Б> = ПхП2,
где Пи Пг—подпространства, для которых только начало явля-
является общей точкой. Подпространство П должно содержать вну-
внутреннюю точку из А, так как в противном случае ПхП2 если
бы и пересекалось с множеством А, то только по граничным
точкам, а потому ПхП2 можно было бы включить в гиперпло-
гиперплоскость 0, тоже содержащую самое большее только граничные
точки множества А. Так как эта гиперплоскость 6 тогда содер-
содержит В, то она отделяет (в широком смысле слова) В от А, что
противоречит предположению.
Теперь можно заметить, что каждая внутренняя точка для
ПГ|Л является внутренней точкой для А; в противном случае
в подпространстве <Л> можно было бы построить опорную гипер-
гиперплоскость для Л, проходящую через эту точку. Пересечение этой
гиперплоскости с П не могло бы быть всем подпространством П,
470 Гл- HI- Обобщенное оптимальное управление
так как П содержит внутренние для А точки; следовательно,
в П существует опорная гиперплоскость для П П А, проходящая
через рассматриваемую точку, что невозможно.
Аналогично можно показать, что каждая внутренняя точка
для П П В является внутренней точкой для В. Это означает, что
нужно только показать, что множества П П А, П П В имеют общую
внутреннюю точку. Но это сразу сводится к тривиальному част-
частному случаю, который мы уже разобрали.
§ 39D
Доказательство принципа максимума
Осталось только доказать лемму C9В. 1). Следуя Гамкрели-
дзе, предположим, что она неверна, и получим противоречие.
Согласно C9С. 1), множества 6Q, Ьа/Я имеют при этом предполо-
предположении общую внутреннюю точку 60q и их линейная оболочка
<6Q, ЬеМу является всем Bи + 2)-мерным пространством. Обозна-
Обозначим через k, m размерности подпространств <6Q>, <бс*>, а через
К, М—два симплекса этих размерностей, которые содержат 60q
в качестве внутренней точки и сами лежат внутри 6Q, Ьа/Я соот-
соответственно.
Теперь можно построить симплекс Д размерности k в прост-
пространстве четверок 8w, такой, что линейное отображение множест-
множества 8W на 6Q, рассматриваемое на Д, является взаимно однознач-
однозначным линейным отображением симплекса Д на К- Для этого
достаточно выбрать (k-{-1) четверок в &W, которые отображаются
в вершины симплекса К, и обозначить через А симплекс, для
которого эти (k-\-\) четверок являются вершинами. Объединяя
обратное линейное отображение /С—»-Д с ограничением отобра-
отображения <7(а) из C9А.6) на Д, рассматриваемым как отображение
множества б№ в Q, получим отображение х(а): /С—►Q, задан-
заданное функцией
к (a, 6q),
и такое, что
к (a, 8q) =
где член о (а) мал по сравнению с а равномерно по б^ € АГ. В то
же время из наших предположений о гладкости многообразия сМ
следует, что существует отображение |х(а): М—-ю/%, заданное
функцией
[г (а, бр),
такое, что
где о (а) опять мало по сравнению с а равномерно по р
кроме того, тогда точка ц (се, 8р) является внутренней для
§ 39D. Доказательство принципа максимума 471
Для доказательства нашей теоремы достаточно убедиться в том,
что для каждого достаточно малого а существуют векторы Sq£K,
6М, такие, что
C9D.1) и (а, 6?) = ц (а, бр).
Из этого соотношения вытекает существование точек и (a, ^)
сколь угодно близких к q, которые являются внутренними точ-
точками для сМ, а это противоречит ^-экстремальности. Значит,
теперь все зависит от доказательства соотношения C9D.1). Одна-
Однако удобнее сначала подвергнуть это соотношение элементарным
преобразованиям.
Обозначим через /С*. М* множества, полученные переносом
множеств К, М, при котором точка 6О<7 становится началом. Вве-
Введем обозначения
и (a, 6q)—q—a60q = ax,*(a, 6*q),
ц(а, 6»—q—а60«7 = ац*(а, Ь*р).
Таким образом, теперь для 6*9 €АГ*,
х-(о, 6«9) = 6-
)
где член оA) равномерно стремится к нулю, когда а—»-0, и
нужно доказать справедливость соотношения
C9D.3) и* (a, 6*q) = ii*(a, 6*p)
для некоторой пары (б*^, 6*p)€S*, где S* = K*xM*. Введел! обо-
обозначения
s* = F*<7, б-р), ЯИ = 6-?-6Т>
и для всех малых ос > О
/Ж) =**(«. fi'tfWK 6*Р)-
Согласно C9D.2),
C9D.4) /* И =/;(*•) + оA)
равномерно по s*gS*, а искомое соотношение C9D.3) принимает
вид
/a(s*) —0 для некоторого
а еще лучше записать его в виде
C9D.5)
С другой стороны, так как <6Q, бс^> совпадает со всем Bл+ 2)-
мерным пространством, <АГ, М> и <К*, М*у тоже совпадают с ним.
Очевидно, что 0—внутренняя точка для f*0 (S*) в обычном смы-
472 Гл. III. Обобщенное оптимальное управление
еле, так как <_f*0(S*)y—все пространство. Отсюда и из C9D.4)
можно получить C9D.5) различными способами, применяя тео-
теорему Брауэра о неподвижной точке. Мы получим это соотноше-
соотношение, применив частный случай этой теоремы—лемму A9.5), кото-
которая была использована при доказательстве теоремы о деформации
в § 19 гл. I т. I.
Так как отображение /J линейно, то в fl (S*) можно построить
симплекс S размерности 2/г + 2, содержащий начало в качестве
внутренней точки, а в S* можно построить соответствующий сим-
симплекс 2 такой же размерности, для которого ограничение отобра-
отображения fl на 2 взаимно однозначно и отображает 2 на S. Обо-
Обозначим через В шар в S с центром в начале и радиусом р и
определим отображение /а из В в /£(S*) посредством композиции
/о (/!)"'• Тогда, согласно C9D. 4),
C9D.6) Ms) =s + o(l)
равномерно по sgfi, когда а—>0. Следовательно, согласно ука-
указанной выше лемме, для каждого достаточно малого а сущест-
существует s£B, для которого /a(s) = 0. Иначе говоря,
C9D.7) O£fa(B).
Но по построению fa(B)c:fa(S*), так что соотношение C9D.5)
должно выполняться. Однако мы знаем, что оно эквивалентно
соотношению C9D.1), следовательно, теорема полностью доказана.
§ 39Е
Эпилог
Теперь, когда мы выработали правильную постановку задачи
оптимального управления и имеем удовлетворительные теоремы
существования, подкрепленные необходимыми условиями мини-
минимума, которые дает принцип максимума, можно считать, что
заложен достаточно прочный фундамент для изучения отдельных
задач, таких, как задача о полете на Луну и многие другие.
Ясно, что это только начало.
ЛИТЕРАТУРА
Банах (Banach S.)
Theorie des Operations Lineaires, MonograHe Matematyczne, Warszawa, 1931.
[Украинский перевод: Баиах С, Курс функцюнального анал1зу (л1и1ЙН1
операцп), «Радянська школа», Кшв, 1948.]
Блисс (Bliss G. А.)
Lectures on the Calculus of Variations, University of Chicago Press, Chicago,
1946. [Русский перевод: Блисс Дж. А., Лекции по вариационному исчисле-
исчислению, ИЛ, М., 1950].
Больца (Bolza О.)
- Vorlesungen uber Variationsrehnung, Teubner, Leipzig & Berlin, 1909.
Гамкрелидзе P. B. (Gamkrelidze R. V.)
On some extremal problems in the theory of differential equations with appli-
applications to the theory of optimal control, J. SIAM, Ser. A., Control 3 A965),
106—128.
Джейкобе (Jacobs M.)
A Generalization of Philippov's lemma (Abstract), Amer. Math. Monthly,
73 A966), 927.
Каратеодори (Caratheodory C.)
A letter to Tonelli, Bollettino delV Unione Mathematica Italiana A923).
Variationsrechnung, Teubner, Berlin & Leipzig, 1935.
Мак-Шей и (McShane E. J.)
Generalized curves. Duke Math. J., 6 A940), 513—536.
Мак-Шейн и Уорфилд (McShane E. J., Warfield R. В., Jr.)
On Filippov's implicit functions lemma, Proc. Amer. Math. Soc., 18 A967),
41—47.
Mope (Morse M.)
The Calculus of Variations in the Large, American Mathematical Society,
Providence, R. I., 1934.
Поитрягнн Л. С, Болтянский В. Г.. Гамкрелидзе Р. В., Мищенко Е. Ф.
Математическая теория оптимальных процессов, Физматгиз, М., 1961.
Сакс (Saks S.)
Theory of the Intergal, Monografie Matematyczne, Warszawa, 1936. [Русский
перевод: Сакс С, Теория интеграла, ИЛ, М., 1949.]
Тонелли (Tonelli L.)
Fondamenti di Caicolo delle Variazoni, v. I, II, Nicola ZanicheJli, Bologna,
1921, 1923.
474 Литература
Харди. Литтльвуд и Пойа (Hardy G., Littlewood J., Polya G.)
Inequalities, University Press, Cambridge, England, 1936. [Русский перевод»
Харди Г. Г., Литтльвуд Дж. Е. и Полна Г., Неравенства, ИЛ, М., 1948.J
Хестеис (Hestenes M. R.)
Calculus of Variations and Optimal Control Theory, John Wiley and Sons, New
York, 1966.
Яиг (Young L. C.)
Generalized curves and the existence of an attained absolute minimum in the
calculus of variations, С R. de la Sociite des Sciences et des Lettres de Varsovte,
classe III, 30 A937), 212—234.
A Variational algorithm, Riv. di Mat. Univ. di Parma, 5 A954), 255—268.
ДОПОЛНИТЕЛЬНАЯ ЛИТЕРАТУРА
Адамар (Hadamard J. S.)
Lecons sur le Calcul des Variations, Herman, Paris, 1910.
Балакришиан (Balakrishnan A. V.)
Conference on Computing Methods on Optimization Problems, Los Angeles,
1964. Academic Press, New York, 1964.
Беллман (Bellman R. E.)
Dynamic Programming, Princeton University Press, Princeton, N. J., 1957.
[Русский перевод: Беллман P., Динамическое программирование, ИЛ:, М.,
I960.]
Бишоп и де Лю (Bishop E., de Leeuw К.)
The representation of linear functionals by measures on sets of extreme points,
Ann. Inst. Fourier Grenoble, 9 A959), 305—331.
Боттс (Botts T. A.)
Sufficient conditions for a generalized-curve problem in the calculus of varia»
tions, Duke Math. J., II A944), 373—403.
Бурбаки (Bourbaki N.)
Elements de Mathernatique, 3-eme ed., Hermann, Paris, 1962.
Валентайн (Valentine F. A.)
The problem of Lagrange with Differential Inequalities as Added Side Condi-
Conditions, Contributions to the Calculus of Variations, 1933—37, University of
Chicago Press, Chicago, 1937, pp. 407—448.
Варга (Warga J.)
Relaxed variational problems, J. Math. Anal. Appl., 4 A962), III—128.
Necessary conditions for minimum in relaxed variational problems, J. Math.
Anal. Appl., 4 A962), 129—145.
Гельфанд И. М. и Фомин С. В.
Вариационное исчисление, Физматгиз, М., 1961.
Гильберт (Hilbert D.)
liber das Dirichletsche Prinzip, Math. Ann., 59 A904), 161—186.
Литература 475
Данскии (Danskin J. M.)
The Theory of Max-Min and its Application to Weapons Allocation Problems,
Springer Verlag, New York, 1967. [Русский^ перевод: Данскин Дж. М.,
Теория максимина и ее приложение к задачам распределения вооружения,
«Сов. радио», М., 1970.]
Кантор (Cantor G.)
Ueber unendliche, lineare Punktmannichfaltigkeiten, Math. Ann., 23 A884),
453—488.
Ковалевский (Kowalewski G.)
Einfiihrung in die Determinantentheorie, Viet & Сотр., Leipzig, 1909.
Курант и Гильберт (Courant R. Hilbert D.)
Methoden der Mathematischen Physic, B. I, II, Springer, Berlin, 1924, 1937.
[Русский перевод: Кураит Р. и Гильберт Д., Методы математической фи-
физики, т. I, II, Гостехтеориздат, 1951.]
Куратовский (Kuratowski К.)
Topologie, Monografie Matematyczne, Warszawa, 1948—50. [Русский перевод
более позднего переработанного издания: Куратовский К., Топология,
т. I и II, «Мир», М., 1966, 1969.]
Лебег (Lebesgue H.)
En Marge du Calcul des Variations, Enseignement Math., B) 9 A963), 209—326.
Ли и Маркус (Lee E. В., Marcus L.)
Foundations of Optimal Control Theory, John Wiley and Sons, New York, 1967.
[Русский перевод: Ли Э. Б. и Маркус Л., Основы теории оптимального уп-
управления, «Наука», М., 1972.]
Лузин Н. Н.
Лекции об аналитических множествах и их приложениях, Гостехтеориздат,
М., 1953.
Мак-Шейи (McShane E. J.)
On multipliers for Lagrange problems, Amer. J. Math., 61 A939), 809—819.
Necessary conditions in generalized curve problems of the calculus of variations,
Duke Math. J., 7 A940), 1—27.
Existence theorems for Bolza problems in the calculus of variations, Duke
Math. J., 7 A940), 28—61.
Curve-space topologies associated with variational problems, Ann. Scuola
Norm. Super. Pisa, B) 9 A940), 45—60.
A metric in the space of generalized curves, Ann. of Math., B) 52 A950), 328—
349.
Relaxed controls and variations problems, J. SIAM, Ser. A, Control 5 A967),
438—485.
Минковский (Minkowski H.)
Gesammelte Abhandlungen von Hermann Minkowski, Teubner, Leipzig &
Berlin, 1911.
Морри (Morrey C. B.,J r.)
Multiple Integral Problems in the Calculus of Variations and Related Topics,
University of California Press, Berkeley and Los Angeles, 1943.
476 Литература
Муаньо и Линделёф (Moigno F., Lindelof L.)
Lecons de Calcul des Variations, Mallet-Bachelier, Paris, 1861.
Палю де Ла Баррьер (Pallu De La Barriere R.)
Optimal Control Theory, W. B. Saunders Co., Philadelphia, 1967.
Радо (Rado T.)
On the Problem of Plateau, Springer, Berlin, 1933.
де Рам (De Rham G.)
Varietes DifferentiabJes, Hermann, Paris, I960. [Русский перевод: де Рам
Ж-, Дифференцируемые многообразия, ИЛ, М., 1956.]
Римаи и Вебер (Riemann В., Weber H.)
Die partiellen Differentialgleichungen der mathematischen Physik, Braun-
Braunschweig, 1900—1901.
Riemann-Webers partiellen Differentialgleichungen def mathematischen
Physik, Braunschweig, 1925, 1927.
Рудин (Rudin W.)
Principles of Mathematical Analysis, McGraw-Hill Book Co., New York,
1953. [Русский перевод: Рудии У., Основы математического анализа, «Мир»,
М., 1966.]
Серпинский (Sierpinski W.)
Lecons sur les Nombres Transfinis, Collection Borel, Gauthier-Villars, Paris,
1928.
Cardinal and Ordinal Numbers, Monografie Matematyczne, Warszawa, 1958.
Фелпс (Phelps R. R.)
Lectures on Choquet's Theorem, Van Nostrand Co., Princeton, N. J., 1966.
[Русский перевод: Фелпс Р. Р., Лекции о теоремах Шоке, «Мир», М., 1968.]
Филиппов А. Ф.
О некоторых вопросах теории оптимального регулирования, Вестник МГУ,
сер. матем. A959), № 2, 25—32.
Флеминг и Я иг (Fleming W. H., Young L. С.)
A generalized notion of boundary, Trans. Amer. Math. Soc, 76 A954), 457—
484.
Representation of generalized surfaces as mixtures, Rend. Cir. Mat. Palermo,
B), 5 A956), 117—144.
Фреше (Frechet M.)
Sur quelques points du calcul fonctionnel, Rend. Cir. Mat. Palermo, 22 A906),
1—74.
Хан (Hahn H.)
Uber die Lagrangesche Multiplikatorenmethode, Akad. Wiss. Vienna, Math.
Natur. Kl. Sitzungsber, Ha, 131 A922), 531—550.
Хаусдорф (Hausdorff F.)
Grundziige der Mengenlehre, Chelsea Publishing Co., New York, 1949. [Рус-
[Русское издание: Хаусдорф Ф., Теория множеств, ОНТИ, М.—Л., 1937, —
несколько отличается от немецкого оригинала. — Ред.]
Литература 477
Хестенс (Hestenes M. R.)
On variational theory and optimal control theory, J. SI AM, Ser. A, Control 3
A965), 23—48.
Хокинг и Янг (Hocking J. G. and Young G. S.)
Topology, Addison-Wesley Publishing Co., Reading, Mass., 1961.
Чезари (Cesari L.)
Existence theorems for weak and usual optimal solutions in Lagrange problems
with unilateral constraints, I, II, Trans. Amer. Math. Soc., 124 A966), 369—
412; 413—430.
Шварц (Schwartz L.)
Theorie des Distributions, Hermann, Paris, 1951. [Новое издание: Hermann,
Paris, 1966; см. также Math. Rev., 8 A947), 264, и II A950), 101.]
Янг (Young L. C.)
On approximation by polygons in the calculus of variations, Proc. Royal Soc.,
(A) 141 A933), 325—341.
Necessary conditions in the calculus of variations, Ada Math., 69 A938),
239—258.
Generalized surfaces in the calculus of variations, I, II, Ann. of Math., 43
A942), 84—103; 530—544.
Some applications of the Dirichlet integral to the theory of surfaces, Trans.
Amer. Math. Soc., 64 A948), 317—335.
Surfaces parametriques general isees, Bull. Soc. Math. France, 79 A951), 59—85.
Contours on generalized and extremal varieties, J. Math. Mech., II A962),
615-646.
Generalized varieties as limits, J. Math. Mech., 13 A964), 673—692.
A theory of boundary values, Proc. London Math. Soc., C) I4A A965), 300—314.
Следующие книги можно использовать для ознакомления с классическими
результатами:
Каратеодори (Caratheodory С), Variationsrechnung, Teubner, Berlin & Leip-
Leipzig, 1935, pp. 389—397.
Contributions to the Calculus of Variations 1938—41, The University of Chicago
Press, Chicago, 1942, pp. 499—516.
[А также Лаврентьев М. А. и Люстерник Л. А., Основы вариационного ис-
исчисления, ОНТИ, М.—Л., 1935.—Ред.]
В качестве дополнительной литературы по выпуклости и дуальности, не-
неравенству Юнга и аналогичным вопросам можно предложить следующие работы:
Зигмуид (Zygmund A.), Trigonometric Series, 1st ed., Monografie Matematy-
czne, Warszawa, 1935; 2nd ed.. University Press, Cambridge, England, 1959. [Рус-
[Русский перевод: Зигмуид А., Тригонометрические ряды, I, II, «Мир», М., 1965.]
Феихель (Fenchel W.), On conjugate convex functions, Canadian J. Math.,
1 A949), 73-77.
478 Литература
Хёрмандер (Hormander L.), Sur la fonction d'appui des ensembles convexes
dans les espaces localement convexes, Ark. Mat., 3 A955), 181—187.
[А также: Рокафеллар Р., Выпуклый анализ, «Мир», М., 1973.
Кроме того, к списку рекомендуемой литературы я хотел бы добавить не-
несколько монографий, в которых с разных точек зрения рассматриваются вопросы,
затрагиваемые автором:
Болтянский В. Г., Математические методы оптимального управления,
«Наука», М., 1969.
Болтянский В. Г., Оптимальное управление дискретными системами,
«Наука», М., 1973.
Зейферт Г. и Трельфалль В., Вариационное исчисление в целом, ИЛ, М.,1947.
Иоффе А. Д. и Тихомиров В. М., Теория экстремальных задач, «Наука»,
М., 1974.
Милнор Дж., Теория Морса, «Мир», М., 1965.— Ред.]
ИМЕННОЙ УКАЗАТЕЛЬ
Адамар Ж- ИЗ
Александров П. С. 174
Банах С. 274
Бедлмаи Р. 342, 355
Бельтрами Э. 417
Болтянский В. Г. 453
Больяи Я. 417, 418
Бурбаки Н. 142. 155, 174, 279
Бушоу Д. 356
Валентайн Ф. 355
Варга Дж. 415, 426, 453
Вейерштрасс К- 42, 50, 201
Галилей Г. 230
Галуа Э. 43, 100
Гамильтон У. Р. 56
Гамкрелидзе Р. В. 355, 453, 456,457,
470
Гаусс К- Ф. 417
Гёдель К- 419
Гильберт Д. 16, 42, 186, 187, 418
Гюйгеис X. 56
Данскин Дж. М. 355
Декарт Р. 185
Дубовицкий А. Я- 466
Дюбуа-Реймон П. 35
Евклид 416
Жордан К. 200
Кант Л. 416, 417
Кантор Г. 154, 155, 416, 418, 432
Каратеодорн К- 45, 48, 52, 66, 201,
217, 222, 342
Клейи Ф. 417
Коши О. Л. 43
Кун Г. 355
Курант Р. 186
Куратовский К- 154
Кэли А. 417
Лагранж Л. 41, 43, 55—57, 67, 112,
271, 285, 286, 317, 318, 357, 358, 361
Лебег А. 226, 227, 231, 245
Линделёф Л. 66
Литтльвуд Дж. Е. 244, 342
Лихтенштейн Л. 133
Лобачевский Н. И. 417, 418
Лузин Н. Н. 154
Максвелл Дж. К- 234
Мак-Шейи Э. Дж. 355. 415, 416, 426,
431, 432, 453, 466
Малхоллеид X. Р. 433
Малюс Э. Л. 56
Милютии А. А. 466
Минковский Г. 52, 148, 170
Мищенко Е. Ф. 453
Морс М. 74, 140, 186
Нейштадт Л. 355
Ньютон И. 42, 43
Платон 237, 242
Пойа Д. (Полна Г.) 342
Понтрягин Л. С. 453, 457
Пуанкаре А. 100, 153
Де Рам Ж- 231
Рассел Б. 227
Риман Б. 15
Сакс С. 433
Серпинский В. 418
Таккер А. У. 355
Тонелли Л. 127, 201, 221, 225, 227, 228,
238, 271
Улам С. 414
Уорфилд Р. Б. 416, 426, 431. 432
Урысон П. С. 174
Фельдбаум А. А. 356
Филиппов А. Ф. 415
Флеминг У. X. 415
Фреше М. 238
Хан 223
Харди Г. X. 237, 342
Хаусдорф Ф. 154
Хестенс М. Р. 355
Шварц Л. 33, 231
Шоке Г. 284
Эйлер Л. 18, 41, 42, 67, 222, 271, 357,
366
Юнг У. Г. (Янг У. Г.) 227, 300
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Аксиома выбора t55
перегруппировки членов двойной
суммы 143
Банаха лемма о недостаточном радиусе
274
одношаговый принцип продолже-
продолжения 152
Банахова вектор-функция 280
Бесконечно мелкий зигзаг 236
Б...и-компакт (бикомпакт) 174
Больца задача 333
Брауэра теорема об инвариантности
области 91
о неподвижной точке 71
Вариация допустимая 191
полная 181
Вейерштрасса условие 229, 265, 269,
326
интегральный вариант Понтрягина
456
каноническая форма 328
новое 337
Вейерштрасса формула 49
Вейерштрасса функция (excess fun-
function) 49
Вектор импульса 41, 111
Вектор общего положения 363
Векторное пространство 143
Виртуальные перемещения 111
Воссозданные кривые (reconstituted
curves) 408
Восстановимое разбиение (repairable
decomposition) 409
Восстановимый класс фрагментов 409
Вполне упорядоченное множество 155
Время полета 396
Время пребывания (sojourn time) 373
Вторая вариация 110
Выпуклая миноранта 149
Выпуклая оболочка 145
Выпуклая фигура 159
Выпуклая функция 148, 150, 163
Выпуклое множество 150
Выпуклости принцип 290
расширенный вариационный 296
Выпуклость 49
эквивалентность определений 149
Выравнивание (trimming) 407
Гамильтона — Якоб и уравнение 77-
Гамильтониан вторичный 113
истинный 327, 336
управляемый 335
Гамильтониан глобальный непарамет-
непараметрический 166
стандартный параметрический 167
Гамильтониан локальный 76
допустимый 84
стандартный 81
параметрической задачи 83
Геодезическая выпуклость 213
Геодезические параллели 48
Геодезический наклон 47
Геодезический параметр 45
Геодезический поток 48
Геодезический уровень 48
Геодезическое покрытие 48
Геодезическое представление 46
Геодезическое семейство 48
Геометрическая оптика 56
Гильберта инвариантный интеграл 48,
398
индуцированный 54
Гильберта принцип минимума 452
Гильберта теорема о существования
решений 188
Гомотопия 215
Граница обобщенного потока 246
относительная 139
Граничная точка выпуклой фигуры 159
Гюйгеиса вариационный алгоритм 45
Двойственное выпуклой фигуре
множество 162
Двойственность современная 289
Деформация допустимая 202
исключительная 202
концевая 202
малая 203
Предметный указатель
481
непрерывная допустимой кривой
214
понижающая 140
Диагональный процесс 176
Дигон 287
Длина обобщенного потока 246
Дуальная функция 164
Дуальное пространство 159
Дуальный единичный шар 177
Дюбуа-Реймона модификация леммы
Эйлера — Лагранжа 35
Евклида аксиома о параллельных 416
Евклидова вектор-фуикция 281
Единственности теорема для благо-
благоприятной задачи 211
Задача на абсолютный минимум 214
благоприятная 201
Больца 333
о брахистохроне 21
вполне эллиптическая 187
вторичная 115
на гомотопический минимум 215
Дидоны 316
изопериметрическая 264
о кратчайшем расстоянии 21
Лаграижа 316, 319
Максвелла 233
о минимальной поверхности
вращения 22
об оптимальном быстродействии
340
Плато 22
положительно экстраопределенная
программирования 359
синтеза 376
стандартная параметрическая 188
о турбулентности 268, 269
управляемого замедления осцил-
осциллятора 342
управляемой остановки 342
Фубини — Тоиелли 315
Чезари — Санчеса 315
Закон сохранения энергии в механике
88
Замена переменной 266
Замыкания теорема 294
Звенья цепи трасс 405
Значащее множество 274
Измеримое пространство 431
Импульс 397
Инвариантность 60, 62
Индекс устойчивости прямой и обрат-
обратный 133
Индикатриса лагранжиана 51
Калибровочная функция (function of
distance) 160
Каноническая точка 88
Каноническая цепь 405
Канонические переменные 76
Канонические трассы 395
Канонические уравнения Эйлера 76
Канонический параметр, соответст-
соответствующий гамильтониану 85
Каноническое погружение 123
Каратеодори лемма 72
Картана интегральный инвариант 58
Конечная снизу функция 169
Конечное наращение 408
Континуум-гипотеза 416, 417
Коридор полета 395
Кривая 240
внутренняя 215
восходящая 196
выровненная 197
калиброванная 197
обобщенная 245
периферийная 215
приемлемая 187
строго внутренняя 215
унивалентиая 398
фигуриста 238
Фреше 237, 238
Кривые воссозданные 408
геодезического наклона 48
минимизирующие 188
параметрические эквивалентные
240
реставрированные 409
Критерий общего положения 363
Кунотакксровского типа ограничения
359
Лагранжа задача 316, 319
Лаграижа скобки 55
Лаграижево представление 298
плотного потока 307
Лагранжиан 45
параметрический, выпуклый вдоль
кривой 229
Лежандра преобразование 75
функции 164
Лежандра условие 82
Линейная оболочка множества 145
пары множеств 145
Линейная форма 245
Линейная функция 144
однородная 144
Линейное пространство 144
Линейное подпространство 144
482
Предметный указатель
Линейные комбинации выпуклые 145
унитарные 144
Линейный элемент 88, 247
взвешенный 248
неособый 89, 100, 327
обобщенный 248
турбулентный 249
пополненный 327
сильный 97, 325
Локальная параметрическая теорема
существования для эллиптического
случая Т05
Локально достижимое множество 215
Локальный угол 93
Максвелла задача 233
Максимальное упорядоченное под-
подмножество 156
Максимальный элемент слабый 157
Малюса теорема 56, 405
Мгновенное значение скользящего
режима 425
Метод геодезических покрытий 44
основной алгоритм 46
Метризации лемма 178
Минимальности локальных экстремалей
теорема 97
Минимизирующая кривая 188
Множество импульсов пучка 398
Момент переключения 367
Морса индекс 135
Морса теорема первая 137
вторая 140
Наивная теория оптимального управ-
управления 355—383
Наращение (fusion) 407
Недостаточный радиус 274
Неособая точка 100
Неявные функции 70
Нормированная риссовская смесь 297
Обобщенная кривая 245
замкнутая 247
Обобщенные функции в смысле Шварца
33
Обобщенный поток 245
Огибающая в задаче о минимальной
поверхности вращения 30
в теореме точности 63
в теореме Якобн 65
Ограниченное время полета 396
Окрестность для постоянного t 88
каноническая 88
узкая 88
факторизуемая 89
широкая 88
Q-гомотопия 215
Q-мииимизирующая последователь-
последовательность 188
Q-экстремаль 188
Опорная точка 148
Опорная функция 149
Опорные гиперплоскости 161
Отделимости теорема 273
дуальная 276
Отделимость вариаций 466
Отмеченная гиперплоскость 116
Отмеченные семейства точности 121
Относительно точное звено цепи трасс
406
Относительно уиивалентная кривая
399
Относительный единичный вектор 45
Отсечение (cutting) 407
Параметрическое задание обобщенных'
кривых 252
Параметрический лагранжиан 45
Пенек (stump-shaped function) 36
Первая вариация 40, 110, 461
Перрона парадокс 41
Плато задача 22
Плотная норма (consistent norm) 295
Плотный поток 295
Погружение каноническое 123
параметрическое 200
в трубку 89
Подвешенное множество (hanging set)
138
Подинтегральная функция, соответ-
соответствующая лагранжиану 241
Поднятие кривой (enhancement) 196
Полигон 287
Полигональный поток 287
Полиэдр 139
Полная вариация 181
Полное пространство 173
Положительный конус 177
Полунепрерывная снизу функция 228
Полюс 80
гиперплоскости 161
Поляра 80
выпуклой фигуры 162, 163
точки 161
Полярные преобразования 163
Понтрягина принцип максимума 338,
453
интегральная форма 456
Правило множителей 317
исправленная форма 324
элементарное 359, 360
Правильно дуальное пространство
(dutiful dual) 177
Предметный указатель
483
Правильное объединение (unimpaired
union) 409
Празадача 421
Предположение интегрируемости
импульса 410
Представительное отображение
(descriptive map) 392
Принцип виртуальных перемещений 41
Принцип выбора для параметрических
экстремалей 192
Пробные функции 35
Пуанкаре — Картана интегральный
инвариант 58
Пучок канонических трасс 395
Пучок траекторий локальный 93
Пучок трасс 395
Равностепенно непрерывное множество
функций 175
Разбиение интервала 181
простое 181
регулярное 181
Распределенное управление (control
measure) 443
симплициальное 443
Рассеивания зона 146
Рассеивания пространство 146
Рассеивания тождества 147
Расширения принцип 293
Результант 249
Реставрированные кривые (trimmed
reconstituted curves) 409
Рефлексивное пространство 159
Риссовская мера 279
Риссоаское представление 183
р-деформация 72
Связка траекторий (bundle of trajecto-
trajectories) 448
Секвенциально компактное множество
174
Сеть трасс (concourse of flights) 410
Симплекс 139
Симплициальная граница 290
Синхронизации условие 391
Скользящий режим (chattering control)
425
измеримый 427
Слабая сходимость 177
Слабое определение экстремалей 111
Смесь 298
Сопряженная точка 127
параметрический случай 199
Сопряженная функция наклона 169
Сопряженное множество прямое и об-
обратное 126, 133
Сопряженный наклон 327
Стандартная проекция 392
Старт пучка (source of spray) 395
Стильтьеса теорема 181
Суббарицентрическая точка 148
Существование абсолютного и гомото-
гомотопического минимума в ограниченной
области 215
мягких решений 452
решений задачи Коши 67, 427
Сходящаяся в себе последовательность
173
Тождества двойного ротора 56
Тонелли — Каратеодори теорема
единственности 213
Тонкая сходимость 245, 443
Тонкий треугольник 208
Точная производная 46
Точная форма 245
Точное семейство индуцированное 54
Точной интегрируемости множество
393
Точности семейства 121
Точности теорема 58, 63
Траекторий связка 448
Траектория 93, 334
допустимая 387
мягкая (relaxed) 426, 441
стандартная 441
Трансверсали 48
Трансверсальности условие 41, 112,
192, 326, 337
Транспонированный градиент 76
Трансфинитная индукция 155
Трасса 388
каноническая 399
Трассы дуга 390
Трубка экстремалей 89
каноническая 89
Турбулентность 256
Турбулентный линейный элемент 249
Удовлетворительный интервал 206
Украшение (embellishment) 407
Унивалентная кривая 398
Унивалентности множество 398
Унивалентности направление 398
Унивалентность относительная 399
Управления 320, 334
допустимые 387
измеримые 426, 427
распределенные 443
симплициальные 443
эффективные 425
Управляющие параметры 320
Уравновешенная точка 145
Утопленное множество 138
484
Предметный указатель
Ферма принцип 56
Филиппова лемма 437
Финиш пучка (destination of spray)
395
Финиш цепи (destination of chain) 405
Фиислеров единичный шар 51
Финслерова длина дуги 45
Финслерова единичная сфера 51
Фрагмент 406
Фреше кривая 237, 238
Фреше поверхность 237, 238
Фубиии — Тонелли задача 315
Функция интервала 181
аддитивная 181
Хаиа — Банаха принцип продолжения
151
Характеристики в смысле Кош и 79
Цель 387
Центр меры 284
Центр тяжести 145
Цепные линии 22
Цепочная окрестность экстремали 195
Цепь трасс 405
ведущая к цели 405
Цермело теорема 155
Цивилизованная функция 34
Цикл относительный 139
Циклоиды 22
Цорна лемма 157
Частично упорядоченное множество
156
Чезари — Санчеса задача 315
Штрих-норма 174
Щетинистый квадрат 238
Экстремалей пучок 126
вторичный 126
канонический 126
обратный 126
прямой 126
Экстремалей связка 124
Экстремали благоприятные 201
вторичные ломаные 134
выровненные восходящие 197
дешевые 187
Экстремаль 18, 326
индуцированная 56
сильная 326
и неособая 125
хорошо направленная 97
Эйлера — Лагранжа лемма 34
другая форма 35
Эйлера рецепт 18
усовершенствованный 326
Эйлера уравнение 18
индуцированное 56
Эйлера уравнения канонические 76
Эллиптическая точка 100
Эллиптичности условие 99
Эффективные управления (honest cont-
controls) 425
Якоби дифференциальные уравнения
115, 119
Якоби теорема об огибающей 65
основная I27
Якоби условие 199
ОГЛАВЛЕНИЕ
ПРЕДИСЛОВИЕ РЕДАКТОРА ПЕРЕВОДА 5
ПРЕДИСЛОВИЕ 9
ТОМ I. ЛЕКЦИИ ПО ВАРИАЦИОННОМУ ИСЧИСЛЕНИЮ
ВСТУПЛЕНИЕ. ОБЩИЕ ЗАМЕЧАНИЯ И ТИПИЧНЫЕ ПРОБЛЕМЫ . 13
§ I. Введение 13
§ 2. Место вариационного исчисления в математике и в космиче-
космических науках 14
§ 3. Постановка простейшей задачи и некоторые родственные воп-
вопросы 16
§ 4. Экстремали в некоторых классических задачах 21
§ 5. Решение задач (а), (Ь), (с) 23
§ 6. Лемма Эйлера — Лагранжа и обобщенные функции в смысле
Шварца 33
§ 7. Варианты той же леммы 35
§ 8. Доказательство основной формы леммы 37
§ 9. Первая вариация, уравнение Эйлера, трансверсальность ... 39
§ 10. Парадокс Перрона 41
ГЛАВА I. МЕТОД ГЕОДЕЗИЧЕСКИХ ПОКРЫТИЙ 44
§11. Введение 44
§ 12. Вариационный алгоритм Гюйгенса 45
§ 13. Связь с элементарным понятием выпуклости 49
§ 14. Снова появляется уравнение Эйлера 52
§ 15. Теорема Малюса 56
§ 16. Достаточные условия инвариантности интеграла Гильберта . . 58
§ 17. Свойства инвариантности и теорема об огибающей 60
§ 18. Общие замечания и приложение теории к задачам на плоскости . 64
§ 19. Необходимые сведения о неподвижных точках и о теоремах суще-
существования для дифференциальных уравнений и неявных функций 66
ГЛАВА П. ДВОЙСТВЕННОСТЬ И ЛОКАЛЬНОЕ ПОГРУЖЕНИЕ 74
§20. Введение 74
§21. Преобразование Лежандра 74
§ 22. Гамильтонианы и их свойства 75
§23. Характеристики в смысле Коши 78
§ 24. Двойственность и стандартный гамильтониан в параметрическом
случае 80
§25. Другие допустимые параметрические гамильтонианы 84
§ 26. Локальный переход от параметрического случая к непарамет-
непараметрическому 86
§ 27. Погружение экстремалей в трубки «в малом» 88
§ 28. Локальная теория существования решений непараметрических
вариационных залач н краевых задач для обыкновенных диффе-
дифференциальных уравнений второго порядка 92
§ 29. Локальная параметрическая теория существования решений для
эллиптического случая 99
486 Оглавление
ГЛАВА III. ПОГРУЖЕНИЕ В ЦЕЛОМ 108
§ 30. Введение 108
§31. Первая и вторая вариации и условие трансверсальности .... 109
§ 32. Как обманчива вторан вариация! 112
§ 33. Вторичный гамильтониан 113
§34. Геометрическая интерпретация понятия точности 116
§35. Отмеченные семейсгва 119
§ 36. Каноническое погружение и фокальные точки 123
§37. Теория сопряженных точек по Якобн 127
§ 38. Индекс устойчивости экстремали 133
§ 39. Вторая ступень теории Морса 138
ГЛАВА IV. ГЛОБАЛЬНЫЕ ГАМИЛЬТОНИАНЫ, ВЫПУКЛОСТЬ, НЕ-
НЕРАВЕНСТВА II ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ .... 142
§40. Введение 142
§41. Центр тяжести и зона рассеивания " 143
§ 42. Выпуклость и теорема Хана — Баиаха _ 148
§43. Идейное наследие Георга Кантора •. . 153
§ 44. Двойственность выпуклых фигур .' 159
§ 45. Двойственность выпуклых функций 163
§ 46. Глобальные гамильтонианы и обновленное вариационное исчис-
исчисление 166
§ 47- Замечании о классических неравенствах 170
§ 48. Дуальный единичный шар в функциональном пространстве ... 172
§ 49. Рнссовское представление 180
ГЛАВА V. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ И ИХ СЛЕДСТВИЯ .... 165
§50. Введение 185
§51. Гильбертова конструкция и некоторые ее следствия для стан-
стандартной параметрической задачи 187
§ 52. Параметрическая теория сопряженных точек и параметрическое
условие Якобн 194
§ 53. Теорема единственности Тоиеллн — Каратеодорн 200
§54. Абсолютный и гомотопический минимумы иа Б...н-компактных
областях и многообразиях 213
§55. На пути к автоматической теории существования 219
§ 56. Первая ступень абстрактного подхода: полунепрерывность
в Б...и-компактиом множестве 224
§§ 57, 58, 59 229
ГЛАВА VI. ОБОБЩЕННЫЕ КРИВЫЕ II ПОТОКИ 230
§ 60. Введение 230
§61. Интуитивные соображения 231
§ 62. Немного о семантике 236
§ 63. Параметрические кривые в вариационном исчислении .... 237
§ 64. Допустимые кривые — элементы дуального пространства . . . 240
§ 65. Аналогия с человеческой жизнью 243
§ 66. Обобщенные кривые и потоки и их границы 245
§ 67. Параметрическое задание обобщенных кривых 252
§ 68. Существование минимума 263
§ 69. Свойства обобщенных решений 264
ПРИЛОЖЕНИЕ I. ЕЩЕ НЕМНОГО ОБ ОСНОВНЫХ ПОНЯТИЯХ
ВЫПУКЛОГО АНАЛИЗА И ТЕОРИИ ИНТЕГРИ-
ИНТЕГРИРОВАНИЯ 272
§70. Введение 272
§71. Теорема отделимости для выпуклого конуса в %^(А) . . .-. . 272
Оглавление 487
§72. Лемма о недостаточном радиусе 274
§ 73. Дуальная теорема отделимости 276
§74. Лемма локализации для Б...н-компактнрго множества .... 278
§ 75. Риссовские меры 279
§ 76. Евклидова аппроксимация банаховой вектор-функцин .... 280
§ 77. Элементарная оценка нормы 281
§ 78. Векторное интегрирование 282
§ 79. Замыкание выпуклой оболочки 283
ПРИЛОЖЕНИЕ II. СТРУКТУРА ОБОБЩЕННЫХ ПОТОКОВ И ИХ
РОЛЬ В ВАРИАЦИОННОМ ИСЧИСЛЕНИИ ... 285
§80. Введение 285
§81. Полигональные потоки 286
§ 82. Основы современной двойственности в вариационном исчисле-
исчислении 289
§ 83. Элементарная форма вариацноиного принципа выпуклости . . 290
§ 84. Первое расширение 291
§ 85. Принцип расширения и первая теорема замыкания для обобщен-
обобщенных потоков 293
§ 86. Дальнейшее расширение: плотные потоки и их границы .... 294
§ 87. Предварительные сведения о смесях и о лагранжевом представ-
представлении 297
§ 88. Дополнительные сведения о мерах, смесях и плотных потоках 300
§ 89. Лагранжево представление плотного потока 307
ТОМ И. ТЕОРИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
ВСТУПЛЕНИЕ. ЧТО ТАКОЕ ЗАДАЧИ ОПТИМАЛЬНОГО
УПРАВЛЕНИЯ 315
§ I. Введение 315
§ 2. Правило множителей 317
§ 3. Оптимальное управление и задача Лагранжа 319
§ 4. Печальные факты жизни 321
§ 5. Первая поправка к уравнению Эйлера и правилу множителей . 322
§ 6. Условие Вейерштрасса, трансверсальность, гамильтонианы и
усовершенствованный рецепт Эйлера 325
§ 7. Классические гамильтонианы с ограничениями 328
§ 8. Управления и принцип максимума 334
§ 9. Принцип максимума и его частные случаи как определения . . . 338
§ 10. Решение двух элементарных задач об оптимальном быстродей-
быстродействии 342
ГЛАВА I. НАИВНАЯ ТЕОРИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ . 355
§ 11. Введение 355
§ 12. Дискретное время и программирование 357
§ 13. Некоторые замечания о линейных дифференциальных уравне-
уравнениях 361
§ 14. Подозрительные на оптимальность решения в простейшей за-
задаче об оптимальном быстродействии 365
§ 15. Единственность н оптимальность 368
§ 16. Двумерные задачи: моменты переключении и основные конст-
конструкции 370
§ 17. Исследование случая (а) 375
§ 18. Исследование случая (Ь]) 377
§ 19. Исследование случая (Ь2) 381
488 Оглавление
ГЛАВА II. ПРИМЕНЕНИЕ СТАНДАРТНЫХ МЕТОДОВ ВАРИА-
ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ К ЗАДАЧАМ ОПТИМАЛЬНОГО
УПРАВЛЕНИЯ 384
§ 20. Введение 384
§21. Траектории и трассы 387
§ 22. Условие синхронизации, стандартная проекция и представи-
представительное отображение 391
§ 23. Пучок трасс 393
§ 24. Инвариантный интеграл Гильберта 396
§25. Вспомогательные леммы 400
§ 26. Теорема Малюса 403
§27. Цепь трасс 405
§28. Соединение фрагментов кривых 406
§29. Фундаментальная теорема и ее следствия 410
ГЛАВА III. ОБОБЩЕННОЕ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ , . . 414
§30. Введение 414
§31. Празадача 419
§32. Снова семантика .". 421
§ 33. Стандартные управления и скользящие режимы в дифферен-
дифференциальных уравнениях 424
§ 34. Принцип отдыха на полпути и лемма Филиппова 430
§ 35. Единственность и ключевая лемма об аппроксимациях .... 437
§ 36. Распределенные управления 442
§ 37. Правильная постановка задач оптимального управления . . . 448
§ 38. Принцип минимума Гильберта 452
§ 39. Принцип максимума Понтрягина 453
§ 39А. Возмущение 460
§ 39В. Редукция к теореме отделимости 465
§39С. Эквивалентная форма условия отделимости 468
§ 39D. Доказательство принципа максимума 470
§39Е. Эпилог 472
ЛИТЕРАТУРА 473
ИМЕННОЙ УКАЗАТЕЛЬ 479
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 480
Л. Янг
ЛЕКЦИИ ПО ВАРИАЦИОННОМУ ИСЧИСЛЕНИЮ
И ТЕОРИИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Редактор Н. И. Плужникова Художник Н. А. Ящук
Художественный редактор В. И. Шаповалов Технический редактор В. П. Сизова
Корректор А. Я. Шехтер
Сдано в набор 27/111 1974 г. Подписано к печати 26/VII 1974 г.
Бумага кн. жури. № 2 60x90Vi«=15.25 бум. л. 30.5 усл. печ. л.
Уч.-изд. л. 31.88. Изд. № 1/6394. Цена 2 р. 44 к. Зак. 1274
ИЗДАТЕЛЬСТВО «МИР»
Москва, 1-й Рижский пер., 2
Ордена Трудового Красного Знамени Первая Образцовая типография
имени А. А. Жданова Союзполиграфпрома при Государственном комитете
Совета Министров СССР по делам издательств, полиграфии и книжной торговли
Москва, М-54, Валовая, 28
Лоренс Чнехолм ЯНГ родился в 1905г.
в Геттнигене. Его родит 1И- Уильям
г»нпи и Грейс Эми™— ашлниские
математики, известные своими работа-
работами по математическому аначиэу и тео-
теории функций- В 19-28 г. Л. Янг по-
Еучн, свою псрв>ю >чеи>т степень
бакалавр искусств», окончив с отли-
отличием Триинтн Колледж. Г 1931 г.
и Яиг- магистр нск\сств . с 1938
'доктор тоГиыхиаук И 1939-49 гг.
4|иг возглавляет мапч-пическни фз-
кчлыет Кейптаунского >т.._рситета.
затем переезжает в США. С 1949 i.
ои про. ссор Висконсиискогоунивер-
Висконсиискогоуниверситета, в 1962-64 гг.-декаи.с 1968-
почетный пр«" ссор.
Свои математические исследоваиня
Л Янг. продолжая традиции роднте-
теи. начал в области теории функции
"(одна нэ первых его работ посвящена
теории меры). В дальнейшем ои пере-
переходит к исследованию зачач риацн-
оииого исчисления. Предложенные им
понятии • ..шейных кривых н по: рх-
ностеи дали возможность по-новому
взглянуть па вопросы существо; иии
решении как в классической, так и в
современной проблематике
Из предисл.ия У X Флеминга к
нгяиискому изданию'
...Лекции проф. Л. Ч. Янга начина-
начинаются с изложения классических воп-
вопросов ■ ■ рнацноиного исчисления (том I)
и заканчиваются недавно полученны-
полученными результатами по теории оптималь-
оптимального управления (том II). Это не про-
просто компиляция полезных теорем н их
доказательств —в этих лекциях, на-
написанных весьма своеобразно, автор
приглашает познакомиться с его точкой
зрения иа предмет, для которого он
сделал так много...
Можно думать, что вариационное не
ЧИС1СНИГ наука весьма «чистая»,
имеющая отдаленное отношение к при-
прикладном математике Дело постои г кик
pai наоборот Мс только конкретные
загачн вариационного исчиелгиня иг-
играют основополагающую роль в нов
седневичн жнзмн и и тиких областях,
как экономика, техники и г п (ведь
человечество сгар.итгя И'нгтвовать
наилучшим пиратом, и мгкчеlax тех
возможностей, которы н < но распоп-
ran). m> и елмл т;< гоирин псом rim
им развитием «оя i,nia hvkviu iiiitiikh.
а позднее iiv<kiim кчсчн'Кчкнх наук
и дру|нх подобных ионршоп
Задачи BdpHaiiHoiiHOiо нечие синя ipe
буют к? только новых методов, но. чго
более с\щест- нио новых понятии.
Необходимые понятия вырабатын<|лнгь
дов/ 1ыю медлен нч. и хотя сен час оин
пронизывают нею современную и |те-
матмку. многие лаже не 1н>до1реплк11.
что эти понятия НОЗИНК1Н имении в
нашем предмете.
Это означает, чти вариационное исчи-
исчисление выступает не только как < -
ласть математики, ни и Kdh п-топип.
математических понятии. А поскольку
сейчас прогресс в математике • мно-
многом связан нмеино с появлением
новых понятии. и1>чаемый здесь пред-
предмет предоставляет нам насущное р\-
ко 1дство к дальнейшим исследовани-
исследованиям, и в этом отношении ин одна об-
область математики не идет ни в какое
сравнение с вариационным исчисле-
исчислением.
J1. Янг
Иногда даже от выдающихся математиков можно услы-
услышать, что математическая теория тем более пенна и ин-
интересна чем больше тяжелого труда в нее вложено. Это.
конечно, правильно, но следует помнить, что весь этот
гяжкин труд выполняется за кулисами и большая его
часть тратится на то. чтобы придать материалу доступ-
доступную форму. Если читатель пенит топько то, что нахо-
находит трудным для восприятия, он рискует получить весь-
весьма превратное представтенне о современной математике.
Тем, кто онредетял значение результата в математике,
вз: шивая страницы, зчпятые его доказательством, или
засекая секундомером нремя, затраченное на его освое-
освоение, пришлось пережить несколько сильных потрясений,
когда были найдены простые доказате пьства теорем, ко-
которые раньше требовапи длинных и запутанных рассуж-
рассуждений. По правде говоря, математик похож на худож-
художника: его труд полон страданий, хотя конечный резуль-
результат не содержит и намека на них. Точно так же, созер-
созерцая произведение искусства, мы думаем о том. что
хотел сказать автор, а не о том, каких усилий это ему
стоило.
Л. $нг