Text
                    Φ И 3 И К 0-
Матем атическая
Библиотека
Инженера
В. Г. БОЛТЯНСКИЙ
ОПТИМАЛЬНОЕ
УПРАВЛЕНИЕ
ДИСКРЕТНЫМИ
СИСТЕМАМИ
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
Москва 19 73


Оптимальное управление дискретными системами. В. Г. Болтянский, Главная редакция физико-математической литературы изд-ва «Наука», М., 1973. Среди крупных достижений современной математики на одном из первых мест должна быть упомянута математическая теория оптимального управления. Она существует в двух аспектах: непрерывном и дискретном. Непрерывный вариант теории, изучающий управляемые объекты, описываемые дифференциальными уравнениями, известен читателю по ряду обстоятельных монографий. В то же время дискретный вариант теории, не менее важный в теоретическом отношении и в приложениях, нигде в полном виде не изложен. Книга восполняет указанный пробел в отечественной и зарубежной математической и технической литературе. Математическая теория оптимального управления для объектов с дискретным временем излагается в форме, доступной инженеру, имеющему математическую подготовку в объеме втуза. Изложение включает новые методы и результаты, так что книга интересна и читателю-математику. Для удобства читателя книга разделена на пять глав, каждая из которых представляет собой отдельное законченное целое. Более подробная характеристика глав книги дана" в предисловии. Книга содержит 158 рис.
ОГЛАВЛЕНИЕ Предисловие 5 Глава I. Постановки задач и характер результатов 9 § 1. Проблема оптимизации дискретных процессов 9 1. Задача о максимуме произведения (9). 2. Несколько прикладных задач (12). 3. Задача оптимального управления дискретными объектами (19). 4. Другие постановки задач дискретного управления (22). 5. Максимизация нескольких функционалов (31). § 2. Связь задач дискретной оптимизации с другими экстремальными задачами .' 38 6· Экстремум функции (38). 7. Задача математического программирования (43). 8. Управляемые процессы с непрерывным временем (49). § 3. Методы решения задач дискретной оптимизации 58 9. Динамическое программирование (58). 10. Дискретный принцип максимума (65). 11. Идеи математического программирования (79). Глава II. Основные понятия многомерной геометрии 93 § 4. Векторное пространство 93 12. Определение векторного пространства (93). 13. Размерность и базис (99). 14. Подпространство (106)'. 15. Гомоморфизмы , векторных пространств (114). 16. Евклидово векторное пространство (124). § 5. Евклидова геометрия 133 17. Определение аффинного пространства (133). 18. Плоскости в аффинном пространстве (142). 19. Аффинные отображения (152). 20. Аффинные функции (160). 21. Евклидово пространство (167). 22. Топология евклидова пространства (175). 23. Координаты (180). Глава III. Элементы теории выпуклых множеств 188 § 6. Выпуклые множества 188 24. Определение выпуклого множества (188). 25. Выпуклая оболочка (193). 26. Граница выпуклого тела (201). 27. Выпуклый многогранник (206). § 7. Опорные свойства выпуклых множеств 216 28. Опорный конус (216). 29. Аффинные функции на выпуклом множестве (228). § 8. Теоремы об отделимости выпуклых конусов 236 30. Отделение выпуклых множеств (236). 31. Двойственный конус (248). 32. Свойство отделимости системы выпуклых конусов (252).
4 ОГЛАВЛЕНИЕ Глава IV. Экстремумы функций 262 § 9. Теоремы существования 262 33. Касательное отображение (262). 34. Шатер множества (278). 35. Теорема о пересечении (288). § 10. Критерии экстремума 305 36. Необходимое условие экстремума функции (305). 37. Достаточное условие экстремума функции (329). 38. Принцип максимума (345). 39. Метод динамического программирования (353). Глава V. Критерии оптимальности дискретных процессов 363 § 11. Динамическое программирование 363 40. Описание метода (363). 41. Связь с теорией экстремумов функций (372). § 12. Необходимые условия оптимальности 376 42. Основная задача (376). 43. Задача с фазовыми ограничениями (390). 44. Теорема существования (400). 45. Дискретные объекты с переменной областью управления (404). 46. Дискретный принцип максимума (метод локальных сечений) (408). § J3. Достаточные условия оптимальности 427 47. Объекты с постоянной областью управления (427). 48. Объекты с переменной областью управления (437). Именной указатель 441 Предметный указатель . 442
ПРЕДИСЛОВИЕ Можно привести ряд примеров из истории математики, когда дискретный вариант теории появлялся раньше непрерывного варианта и подготавливал пути развития последнего. В теории оптимального управления дело обстояло иначе. Пути развития прокладывала непрерывная теория оптимального управления, созданная за последние 15—20 лет. Центральным, стержневым результатом ее является принцип максимума Л. С. Понтрягина. Большая значимость и популярность этого результата привели к тому, что и в дискретных задачах оптимизации (широкий интерес к которым возник несколько позже) были в первую очередь предприняты попытки найти дискретный аналог принципа максимума. Среди многочисленных работ, посвященных этому вопросу, было немало ошибочных. Достаточно сказать, что переведенная на русский язык книга Фана и Ваня «Дискретный принцип максимума» (Издательство «Мир», 1967) математически некорректна. Таким образом, зарождение дискретного варианта теории оптимального управления было связано с известными трудностями. Из работ, появление которых привело к созданию теории дискретных оптимальных процессов, необходимо отметить статьи как советских ученых (Н. Н. Красовский, Л. И. Розоноэр, Ф. М. Кириллова, Р. Габасов, А. Г. Бутковский, А. И. Пропой и др.), так и зарубежных авторов (S. S. L. Chang, R. Bellman, Ε. S. Lee, Η. Halkin, J. M. Holtzman, B. W. Jordan, E. Polak, Фам Хыу Шак и др.). Кроме статей указанных выше авторов необходимо отметить небольшую, превосходно написанную книгу Б. Н. Пшеничного «Необходимые условия экстремума» («Наука», 1969). В ней, в частности, приведено краткое изложение теорем, объединяемых под названием «дискретный принцип максимума». Наконец, имеется ряд статей и книг, специально посвященных изложению метода динамического программирования, развитого американским математиком Р. Беллманом и совершенно отличного от дискретного принципа максимума. Это, йо-существу, и
6 ПРЕДИСЛОВИЕ все, что имеется по теории дискретного оптимального управления. Таким образом, предлагаемая вниманию читателя книга является первой попыткой систематического изложения теории дискретного оптимального управления. Книга написана в чисто математическом плане; прикладные вопросы в ней не рассматриваются. Но даже в отношении математической теории дискретных оптимальных процессов книга не претендует на полноту. В ней, например, совершенно не рассмотрены дискретные процессы с бесконечным числом шагов, вопросы аппроксимации непрерывных оптимальных процессов дискретными, вычислительные методы в задачах дискретного управления. Некоторые из этих вопросов рассмотрены в недавно вышедшей книге Η. Η. Моисеева «Численные методы в теории оптимальных систем» («Наука», 1971). Несколько слов о методах, служащих основой изложения в предлагаемой книге. Здесь их имеется два. Первый связан с вопросами отделимости системы выпуклых конусов. Он был предложен в работах А. А. Милютина и А. Я. Дубовицкого. В книге этот метод излагается в существенно более общем виде (п. 32). Отздчие от метода Милютина — Дубовицкого состоит в том, что у них все конусы, кроме одного, предполагаются телесными, а здесь рассматривается общий случай. Второй применяемый в книге метод (п. 35) связан с понятиями топологии (а именно, теории пересечений, восходящей к работам американского математика С. Лефшеца). По поводу этого метода хотелось бы отметить следующее. В предисловии к упомянутой выше книге Б. Н. Пшеничный назвал первоначальное доказательство принципа максимума «в какой-то мере сенсационным». Думаю, что непривычным в этом доказательстве было применение идей топологии, к которым большинство математиков-прикладников относятся с предубеждением. Я попытался здесь показать, что топологические методы весьма полезны в математической теории управления и позволяют получить более глубокие и тонкие результаты. Впрочем, читатель, которому топологические рассмотрения покажутся чуждыми, найдет указания, как можно обойтись классическими методами анализа. В книге пять глав. Глава I содержит первоначальное изложение вопроса об оптимальном управлении дискретными объектами. Это изложение для определенного круга читателей будет вполне достаточным. Здесь есть постановка задачи, обсуждение («на пальцах») возможных методов ее решения, первоначальные формулировки результатов и беглое сравнение теории дискретного оптимального управления с другими «экстремальными» теориями в математике.
ПРЕДИСЛОВИЕ 7 По существу, эту главу можно рассматривать как отдельную книгу небольшого объема, предназначенную для читателя- инженера при его первоначальном знакомстве с предметом. Можно надеяться, что, познакомившись с математической постановкой задачи и привыкнув к виду формулировок (в частности, примирившись с наличием вспомогательных переменных в теоремах), читатель-инженер будет рассматривать последнюю главу книги как справочник, к пользованию которым он уже психологически подготовлен. При необходимости же более углубленно изучить предмет читатель обратится к промежуточным главам. Глава II содержит изложение основных фактов, относящихся к теории векторных (конечномерных) пространств, аффинной и евклидовой геометрии. Изложение этих вопросов, имеющееся в курсах линейной алгебры, является алгебраическим, причем обычно это изложение не доходит до введения геометрических "понятий. Вследствие этого нередко инженеры не могут, например, объяснить запись уравнения гиперплоскости или, в лучшем случае, пишут его по аналогии с уравнениями, известными из курса аналитической геометрии трехмерного пространства. В этой главе дано полное построение евклидовой (многомерной) геометрии на основе аксиоматики Вейля. Это также, по существу, отдельная маленькая книга. Читатель может (в случае нежелания углубленно изучать геометрию или в случае, если он считает себя в общих чертах знакомым с предметом) использовать книгу как справочник при изучении дальнейших глав, где применяются понятия геометрии. Глава III содержит необходимые сведения из теории выпуклых множеств, изложенные с полными доказательствами. Теория выпуклых тел широко применяется в задачах оптимального управления (в том числе и дискретных), и владение понятиями и фактами этой теории становится сейчас необходимым элементом культуры не только математика, но и инженера. В конце главы изложены теоремы об отделимости выпуклых конусов, обобщающие метод Милютина — Дубовицкого. Эга глава также представляет собой отдельное законченное целое. Для читателя-инженера, не желающего вникать в тонкости математических доказательств, глава может рассматриваться как справочная. Вместе взятые, главы II и III содержат все необходимые геометрические сведения. Глава IV также является совершенно самостоятельной. Она посвящена в основном вопросам математического программирования. Здесь излагаются результаты типа теоремы Куна—Так- кера (среди них, вероятно, есть несколько новых). В книге глава IV служит базой для построения (в следующей главе) теории дискретного оптимального управления»
8 ПРЕДИСЛОВИЕ Глава V, посвященная критериям оптимальности дискретного управления, — центральная в книге (по содержанию). Необходимые и достаточные условия оптимальности здесь изложены, по возможности, в наиболее общей форме. Кроме того, приведена новая версия дискретного принципа максимума, полученная на основе «метода локальных сечений», ранее примененного автором к теории непрерывного оптимального управления. Следует отметить, что задачи с запаздыванием (метод сведения которых к задачам без запаздывания намечен в главе I) здесь подробно he рассматриваются. Соответствующие критерии оптимальности имеются в работах Фам Хыу Шака; их также можно получить изложенными в книге методами. За пределами пятой главы остались также работы Р. Габасова и других авторов, содержащие критерии оптимальности не первого, а более высоких порядков и применимые к отысканию особых (вырожденных) оптимальных процессов. Такова специфика книги — пять, по существу, отдельных маленьких книг, составляющих вместе единое целое. Насколько этот замысел удачен, предоставляется судить читателю. В заключение мне хотелось бы выразить признательность все коллегам и друзьям, которые своим вниманием, замечаниями, советами помогли появлению этой книги. Среди них в первую очередь должны быть названы мой учитель Л. С. Понтрягин, Н. Н. Красовский, Б. Н. Петров, Е. Ф. Мищенко, Н. X. Розов, Р. М. Мукурдумов. В. Болтянский
ГЛАВА I ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ § 1. Проблема оптимизации дискретных процессов 1. Задача о максимуме произведения. В этом и следующем пунктах мы рассмотрим несколько постановок задач. Несмотря на их совершенно различный характер, они приводят, после некоторого математического осмысления, к сходным постановкам математической проблемы — проблемы оптимального управления дискретными системами. Пример 1.1. Рассмотрим следующую хорошо известную математическую задачу: найти N неотрицательных чисел, сумма которых не превосходит заданного числа а > 0 и которые имеют при этом максимальное произведение. Мы не будем сейчас решать эту задачу, а только переформулируем ее иначе. С этой целью вообразим следующий мысленный эксперимент. Некто' хочет выбрать N неотрицательных чисел, имеющих сумму, не превосходящую а, и затем, перемножив их, посмотреть, насколько большим получилось произведение. Для этого в первую секунду он выбирает одно неотрицательное число (разумеется, не превосходящее а), во вторую— еще одно число (так, чтобы сумма обоих выбранных чисел не превосходила а), в третью-*-третье число, ...; наконец, N-e число он выбирает в N-ю секунду. Число, которое выбирает этот некто в момент времени t, обозначим через u(t). Таким образом, выбор N чисел, сумма которых не превосходит числа а, мы заменили выбором некоторой функции u(t)y определенной, однако, не для всех t, а лишь для дискретного множества значений t— 1, 2, ..., N. Естественно предположить, что, выбирая одно за другим числа и(1)9и(2), ..., u(N), наш некто каждый раз подсчитывает сумму и произведение уже выбранных чисел. Сумма ему нужна для того, чтобы знать, в каких пределах можно будет выбирать следующее число (т.е. сколько еще осталось до а). Произведение уже выбранных чисел удобно иметь каждый раз затем, чтобы, дойдя до конца процесса, иметь готовое
|0 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ (1 произведение всех чисел. Итак, обозначим через xl(t) сумму, а через χ2 (0-— произведение всех чисел, уже выбранных за / секунд: xl(t)-u(l) + u(2) + ... +«(/); x*(t) = u(l)u{2) ... u{t). Ясно, что, выбрав в момент t число и {t)9 наш некто, чтобы узнать сумму всех уже имеющихся чисел, просто прибавит только что выбранное число u(t) к сумме xl(t—1) всех ранее имевшихся чисел: xl{t) = xx{t-\) + u(t). (1.1) Точно так же для нахождения x2(t) надо произведение всех ранее имевшихся чисел, т.е. x2{t—1), умножить на только что выбранное число u(t): x2(t) = x2{t-\)-ti{t). (1.2) Формулы (1.1) и (1.2) имеют место для t = 2, ..., N. При * = 1 мы имеем вместо них соотношения х*(1)=и(\), х2(1) = и(1). Мы можем включить эти два соотношения в систему формул (1.1), (1.2), условившись считать, что *i(0) = 0, *2(0)=1. (1.3) Тогда соотношения (1.1), (1.2) будут иметь место для всех ί=1, 2, ..., N. Наконец, определим, в каких пределах можно выбирать в момент t число u(t). Так как в момент / сумма всех выбранных чисел не должна превосходить а, т. е. яЧ*—1) + и(0'<а. то мы должны иметь и(<)<а — xl(t— 1). Кроме того, по условию число u(t) должно быть неотрицательным. Таким образом, число u(t) должно принадлежать отрезку 0<α(ί)<α-^(<-1), (1.4) α (/)€=£/(*'(*-0), (1.5) где через U(xl(t—1)) обозначен отрезок (1.4). Остается заметить, что произведение всех выбранных чисел и(\)9 и(2)9 ..., u(N) равно x2(N). Таким образом, наш мысленный эксперимент может быть описан следующим образом: одно за другим выбираются числа и(\), и(2), ..., u(N), причем при каждом ί ϊ= 1, 2, ..., N вместе с u(t) определяются также числа xx{t)9x2(t) (см. (1.1), (1.2), (1.3)) и накладывается ограничение (1.5), где U(xl(t—1)) есть отрезок, определяемый соотношениями (1.4); в конечный момент t = N нас интересует значение *2{N).
I] § 1. ПРОБЛЕМА ОПТИМИЗАЦИИ ДИСКРЕТНЫХ ПРОЦЕССОВ Ц Условимся говорить, что соотношения (1.1), (1.2) задают дискретный управляемый объект, где х1, х2 — фазовые координаты, а и — управляющий параметр, который должен изменяться в пределах области управления, заданной соотношениями (1.4). Произвольную последовательность чисел и(\), и(2), ..., и(N) условимся называть управлением, а последовательности *Ч0), ^(1), ..., *'(А0; *2(0), *2(1), ..., хЦЫ), определяемые из соотношений (1.1), (1.2) с помощью начальных условий (-1.3), условимся считать траекторией, соответствующей этому управлению. Если в каждый момент t— 1, 2, ..., N выполняется соотношение (1.5), то управление и(\), ..., u(N) будем называть допустимым. Теперь ясно, что задача о максимуме произведения может быть переформулирована следующим образом: для дискретного управляемого объекта (1.1), (1.2) найти такое допустимое управление и соответствующую траекторию с начальными условиями (1.3), чтобы выполнялось ограничение (1.5), а величина x2(N) принимала при этом максимальное значение. Пример 1.2. Рассмотрим еще один способ сведения задачи о максимуме произведения к дискретному управляемому объекту. С этой целью поставим мысленный эксперимент несколько иначе. Именно, будем считать, что некто, фигурировавший в примере 1.1, хочет учитывать только случай, когда все Сомножители положительны (если хотя бы один из сомножителей равен нулю, то и произведение равно нулю, что, конечно, не дает максимума произведения), а чтобы упростить операцию умножения, он вычисляет не само произведение, а его логарифм, т. е. су м му логарифмов сомножителей. При таком подходе управление u(t), t = 1, 2, ..., Ν, и первая фазовая координата xl(t), t = 0, 1, ..., Ν, сохраняют прежний смысл; сохраняется соотношение (1.1) и первое из равенств (1.3). Вторая фазовая координата и связанные с ней соотношения становятся ненужными: вместо этого наш некто, последовательно выбирая числа и(\),и(2), ..., u(N·)* вычисляет сумму их логарифмов и ставит задачу о том, чтобы эта сумма / = 1пи(1) + 1пи(2) + ... +\n~u(N) (1.6) была возможно большей. (Мы здесь пользуемся натуральными логарифмами, т. е. логарифмами при основании е.) Далее, с ограничениями (1.4) мы поступим следующим образом. Обозначим через Мх отрезок [0, а] и потребуем, чтобы выполнялось включение χ1{Ν)<=ξΜ{. (1.7)
12 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [2 Так как в силу (1.1) д:1(Л^) = «(1) + н(2) + ... + u(N), то включение (1.7) означает, что сумма всех выбранных чисел «(1), и(2), ..., u(N) не превосходит а. Поэтому нам остается лишь позаботиться, чтобы все эти числа были положительными, т. е. ограничения (1.4) заменяются более простыми: u(t)>09 ;=1, 2, ..., N. (1.8) Таким образом, область управления U(xl(t— 1)) (ср. (1.5)) теперь представляет собой луч U— (О, оо), т.е. не зависит от хх (t—1), так что соотношение (1.8) имеет более простой вид, чем (1.5): u(f)c=U. (1.9) Итак, дискретный управляемый объект задается теперь соотношением (1.1), где х1 — фазовая координата (единственная), а и — управляющий параметр, который должен изменяться в пределах области управления, заданной соотношением (1.8). В результате задача о максимуме произведения, рассмотренная в предыдущем примере, принимает следующую формулировку: для дискретного управляемого объекта (1.1) найти такое управление и(1), и(2), ..., u(N), удовлетворяющее условию (1.8), чтобы для соответствующей траектории ^(0), я4(1), ..., xi(N) с начальным условием х1(0) = 0 выполнялось включение (1.7) и сумма (1.6) принимала при этом наибольшее возможное значение. 2. Несколько прикладных задач. Пример 2.1*). Ферма имеет стадо скота. Ежегодно часть стада отправляется на мясозаготовки, а остальная часть остается на ферме для воспроизводства. Доход от продажи скота мя« I созаготовительным организациям выражается функцией φ(Α:), где х-— количество проданного скота (функция *р(х) может, например, иметь вид, показанный на рис. 1: поставки мяса | b χ сверх планового задания Ь оплачиваются по более высоким ценам). Рис· ι· Количество скота, оставляемого на ферме для воспроизводства, в следующем году (до начала мясозаготовок) увеличивается в а раз (где а> 1). Каким образом ферма может получить за N лет максимальный доход, если минимальные ежегодные мясозаготовки составляют 6? Обозначим через х1(0) начальное количество скота на ферме, а через xl(t)—количество скота, оставленное на ферме *) См. Р. Беллман, Динамическое программирование, ИЛ, М., 1960, стр. 66—67.
2j § ι. ПРОБЛЕМА ОПТИМИЗАЦИИ ДИСКРЕТНЫХ ПРОЦЕССОВ 13 к концу *-го года (t = 1, 2, ..., Ν). Далее, количество скота, проданное для мясозаготовок в ^-м году, обозначим через u(t), t = 1, 2, ..., Ν. Β (/—1)-м году на ферме было оставлено для воспроизводства количество скота, равное xi(t — 1). Следовательно, в i-ы году (перед мясозаготовками) на ферме будет количество скота axMJL — 1). Из этого количества u(t) будет продано для мясозаготовок, а оставшаяся часть, т. е. axi(t— 1) — u(t), остается к концу ^-го года на ферме для воспроизводства. Итак, xi(f) = axl(t—\) — u{t), f=l, 2, ..., Ν. (2.1) Доход фермы за N лет составит / = φ(α(1)) + φ(ιι(2))+ ... + φ (α (Λ0) - Σ Φ ИО). (2.2) /«ι Учитывая обязательные мясопоставки, мы имеем для управляющего параметра и следующие ограничения: и (*)>*, ί=1, 2, ..., Ν. (2.3) Кроме того, по смыслу задачи фазовая координата х1 (т. е. количество скота, оставляемого для воспроизводства) неотрицательна: *(0>0, f-1, 2,..., N. (2.4) Таким образом, поставленная задача о максимуме дохода животноводческой фермы за JV-летний период принимает следующую формулировку: для дискретного управляемого объекта (2.1) найти такое управление и(\),и(2), ..., u(N), удовлетворяющее условию (2.3), чтобы для соответствующей траектории х1(0), х1(1), ..., xl(N) с заданным начальным условием #1(0) = = с выполнялось соотношение (2.4) и сумма (2.2) принимала при этом наибольшее возможное значение. Заметим, что в примере 2.1 число χι(Ν)9 τ. е. количество скота, оставленное на ферме к концу JV-ro года, никак условиями задачи не регламентируется. Поэтому очевидно, что в целях достижения максимального дохода за N лет целесообразно будет в N-м году продать весь имеющийся к тому времени скот на мясозаготовки, а это означает, что ровно через N лет ферма прекратит существование. Если же это планом не предусматривается, то последнее из условий (2.4) следует заменить соотношением xi(N)^d, где d — плановое задание по разведению скота к концу JV-летнего периода. Пример 2.2. Предстоит спроектировать Af-ступенчатую космическую ракету с заданным стартовым весом G. Известен также вес Η космического корабля, который должен быть
14 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [2 выведен на траекторию полета с помощью последней ступени ракеты-носителя. Каждая ступень ракеты-носителя имеет запас горючего. За время работы очередной ступени (от момента включения ее двигателей и доотделения полностью отработавшей ступени) ракета получает добавочную скорость Αν, зависящую от веса Ρ того груза, который несет эта ступень, и от веса Q самой ступени (определяющего запас горючего): Av = f(P,Q). Требуется найти распределение веса между ступенями, при котором скорость космического корабля (после отделения всех ступеней ракеты-носителя) будет максимальной*). Обозначим через u(t) вес t-й ступени, считая от космического корабля. Гаким образом, вес последней ступени (непосредственно выводящей корабль на траекторию полета и отделяемой после всех остальных ступеней) мы обозначим через и(\), вес предпоследней ступени — через и (2), и т. д. Далее, вес космического корабля вместе с примыкающими к нему t ступенями обозначим через **(/), t = 0, 1, ..., N (рис. 2). Тогда яснр, что χ40 = *4'-ΐ) + "(0, причем задание веса космического корабля и стартового веса ракеты накладывает следующие условия: *ΐ(0)^=#, xi(N)=G. Согласно сказанному выше добавочная скорость, сообщаемая за время работы t-ft ступени, равна Ао,-/(*1('-г1).и(0), так как u(t)—вес ^-ступени, a xl(t—1) — вес того груза, который она несет. Общая же скорость, сообщаемая космическому кораблю всеми ступенями ракеты-носителя, равна /= Σ/(*·(<-!). «(*))· (2.6) *=1 *) Эта задача взята из книги Е. С. В е н τ ц е л ь, Элементы динамического программирования, «Наука», М., 1964, стр. 99—102. й щаоль I/ *К'1}\ фЛ ψΉ'ступень Рис. 2.
21 § 1. ПРОБЛЕМА ОПТИМИЗАЦИИ ДИСКРЕТНЫХ ПРОЦЕССОВ 15 Таким образом, задача о максимуме скорости космического корабля принимает следующую формулировку: для дискретного управляемого объекта (2.5) найти такое управление и(1), и(2), ..., ti(N), чтобы для соответствующей траектории х1(0), х*(\), .··» xl(N) с начальным условием х1(0) — Η выполнялось соотношение х^(Ы) = G и сумма (2.6) принимала при этом на- иболыиее возможное значение, (Разумеется, и здесь управляющий параметр и подчинен ограничениям типа u(t)^bti о чем мы не упоминали.) Пример 2.3*). Некоторое вещество (продукт химического производства) находится в растворе и должно быть извлечено из него промывкой. Промывка производится в N одинаковых агрегатах, через которые последовательно протекает раствор (рис. 3), причем в процессе промывки раствор и вода не смешиваются. (Например, раствор и промывочная вода могут Г xfV ( „« «* У ί-ι |Т rti-1) хШ )ч |Т Рис. 3. быть разделены тонкой пленкой с избирательной проницаемостью.) Количество вещества, извлеченного на очередной ступени промывки, выражается функцией φ(#, и), где χ—количество вещества в растворе (при поступлении его в промывочный агрегат), а и — использованное количество воды. Доход производства определяется как βιΛ' — β2ί/, где X — количество вещества, извлеченного из раствора (на всех ступенях промывки), а (/ — израсходованное количество воды. Задача заключается в нахождении такого режима промывки, который обеспечивает максимальный доход**). Обозначим через x(t) количество вещества в растворе при выходе его m t-ft ступени промывки (или, что то же, при входе раствора в (/+1)-к> ступень), а через u(t) количество *) См. Фан Лянь-цэнь, Вань Чу-сен, Дискретный принцип мак* симума, «Мир», М., 1967, стр. 51—-53. **) Заметим, что в действительности раствор непрерывно протекает по трубопроводу, проходящему через все промывочные ступени, но мы можем мысленно выделить некоторую порцию раствора и считать, что она в течение некоторого времени находится в первом промывочном агрегате, затем в течение того же времени во втором и т. д. В таком случае и будет обозначать количество воды, поступающей в промывочный агрегат во время прохождения выделенной порции раствора, т. е. интенсивность подачи воды, а х можно представлять себе как концентрацию вещества в растворе.
16 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [2 промывочной воды, подаваемой в t-н агрегат. Тогда в результате промывки в ^-м агрегате из раствора (первоначально содержащего вещество-продукт в количестве x(t— 1)) будет выделено количество вещества, равное φ(χ(ί— 1), u(t)), и потому количество вещества в растворе при выходе из t-u ступени упадет до x(t— 1) — q>(x(t— 1), u(t)). Таким образом, *(0-*(/-1)-φ(*(ί-1),α(0), f=»l, 2,..., Ν, (2.7) где х(0) = Χο — количество вещества в первоначальном растворе (поступающем в первую ступень промывки). Общий же доход производства равен / - βι (х (0) - х (Ν)) - β2 Σ и (*).. (2.8) При этом управляющий параметр u(t) подчинен ограничениям 0<α(ί)<6, ί=1, 2, ..., Ν, (2.9) где b определяется конструктивными особенностями промывочного агрегата. Рис. 4 Таким образом, задача о наиболее выгодном режиме промывки принимает следующую формулировку: для дискретного управляемого объекта (2.7), (2.9) найти такое управление «(1), и(2), ..., u(N), чтобы для соответствующей траектории х(0), *(1), ..., χ(Ν) с начальным условием х(0) = Хо сумма (2.8) принимала наибольшее возможное значение.
2] § 1. ПРОБЛЕМА ОПТИМИЗАЦИИ ДИСКРЕТНЫХ ПРОЦЕССОВ 17 Пример 2.4 *). В качестве последнего примера рассмотрим транспортную задачу — о перевозке товаров («сырья») от производителей («складов») к местам потребления («заводам»). Для большей простоты и наглядности будем считать, что число складов равно трем; число заводов обозначим через N. Кроме того, предположим, что имеется только один вид сырья и что запас равен спросу; иначе говоря, если мы обозначим через аи а2, а3 количество сырья на складах, а через Ьи Ь2, ..., Ьм потребности заводов в сырье, то al+a2 + a3 = bl + b2+ ... + bN. (2.10) Стоимость перевозки и единиц сырья с ί-го склада на t-и завод зависит от и (т. е. от того, сколько сырья нужно перевезти), а также от i и t (этими числами характеризуется дальность перевозки; рис. 4); мы обозначим эту стоимость через <р^ (и) (рис. 5). Задача заключается в том, чтобы перевезти сырье со складов на заводы с минимальными транспортными расходами. Решение этой задачи можно представлять себе следующим образом. Чтобы составить план перевозок, мы намечаем прежде всего количество сырья, которое надо завезти с первого и второго складов на 1-й завод, затем количество сырья, перевозимого с этих же складов на 2-й завод, на 3-й завод и т. д. Рис. 5. Количество же сырья, поставляемого третьим складом, определится тогда однозначно: на каж* дый завод надо довезти с третьего склада недостающее количество сырья. Именно, обозначим через ul(t) количество сырья, поставляемого t-uy заводу первым складом, а через u2(t) — вторым складом. Тогда, поскольку потребность ^-го завода в сырье равна bt, с третьего склада надо будет на 4-й завод завезти сырье в количестве bt — ul(t)— u2(t). Итак, для составления плана перевозок нужно лишь выбрать числа ul{t),u2(t), ί = 1,2, ..., N. Однако при выборе этих чисел надо соблюдать некоторые предосторожности. Прежде всего числа «*(/), u2(t) должны быть по смыслу задачи неотрицательными, а сумма их не должна превосходить bt: ul(t)>0, «2(0>0, ul(t) + u2(t)^bt9 t=l9 2,..., Ν. (2.11) *) Сведение задач линейного программирования к задачам управления Дискретными системами рассматривалось в работе Η. Η. Моисеева, О применении методов оптимального управления к задаче оптимального планирования, Кибернетика, № 2 (1966).
18 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [2 Иными словами, «управляющая точка» u(t) — (ti^t), u2(t)) должна находиться в треугольнике Ut, показанном на рис. 6: u(t)e*Ut. (2.12) Но этого мало. Если мы будем план перевозок (т. е. набор чисел uHt), u2(t)y t= 1, 2, ..., Ν) составлять неосторожно, то не исключена возможность, что мы «запланируем» вывезти с некоторого склада больше сырья, чем там есть. Чтобы этого не случилось, будем по каждому складу вести учет запланированного к вывозу сырья. Именно, обозначим через xl(t) и x2(t) количество сырья, вывозимого на первые / заводов, с первого и второго складов соответственно: Рис· 6· χ2(t) = u2{l) + u2{2)+ ... + и2(t). Тогда при планировании поставок сырья на (t + 1)-й завод мы будем иметь представление о том, сколько еще сырья имеется на первых двух складах. Ясно, что хЧО —*!(*—!) +и1 (0. x2(t) = x2(t-\) + u2(t), (2.13) /-1, 2, ..., Ν, где мы считаем для удобства: *!(0) —0, *2(0) = 0. (2.14) Так как запас равен спросу, т. е. выполнено соотношение (2.10), то после завоза сырья на все N заводов склады останутся пустыми, т. е. xl(N) = alf x2(N) = a2. % (2.15) Легко понять, что если соотношения (2.11), (2.15) выполнены, то план перевозок является допустимым, т. е. заводы получат с трех складов нужное количество сырья. При этом стоимость всех перевозок (по составленному плану) будет равна /= 2 [Φΐ (и1 (0) + Ф? (и2 (0) + Ф? (bt - и1 (t) - и2 Щ (2.16) Таким образом, транспортная задача принимает следующую формулировку: для дискретного управляемого объекта (2.13) найти такое допустимое (т. е. удовлетворяющее условию (2.11)) управление ul(t), u2(t)% t = 1, 2, ..., Ν, чтобы для соответствующей траектории xx(t),x2(t), t = 0, 1, ..., Ν, с начальным
3| § 1. ПРОБЛЕМА ОПТИМИЗАЦИИ ДИСКРЕТНЫХ ПРОЦЕССОВ Ю условием (2.14) удовлетворялось конечное условие (2.15) и при этом сумма (2.16) принимала наименьшее возможное значение, 3. Задача оптимального управления дискретными объектами. Обобщая рассмотренные в пп. 1, 2 примеры, мы теперь укажем общее математическое описание дискретных управляемых объектов. Будем по-прежнему считать, что переменная t (которую мы будем иногда называть «временем») может принимать лишь дискретное множество значений, а именно ^ = О, 1, ..., N, где N — фиксированное натуральное число. Во всех рассмотренных выше примерах, кроме последнего, мы имели только один управляющий параметр и, в то время как в примере 2.4 было два управляющих параметра и1, и2. В общем случае предполагается, что можно воздействовать на управляемый объект, выбирая (с большей или меньшей степенью произвола) г управляющих параметров и1, ..., ыг, или, что то же самое, точку и пространства переменных и1, ..., иг. Таким образом, в каждый момент t управляющая точка u(t) имеет г координат: и(*)«(и1 (0, ..·> tir(t)). Управлением мы условимся называть последовательность точек и (II α (2), ..., α (АО (3.1) в пространстве переменных и\ ..., №. В рассмотренных выше задачах состояние объекта характеризовалось одной или двумя фазовыми координатами. В общем случае будем считать, что в каждый момент t состояние объекта характеризуется η фазовыми коордцнатами х19 ..., хп, т. е. точкой χ пространства Еп переменных х1, . ·., хп. Таким образом, в каждый момент t фазовое состояние x(t) имеет η координат: *(')=(*'о,.... хпт Последовательность *(0), *(1), ..., χ{Ν) (3.2) состояний объекта в моменты / = 0, 1, ..., N будем называть траекторией движения объекта. Начальное состояние лг(0) должно быть задано. Дальнейшее же поведение объекта однозначно определяется, если выбрано некоторое управление (3.1), с помощью соотношений x(t) = ft(x(t-l), u{t)\ /=1, ..., Ν, (3.3) где ft(x9 u) = (f\(x> u)f ..., ί"(χ, и)) — некоторая вектор-функция со значениями в пространстве Еп. Индекс t у функции ft{x%u) означает, что рассматривается не одна функция f(x,u)
20 ГЛ. Ϊ. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ (3 для всех моментов t = 1, ..., Λ/, а, вообще говоря, различные функции, меняющиеся от одного момента времени к другому. Если же функция // (а:, и) в действительности не зависит от /, то мы имеем лишь одну функцию f(xy и), и соотношение (3.3) принимает вид *(0 = /И*-1), и (ή). (Именно такой случай имел место в рассмотренных ранее задачах; так, в примере 1.1 поведение дискретного управляемого объекта описывается соотношениями (1.1), (1.2), правые части которых не зависят явно от t.) Соотношения (3.3) представляют собой закон движения дискретного управляемого объекта. Траекторию (3.2), удовлетворяющую соотношению (3.3), будем называть соответствующей начальному состоянию д:(0) и управлению (3.1). Далее, для каждой точки χ е Еп и каждого ί = 1, ..., N задано в пространстве переменных ult ..., иг некоторое непустое множество Ut(x) — область управления, соответствующая в момент ί фазовому состоянию х. Мы будем рассматривать лишь такие управления (3.1), которые удовлетворяют условию (ср. (1.5), (1.9), (2.12)): u{t)<=Ut(x{t-\)), f«l, ..., ff9 (3.4) где траектория (3.2) исходит из начальной точки х(0) и соответствует управлению (3.1). Управления, удовлетворяющие этому условию, будем называть допустимыми (относительно начального состояния х{0)). Соотношения (3.3), (3.4) и определяют дискретный управ- ляемый объект. Процесс управления таким объектом осуществляется следующим образом. Поскольку задано начальное фазовое состояние #(0), нам известна соответствующая область управления ί7ι (λ:(0) ). В силу (3.4) мы можем выбрать произвольную управляющую точку и(\) е U\(x(0)), после чего определится фазовое состояние х(1) в момент t= 1 (см. (3.3)). Далее, зная д:(1), мы можем рассмотреть соответствующую область управления £/2(#(l)). После этого, выбрав произвольную управляющую точку и(2)е ί/2(#(1)) (см. (3.4)), мы сможем найти следующее фазовое состояние χ(2) (см. (3.3)), и т. д. Очевидно, что управление (3.1), получающееся в результате такого последовательно выполняемого построения, является допустимым (относительно исходного начального состояния х{0))> а получающаяся траектория (3.2) является соответствующей этому управлению. Теперь поставим задачу оптимального управления для дискретного управляемого объекта (3.3), (3.4). С этой целью предположим, что заданы некоторые функции f°t(x, и), f = 1, ..., ЛЛ
3] § 1. ПРОБЛЕМА ОПТИМИЗАЦИИ ДИСКРЕТНЫХ ПРОЦЕССОВ 21 В качестве критерия эффективности, т. е. функционала, показывающего, насколько «выгодным» был выбранный процесс (3.1), (3.2), мы возьмем следующий: / — /o(x(0)tn(l)) + /g(jc(l)fa(2))+ ... + ft(*(JV-l),a(A0)- -2/?(*(<-l),aW). (3.5) Задача оптимального управления заключается в том, чтобы, зная начальное состояние х(0)9 выбрать такое допустимое управление (3.1) для объекта (3.3), (3.4), которое придает функционалу (3.5) максимальное значение. (В некоторых случаях речь может идти о минимальном значении функционала (3.5); именно такой случай мы имели в примере 2.4.) Эту задачу, которую мы будем называть основной, можно охарактеризовать как задачу оптимального управления с закрепленным левым концом и свободным правым концом. Иными словами, начальное состояние х(0) предполагается заданным, а состояние в правом конце отрезка времени, т. е. x(N)t ничем не связано (лишь бы значение функционала (3.5) было максимальным). Типичной задачей оптимального управления с закрепленным левым концом и свободным правым концом является задача, рассмотренная в примере 2.3. Кроме основной задачи можно также рассматривать задачу с подвижными концами. В этом случае предполагается, что в фазовом пространстве Еп заданы два множества М0 и MN, и ставится задача найти,такое начальное состояние χ(0)εΜ0 и такое допустимое (относительно х(0)) управление (3.1), чтобы было выполнено соотношение χ(Ν)^ΜΝ и при этом функционал (3.5) принимал наибольшее возможное значение. Ясно, что если М0 состоит из одной точки, a MN совпадает со всем фазовым пространством £п, то задача с подвижными концами превращается в рассмотренную ранее основную задачу. Далее, если каждое из множ-еств М0, ΜΝ состоит лишь из одной точки (т. е. заданы заранее и начальное состояние д:(0) и конечное состояние x(N))t то мы имеем задачу с закреплен- ными концами. В примере 1.2 мы имели задачу с закрепленным левым и подвижным правым концом (см. (1.7)). В примерах 2.2 и 2.4 рассматривались задачи с закрепленными концами. Наконец, возможен случай, когда для каждого / = О, 1, ..., N задано в фазовом пространстве Еп некоторое множество Mi и ставится задача найти такое начальное состояние *{0) и такое допустимое (относительно х(0)) управление (3.1), чтобы были выполнены соотношения x(t)^Mt, t = О, 1, ..., Ν,
22 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [4 и при этом функционал (3.5) принимал наибольшее возможное значение. Эту задачу условимся называть задачей с ограничениями на фазовые координаты. При Μι — ... = MN-i — Еп она превращается в задачу с подвижными концами. Таким образом, задача с ограничениями на фазовые координаты является наиболее общей из рассмотренных. Задачу с ограничениями на'фазовые координаты мы имели в примере 2.1 (см. соотношение (2.4), которое имеет вид x{t)^Mty где Mt есть луч [0, оо)). 4. Другие постановки задач дискретного управления. Сформулированные в предыдущем пункте задачи оптимального управления дискретными объектами являются основной темой исследования в этой книге. Именно для задач в такой постановке доказываются основные результаты. Однако эти задачи (даже наиболее общая из них —задача с ограничениями на фазовые координаты) не являются всеобъемлющими. В теории дискретных систем встречаются и другие постановки задач: оптимальные задачи для систем с обратной связью, дискретные объекты с запаздыванием и др. Здесь мы рассмотрим некоторые из этих задач и покажем, как они сводятся к задачам, сформулированным в предыдущем пункте. Системы с обратной связью. Вернемся к задаче о последовательном извлечении вещества из раствора (пример 2.3). Если процесс промывки протекает очень медленно, то раствор, выходящий из N-ro промывочного агрегата, все еще содержит немало вещества, и слив раствора ведет к заметным потерям. В таких случаях бывает целесообразно сливать лишь небольшую часть раствора, выходящего из N-n промывочной ступени, а остальную часть снова подавать на вход первого агрегата, осуществляя таким образом «обратную связь» (рис.7). Рис. 7. При такой схеме работы большая часть раствора будет многократно проходить через все N промывочных ступеней, что повысит процент извлекаемого из раствора вещества. Легко понять, что в рассматриваемом случае (т. е. в схеме с обратной связью) соотношения (2.7) —(2.9) остаются без из-
41 § 1. ПРОБЛЕМА ОПТИМИЗАЦИИ ДИСКРЕТНЫХ ПРОЦЕССОВ 23 менений: меняется лишь начальное условие х(0) = хо. В самом Йеле, так как раствор, вводимый в систему очистки (и содержащий вещество-продукт в количестве х0) смешивается с частью раствора, выходящего из Ν-Ά ступени очистки, то л:(0) (т. е. количество вещества в растворе, входящем в первую ступень) уже не будет равно х0, а будет представлять собой некоторую комбинацию количеств Хо и x(N), например: *<о)»*+*у. Иными словами, вместо равенства л:(0) = Хо мы теперь будем иметь какое-либо соотношение между #(0) и x(N)9 которое в общем случае можно записать в виде φ(χ(0), x(N)) = 0. Обобщая, мы можем сказать, что математически дискретная система с обратной связью описывается соотношениями (3.3), (3.4) с дополнительными условиями вида <р,(*(0),*(Л0) —0, ί=1, 2, ..., / ,. (4.1) (заменяющими накладывавшиеся ранее требования х(0)&Мо, χ(Ν)^ΜΝ). Возможно, что, кроме того, накладываются ограничения на фазовые координаты: x(t)& Ми t = 1, 2, ..., N— 1. Задача, как и прежде, заключается в том, чтобы при выполнении всех этих требований максимизировать функционал (3.5).· Поставленная задача может быть сведена к задачам, рассмотренным в п. 3, при помощи следующего приема. Добавим к фазовой переменной χ = (χ1, χ2, ..., χη) еще переменную у = (χη+ι, ..., λ2η), которую подчиним условиям: *(*)-*(*-1), '-1. ·-. Ν; (4.2) ίΚ0)-*(0). (4.3) Ясно, что в силу этих условий #(0) =*#(!)= ... = у (Ν) = х(0), и потому соотношение (4.1) можно будет записать в виде Ф* (У (ЛО, х (Ю) - 0, / - 1, 2, ..., /. (4.4) В результате мы приходим к следующей постановке задачи. Имеется 2п фазовых координат я1, ..., хп, Arn+1, ..., х2п, и те же г управляющих параметров и1, ..., иг, что и раньше. Соотношения (3.3), (3.4), (4.2) определяют дискретный управляемый объект. Соотношение (4.3) означает, что начальная точка (#(0), у(0)) принадлежит множеству М0> определяемому в пространстве переменных х\ ..., χ2η уравнениями х* « xi+n, i = 1,2, ..., п. Соотношение (4.4) может быть записано в виде (л; (Ν), у (Ν)) <= Μ*Ni гДе множество Мм определяется уравнениями фг(г/, х) = 09 / = ""U ···, /, а функционал (3.5) оказывается зависящим лишь от координат х19 ..., хп.
24 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ \* Таким образом, за счет увеличения (вдвое) числа фазовых координат дискретная задача с обратной связью сведена к задаче с подвижными концами (или к задаче с ограничениями на фазовые координаты, если в постановку задачи с обратной связью входили ограничения x(t)^Mt, t = 1, 2, ..., Ν—1). Заметим, что удвоение числа фазовых координат практически мало усложняет задачу, поскольку соотношения (4.2) имеют особенно простой вид. Системы с запаздыванием. Чтобы получить представление о задачах с запаздыванием, уточним постановку задачи, рассмотренной в примере 2.1. Именно, будем учитывать, что каждый год на ферме имеется молодняк (однолетки), которые на будущий год еще не дадут потомства, и взрослые животные. Будем при этом считать, что если число оставленных на ферме взрослых животных равно у, то на будущий год от них будет приплод ky. Предполагается также, что мясопоставки производятся только за счет взрослых животных. Сохраним те же обозначения x(t), u(t)y что и при рассмотрении примера 2.1. Тогда в t-м году потомство будет получено только от тех животных, которые рождены в (t — 2)-м году или ранее, т. е. от животных, которые были оставлены на ферме к концу (/ — 2)-го года и еще сохранились на ферме к /-му году. Но в (t — 2)-м' году на ферме было оставлено x(t— 2) животных, причем u(t—1) из них было в (t—1)-м году отправлено на мясозаготовки. Следовательно, к ί-му году на ферме было x(t — 2) — u(t — 1) взрослых животных, и потому в /-м году потомство составляет k(x(t — 2) — u(t—1)) животных. Из этого вытекает, что перед мясозаготовками /-го года на ферме стало x(t—l)-{-k(x(t — 2) — u(t — l)) животных. После же мясозаготовок это количество животных уменьшилось на u(t)y с чем ферма и подойдет к концу £-го года/ Таким образом, x(t) = x(t—l) + k(x(t — 2)— и(*-1))-и(0, (4.5) Y = 2, 3, ..., N. Мы видим, что, в отличие от (3.3), это соотношение имеет вид xy)=*ft{x(t-l),x(t-2)9u(f)9u(t-l))t t = 2, 3, ...,tf, (4.6) т. е. фазовое состояние x(t) зависит не только от x(t—1) и u(t), но и от предшествующих им величин χ\ί—2)> u(t—1). Заметим, что соотношение (4.5) написано лишь для t = = 2, ..., Ny поскольку, если подставить в него / = 1, в правую часть войдут величины х[—1) и и(0)9 которые в задаче опреде-
4] 1. ПРОБЛЕМА ОПТИМИЗАЦИИ ДИСКРЕТНЫХ ПРОЦЕССОВ 25 лены не были. Поэтому величины х(0), х(1) должны быть заданы отдельно, а остальные состояния х(2), ..., χ(Ν) могут быть получены по'формуле (4.5). Впрочем, если бы нам были известны количество животных на ферме за год до срока планирования (т. е. х(— I)) и мясопоставки в году, предшествующем первому году планирования (т. е. и{0)), то соотношение (4.5) имело бы смысл и для^== 1. Другой пример системы с запаздыванием доставляют нам непрерывные (или, как их еще называют, цепные) дроби; непрерывная дробь имеет вид а, + г—1 · (4·7) а,- а2 + +i где ао, аи ..., αΝ — некоторые числа. Обрывая дробь (4.7) на числе аи мы получаем выражение ао + —i . (4.8) fli а2 + +i называемое t-й подходящей дробью для непрерывной дроби (4.7). Если освободиться в (4.8) от «многоэтажных» дробей, то мы запишем это выражение в виде обычной дроби, которую обозначим через -—". Например, η — -2l — JV n Л- l — aogi + l — pi . a°~ ι - Q0' а° + "нг_~5; -"от· a°+ ai+± axa2+i — Ί5Γ· И Τ· Д' Таким образом, числители и знаменатели подходящих дробей можно определить следующим образом: Ро = а09 Рх = aQax +1, P2 = a0axa2 + a0 + a2, ...; Qo=l> Qx — ait Q2 = ^i^2+ 1, ...
26 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ (4 Можно доказать по индукции*), что числители и знаменатели подходящих дробей определяются соотношениями Pt = atPt-г + Р*-2, Qt = atQt-x + Q,_2. (4.9) (Заметим, что эти соотношения имеют место для t = 2,3, ..., Ν; однако если — чисто формально — положить Ρ_ι = 1, Q_i = 0, то эти соотношения будут справедливы и при t = 1.) Мы можем теперь представить себе, что некто выбирает по своему усмотрению управление и (1) = а{, и (2) = а2, ..., и (N) = aN и вычисляет последовательно подходящие дроби — первую, вторую и т. д., — считая их числители и знаменатели фазовыми координатами: *!(1)-Pi. *2(l) = Qf, xl (2)*= Ρ* χ* (2) - Q2; ...; χ* (Ν) = ΡΝ% χ' (Ν) = QN. Тогда соотношения (4.9) определят дискретный управляемый объект xl(t) = u(t)xl(t-l) + xl(t-2)f x2(t) = u(t)x2(t-l) + x2(t-2). (4.10) И здесь, в отличие от (3.3), правые части зависят не только от u(t), x(t— 1), но и от x(t — 2). Рассмотренные выше дискретные объекты (4.5), (4.10) называются объектами с запаздыванием (поскольку x(t — 2), т. е. информация о состоянии объекта в момент / — 2, не только участвует в формировании состояния x(t—1), но также — как бы где-то задерживаясь, запаздывая — участвует в момент t в формировании состояния x{t)). В общем случае дискретный объект с запаздыванием на один шаг. может быть описан следующим образом. Пусть χ = (х\ ..., хп) есть вектор фазового состояния, а и = = (и1, ..., иг) — управляющий вектор. Известна предыстория процесса, т. е. состояния х(—1) и х(0), а дальнейшее поведение объекта определяется соотношениями x(t)-ft(x(t-l), x(t-2)9 u(t)), f = l, 2, ..., ΛΛ (4.11) Задача заключается в том, чтобы найти управление и(1), и(2), ..., u(N), определив по которому траекторию х(— 1), х(0)9 *(1), ..., x(N), мы сможем максимизировать функционал /-Σ/?(*(*-l).*(*-2)f u(t)) *) См., например, А. Я. Хин чин, Цепные дроби, Гостехиздат, М. — Л., 1949. стр. 10—12.
4j § !. ПРОБЛЕМА ОПТИМИЗАЦИИ ДИСКРЕТНЫХ ПРОЦЕССОВ 27 (возможно, что при этом наложены ограничения типа u(t) e ^Ut(x(t—1), x(t — 2)) на управления и ограничения типа x(t)^Mt на фазовые координаты). Для сведения этой задачи к задачам, рассмотренным в п. 3, введем дополнительную фазовую переменную у = (хп+{, ..., х2п), которую подчиним условиям: y(t) = x(t-l), / = 0, 1, .... N. (4.12) Тогда у(0) = х(—1), а соотношение (4.11) можно будет записать в форме x(t) = ft(x(t-l),y(t-l),u(t)), t=\, 2, ..., Ν, (4.13) причем ограничение u(t) e Ut(x(t— 1), x(t — 2)) принимает вид u(f)eUt(x(t-l),y(t-l)). (4.14) В результате мы приходим к следующей постановке задачи. У нас теперь имеется 2п фазовых координат а:1, ..., хп, xn+i, ..., х2п и те же г управляющих параметров и1, ..., игу что и раньше. Соотношения (4.12) — (4.14) определяют дискретный управляемый объект, для которого задана начальная точка (*(0), г/(0)); требуется максимизировать функционал /-Σ/?(*(*-a »(<-i). «(d). Таким образом, за счет увеличения (вдвое) числа фазовых координат дискретная задача с запаздыванием (на один шаг) сведена к задаче с закрепленным левым концом. Случай, когда в правую часть соотношения (4.11) входит также u(t—1) (ср. (4.6)), требует введения еще дополнительных фазовых координат. Именно, введя (кроме уже имеющихся хну) еще фазовую переменную ζ = (х2п+{, ..., х2п+г) и подчинив ее условиям *(0-и(0,- мы сможем соотношение типа (4.6) записать в виде x® = ft(x(t-l),y(t-l)9u®9z(t-l))9 который вполне согласуется с записью управляемого объекта в виде (3.3). Наконец, отметим, что встречаются дискретные управляемые объекты с запаздыванием на θ шагов (где θ — натуральное число, меньшее Ν), т. е. объекты, описываемые соотношениями типа x®~ft(x(t-l),x(t-2l ..., *(ί-θ-1),α(0), (4.15) *-1, 2, ..., Ν,
28 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ (4 2п), ПОД- СВОДИТ причем задана предыстория х(—θ), χ(—θ + 1), ..., х(—1), х(0) и, возможно, налагаются ограничения на управляющие параметры и на фазовые координаты. Для таких объектов введение дополнительной фазовой переменной у = (хп+\ ,.., χ чиненной условию (4.12), уменьшает θ на единицу, т. е. рассматриваемый объект к другому объекту, имеющему запаздывание на θ— 1 шагов. Таким путем, вводя достаточное число дополнительных фазовых координат, мы можем свести объект (4.15) к объекту без запаздывания. Системы с переменным числом фазовых координат. В некоторых случаях приходится рассматривать процессы, у которых с изменением дискретного времени t меняется и число фазовых координат, описывающих поведение объекта. Предположим, например, что в системе промывки (см. пример 2.3) после (/—1)-й ступени поток разделяется, а затем снова сходится, как показано на рис. 8. Тогда на v'fH % Η хЧ-пч u'tt+lh x'(i) \ i+l ftttj ifii*1) хгН) w x}(t+!) К 1+1 r УМ м'Н+2) i+£ x'(t+2) fm+» uiw ^ш\ *y Lh*/ 'jWHJ i+2 V i+3 it xtt+3) Рис. 8. (U—1)-й ступени мы имеем одну фазовую координату л;1, на t-и и (t + 2)-й ступенях —две координаты х\ л:2, а на {t + 1)-й ступени — три фазовые координаты л;1, л:2, х3. То же относится к числу управляющих параметров. В общем случае объект с переменным числом фазовых координат и управляющих параметров записывается так же, как и в п. 3 (см. (3.3)), но теперь x(t) есть вектор, число компонент которого зависит от t: *(*)-(*'(*). ^(О. ..., χη*(ή)9 / = 0, 1, ..., Ν; то же относится и к управлению: u(t) = W(t), u\t\ ..., и'Щ), <- 1, 2, ..., N.
41 § 1. ПРОБЛЕМА ОПТИМИЗАЦИИ ДИСКРЕТНЫХ ПРОЦЕССОВ 29 Такой объект легко сводится к объектам, рассмотренным в п. 3. Именно, обозначим через η наибольшее из чисел и0, пи ···» пк- Тогда каждый вектор x(t) имеет не больше, чем η 'компонент. Но мы можем считать, что вектор x(t) имеет ровно η компонент, поставив на недостающие места нули: χ (t) = (χ1 (ή. χ* (t), .. ., xnt (t), 0, 0, ..., 0) (4.16) (здесь поставлено п — tit нулей) и переписав соотношение (3.3) в координатной форме следующим образом: ί/Λ ί #(*('—^"W) при /=ι, ...,**; ,, __, х (0 = | (4.17) I 0 при i = nt + 1, ..., п. Конечно, в записи (4.16) последние п — nt координат (т. е. нули) не зависят от выбираемого процесса управления и не влияют на последующие фазовые состояния. Но это уже вопрос конкретной записи уравнений (4.17). Для нас сейчас важно лишь то, что таким формальным приемом объект с переменным числом фазовых координат приводится к записи с постоянным числом фазовых координат, а закон движения этого объекта записывается в виде (4.17), т. е. подпадает под тип (3.3). Функции конечного состояния. Обратим внимание на то, что в выражение функционала (3.5) совсем не входит конечное состояние x(N). В то же время встречаются такие задачи, в которых именно конечное состояние χ (Ν) характеризует эффективность процесса, т. е. в качестве критерия эффективности принимается некоторая функция / —φ(χ(Λ0) (4.18) конечного состояния χ(Ν). Такой случай мы имели в примере 1.1. Возможен также и более общий случай, когда критерий эффективности содержат и сумму (3.5) и выражение типа (4.18), т. е. имеет вид / = Φ (х (Ν)) + Σ П (х (f - 1), и (/)). (4.19) Такой случай мы имели в примере 2.3. Предположим, что для управляемого объекта (3.3), (3.4) критерий эффективности задан в виде (4.18). Тогда, учитывая соотношение x(N) = fN(x(M— 1), и (Ν)) (см. (3.3)) и полагая /?-/5- ... -/^,-Ο, f%(x(N-l),u(N)) = - φ (fN (х (Ν - 1), и (Ν))) = φ(χ (Ν)), получим Ф (χ (Ν)) = ί°Ν (χ (Ν - 1), и (Ν)) = Σ Π (χ (/ - 1), « W).
30 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [4 Таким образом, функционал вида (4.18) легко приводится к виду (3.5). Таким же способом сводится к виду (3.5) и функционал вида (4.19). Полезно также иметь в виду, что в свою очередь функционал вида (3.5) всегда может быть приведен к виду (4.18). В самом деле, пусть задан дискретный управляемый объект (3.3), (3.4) и для него поставлена задача максимизации функционала (3.5). Считая, что х = (х\ ..., хп) и и—{и{у ..., иг) имеют прежний смысл, введем дополнительную фазовую координату хп+\ которую подчиним условиям: **+i(0) = 0; χη+1 (ή = χ«+1 (f _ 1) + /0 (χ (f - 1), U (t))> Тогда ясно, что θ *Λ+4θ)=Σ/?(*(*--1),κ(<)), θ-1, 2, ..., Ν, и, в частности, xn+l(N) =/ (см. (3.5)). Таким образом, функционал (3.5) принимает вид xn+l(N), т.е. приводится к виду (4.18) (причем для этого требуется ввести лишь одну дополнительную фазовую координату). Изопериметрическая задача. Под этим названием (применительно к дискретным объектам) понимают следующую задачу. Имеется дискретный управляемый объект (3.3), (3,4). Для этого объекта рассматривается функционал /, заданный формулой (3.5), и еще k функционалов такого же вида: /|-Ui}(*(*-l),"(0)f ί=»1 /*-Σ#(*(*-ΐ).κ(')). *—1 (4.20) Наконец, заданы k действительных чисел си с2, ..., Ck. Задача заключается в том, чтобы рассматривать только те процессы (3.1), (3.2), для которых функционалы (4.20) принимают заданные значения: и найти среди всех этих процессов такой, который придает функционалу (3.5) наибольшее возможное значение. (Возможно, что при этом наложены концевые условия или ограничения на фазовые координаты.) Эта задача также легко сводится к задачам, рассмотренным в п. 3. Именно, введем дополнительные фазовые координаты
5] I. ПРОБЛЕМА ОПТИМИЗАЦИИ ДИСКРЕТНЫХ ПРОЦЕССОВ 31 χ71+ι ^ xn+h, которые подчиним условиям: **+*(()) = О, i=l, 2, ..., k\ (4.21) χη+ΐ(ί). = χ»+*(ί-1) + 81(χ(ί-1), и (ή), /=1, 2, ..., k, (4.22) где χ=: (χ\ ..., хп) и u = {ul, ..., ur) имеют прежний смысл. Тогда *»+4θ)-Σ £{(*('-!)> и (0); θ=1, 2, ..., iV; *=1, 2, ..., k\ в частности, *»+'(Λ0 = //, /=1, 2, ..., й. . (4.23) Наложенные в постановке задачи условия Ji—cu ..., /а> = Сй можно будет записать в виде x*+*(N) = ci9 /=1, 2, ..., fe, т. е. они превратятся в условия на правом конце. Таким образом, за счет увеличения числа фазовых координат изопериметриче- ская задача сведена к задачам, рассмотренным в п. 3. Мы рассмотрели несколько различных модификаций постановки задачи об управляемых объектах. Разумеется, могут встретиться и их комбинации (например, объект с обратной связью и с запаздыванием). Могут встретиться и другие, более специальные модификации, которые здесь не рассмотрены. Однако сказанное выше убеждает нас в том, что введением дополнительных переменных эти постановки задач сводятся к задачам, рассмотренным в п. 3. 5. Максимизация нескольких функционалов. Инженеры нередко задают математикам вопрос: как надо управлять объектом, чтобы максимальное значение принял не один функционал (3.5), а несколько заданных функционалов такого типа. Нетрудно понять, однако, что такая постановка вопроса неправомочна: нужно правильно соразмерять желаемое и возможное. В самом деле, если для дискретного управляемого объекта (3.3), (3.4) мы поставим задачу о максимуме функционала (3.5), то, как правило, получим один вполне определенный оптимальный процесс, позволяющий достичь этой цели. Если теперь для того же объекта (3.3), (3.4) мы рассмотрим задачу о максимуме другого функционала, то тоже получим, как правило, один вполне определенный оптимальный процесс, решающий эту задачу. При этом два найденных оптимальных процесса вовсе не обязаны совпадать; напротив, как правило, они будут различны, т. е. управление, доставляющее максимум первому функционалу, не будет максимизировать второй (и наоборот). Таким образом, ожидать, что мы сумеем выбрать управление, одновременно максимизирующее оба функционала, не приходится — это может про· изойти лишь в каких-то особых, исключительных случаях. Хорошей иллюстрацией сказанному может служить аналогия с задачей о максимуме функции. Пусть f(x) и g(x) — две функции, заданные на ^котором отрезке. Максимум*) функции f(x), как правило, достигается ) Мы везде говорим лишь об абсолютном максимуме, т. е. о наибольшем значеции функции; относительные (локальные) максимумы в расчет не принимаются.
32 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [5 Рис. 9е в одной точке (рис. 9), так же как и максимум функции g(x). При этом, как правило, эти функции достигают максимума в различных точках, и лишь в исключительных случаях может оказаться, что обе функции достигают максимума в одной и той же точке. Задача «найти точку, в которой обе функции fug достигают максимума», является, таким образом, неправомочной (т. е. она, как правило, неразрешима). И тем не менее жизнь постоянно ставит перед нами задачу (или, лучше сказать, пожелание) одновременно максимизировать несколько функций (или несколько функционалов в случае дискретного управляемого объекта). В примере 2.1 это будут пож£лания о максимуме мясопоставок при одновременном максимуме количества скота на ферме к концу планового периода. Ясно, что эти пожелания противоречат друг другу (чем больше мясопоставки, тем меньше остается на ферме скота), и это еще раз иллюстрирует тот факт, что задача об одновременном достижении максимума двух (или более) функционалов неправомочна. Можно искать разные выходы из этого положения. Один из них (см. стр. 13) заключается в том, чтобы фиксировать количество скота на ферме к концу планового периода (и тем самым отбросить второй функционал) и при этих условиях искать максимум одного остающегося функционала — дохода от мясопоставок. Таким образом, при наличии пожеланий об одновременном достижении по возможности большего значения двух или более функционалов приходится вносить некоторые уточнения в постановку задачи. Например, в той же задаче о животноводческой ферме можно фиксировать ежегодные мясопоставки на некотором допустимом уровне с тем, чтобы достичь максимального количества скота на ферме к концу планового периода. И лишь после того, как то или иное уточнение получено, мы имеем четкую математическую постановку задачи. Математика не всесильна; как минимум, нужно знать, чего мы хотим, что является более важным, а что менее важным. Существуют, однако, математические приемы уточнения положения об одновременной максимизации нескольких функционалов. Некоторые из них мы в этом пункте и опишем. Подчеркнем, что вопрос о том, какой из этих приемов следует избрать ^и в какой форме, не относится к компетенции математики, а должен решаться конструкторами, плановиками, эксплуатационниками и другими работниками инженерного профиля. Итак, предположим, что рассматривается дискретный управляемый объект (3.3), (3.4) и для этого объекта имеется пожелание о достижении по возможности большего значения нескольких функционалов типа (3.5), а именно, функционалов. л - Σ *ί (*<*-ΐ). «с». <=1 (5Л) *=ι (Разумеется, могут еще быть условия на концах или ограничения на фазовые координаты, о чем, однако, мы здесь не говорим, так как это не связано с обсуждаемым сейчас вопросом.)
a 1. ПРОБЛЕМА ОПТИМИЗАЦИИ ДИСКРЕТНЫХ ПРОЦЕССОВ 33 Один из наиболее простых приемов уточнения этого пожелания (и доведения его до математически осмысленной задачи об оптимальном управлении дискретным объектом) заключается в том, что мы фиксируем минимальные приемлемые (с точки зрения постановки задачи) значения всех функционалов (5.1), кроме одного, и при этих условиях ищем максимум остающегося функционала. Проиллюстрируем этот прием на примере пожелания об одновременном достижении максимума двух функций. Так как это пожелание невыполнимо (см. рис. 9), то мы потребуем, чтобы функция g(x) принимала значение, не меньшее заданного числа с, и при этом условии будем искать максимум функции f(x). Условие g(x) ^ с выделяет из отрезка [а, Ь]у на котором рассматриваются функции f(x) и g(x), некоторое подмножество (на рис. 10 —-/— Α—-.τ^λ ffW/. ч.^' b x Ν Ш С Рис. 10. Рис. 11. это подмножество выделено жирно). На этом подмножестве мы и должны искать максимум функции f(x)\ точка Хо на рис. И показывает решение этой задачи. Заметим, что нам пришлось несколько поступиться в отношении значения функции f(x) (т. е. если бы мы отбросили условие g(x) ^ с, то значение функции / можно было бы увеличить; ср. точки Л и С на рис. И), но зато при таком уточнении задачи (т. е. при наложении условия g(x) > с) удается в какой-то степени «помирить» противоречащие друг другу пожелания о максимизации функции f(x) и функции g(x). > Вернемся теперь к функционалам (5.1) и уточним постановку задачи следующим образом. Даны некоторые числа Си ^2, ...» ch-\\ требуется среди всех (допустимых) процессов (3.1), (3.2), удовлетворяющих условиям h > сх /ft_! ^ Ch-u найти такой, который максимизирует функционал /*. Эта задача сводится к задачам, рассмотренным в п. 3, так же, как и изопериметрическая задача (стр. 30). Именно, введем дополнительные фазовые координаты xn+l, , χΛ+*~1, которые подчиним условиям *ft+'(0) —0, ι = 1, 2, ..., jfe—1; xn+i(t)-xn+i(t-i) + git(x(t-i),u(t)), '-ι. 2. ···> *-ι (ср. (4.21), (4.22)). Тогда (ср. (4.23)) 1, 2, ..., Λ-1, и потому наложенные требования /i ^ ci, ..., /α-ι ^ Сц-ι записываются в виде xn+t(N)>ciy / = 1, 2, ..., fc — i,
34 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ (5 т. е. они превращаются в условия на правом конце. Теперь у нас остается только один функционал /*, который нужно максимизировать. Рассмотрим другой прием, также имеющий широкое применение. Предположим, что снова рассматривается дискретный управляемый объект (3.3), (3.4) с пожеланием о достижении по возможности большего значения к функционалов (5.1). Однако функционалы эти неравноправны: одни из них играют, с нашей точки зрения, более важную роль, другие — менее важную. В соответствии с этим мы задаемся некоторыми весами, т. е. положительными числами βι, β2, ..., β&, характеризующими, на наш взгляд, важность функционалов /ι, /г, ..., J κ (т. е. более важному функционалу приписывается больший вес). Теперь вместо k функционалов (5.1) мы рассматриваем только один функционал /, в который функционалы /ι, h h входят с приписанными им весами: /-&/,+ ... +рл=2(м}(*('-о,«(о)+ — ··. +β**ί(*('-0. «('))). (5.2) и приходим к задаче о максимизации одного функционала /, определенного формулой (5.2). Такой прием был применен в примере 2.3 (стр. 15). Там мы имели два функционала, которым желательно было придать по возможности большие значения: функционал Λ = х(0)—x(N)t т. е. количество извлеченного из N раствора вещества, и функционал h s=s — 2 и О» выражающий взятое со знаком минус количество израсходованной воды (максимум этого функционала означает минимум расхода воды). Ясно, что одновременно достичь максимума обоих функционалов невозможно: максимум функционала /г достигается при нулевом расходе воды, что соответствует нулевому количеству извлеченного вещества (т. е. не максимуму, а минимуму функционала /ι). Чтобы помирить эти противоречивые пожелания, мы рассматриваем функционал / = βιΛ + β2^2 (см. (2.8)), где «веса» βι, β2, можно, например, выбрать следующим образом: βι — цена вещества-продукта, β2 — плата за воду. В таком случае / можно интерпретировать как доход предприятия. Отметим, что замена нескольких функционалов (5.1) их линейной комбинацией (5.2) является, конечно, не единственной возможностью. В общем случае можно уточнить задачу, взяв функционал J-FUi.J* ···> /А). (5.3) где F — некоторая функция от k аргументов. Какую именно функцию F выбрать для этой цели (или даже, в более простом случае (5.2), какие выбрать «веса» рь β2, ..., βλ) — не относится к компетенции математики. Но если функция (5.3) (или, в частном случае, (5.2)) выбрана из каких-либо «прикладных» соображений, то мы получаем математическую задачу об оптимальном управлении дискретным объектом — задачу такого типа, который рассмотрен в п. 3. Имеется еще один подход к задаче максимизации нескольких функционалов, имеющий, правда, весьма ограниченную область применения. Мы его рассмотрим сначала на примере функций от двух переменных. Пусть f(x,y) и g(x>y) —две функции переменных х, у, заданные на некотором множестве Μ плоскости переменные х> у. Желательно максимизировать (по возможности) обе эти функции, но в первую очередь для нас является важной функция f(x,y). Тогда мы можем уточнить задачу следующим образом: найти точку (хо,Уо), в которой функция /(*, у) принимает наиболь-
5] § 1. ПРОБЛЕМА ОПТИМИЗАЦИИ ДИСКРЕТНЫХ ПРОЦЕССОВ 35 шее значение, а если это наибольшее значение достигается более чем в одной точке, то среди них выбрать такую, в которой будет больше значение функции g(x,y)- г/ ч Рассмотрим, например, функцию / (*, у) = 2 — (* + у)2 (заданную на всей плоскости переменных х, у). Наибольшее значение, равное 2, эта функция принимает не в одной точке плоскости переменных х> уу а во всех точках прямой х + У = 0. Поэтому среди точек этой прямой имеет смысл искать такую точку, в которой другая заданная функция g(x,y) принимает как можно большее значение. Аналогичным образом ставится задача и для дискретных управляемых объектов. Предположим, что функционалы (5.1) упорядочены по их важности: /ь hy · · ·, h — в том смысле, что важнее всего придать наибольшее значение функционалу /ь а если процессов, максимизирующих функционал /ь имеется много, то среди них важнее всего выбрать процесс, максимизирующий функционал /г', затем, если и таких процессов много, надо максимизировать функционал /з и т. д. Эту задачу можно (во всяком случае, формально) свести к рассмотренной в п. 4 изопериметрической задаче. В самом деле, обозначим через с{ максимальное возможное значение функционала J\ (при выполнении ограничений (3.4) на управления и ограничений на фазовые координаты, если они наложены). Тогда равенство J\ = C\ равносильно максимизации функционала J\. Заметим, что нахождение числа с\ означает решение задачи того типа, который рассмотрен в п. 3: для объекта (3 3), (3.4) найти максимум функционала J\. Далее, обозначим через Сг максимальное возможное значение функционала /г, достигаемое при выполнении условия J\ = C\. Нахождение числа с2 равносильно решению изопериметрической задачи: для объекта (3.3), (3.4) найти максимум функционала /г при условии J\ = С\. Затем мы перейдем к задаче: найти максимум функционала /3 при выполнении условий J\ = си /2 = с2, и т. д. В конце концов мы придем к последней изопериметрической задаче: найти максимум функционала /ft при выполнении условий J\ = Сь ..., Jh-ι = ck-\. В заключение отметим еще одну постановку задачи о достижении по возможности большего значения нескольких функционалов. Пусть снова .рассматривается дискретный управляемый объект (3.3), (3.4) и функционалы (5.1). Для большей наглядности рассмотрим сначала более подробно случай k = 2, т. е. случай, когда имеется только два функционала7 /ι, Λ. Рассмотрим какой-либо допустимый процесс (3.1), (3.2) в заданном дискретном управляемом объекте (т. е. процесс, удовлетворяющий условиям (3.3), (3.4) и ограничениям на фазовые координаты, если они наложены). Для этого процесса функционалы /4, /2 принимают некоторые значения, чем определяется точка в плоскости переменных Λ, /г (рис. 12). Если мы рассмотрим всевозможные допустимые процессы в заданном дискретном управляемом объекте и для каждого такого процесса отметим соответствующую точку (/lf /2), то получим на плоскости переменных /4, /г некоторое множество D (см. Рис 12), которое дает нам полное представление о возможных значениях пары функционалов J и h. Например, по рис. 12 мы можем увидеть, какое максимальное значение может принять каждый из функционалов J и h> и убедиться, что одновременно функционалы Л и /2 достичь максимума не могут. Рис. 12.
36 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [5 Возьмем теперь какую-либо точку Л = (/*,/2) множества D (рис. 13). Так как эта точка принадлежит множеству D, то найдется такой допустимый процесс (3.1), (3.3), который доставляет функционалу J ι значение /ρ а функционалу /2 — значение /2. Проведем "из точки Л лучи, параллельные положительным полуосям /ь /г- Они образуют прямой угол с вершиной в точке Л (заштрихованный на рис. 13). Каждая внутренняя точка Ρ = (/ь /2) этого угла обладает тем свойством, что у нее обе координаты, /ь /2, соответственно больше координат точки Л, т. е. J{>Jlt /2>/2· Если же точка Q=a(jl9 /2) лежит на одной из сторон этого угла, но не совпадает с точкой Л, то одна из ее координат совпадает с соответствующей координатой точки Л, а вторая координата — больше; например, на рис. 13 мы имеем: j\=j\, j'2>r2. Отсюда ясно, что если указанный прямой угол (с вершиной в точке Л) имеет с множеством D общую точку θ, отличную от Л, то процесс, приводящий к точке Л =(^ι» /2), заведомо не является оптимальным — ни в каком смысле (подчеркнем, что мы здесь говорим о максимизации функционалов /ь /2). В самом деле, процесс, приводящий к точке В (таковой существует, поскольку точка В принадлежит множеству D), увеличивает, по сравнению с точкой Л=(/|, /2), значения обоих функционалов /ь /2 (или, по крайней мере, увеличивает значение одного из этих функционалов, не изменяя значения другого). Итак, для того чтобы точка Л= (/ь /2), принадлежащая множеству D, соответствовала оптимальному процессу (хотя бы в каком-то понимании), необходимо, чтобы прямой угол с вершиной в точке Л и сторонами, параллельными положительным полуосям координат, не содержал точек множества D (кроме Л). В частности, ясно, что внутренняя точка множества D (например, точка А' на рис. 13) не удовлетворяет этому необходимому условию и потому не может соответствовать оптимальному процессу — как бы мы ни уточняли смысл оптимальности при двух функционалах Λ, /2. Иначе говоря, точка, соответствующая оптимальному процессу, обязательно должна лежать на границе множества D. Однако не каждая граничная точка множества D удовлетворяет этому необходимому условию (например, точка Л на рис. 13). На рис. 14 показаны точки Сь С2, С3, удовлетворяющие сформулированному необходимому условию. Идея заключается теперь в том, чтобы принять сфорхмулированное выше необходимое условие оптимальности за определение оптимальности (для случая двух функционалов J и /г). Иначе говоря, мы рассмотрим т£лерь следующее уточнение постановки задачи о максимизации двух функционалов )\, /2.
5] § 1. ПРОБЛЕМА ОПТИМИЗАЦИИ ДИСКРЕТНЫХ ПРОЦЕССОВ 37 Пусть (3.1), (3.2) — некоторый допустимый процесс для рассматриваемого дискретного управляемого объекта, доставляющий взятым функционалам значения /р ^2» будем считать этот процесс оптимальным, если не существует допустимого процесса, для которого /j^/p ^^^2» причем хотя бы одно из этих двух неравенств — строгое. Геометрически это означает, чт> прямой угол с вершиной в точке C = (/j, /2) и, сторонами, параллельными положительным полуосям координат, не содержит, кроме С, других точек множества D. Рисунок 14 показывает, что при таком понимании оптимальности (в отличие от предыдущих) мы будем иметь, как правило, бесконечно много оптимальных процессов для данного дискретного управляемого объекта. J, Рис. 15. Аналогичное определение может быть сформулировано и для случая, когда рассматривается к функционалов (5.1). Именно, допустимый процесс (3.1), (3.2), доставляющий функционалам (5.1) значения /р J*2> ..., J*k, считается оптимальным, если не существует допустимого процесса, для которого Λ =^Λ» h^h> ···» Jk^*Jfi> причем хотя бы одно из. этих неравенств — строгое. Иначе говоря, процесс оптимален, если невозможно увеличить значение ни одного из функционалов (5.1), не уменьшая при этом значений остальных функционалов. Это понимание оптимальности допускает такую же геометрическую интерпретацию, как и в случае к = 2, только вместо прямого угла с вершиной в точке (/|, /2) теперь будет рассматриваться телесный угол в ^-мерном пространстве, состоящий из всех точек Ci, /2, ..., /л), удовлетворяющих условиям Λ^/ρ /2^^2' ···» ^k^^k* Рисунок 15 иллюстрирует случай k = 3. Покажем теперь, что и при таком понимании оптимальности задача отыскания оптимальных процессов сводится (в известном смысле) к задачам, рассмотренным в п. 3. Для простоты мы снова ограничимся случаем Ы2 и будем считать множество D выпуклым (рис. 16). Пусть (3.1), (3.2) — некоторый оптимальный процесс, так что ему соответствует точка Д = (/р /g), лежащая на Рис. 16
38 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ 16 границе множества D, причем прямой угол с вершиной Л и сторонами, параллельными положительным полуосям координат, не имеет с множеством D других общих точек, кроме А. Обозначим этот прямой угол через К. Тогда существует прямая Г, проходящая через точку А и отделяющая множество D и угол К. Обозначим через η = (βι, β2) вектор, ортогональный прямой Г и направленный в сторону угла К. Тогда функция F(Ju /2) —ΡιΛ + β2/2. (5.4) рассматриваемая в плоскости переменных /ь /г, принимает на прямой Г постоянное значение, равное этой функции в точке А, а во всех точках множества D эта функция принимает меньшее значение. Таким образом, функция (5.4), рассматриваемая на множестве D, достигает максимума в точке А. Иначе говоря, рассматриваемый допустимый процесс (3.1), (3.2) (которому соответствует точка А) максимизирует функционал (5.4). При этом числа βι и β2 неотрицательны, так как вектор η находится внутри угла К (или идет по одной его стороне). Следовательно, рассматриваемое понимание оптимальности в конечном итоге эквивалентно оптимальности в смысле максимума одного функционала (5.4) при некоторых неотрицательных βι, β2. Аналогичное утверждение справедливо и для большего числа функционалов. Подводя итоги, мы можем сказать, что задачи, рассмотренные в п, 3, являются основными — к ним сводится большое число задач оптимального управления дискретными объектами, рассмотренных в пп. 4, 5. § 2. Связь задач дискретной оптимизации с другими экстремальными задачами 6. Экстремум функции. В этом пункте мы проследим связь между задачей оптимального управления дискретными объектами, поставленной в § 1, и хорошо известной задачей об экстремуме (т. е. максимуме или минимуме) функции. Рассмотрим некоторую функцию f, заданную на множестве Μ (или, как еще говорят, имеющую множество Μ своей областью определения) и принимающую действительные значения. Это означает, что каждой точке а е Μ сопоставлено некоторое число /(а), называемое значением функции / в точке а. Точка х0 е Μ называется тонкой минимума функции /, если для каждой точки χ <= Μ справедливо неравенство }(х) ^ f(Xo). Если Хо — точка минимума функции /, то соответствующее значение /(дг0) называется наименьшим значением (или также минимумом) функции f. Для записи наименьшего значения функции / пользуются обозначением minf(x). (6.1) Х€=М Таким образом, символ (6.1) определяется следующими двумя условиями:
б] § 2. СВЯЗЬ С ДРУГИМИ ЭКСТРЕМАЛЬНЫМИ ЗАДАЧАМИ ЗЙ 1) /Μ^ min/(χ) Для любого хеМ; 2) существует такая точка л;0е М, что /(л;0) = min f (χ). Аналогично определяется максимум функции; заметим, что задача нахождения максимума функции / эквивалентна задаче нахождения минимума функции —f. Задача нахождения экстремумов функций является в такой постановке слишком общей, и потому, как правило, накладывают некоторые ограничения на саму функцию / и ее область определения. Многие разделы и даже целые направления в современной математике полностью посвящены решению задачи об экс* тремумах функций при тех или иных ограничениях. Примерами могут служить многочисленные разделы анализа, посвященные различным экстремальным задачам, а также вариационное исчисление, линейное программирование, теория игр и др. Математическая теория оптимального управления дискрет* ными объектами также всецело связана с рассмотрением спе* циального класса задач на экстремумы функций. Именно, мы покажем здесь, что задача оптимального управления дискретным объектом эквивалентна-задаче об экстремуме функции, определенной на некотором подмножестве евклидова пространства. Иначе говоря, мы покажем, что каждая задача об экстремуме функции может быть переформулирована как задача оптимального управления для некоторого дискретного объекта (причем весьма специального вида) и, обратно, каждая задача оптимального управления дискретным объектом сводится к задаче об экстремуме некоторой функции. Итак, предположим, что поставлена некоторая задача об экстремуме (пусть, для определенности, о максимуме) функ* ции, заданной на подмножестве евклидова пространства, т. е. в я-мерном пространстве Еп переменных г1, ..., гп задано множество Ω, на котором определена функция F(z)=F(z\ ..., zn)y и ставится задача о нахождении точки z0 = (zj, ..., zf) <= Ω, в которой функция F (рассматриваемая на множестве Ω) достигает наибольшего значения. Примем Еп за фазовое пространство дискретного управляе* мого объекта и положим N=1. В этом случае (т. е. при N=1) задача оптимального управления дискретным объектом (с за* крепленным левым концом и свободным правым концом) опи* сывается следующим образом. Задана некоторая начальная точка х(0)=х0 и некоторое множество U = U0(x(0)). Траек* тория состоит, кроме х(0), еще из одной точки, х(1), определяемой соотношением (ср. (3.3), (3.4)) * (1) = /ι (*(<>), и(1)), где u(l)^U. (6.2)
40 ГЛ, I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ (6 Кроме того, задана функция /J (х (0), и(1)). Требуется выбрать управление (т. е. точку m(1)g(/) так, чтобы функционал / = /?(*(<>). «(D) (6.3) (ср. (3.5)) принял наибольшее возможное значение. Положим теперь ί/ = Ω, /,(*, и) = иу /?(*, u) = F(u). Тогда дискретная задача оптимального управления, описываемая соотношениями (6.2), (6.3), примет следующий вид: траектория объекта описывается уравнением х(1)— и(1) и требуется выбрать точку «(1)εΩ так, чтобы функционал J = F(u(l)) принял наибольшее возможное значение. Здесь обозначения х(0), х(1) не играют никакой роли, т. е. перед нами фактически стоит следующая задача: найти точку u(1)gQ так, чтобы / = F(u(l)) было максимальным. Но это, очевидно, и есть исходная задача о максимуме функции F(z) на множестве Ω. Итак, всякая задача об экстремуме функции, заданной на подмножестве евклидова пространства, может быть переформулирована (и притом тривиальным образом) как задача об оптимальном управлении дискретным объектом. Разумеется, существуют и другие способы записать задачу об экстремуме функции как задачу оптимального управления дискретным объектом. Например, в примерах 1.1, 1.2 мы по-иному построили дискретный управляемый· объект, исходя из задачи о максимуме функции F(z\ ζ2, ..., ζη) = ζιζ2 ... ζη, заданной на множестве Ω, описываемом неравенствами ζλ >Ό, ..., ζη >Ό, ζ1 + ... + ζη^α. Действительно, при указанном там способе сведения мы получили дискретный объект с двумерным (в примере 1.1) или одномерным (в примере 1.2) фазовым пространством, для которого г = 1, N = п\ по методу же, описанному только что, мы из той же задачи о максимуме функции получим дискретный объект, для которого г = п^ N = 1. Можно предложить и другие способы сведения той же задачи к аадаче об оптимальном управлении дискретным объектом. То же относится и к любой другой задаче об экстремуме функции. Обратно, пусть задана некоторая задача об оптимальном управлении дискретным объектом. Возьмем наиболее общую из рассмотренных в п. 3 задач: управляемый объект описывается соотношениями (3.3), (3.4) и требуется выбрать начальную точку х(0)еМ0 и управление (3.1) так, чтобы соответствующая траектория (3.2) удовлетворяла условиям x(t)^Mly /=1,2,... ..., Ν, и при этом функционал (3.5) принимал наибольшее возможное значение. Напомним, что Ut(x) есть подмножество r-мерного пространства переменных и\ ..., иг.
б] § 2. СВЯЗЬ С ДРУГИМИ ЭКСТРЕМАЛЬНЫМИ ЗАДАЧАМИ 41 Введем в рассмотрение новые переменные, которые мы будем обозначать через и\ и **, где i = 1, ..., п\ j = 1, .»., г; s = 0, 1, ..., N; t = 1, 2, ..., N. Таким образом, число этих переменных равно k = n(N + 1)+ rN. Пространство, в котором координатами являются все эти переменные, обозначим через Ek. Пусть z=(u\y xls)— некоторая точка этого пространства. Тогда для каждого s = 0, 1, ..., N мы можем рассмотреть точку пространства Епу имеющую числа х\, ..., xj своими координатами; эту точку обозначим через ls(z). Точно так же мы можем рассмотреть (для каждого t = 1, ..., Ν) точку пространства переменных и\ ..., игу имеющую числа и\9 ..., и\ своими координатами; эту точку обозначим через r\t(z). Напишем теперь систему соотношений: M*)eAis> 5 = 0, 1, ..., Ν; (6.4) *(*)€=*/,&-,(*)), t=l, ..., Ν· (6.5) h (ζ) = U &-, (ζ), η, (ζ)), / = 1, ..., Ν. (6.6) Множество всех точек ζ e Ek9 удовлетворяющих соотношениям (6.4) — (6.6), обозначим через Ω; таким образом, Ω a Eh. Далее, определим функцию F(z) (которую будем рассматривать только на множестве Ω), положив F(z)=f«(l0(z), ηι (*)) + /№! (*), η2(ζ))+ ... ... +f°N(tN-Az), %(*)), (6.7) и рассмотрим задачу о нахождении максимума этой функции на множестве Ω. Мы покажем, что эта задача эквивалентна исходной задаче об оптимальном управлении дискретным объектом. В самом деле, пусть χ (0) е М0 — некоторая начальная точка, (3.1)— допустимое (относительно этой начальной точки) управление и (3.2) — соответствующая траектория рассматриваемого дискретного управляемого объекта. Обозначим через xls, ..., х% координаты точки x(s) (5 = 0, 1, ..., Ν), а через и\> ..., urt — координаты точки u(t) (t=l, ..., Ν). Тогда мы получим набор чисел xl$i и\ для всехt индексов /=1, ..., п\ /' = 1, ..., г; 5 = 0, 1, ..., N\ t — \, ..., Ν, т. е. получим некоторую точку z = (u[, χ*) пространства Ек. Ясно, что эта точка ζ удовлетворяет соотношениям 6Л*) =■*(*). 5 = 0, 1, ..., Ν\\ y\t(z) = u(t), t=l,...,N J Ρ*'
42 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [6 (и однозначно определяется этими соотношениями). Из (3.3), (3.4) и соотношений x(t)&Mh t = О, 1, ..., Ν, вытекает, что точка ζ удовлетворяет соотношениям (6.4) — (6.6). Обратно, если ζ— произвольная точка множества Ω, то, построив точки- (3.2), (3.1) по формулам (6.8), мы найдем (в силу соотношений (6.4) — (6.6), что (3.2), (3.1) есть траектория и управление, удовлетворяющие соотношениям (3.3), (3.4) и включениям χ(ί)^ Мь t = О, 1, ..., N. Таким образом, соотношения (6.8) устанавливают взаимно однозначное соответствие между точками множества Ω и допустимыми процессами в рассматриваемом дискретном объекте (т. е. процессами (3.1), (3.2), удовлетворяющими соотношениям (3.3), (3.4) и включениям x(t)^ Mu t = О, 1, ..., Ν). Далее, в силу (6.8) значение функции F в точке 26Ω (см. (6.7)) равно значению функционала / (см. (3.5)) для соответствующего точке ζ процесса. Отсюда вытекает, в частности, что точки максимума функции F, рассматриваемой на множестве Ω, соответствуют в силу (6.8) оптимальным процессам рассматриваемого дискретного объекта. Таким образом, задача отыскания оптимальных процессов в рассматриваемой дискретной системе эквивалентна*) задаче отыскания точек максимума построенной функции F(z). Эквивалентность рассмотренных задач, естественно, ставит вопрос о том, нужно ли отдельно строить теорию оптимальных процессов в дискретных системах. Не целесообразно ли поставить в этом месте точку, сказав, что задача отыскания оптимальных процессов в дискретных системах сведена, таким образом, к задаче об экстремуме функции, заданной на некотором подмножестве евклидова пространства, а эта задача рассматривается, например, в теории математического программирования? Такая точка зрения является вполне обоснованной; во всяком случае, теорию оптимальных процессов в дискретных системах можно рассматривать как главу теории экстремумов функций. Однако дело вовсе не в том, является ли одна теория формально подчиненной другой. Хотя основная задача математической теории оптимальных процессов в дискретных системах сводится к задаче об экстремуме функции, заданной на не- *) Можно было, конечно, и проще свести задачу оптимизации дискретных процессов к задаче о минимуме некоторой функции. Достаточно было бы обозначить через Ω* множество всех допустимых процессов (3.1), (3.2) (т. е. удовлетворяющих соотношениям (3.3), (3.4)) и на множестве Ω* рассмотреть функцию /, определяемую равенством (3.5); тогда отыскание точек максимума функции /, заданной на множестве Ω*, и означало бы, по определению, отыскание оптимальных процессов в рассматриваемом дискретном объекте. Однако проведенная выше редукция ценна тем, что она сводит задачу оптимизации дискретных процессов не к максимуму функции, заданной на к а к о м - то абстрактно определяемом множестве," а к максимуму функции, заданной на некотором подмножестве евклидова пространства.
η $ 2. СВЯЗЬ С ДРУГИМИ ЭКСТРЕМАЛ6НЫМИ ЗАДАЧАМИ 43 котором подмножестве евклидова пространства, тем не менее задача оптимизации дискретных процессов имеет свои особенности. Ведь система соотношений (6.4) — (6.7), задающая множество Ω с Ek и функцию F(z) на нем, является очень специфической (например, каждая из переменных и[ входит не более чем в два*) из 3Λ/ -f- 1 соотношений (6.4) —(6.6), определяющих множество Ω, на котором задается функция F, хотя число N может быть и очень большим, а каждая из переменных χ входит не более чем в четыре из них). Естественно ожидать, что благодаря этому необходимые или достаточные условия оптимальности также будут формулироваться более специфическим образом, чем общие теоремы, выражающие критерии экстремумов функций. Эти соображения оправдывают наличие собственного предмета исследования в математической теории оптимального управления дискретными системами. Разумеется, в силу редукции, проведенной в этом пункте, можно было бы все получаемые таким образом специфические результаты формулировать в терминах экстремумов функций (т. е. если область определения и сама функция имеют такой-то вид, то справедливы такие-то уточненные условия экстремума). Однако и это нецелесообразно, так как многие практические приложения (ср. п. 2) требуют записи постановки задачи именно в форме управляемого объекта, последовательно переходящего из одного состояния в другое. К тому же дискретные управляемые процессы возникают и в математических задачах, — например, как средство получить дискретный, упрощенный вариант задачи об оптимальном управлении непрерывными процессами (о чем.мы еще будем говорить ниже). Все это показывает, что задача дискретного оптимального управления не только по форме записи отличается от задачи об экстремуме функции, но и имеет свою специфику, порождает самостоятельное направление в математике. 7. Задача математического программирования. Как мы видели в п. 6, задача оптимального управления дискретными объектами сводится к задаче об экстремуме функции, заданной на некотором подмножестве Ω евклидова пространства. Это значительно сужает класс подлежащих рассмотрению экстремальных задач. Однако даже в таком виде задача является чрезмерно общей, и для того, чтобы получить содержательные результаты, *) Если соотношения (6.4) — (б.б) расписать в координатной форме, то получится, что каждая переменная и\у x*s входит в большее число соотношений, но и в этом случае отношение числа соотношений, содержащих данную переменную, к общему числу соотношений будет примерно таким же. Например, если расписать (6.6) в координатной форме, то мы получим nN соотношений, из которых не более чем η + 1 содержат данную переменную л;^.
44 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [7 приходится накладывать некоторые ограничения на множество Ω и рассматриваемую на нем функцию. Наиболее часто встречается случай, когда множество Ω задается в евклидовом пространстве некоторой системой равенств и неравенств, а рассматриваемая на нем функция (экстремум которой ищется) является гладкой. Более подробно это означает следующее. В евклидовом пространстве Еп переменных ζ\ ..., ζη заданы функции F0(z) = F*{z\ ..., z% Я(г) = Я(^, ..., ζ\ ...; Fk(z) = Fk(z\ ..., ζ% gl{z) = g'(z\ ..., ζ\ ..., gs(z) = gs(z\ ..., ζ\ которые предполагаются гладкими, т. е. имеющими непрерывные производные по всем своим аргументам. Далее, Ω определяется как множество всех точек ζ е Еп, удовлетворяющих системе соотношений Я(г) = 0, ..., Fk(z) = 0, (7.1) *'(*)<0, ..., gs(z)<0. (7.2) На этом множестве Ω рассматривается функция F°(z) и ставится задача об отыскании максимума (или минимума) этой функции на множестве Ω. Сформулированная задача носит название задачи математического программирования. Для задачи в такой постановке разработано большое число условий экстремума — как необходимых, так и достаточных. Это позволяег(в соответствии со сказанным в п. 6) получить ряд критериев оптимальности для дискретных процессов. Скажем теперь несколько слов о смысле соотношений (7.1). Уравнение F1 (ζ) = 0 определяет (п — 1) -мерную поверхность (или, иначе, гиперповерхность) в и-мерном пространстве Еп. Так, при п = 2 уравнение Fl(zl9z2)=0 определяет линию на плоскости Е2 переменных ζ\ ζ2. При η = 3 уравнение Fl(z\ ζ2, ζ3) = 0 определяет поверхность (двумерную) в трехмерном пространстве Е3. То же относится к каждому из уравнений (7.1). Множество, определяемое системой уравнений (7.1), состоит поэтому из точек, принадлежащих каждой из гиперповерхностей Fl(z)=0, ..., Fh(z)=0, τ. е. это множество представляет собой пересечение всех указанных гиперповерхностей. Например, при п = 3 два уравнения /71(г)=0» /г2(г)=0 определяют пересечение двух поверхностей, т. е. ли- нию в трехмерном пространстве Ег (рис. 17). В общем случае следует представить себе, что уравнения (7.1) определяют в /г-мерном пространстве Еп пересечение k гиперповерхностей, т. е. определяют (n — k) -мерную поверхность в Еп,
7] § 2. СВЯЗЬ С ДРУГИМИ ЭКСТРЕМАЛЬНЫМИ ЗАДАЧАМИ 45 Рис. 17. Коснемся, далее, смысла неравенств (7.2). Уравнение g\(z)=~ О определяет, как мы говорили, некоторую гиперповерхность в Еп. Эта гиперповерхность разбивает пространство Еп на две области: в одной из них выполняется неравенство g](z)> О, а в другой —неравенство gl(z)<Q. Таким образом, неравенство gl (-г) < 0 определяет замкнутую область в Епу к которой причисляются точки области gl (ζ) < 0 и точки ограничивающей ее~ гиперповерхности gl (z) — 0. Рассмотрим для примера замкнутую область, определяемую на плоскости Е2 переменных ζ1, ζ2 неравенством g (ζ) < 0, где g (z) — — (ζχ)2 + (г2)2 — 1 · Это неравенство определяет замкнутый единичный круг (рис. 18); для точек внутри этого круга выполнено неравенство g{z)<.0, на граничной окружности выполняется равенство g(z)=0, а для внешних точек £(г)^>0. Итак, каждое из неравенств (7.2) определяет замкнутую область в Еп. Множество же, определяемое всеми неравенствами (7.2), состоит из точек, принадлежащих каждой из замкнутых областей gl{z) <: 0, ..., gs(z)^ 0, т. е. это множество представляет собой пересечение всех указанных замкнутых областей. Наконец, множество, определяемое системой всех соотношений (7.1), (7.2), представляет собой пересечение поверхности (7.1) и множества, определяемого неравенствами (7.2). Это множество (определяемое системой соотношений (7.1), (7.2)) можно представлять себе как (n — k) -мерный «криволинейный многогранник». Пусть, например, п = 3 и &= 1. Тогда мы имеем только одно уравнение Я (г1, г2, г3) = 0 (7.3) Рис. 18. (ср. (7.1)), которое определяет поверхность в £3 (рис. 19). Добавив к (7,3) одно неравенство g]{z\ z2, ζ3)^0, мы получим замкнутую область на этой поверхности (рис. 20), от которой второе неравенство g2(z\ ζ2, ζ3)4^0 отрежет еще «кусок» (рис. 21), и т. д. Наконец, вся система неравенств gl(z\ z2, z3)<0 gs(z\ z2t z3)<0 определит на поверхности (7,3) некоторый «криволинейный мно-
46 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ F гоугольник» (т. е. «криволинейный многогранник» размерности два; рис. 22). Нахождение точки минимума (или максимума) функции F°(z), заданной на «криволинейном многограннике» (7.1), (7.2), может быть проведено классическими методами. Рассмотрим простой пример. Рис. 21. Рис. 22. Пример 7.1. Найти минимум функции F = χψ - 4xtf - 2х2у + 8ху + у хг + х2 - 4х + 3, (7.4) рассматриваемой на прямоугольнике —1^C#<3, 0 ^.у *С2 (рис. 23). Решение. Здесь множество Ω, на котором определена функция F, определяется на плоскости Е2 переменных ζ1 = χ, ζ2 = у неравенствами •22<0, ζ2-2<0, (7.5) у2 = у неравенствами т. е. уравнений (7.1) нет совсем, а неравенства (7.2) имеют вид (7.5),
7] § 2. СВЯЗЬ С ДРУГИМИ ЭКСТРЕМАЛЬНЫМИ ЗАДАЧАМИ 47 Допустим сначала, что искомая точка минимума лежит внутри рассматриваемого прямоугольника. В таком случае должно выполняться известное из анализа необходимое условие экстремума: частные производные функции F по χ и по у должны в этой точке обращаться в нуль. Находя частные производные и приравнивая их нулю, палучаем систему: Fx = 2ху2 — 4ху — 4ί/2 + 8у + 2л:2 + 2х — 4 = 0, 1 Fy = 2x2y-2x2-8xy + 8x = 2x(x-4)(y-l)=:0. J (7,6) Второе из соотношений (7.6) может внутри рассматриваемого прямоугольника выполняться при у = 1 или при χ = 0. В первом случае (у = 1) из первого уравнения (7.6) находим χ = 0. Во втором случае (х = 0) из первого уравнения (7.6) получаем ί/= 1. Итак, внутри прямоугольника имеется лишь одна точка, в которой обе производные FXi Fy одновременно обращаются в нуль, а именно — точка (0, 1). Иначе говоря, из всех внутренних точек прямоугольника только точка (0,1) может оказаться точкой минимума. Но, возможно, функция F достигает минимума на границе прямоугольника. Рассмотрим сначала сторону прямоугольника, определяемую соотношениями х = — 1, 0<#^2. Подставляя в (7.4) значение χ = — 1, находим, что на этой стороне функция F имеет следующий вид: Рис. 23. Л*—!)' 22 "б0*-1Оу + -==·. (7.7) Допустим, что функция F достигает минимума в некоторой точке М0 рассматриваемой стороны. В таком случае для любой точки Μ прямоугольника должно быть выполнено неравенство F(M) ^ F(M0). В частности, это неравенство должно быть выполнено для любой точки М, лежащей на рассматриваемой стороне; иначе говоря, функция F, рассматриваемая только на отрезке χ = —1, 0 ^ у ^ 2 (т. е. функция (7.7)), должна достигать минимума в точке М0. Если минимум достигается в некоторой внутренней точке этого отрезка, то в этой точке должна обращаться в нуль производная функции (7.7), т. е. выполняться соотношение 10у— 10 = 0, или у — 1. Итак, (—1, 1)— единственная внутренняя точка стороны χ = —1, 0 ^ у <: 2, в которой, возможно, функция F достигает минимума.
48 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [7 Аналогичное рассуждение, примененное к остальным сторонам прямоугольника, даст нам еще три точки возможного минимума: (3, 1), (1,0), (1,2). Наконец, возможно, что функция F достигает минимума в одной из вершин рассматриваемого прямоугольника, т. е. в одной из точек (—1, 0), (3, 0), (—1, 2), (3, 2). Таким образом, мы имеем лишь девять точек (рис. 23), в которых функция F может достигать минимума. Чтобы найти действительную точку минимума, теперь остается найти значения функции F в этих девяти точках и из них зыбрать наименьшее. Непосредственный подсчет показывает, что наименьшими из значений функции в этих точках являются F(l,0)=2/3 и F(1,2)= 2/3. Итак, функция F достигает минимума в двух точках (1, 0), (1, 2) и этот минимум равен 2/3. Метод, примененный при решении примера 7.1, допускает обобщение и на общий случай. Пусть требуется найти минимум функции F°(z), заданной на множестве Ω, которое описывается соотношениями (7.1), (7.2). Возьмем какую-либо внутреннюю точку zQ=(zl0i го> · · ·»zo) «многогранника» Ω, т. е. точку, удовлетворяющую всем соотношениям (7.1), (7.2), причем в соотношениях (7.2) имеют место строгие неравенства (рис. 24). Для того чтобы функция F0 достигала минимума в точке z0i необходимо, чтобы обращались в нуль частные производные функции F0 по всем направле- Рис 24. ниям, касательным к «многограннику» Ω (см. рис. 24). Это дает η — k равенств (так как «многогранник» Ω имеет размерность η — k). Кроме того, мы имеем еще k равенств (7.1) (выполняющихся в точке Zo, так как 20ей). Мы получаем, таким образом, η равенств, составляющих необходимое условие для того, чтобы функция F°(z) достигала минимума во внутренней точке «многогранника» Ω. Это необходимое условие представляет собой систему η уравнений с η неизвестными zlQf z\, ..., z%, так что (как правило) внутри Ω найдется лишь конечное число точек, в которых может достигаться минимум функции F°(z). Допустим теперь, что в точке г0£Й одно из соотнршений (7.2) обращается в равенство, а остальные неравенства остаются строгими. Например, g1(z0) = 0, g2(z0)< 0, ..., gs(z0)<0. Тогда точка z0 удовлетворяет соотношениям Я (г) = 0,; ..., Fk (ζ) = 0, gl (z) = 0; (7.8) £2(ζ)<0, ..., «*(*)«).
8} § 2. СВЯЗЬ С ДРУГИМИ ЭКСТРЕМАЛЬНЫМИ ЗАДАЧАМИ 49 Эти соотношения определяют «криволинейный многогранник» Ω' размерности n — (k+l) = (n — k)—l (т. е. на единицу меньшей размерности, чем Ω), который является гранью «криволинейного многогранника» Ω (рис. 25). Ясно, что ζ0 является внутренней точкой многогранника Ω' (ибо соотношения (7.8) являются в точке ζ0 с τ ρ or им и. неравенствами). Поэтому мы можем аналогичным образом выписать необходимое условие достижения минимума в точке zo, содержащее η уравнений относительно координат zj, гЬ · · · > ζο точки 2о· Отсюда вытекает, что и в грани Ω' найдется лишь конечное число точек, в которых может достигаться Рис. 25. минимум. Аналогичное положение вещей имеет место и на гранях меньшего числа измерений. Всего мы получаем (внутри «многогранника» и на всех его гранях) конечное число точек, в которых может достигаться минимум. Остается сравнить значения функции F в этих точках и выбрать из них наименьшее *). Вообще говоря, описанный метод становится весьма канительным, если рассматриваемый «многогранник» имеет большое число граней. Так как при увеличении η (т. е. числа переменных г\ г2, ..., ζη) число граней многогранника неизбежно возрастает, то метод становится все более громоздким. Например, нетрудно подсчитать, что n-мерный параллелепипед, т. е. многогранник, определяемый в пространстве Еп неравенствами ах<,гх^Ь\ а2<г202, ..., an^zn^bn, имеет Зп—1 граней (всех размерностей 0,1, ··., η—1). Уже при η = 4 мы имеем 80 граней, и каждая из них требует отдельного вычисления для нахождения точек, в которых может достигаться минимум. Поэтому описанный выше метод (требующий перебора всех граней «криволинейного многогранника» и являющийся в значительной степени кустарным) применяется редко, а вместо него в математическом программировании используются другие методы (см. § 3). 8. Управляемые процессы с непрерывным временем. Математическое программирование является одним из источников, *) Строго говоря, описанный метод гарантирует нахождение минимума лишь в том случае, если заранее есть уверенность в существовании минимума, однако если, как это неявно предполагалось выше, функция F дифференцируема (и, следовательно, непрерывна) и если, как это также неявно предполагалось, рассматриваемый «многогранник» является ограниченным замкнутым множеством, то функция F заведомо достигает минимума на этом «многограннике», и потому описанный метод применим.
50 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ 18 позволяющих получить критерии оптимальности для дискретных управляемых объектов. Здесь мы рассмотрим еще один источник получения теорем о дискретных управляемых объектах, а именно, рассмотрим постановку задачи оптимального управления для недискретных процессов, т. е. процессов с непрерывным временем. Это интересно по двум причинам. Во-первых, результаты теории оптимального управления непрерывными объектами позволяют по аналогии сформулировать «похожие теоремы», относящиеся к дискретным объектам (см. ниже, п. 10). Таким образом, теория оптимального управления непрерывными объектами является для теории дискретных управляемых объектов важным эвристическим средством, указывающим некоторые направления исследования и подсказывающим характер результатов. Во-вторых, связь между дискретными и непрерывными управляемыми объектами, позволяющая рассматривать непрерывные объекты как «предельный случай» дискретных, важна сама по себе — например, как средство приближенного описания непрерывных управляемых процессов (как правило, более сложных) дискретными процессами (или как средство приближенного описания дискретных процессов непрерывными). Пример 8.1. Рассмотрим дискретный управляемый объект примера 1.2 и осуществим в нем предельный переход к непрерывному управляемому объекту. Итак, мы рассмотрим дискретный объект, описываемый соотношениями xiy) = xi(t-l) + u{t)9 (8.1) и (0 е= f/, (8.2) *ΐ(0) = 0, xl(N)&Mu (8.3) где t/ = (0, оо), Λίι = [0, α], и для этого объекта поставим задачу о нахождении процесса, придающего наибольшее значение функционалу ν /—Σ In!*(/). (8.4) Предположим, что N является «большим» (скажем N = 50 или более), и нам пришла в голову мысль графически представить себе поведение управления α(1), α (2), .... и (Ν) (8.5) и соответствующей траектории *'(0), *'(!)> .... х1№ (8.6) Поскольку N велико, графическое изображение в обычном масштабе времени неудобно. Естественно поэтому выбрать некото*
8j § 2. СВЯЗЬ С ДРУГИМИ ЭКСТРЕМАЛЬНЫМИ ЗАДАЧАМИ 51 рый «шаг» h и вместо t ввести новый аргумент τ по формуле т = й, *«=0, 1, ..., N. (8.7) Таким образом, τ будет принимать значения О, К 2Λ, ..., Nh. Выбор «шага» h мы детализируем следующим образом: А = £ (8.8) (так что при большом N «шаг» h будет малым). Введем новые переменные yl9 vt зависящие от аргумента т, по формулам: у1 (*) = *'(χ)-*'('), ο(τ)=4Μ(^)=4«(0· (8.9) В новых переменных соотношение (8.1) примет следующий вид (учитывая, что г/1 (τ- Λ) = *' (JLT^) = *1(t ~ 1) = χ1 (/_ 1)): ί/1(τ) = ί/1(τ-Λ) + Λο(τ), или у«(т)-.у.(Т-Л)„р(т)> (810) Здесь в левой части стоит выражение, имеющее своим пределом при Л-*0 производную dyx\dx (именно с этой целью был введен в правой части второй формулы (8.9) множитель 1//*). Далее, соотношения (8.2), (8.3) при переходе к новым переменным примут вид ο(τ)εί/, (8.11) #ΐ(0) = 0, у1(а)е=М{ (8.12) (так как в силу (8.8) и (8.9) мы имеем у1 (а) = xl(a/h) = = хх (Ν)), где по-прежнему U = (0, оо), М\ = [0, а]. Наконец, функционал (8.4) перепишется в виде = N\nh + 2 In υ (τ) = ΛΠη h + | J] Λ In υ (τ), причем суммирование в правой части производится по τ = Α, 2Λ, ..., А7г. Заметим, что слагаемое N\nh и положительный множитель 1/А в правой части являются константами, и потому задача о' максимуме функционала / равносильна задаче о максимуме функционала / = 2Λ1ηϋ(τ)., (8.13)
52 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ J8 Все, что пока было сделано, представляет собой простую замену переменных. Задача о максимуме функционала (8.13) для управляемого объекта (8.10)— (8.12) с дискретным временем τ = 0, ft, 2ft, ..., Nh лишь обозначениями отличается от задачи о максимуме функционала (8.4) для управляемого объекта (8.1) —(8.3) с дискретным временем t = 0, 1, ..., N. Однако формулы (8.10) — (8.13) мы можем осмыслить по- новому. Соотношение (8.10) является приближенным выражением равенства ^ψ~=ν(τ), (8.14) а выражение в правой части (8.13) (где, напомним, суммирование ведется по τ = ft, 2ft, ..., Nh, причем Nh = а) является интегральной суммой для определенного интеграла а Г = Jin о (τ) dr. (8.15) о Поэтому можно считать, что исходная дискретная задача оптимального управления (см. (8.1) — (8.4)) приближенно соответствует следующей задаче для недискретной («непрерывной») переменной τ, меняющейся на отрезке О^Ст^Са. Найти такое управление ν (τ), т. е. функцию, заданную на отрезке Ο^τ^α и принимающую значения в множестве U (см. (8.11)), что решение у1 (τ) дифференциального уравнения (8.14) с начальным условием у!(0)=0 удовлетворяет конечному условию у{(а) ^ Μχ (см. (8.12)) и при этом интеграл /* принимает наибольшее возможное значение. Это и есть «непрерывная» задача оптимального управления; вместо «дискретного времени» t здесь рассматривается «непрерывная» переменная τ (время). В каком же смысле эти две задачи оптимального управления (дискретная и непрерывная) приближенно «соответствуют» друг другу? По-видимому, можно ожидать, что для каждого допустимого процесса u(t)9 xl(t) в дискретном объекте (8.1) —(8.3) найдется близкий к нему (в смысле преобразования (8.9)) допустимый процесс непрерывного управляемого объекта (8.14), (8.11), (8.12) и обратно. Следовательно, если непрерывная задача окажется более простой, то, решив ее, т. е. найдя оптимальный процесс ν (τ), у1 (τ), мы получим по формулам (8.9) приближенное решение задачи дискретного оптимального управления (8.1) — (8.4). (Разумеется, для того чтобы это было не просто добрым пожеланием, а обоснованным методом упрощения задачи, было бы необходимо знать, какую ошибку мы совершаем, заменяя одну задачу другой; однако мы оставим это в стороне.)
8] § 2. СВЯЗЬ С ДРУГИМИ ЭКСТРЕМАЛЬНЫМИ ЗАДАЧАМИ 53 «Непрерывная» задача (8.14), (8.11), (8.12), (8.15), к которой мы пришли, решается просто. Прежде всего заметим, что в силу (8.14) и первого соотношения (8.12) мы имеем: а а Ух (а) = */' (0) + J* ^-άτ = J" υ(τ) dx, О О и потому, согласно второму соотношению (8.12), а |ϋ(τ)ώτ<α. (8.16) о Воспользуемся теперь тем, что 1η ν <ζ ν— 1 на луче (0, оо), причем равенство достигается только в точке v=l*). Следовательно, 1η ν (τ) < υ (τ) — 1 (напомним, что ό(χ) > 0 в силу (8.11)), и потому а а а j In υ (τ) dx < J (ν (τ) - 1) dx = j ν (τ) dx - α < 0 0 0 0 (см. (8.16)), причем равенство достигается лишь при ν(τ)=1. Это и дает решение сформулированной выше задачи для непрерывного управляемого объекта: искомое оптимальное управление имеет вид ν(χ) ξξξ 1 и оно придает функционалу (8.15) значение /* = 0; при любом другом допустимом управлении функционал /* принимает меньшее (т. е. отрицательное) значение. Имея точное решение v(x) ss 1 для задачи оптимального управления рассматриваемым непрерывны^ объектом, мы теперь можем по формулам (8.9) получить приближенное решение для исходной задачи оптимального управления дискретным объектом: ιι(0 = Αϋ(τ)-Α—^ (*=1, 2, ..., АО. Итак (не касаясь вопроса о том, насколько точным является найденное приближение), мы можем сказать, что для дискретной задачи (8.1)— (8.3) (в смысле максимума функционала (8.4)), т, е. для дискретного объекта, рассмотренного в примере 1.2, оптимальным является управление и(1)-и(2)- ... -и(Л0 = -£. *) Действительно, функция 1η ν — ν + 1 обращается в нуль при ν = 1, Убывает при у>1 и возрастает при 0 < ν < 1.
54 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [8 причем это оптимальное управление единственно. Возвращаясь к задаче о максимуме произведения (пример 1.1), мы находим отсюда, что произведение N неотрицательных чисел, сумма которых не превосходит а, достигает максимума, если каждое из чисел равно α/Ν; в любом другом случае произведение будет меньшим. Мы получили этот результат как приближенный, исходя из соображений, связанных с непрерывными управляемыми процессами. В действительности, как мы увидим в § 3, полученный результат является точным. Осуществленное в примере 8.1 сведение к непрерывной задаче оптимального управления может быть^ аналогичным образом проведено для многих дискретных задач. Однако чаще применяется обратный переход: от непрерывной задачи к дискретной. Как правило, точное решение непрерывной задачи оптимального управления получить не удается, и приходится искать приближенное решение. Замена непрерывной задачи более простой ди· скретной является одним из возможных способов приближенного решения. Проследим, в общих чертах, редукцию непрерывной задачи к дискретной. С этой целью возьмем следующую «непрерывную» задачу оптимального управления. Рассматривается дифференциальное уравнение !?- = £(</. ν) (8.17) (ср. (8.14)), в котором у = (у1, у2, ..., уп) — вектор фазового состояния, α ν = {ν1, ..., vr)—управляющий вектор. Далее, фиксировано (в пространстве переменных ν1, ..., vr) некоторое множество V, называемое областью управления, и некоторое по- ложительное число Т. Допустимым управлением называется всякая (кусочно-непрерывная) функция ν (τ),, заданная .на отрезке О ^τ ^Τ и принимающая значения в множестве V: о(т)е7 (8.18) (ср. (8.11)). Кроме того, в пространстве переменных у\ ..., уп задана точка yQ и множество Мх. Наконец, указана функция g°{y,v), позволяющая, если известны некоторые функции у (τ), ν (τ), рассматривать определенный интеграл т r=jg°(yW> ν(τ))άτ (8.19) о (ср. (8.15)). Требуется найти такое допустимое управление ν (τ), что соответствующее решение у (τ) дифференциального уравне-
8] § 2. СВЯЗЬ С ДРУГИМИ ЭКСТРЕМАЛЬНЫМИ ЗАДАЧАМИ 65 ния (8.17) с начальным условием У(0) = у0 (8-20) удовлетворяет также конечному условию У{Т)<=МХ (8.21) (ср. (8Л2)) и при этом функционал (8.19) принимает наибольшее возможное значение. Для того чтобы осуществить редукцию этой «непрерывной» задачи оптимального управления к дискретной, фиксируем некоторое натуральное число N и положим А=^ (8.22) (ср. (8.8)). Мы условимся теперь придавать аргументу τ лишь значения 0, /г, 2/г, ..., Nh= T и введем новый (дискретный) аргумент / по формуле '< = Т (8.23) (ср. (8.7)), так что t будет принимать лишь значения 0, 1, ..., N. Далее, вместо переменных у, υ введем новые переменные х, и по формулам: х (ή = у (th) = у (τ), и (0 = υ (th) = υ (τ) (8.24) (эта замена несколько отличается от замены (8.9); в связи с этим см. ниже замечание 8.3). Пусть теперь υ (τ)—допустимое управление (в смысле рассматриваемой «непрерывной» задачи), а у (τ) —соответствующая траектория, т.е. решение дифференциального уравнения (8.17) при υ = ν(χ) с начальным условием (8.20). Таким образом, ■^-*(У(Т), ν(τ)). Это соотношение можно заменить приближенным равенством y{r)-y^-h) ^giy{x)> V(x))~g(y{r-h), υ (χ)), которое мы будем рассматривать лишь для значений τ = А, 2/ι, ..., Nh. Отсюда получаем y(x)~y(x-h) + hg(y(x — h), о (τ)), или, в силу (8.24), x(t)*x(t-i) + hg(x{t-l), и (ή), /-1, 2, ..., N. (8.25)
56 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [8 Далее, "интеграл (8.19) можно приближенно заменить интегральной суммой: Г ~ Σ hg° (у (th), v (th)) « Σ hg° (у (th - Λ), υ (th)) = f=l *=i = /*Sg°(*(i-l), u(t)). (8.26) t=\ Наконец, соотношения (8.18), (8.20), (8.21) в силу замены (8.24) примут вид и(0еК, (8.27) *(0) = Уо, x(N)*=M{ (8.28) Обозначим теперь функцию в правой части соотношения (8.25) через /: f(xt u) = x + hg(x, и) и заменим (совершая некоторую погрешность) приближенное равенство (8.25) точным: x(t) = f(x(t-\\ u(t)). (8.29) Далее, заменим (также совершая некоторую погрешность) инте- /* выражением, стоящим в правой части соотношения (8.26), т. е. заменим задачу о максимуме функционала /* за- зачей о максимуме функционала N / = Λ Σ g0 (* (' - 1), и(0). (8.30) В результате мы и получаем дискретную задачу оптимального управления (8.29), (8.27), (8.30) с закрепленным левым и подвижным правым концом (см. (8.28)). При переходе к этой задаче от исходной непрерывной задачи мы допустили погрешности: во-первых, из всего отрезка 0 ^ τ ^ Τ оставили лишь конечное число значений τ = 0, Λ, 2Λ, ..., Nh и, во-вторых, заменили приближенные равенства (8.25), (8.26) соотношениями (8.29), (8.30). Однако, при определенных условиях укажем, если функция g(y,v) «достаточно гладкая», а число h является «достаточно малым», т. е. производная dg(y(x)> v(j))/dy мало изменяется на отрезке длины h) можно ожидать, что для каждого допустимого процесса u(t), x(t) в дискретном объекте (8.27) — (8.30) найдется «близкий» к нему допустимый
81 § 2. СВЯЗЬ С ДРУГИМИ ЭКСТРЕМАЛЬНЫМИ ЗАДАЧАМИ 57 процесс в непрерывном управляемом объекте (8,17) — (8.21) и обратно (рис. 26). Таким образом, если поставлена непрерывна^ задача оптимального управления /* = max при условиях (8.17) — (8.21) и решение этой задачи наталкивается на серьезные трудности, то, взяв некоторое достаточно большое N и перейдя по формулам (8.22) — (8.24) к дискретной задаче (8.27) — (8.30), мы можем затем попытаться решить эту дискретную, задачу и, если это удастся, ее решение, преобразованное по формулам (8.24), считать приближенным решением исходной непрерывной задачи. Разумеется, строго говоря, для применения этого метода необходимо иметь некоторые оценки, показывающие, какую ошибку мы совершаем, заменяя непрерывную задачу дискретной. Замечание 8.2. Выше речь шла об оптимальности в смысле достижения максимума интегрального функционала /* (см. (8.19)). В соответствии с этим, переходя к дискретному случаю, мы также получили задачу о максимуме функционала / (см. (8.30)). Разумеется, в обоих случаях можно было бы рассматривать задачу не о максимуме, а о минимуме соответствующего функционала (этот случай в теории непрерывных управляемых процессов встречается наиболее часто — минимум расхода горючего, минимум затраты электроэнергии, промывочной воды, и т. д.). Замечание 8.3. Примененный выше способ замены непрерывной задачи дискретной (см. (8.24)) является простейшим, но не единственно возможным. НереЦко вид уравнения (8.17) может подсказать иной способ редукции, являющийся в рассматриваемом конкретном случае более удобным. Так, в примере 8.1 переход от дискретной задачи (8.1) —(8.4) к непрерывной (который, разумеется, можно было бы провести и в обратном направлении — от непрерывной задачи к дискретной) осуществлялся несколько иначе: во второй формуле (8.9) оказалось удобным ввести множитель 1//г. В качестве еще одного примера рассмотрим случай, когда уравнение (8.17) имеет вид *-»■+· (у, t> — скаляры). В этом случае вместо замены (8.24) удобнее применить замену х (t) = hy (th) = hy (τ), и (t)-* h2v (th) = h2v (τ). (8.31) Действительно, при этой замене (таким же путем, как было выведено соотношение (8.25)) мы получим дискретный процесс *(0-*('-1) + (*(*-1))2 + а(0, не содержащий параметра h в правой части. При этом, однако, соотношение (8.18) заменится (в силу второй формулы'(8.31)) включением u(t) <= U, где U — множество всех точек вида hzv (ие|/), Замечание 8.4. В теории оптимального управления непрерывными процессами*) основной является задача с незакрепленным временем, т. е. задача, в которой время Τ (ср. (8.19)) заранее не задано. Случай же, когда заранее задан отрезок 0 < τ ^ Г, на котором рассматривается искомое *) См., например, Л. С. Π о н т ρ я г и н, В. Г. Болтянский, Р. В. Г а м- крелидзе, Ε. Φ. Мишенко, Математическая теория оптимальных процессов, «Наука», М., 1969; В. Г. Болтянский, Математические методы оптимального управления, «Наука», М., 1969.
5δ ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЁЗУЛ^АТОб [9 управление, носит (в теории оптимальных процессов с непрерывным временем) название задачи с закрепленным временем. Так как в рассматриваемых дискретных задачах множество значений, которые может принимать t, заранее задано (и одинаково для всех рассматриваемых допустимых управлений), то аналогом этих задач в случае непрерывного времени t следует считать именно задачу с закрепленным временем. Рассмотренный в этом пункте переход как раз имел указанный характер: от непрерывной задачи с закрепленным временем к дискретной задаче оптимального управления. § 3. Методы решения задач дискретной оптимизации 9. Динамическое программирование. В этом и следующих пунктах мы опишем основные методы нахождения оптимальных режимов в дискретных управляемых объектах. Одним из ним является метод динамического программирования, созданный американским математиком Р. Беллманом. Сущность метода динамического программирования состоит в том, что для оптимальности всего процесса в целом нужно, чтобы на каждой промежуточной стадии последующая часть процесса также обладала свойством оптимальности. Более подробно, предположим, что, осуществляя управление дискретным объектом (3.3) — (3.5), мы уже как-то выбрали управление и(1), и(2), ..., u(k) и траекторию #(0), х(1), ..;, x(k) от начала процесса до момента t = k и хотим завершить процесс, т.е. выбрать w(&+l), ..., и (Ν) и x(k+l)y ..., χ (Ν); тогда, если завершающая часть процесса (от момента / = k до t = Ν) не будет оптимальной — в смысле максимума функционала /*- Σ /?(*(*-!). и (ή), (9.1) го и весь процесс в целом не будет оптимальным. В самом деле, если бы мы могли улучшить «хвост» процесса, т.е. изменить x(k + 1), ..., χ (Ν) и u{k+ 1), ..., и (Ν) так, чтобы сумма соответствующих слагаемых в (3.5) увеличилась, то это привело бы к улучшению всего процесса в целом. Эта прозрачная идея реализуется, следуя Беллмалу, таким образом. (Для простоты мы здесь ограничимся рассмотрением основной задачи, поставленной в п. 3.) Предположим, что в момент t = k мы уже находимся в точке x = x(k) (не задаваясь вопросом, как мы в эту точку пришли из начального состояния). Будем всеми возможными способами осуществлять завершающую часть процесса: и(*+1), ..., u(N)\ x(k + l), ..., χ(Ν) (9.2) (так, чтобы выполнялись соотношения (3.3), (3.4)). Для каждой такой завершающей части процесса вычислим сумму (9.1) и
9] § 3. МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 59 наибольшую из всех этих сумм обозначим через toh(x) = = <uh(x(k)). Таким образом, отправляясь из точки # = #(&), мы можем выбрать завершающую часть процесса (9.2) так, чтобы сумма (9.1) приняла значение ω^(χ), но большего значения этой суммы достичь (отправляясь из точки х) невозможно. Полагая в этом рассуждении k = О, 1, ..., Ν, мы получим N + 1 функций (йо(х), ωι(я), ..., (un(x). Ясно, что u)n(x) = О, поскольку в сумме (9.1) при k = N нет слагаемых, т.е. эта сумма равна нулю. Ясно, далее, что ω0(#ο) есть максимальное значение суммы (3.5), т.е. функционала /, которое мы можем получить, начиная движение из точки χ = Xq и используя всевозможные допустимые процессы (3.1), (3.2). Иными словами, ωο(*ο) есть то значение функционала /, которое он принимает для оптимального процесса с начальным состоянием х(О) = Хо, так что задача дискретного оптимального управления как раз и заключается в отыскании значения ωο(#ο) и способа его достижения. Итак, если бы мы умели последовательно вычислять функции (un(x), (un-i(x)> ···, ωι(*), ωο(*), начиная от (un(x) =0 и до искомой функции (ύο(χ), то это и означало бы, что мы обладаем методом решения дискретной задачи оптимального управления. И такой метод легко получить. Предположим, что мы находимся в момент t = k— 1 в точке x = x(k—1). Исходя из этой точки, выберем наилучшее завершение процесса, т. е. выберем u(t)y x(t) для / = Λ,ΛτΜ»···»^ так, чтобы сумма N /*-1-Σ/?(*(*-1), и (ή) приняла свое наибольшее значение (uk-i(x). Эту сумму можно записать.в виде '*-!=/*(*(*-О, "(*))+ Σ /?(*(*-!), "(0). причем второе слагаемое справа равно Jk- Ясно, что это слагаемое равно m{x{k))> т.е. равно наибольшему возможному значению суммы Jk при движении из точки x(k) '(ведь улучшение «хвоста», т. е. увеличение суммы Jki привело бы, согласно сказанному выше, к увеличению суммы Jk-u а это невозможно, так как Jk-ι = (Ok-i(x))· Таким образом, ωΑ_, (х) - f°h (x (k - 1), и (k)) + ω, (χ (k)). (9.3) Заметим теперьТ что это соотношение имеет место, если x(k), u(k) входят в наилучшее завершение процесса, исходящее из точки χ = χ (k —-1). Если же мы π ρ о и з в о л ь н о (с соблюдением
60 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [9 соотношений (3.3), (3.4)) выберем x(k), u(k)y то соотношение (9.3) заменится неравенством ωΛβ1 (x)>f°k(x(k- 1), u(k)) + *k(x(k))9 <9.4) поскольку в правой части (9.4) теперь стоит какая-то (возможно, не максимальная) сумма Λ_ι. Следовательно, m-i(x) есть наибольшее из всех значений суммы /2(*(ft-l), u(k)) + *h(x(k))9 которые можно получить, выбирая допустимым образом u(k)t x(k)% т.е. ωΛ_, (х) = max [f°k {χ (k — 1), и (k)) + ωΛ {χ (k))]. Заменяя здесь в правой части x(k) через fh(x(k—1), u(k)) (см. (3.3)) и вспоминая, что x(k—1)=д:, мы запишем это соотношение в окончательном виде: ω^ί*) — max [/»(*, и) + <uk(fk(χ, и))], k—l9 2, .,., Ν. (9.5) Здесь максимум берется по всем u = u(k) (поскольку x{k) совсем не входит в правую часть), т.е. по всем точкам и е Uk(x). Соотношение (9.5), называемое уравнением Беллмана, позволяет последовательно вычислять функции cdjv, cojv-i, ..., ωι, ωο, начиная от ©jv = 0 и до искомой функции ω0(χ). Метод нахождения искомой функции ωο(χ) с помощью соотношений (9.5) и носит название динамического программирования. Практическое использование этого метода обычно требует использования вычислительных машин с большим объемом памяти. Дело в том, что при последовательном вычислении функций ша(дг) с помощью соотношения (9.5) мы так и не знаем до последнего момента (т. е. до нахождения числа ωο(#ο))> каковы же будут состояния x(t), образующие оптимальную траекторию, исходящую из-точки х(0) = #o. (Это будет проиллюстрировано в рассматриваемом ниже примере 9.2.) Поэтому приходится искать (и запоминать) значения функций т(х) теоретически для всех (а практически для достаточно густой сетки) значений х. Это равносильно отысканию сразу всех оптимальных траекторий (соответствующих различным начальным состояниям *(0)). По указанной причине метод динамического программирования является практически малоэффективным, несмотря на необычайную широту области принципиально возможных применений. В некоторых же (впрочем, весьма редких) случаях привлечение дополнительных соображений позволяет решить задачу в конечном виде.
9] § 3. МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 61 В качеству примера решим методом динамического программирования задачу, поставленную в примере 1.1. При решении нам потребуется следующая лемма, которую, чтобы затем не прерывать изложения, мы вынесем вперед: ( с — и \^ Лемма 9.1. Функция иу—^—1 , рассматриваемая на отрезке О < и ^ с, достигает максимума в единственной точке с (с \*+1 и = -4-Г и этот максимум равен _£_) «+1 \k+\/ Доказательство легко получается с помощью дифференцирования. Пример 9.2. Рассмотрим дискретную задачу оптимального управления, поставленную в примере 1.1. В этом случае имеются лишь две фазовые координаты х\ х2 и один управляющий параметр и, так что уравнение (3.3) в координатной форме принимает вид х* (t) _/!(*■(*-1), х2(/-1), u(t))9 *2 (0 = №('-!), *2('-1), и (t)), где в качестве /J, f2t следует взять функции (см. (1.1), (1.2)) f\(x\ x\ u) = xl + u, f2(x\ x\ и) = хЧ. (9.6) Далее, область U (х) = Ut (x) = Ut (x\ х2) определяется неравенствами (см. 1.4)) 0<и<а —х1. (9.7) Теперь займемся функцией f°t(xl, х2, и), задающей функционал (3.5). Так как вся сумма (3.5) должна быть (по постановке задачи) равна x2(N), т.е. должна быть равна x2(N—l)u(N) (см. (1.2)): П(х1(0),х2(0),и(1))+ ... + f«N(x*(N- l),x2(N- \),u(N))=* = x2(N-\)u(N), то естественно считать, что функции f°t имеют следующий вид: /?-...«&_,«■<>, f°N(x\ х2, и) = х2и. (9.8) Перейдем к применению метода динамического программирования. Мы имеем из (9.5) (в силу соотношения со^ = 0): ®м-\{х1> x2)— max/° (λ:1, λ:2, и) = max x2u = χ2 (α — χ1). Здесь мы воспользовались тем, что χ2 ^ 0, и потому максимум выражения х2и достигается при и = а — х1 (см. (9.7)). Кроме того, отсюда следует, что оптимальное значение u(N)9 т. е. то значение, при котором JN~\ принимает свое наибольшее
62 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [9 значение ωΝ-\(χ(Ν—1)), равно u(N)=*a — xl(N-l). Как видим, сделав один шаг (т.е. перейдя от cojv к cdjv-i), мы вовсе еще не узнали значения u(N); мы лишь определили, как оно зависит от предыдущего состояния x(N—1) (которое нам также еще не известно). Продолжим процесс дальше. С этой целью заметим, что в силу (9.8) соотношение (9.5) при k < N принимает вид ωΛ-ι(*!. *2)= max M/JK*1· χ2> ")> /К*1' χ2> ")) = u^U(x) R ч 7 = max ω* (χ1 + и, х2и). u^U(x) При k = N—\ получаем ωΝ-2(χι, х2) = max х2и (а — χ1 — и) = χ2 max и (α — α:1 — и). u<=U(x) u^U(x) Согласно лемме 9.1 выражение и (а — х1 — и) достигает макси- мума при и = —о— и этот максимум равен I—~—I · Таким образом, ω^(д:1, х2) = х2(^~^^ . Так как максимум достигается при и = {а — #!)/2, то для оптимального управления w (Λ/' — 1) мы имеем следующее значение: „(ΛΓ-0-—''<*-*>. Следующий шаг: ω#-.3(* > χ)= max * *м о =Λ: raax " ο · u<=U(x) \ Δ ι ue=U(x) \ Δ ι Согласно лемме 9.1 выражение и( а"~* ~~и\ достигает максимума при и = {а — χι)β и этот максимум равен ί а~~* ) * Таким образом, Кроме того, оптимальное управление u{N — 2) имеет вид u{N-2)=a-xl<f-3) . Продолжая этот процесс, находим πα индукции: ®N-k(χ1, χ2) = χ2(a~kx ) . u(N-k + \)=a~xl{kN~k) ; * = 1, 2 JV. (9.9)
9] § 3. МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 63 До сих пор мы вели процесс «вслепую», не зная, куда он приведет. Поэтому, мы нашли лишь общее соотношение (9.9), пригодное для всех оптимальных процессов. Теперь используем начальные значения л:1(0)=0, х2(0) = 1 (см. (1.3)). При k = N получаем из (9.9): u(l) = a/N. Согласно (1.1) это дает χΐ(1)=α/Ν. Теперь при k = N—\ получаем из (9.9): u(2) = alN, и потому (см. (1.1)) xl(2) = 2a/N. Затем при k = Ν — 2 из (9.9) получаем и(3) = α/Ν и т. д. Итак, методом динамического программирования мы нашли единственный оптимальный процесс: и(1)-и(2)« ... -ц(Л0—J- — в полном соответствии с результатом примера 8.1 (так что, действительно, результат примера 8.1 является точным, а не приближенным). Рассмотренный пример позволяет проследить одно интересное обстоятельство. Мы уже упоминали на стр. 40, что одна и та же задача о минимуме функции может быть по-разному све- - дена к задаче об отыскании оптимальных процессов в дискретных системах. Например, задача, рассмотренная в примере 1.1, может быть описана дискретным объектом, указанным в примерах 1.1, 1.2, а может быть сведена к дискретному объекту по методу стр. 39—40. В первом случае, как мы видели в примере 9.2, метод динамического программирования позволяет легко решить задачу. В последнем же случае (т. е. при сведении к дискретному объекту по методу стр. 39—40) мы имеем N = 1, и потому динамическое программирование рекомендует лишь найти «функцию» (т. е. в данном случае число) ω0 = max/? (#, u) = maxF(u). «ей ней Но это просто есть формулировка поставленной задачи и ничего более. Таким образом, при таком сведении к дискретному управляемому объекту метод динамического программирования н и* чего не дает для решения первоначальной задачи. Мы видим, что «сила» метода динамического программирования (если его применять к задаче об экстремуме функции) существенно зависит от того, насколько умело мы выберем способ сведения рассматриваемой задачи об экстремуме функции к той или иной задаче оптимального управления дискретным объектом. В заключение рассмотрим вопрос о применении метода динамического программирования к задаче оптимального управления непрерывными объектами. Будем исходить из «непрерывной» задачи оптимального управления, сформулированной в п. 8 (см. формулы (8 17) —(8.21)), считая, что множество Μι (см. (8.21)) совпадает со всем пространством переменных
64 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [9 у1, ..., уп, и осуществим редукцию ее к дискретной задаче (8.27)—(8.30). К этой дискретной задаче мы применим метод динамического программирования. Уравнение Беллмана (см. (9.5)) в этом случае запишется следующим образом: <*k-{ (х) = max [hg° {χ, и) + CDfe (χ + hg (χ, «))], k = 1, 2, ..., Ν, (ср. соотношения (8.29) и (8.25)). Здесь N ofe (*) = max 2 Λ*°(*(*-1). « (0). где максимум берется по всевозможным завершающим частям процесса (см. (9.2)), исходящим из точки x(k) = χ. Производя в этих соотношениях замену (8.23), (8.24) и вводя обозначение <ЬХ (#) = ώ/л (#) = ω*(χ), получим соотношения: ωτ-Λ (у) = max [/г#° (t/, v) + Щ (у + hg (у, с/»], τ = /г, 2/г, ... tf/г; ) Nh \ (9.10) ώΤ (у) = max 2 ^° to Φ - Λ), σ (θ)). Во втором соотношении (9.10) суммирование ведется по последовательным значениям 0, отстоящим друг от друга на h (т. е. θ = τ +h, τ + 2h Nh), и потому это соотношение является приближенным выражением равенства Τ ώχ (у) - max j* g° (у (θ), ν (θ)) <*θ. (9.11) τ Здесь максимум берется по всем допустимым управлениям ν {τ) и соответствующим решениям дифференциального уравнения (8.17) с начальным условием у (τ) = у. Первое же из соотношений (9.10) в силу равенства η &х (У + hg (у, ν)) « ώτ (у) + h V д^[у) gt {yt V) " £t\ ду (вытекающего из формулы Тейлора) может быть переписано в виде ωτ (у) — &х-н (у) i [«·*·»+Σ ^ψ- «*<*·>] + max Это соотношение является приближенным выражением равенства Αωτ (у) дх max g° (у, 0) + V а&; f gl (у, ν) - 0. (9.12) Соотношения (9.11), (9.12) и дают принцип динамического программирования для рассматриваемой «непрерывной» задачи оптимального управления. Его можно сформулировать следующим образом.
10] § 3. МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИЙ 65 Пусть τ — некоторая точка отрезка [0, Т] и у —* некоторая точка фазового пространства (т. е. пространства переменных у\ ..., уп). Будем рассматривать всевозможные допустимые управления υ(θ), τ < θ ^ Τ (см. (8.18)) и соответствующие решения у (в) дифференциального уравнения (8.17) с начальным условием у(т) = у. Беря максимум по всем таким процессам ι»(θ), y(Q), мы сможем определить ώτ (у) формулой (9.11). Оказывается^ что функция ώτ (у) удовлетворяет соотношению (9.12), которое называется уравнением Беллмана для рассматриваемой «непрерывной»^задачи. s Из сказанного ясно, что число ώτ(ί/) при τ = 0, у = у0 дает наибольшее возможное значение функционала (8.19) при выполнении условий (8.17), (8.18), (8.20) ν и что оптимальный процесс и (τ), у (τ) (для которого функционал (8.19) принимает наибольшее значение) удовлетворяет уравнению Беллмана, т. е. обращает его в тождество: аЙт(у(т)) + g° (У (τ), ν (τ)) + У ^lilil» g< (у (τ)> ρ (τ)) « ο. дт ^^ ди% Таким образом, метод динамического программирования доставляет некоторую информацию об оптимальных процессах в рассматриваемой «непрерывной» задаче, и потому он может быть применен для разыскания оптимальных процессов. Мы не будем касаться трудностей, с которыми связано применение этого метода (в «непрерывном» случае), т. е. трудностей решения дифференциального уравнения в частных производных (9.12), осложненного к тому же наличием максимума. Отметим здесь лишь, что приведенные выше рассуждения, конечно, не являются доказательством справедливости метода динамического программирования (т. е.· выполнения соотношения (9.12) для функции (9.11)). Достаточно сказать, что примененный выше переход от «непрерывной» задачи к дискретной и обратно совершенно не был корректно обоснован. Для корректного обоснования метода динамического программирования (в применении к рассматриваемой «непрерывной» задаче) приходится накладывать некоторые условия на постановку задачи. К сожалению, в эти условия входит функция ώτ (у) (нахождение которой и означает решение задачи), так что до решения задачи эти условия практически непроверяемы. Все это делает метод динамического программирования малоэффективным. (Подробнее об указанных здесь трудностях обоснования метода динамического программирования, — правда, в применении к «непрерывной» задаче с незакрепленным временем, — сказано на стр. 29 второй из книг, указанных в сноске на стр. 57.) Ν Подчеркнем еще раз, что в применении к дискретным задачам, представляющим основной интерес в настоящей книге, метод динамического программирования обосновывается вполне корректно. Ниже (в п. 40) мы изложим наиболее общую версию метода динамического программирования в применении к дискретной задаче оптимального управления. 10. Дискретный принцип максимума. Рассмотренный в предыдущем пункте метод динамического программирования является (несмотря на его недостатки — применительно к «непрерывным» задачам) одним из двух основных методов, используемых в теории оптимального управления непрерывными процессами. Другой метод основан на применении принципа максимума Л. С. Понтрягина. Этот метод является наиболее эффективным и в настоящее время признается основным методом решения «непрерывных» задач оптимального управления. Неудивительно, что сразу же после открытия и доказательства
66 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [№ принципа максимума были сделаны попытки нахождения «дискретной» версии принципа максимума. Этому вопросу и посвящен настоящий пункт. Прежде всего мы дадим формулировку принципа максимума, причем, имея в виду нашу основную цель (дискретную задачу), ограничимся случаем «непрерывной» задачи оптимального управления с фиксированным временем. Именно, мы рассмотрим сформулированную в п. 8 задачу (8.17) — (8.21), причем для простоты возьмем лишь случай свободного правого конца, т. е. будем считать, что множество М\ в соотношении (8.21) совпадает со всем пространством переменных yi, ..., уп. В этом случае принцип максимума формулируется следующим образом (см. стр. 375 второй из книг, указанных в сноске на стр. 57): Введем вспомогательные переменные φα, φι, ..., φη (здесь η — число фазовых переменных у\ ..., уп) и с их помощью со- ставим вспомогательную функцию η Я (φ, у, о)=2фй'(У, ν), (10.1) где g° — функция, участвующая в определении функционала (8.19), a g1, ..., gn — компоненты вектор-функции g(v, у), стоящей в правой части уравнения (8.17). Далее, напишем следующую систему дифференциальных уравнений для вспомогательных неизвестных-. dcp/ дН Λ dgi {у, υ) ^--—--g,,-^, 1=1 .... η, (10.2) где положим φ0=1. (10.3) Пусть теперь ν (τ), 0 ^ τ ^ Τ, — некоторое допустимое (т.е. удовлетворяющее условию (8.18)) управление, а у (τ)—соответствующее решение дифференциального уравнения (8.17) с начальным условием (8.20). Подставим функции у = у (τ), ν=*ν(χ) в правые части уравнений (10.2) и обозначим через φ (τ) решение этой системы с начальным условием φι(Γ) = φ2(Γ)= ... -фя(Г) = 0. (10.4) Если процесс ν(τ), у (χ) оптимален, т. е. придает максимум функционалу (8.19), то для каждого момента τ(0 < τ < Τ) выполнено следующее соотношение максимума: Η (φ (τ), у (τ), υ (τ)) = max Η (φ (τ), у (τ), υ), (10.5) г, е. Я (φ (τ), у(х), ν(χ))^Π(ψ(χ), y(x),v) для любого v<=V4
ΙΟ]. § 3 МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 67- Если ставится задача о минимуме (а не о максимуме) функционала (8.19), то формулировка остается той же, только соотношение (10.3) принимает вид Φό —— 1. (Ю.З/ Сформулированная теорема (принцип максимума) дает н е- обходи'мое условие оптимальности (10.5), во многих случаях позволяющее из всех процессов с начальным условием (8.20) выделить лишь один процесс ν(τ), y(t), «подозрительный» на оптимальность (или позволяющее выделить конечное число таких процессов, из которых затем нужно отобрать действительно оптимальный процесс). Попытаемся теперь сформулировать «дискретный» аналог принципа максимума. С этой целью мы применим тот же прием перехода от «непрерывной» задачи к дискретной, которым мы воспользовались в п. 8. Именно, применим замену (8.24), которую дополним введением еще одного переменного ψ по формуле Ψ(0 = φ(^) = φ(τ). (10.6) Тогда Я оказывается функцией аргументов ψ, χ, и: Я-Σ Ψι (*)**(*(*-О, и (ή) (где ψ0 = φο), а соотношение максимума (10.5) (которое мы будем рассматривать лишь для значений τ = Л, 2А, ..., Nh) в новых переменных примет вид #(Ψ(0, *,(<■-О, *(/))> χ >Я(гр(0, x(t~- 1), и) для любого weK; /=1, ..., N, т. е. п π > Σ Ψ* (0 g'(* С "" 0» ti) для любого кеК; t=l9...9N. (10.7) Далее, соотношение (10.2) можно заменить приближенным равенством 5/(τ)-φ/(τ-Α) Л dgl (у (τ), о (τ)) т ~-2ίΦι(τ) {=0 1=0
68 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [10 которое мы будем рассматривать лишь для значений τ = = Α, 2Λ, ..., Nh. В новых переменных это приближенное равенство запишется в виде ♦/(<-0-МО+ αΣ*ι(0 d8>(x{t~l)'u{t)) ; (Ю.8) /=1, ..♦, η; / —1, ..., Ν. Наконец, соотношения (10.3), (10.4) можно будет записать следующим образом: ♦ь-1. (Ю.9) *ι(Λ0-*ϊ(Λ0- ··· -*Я(ЛО-0. (ШЛО) Введем теперь, как и в п. 8, функцию f(x, u)±*x + hg(x, и) и, для единообразия обозначений, функцию hg°(x9 и) обозначим через f°(*, #), так что функционал (8.30) запишется в виде N /—Ц/9(*(*-1), и (ή). (10.11) /—о Кроме того, введем в рассмотрение функцию Я (ψ, х, и) - Л«° (x, u) + 2 Ь {х1 + Л*' (*. и)) — 2 */ (л:, и). Тогда, заменив (совершая некоторую погрешность) приближенное равенство (10.8) точным, мы получим • ♦/(/-Ο-^Ψ,ίΟ ^ ^ , /-1 n; /-1, 2 tf. (10.12) Далее, соотношение максимума (10.7) можно будет переписать в виде Я(ф(0> χ(ί — 1), и (/))># (ψ (0> *(/— 1), «) для любого βε7, Я (ψ (0, x(t- 1), «(0) — max Η (ψ (0, x(t- 1), и); (10.13) ueV /—t, 2, .... ЛГ. Наконец, как и в п. 8, мы заменим (совершая некоторую-погрешность) приближенное равенство (8.25) точным: *(*)-/(*(/-1), u(t)) (10.14) (см. (8.29)).
Ю] § 3 МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 69 Полученные соотношения и составляют так называемый ди- скретный принцип максимума. Мы его сформулируем (по аналогии с «непрерывным» принципом максимума) следующим образом. Рассматривается дискретный управляемый объект (10.14) с областью управления V (см. (8.27)) и критерием эффективности (10.11). Для этого объекта рассматривается основная задача (т. е. задача со свободным правым концом и без ограничений на фазовые координаты) с начальным условием х(0) = уо (см. (8.28)), причем оптимальность понимается в смысле максимума функционала (10.11). Для решения этой задачи введем вспомогательные переменные ψο, ψι, ·.., ψη (здесь η —число фазовых переменных х\ ..., хп) и с их помощью составим следующую вспомогательную функцию: ЛОМ, κ)«Σψ/(*. и). (ЮЛ5) /—о где f° — функция, участвующая в определении функционала (10 11), a /*, ..., fn — компоненты вектор-функции f(x, и), стоящей в правой части уравнения (10.14). Далее, напишем систему соотношений (10.12) для вспомогательных неизвестных и положим ψ0 = 1 {см. (10.9)). Пусть теперь u(t)9 t = 1, 2, ..., Ν — некоторое допустимое (т. е. удовлетворяющее включению u(t)&V для всех /=1, 2, ..., Ν) управление, a x(t), t = 0,1, ..., Ν, — соответствую- щая (т. е. удовлетворяющая соотношению (10.14)) траектория, исходящая из точки х(0) = уо. Подставим функции x = x(t)f и = u(t) в правые части соотношений (10.12); тогда, используя соотношения (10.9), (10.10), мы сможем последовательно найти Ψ(Λ/-1), ψ(#-2), ..., ψ(1). Если процесс u(t), x(t) оптимален, т, е. придает максимум функционалу (10.11), то для каждого i = 1, 2, ..., N выполнено соотношение максимума (10.13). Если оптимальность понимается в смысле минимума (а не максимума) функционала (10.11), то формулировка остается той же, только соотношение (10.9) принимает вид Фо —-1. (Ю.90 Мы сформулировали дискретный принцип максимума как необходимое условие оптимальности (по аналогии с «непрерывным» принципом максимума), причем ограничились лишь случаем основной задачи, сформулированной в п. 3. Разумеется, приведенные рассуждения не могут служить доказательством дискретного принципа максимума, поскольку совершенный переход от непрерывного объекта к дискретному не был
70 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [10 обоснован и содержал погрешности (замену приближенных ра· венств точными). Известны попытки (начиная с работ Каца (S. Katz)) доказать дискретный принцип максимума в общем виде. Однако все эти рассуждения математически наивны и содержат прозрачные ошибки*). Представляется поэтому интересным математически осмыслить формулировку дискретного принципа максимума и выяснить, верен ли этот принцип в таком виде. Мы увидим, что в приведенной формулировке принцип максимума не будет ни необходимым, ни достаточным условием оптимальности. Для того чтобы математически осмыслить формулировку дискретного принципа максимума, мы переформулируем рассматриваемую дискретную задачу оптимального управления в виде задачи об экстремуме функции, заданной на подмножестве евклидова пространства (см. п. 6). С этой целью введем в рассмотрение переменные w/, xls (как в п. 6) и обозначим через Ег пространство, в котором координатами являются все эти переменные (/ = 1, ..., п\ / = 1, ..., г; 5=1, ..., Ν; ί = 1, ... ..., Ν). Для любой точки ζ^Εζ, мы, как и в п. 6, определим точки ls{z) и r\t(z). Так как мы рассматриваем основную задачу, то соотношений (6.4) не будет, а соотношения (6.5), (6.6) примут теперь вид r\t(z)<==V, t=l, .,., Ν; (10.16) lt(ζ)-/(!,-,(*), η,(2)), f-1, ..., Ν (10.17) (где следует считать %o(z)~yo). Множество всех точек z^Ez> удовлетворяющих всем соотношениям (10.16), (10.17), обозначим через Ω. Тогда рассматриваемая дискретная задача оптимального управления эквивалентна задаче отыскания максимума функции F(z) = f°(lo(z), ηι (*)) + № (*), Ч2(г))+... +/°(6лм(г), Члг(г)), (10.18) рассматриваемой на множестве Ω (в силу формул (6.8)). Соотношение (10.17) можно в координатной форме записать в виде -|<(2)-Pf'&-i(z)> M2)) = °; '=1 К *=1.·..., п. *) Советскому читателю одна такая попытка известна по переводной книге Фана и Ваня (см. сноску на стр. 15). Эта книга, излагающая интересные прикладные задачи, в математическом отношении (как и отмечается ее редактором) некорректна; в частности, содержащееся на стр. 33—35 этой книги рассуждение содержит очевидную ошибку и доказательства дискретного принципа максимума не дает>
,0] § 3. МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 71 Левую часть этого соотношения мы обозначим через F\(z): ^ί (г)--!{(«) +/'(!,.! (г), η, (ζ)) (10.19) (здесь, очевидно, Vt(z) = x\y Из выражения (10.19) легко получить выражения для частных производных функции F\ (ζ) no переменным х[. Они имеют следующий вид: £!ω «fL_ «■(!"<.)■»(,», ,_, „ lim дх\ d*{_i д*1 (остальные частные производные равны нулю, так как другие переменные х[ в правую часть выражения (10.19) не входят). Рассмотрим теперь функцию, получающуюся из F(z) добавлением линейной комбинации функций (10.19): G(z) = F(z)+S Σψί(ζ), (Ю.21) где ψ* — некоторые константы. Так как все функции F!s (z) тождественно обращаются в нуль на множестве Ω (см. (10.17), (10.19)), то F(z)=G(z) на множестве Ω при любом выборе констант ψ*. Следовательно, задача о максимуме функции F(z) на множестве Ω равносильна задаче о максимуме функции G{z) на множестве Ω. Заметим еще, что в силу (10.20) функция G(z) имеет следующие частные производные по переменным х\_х\ dG (ζ) =dF(z) у у dFJiz) _ f" i f 171 ΤΙ Ι7Μ V~"4 <?*' Ψί ^ ^ψ/ a** / = 2, 3, ..., JV; л* — '/V . ψ* Таким образом, если положить ψ£=1, то эти частные производные можно записать в виде
72 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ 10 Пусть теперь u(t)y x(t) —оптимальный процесс для рассматриваемой дискретной задачи и z0 — соответствующая точка множества Ω, т. е. Ы2о) = *(0. ηί(2ο)== w(/); /=l, ..., Λ/" (см. (6.8)). Пусть, далее, ψ(1), ψ(2), ...; ψ (Ν) соответствует этому оптимальному процессу в силу дискретного принципа максимума (см. (10.10), (ГО. 12)). Выберем константы ψ*, участвующие в определении функции G(z) (см. (10.21)), следующим образом: Тогда в силу (10.22) мы получим -^ —*ι(Λ0, и потому согласно (10.10), (10.12) Εΐψ-^Ο; /=1, ..., Ν. ίβ| „. Итак, функция G(z) имеет в точке ζ = ζ0 нулевые частные производные по всем переменным х\. Займемся, наконец, условием максимума (10.13). Записывая его в виде Σ *< (0 Ζ1 (* (* - 1), и (0) - шах 2 ψ, (<) /' (χ (ί - 1), и) и переходя к переменным х\, и{, ψί, получим i W {It-, (z0)> П. (*ο)) - max Σ ψ</< (|f_, (z0), ut), t = 1, ..., N. Добавив к обеим частям этого равенства слагаемое — 2 Ψί£*(2ο)» не зависящее от uv мы найдем (учитывая, что г|^ = 1); /°&-i(2o> *fo)) + Ji W-Si (*«)+/'&_,Ы. n/W)- = max [/о (6/_, (г0), «,) + ± Μ (- 6,'(*0) + /' (S,_, fo), «,))] .
10] § 3. МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 73 Суммируя эти соотношения по f= 1, ..., N и учитывая (10.18), (10.19), (10.21), получим G (г0) = max G (20). (10.23) где через 50 обозначена точка, имеющая те же координаты х\, что и точка z0 (т. е. Ц(20) = |J(z0) для всех /, 0 и произвольные координаты «*, удовлетворяющие условиям (10.16). Иными словами, функция G(z) достигает в точке zQ максимума по всем переменным ujs (при фиксированных переменных #j). Обратно, из соотношения (10.23), проводя рассуждения в обратном порядке, мы получим соотношение максимума (10.13) для всех *=1, ...,ЛГ. Таким образом, равенство (10.23) представляет собой эквивалент условия максимума (10.13) в терминах переменных и/, х\. Осмыслим получившиеся формулы. С этой целью обозначим; через Еи пространство всех переменных и[(}=\, ..., г s = 1, ..., Ν) и для любой точки гг*е£и положим r\t(u*) = = («}, ..., uj).Далее, через Ξ обозначим множество всех точек и* пространства EUy координаты которых удовлетворяют условиям η;(α*)^ν, t= 1,...., N (ср. (10.16)). Таким образом, задание точки «*gS равносильно заданию допустимого .управления и(1), ..., ιι(Ν). Заметим теперь, что задание точки «*еЕ (т. е. задание значений всех переменных и^ однозначно определяет значения переменных х\ в силу соотношений (10.17) (это равносильно тому, что задание управления и(\)у ..., u(N) однозначно определяет траекторию #(0),л;(1), ..., χ(Ν) в силу соотношений (10.14), поскольку начальная точкд д:(0) = у0 задана). Обозначим через ζ(«*) точку #* = {^} (в пространстве Ех всех переменных х\), определяемую соотношениями (10.17), исходя из точки а* £ Ξ; Таким образом, для любой точки и*бЗ точка ζ = (и*, ζ(«*)) удовлетворяет всем соотношениям (10.16), (10.17), т. е. принадлежит множеству Ω, причем, очевидно, любая точка гей имеет такой вид. Если условно изобразить на графике все переменные и[ одной осью «*, а все переменные х\ — одной осью #*, то мы по- чим функцию χ* = ζ(α*), заданную на множестве Ξ (лежащем на «оси» и*), причем множество всех точек ζ = (и*, #*), для которых χ* = ζ(«*), τ. ^график функции ζ, как раз и будет представлять собой множество Ω (рис. 27).
74 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [10 Далее, в пространстве Ег .задана функция G(z) и ищется максимум этой функции на множестве Ω (рис. 28); это равносильно отысканию максимума функции F(z) на множестве Ω. При этом функция G(z) оказывается подобранной таким образом, что все ее производные по координатам точки х*(т. е. по xfy обращаются в нуль в некоторой точке z0 e Ω. Утверждается, что при этих обстоятельствах выполнение условия максимума, т. е. выполнение равенства (10.23), является необходимым условием для того, чтобы функция G(z)9 рассматриваемая на множестве Ω, достигала максимума в точке г0. Рис. 27. Рис. 28. Это и есть формулировка дискретного принципа максимума в терминах координат и[9 х\. Таким образом, отвлекаясь от конкретного вида функции G(z), функции ζ (α*) и множества Ξ, мы можем сказать, что дискретный принцип максимума представляет собой утверждение следующего типа: В пространстве Еи дано некоторое множество Ξ и задано некоторое отображение ζ: Е->ЕХ этого множества S в пространство Ех. Множество всех точек ζ = (ί/*,ζ(«*)), где «*ε3, т. е. график отображения ζ, обозначается через Ω; таким образом, Ω cz EZf где Ez = Еи χ Εχ есть прямое произведение пространств Еи и Ех. В пространстве Εζ задана некоторая функция G(z), а в множестве Ω задана некоторая точка ζ0 = («*, #*), причем в точке ζ0 все частные производные функции G(z) no направлениям, лежащим в ЕХ) равны нулю. Для того чтобы (при этих обстоятельствах) функция G(z)9 рассматриваемая только на множестве Ω, достигала максимума в точке z0, необходимо, чтобы функция G(z) в точке zQ достигала максимума по переменному и*9 т\ е. G (u\ x*0) ^ G (u*Qi х*0) для любого ii*GS,
§ 3. МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 75 Ш1 0 ШШ ^^:::-M^imvJ Ω Это утверждение (вопрос о справедливости которого мы сейчас обсудим} назовем, поскольку речь идет о функциях в евклидовых пространствах, евклидовым принципом максимума. Простые примеры показывают, что в том общем виде, как он был сформулирован выше, евклидов принцип максимума места не имеет. Рисунок 29 иллюстрирует этот факт: функция G(z) изображается графически поверхностью, имеющей седло над точкой г0 (так что все производные функции G(z) в точке £о обращаются в нуль), причем *в направлении оси и* поверхность поднимается (и, следовательно, функция G(z) не достигает в точке z0 максимума по переменному г/*), а в направлении оси х* поверхность опускается. Если теперь линия Ω, т. е. график Рис. 29. функции χ* = ζ(«*), достаточно сильно наклонена к оси */*, то при движении по этой линии от точки 20 функция G(z) убывает. Итак, функция G(z), рассматриваемая на множестве Ω, достигает в точке z0 максимума, но необходимое условие, указанное в евклидовом принципе максимума (т. е. достижение максимума по переменному и*), не выполнено. В нижеследующем примере эта идея подтверждена точным подсчетом. Пример 10.1. Пусть Еи — пространство переменныхщ, u2t ..щ ..., uNi а Ех— пространство переменных лгьлг2, ..., χΝ· За множество Ξ примем все пространство EUi а отображение ζ: Ξ-+Εχ зададим соотношением ζ(α„ «2, ··., uN)*=(tb, u2i ..., uN), т. е. точка ζ (и*-) имеет в пространстве Ех такие же координаты, .какие имеет точка и* в пространстве Еи. Далее, функцию G(z) зададим формулой G(z) = G(^, ..., uNi xv ..., χΝ) = «α? + ... +4_2(*J+ ... + 4)> (10-24) а за Zq примем начало координат пространства Ez. Тогда в точке 20 все производные функции G(z) обращаются в нуль, в том ^числе и производные по переменным хъ x2i...,xN. Далее, множество Ω в силу определения отображения ζ задается в пространстве Ег уравнениями Х\ — Wj, Х2 — U2, lN*
76 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ п0 и потому на этом множестве функция G(z) имеет вид -(x? + *S+ ... +χ%), т. е. эта функция, рассматриваемая на множестве Ω, достигает в точке z0 максимума. Однако необходимое условие, содержащееся в евклидовом принципе максимума, не выполнено, так как G(z), рассматриваемая как функция только переменных ии ... ..., uNt имеет вид' и\ + и\+ ... +и%, так что она достигает в точке г0 не максимума (по «*), а минимума. Таким образом, в рассматриваемом случае евклидов принцип максимума места не имеет. Пример Ш.2. Евклидов принцип максимума не может (в общем случае) рассматриваться и как достаточное условие для достижения функцией G(z)9 рассматриваемой лишь на множестве Ω, максимума в точке 2о. В самом деле, сохраним те же обозначения, что и в предыдущем примере, но в качестве G(z) возьмем ту же функцию с обратным знаком: G{z) = -u\- ... -и% + 2(х* + ... +х%). (10.25) По-прежнему все производные функции G(z) обращаются в точке г0 в нуль, причем теперь уже выполнено и условие, содержащееся в евклидовом принципе максимума, т. е. G(z)9 рассматриваемая как функция только переменных ии ..., uN, достигает в точке 20 максимума. Однако функция G, рассматриваемая на множестве Ω, не достигает в точке z0 максимума. Итак, в общем случае (в том виде, как он был сформулирован) евклидов принцип максимума не является ни необходимым, ни достаточным условием достижения максимума на множестве Ω. Рассмотренные примеры легко могут быть переформулированы в терминах дискретных управляемых объектов. В результате мы получим примеры, показывающие, что в общем случае дискретный принцип максимума не является ни необходимым, ни достаточным условием оптимальности*). Для получения этих примеров мы положим η = г = 1 (т. е. будем считать, что имеется лишь одна фазовая координата и один управляющий параметр) и применим формулы (6.8), т.е. щ, xt заменим на u(t), x(t). Кроме того, мы отбросим в (10.24), (10.25) слагаемое x2N (поскольку в функционал (10.11) аргумент x(N) не входит), -*) Впервые пример подобного рода был предложен А. Г. Бутковским (О необходимых и достаточных условиях оптимальности для импульсных систем управления, Автоматика и телемеханика 24, № 8 (1963).
10} § 3 МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 77 Пример 10.3. Рассмотрим дискретный управляемый объект X(f) = u(f)9 t=l9 2, ..... Ν, (10.26) (т.е. f(x(t—-1), u(t)) = «(/), см. (10.14)) с начальным состоянием х(0)=0, где *(/), u(t) — скаляры (т.е. п = г=1). В качестве области управления V (см. (8.27)) возьмем отрезок [—1^ 1]. Для этого дискретного объекта рассмотрим основную задачу (т. е. задачу со свободным правым концом и без ограничений на фазовые координаты) в смысле максимума функционала (10.11), где /о(д.(*_1), и(0) = И0)2-2(*(/--1))2. (10.27) Согласно дискретному принципу максимума введем вспомогательные переменные ψ0, г^, где ψ0=1· Функция Η (см. (10.15)) здесь имеет вид Я ОНО, *·('-!). "(')) = - Ψο/° (х (/ — 1)э α (/)) + ψ, (/) fl (x (t - 1), и (t)) - - (α (Ζ))2 — 2(д: (/— 1))2+ ψ, (/) и (f), (10.28) и потому система соотношений (10.12) записывается в следующей форме: ♦.«-О-^^^^-'Ь''^»—4x(f-l). (10.29) Рассмотрим теперь для этого дискретного объекта процесс а(1)-и(2)- ... -и(ЛГ-1)-0, и(Л0-1, *(0) = *(1) = ... — *(#-1) —0, *(Л0 —1 ' (очевидно, что соотношению (10.26) этот процесс удовлетворяет). Для этого процесса в силу (10.10) и (10.29) находим *i(iV)-*i(Af-l)- ... -*ι(2)-*ι(1)-0. (10.31) Из (10.26), (10.27) находим (для любого допустимого процесса) / = И1))2 + («(2))2+ ... +(ιι(Ν)Υ-2(χ(1)Υ-.2(χ(2)Υ- ... ...-2{χ(Ν- Ι))2 - (и (Ν))2 - (и (I))2 - (и (2))2 ... — («(Л^— 1))2<(и(Л^))2< 1. В то же время для процесса (10.30) мы имеем, очевидно, / = I, т.е. процесс (10.30) является оптимальным. Однако условие максимума (10.13) для этого процесса при /= 1, ..., N—1 не выполняется (см. (10.28), (10.30), (10.31)): Я(ф(/), х(/-1), α(/))«= 0, J=l, 2, .... tf-1; max // (ψ (0, x(t — 1), и) = max и7 = 1. не/ us/
78 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [10 Таким образом, для этого оптимального процесса необходимое условие, указанное в дискретном принципе максимума, не выполняется. Этот пример показывает, что в той формулировке, которая приведена выше, дискретный принцип максимума места не имеет. Пример 10.4. Будем рассматривать тот же дискретный объект, что и в предыдущем примере, но изменим знак у функционала /: /° (х (t - 1), и (0) = 2 (х (t - I))2 - и {t)f. (10.32) Тогда соотношения (10.28), (10.29) примут вид Η (ψ (0, x{t-l).u (t)) - 2 {χ (t- Ι))2 - (и (О)2 + *ι (<) и (f), ψ^/ — 1) = 4*(/-1). Поэтому для процесса ы(1) = ... =и(ЛО = 0, лг(0) = д:(1)= ... =χ(Ν) = 0 (10.33) справедливо соотношение (10.31). Выполняется для процесса (10.33) и соотношение максимума (при всех t= 1, ..., Ν): max#(♦(*), *(f—1), u),= max(--tf2)===0 = tf(i|)(0, *(f—1),и(/)). Однако процесс (10.33) оптимальным не является: для него функционал / (см. (10.32)) принимает значение 0, в то время как, например, для процесса и(1)=1, α(2)— ... =и(Л0 = 0; *(1)=1, х(0) = х(2)= ... =i(A0 = O- имеем /== 1. Таким образом, дискретный принциц максимума не является и достаточным условием оптимальности. Итак, в отличие от «непрерывного» случая, дискретный принцип максимума не дает в общем случае ни необходимого, ни достаточного условия оптимальности. Однако большая популярность принципа максимума Л. С. Понтрягина, представляющего собой удобное и широко применяемое необходимое условие оптимальности для непрерывных управляемых процессов, направляли усилия исследователей на получение и для дискретных процессов условий оптимальности в форме принципа максимума. Во-первых, удалось доказать дискретный принцип максимума, ограничивая класс рассматриваемых дискретных управляемых объектов. Первой в этом направлении была работа Л. И. Ро- зоноэра*), который доказал, что в случае основной задачи *) Л. И. Ρ о з о н о э р, Принцип максимума Л. С. Понтрягина в теории оптимальных систем, III, Автоматика и телемеханика 20, № 12 (1959).
1U § 3. МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 79 для дискретных объектов, линейных по фазовым координатам, дискретный принцип максимума справедлив — как необходимое и достаточное условие оптимальности. Во-вторых, для дискретных управляемых объектов общего вида были установлены теоремы, получающиеся некоторым уточнением или видоизменением указанной выше формулировки дискретного принципа максимума. Формулировка принципа максимума для дискретных систем, обладающих определенной выпуклой структурой, приведена в работе А. И. Пропоя *), однако его доказательство содержит пробел. Корректные доказательства даны X. Халкиным, И. Хольтцманом и другими авторами**). В работе Р. Габасова и Φ. Μ. Кирилловой ***) был введен принцип квазимаксимума, устанавливающий связь между «непрерывным» и «дискретным» прицципом максимума. Таким образом, дискретный принцип максимума, несмотря на первоначально некорректную его формулировку, ознаменовал собой одно из стержневых направлений исследования в теории оптимального управления дискретными системами. 11. Идеи математического программирования. В этом пункте мы кратко охарактеризуем еще одну группу результатов, частично примыкающих к дискретному принципу максимума и также позволяющих получить информацию об оптимальных процессах в дискретных объектах. Речь идет о методах решения задачи математического программирования, сформулированной в п. 7. Начнем с напоминания некоторых классических понятий математического анализа. Пусть f(z) = f(zl, ..., ζη) — некоторая функция, заданная в пространстве Еп и являющаяся гладкой, т.е. имеющая непрерывные производные. dzl ' dz2 ' ' * *' дгп ' у 1 ' Таким образом, в каждой точке z0 определены η чисел (11.1); вектор, имеющий эти числа своими координатами, называется *) А. И. Пропой, О принципе максимума для дискретных систем управления, Автоматика и телемеханика 26, № 7 (1965). **) В. W. Jordan, Ε. Ρ ο 1 a k, Theory of a class of Discrete Optimal Control Systems, J. Electron and Control 17, 6 (1964); Pearson J., The Discrete Maximum Principle, Int. J. of Control 11, 2 (1965); H. Halkin, A Maximum Principle of the Pontryagin Type for Systems Described by Nonlinear Difference Equations, J. SIAM on Control 4, 1 (1966); Ι. Η ο 11 ζ m a n, H. Halkin, Directional Convexity and the Maximum Principle for Discrete Systems, J. SIAM on Control 4, 2 (1966); M. Canon, С Cullum, E. Po- 1 a k, Constrained Minimization Problem in Finite Dimensional Spaces, J. SIAM on Control 4,3 (1966). ***) P. Г аба сов, Ф. М. Кириллова, К-вопросу о распространении принципа максимума Л. С. Понтрягина на дискретные системы, Автоматика и телемеханика 27, № 11 (1966).
80 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [11 градиентом функции / (в точке z0) и обозначается через grad/(z0): Пусть δζ — произвольный вектор, исходящий из точки z0; конец этого вектора обозначим через ζ. Тогда координаты вектора δζ равны ζ1 — zj, ζ2 — ζ2, ..., ζΛ — ζ J. Будем предполагать, что система координат ζ1, ζ2, ..., ζη в пространстве Еп является пря- моугольной. В таком случае скалярное произведение векторов δζ и gradf(zo) вычисляется следующим образом: 6zgrad/(zo) = _ df fa>) (~\ __ 7\\ ι ^ (*о) /~а _ ~2\ ι ι д/ (ζρ) / „ __ Λν Согласно формуле Тейлора мы имеем где многоточие в конце означает величину более высокого порядка малости, чем расстояние между точками ζ и ζ0 (τ. е. чем длина |6ζ| вектора δζ). Таким образом, f(*)-fte>)«**grad/(z0), (11.2) где δζ — вектор, идущий из точки ζ0 в точку ζ, а равенство (11.2) является приближенным (ошибка является величиной более высокого порядка малости, чем |δζ|). Пусть теперь Λ — некоторая линия, исходящая из точки z0jh а — единичный касательный вектор к этой линии в точке z0 (рис. 30). Тогда для точки ζ, принад- Л лежащей линии Λ и отличной от ζ0, мы можем написать δζ~|δζ|α, (11.3) где δζ —вектор, идущий из точки ζ0 в точку ζ, а равенство является при- Рис. 30. ближенным (ошибка имеет более высокий порядок малости, чем |δζ|). Из (11.2) и (11.3) получаем, что для точки ζ, принадлежащей линии А, справедливо приближенное равенство f(^-/(zo)-|6z|.(agradf(z0)). (11.4) Если скалярное произведение agrad/(z0) отлично от нуля, то правая часть соотношения (11.4) имеет тот же знак, что и произведение agrad/(z0) (ибо |δζ|>0), а потому при достаточно малом |δζ| и левая часть имеет тот же знак (рис. 31),
§ 3. МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 81 поскольку при достаточно малом |6г| отброшенная величина, имеющая более высокий порядок малости, будет меньше, чем f(zh№0)>0 а) Рис. 31. ЩЬЩ) правая часть соотношения (11.4). Итак, справедливо следующее предложение: Теорема 11.1. Пусть Л — линия, исходящая из точки г0 и имеющая в точке z0 касательный вектор а. Предположим, что скалярное произведение α grad/(го) отлично от нуля. Тогда для любой точки г линии Л, отличной от ζ0 и достаточно близкой к г0, разность f(z) —f(zQ) имеет тот же знак, что и скалярное произведение a grad / (г0). Предположим теперь, что в точке z0 функция / обращается в нуль, т.е. точка г0 лежит на гиперповерхности f(z) = 0 (или, иначе, на границе замкнутой области f(z) ^0). Рассмотрим какую-либо линию Л, исходящую из точки г0 и лежащую на гиперповерхности f(z) = 0 (рис. 32). Если а — касательный вектор этой линии в точке г0, то должно быть выполнено соотношение agvadf(zQ) = 0 (ибо f(z) — — f (^о) = 0 для любой точки ζ линии Л, и потому скалярное произведение a grad f(zo) не может быть отличным от нуля; см. теорему 11.1). Иначе говоря, вектор grad/(20) «ортогонален» (в точке го) к любой линии, лежащей на гиперповерхности /(г) = 0, т. е. «ортогонален» гиперповерхности f(z) = 0 в точке го. На этом основании вектор gradf^o) называют нормальным вектором^ гиперповерхности f(z) = 0 в точке г0. Рассмотрим теперь вопрос о расположении линии Л относительно замкнутой области f(z) <; 0. Из теоремы 11.1 непосредственно вытекает следующее предложение. Теорема 11,2. Пусть f(z) — гладкая функция, обращающаяся в нуль в точке г0. Пусть, далее, А —исходящая из точки Рис. 32.
82 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [Л z0 линия, имеющая в точке z0 касательный вектор а. Если agrad/(20) < 0, то найдется такая тонка Ζι&Λ, что дуга линии Λ от точки ζ0 до ζ\ целиком лежит в области f(z)^0, причем эта дуга не имеет с гиперповерхностью f(z) = О других общих точек, кроме z0 (рис. 33). Если же agrad/(z0) > 0, то найдется такая точка Ζ\ е Λ, что дуга линии Λ от точки ζ0 до г\ не имеет с областью f(z) ίζ 0 общих точек, кроме ζ0 (рис. 34). Применим эти соображения к задаче математического программирования. Предположим, что функция F°(z), рассматриваемая на множестве Ω (см. (7.1), (7.2)), достигает максимума Рис. 33. Рис. 34. в точке 20 е Ω. Возьмем произвольную кривую Λ, исходящую из точки 2о и" расположенную в множестве Ω. Тогда для любой точки ζ линии Λ праведливо неравенство F° (z) KF°(z0) (поскольку г0 —точка максимума). Следовательно, для касательного вектора а к линии Λ в точке Zq справедливо неравенство a grad F°(z0) <: 0 (в противном случае, т. е. при выполнении неравенства agradF°(20)> 0, согласно теореме 11.1 мы имели бы для точек кривой Λ, достаточно близких и zq, неравенство F°(z) — F°(z0)> 0,~что невозможно). Итак, справедлива следующая Теорема 11.3. Для того чтобы гладкая функция F0 (ζ), рассматриваемая на множестве Ω, достигала максимума в точке z0 e Ω, необходимо, чтобы для любого вектора а, касающегося в точке Zq некоторой линии Λ cz Ω, было выполнено неравенство agrad Ζ70(г0) < 0. Эта теорема, однако, неудобна для применений, поскольку пока не очень ясно, как искать векторы а, обладающие указанными свойствами (т. е. касающиеся в точке ζ0 линий, расположенных в множестве Ω). По существу, специфика множества Ω (выражающаяся соотношениями (7.1), (7.2)) никак в этой теореме не учитывается. Для уточнения этой теоремы и получения более удобного необходимого условия экстремума мы рассмотрим наиболее простой и наглядный случай η = 2, а затем
n § 3. МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 83 попытаемся сформулировать получающиеся результаты для произвольного п. Именно, рассмотрим случай, когда множество Ω задается на плоскости Е2 переменных г1, ζ2 соотношениями Я (г)-О, (И.5) 8l(z)<09 g2(*)<09 g3(z)<0 (11.6) (рис. 35) и ставится задача о нахождении максимума функции Рис. 35. Рис. 36. F°(z) на множестве Ω. Предположим сначала, что максимум достигается в точке ζ0^Ω, в которой первые два ограничения (11.6) активны (т. е. выполняются равенства §1(г0)=0, g-2(z0)=0), а третье ограничение (11.6) неактивно (т. е. 8 (*о) < 0, см. рис. 36). Векторы grad^feo), gradg2(z0) (11.7) образуют на рис. 36 острый угол между собой, а касательные к линиям g](z) = 0, g2(z) = О в точке z0 (пунктир на рис. 36) образуют тупой угол, стороны которого соответственно перпендикулярны к векторам (11.7). Внутри этого тупого угла и расположено множество Ω, которое на рис. 36 изображено линией, исходящей из точки z0. Обозначим через.α касательный вектор этой линии Ω в точке 20, а через / — прямую, перпендикулярную к вектору а и проходящую через точку zQ. Вектор grad Fl(zQ) (ортогональный линии Ω в точке Zq) направлен по прямой /. Так как для любой точки ζ линии Ω мы имеем F°(z) ^ F°(z0) (ибо z0—-точка максимума), то согласно теореме 11.1 скалярное произведение a grad F°(z0) неположительно. Будем для наглядности считать, что это произведение отрицательно, т. е. вектор grad F° (го)
84 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ ill расположен по другую сторону от прямой /, чем вектор а (см. рис. 36). Иначе говоря, вектор grad F°(z0) расположен в той же полуплоскости, определяемой прямой /, что и векторы (11.7). Следовательно, прямая, параллельная / и проходящая через конец хо вектора grad F°(z0), пересекает биссектрису угла между векторами (11.7) в некоторой точке Х\. Вектор, идущий из точки Хо в точку хи параллелен прямой /, и потому он имеет вид ψι grad/71 (г0), где ψι — некоторое число. Поэтому вектор n = grad^(20) + tigradF1(20) (т. е. вектор, идущий из точки z0 в точку Z\) направлен по биссектрисе угла между векторами (11.7). Следовательно, вектор η образует острые углы с векторами (11.7) и потому я = 0! grad gl (z0) + σ2 grad g2 (z0), где σι и σ2 — положительные числа (см. рис. 36). Приравнивая два найденные выражения для вектора л, мы получаем соотношение, которое можно записать следующим образом: ψ0 grad F° (z0) + Φι grad Я (z0) = = σ{ grad gl (zQ) + σ2 grad g2 (z0) + σ3 grad gz (z0), (1 1.8) где ψο — 1» <?ι ;Ξ> 0, <j2 > 0, σ3 = 0. Итак, имеет место соотношение (11.8),в котором все коэффициенты Οι неотрицательны; что же касается ψο, то вместо ψ0 = 1 достаточно написать ψο > 0, так как при умножении всех коэффициентов ψο, ψι, σι, σ2, аз на один и тот же положительный множитель вид соотношения (11.8) и знаки коэффициентов не меняются. Заметим еще, что справедливы соотношения σ^ι(ζο) = 09 σ2£2(ζ0)^=0, σ3£3(ζ0) = 0, (11.9) так как £ί(ζ0) = 0, g2(z0) = 0, σ3 = 0. Аналогичное утверждение справедливо и в случае, когда имеется не два, а иное число активных в точке ζ$ ограничений. Пусть, например, максимум функции F°(z) на множестве Ω достигается в точке г0, в которой активным является только третье ограничение (11.6), т. е. &(г0) < 0, g2(z0) < Q, £3(г0) =0 (рис. 37). Множество Ω изображено на рис. 37 жирным участком линии, исходящей из точки Ζο. Обозначим через а касательный вектор этой линии в точке г0, а через / — прямую, перпендикулярную к вектору а и проходящую через точку г0. Вектор grad Fl(zQ) (ортогональный линии Ω в точке г0) направлен по прямой I. Как и в предыдущем случае, скалярное произведение a grad Ζ70 (го) неположительно. Скалярное произведение ogradg3(^o) в силу теоремы 11.2 также неположительно (ибо
И] § 3 МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 85 gradF°(z0), gradg3(z0) прямой /, чем вектор а А линия Ω, исходящая из точки z0, лежит целиком в области g3 (z) ^.0). Будем считать, для наглядности, что эти произведения отрицательны, т. е. векторы расположены по другую сторону от (см. рис. 37). Следовательно, найдется такое положительное число аз, что концы векторов gradF°(z0), a3gradg3(z0) расположены на одной прямой, параллельной /, и потому вектор σ3 grad g3 (z0) — grad F° (z0) параллелен /, т. е. пропорционален вектору gradF^Zo): σ3 grad g3 (z0) — grad F° (z0) = = ψ, grad Fl (z0). Но это означает, что и в этом, случае справедливы соотношения {11.8), (11.9) (где теперь ψ0 = 1, аз ί> Ο, σι = θ2 = 0). Итак, если функция F0(ζ), рассматриваемая на множестве Ω (см. (П.5), (11.6)), достигает максимума в точке z0 e Ω, то су- ществуют такие числа ψο, ψι, хотя бы одно из которых отлично от нуля, и такие неотрицательные числа σι, σ2, σ3, что ψ0^0 и справедливы соотношения (11.8), (11.9). (Мы в этой формулировке написали ψ0 ^ 0, а не ψ0 >* 0, так как мы не учли некоторые «крайние» возможности; например, если agradg3(z0) = 0, то рис. 37 принимает вид, показанный на рис. 38, и соотношение (11.8) принимает вид ψι gradf^Zo) = = a3.gradg3(z0), т. е. здесь ψ0 = - 0, ψι Φ 0.) Мы проследили (да и то не полностью) лишь случай, когда п=2 и k=l (ср. (7.1) и (11.5)). Однако характер полученного результата делает правдоподобной следующую теорему: 11.4. Пусть F°(z)—гладкая функция, заданная Ω, определяемом системой' соотношений (7.1), (7.2). Длч того чтобы функция F°(z), рассматриваемая на множестве Ω, достигала максимума в точке z0 e Ω, необходимо. Теорем а на множестве
86 ГЛ. Ϊ. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ \\\ существование таких чисел ψ0, ψι, ..., ψ&> ви ·-·> o8, хотя бы одно из которых отлично от нуля, что числа ψο, Oir- · ·, о8 неотрицательны и выполнены соотношения k s 2al)igradF'(2o)=Sa/gradg/(2o), (НЛО) o{gl (го) - *2g2 («о) = · · ■ = Ъ? (*α) = 0· (11-11) Эта теорема действительно имеет место. Доказательство этой теоремы мы приведем в главе IV, а пока ограничимся сказанным. Замечание 11.5. В том частном случае, когда ограничений (7.2) (а значит, и чисел а) нет совсем, соотношение (11.10) принимает вид: S*,grad/"(2b)-0. (11.12) Таким образом, для того чтобы функция F0(z)t рассматриваемая на множестве Ω, определяемом уравнениями Fl (ζ) = 0, ... ..., Fh (z) = 0, достигала максимума (или вообще экстремума) в точке Ζο^Ω, необходимо существование таких чис'ел ψ0, ψι. ..., ψ&, яогя бь* одяо из которых отлично от нуля, что имеет место соотношение (11.12). Это — классическая теорема Лагранжа об условном экстремуме. Теорема 11.4 является ее обобщением. Пример 11.6. В качестве примера решим задачу о максимуме произведения, рассмотренную в примере 1.1. Речь идет о нахождении максимума функции F>(z) = zlz2 ... г"9 (11.13) рассматриваемой на множестве Ω, определяемом неравенствами ζι>0, ζ2>0, ..., *">(), ζι+ζ2+ ... + z"^a. (11.14) Таким образом, равенств (7.1) в определении множества Ω нет совсем, а имеются лишь неравенства, которые можно записать в виде -ζ^Ο, ..., -2*<0f zl+ ... + ζ*-α<0, т. е. в виде (7.2), где gi(z) = -z*, ..., g"(z) = -z", gW(z) = z*+ ... +2*-a (так что в данном случае s = N + 1). Пусть в точке 206Ω функция (11.13) достигает максимума. Тогда согласно теореме 11.4 существуют такие неотрицательные числа ψο, σι, ..., ajv+i, не все равные нулю, что
Ill § 3. МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 87 справедливы соотношения r лч-ι i|)ogradF0(^o) = 2 c7/gradg/(z0), (11-15) σ/*'(2ο) = 0, 7 — 1, 2, ..., N+l. (11.16) Заметим, что в точке 20 = (zJ, г% ..., ζ%) ни одна из координат ζι0, ζ\, ..., ζξ в нуль не обращается, так как иначе мы имели бы F°(z0) = 0 (см. (11.13)), а это, очевидно, максимума функции Ρ (ζ) не дает. Итак, ζι0 > 0, ..., ζ$ > О, и потому g'^oXO, ..., £"(*<>)< 0. Из (11.16) вытекает теперь, что σ1=σ2 = ... =σΛ/ = 0, и потому соотношение (11.15) принимает вид Ψο grad F° (z0) = <*;v+i grad g"*1 (*0); ψ0 > 0, аы+1 >0, т. е. <^° fro) _ ^ d^*1 (*o) __ Ψθ ^ — σΛΓ + 1 ~i ==(TW + l> '— 1» ·-·. Ν. dF(z0) zo'zl· ·■· ·** , Но производная ——-^, очевидно, равна -t (так как дг z0 ζι0 φ 0). Таким образом, 1 = σ^+ι, ί—ι, ..., TV. 4 Отсюда следует, что σΝ+χ Φ 0 (так как все числа zlQ9 ζ\, ..., ζ% отличны от нуля) и все числа ζι0> ..., ζξ равны между собой: 2i_22_ =2/vLlo-4-4· <сп — .сЛ — . . . — <сЛ — Но так как αΝ+ι φ 0, то из (11.16) получаем, что Я"+'(г0) = 0, т.е. г'+22+ ... +^-а = 0. Следовательно, *«=** = ... =г0" = £. (11.17) Итак, максимум функции (11.13) при ограничениях (11.14) может достигаться только в точке (11.17). Но множество Ω, определяемое в пространстве ΕΝ неравенствами (11.14), является замкнутым и ограниченным. Поэтому непрерывная функция (11.13), заданная на этом множестве, обязательно должна достигать максимума хотя бы в одной точке множества Ω. Следовательно, точка (11.17) действительно является точкой
88 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [11 максимума функции F0(ζ), притом единственной точкой максимума. Теор'емы 11.3 и 11.4, сформулированные выше, дают возможность получить необходимые условия оптимальности для дискретных управляемых объектов. В самом деле, как мы видели в п. 6, задача оптимального управления дискретными системами сводится к задаче об экстремуме функции, рассматриваемой на некотором подмножестве евклидова пространства, а необходимые условия экстремума для таких функций и были рассмотрены в этом пункте. Мы, однако, не будем сейчас формулировать все получаемые таким образом условия оптимальности, а ограничимся лишь одним примером, а именно, применением теоремы 11.4 к основной задаче, рассмотренной в предыдущем пункте (стр. 69). При этом мы предположим, что область управления V задается в пространстве переменных и\ ..., иг системой неравенств gl(u\ ..., иг)<0, ёЦиК ..., и'ХО, ...,, gl\u\ ..., И<0. (11.18) Переходя к переменным и\, xls, как в п. 10, переформулируем эту задачу как задачу нахождения максимума :функции (10.18) на множестве Ω, определяемом системой соотношений (10.16), (10.17). При этом согласно (11.18) соотношения (10.16) можно в рассматриваемом случае записать следующим образом: g>("b А "ϊ)<°; /=ь ···.'; '=1· ···■ Ν·. (11Л9) Итак, перед нами стоит задача о максимуме функции (10.18) на множестве Ω, определяемом системой равенств (10.17) и неравенств (11.19). Пусть эта функция (рассматриваемая на множестве Ω) достигает максимума в точке г0ЕЙ. Тогда согласно теореме 11.4 существуют такие числа ψ0, ψ^ (где i = 1, ..., п\ t = 1, ..., Ν) и такие неотрицательные числа σ* (где /= 1, ..., /; /=1, ... ...,Л0, что Ν η Ν Ι ψ0 grad F (z0) + Σ Σ V, grad FJ (z0) = Σ Σ <*', grad g>s (z0). (11.20) s—ι /—i s=i /=i σ/*Ι(*ο)-°; /=1, ...,/; *«1, ..., Ν9 (11.21) где через g\(z) обозначена функция gHu1, ..., иг), в которую в качестве аргументов подставлены и\, ..., urv т. е. g\{z) = = §/(%(г)). Соотношение (11.20) означает, что функция ' №(ζ) + Σ Σψ№-Σ Σο^Κζ) (11.22)
II] § 3. МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ S9 имеет в точке z0 нулевые производные по всем аргументам, т. е. по w|, х\. Прежде всего запишем равенство нулю частных производных по переменным х\. Так как функции g[(z) от этих переменных не зависят, то, учитывая (10.20), мы сможем результат дифференцирования функции (11.22) по переменной х\_х записать следующим образом: / Ψο dxi Τι' Э*1 ~~ ' /=1, ..., п\ t = 2, ..., Ν, (11.23) а результат дифференцирования по χιΝ записать в виде -i|>f = 0, /=1, ..., п. (11.24) Займемся далее производными по переменным и\. Приравнивая нулю производную функции (11.22) по и\ в точке г0, получаем (в силу (10.18), (10.19) и определения функций g!s(z)): df° ft-i (*о)> 4, (*0)) , yi *f (ξ,,, fa), η, (ζ0)) 40 да* ^Ψ dul ** 1 ди1 /-ι т. е. L· I диг ' *—I, ..., Г, Г—1, ..., TV, grad. (Д ψ}// (ξίβ1 (ζ0), η, (z0))j = S σ) grad g/ (η, (z0)), (11.25) *=1, ..., N. Фиксируем теперь некоторое число t (=1, ..., Ν). Точка η, (2ο) принадлежит множеству V (см. (8.27)). Будем, для определенности, считать, что в точке r\t(z0) первые * неравенств (11.18) являются активными (т. е. обращаются в равенства), а остальные неактивны: ^(%Ы)=0, ..., gft(%(*o)H(), g*+l(rb(z0))<0, .... g'M*o))<0. Иначе говоря, g}(z0) = 0, ..., g?(z0) = 0, g*+'(2o)<0, ..., g'(2o)<0· Из этих соотношений вытекает, в силу (11.21), что σ<+1= ··· -σϊ = 0. (11.26)
90 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ [И Пусть теперь а — вектор, исходящий (в пространстве переменных и\ ..., ит) из точки r)t(zo) и касающийся некоторой линии, лежащей в множестве V (рис. 39), т. е. имеющий неположительное скалярное произведение с каждым из векторов grad gl (η, (zQ))9 . . ., grad gk (η, (ζ0)), которые мы теперь будем считать линейно независимыми. Учитывая соотношения (11.26) и неравенства 0J^O, мы получаем отсюда, что скалярное произведение вектора а на вектор, стоящий в правой части соотношения (11.25), неположительно. Следовательно, * grad„ X х(2*^(6м(^л,(го)))<о. Но это означает, что производная функции Σ^/'β-ιΟ2). %(ζ)) (11.27) в точке £0 по направлению, определяемому вектором я, неполог жительна. Итак, если функция (10.18), рассматриваемая на множестве Ω, достигает в точке Zo максимума, то существуют такие константы ψ0^0, ψ{ (i = 0, 1, ..., η; t = 1, ..., Ν), что выполнены соотношения (11.23), (11.24) и при каждом t функция (11.27) имеет в точке z0 неположительную производную по любому направлению, входящему (в точке r\t(zo)) в множество V. Заметим, наконец, что ψο Φ 0; в противном случае из (10.23), (10.24) мы последовательно получили бы, 4τοψ^~Ι=0, Ψ^~2 = 0, ···» Ψ{ = 0 (i=l, ..., n), т. е. все константы ψ0, ψί были бы равны нулю, что невозможно (см. (11.20)). Таким образом, ψο > 0. Поскольку во все соотношения (11.23), (11.24), (11.27) константы ψ0, ^\ входят однородно (т. е. при умножении всех этих констант на один и тот же множитель k > 0 справедливость высказанных условий не нарушается), мы можем считать, что ψ0 = 1. Теперь переформулируем полученный результат в терминах дискретных управляемых процессов, т. е. заменим It (ζ) на x(t), далее, заменим η*(ζ) на u(t) и, наконец, заменим ψ| на ψ2·(0. Тогда, очевидно, соотношения (11.23), (11.24) превратятся в (10.12), (10.10), а функция (11.27) превратится в grotyffc<$/ <?"k/s& Ф&дщщ» Рис. 39.
§ 3. МЕТОДЫ РЕШЕНИЯ ЗАДАЧ ДИСКРЕТНОЙ ОПТИМИЗАЦИИ 9И #(ψ(/), x(t— 1),"(0)· Таким образом, мы получаем следующую теорему *): Теорема 11.7. Имеется объект (10.14) с областью управления V (см. 8.27)). В каждой точке «еУ градиенты активных неравенств (11.18) предполагаются линейно независимыми. Рассматривается основная задача (со свободным правым концом и без ограничений на фазовые координаты) с начальным уело- вием х(0) — уо (см. (8.28)), причем оптимальность понимается в смысле максимума функционала (10.11). Для решения этой задачи введем вспомогательные переменные ψο, ψι» ..., ψη {здесь η — число фазовых переменных χ1, ..., хп) и с их помощью составим следующую вспомогательную функцию: η Я (ψ, χ, α)—Σψ/(*. и); где f° — функция, участвующая в определении функционала (10.11), a f\ ..., fn — компоненты вектор-функции да:, и), стоящей в правой части уравнения (10.14). Далее, напишем систему соотношений (10.12) для вспомогательных неизвестных и положим ψο = 1 (см. (10.9)). Пусть теперь u(t), t = 1, ..., Ν, — некоторое допустимое (т. е. удовлетворяющее включению u(t)& V для всех t = 1, ... ..., Ν) управление, a x(t), t = 0, 1, ..., Ν, — соответствующая (т. е. удовлетворяющая соотношению (10.14)) траектория, исходящая из точки *(0)= уо. Подставим функции x=x(t), u=u(t) в правые части соотношений (10.12); тогда, используя соотношения (10.9), (10.10), мы сможем последовательно найти ψ(Λ/-1),ψ(Λί-2),...,ψ(1). Если процесс u(t), x(t) оптимален, т. е. придает максимум функционалу (10.11), то для каждого t = 1, ..., N функция H(ty(t),x(t—\)>и) имеет в точке u = u(t) неположительную производную по любому направлению, входящему (в точке u(t)) в множество V. Если оптимальность понимается в смысле минимума (а не максимума) функционала (10.11), то формулировка остается той же, только соотношение (10.9) принимает вид Ψοβ—1. Теорема 11.7 представляет собой корректно доказанное (правда, со ссылкой на теорему 11.4) необходимое условие оптимальности. *) Условия оптимальности такого типа (состоящие в неположительности производной функции Я (ψ, χ, и) по любому допустимому направлению) содержатся в работах А. И. Пропоя и других авторов (см. сноски*) и **) на стр. 79).
92 ГЛ. I. ПОСТАНОВКИ ЗАДАЧ И ХАРАКТЕР РЕЗУЛЬТАТОВ. (П Интересно сравнить эту теорему с дискретным принципом максимума (стр. 69). Если бы производная функции H($(t),x(t—l)9u) в точке u = u(t) по любому направлению, входящему в множество V, была не только неположительной (как утверждается в теореме 11.7), а отрицательной, то это означало бы, что в некоторой окрестности точки u(t) функция //(ψ(/), x(t—l),u) убывает при смещении из точки u(t) в любом направлении (не выходя из множества V). Иначе говоря, это означало бы, что функция #(ψ(/), x(t — 1),ы) переменной и е V достигает в точке u(t) локального максимума Рис. 40. (рис. 40). Таким образом, даже если условие неположительности производных, содержащееся в теореме 11.7, несколько усилить (заменив его условием отрицательности производных), мы придем к условию локального максимума функции H(ty(t),x(t—l),u) переменной и б|/ в точке u(t)t значительно более слабому, чем условие абсолютного максимума этой функции, содержащееся в дискретном принципе максимума. Мы видим, что необходимое условие, содержащееся в теореме 11.7, является значительно более слабым, чем необходимое условие, указанное в дискретном принципе максимума. Взамен этого теорема 11.7 оказывается общей, в то время как дискретный принцип максимума применим лишь для узкого класса дискретных управляемых объектов. Отметим, что в примере 10.3 необходимое условие, указанное в теореме 11.7, для процесса (10.30), как легко проверить, выполняется (тогда как необходимое условие, содержащееся в дискретном принципе максимума, не выполняется).
ГЛАВА II ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ § 4. Векторное пространство 12. Определение векторного пространства. Множество R называется векторным пространством, если в нем определены две операции, удовлетворяющие перечисляемым ниже двум группам аксиом. Элементы множества R называются векторами; мы их будем обозначать жирными строчными буквами. Чтобы указать, что вектор а принадлежит пространству R (т. е. является его элементом), пишут αεί, Первая из двух операций, заданных в векторном пространстве, называется сложением векторов. Каждым двум векторам ае/?( b^R эта операция сопоставляет вектор (того же пространства), называемый суммой векторов а и Ь и обозначаемый через а + Ь. Вторая операция называется умножением вектора на число. Каждому вектору ае/? и каждому действительному числу λ эта операция сопоставляет некоторый вектор (того же пространства), называемый произведением вектора а на число λ и обозначаемый через λα. Далее, под равенством двух векторов мы всегда будем понимать их совпадение. Наконец, аксиомы (при выполнении которых множество R с заданными в нем двумя операциями указанного типа называется векторным пространством) формулируются следующим образом; I группа: аксиомы сложения векторов. \х. Сложение векторов коммутативно, т. е. для любых двух векторов ug/?, b^R справедливо соотношение a + b = b +а. 12. Сложение векторов ассоциативно, т. е. для любых трех векторов оей, бе/?, с е R справедливо соотношение (а + Ь) + с = а + (Ь + с). 13. В множестве R существует такой элемент, называемый нулевым вектором (или просто нулем) и обозначаемый символом О, что для любого вектора a^R справедливо соотношение α + 0 = α.
94 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ fl2 14. Для любого элемента ае R найдется в R такой элемент, называемый противоположным вектору а и обозначаемый символом — а, что а + (—а) = 0. II группа: аксиомы умножения вектора на число. Нь Умножение векторов на числа ассоциативно, т. е. для любого вектора a^R и любых двух действительных чисел λ, μ справедливо соотношение λ (μα) = (λμ) α. ΙΙ2. Умножение векторов на числа дистрибутивно по отношению к числам, т\ е. для любого вектора a^R и любых двух действительных чисел %, μ справедливо соотношение {λ + μ)α = λα + μα. Из. Умножение векторов на числа дистрибутивно по отношению к векторам, т. е. для любых векторов ае R, Ь ей и любого действительного числа'% справедливо соотношение % (а + Ь) = λα + λ*. Н4. Для любого вектора а<=/? справедливо соотношение 1а = а. Приведем два примера векторных пространств. Пример 12.1. Фиксируем на плоскости Я некоторую точку О и будем называть вектором произвольную точку плоскости Π (отличную от точки О или совпадающую с ней). Если А и В— два произвольных вектора (т. е. две точки плоскости #), то их суммой А 4- В будем называть такую точку С, что середина отрезка ОС совпадает с серединой отрезка АВ (рис. 41), (Таким образом, если точки О, А и В не лежат на одной прямой, то а) Рис. 41 ОАСВ — параллелограмм.) Далее, пусть А—произвольный вектор и λ — действительное число. Если точка А не совпадает с О и λ > 0, то произведением %А будем называть такую точку D луча ОА, что -qJ- = K если точка А не совпадает с О и λ < 0, то произведением КА будем называть такую точку D, лежащую на
12] § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 95 продолжении луча О А за точку О, что -qx=— λ (рис. 42); в остальных случаях (т. е. если А совпадает с О или если λ = 0) будем считать λΑ = 0. При таком определении векторов и действий над ними множество всех точек плоскости Я становится векторным пространством. Нулевым элементом этого векторного пространства Рис. 42. является точка О; далее, если А—произвольный вектор, то противоположный вектор—А представляет собой точку, симметричную точке А относительно О (рис. 43). На практике при рассмотрении этого векторного пространства обычно на чертежах изображают векторы не точками Л, В9 С,... плоскости Я, а направленными отрезками («радиусами-векторами») ОА9 05, ОС,...,идущими из точки О к соответствующим точкам (рис.44). Совершенно таким же образом мы можем получить векторное пространство, если фиксируем точку О в обычном трехмерном В οΰ Рис. 43. Рис. 44. пространстве Σ (известном из школьного курса геометрии) и будем считать вектором произвольную точку А (или направленный отрезок ОА) пространства, а операции определим так же, как и выше. Эта «геометрическая модель» векторного пространства служит основным источником геометрической интуиции и служит
$6 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [12 для «зрительной» геометрической интерпретации фактов, имеющих место в различных векторных пространствах. Пример 12.2. Выберем некоторое натуральное число η и будем называть вектором произвольную последовательность {х\ ..., *"}, состоящую из η действительных чисел. Сумму векторов и произведение вектора на число определим формулами: {х\ ..., хп} + {у\ ..., уп) = {х1 + у1, ..., хп + уп)\ λ{χ\ ..., χη} = {λχ\ . .., λχη}. Несложно проверяется, что эти векторы и определенные над ними операции удовлетворяют всем аксиомам векторного пространства. Это векторное пространство называется п-мерным арифметическим векторным пространством. Перейдем к рассмотрению простейших фактов, вытекающих из аксиом векторного пространства. Теорема 12.3. Для любых двух векторов а е /?, b e R уравнение α-\· χ = b всегда имеет решение и притом только одно. Доказательство. Чтобы доказать существование решения, проверим, что вектор χ = (—а) + Ь является решением этого уравнения. В самом деле, подставляй это значение в левую часть, мы находим, последовательно применяя аксиомы Ь, Ι4, Ιι, 1з: а + х = а + ((-а) + Ь) = (а + (-а)) + Ь = 0 + Ь = Ь + 0 = Ь. Таким образом, существование решения доказано. Установим теперь единственность. Пусть х\ и х2 — два решения'заданного уравнения, т. е. справедливы равенства а + *ι = 6, й + *2 = Ь, и потому а + хх =α + *2· Здесь (по смыслу понятия «равенство») слева и справа стоит одинитотже вектор. Прибавляя этот вектор к вектору (—а), получаем (- а) + (а + х,) = (- α) + (α + *2), или, согласно аксиоме Ь, ((— а) + α) + χι — ((— а) + а) + х2\ далее, согласно аксиоме 1ь {а + (— а)) + *, = (а + (- а)) + х2, и потому (аксиома 14) 0 + *1=0 + *2,
jty § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО Q? или, иначе, в силу аксиомы 1ь хг + 0 = *2 + 0; наконец, из аксиомы 1з отсюда следует Х\ = *2. Из теоремы 12.3 вытекает, в частности, единственность нуля. В самом деле, предположим, что в векторном пространстве R имеется, кроме нулевого элемента 0, еще один элемент О7, обладающий аналогичными свойствами (и, в частности, обладающий свойством, указанным в аксиоме 13, т. е. a -f О7 = а для любого a^R). Тогда оба вектора 0,0' являются решениями уравнения а + χ = а, и потому в силу теоремы 12.3, они совпадают: 0 = 0'ь Из теоремы 12.3 вытекает также справедливость равенств 0а = 0, (-1)а = -а (12.1) для любого вектора а. В самом деле, применяя последовательно аксиомы II4, 1U, Н4, находим α = Ια = (1 + 0) α = Ια + θα = α + θα. Таким образом, а + θα = α, т. е. вектор χ = θα является решением уравнения а-\-х=а. Вектор 0 также является решением этого уравнения (аксиома 1з). Отсюда в силу единственности (теорема 12.3) вытекает, что θα = 0. Далее, применяя последовательно аксиомы П4, И2 и уже доказанное первое из равенств (12.1), находим α + (--ΐ)α=1α + (-1)α = (1+(-1))α = 0α = 0. Следовательно, вектор χ = (—1)α является решением уравнения а + х = 0. Вектор —α также является решением этого уравнения (аксиома Ι4). Отсюда в силу единственности (теорема 12.3) вытекает, что (—1)а = —а. Мы столь подробно провели эти рассуждения, чтобы показать, как работают аксиомы. В дальнейшем рассуждения будут более схематичны. Операция вычитания задается в векторном пространстве, по определению, равенством α-& = α+ (-&), (12.2) С помощью этой операции теорема 12.3 (с учетом ее доказательства) может быть сформулирована следующим образом: уравнение а + χ = Ь для любых векторов а, Ь имеет единственное решение χ = Ь — а. Иными словами, соотношения а + с = 6ис = = 6 — а означают одно и то же. Несколько векторов, соединенных последовательно знаками "+ и —, образуют алгебраическую сумму векторов. По определению, действия в алгебраической сумме выполняются
9S ГЛ. И. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИЙ [12 последовательно. Например, а — Ь — с + d = ((α — 6) — с) + d\ — а + Ъ — с = ((— а) + Ь) — с, и т. п. Из определения операции вычитания и аксиом Ij, I2 вытекает, что при вычислении алгебраической суммы можно производить действия в любом порядке (учитывая стоящие перед векторами знаки); например, a — b+c--d-{-e = a + c + e — 6 — d = = — b + e — d + a + c и т. д. Далее, из аксиом lb, Из и второго равенства (12.1) вытекают обычные правила действий типа: α (а — Ь + с) = аа — аЬ + ас; (а + β — ν)α = аа + βα — γα; — (а — 6 + с) = -г- а + 6 — с; (а — β) (а — 6 + с) = аа — βα — а& + β& + ас — β<? (где α, β, γ — произвольные действительные числа, а, 6, с — произвольные векторы) и т. п. Отметим еще правила действий с векторными равенствами. Как мы отмечали, соотношения а-\~с = b и с = Ь —а означают одно и то же. Иными словами, слагаемое можно перенести в другую часть векторного равенства, изменив стоящий перед этим слагаемым знак на противоположный. Правило это сохраняет силу и в том случае, если в обеих частях равенства стоят алгебраические суммы векторов. Например, равенство а —Ь+c=d—e имеет место в том и только в том случае, если справедливо соотношение a + c + e = b + d. Далее, обе части векторного равенства можно умножить на любое действительное число и можно разделить на одно и то же отличное от нуля действительное число (деление на число α φ О сводится к умножению на —J. Например, при α φ О равенство а+Ь=с~d+e имеет место в том и только в том случае, если aa + ab = (xe — ad + ae.
13j § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 99 Из сказанного, в частности, следует, что векторное уравнение ах = а имеет при α φ О единственное решение χ = — а. Иными словами, в отношении операций сложения и вычитания векторов, операции умножения вектора на число и в отношении правил действий с равенствами сохраняются в векторных пространствах все те свойства, которые известны для действительных чисел. 13. Размерность и базис. Определение 13.1. Пусть аь ..., ak — векторы векторного пространства Я и αϊ, ..., α* — действительные числа. Вектор ахах+ ... +ahah (13.1) называется линейной комбинацией векторов аи ..., ak с коэффициентами αϊ, ..., α^. Определение 13.2. Векторы аь ..., uh векторного пространства R называются линейно зависимыми, если существуют такие действительные числа аь ..., а*, хотя бы одно из которых отлично от нуля, что αιαι + ... + α&α& = 0. Этому определению часто придают другую форму. Именно, линейную комбинацию (13.1) называют нетривиальной, если хотя бы один из коэффициентов аь ..., а& отличен от нуля. Определение 13.2 может быть теперь сформулировано следующим образом: векторы аи ..., ak называются линейно зависимыми, если существует нетривиальная линейная комбинация этих векторов, равная нулевому вектору. Далее, векторы ah ..., α* называются линейно независимыми, если они не являются линейно зависимыми, т. е. если никакая их нетривиальная линейная комбинация не обращается в нуль. Нередко выражение «линейно независимые векторы» заменяют равнозначным выражением «линейно независимая система векторов». Из этого определения следует, что если векторы аи ..., ай линейно независимы, то из справедливости равенства Щ*\+ ··· + «*«* = β вытекает αϊ = ... = α& = 0. Теорема 13.3. Пусть а{, ..., ak — линейно независимые векторы. Если векторы Ь,аи ..., аи линейно зависимы, то вектор Ь представляется в виде линейной комбинации векторов аи ..., ahi т. е. существуют такие действительные числа λι, ..., λ*, что Ъ = Х{ах + ... +hkak. Доказательство. Так как векторы Ь, аи ..., ak линейно зависимы, то найдутся такие числа β, щ, ..., а^, хотя бы одно из
100 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [13 которых отлично от нуля, что β& + а,а{ + ;.. + акак = 0. (13.2) Если положить β = 0, то соотношение (13.2) принимает вид а{а{+ ... + акак = 0, и потому из линейной независимости векторов аь ..., ак вытекает, что αϊ = ... = ак = 0. Но это противоречит тому, что среди чисел β, ось ·. ·, ак имеется хотя бы одно отличное от нуля. Следовательно, β Φ 0. Теперь из (13.2) мы получаем - αϊ α& & = — Κξ-*ι— ··· —-fa*> или Ь = λ^ι + ... + λΛαΛ, где λ, == — α//β, /=1, ..., k. Теорема 13.4. Пусть Ьи ..., Ьку с — линейно независимая система векторов. Пусть, далее, ак+и . ·., я?п (tn ^ k -f- 1) — га/ше векторы, что система векторов Ьи ..., Ьк, ак+и ..., ат (13.3) также является линейно независимой. Тогда из ак+и ..., am можно выбрать такой вектор а89 что если в системе (13.3) заменить а8 вектором су то полученная система векторов будет линейно независимой. Доказательство. Добавим вектор с к системе векторов (13.3). Если получившаяся система векторов Ъи ..., Ьк, ак+и ..., ат, с (13.4) окажется линейно независимой, то в системе векторов (13.3) любо й из векторов ак+и ..., ат можно будет заменить вектором с, и мы получим линейно независимую систему. Пусть теперь система векторов (13.4) является линейно зависимой. Тогда по теореме 13.3 вектор с является линейной комбинацией векторов (13.3) ^ * = βι*ι + ... + fah + ак+{ак+1 + ... +атат. (13.5) Если бы все коэффициенты ал+ь ..., ат были равны нулю, то это соотношение можно было бы переписать в виде с-β,»,- ... -βΛ»Λ = 0, а это противоречит линейной независимости векторов Ьи ..., Ьк, с. Следовательно, хотя бы один из коэффициентов а*+ь ...» ат отличен от нуля. Пусть, для определенности, ак+\ Φ_ 0 (в ином
13] § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 101 случае можно было бы поменять порядок нумерации векторов flfc+b · · · » йт)' Докажем, что система векторов &1, ..., bk, с, ak+2y ..., ат (13.6) является линейно независимой. Допустим, что Хтат = 0. (13.7) Подставляя сюда вместо с его выражение (13.5), получаем λΑ+ ... 4-λΑ+λ*+ι(βι&ι+ ·.· +βΑ + α*+Ια*-Η + или (λΙ+λΛ+ιβι)6ι+ ... +(h + hk+A)h + Xk+lak+lak+l + + (hk+2 + hk+\ak+2)ak+2+ ... + (^m4^+i<xm)am==0. Так как векторы (13.3) линейно независимы, то все коэффициенты в левой части равны нулю; в частности, λ^+ιο^+ι = 0. А. так как α^+ι φ 0; то λπ+ϊ = 0. Но тогда обращение в нуль остальных коэффициентов означает, что λι = ... = λ* = 0, λή+2 — · · · — hm = 0. Итак, в нуль может обращаться лишь тривиальная линейная комбинация (13.7), т. е. векторы (13.6) линейно независимы. Теорема 13.5. Пусть &i,..., 6m-i — линейно независимая система векторов пространства R и аи ..., аш —другая линейно независимая система векторов этого пространства {содержащая на один вектор больше). Тогда из аи ..., ат можно выбрать такой вектор aSy что система Ьи ..., 6m_i, a8 будет Зшнейно независима. Доказательство. При k = 0 утверждение предыдущей теоремы принимает следующий вид: если с φ 0 и система векторов аь ..., ат линейно независима, то среди векторов аи ... ..., ат найдется такой, что, заменив его вектором с, мы снова получим линейно независимую систему. Мы можем считать при этом (изменив, если нужно, нумерацию векторов аи ..., am), что заменяется на с вектор аи т. е. что линейно-независимой будет система векторов с, а2, ..., ат. Так как Ь\ φ 0 (поскольку система векторов Ь\9 · · · > &m-i линейно независима), то мы можем применить это утверждение к вектору с = Ь\. Итак, изменив, если нужно, порядок векторов аи ..., am, мы можем добиться того, что векторы *1, Я2, ·..> *т (13.8) будут линейно независимы. Теперь применим теорему 13.4 при k = 1, считая с — Ь2. То- гда мы найдем, что в системе векторов (13.8) можно один из
102 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [13 векторов а2, · · ·» ат заменить вектором Ь2 и система останется линейно независимой. Мы можем считать (изменив, если нужно, нумерацию векторов а2, ..., ат), что именно вектор а2 заменяется вектором Ь2. Итак, изменив, если нужно, нумерацию векторов аи ..., ят> мы можем добиться того, что векторы Ъ\, Ь2, Лз, ..., йт линейно независимы. Затем применим теорему 13.4 при k = 2, с = 63 и т. д. После т—1 таких шагов мы придем к тому, что векторы Ьи Ь2у ... ..., Ъш-\, ат линейно независимы (где ат — не обязательно последний, а какой-то из первоначально взятых векторов аи ..., От, поскольку в процессе доказательства мы меняли нумерацию). Пользуясь понятием линейной зависимости и независимости, можно определить теперь размерность векторного пространства, С этой целью вводится следующая группа аксиом: III группа: аксиомы размерности.^ ΙΙΙι. В векторном пространстве R можно найти η линейно независимых векторов. 1Н2. Любые η + 1 векторов векторного пространства R линейно зависимы. Векторное пространство, удовлетворяющее (при некотором η ^ 0) аксиомам этой группы, называется n-мерным векторным пространством, или, иначе, векторным пространством размер- ности п. Заметим, что нульмерное векторное пространство состоит только из одного элемента 0. Размерность векторного пространства R обозначают символом dim R. Существуют и такие векторные пространства, которые не имеют конечной размерности (т. е. пространства,* в которых можно найти как угодно много линейно независимых векторов). Однако в этой книге мы ограничимся изучением векторных пространств конечной размерности. Определение 13.6. Упорядоченная система векторов векторного пространства R называется его базисом, если эти векторы линейно независимы, а число их равно размерности пространства R. Аксиома ΙΙΙι означает, что в любом n-мерном векторном пространстве можно найти базис. Те о ρ е м а 13.7 Пусть аи ..., ап — базис n-мерного векторного пространства R. Тогда любой вектор a^R может быть представлен, и притом однозначно, в виде линейной комбинации векторов это?о базиса. Коэффициенты этой линейной комбинации называются координатами вектора а в базисе а\, ..., ап. Доказательство. Пусть a&R. Так как число векторов а, Я|, ..., Яп равно η + 1, то, согласно аксиоме 1И2, эти векторы
131 § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 103 линейно зависимы, и потому в силу теоремы 13.3 вектор а может быть представлен в виде линейной комбинации векторов аь...,ап. Докажем единственность такого представления. Пусть а = λχαχ + ... + ληαη9 а = μ^ι + ... + μη*η два представления вектора а в виде линейной комбинации векторов базиса. Тогда λ{αχ+ ... +λΛα„«=μ1α1+ ... + μηαη, откуда (λ1-μΙ)αι+ ... +{λη-μη)αη = 0. Так как векторы а\, ..., ап линейно независимы, то отсюда вытекает, что К — Р\— ··· —К — μΛ = 0, т. е. λΙ = μ1, ..., λη = μη- Теорема 13.8. Всякая линейно независимая система векторов может быть дополнена до базиса. Иными словами^ если Ьи · · · f bh — линейно независимые векторы n-мерного векторного пространства Ry причем k <пу то существуют такие векторы bk+u · · ·, Ьп, что Ьи ..., bh, bk+u .. ·, bn есть базис. Доказательство. Так как k <C п, то мы можем выбрать k + 1 линейно независимых векторов в R. Согласно теореме 13.5 среди этих k + 1 векторов можно найти такой вектор bk+u чт° &1, ..., b^ bk+i линейно независимы. Если k -f· 1 = л, то мы получаем таким образом требуемый базис. Если же k -j- 1 < η, то линейно независимую систему Ьи ..., bh, bh+\ мы таким же образом сможем дополнить еще одним вектором, и т. д. Теорема 13.9. Пусть в векторном пространстве R заданы векторы аи ..., аШу каждый из которых представляется в виде линейной комбинации векторов 6Ь ..., Ьи того же пространства, причем m > k. Тогда векторы аи ..., аш линейно зависимы. Доказательство. Выберем из системы векторов Ьи ... •.., bh наибольшую (в смысле числа векторов) линейно независимую систему. Пусть, скажем, это будет система Ьи ..., bi (где / ^ k). Тогда при / < k каждый из векторов 6/+ь ..., bk представляется в виде линейной комбинации векторов Ьи ..., Ь{ (по теореме 13.3). Отсюда вытекает, что и каждый вектор аи ... ,· аш представляется в виде линейной комбинации векторов *ь ..., Ь\ (причем I ^ k < m). Допустим теперь, что векторы аи ..., ат линейно независимы. Тогда по теореме 13.5 найдется такое число s(== 1, ..., /л), что векторы 6Ь ..., 6/, as линейно независимы. Но вектор а8 представляется в виде линейной комбинации векторов Ьи ..., Ьи что противоречит линейной независимости векторов Ьи ·. · э *г, α&·
104 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ TfeOMEtPHtf f)3 Пример 13.10. Рассмотрим снова арифметическое векторное пространство Rn (пример 12.2) и покажем, что его размерность равна п. С этой целью рассмотрим следующие векторы пространства Rn: f Λ m F ^ β! == {1, ρ, 0, ..., 0, 0}, β2 = {0, 1, 0, ..., 0, 0}, ел = {0, 0, 0, .... 0, 1}. Мы имеем: ахех + а2е2 + ... + αΛβΛ = щ {1, 0, 0, ..., 0, 0} + + <х2{0, 1, 0, ..., 0, 0}+ ... +ая{0, 0, 0, .... 0, 1} = «{а„ 0, 0, .... 0, 0} + {0, а2, 0, .... 0, 0}+ ... .. · + {0, 0, 0, ..., 0, ап} = {аь <х2, ..., ап}. (13.9) Из этого следует, что линейная комбинация α\β\ + ···"+ &пеп в том и только в том случае обращается в нуль, если αϊ = ... ... = αη = 0, т. е. векторы ей ..., еп линейно независимы. Соотношение (13.9) показывает, что любой вектор {αϊ, ..., αη} пространства Rn представляется в виде линейной комбинации векторов еи ..., еп: {аь ..., αΛ} = α,β, + ... +апеп. В силу теоремы 13.9 отсюда следует, что любые η -j- 1 векторов пространства Rn линейно зависимы. Таким образом, dim7?n — я, а векторы ей ..., еп составляют базис пространства Rn. Теорема 13.11. Пусть си с2, ..., сп — базис векторного пространства R и пусть в этом базисе вектор а имеет координаты х1, ..., хп, а вектор Ь имеет координаты у\ ..., уп, г. е. а — х1ех + ·.. + хпеП9 Тогда вектор аЦ- Ь имеет (в этом же базисе) координаты х] + у\ ..., хп + уп, а вектор λα имеет координаты λχι, ♦ .. •»» » NX * Доказательство получается очевидным подсчетом. Установленные факты дают возможность сравнить между собой все n-мерные векторные пространства. Пусть <p:/?-*S-~ некоторое отображение векторного пространства R в векторное пространство S, т.е. функция, заданная на множестве R и принимающая значения в множестве S. Отображение φ называется изоморфизмом (или изоморфным отображением), если оно взаимно однозначно (т.е. каждый вектор 6gS является образом одного и только одного вектора αεί) и, кроме того, сохраняет операции сложения векторов и умножения вектора на число, т. е. φ (α + 6) = φ до + φ (6)> φ (λα) = λφ до (13Ло)
13) § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 105 для любых векторов а, Ь пространства R и любого действительного числа λ. Если существует изоморфное отображение W-R-+S то векторные пространства R и S называются изо- морфными. Изоморфные векторные пространства, по существу, ничем не отличаются друг от друга; ведь ничего, кроме сложения векторов и умножения вектора на число, в векторном пространстве нет, а эти операции сохраняются при изоморфном отображении. Теорема 13.12. Два конечномерных векторных пространства R и S в том и только в том случае изоморфны между собой, если dim/? = dimS. Доказательство. Прежде всего заметим, что при изоморфизме φ:/? —»S нулевой вектор переходит в нулевой вектор: φ(0) = 0. В самом деле, если а е R, то а + 0 = а, и потому согласно (13.10) φ (α) + φ(0) = φ(α), откуда следует, что φ(0) = 0. Далее, линейная комбинация векторов переходит в линейную комбинацию с теми же коэффициентами, т. е. если Ь = а\йх + ... + akahi то φ(6) = αιφ(αι) + ... + ak(p(ah) (это* вытекает из (13.10)). Следовательно, равенство а\й\ + ... ... + auuk = 0 имеет место в том и только в том случае, если αιφ(αι) + ... + α^φ(α^) = 0. Но тогда ясно, что векторы аи ..., ah пространства R в том и только в том случае линейно независимы, если векторы φ(^ι), φ(α^), ..., φ(α^) пространства S линейно независимы. Поэтому максимальное число линейно независимых векторов в пространствах R и S одинаково, т. е. dim R = dim S. Итак, если векторные пространства изоморфны, то они имеют одинаковую размерность. Обратно, пусть векторные пространства R и S имеют одну и ту же размерность /г. Выберем в пространстве R некоторый базис аь ..., ап, а в пространстве S — некоторый базис &ь ..., Ьп- Тогда любой вектор c&R однозначно записывается в виде c = Xjai+ ... -f~ ληαη (где λ1, ..., λη —координаты вектора с в базисе аи ..., αη). Обозначим теперь через φ (с) вектор пространства S, имеющий в базисе Ьи ..., Ьп те же координаты, т. е. q>(c) = Xlb{ + ... + λη6„. Мы получаем отображение φ : R —► S. Легко видеть, что построенное отображение изоморфно. Из доказанной теоремы вытекает, в частности, что любое n-мерное векторное пространство изоморфно пространству Rn (см. пример 13.10). Выберем в n-мерном векторном пространстве R базис βι, ..., αη, а в пространстве Rn возьмем базис еи ... ···, еп, рассмотренный в примере- 13.10. Тогда изоморфное отображение φ, построенное при доказательстве теоремы 13.12, сопоставляет вектору с = %ха{ + ... + ληαη пространства R вектор 4>(с) = Ve{ + ... + %пеп = {λ1, ..., λη) пространства Rn (см. (13.9)). Итак, фиксировав в n-мерном векторном пространстве
105 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [14 R базис аи ..., ап и сопоставляя каждому вектору с = λια{ + . · · ... + ληαη е R вектор ср(с) = {λ1, ..., λη} е/?п, мы получаем изоморфизм φ : R —► Rn. Нередко отождествляют пространства R и Rn в силу этого изоморфизма, т. е. пишут не φ(λιαγ + ... + ληαη) = *= {λ1, ... ,λη}, а просто λια{ + ... + ληαη = {λ1, ..., λη}. Таким образом, запись с = {V, ...., λη} означает, что вектор c^R имеет (в базисе аи ..., ап) координаты λ1, ..., λη. Разумеется, такая запись допустима лишь в том случае, если в R заранее задан базис аи ..., ап (который не меняется в процессе рассуждения). 14. Подпространство. В этом пункте через R всюду будет обозначаться n-мерное векторное пространство. Определение 14.1. Множество A a R называется подпространством пространства R, если для любого вектора α е Л и любого действительного λ вектор λα принадлежит множеству А и, кроме того, для каждых двух векторов а, Ь е А вектор а + Ь также принадлежит множеству Л. Из этого определения непосредственно следует, что если векторы αϊ, ..., as принадлежат подпространству Л, то и любая их линейная комбинация %хах + ... + Xsas также принадлежит подпространству А. В частности, нулевой элемент принадлежит любому подпространству. Ясно, что множество, состоящее только из одного элемента 0, является подпространством; это подпространство (мы его будем обозначать символом 0) называется тривиальным. Любое другое подпространство называется нетривиальным. Ясно также, что множество Л, совпадающее со всем пространством R, является подпространством; это подпространство называется несобственным. Любое другое (т. е. не совпадающее с R) подпространство называется собственным. Пример 14.2. Рассмотрим в обычном трехмерном пространстве Σ плоскость Я и в плоскости Я выберем некоторую точку О. Тогда Σ и Я можно рассматривать как векторные пространства, определив векторы и операции над ними, как указано в примере 12.1. Легко проверить, что Я является нетривиальным собственным подпространством векторного пространства Σ. Пример 14.3. Рассмотрим арифметическое n-мерное пространство Rn\ выберем натуральное число т<п и обозначим через Ат множество векторов вида {λι, ..., %т, 0, ..., 0}, т. е. векторов, у которых последние η — т координат равны нулю (первые т координат могут быть как отличными от нуля, так и равными нулю). Легко видеть, что Ат есть нетривиальное собственное подпространство пространства Rn. Теорема 14,4 Всякое подпространство А векторного пространства R само является векторным пространством (относительно тех операций над векторами^ которые имеются в про-
14) § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 107 стоанстве /?), причем dim Л < dim/?. Равенство dim Л = dim /? имеет место в том и только в том случае, если подпространство А — несобственное. Доказательство. Для любых двух векторов а, аеЛ определена их сумма а + 6, принадлежащая (в силу определения 14.1) тому же множеству Л. Аксиомы 1ь 12 выполнены в /? для всех векторов и, в частности, для векторов, принадлежащих множеству А. Далее, так как ОеЛ, то в А выполнена и аксиома Ι3· Наконец, так как — α = (— 1)α, то для любого а^А вектор —а также принадлежит Л, и потому в Л выполнена и аксиома Ь. Итак, все аксиомы группы I в А выполнены. Столь же просто проверяются и аксиомы группы II. Таким образом, Л есть векторное пространство. Далее, если векторы аи ..., аш подпространства Л линейно независимы в Л, то они линейно независимы и во всем пространстве /?, так как операции в Л те же, что и во всем пространстве /?. Но в /? не существует более чем η линейно независимых векторов. Значит, и в Л не существует более чем η линейно независимых векторов. Таким образом, dim Л ^ я, т. е. dim Л < dim/? Если А — несобственное подпространство, т.е. Л =/?, то, очевидно, dim Л = dim/?. Обратно, пусть aim A = aim R, т.е.. dim Л = п. Тогда в Л можно найти η линейно независимых векторов еи . ·., еп. Эти векторы составляют базис в /?, т. е. любой вектор дсе/? можно записать в виде χ = λχβ\ -f- ... + ληβη. Но тогда *еЛ, так как линейная комбинация векторов из Л также принадлежит подпространству Л. Таким образом, любой вектор x^R принадлежит подпространству Л, т.е. Л = /? и, значит, Л — несобственное подпространство. Теорема 14.5. Пересечение двух {или, вообще, любого числа) подпространств является подпространством. Доказательство. Пусть Л и В — подпространства векторного пространства /?. Пусть, далее, а, Ь — два вектора, принадлежащие множеству С = А Г) В. Так как а е С, то вектор а принадлежит каждому из подпространств Л, В. Точно так же вектор Ь принадлежит каждому из подпространств Л, В. Так как а, 6 е Л и так как Л — подпространство, то а + Ь <= Л. Точно так же, а + Ь е В. Таким образом, вектор а + Ь принадлежит каждому из подпространств Л, В, т. е. а + Ь е С. Мы видим, что если а,Ь & С, то и вектор а + Ь принадлежит множеству С. Точно так же доказывается, что если а^С, то Ха^С (для любого действительного λ). Таким образом, С —подпространство. Аналогично проводится рассуждение и в случае пересечения любого числа подпространств.
108 ГЛ. It. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [14 Из теоремы 14.5 вытекает, что для любого множества Q cz R найдется наименьшее подпространство, содержащее множество Q, т. е. подпространство, содержащееся в любом другом подпространстве, также содержащем Q. В самом деле, рассмотрим все подпространства, содержащие множество Q (такие подпространства имеются — например, само R)t и обозначим через LQ пересечение всех: этих подпространств. По теореме 14.5, LQ является подпространством. Ясно, что Q c= Lq и что Lq содержится в любом подпространстве,4 содержащем множество Q. Таким образом, LQ есть искомое наименьшее подпространство, содержащее Q. Оно называется подпространством, порожденным множеством Q. Теорема 14.6 Пусть Q cz R. Вектор лее R в том и только в том случае принадлежит подпространству Lq, порожденному множеством Q, если χ можно записать в виде линейной комбинации векторов, принадлежащих множеству Q. Доказательство. Обозначим через А множество всех векторов xEi?, которые можно записать в виде линейной комбинации векторов, принадлежащих множеству Q. Легко видеть, что если а, бе Л, то а + Ь^А, и если а^А, то λα^Α для любого действительного λ. Таким образом, А есть подпространство векторного пространства R. Так как, очевидно, Q cz Л, то (поскольку LQ есть наименьшее подпространство, содержащее Q) справедливо включение Aid LQ. Обратно, если χ <= Л, т. е. χ = %xqx + ... + λ8^, где Ц\ е Q, i = 1, ..., s, то (в силу включения Q c= LQ) мы имеем ц\ е Lq, i = 1, ..., 5, и потому (поскольку LQ есть подпространство) вектор χ = Xlqi + ... + %sqs принадлежит LQ. Таким образом, A a Lq. Из доказанных включений A zd Lq, A cz Lq следует, что A = LQ. ' Из теоремы 14.6 вытекает, что для любого целого г, удовлетворяющего неравенствам 0 ^ г <ζ п, в R найдется подпространство размерности г. Для г = О и г = η это очевидно. Пусть 0 < г < п. Возьмем в R какие-либо г линейно независимых векторов βχ, ..., ег (например, первые г векторов некоторого базиса)* и обозначим через Q множество всех этих векторов. Так как подпространство Lq, порожденное множеством Q, содержит г линейно независимых векторов еи ..., ет, то dim LQ ^ г. С другой стороны, каждый вектор χ е Lq согласно теореме 14.6 представляется в виде линейной комбинации векторов ех, ..., ег, и потому согласно теореме 13.9 каждые г+1 векторов подпространства LQ линейно зависимы. Следовательно, dim Lq ^ г. Из доказанных неравенств вытекает, что dim LQ = r%
Μ] § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 109 Пример И.7. Покажем, что любые два г-мерные подпространства «одинаково расположены» в R. Иными словами, если д ^ β два г-мерных подпространства векторного пространства /?, то существует такой изоморфизм φ :/?-*# пространства R на себя, при котором подпространство Л изоморфно отображается на подпространство В. В самом деле, пусть аи ..., ат — базис подпространства Л. Тогда векторы аи ..., йг линейно независимы, и потому согласно теореме 13.8 эта система векторов может быть дополнена до базиса аи . · ·, аг, ат+и ..., ап всего пространства R. Пусть, далее, Ьи .··, Ъг—базис подпространства В. Тогда, аналогично, система векторов Ъи ..., Ъг может быть дополнена до базиса &ь ..., 6г, Ьг+ь · · · > ьп пространства R. Обозначим теперь через φ изоморфизм пространства R на себя, который переводит вектор, имеющий относительно базиса аи ..., ап координаты λ1, ..., λη, в вектор, имеющий те же координаты относительно базиса Ьи ..., Ьп (ср. конец доказательства теоремы 13.12): Ф^^Ч- ... + ληαη) = λ% + ... +λΧ. Тогда вектор *, принадлежащий подпространству Л, т. е. имеющий вид x = Val+ ... +λΓαΓ + 0αΓ+1+ ... +0ап, (14.1) переходит при отображении φ в вектор λι6ι + ... + λ% + 06Γ+1 + ... + 0Ьп, (14.2) т. е. в вектор, принадлежащий подпространству В. При этом любой вектор, принадлежащий подпространству В, т.е. имеющий вид (14.2), является образом вектора (14.1), принадлежащего подпространству Л. Таким образом, при изоморфизме φ подпространство Л отображается (изоморфно) на подпространство β, т.е. изоморфизм φ — искомый. В отличие от пересечения (см. теорему 14.5), объединение Ли В двух подпространств Л и β, вообще говоря, подпространством не является. Однако можно рассматривать подпространство, порожденное объединением А [} В. Это подпространство называется суммой подпространств Л и В и обозначается через Л + В. Теорема 14.8. Пусть А и В — два подпространства векторного пространства R. Вектор χ е R в том и только в том случае принадлежит подпространству А + В9 если его можно представить в виде χ = а + 6, где а<=А, Ь(=В. Доказательство. Так как Л с= Л + β, В cz Л + В, то для любых ае Л, Ь е В вектор а + Ь принадлежит подпространству Л -|~ β.
ПО ГЛ. П. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [14 Обратно, пусть х^А-\-В. Тогда, по теореме 14.6, х = λ^ι + ... + λ*<78, где каждый из векторов q\, ..., qs принадлежит множеству Л U β, т. е. принадлежит одному из подпространств А, В. Пусть, скажем, Ц\, ..., ^6^, q^u ... ..., <7S е В. Тогда, очевидно, χ = а + Ь, где α = λ1ήτ1+ ... +%еД 6 = λ*-Η</,+1+ ... +^,gB. Теорема 14.9. Пусть А и В — два подпространства вектор- ного пространства /?. Пусть, далее, L = A-\-B — ux сумма, а С = А П В — их пересечение. Тогда dimL = dim A + dim В — dim С. (14.3) Доказательство. Обозначим через г размерность подпространства С, и пусть ей .. ., ег—некоторый базис этого подпространства. Размерности подпространств А п В обозначим соответственно через ρ и q. Так как векторы еи ..., ег расположены в подпространстве А и линейно независимы, то их можно дополнить векторами /г+ь ..., fp до базиса еи ..., ег, /г+ь ... ..., fp подпространства А (в силу теоремы 13.8). Точно так же векторы еи ..., ет можно дополнить векторами #г+ь ..., gq До базиса еи ..., ёг, gr+u ..., gq подпространства В. Мы покажем, что векторы «ι.···· er, fr+u ···> fP> gr+u ..., gq (14.4) образуют базис подпространства L. Так как число этих векторов равно ρ + (У — г) = dim Л + dim В — dim С, то из этого и будет следовать справедливость формулы (14.3). Пусть χ — произвольный вектор, принадлежащий подпространству L. По теореме 14.8 χ = а + 6, где а^А, Ь ^В. Вектор а е Л представляется в виде линейной комбинации векторов *ь ···> er, fr+i» · · · > fp и, значит, в виде линейной комбинации векторов (14.4) (с нулевыми коэффициентами при векторах gr+u · · · > gq)- Точно так же вектор JgB представляется в виде линейной комбинации векторов (14.4). Поэтому и вектор χ = α + b представляется в виде линейной комбинации векторов (14.4). Остается доказать, что векторы (14.4) линейно независимы. Пусть μι^ + ... +V>r*r + K+\fr+\ + ··. +λρ/ρ + + νΓ+1£Γ+1+ ... + ν^ = 0, (14.5) т. е. μι*ι + · · · + μ/·*Γ + λ/ч ι/γ+ι + .. · + Vp = = — vr+1grr+1 — ... —vqgq. (14.6)
Μ] § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 111 Вектор стоящий в левой части равенства (14.6), принадлежит подпространству Л, а вектор, стоящий в правой части, —подпространству В. Так как это один и тот же вектор, то он принадлежит подпространству Л Г) В = С. Следовательно, вектор (14.6) представляется в виде линейной комбинации векторов еи ..., ег: ИЛИ , . I I A α,βι+ ... 4-<xrer + vr+1£r+i+ ... + ν^ = 0. Из линейной независимости векторов еи ..., er, gr+u · · > gq (составляющих базис подпространства В) вытекает, что в этом равенстве все коэффициенты равны нулю. В частности, vr+1 = ... ==v<7 = 0. Отсюда следует в силу (14.6) что μΐ«1+ · ·· + Рг*г + Av+i/r + l + "· + V/> = 0> и потому Ич = ··· — fV—λΓ+ι = ... =λ/7 = 0 (так как векторы еь ..., er, /r+i, ..., /ρ, составляющие базис подпространства Л, линейно независимы). Итак, все коэффициенты в соотношении (14.5) равны нулю, т.е. векторы (14.4) линейно независимы. Теорема доказана. Пусть Л и В — два подпространства /г-мерного векторного пространства R. Если А -\~ В = R и Л Π В = О, то говорят, что β является прямым дополнением подпространства Л и пишут R = А φ В (в этом случае Л также является прямым дополнением подпространства В, т. е. R = В φ Л, поскольку в сформулированном определении роли подпространств Л и β одинаковы). Таким образом, если R = А φ В, то dim (Л + В) = л, dim (Л Π β) = 0, и потому в силу (14.3) dim Л + dim В = п. Обратно, если Л Π В = 0 и dim Л + dim β = η, то dim (Л + β) « = /ι, т. е. # = Лфв. Итак, мы получаем следующее предложение: Теорема 14.10. Пусть А и В — два подпространства п-мер- ново векторного пространства R, пересечение которых является тривиальным подпространством. Для того чтобы А и В были прямыми дополнениями друг для друга (т. е. R = Л φ β), необходимо и достаточно выполнение равенства dimA + dimB=n. Заметим еще, что если R = Л φ В и если еи ..., ер — базис подпространства Л, а /ь ..., fq—-базис подпространства β, то векторы 6\, . . ., вр, /Ί, . . . , fq составляют базис всего пространства R (см. (14.4)),
112 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [14 Теорема 14.11. Пусть А и В —два подпространства п-мер- ного векторного пространства R. Соотношение R = Л φ В имеет место в том и только в том случае, если любой вектор x^R однозначно представляется в виде χ = й + Ь; а е Л, Ь е В. Доказательство. Пусть R = Α φ β. Так как в этом случае А + В = /?, то в силу теоремы 14.8 любой вектор χ е R представляется в виде χ = а + 6, а е Л, 6 е β. Если, кроме того, имеется аналогичное представление х = а' + Ь'у а'^А, V е S, то мы имеем α + 6 = а' + Ь', откуда α — α' = 6' — 6. Вектор α — α7 принадлежит подпространству Л, а так как он равен вектору Ь' — 6, то он принадлежит и подпространству В. Следовательно, а — а'^А(\В, и потому а — а' = 0, &'*—6 = 0, т. е. α = α7, b = 6'. Таким образом, единственность представления χ = a + b, a^ A, 6 е β доказана. Обратно, пусть любой вектор jce/? однозначно представляется в виде * = а + &> а^А, Ь^В. Тогда по теореме 14.8 любой вектор x&R принадлежит подпространству Л-f* θ, т.е. А + В = R. Если бы существовал отличный от нуля вектор с е Л Π β, то мы имели бы два различных представления с = с + 0, с€=Л, Οεβ, с = 0 + г, ОеД се β, что противоречит предположению. Следовательно, Л Л β = 0, и потому R = Α φ β. В заключение рассмотрим понятие прямой суммы. Пусть Аи ..., Лк — подпространства ft-мерного векторного пространства R. Говорят, что пространство R распадается в прямую сумму подпространств Ль ..., Ak и пишут "Я«4,® ... ΘAk, (14.7) если любой вектор χ е R однозначно представляется в виде х = ах+ ... + аь α,ε=4ΐ9 ..., а*ёД*. Заметим, что в приведенном выше определении не исключается случай, когда некоторые из подпространств в соотношении (14.7) являются тривиальными (т. е. состоят только из одного элемента 0). Теорема 14.11 показывает, что распадение пространства R в прямую сумму двух подпространств Л, β имеет место в том и только в том случае, если Л и β являются прямыми дополнениями друг для друга, т. е. соотношение R = А ©β имеет тот ще смысл, что и прежде.
и] § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО ЦЗ Теооема 14 12. Пусть # = Л © β, причем подпространство А (рассматриваемое как векторное пространство) распадается в прямую сумму своих подпространств Ль ..., Ак: А=*АХ® ...®Ак. ' (14.8) Тогда пространство R распадается в прямую сумму подпространств Аи ..., Ак> В: R = A{@ ... @Ak®B. (14.9) Доказательство. Пусть хе/?. Тогда, в силу соотношения R = А ф В мы можем написать χ = а + 6, где а <= Л, jeB, Далее, вектор а е А можно в силу (14.8) записать в виде а = а{+ ... +аь ах^Аи ... ak<=Ak. (14.10) Следовательно, х=*ах + ... +ak + b; ах*=А{9 ..., а*е=Ль ieB. (14.11) Остается доказать, что разложение (14.11) единственно. Пусть, кроме (14.11), имеет место разложение х = а[+ ... +а£ + 6'; а[ <= Ль ..., а£<= ЛА, УеВ. (14.12) Так как Л/ cz Л, ί = 1, ..., kt то а[ -f ... +а*еД и потому разложение # = (αί + ... + а*) + &' должно совпадать с разложением х = а + Ь, т. е. а = а[+ ... + <Й. & = &'. (14.13) Но в силу (14.8) первое из разложений (14.13) должно совпадать с разложением (14.10), т. е. а\ =αί, ..., a,k = a'k. Таким образом, разложения (14.12) и (14.11) совпадают. Теорема 14.13. Если R = Л + В, то существует такое подпространство D cz β, что R = Л ©> D. Доказательство. Положим С = Л Π θ и выберем в векторном пространстве В какре-либо подпространство Ζ), являющееся прямым дополнением подпространства С cz θ, так что В = С © D. Так как D с θ, то D = В Л D и ЛП£сЛЛ(ВПЯ) = (ЛПЯ)ЛЯ = СПО, т. е. Л Л D есть тривиальное подпространство. Поэтому согласно теореме 14.10 достаточно доказать, что dim Л + dim D = п. Мы имеем в силу формулы (14.3) я = dim # = dim Л + dim β" — dimC = = dim Л + (dim С + dim D) — dim С = dim A -f dim £>f НЩ и завершается доказатель9тэо.
ГЛ. И. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [15 Заметим еще, что если R = А{ © ... φ Ak и если е\1\ ..., е«>— базис подпространства Д, далее е<2), ..., е™ — базис подпространства Л2, ..,, наконец, e<fe), ..., е^ —базис подпространства Aki то векторы составляют базис пространства /?. Это легко доказать по индукции, воспользовавшись соотношением Λ,φΛθ ... ΦΛ* = ΑΘ(ΛΘ ... θ40. 15. Гомоморфизмы векторных пространств. Определение 15.1. Отображение Ф: R-+S векторного пространства R в векторное про^тРанство ^ называется гомоморфизмом, если оно сохраняет о^РаДии сложения векторов и умножения вектора на число, т. е. удовлетворяет условиям (13.10). В отличие* от изоморфизма, гомоморфизм может не быть взаимно однозначньш отображением и может не быть отображением на все простРанство 5. Пусть φ: R -> S — некоторый гомоморфизм и Л — подпространство пространства R· Через φ (Л) обозначается образ подпространства А 1фи отображении φ, τ. е. множество всех векторов вида ф(*), где Х^А- В частности, можно рассматривать образ φ(/?) всего пространства R при гомоморфизме φ; он называется образом гомоморфизма φ и обозначается через Im<p (т. е. Ιπιφ = φ (Λ))· Теорема 1бЛ. Образ φ (л) любого подпространства А с: R при гомоморфиз№ φ: # -* S является подпространством вектор- ного пространства S. Доказательство. Пусть а, 6еср(Л), т. е. существуют такие элементы ^У^Д что φ (л;) = α, φ (у) = Ь. Тогда 0 + 6 = φ (χ) + φ (у) = φ (ж + у). Так как * + У^^ (поскольку А—подпространство), то а + + &<=ср(Л). Итак, если α, &<=ср(Л), то а + Ье<р(Л). Пусть, далее, α^φ(Λ), т. е. α = φ(χ), где * е Л, и пусть λ — действительное число. Тогда. λα = λφ (ж) = φ (λ*). Так как λχ^Α (поскольку А — подпространство), то λα^φ(Α). Итак, если аеф(^)» то ^аеср(Л) для любого действительного λ. Таким образов Φ О4) —подпространство. Пусть снова Ф: R-* S — некоторый гомоморфизм и β — подпространство пр0СТРанства ^. Прообразом подпространства В при гомоморфйзме Φ называется множество рсех элементов
151 $ 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 115 г-р „ля которых Ф(х)ей. Этот прообраз обозначается через «гЧВ\ В'частности, можно рассматривать прообраз φ"1 (0) тривиального подпространства; он называется ядром гомоморфизма Φ и обозначается через Кегср. Таким образом, ядро Кег φ состоит из всех элементов же/?, для которых φ(*) = 0. Теорема 15.2. Прообраз φ"1 (В) любого подпространства В czS при гомоморфизме φ: R->S является подпространством векторного пространства R. Доказательство. Пусть α, ίεφ-1^), т. е. φ(α)εβ, φ (6) gB. Так как β— подпространство, то отсюда следует, что Ι(α)+φ(6)Εβ, т. е. φ(α+ &)<=£. Следовательно, а + Ь(= <εξ φ-1 (В). Итак, если а, Ь е φ"1 (β), то а + 6 е φ"1 (β). Пусть, далее, aeqr1^), т. е. (p(a)sfl, и пусть λ —действительное число. Так как В — подпространство, то отсюда следует, что λφ(α) е β, т. е. φ (λα) е β. Следовательно, λαεφ'^β). Итак, если αεφ"1^), то λα^φ_1(β) для любого действительного λ. Теорема 15.3. Для любого гомоморфизма φ: R-+S справедливо соотношение dim R = dim (Im φ) + dim (Ker φ). (15.1) Доказательство, Обозначим размерность подпространства Ιιτιφ через р, и пусть си...,ср— некоторый базис этого подпространства. Так как с\, ..., сР е Im φ, то существуют такие элементы ей ..., ер e R, что ф(^) = сь ..., <р(ер) = ср. Векторы еи...,ер линейно независимы, так как из равенства а\е\ + ... + аРер = 0 вытекает, что αιφι (е\) + ... + αΡφ(βρ) = = 0, т. е. aiCi + ... + арср = 0, и потому αϊ = ... = аР = 0. Обозначим через L подпространство пространства /?, порожденное векторами е\,...ер. Согласно теореме 14.6 подпространство L состоит из всех векторов вида ххв\ +... + хрер. Из соотношения φ (х]е1 + ... + хрер) = х1с{ + ... + хрср непосредственно вытекает, что отображение φ, рассматриваемое на L, является изоморфизмом пространства L на подпространство Irncp. Пусть ^е/?, Тогда φ(χ) elm φ и, так как φ(Ζ,) = Ιπιφ, то найдется элемент aeL, для которого φ(α) = φ(*). Таким образом, φ(χ) —φ(α)= 0, т. е.^ <р(х—а) = 0, и потому элемент Ь = χ — а принадлежит подпространству Кег φ. Итак, x = a + b; a<=Ly 6е=Кегф, (15.2) т. е. любой вектор x^R представляется в виде (15.2).
116 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [15 Докажем однозначность такого представления. Пусть, кроме (15.2), имеется представление Х = а' + Ь'. a'^Ly &'e=Kerq). (15.3) Тогда а + Ь = о! + Ь\ откуда а —- а' = Ь' — Ь е Кег φ, и потому φ (а — а') = 0. Следовательно, φ (α) = φ (а7). Но так как a, а' e L, а отображение φ, рассматриваемое на L, является изоморфизмом, то отсюда следует, что а = а'. Теперь из соотношения а + -f Ь = а' + Ь' вытекает, что Ь = Ь'. Таким образом, представления (15.2) и (15.3) совпадают, чем и доказана единственность. В силу теоремы 14.11 мы теперь находим, что R = L ф Кег φ, и потому dim R = dim L + dim (Ker φ) (теорема 14.10). Но так как пространства L и Imcp изоморфны, то согласно теореме 13.12 dim L = dim (Ιηιφ). Теорема 15.4. Пусть R и S — векторные пространства и ей—,€п — базис пространства R. Тогда для любых элементов fli,..., йп пространства S существует, и притом только один, гомоморфизм φ: R-+S, удовлетворяющий условиям у(ех) = аи ..., φ(βη) = αη. -(15.4) Доказательство. Пусть χ — произвольный элемент пространства R и л:1, ...,хп — его координаты в базисе еи ..., еп: х = ххе{+ ··· +Л„· (15.5) Положим (f(x) = x%+ ... + *Лай. (15.6) Таким образом, для любого x&R определен элемент φ(*) eS. Непосредственно проверяется, что получаемое таким образом отображение φ: R-+S удовлетворяет условиям (13.10), т. е. является гомоморфизмом. Ясно также, что этот гомоморфизм φ удовлетворяет условиям (15.4). Тем самым существование требуемого гомоморфизма доказано. Докажем единственность. Пусть φ^ R-+S — какой-либо гомоморфизм, обладающий требуемыми свойствами, т. е. φ1(β1)==αι, ..., q>i{en) = ani Тогда для вектора (15.5) мы имеем Φι (*) = <Ρι(*1*ι+ ···'+*4ι) = *Ιφ(«ι)+ ... +хп<р(еп) = = л:1а1+ ... +Χηαη = φ(χ). Итак, φι(*) == φ (χ) для любого элемента x<=R, т. е. гомоморфизм φι совпадает с построенным выше гомоморфизмом φ.
15] § 4. ЁЁКТОРНОЁ ПРОСТРАНСТВО 117 Замечание 15.5. Пусть fu .. ·, h — базис пространства S. Запишем каждый из векторов аи ..., "п (см. (15.4)) в виде линейной комбинации векторов базиса: ' а} = с^ + ... +c*tk9 1=1 .... п. (15.7) Тогда соотношение (15.6) можно будет записать в виде η η k φ (x) = Σ *'*/ = 2 2 x!c)fr Иначе говоря, Φ(*)==»1/ι+ ··· +У7ь (15.8) y'-Scjx/, ί=1, .'.., k. (15.9) Итак, гомоморфизм φ : R -* S, удовлетворяющий условиям (15.4), может быть описан следующим образом: он переводит вектор х, имеющий в базисе еи . ., еп координаты х\ ..., хп (см. (15.5)), в вектор, имеющий в базисе /ь ..., fh координаты У1, .··, Ук (см· (15.8)), определяемые формулами (15.9); при этом числа с\ определяются равенствами (15.7). Заметим теперь, что задание чисел cj (/=1, ..., k\ j = = 1, ..., η), т.е. задание матрицы С= (cj), равносильно заданию векторов аи ..., ап (см. (15.7)). Таким образом, справедливо следующее утверждение: Пусть R — векторное пространство с базисом ей ..., сп и S — векторное пространство с базисом fu ..., fk- Всякий гомоморфизм φ : R —► S однозначно определяется по формулам (15.5), (15.8), (15.9) заданием kXn-матрицы С=(с|.), г. е: гомоморфизм φ переводит элемент x^R с координатами х1, ..., хп в элемент с координатами у1, ..., yk, определяемыми по форму- лам (15.9). Тем самым устанавливается взаимно однозначное соответствие между гомомоофизмами R->S и k Χ η-матрицами С-(с}). Определение 15.6. Пусть R = А ф В. Согласно теореме 14.11 каждый вектор x^R однозначно представляется в виде х = а + Ь; а^А, Ь^В. Вектор а называется проекцией вектора χ на подпространство А в направлении подпространства В. Теорема 15.7. Пусть R = А © В. Для каждого вектора х е R обозначим через π (χ) проекцию вектора χ на подпространство А в направлении подпространства В. Получаемое отображение π пространства R в себя (называемое проектированием на подпространство А в направлении под-
il8 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ 415 пространства В) является гомоморфизмом. При этом Im π = Л, Кег π = В. Доказательство. Пусть ху у е R. Представим векторы дс, у в виде x=al + bu y = a2 + b2\ alta2^A, Ь{,Ь2^В. Тогда ai = η (χ) у α2 = η (у). Мы имеем * + y = (fli + bl) + (a2 + b2) = (al +α2) + (6ι + »2)· Так как αϊ + #2 е Л, 6ι + &2 е β, то отсюда следует, что а{ + -f-a2 = Jt(* + 0)f т.е. π (ж + */) = π (ж) +я(у). Аналогично устанавливается соотношение. π(λχ) =λπ(χ). Таким образом, π есть гомоморфизм. Очевидно, что ImnczA. Но для любого вектора а^А мы имеем п(а)=а (поскольку α = α + 0; α^Α, Oefi), и потому Im π id Л. Таким образом, Im π = Л. Наконец, включение дсеКегя, т. е. π(*) = 0 имеет место в том и только в том случае, если χ = 0 + 6, где 6еВ, т. е. если * <= б. Иначе говоря, Кег π = В. Определим теперь некоторые операции над гомоморфизмами. Пусть φι и ф2—- два гомоморфизма векторного пространства R в векторное пространство 5. Для любого χ е R элементы φι (ж) и фг(*) являются векторами пространства S, и мы можем рассматривать их сумму φι(*) +φ2(*). Определим отображение ψ : R -* S формулой Ψ (*) = Φι (*) + %(*). *€=#. Непосредственно проверяется, что отображение ψ является гомоморфизмом векторного пространства R в векторное пространство S. Этот гомоморфизм называется суммой гомоморфизмов φι и фг: Ψ = Φι+φ2. Таким образом, по определению, (φι + φ2) (χ) = φι (ж) + <рг(*) для любого xeJ?. Пусть, далее, φ : R —> S — некоторый гомоморфизм и λ — действительное число. Определим отображение x:R-+S формулой χ(*)=λφ(*), *е=#. Непосредственно проверяется, что отображение χ является гомоморфизмом пространства R в S. Этот гомоморфизм называется произведением гомоморфизма φ на число λ: Χ = λφ. Таким образом, по определению, (λφ) (χ) = λ(φ(*)) для любого χ е Я.
15] § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 119 ГО- на- че- Пусть наконец, φ : #-* S — гомоморфизм пространства R в пространство S, а ψ : 5 -* Τ — гомоморфизм пространства S в пространство Т. Определим отображение ζ-.R^T формулой ζ(χ) = Ψ(Φ(*))> «ей. Непосредственно проверяется, что отображение ζ является моморфизмом пространства R э Т. Этот гомоморфизм зывается композицией гомоморфизмов ψ и φ и обозначается рез ψ°φ: _ ζ = ψοφ. Таким образом, по определению, (ψοφ)(*) = ψ(φ(Λ;)) для любого хеЛ. Теорема 15.8. Пусть R uS — векторные пространства. Множество всех гомоморфизмов R-+ S с определенными выше операциями сложения и умножения на действительные числа является векторным пространством размерности dim R · dim S. Это пространство обозначается через Hom(R,S). Доказательство. Пусть φι, φ2^ Hom(/?,S), т. е. φι и φ2 — некоторые гомоморфизмы R -> S. Докажем, что φι + ф2 = = <Р2 + фь Мы имеем (для любого *<=/?): (<Ρι + ф2) (*) = Φι (χ) + Ф2 (*)> (Φ? + Φι) (х) — ф2 (х) + Φι (*). Так как φι(*) + <рг(*) = фгМ + φι(*) (ибо в векторном пространстве S сложение коммутативно), то (φι + Фг) (х) — (Фг + Φι) {х) Для любого * <= /?. Это и означает, что гомоморфизмы φι -|- φ2 и φ2 -f- φι совпадают, т. е. φι + φ2 = φ2 + φι· Тем самым доказано, что в множестве Hom(#, S) выполняется аксиома Ь. Аналогично проверяются и все остальные аксиомы I и II групп; отметим лишь, что нулевым элементом в Hom(/?, S) является гомоморфизм, переводящий все пространство R в нулевой элемент OgS, а элемент —φ (для cp<=Hom(/?, S)) определяется равенством (—φ) (χ) = = — (ср(*)) Для любого x^R (т.е. — φ = (—1)φ). Таким образом, Hom(R, S) есть векторное пространство. Обозначим через η размерность пространства /?, через k — размерность пространства 5, и докажем, что векторное пространство Hom(/?, S) изоморфно векторному пространству всех /гХ/г-матриц С = (с|.) с действительными элементами. С этой целью фиксируем в R некоторый базис еи ..., еЛ, а в пространстве S — некоторый базис /ι, ..., /&. Каждый гомоморфизм φ: R-+S позволяет определить в пространстве S векторы ах = φ(βι), ..., ап = φ(βη); далее, представляя эти векторы в виде линейной комбинации векторов базиса fu ..., f%
120 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [15 (см. (15.7)), мы определим числа с^ т. е. сопоставим гомоморфизму φ некоторую &Хя-матрицу C = (cj). Согласно замечанию 15.5 каждая k χ η-матрица С в свою очередь однозначно определяет гомоморфизм φ, τ. е. установленное соответствие между гомоморфизмами φ: /?-*S и k X я-матрицами C=(cj) взаимно однозначно. Непосредственно проверяется, что сумме φ' + φ" двух гомоморфизмов R-+S соответствует сумма С + С" = (c'i + с"Ч) соответствующих матриц, а произведению λφ гомоморфизма φ: R -> S на число λ соответствует произведение ХС = (Хс^) соответствующей матрицы C = (cj) на число λ. Это и означает, что пространство Hom(/?, S) изоморфно векторному пространству всех &Хл-матриц с действительными элементами. Так как рассмотренные пространства изоморфны, то их размерности совпадают (см. теорему 13.12). Но размерность векторного пространства всех k X я-матриц (с действительными элементами) равна kn. Таким образом, dim (Нот (/?, S)) = nk = dim R · dim S. Теорема 15.9. Пусть φ: R-+S и ψ: S-^Γ — гомоморфизмы векторных пространств. Фиксируем в пространстве R некоторый базис еи ..., еПу в пространстве S — базис fit ..., fk и в пространстве Τ — базис gu ..., gi. Пусть в этих базисах гомоморфизму φ соответствует k X η-матрица С, а гомоморфизму ψ соответствует /χ&-матрица D. Тогда гомоморфизму ψοφ пространства R в Τ соответствует (в тех же базисах) Ι χ ^матрица DC. Доказательство. Элементы с\ матрицы С определяются из соотношений (15.4), (15.7), а элементы матрицы D — из аналогичных соотношений Отсюда получаем (♦•ф)(«/)-*(ф(«/))-^ =1,*=,1(4,^.)=1,2^-1(1^)*«· Таким образом, (ψ ο φ) (β^Σ^α, где элементы /χ^-матрицы Q = (??), т. е. матрицы, сортв^-
1SI § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 121 ствуюшей гомоморфизму ψ «φ, определяются формулой Но это и означает, что Q = DC. Теорема 15.10. Пусть /?, S, Т —векторные пространства и f R *-* S — некоторый гомоморфизм. Рассмотрим векторные пространства Hom(R, Τ) и Hom(S, T) и для произвольного элемента (peHom(S, Τ) (т. е. гомоморфизма S->7) положим **/ \_φ0ζ (так что ζ*(φ) представляет собой гомоморфизм %Хт, т. е. элемент пространства Нот(/?, Г)). Получаемое таким образом отображение ζ*: Hom(S, 7)->Hom(/?, T) является гомоморфизмом. Доказательство получается непосредственной проверкой, так же как и доказательство следующего предложения: Теорема 15.11. Пусть /?, S, Τ — векторные пространства и χ. 5 —► Τ —- некоторый гомоморфизм. Рассмотрим векторные пространства Нот (7?, S) и Нот (R, Т) и для произвольного элемента среНот(/?, S) (т. е. гомоморфизма R-+S) положим χ#(φ) =χοφ (так что χ*(φ) представляет собой гомоморфизм R-+T, т. е. элемент пространства Нот(/?, Г)). Получаемое таким образом отображение χ*: Нот(/?, S)-+Hom(/?, T) является гомоморфизмом. В заключение рассмотрим понятия сопряженного пространства и сопряженного гомоморфизма. Пусть R — векторное пространство. Через D мы будем обозначать числовую прямую; она представляет собой од ном еρ ное векторное пространство (совпадающее с одномерным арифметическим векторным пространством R1). Каждый гомоморфизм /: R-+D называется линейным функционалом на пространстве R. Таким образом, линейный функционал f: R-+D сопоставляет каждому элементу χ е R некоторое действительное число /(#), причем / (*ι + *2) - / (*ι) + / te), / (λ*) = λ/ (χ). Множество всех линейных функционалов на пространстве R, т. е. Нот (7?, Ζ)), является в силу теоремы 15.8 векторным пространством размерности dim/?. Это пространство называется сопряженным к векторному пространству R и обозначается через /?*. Таким образом, /Г = Нот (#, D), dim Rm = dim R. Пусть теперь /?, S — векторные пространства и ζ: /?->$— некоторый гомоморфизм. Тогда согласно хеореме 15.10 определен гомоморфизм ζ*: Hom(S, D)->Hom(/?, £)), т. е. гомоморфизм ζ*: S* ->#*, Этот гомоморфизм ζ* называется сопряженным
122 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ (15 исходному гомоморфизму ζ. Согласно теореме 15.10 сопряженный гомоморфизм ζ* строится следующим образом: каждому линейному функционалу /: S->D (т. е. элементу пространства S*) он сопоставляет линейный функционал ζ* (/) = f ° ζ, заданный на пространстве R (т. е. являющийся элементом пространства /?*). Наконец, отметим еще один способ записи линейных функционалов, обладающий определенными удобствами. Пусть R — векторное пространство, R* — сопряженное ему пространство и пусть же/?, f e R*. Так как линейный функционал / представляет собой гомоморфизм f: R-» D, то определено значение f(x)^D9 являющееся действительным числом. Это число условимся также обозначать через (х, f) и в такой записи называть его скалярным произведением элемента χ е R> на линейный функционал f e #*: (*,/) = /(*)· Непосредственно из определения вытекают следующие свойства скалярного произведения: (*ι + *2. /)β(*ι> 0 + (*2· /); | (*,fi+/2) = (*./ι)+ (*.«; (15.10) (λχ9 f)*=b(x9f); (*, λ/) = λ(*, /). i Наконец, отметим следующее утверждение, также непосредственно вытекающее из определения скалярного произведения и сопряженного гомоморфизма: Пусть R, S — векторные пространства, ζ: R-+ S — некоторый гомоморфизм и ζ*: S* -> R* — сопряженный ему гомоморфизм. Тогда для любых элементов χ е R, f e S* справедливо соотношение «(*),/)-(*, Г (0). (15.11) Теорема 15.12. Пусть R — векторное пространство, R* — сопряженное ему пространство и пусть /ι, ..., fn — произвольный базис пространства /?*. Тогда существует такой базис ей ..., еп пространства R, что ί 0 при 1Ф\\ Μ*/) = ϊ ι · · (15.12) х ' 11 при ι = }. При таком выборе базисов для любых элементов * = *'*,+ ··. +*ЧеЛ, f-if'fi+... +ί/"/η^/?* (15.13) справедливо соотношение (*,/) = /(*) = *У + ... + *V. (15Л4)
& 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 123 15J Доказательство. Определим отображение φ: R -* Rn векторного пространства R в арифметическое векторное пространство /?п, положив для любого вектора ае=#: φ (а) = {/, (а), ..., /я(а)}. Непосредственно проверяется, что отображение φ является гомоморфизмом. Покажем, что ядро Кег φ этого гомоморфизма является тривиальным подпространством. В самом деле, пусть аА — отличный от нуля вектор пространства R. Дополним вектор аА векторами fl2 αη до некоторого базиса аи а2, ..., ап пространства R и для любого вектора χ = λια{+λ2α2+ ... +Xnan^R положим f(x) — λ1. Непосредственно проверяется, что полученное таким образом отображение f: R —► D является линейным функционалом, причем f(ai) = 1. Представим / в виде линейной комбинации векторов базиса fu ..., fn: / = μ'/ι +·.. +μηίη. Отсюда вытекает, что μ1/1(αΙ)+ ... +μηίη(αι) = ϊ(αι)=1. Следовательно, хотя бы одно из чисел fi(fli), ···» Μ^ι) отлично от нуля, и потому φ (αϊ) =7^=0. Итак, никакой отличный от нуля вектор fliGi? не принадлежит ядру Кег φ, т. е. Кег φ есть тривиальное подпространство. Из теоремы 15.3 вытекает теперь, что dim(Imq)) = dim7? = = η, т. е. Irncp = Rn. Таким образом, φ есть изоморфизм пространства R на пространство Rn. Обозначим через еи е2, ..., еп векторы пространства /?, удовлетворяющие соотношениям Ф(е,) = {1, 0 0, ..., 0, 0}, Ф(*2) = {0, 1, 0, ..., 0, 0}, ф(е„) = {0, 0, 0, ..., 0, 1}. Векторы еи е% ..., еп составляют базис векторного пространства R. Из соотношения tfife), f2(et), ..., Μ**)} = Φ(**) = {0, 0, ..., 1, ..., 0} (единица стоит на j-м месте) и вытекает справедливость соотношений (15.12). Равенство же (15.14) является непосредственным следствием соотношений (15.12), (15.13),
124 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [16 16. Евклидово векторное пространство. Определение 16.1. Векторное пространство R называется евклидовым векторным пространством, если в нем определена операция скалярного умножения векторов, сопоставляющая каждым двум векторам а, Ь е R дейс1 вительное число аб, называемое скалярным произведением векторов а, 6 и удовлетворяющее следующим аксиомам. IV группа: аксиомы скалярного произведения. IVi. Скалярное умножение коммутативно, т. е. для любых двух вектрров ае/?, Ь е R справедливо соотношение db == Ьа. IV2- Скалярное умножение дистрибутивно, т. е. для любых трех векторов a^R, b&R, c&R справедливо соотношение a(b + c) — ab + ac. IV3. Для любых векторов a^R, b ^R и любого действительного числа λ справедливо соотношение (λα)* —λ (а*). IV4. Для любого отличного от нуля вектора asU скалярное произведение аа этого вектора tia себя (называемое скалярным квадратом вектора а и обозначаемое также символом а2) положительно: а2 > О при а Ф 0. Множество R, удовлетворяющее всем аксиомам I, II, III и IV групп, называется n-мерным евклидовым векторным пространством. Пример 16.2. Рассмотрим снова векторное пространство Π примера 12.1 и следующим образом введем в нем скалярное умножение векторов.,Пусть А и В— два произвольных вектора (т. е. две точки плоскости Я; вместо точек можно рассматривать соответствующие радиусы-векторы О А, ОВ). Если хотя бы один из этих векторов является нулевым (т. е. совпадает с точкой О), то скалярное произведение А-В этих двух векторов считается равным нулю (т. е. 0-0 = О· β = А О = 0). Если же оба вектора Л, В отличны от нуля (т. е. ни одна из точек Л, В 'не совпадает с О), то скалярное произведение этих векторов определим формулой Л-В = (дл. О А) (ял. OB)cos(Z АОВ) (рис. 45); здесь символы дл. ОЛ, дл. ОВ означают обычную длину отрезков О А, ОВ. Из курса элементарной (или анали-
§ 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 125 16J тической) геометрии известно, что определенное таким образом скалярное умножение удовлетворяет всем аксиомам IVi—IV4, е указанное введение скалярного умножения превращает Π в (двумерное) евклидово векторное пространство. Такое же введение скалярного произведения превращает трехмерное пространство Σ примера 12.1 в трехмерное евклидово векторное пространство. Пример 16.3. Рассмотрим л-мерное арифметическое векторное пространство Рис. 45. (см. пример 12.2) и введем в нем скалярное умножение следующим образом: для любых двух векторов * = {*', ..., х% у = {у\ .... уп) положим ху = х1у1+ ... +*V· Непосредственно проверяется, что введенное таким образом скалярное произведение удовлетворяет всем аксиомам IVi—IV4. Таким образом, пространство Rn с указанным скалярным произведением представляет собой n-мерное евклидово векторное пространство. Выведем теперь ряд следствий из аксиом IV группы. Прежде всего заметим, что из аксиом IV2, IV3 вытекают в силу аксиомы IVi соотношения (а + 6) с = ас + be, a (Kb) = λ (ab). Используя эти соотношения и аксиомы IV2, 1Уз, получаем соотношение Σ α^)(Σβ/6/)= Σ Σ α,β/ία,*,), (16.1) показывающее, что'' при скалярном умножении двух линейных комбинаций векторов можно пользоваться обычным «правилом умножения многочленов». Отсюда (с4 учетом аксио мы коммутативности IVi) вытекает справедливость формул (а ± bf = α2 ± 2аЬ + Ь\ (а + Ъ) {а - 6) = а2 - б2 и правила возведения многочлена в квадрат: Заметим еще, что для любого вектора а справедливы соотношения θα = 0, аО = О (вытекающие, например, из аксиомы 1Уз).
126 ГЛ. И. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [16 Определение 16.4. Длиной вектора а (принадлежащего евклидову векторному пространству) называется число У а2. Длину вектора а обозначают символом \а\ или той же буквой, которой обозначен вектор, но напечатанной светлым шрифтом: |α|«=α = ν^. Из этого определения непосредственно вытекает соотношение а2 = а2 (для любого вектора а). Теорема 16.5. Для любых векторов а, Ъ евклидова векторного пространства R справедливы соотношения |а6|<а6, (16.2) | λα | = | λ |α, \а + Ь\<\а\ + \Ь\ (16.3) (λ — произвольное действительное число). Доказательство. Рассмотрим вектор ха-\-Ь, где χ — действительное число. В силу аксиомы IV4 (и соотношения О2 = 0) скалярный квадрат этого вектора есть число неотрицательное: (ха + Ъ)2^0. Раскрывая скобки, получаем отсюда (учитывая соотношения а2 = а\ Ь2 = Ъ2) a2x2 + 2(ab)x + b2>0. Написанное неравенство справедливо для любого действительного числа х, т. е. квадратный трехчлен a2x2 + 2{ab)x + b2 принимает (при всех х) только неотрицательные значения. Отсюда вытекает, ЧТ9 дискриминант этого квадратного трехчлена неположителен: (2α6)2-4α2ί>2<0. Таким образом, (α6)2<α262, или |а6|<а6. Далее, мы имеем | λα | = УЩ2 = УШ2 = УШ2 = \ λα | = | λ \α (так как а ^ 0).
16] § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 127 Наконец, используя уже доказанное неравенство (16.2), находим Замечание 16.6. Предположим, что оба вектора а, Ь отличны от нулевого вектора (так что а > О, b > 0). Тогда соотношение (16.2) можно переписать в виде nh — α&<α&<α&, или —1<—г-<1. Из этих неравенств следует, что существует угол φ (удовлетворяющий неравенствам 0 <ζ φ ^ π), для которого C0S(p = "S~' (Ι6·4> или ^ab = ab cosy. (16.5) По аналогии с обычным определением скалярного произведения (известным из аналитической или элементарной геометрии, ср. пример 16.2) угол φ, определяемый равенством (16.4) (т. е. удовлетворяющий соотношению (16.5)), можно назвать углом между векторами а и Ь в евклидовом векторном пространстве. Однако, как правило, при рассмотрении евклидова векторного пространства вычисление углов между векторами (по формуле (16.4)) не производят, а предпочитают пользоваться непосредственно скалярными произведениями. Тем не менее, в целях наглядности (и по привычке) нередко говорят, что «векторы а и Ь образуют острый угол» (или образуют прямой угол, или тупой) в зависимости от того, будет ли число cos φ, вычисленное по формуле (16.4), положительно (отрицательно, равно нулю). Итак, векторы а, Ь образуют острый угол, если аЬ > 0; векторы а, Ь образуют тупой угол, если ab < 0; векторы а, Ъ образуют прямой угол, если оба они отличны от нулевого вектора и ab = 0. В последнем случае чаще пользуются термином «ортогональные» векторы. Именно, два вектора а, Ь называются ортогональными, если ab = 0 (причем безразлично, являются ли векторы отличными от нуля). Иначе говоря, если векторы а и Ь ортогональны, то либо оба они отличны от нулевого вектора и образуют прямой угол, либо же хотя бы один из этих векторов равен нулю (и тогда угол между ними не определяется). Этой терминологией мы также будем пользоваться в дальнейшем,
128 ГЛ. It. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ П6 Система векторов еь ...,е* в евклидовом векторном пространстве R называется ортонормированной, если векторы еи ... ,£& попарно ортогональны друг другу и каждый из них имеет длину,* равную единице. Таким образом, условие орто- нормированности системы векторов еи ..., е& можно записать в виде m при 1Фк eie} = \i . . (16.6) 1 U при 1=]. Теорема 16.7. Всякая ортонормированная система векторов является линейно независимой. Доказательство. Пусть еи ..., β* — ортонормированная система векторов. Предположим, что а1ег+ ... +аЧ = 0. (16.7) Умножим обе части этого равенства скалярно на вектор е\ (где г — одно из чисел 1, ..., к). Тогда в силу (16.6) мы получим: а* = 0. Так как это справедливо для любого i = 1, ..., &, то все коэффициенты в левой части равенства (16*7) обращаются в нуль. Таким образом, векторы βι, ..., е& линейно независимы. Теорема 16.8. Всякую ортонормированную систему векторов ei, ..., ви в n-мерном евклидовом векторном пространстве можно (при k < η) дополнить до ортонормированного базиса. В частности, отсюда следует, что во всяком n-мерном евклидовом векторном пространстве существует ортонормированный базис βι, ..., еп. Доказательство. Пусть eh ..., е& — ортонормированная система векторов в R, причем k <; п. Так как векторы еи ..., е* линейно независимы (теорема 16.7), то в силу теоремы 13.8 эту систему векторов можно некоторыми векторами fh+u ♦. ♦, fn дополнить до базиса 01» · · ·> £fei fk+U · · м fn пространства R. Конечно, этот базис не будет, вообще говоря, ортонормированным. Возьмем векторы еь ..., е^ fh+\ (они линейно независимы) и попытаемся подобрать коэффициенты αϊ, ..., ан так, чтобы вектор /*+ι+«ι*ι+ ··· +^kek (16.8) был ортогонален всем векторам е\, ..., ей. Составляя скалярное произведение вектора (16.8) на вектор е\ (где i — одно из чисел 1, ..., k) и приравнивая это скалярное произведение нулю, получаем (в силу (16.6)) *ifk+\ + «* ™ 0; . τ с ai=—eifk+i (/ = 1 k). (16.9)
16) § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 129 Итак если коэффициенты аь ..., ah определить соотношениями (16.9), то вектор (16.8) —обозначим его в этом случае через вл+i— будет ортогонален всем векторам еи ..., ек. Заметим что вектор e'k+i отличен от нуля (действительно, вектор (16 8),отличен от нуля, так как векторы еи ..., еку /м-ι линейно независимы). Однако возможно, что длина этого вектора отлична от единицы. Положим 0 \_0, вк + \ —Т~7 Г^Л + 1· Вектор еи+\, по-прежнему, ортогонален всем векторам еи...,еи и, кроме того, его длина, как легко видеть, равна единице. Таким образом, векторы еь...,еА, ek+\ образуют ортонормированную систему. Итак, если k < η, то ортонормированную систему еи ..., ek можно дополнить одним вектором eh+\ до ортонормированной системы, состоящей из k + 1 векторов. Если k + 1 < я, то таким же образом мы добавим еще один вектор и получим ортонормированную систему, состоящую из k + 2 векторов. Продолжая таким образом, мы получим в конце концов ортонормированную систему еи..., еп, состоящую из η векторов, т. е. (в силу теоремы 16.7) получим ортонормирован- ный базис пространства R. Теорема 16.9. Пусть е\у...,еп —ортонормированный базис п-мефного евклидова векторного пространства R. Тогда для любых векторов х = х1е{+ ... +хпеП9 у = у1е{ + ... + упеп пространства R их скалярное произведение вычисляется по формуле ху = *1У1+ ... +хпуп. В частности, i*i=vV)2+ ... +ю2. Доказательство непосредственно вытекает из формул (16.1) и (16.6). Следствие 16.10. Любые два n-мерных евклидовых векторных пространства изоморфны между собой. Иначе говоря, если R и S — два n-мерных .евклидовых векторных пространства, то существует изоморфизм φ: R -* 5, который сохраняет скалярное произведение, т. е. ху = φ(*)φ(#) для любых векторов x9y^R. В самом деле, пусть йи ...,αη —- ортонормированный базис пространства R и Ъи ...,6П — ортонормированный базис пространства S. Используя эти базисы, построим изоморфизм φ: /?-*S, как в доказательстве теоремы 13.12. Так как при этом
130 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [16 изоморфизме сохраняются координаты векторов, то в силу теоремы 16.9 изоморфизм φ сохраняет скалярное произведение. Определение 16.11. Пусть R— евклидово векторное пространство и Л — некоторое его подпространство. Вектор χ е R называется ортогональным подпространству Л, если он ортогонален каждому вектору, принадлежащему подпространству Л, т. е. ху = 0 при у^А. Множество β всех векторов *е/?, ортогональных подпространству Л, называется ортогональным дополнением подпространства Л (в пространстве /?). Теорема 16.12. Пусть R— евклидово векторное пространство, А — его подпространство и В — ортогональное дополнение подпространства Л. Тогда В есть подпространство, представляю- щее собой дополнение подпространства А. В свою очередь А есть ортогональное дополнение^ подпространства В. Доказательство. Подпространство Л само является евклидовым векторным пространством (как подпространство пространства /?), и потому согласно теореме 16.8 в Л существует ор- тонормированный базис в\, ..., ё&, где k = dim Л. В силу той же теоремы 16.8 систему векторов еи ..., ek можно дополнить векторами ви+и . · ·, еп до ортонормированного базиса е\у ..., eki eh+u · · ·, вп пространства /?, где η = dim R. Обозначим через С подпространство, порожденное векторами ek+u .. ·, ^п, т. е. подпространство, состоящее из всех векторов вида α^+ιβ/^-ι + · · · ... + αη*η. Так как каждый из векторов ek±u ..., еп ортогонален всем векторам еь ..., eh, то он ортогонален и любой линейной комбинации этих векторов, т. е. любому вектору *еЛ. Но тогда и любой вектор у = α*+ιβΜ-ι + ... + (х>пСп подпространства С ортогонален произвольному вектору *еЛ, т. е. у^В. Тем самым доказано включение С а В. Обратно, если вектор ζ = а{е{ + · · · + щек + ak+lek+l + ... + «лел принадлежит множеству 5, т. е. ортогонален подпространству Л, то ze\ = 0, ...,zeh =*= 0, откуда следует, что αϊ = ... = α* = 0, и потому г = ал+1ел+1+ ... +саеС. Таким образом, В с: С. Мы видим, что В = С, т. е. В есть подпространство, порожденное векторами .еА+ь ...,еп. Отсюда без труда вытекают все утверждения теоремы. Следствие 16.13. Пусть А—подпространство евклидова векторного пространства R. Тогда каждый вектор x^R однозначно представляется в виде χ = х\ + дс2, где Х\^ А, а вектор х2 ортогонален подпространству А (г. е. принадлежит ортогональному дополнению В подпространства А). Вектор Х\ назы-
16] § 4. ВЕКТОРНОЕ ПРОСТРАНСТВО 131 вается ортогональной проекцией вектора χ на подпространство А. Доказательство непосредственно вытекает из теорем Следствие 16.14. Пусть А — подпространство евклидова векторного пространства R. Для каждого вектора x^R обозначим через п(х) ортогональную проекцию вектора χ на подпространство А. Получаемое отображение π пространства R в себя (называемое ортогональным проектированием на подпространство А) является гомоморфизмом. При этом Ιιτιπ = = А Кег π = В, где В — ортогональное дополнение подпространства А. Доказательство непосредственно вытекает из теоремы 15.7, следствия 16.13 и определения 15.6. Теорема 16.15. Пусть R, S —евклидовы векторные пространства и φ: R -* S — некоторый гомоморфизм. Тогда существует такое число Μ > О, что \φ(α)\ < М\а\ для любого a^R. Доказательство. Пусть еи ..., еп — ортонормированный базис пространства R. Положим А1-|ф(е,)|+ ... +|ф(ея)|. Тогда для любого вектора а = х1е1 + ... +xnen(=R мы имеем \х*\=*У(х*У<У{х1Г+ ··· +(*й)2~1*1. ' = 1, ..., /г, и потому Ιφ(α)| = |φ(*ιβΙ+ ... +хпеп)\ = \х1<р(е{)+ ... +**φ(βΛ)|< <и1Ф(е1)|+...+илФ(^)|=и1|-1ф(е1)|+...+ил|Чф(ел)|< <Ι α 1 -1 Φ («01+... +1 α I -1 Φ (О N=1 α I - О Φ («ι) Ι+- - -ΗΗ φ (βΛ) |)— = Λί|α|. В заключение рассмотрим вопрос о записи линейных функционалов в евклидовых векторных пространствах. Теорема 16.16. Пусть f — произвольный линейный функционал, заданный на евклидовом векторном пространстве R. Тогда существует и притом только один вектор бе/?, обладающий тем же свойством, что f(x) = bx (для любого x&R). Вектор Ь называется градиентом линейного функционала f и обозначается через grad/. Доказательство. Введем в пространстве R ортонормированный базис βι,...,βη (где η = dim/?) и положим 0ι=/(?ι)> ···> % = /(«*)·
132 ГЛ. И. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ U€ Здесь αϊ, ..., ап — действительные числа. Через Ь обозначим вектор Ь = ахех + ... +апеп. Если теперь х=*х1ех + ... +хпеп -"— произвольный вектор пространства /?, то мы имеем /(*) = /(*'*,+ ... +хпеп) = = xlf(e{)+ ... + xnf(en) = xlax + ...+xnan = xb = bx (см. теорему 16.9). Таким образом, требуемый вектор Ь найден. Докажем, что этот вектор — единственный. Пусть Ъ' — другой вектор, обладающий тем же свойством: f (х) = bxt f (χ) = Ь'х для любого x&R. Тогда Ьх — Ь'х = О, т. е. (&_&')* = 0. Это соотношение справедливо для любого x&R. Подставляя, в частности, х= Ь — &', находим: (Ь — б')2 = 0, откуда Ь — Ь' = О, или Ь = &'. Теорема 16.17. Пусть R— евклидово векторнре пространство и R* — сопряженное ему пространство. Отображение φ: /?* -* R9 определенное формулой q>(/) = grad/, /е=Д\ является изоморфизмом пространства R* на R. Доказательство. Пусть ft, f2^R*, т. е. f\ и /2— линейные функционалы на R. Положим 4>(fi) —*ι. φ(/ί) = *2 т. е. bx—gvadfl9 &2 = gradf2. Согласно теореме 16.16 мы имеем /ι (*) = Ь\Х, /2 (х) = Ь2х для любого χ е /?. Следовательно, (/ι + /2) (*) = /ι (*) + U (*) = Μ + Μ = (6ι + b2) х9 т. е. grad (fx + /2) =61 + Ь2. Иначе говоря, φ (ft + h) = Φ (/ι) + + φ(/2). Аналогично доказывается, что φ(λ/) = λφ(/). Таким образом, отображение φ является гомоморфизмом. Остается доказать, что отображение φ взаимно однозначно. Пусть b&R. Положим f(x) = Ьх. В силу аксиом IVi—IV3 отображение / обладает свойствами (13.10), т. е. является линейным функционалом на /?. Ясно, что grad/= 6. Таким образом, для любого вектора b^R найдется функционал /, для которого
17! § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 133 (f\ =Ь т. е. φ есть отображение пространства R* на все про- СТРп7сть° теперь φ(/ι) = Ф(/2>- Тогда (поскольку φ —гомоморфизм) φ β - f2) — φ (/ι) - Φ (/2) — 0, т. е. grad (f{ - f2) = О, Это означает, что (/ι —/2)*-0*-Ό для любого * е R, т. е. ^1(х)_/8(ж) — 0> или /,(*)еэЫ*). Итак> если <p(/i)=<p(b), то /l = f2- Замечание 16.18. Разумеется, тот факт, что пространства R* и R изоморфны, не является новым: он справедлив для л ю- бого n-мерного векторного пространства (см. теорему 13.12 и соотношение aimR* = dimR в конце п. 15). Однако наличие скалярного произведения в евклидовом векторном пространстве позволяет установить изоморфизм между пространствами R* и /?, который не связан с выбором базисов в этих пространствах;^ такой, изоморфизм φ и построен в теоремах 16.16, 16.17. Заметим, что в силу этого изоморфизма скалярное произведение, рассмотренное в конце п. 15, переходит в скалярное произведение, имеющееся в R. Иначе говоря, если R — евклидово векторное пространство, то для любых элементов х е /?, /ей* справедливо соотношение (*,/)-*<p(F) (где <p(f) =grad/); здесь слева стоит скалярное произведение, рассмотренное в п. 15, а справа — скалярное произведение в пространстве R. § 5. Евклидова геометрия 17. Определение аффинного пространства. Свойства векторных пространств, рассмотренные в предыдущем параграфе, Рис 46. Рис. 47. могут быть геометрически интерпретированы в векторном пространстве Σ (см. пример 12.1). Например, каждая прямая, проходящая в пространстве Σ через точку О, представляет собой одномерное подпространство, а всякая плоскость, проходящая мая Точку ^' — Двумерное подпространство. Если при этом пря- не лежит в плоскости (рис. 46), то она является прямым
134 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [17 дополнением этой плоскости, а если прямая перпендикулярна к плоскости, то — ортогональным дополнением. Простую геометрическую интерпретацию имеет также ортогональное проектирование (рис. 47) и другие рассмртренные понятия. И все же введенные понятия и доказанные теоремы носят скорее алгебраический, чем геометрический характер. При рассмотрении примера 12.1 это выразилось в том, что мы фиксировали в плоскости Π (или пространстве Σ) некоторую точку О и рассматривали только векторы (направленные отрезки), исходящие из точки О (или, как говорят, «связанные» векторы), а в качестве подпространств рассматривали только прямые и плоскости, проходящие через О. Все это вовсе не диктуется геометрическими свойствами плоскости (или пространства); напротив, геометрически все точки равноправны, и наделение одной точки О исключительными свойствами представляется несколько искусственным. Кроме того, для геометрии характерно рассмотрение не только векторов, но и точек; рассмотрение не только'прямых и плоскостей, проходящих через О, но также прямых и плоскостей, не проходящих через эту точку. Иными словами, векторное пространство отличается от той трактовки пространства, к которой мы привыкли в курсе геометрии (элементарной или аналитической). В этом пункте мы опишем понятие аффинного пространства, полностью отвечающее нашим интуитивным представлениям о геометрическом пространстве в отношении всех свойств, кроме метрических. Метрические свойства будут описаны в п. 21. Для того чтобы сделать более естественным и понятным излагаемое ниже определение аффинного пространства, напомним, что в геометрии (элементарной или аналитической), кроме «связанных» векторов (исходящих из точки О), рассматривают также свободные векторы, причем от каждой точки А можно «отложить» вектор АВ, «равный» заданному вектору а (рис. 48). Другими словами, если заданы точка А и вектор а, то найдется такая точка В, что АВ = а. Мы привыкли представлять себе (и изображать) точки и векторы на одном и том же экземпляре плоскости (или в одном и том же пространстве), однако для большей ясности можно представить себе два как бы рядом расположенных экземпляра плоскости, на одном из которых фиксирована точка О и изображаются связанные векторы, а на другом изображаются точки и свободные векторы (рис. 49): Экземпляр плоскости, на котором изображаются связанные векторы, обозначим через R; он представляет собой двумерное векторное пространство, рассмотренное в примере 12.1. Второй экземпляр (на, котором изображаются, точки и свободные векторы) обозначим через X. В плоскости X нет никакой фиксированной тон·
171 § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 135 (τ е все ее точки равноправны); она-то и представляет собой «'геометрическую» плоскость. Для любого вектора α (т. е. элемента векторного пространства R) и любой точки Л е=Х найдется в плоскости X такая точка В, что направленный отрезок Л5, идущий в плоскости X от точки Л к 5, «равен» вектору а: АВ = а. Указанные соображения и лежат в основе аксиоматического определения аффинного пространства. Мы изложим его следующим образом. У Αν' Рис. 48. Рис. 49, Пусть R — векторное пространство размерности η и X — некоторое множество, элементы которого называются точками. Пара (/?; X) называется n-мерным аффинным пространством, если каждым двум точкам Л, В^Х сопоставлен некоторый вектор, обозначаемый через АВ (и принадлежащий векторному пространству /?), причем выполнены следующие аксиомы. V группа: аксиомы откладывания векторов. Vi. Для любой точки A g^ и любого вектора аеR найдется такая точка В'еХ что АВ = а (нахождение такой точки В называют откладыванием вектора а от точки Л). V2. Для любых трех точек А, В; СеХ справедливо соотношение АВ + ВС + СА = 0. V3. Если для точек Л, В е X справедливо соотношение АВ = = 0, то точки А и В совпадают. Перейдем к рассмотрению простейших фактов, вытекающих из аксиом откладывания векторов. Теорема 17.1. Для любой точки А^Х справедливо соотношение АА = 0. Для любых двух точек Л, В е X справедливо соотношение А В = —В А.
136 ГЛ. И. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [J7 Доказательство. Для трех совпадающих точек А = В = = С мы имеем в силу аксиомы V2 или ЗЛЛ = 0. Умножая это равенство на у, получаем АА=0. Далее, заменив в аксиоме V2 точку С точкой Л, получим АВ + ВА + АА — О, откуда в силу уже доказанного соотношения ДЛ = 0, находим АВ + ВА = 0, т. е. ЛВ = — ВА. Теорема 17.2. Для любых точек Аи Л2 4еХ справедливо соотношение А1А2 + А2Аз+ ... +Ak-lAk = AlAk. Доказательство получается по индукции с помощью, аксиомы V2 и соотношения АВ = —ВА. Теорема 17.3. Если действительные числа α1,...,α3 обладают тем свойством, что а!+ ... +<х' = 0, то для любых точек Q, Q', Аи ..., As справедливо соотношение Доказательство непосредственно получается из Соотношений QAt^QQ' + tpAi, * = 1, ..., s. На основании теоремы 17.3 мы введем теперь некоторые удобные для дальнейшего обозначения. Пусть λ1, ..., λ8 — действительные числа, удовлетворяющие условию V+ ... +λ*=1, (17.1) и пусть Q, Л, AU.,.9AS^X — такие точки, что имеет место равенство QA - VQAi - ... - VQAS = 0. (17.2) Так как сумма коэффициентов в левой части (17.2) равна нулю, то согласно теореме 17.3 для любой точки Q'ei справедливо соотношение Q'A-VtyA^ ... -XsQ'As = 0. Иными словами, если при выполнении соотношения (17.1) имеет место равенство (17.2), то это равенство в действитель-
§ 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 137 ости не связано с выбором точки Q, а выражает некоторую зависимость только между точками Л, Аи ..., А8. Мы условимся r этом случае писать вэтом у Л = Я!Д+ .... +λΜ,. (17.3) Таким образом, соотношение (17.3) мы будем писать только в случае, когда выполнено равенство (17.1) и будем понимать соотношение (17.3) в том смысле, что для некоторой (а потому и для любой) точки Qe^i справедливо равенство (см. (17.2)) θ!=τ=λΙθί+ ... +KSQAS. (17.4) Теорема 17.4. Пусть λ1,..., λδ — действительные числа, удовлетворяющие условию (17.1), и Аи ..., А8^Х— произвольные точки. Тогда существует и притом только одна точка Ле^, удовлетворяющая соотношению (17.3). Доказательство. Выберем (и фиксируем) произвольную точку Q е X. Равенство (17.3), по определению, равносильно соотношению (17.4) (поскольку условие (17.1) выполнено). Таким образом, нам нужно доказать существование и единственность точки Л, удовлетворяющей соотношению (17.4). Так как точки Q, Ль ..., А8 и числа λ1, ..., λ8 известны, то в правой части соотношения (17.4) стоит известный вектор; обозначим его через а. Таким образом, речь идет о доказательстве существования и единственности точки Л, удовлетворяющей со- QA = a9 <w 5тД/4? отношению где Q — фиксированная точка. Существование такой точки непосредственно вытекает из аксиомы Vi. Докажем единственность. Пусть Л, Л' — две точки, удовлетворяю- рис> 50. щие поставленному условию, т. е. QA—at QA' = a. Тогда 'QA^QA\ и потому AA'=*AQ + QA' = = —- QA + QA' = 0. Из аксиомы V3 вытекает теперь, что точки Л и Л' совпадают. Пример 17.5. Введем понятие отрезка в аффинном пространстве. Пусть Л и В— две различные точки пространства X. Говорят, что точка С принадлежит отрезку [Л, В], если векторы АВ и АС связаны соотношением (рис. 50) АС = КАВ, где 0<λ<1. (17.5) Ясно, что обе точки Л, В принадлежат отрезку [Л, В]\ они называются концами (или концевыми точками) отрезка [А, В].
138 ГЛ. П. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [17 Точка С, для которой число λ в соотношений (17.5) равно 1/2, называется серединой отрезка [Л, β]; она обладает тем свойством, что АС = СВ. Иногда бывает нужно рассматривать отрезок [Л, В],'не зная заранее, различны ли точки Л и β. В таких случаях удобно вводить в рассмотрение «отрезок» с совпадающими концами Л = β, состоящий, по определению, из одной только точки Л. Такой отрезок называется вырожденным. Это соглашение позволяет рассматривать «отрезок [Л, β]» для любых точек Л и β, совпадающих или различных. Пусть С — произвольная точка отрезка [Л, В]. Возьмем произвольную точку Q пространства X. Тогда № = QC~-QA, AB = QB~QA> и потому соотношение (17.5) (справедливое, поскольку С е [Л, β]) принимает вид откуда или, иначе, QC-QA = K(QB — QA)t 0<λ<1, 0С==(1~.Я)0В + Я0Л, 0<λ<1, С = (1—λΜ + λΒ, 0Χλ<1. (17.6) Проводя вычисления в обратном порядке, мы из соотношения (17.6) получим соотношение (17.5). Следовательно, если точка С удовлетворяет соотношению (17.6), /го С^[А, В]. Таким образом, справедливо следующее предложение: Точка С в том и только в том случае принадлежит отрезку [Л, β], если имеет место соотношение (17.6). Если Л и β — различные точки, то все точки отрезка [Л, β], кроме его концов А и В, называются внутренними точками этого отрезка. Множество всех внутренних точек отрезка [Л, β] обозначается через (Л, β) и называется интервалом с концами Л и β. Таким образом, концы Л и β не принадлежат интервалу (Л, β). Присоединяя к интервалу (Л, β) одну из его концевых точек Л или β, мы получаем полуинтервалы: [Л, β) и (Л, В]. Пусть Л о, А\х...,Аь^Х. Если какую-либо из этих точек, скажем, Л0, можно выразить через остальные точки следующим образом (см. (17.3)): Ло = ЯЧ+ ... +XkAk9 где λ'+ ... +λ* = 1, то мы будем говорить, что точки Л0, Au...,Ak зависимы. Если же никакую из них нельзя выразить через остальные, то точки Лр, Л ι,..., Л ft независимы,
ς б. ЕВКЛИДОВА ГЕОМЕТРИЯ 139 Теорема 17.6. Точки А0, Au...fAheX в том и только в том случае независимы, если векторы А0А{,..., A0Ak линейно независимы. __ „ „ „ -, Доказательство. Пусть точки Л0, Au...,Ak зависимы. Тогда одна из них, скажем, Аи может быть выражена через осталь- ные: Α. = λοΑο + λιΆι+ ... +XkAkt где в правой части точка А{ не встречается (т. е. %i = 0), причем ^ο_^_χΐ_}__ -f λ* = 1. Это означает (см. (17.4)), что Wi = WQA> + VQAi+ ... + λ*θΖ, где q — произвольная точка пространства X. В частности, при Q = Л0 получаем причем λ' —0. Таким образом, векторы А0А{ A0Ak линейно зависимы. Обратно, пусть векторы АИь · ·> A0Ak линейно зависимы. Тогда один из них, скажем, А0А}, можно выразить через остальные: Α3/ = λ1ΑΑ+ ... +ЬкАоАк9 где λ' = 0. Положим λ° = 1 — λ1 — ... — λ*. Тогда λ° + λ* + .. · ... + Xk = 1 и имеет место соотношение т. е. соотношение (17.4) при Q = A0. Следовательно, Α! = λ°Α0 + λιΑχ + ... -ΗλΜ*. Так как Xj = 0, то это означает, что точка Aj может быть выражена через остальные, т. е. точки Л0, Au...,Ak зависимы. Теорема доказана. Пусть a\...,as — действительные числа, удовлетворяющие ус* ловию а1+ ... +а5 = 0, (17.7) и Аи...,As — некоторые точки пространства X. Тогда в силу теоремы 17.3 вектор а —а!ЙГ+ ... +<*SQAS (17·8) не зависит от выбора точки Q. Мы условимся обозначать этот вектор а через β-αΜ,+ ... +аМ„ (17.9)
140 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [17 подчеркивая этим обозначением, что вектор а зависит только от чисел а1, ..., as и точек Ль ..., Д8^1 Иначе говоря, запись (17.9) будет применяться только при выполнении условия (17.7) и будет пониматься в смысле (17.8). Пусть, в частности, Л и В— две точки пространства X. Рассмотрим вектор ,α — Β-Λ, (17.10) т. е. вектор 1β+(—1)Λ (здесь сумма коэффициентов равна нулю, т. е. условие (17.7) выполнено). Равенство (17.10) означает, по определению, что а = QB — QA. Но QB — QA = АВ. Таким образом, мы имеем АВ = В-А, (17.11) т. е. в силу принятых обозначений вектор АВ (см. аксиомы Vi— V3) можно также обозначать через В — А. В соответствии со сказанным, мы будем также пользоваться обозначением типа А + а, где ЛбХ,аеЛ. Смысл этого обозначения следующий: запись В =± А + я означает, по определению, то .же самое, что и а = В — Л, т. е. а = АВ. Таким образом, запись В = А + а означает, что В есть точка, которую мы получаем в результате откладывания вектора а от точки А (см. аксиому Vi). Теорема 17.7. Пусть (/?, X) — аффинное пространство. Фиксируем в X некоторую точку О и условимся все точки пространства X называть векторами, а сложение этих векторов и умножение их на действительные числа определим следующими соглашениями: будем писать С = А + В, если С = А+В — 0 (Л, β, С е Ζ), будем писать D = λΑ, если D — %А + (1 — λ)О (ДОе^). Оказывается, что такое введение операций превращает X в векторное пространство, изоморфное R. Отображение φ: X-+R, определяемое формулой ср(Л)=ОЛ, является изоморфизмом. Доказательство. Прежде всего заметим, что отображение φ: X-+R, определенное формулой (р(Л) = ОА, является взаимно рднозначным (это непосредственно вытекает из аксиом Vi и V3). Поэтому для доказательства теоремы достаточно установить соотношения <р(Л + Я) = ср(Л) + <р(В), φ(λΑ) = λφ(Α); (17.12) этим будет доказано, что в X выполняются аксиомы I и II групп (так как в R они выполняются), т.е. будет доказано, что X — векторное пространство, и одновременно будет доказано, что φ — изоморфизм.
17) § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 141 Запись С = А + β, т. е. С = А + В — О, означает, что QC = = QA + QB — QO для любой точки Qel В частности, при 0 = 0 мы получаем ОС = ОА + ОВ, т. е. ф(С) = у(А) + φ(β). Итак, если С = Л + В, то (р(С) = Ф(Л) + <р(Я), чем установлено первое из соотношений (17.12). Далее, запись D = ?Ajr. е. D = λΑ + (I — λ)О, означает, что QU = λθ2 + (1 —X)QD для любой точки QeI В частности/при Q = О мы получаем OD = λΟΑ, τ. е. cp(D) = λφ(Α). Этим установлено второе соотношение (17.12). Замечание 17.8. Итак, если в пространстве X фиксирована некоторая точка О, то X превращается в векторное пространство. В этом случае имеет смысл линейная комбинация с, любой суммой коэффициентов λ1 + - + λ*: эту линейную комбинацию мы можем понимать, как λιΑχ+ ... +λ% + 0-λΙ— ... —λ*) Ο, где теперь уже сумма коэффициентов равна единице. Имейно так мы осмыслили сумму А + В (как А + В — О) и произведение λΑ (как λΑ + (1 —-λ)О) в формулировке теоремы 17.7. Отметим еще, что определение суммы в теореме 17.7, т. е. соглашение принять за сумму точек А и В точку С = А^{-В — 0, можно записать в виде С + О = А + #, или а это означает, что середина отрезка [О, С] совпадает с серединой отрезка [Л, В]. Таким образом, операции, введенные в теореме 17.7, полностью согласуются с примером 12.1. Замечание 17.9. Изложенная в этом пункте концепция аффинного пространства основывалась на раздельном рассмотрении пространства векторов R и пространства точек X. Однако можно было бы эти пространства и совместить. Именно, если R— векторное n-мерное пространство, то можно было бы условиться считать элементы множества R (т. е. векторы) в то же время и «точками», т. е. называть каждый элемент множества R то вектором, то точкой, в зависимости от обстоятельств. В этом случае, если Л, В — две «точки» (т. е. Л, Бе R), то под «вектором» АВ следует понимать разность А —В (ср. (17.11)), имеющую смысл в R, так как R — векторное пространство. Переходя к обычным обозначениям элементов векторного пространства (а, 6, с,... вместо Л, β, С,...), мы опишем тогда операцию откладывания векторов следующим образом. Каждым
142 ГЛ. И. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ (18 двум точкам a, b^R сопоставляется вектор Ь — ае/?, называемый вектором, идущим от точки а к точке Ь, Аксиома Vi означает в этом случае, что для любой точки ае/? и любого вектора c^R найдется такая точка x^R, что вектор, идущий от точки а к лс, равен с, т. е. х — а = с, или χ = а + с. Таким образом, в этом случае откладывание вектора с от точки а означает переход к точке а + с. Мы видим, что при такой трактовке векторов и точек аксиома Vi выполняется в любом векторном пространстве. Столь же просто проверяется выполнение аксиом V2 и V3. Итак, при указанной трактовке любое векторное пространство превращается вместе с тем в аффинное пространство, т. е. в одном и том же множестве R рассматриваются и точки и векторы. Другой вариант совмещенной трактовки (т. е. рассмотрения точек и векторов в одном и том же пространстве) может быть получен на основе теоремы 17.7: так как выбор фиксированной точки О е X превращает X в векторное пространство, изоморфное R, то можно ограничиться одним только множеством X, рассматривая в нем и точки и векторы. По-видимому, все же раздельная трактовка (множества R и X) является более простой и наглядной. В дальнейшем читатель может избрать для себя любую из этих точек зрения. Точнее, мы будем говорить о точках и векторах в множествах R и X соответственно (раздельная трактовка), но читатель может при желании считать R и X совпадающими. 18. Плоскости в аффинном пространстве. Пусть (R, X) — аффинное пространство. Множество Ρ с= X называется плоскостью (или линейным многообразием), если для любых точек А\,...,А8еР и любых дейстительных чисел μ1,..., μδ, удовлетворяющих условию μ1 + ... + μ8 = 1, точка А = μ1 Α χ + ... + μβΑ3 также принадлежит множеству Р. Если в плоскости Ρ можно найти г + 1 независимых точек, но нельзя найти большего числа независимых точек, то плоскость Ρ называется r-мерной. Если аффинное пространство X имеет размерность п, то (п— 1)-мерные плоскости в нем называются также гиперплоскостями. Наконец, одномерные плоскости в аффинном пространстве называются прямыми линиями (или просто прямыми). Теорема 18.1. Пусть Ρ czX — некоторая г-мерная плоскость. Тогда множество LP всех векторов АВУ где Л, SeP, представляет собой r-мерное подпространство векторного пространства R. Это подпространство называется напр а вляю- щим подпространством плоскости Р. Доказательство. Пусть a, 6eLP, т. е. а=АВ, b=CD, где /1, β, С, DeP. Так как Ρ есть плоскость, то точка E=*B + D-C (18.1)
§ 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 143 принадлежит плоскости Р. Равенство (18.1) означает, что QE = QB + QD-QC для любой точки Q е= X. В частности, при^Э = А получаем №^AB + № — AC = AB + CD = a + b. Так как А, Е<=Р, то АЕ f=LP, т. е. a + b^LP. Итак, если а, 6 s LP, то а + 6 е LP. _^ Пусть теперь a^LP, т. е. а = АВ, где Л, ВеР, и пусть ^ произвольное действительное число. Так как Ρ есгь плоскость, то точка F = (l-X)A + XB (18.2) принадлежит плоскости Р. Равенство (18.2) означает, что 0^ = (1-Я)0Л + Я05 для любой точки QgI В частности, при Q = А получаем № = (\-λ)ΑΑ + λΑΒ = ΧΑΒ = λα. Так как Л, F <= Р, то Л/7 е LP, т. е. λ0 е Ζ,Ρ. Итак, если α е LP, то Xa^Lp. Таким образом, LP — подпространство. Так как dim Ρ = г, то найдутся независимые точки До, Ль .·., Аг^Р. По теореме 17.6 векторы ДоА\, .. .. А$АГ линейно независимы. Но все эти векторы принадлежат LP. Таким образом, в LP найдены г линейно независимых векторов, и потому dim LP > г. Пусть, наконец, ей ···, Cs — некоторый базис подпространства LP, где s = dim LP. Тогда в Ρ найдутся такие точки Ви ..., Bs, Cu ..., Cs, что ех = ВхСи ..., es = BSCS. Возьмем произвольную точку 40еР. Для каждого /= 1, ..., 5 точка А{ = Л0 + Ci — В{ принадлежит плоскости Р. Это равенство означает, что QAi = QAo + QCi-QBi Для любой точки QgI В частности, при Q = Л0 получаем Л"Д = Л"Д> + Afit - лД = ДА - Л0"я1 = B& = ef.
144 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ Ц8 Итак, мы нашли в Ρ такие точки Л0, Ли ..., Л5, что _> —> AqAi = β], ..., AqAs = β5. Так как векторы еь ..., es линейно независимы, то по теореме 17.6 точки Л0, Аи ..., As являются независимыми. Отсюда следует, что s^ г (поскольку dimP = r), т. е. dimLp^r. Из доказанных неравенств вытекает, что dimLp = г. Теорема 18.2. Пусть PczX — некоторая плоскость и LpCiR — ее направляющее подпространство. Пусть, далее, еи ..., ег — базис подпространства LP и А0 — произвольная точка плоскости Р. Точка А е X в том и только в том случае принадлежит плоскости Р, 'если существуют такие действительные числа λ1, ..., λ1", что А = А0 + Х1е1 + ... + Кгег. (18.3) Доказательство. Равенство (18.3) означает, по определению, что А^А^Ке^ ... +λΓβΓ (18.4) (см. стр. 140). Если ЛеР, то A0A^LPi т. е. найдутся такие действительные числа λ1, ..., Хг что имеет место соотношение (18.4), а потому и (18.3). Обратно, пусть имеет место равенство (18.3), а потому и (18.4). Тогда вектор а = А0А, как линейная комбинация векторов еи ..., ег, принадлежит подпространству LP. Поэтому найдутся такие точки В, С е Р, что ВС = а. Положим D = A0 + C~B. (18.5) Точка D принадлежит плоскости Р, поскольку Л0, Ву С εξ Р. Равенство (18.5) означает, что QD = QA о + QC — QB для любой точки Q е X. В частности, при Q = Л0 получаем AqD = Afi — А^В = ВС = α = ДИ. Из равенства Л0/) = А0А, т. е. Л/) = 0, следует, что точки Л и D совпадают (аксиома Уз), и потому А&Р. Итак, если имеет место равенство (18.3), то Л е Р. Теорема 18.3. Пусть еи ..., ег — произвольные векторы пространства R и Л0 — произвольная точка пространства X, Тогда множество Ρ всех точек вида (18.3), где λ1, ..., λν —произвольные действительные числа, представляет собой плоскость размерности, не большей г, причем направляющим подпростран-
& 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 145 18] * ом для этой плоскости служит подпространство, порожденное Лекторами еи . .·> *т- Если векторы еи ..., ег линейно незави- симыУ то dim Ρ = г. Доказательство. Пусть А ь ..., As — произвольная система точек, принадлежащих множеству Р, т. е. . Л,= Л0 + Я)е, + ... +λ·βΓ, / = 1, ..., s, (18.6) и пусть А — комбинация точек Аи ..., А8, т. е. Α = μιΑ{ + ... + μΜ„ (18.7) ГД6 μ1+ ... +μ-=1. (18.8) Соотношение (18.7) означает, что θ2 = μ10^ι+ ... + μ*θΧ для любой точки QeI, а соотношение (18.6) означает, что Q4* = Q4, + λ!βι + ... +λ/βΓ, /=1, ..., s. Отсюда получаем (в силу (18.8)) S ^ <1Α=Σμί&Αο + λ\61+ ... + λίβΓ) = = 0^ο+(Σμ%!)βΙ+ ... + (Σμ'λϊ)βΓ. Это соотношение имеет вид (18.3), и потому ЛеР. Итак, из (18.7), (18.8) вытекает, что А е Я, т. е. Ρ представляет собой плоскость. Обозначим через LP направляющее подпространство этой плоскости. Из соотношения (18.3), которое можно записать в виде (18.4), следует, что любой вектор вида λχβ\ + ... + Xrer принадлежит подпространству LP. Обратно, пусть a^LPi т. е. а = АВ. где Л, В е Р. Тогда Л0Л = Я1е1+ ... +К'еп A^B — v1el + ... + vre» и потому α = ΛΒ = ^^-β8=β(ν,--λΙ)βι + ... +(νΓ-λΓ)βΓ. Итак, вектор α в том и только в том случае принадлежит подпространству LPi если а есть линейная комбинация векторов еи ..., ег. Иначе говоря, LP есть подпространство, порожденное векторами еи ..., ег (см. теорему 14.6). Отсюда вытекает и неравенство dim Я = dimLP ^ r в общем случае и равенство dimP = dimLP = r в случае линейной независимости векторов еь ..., ег,
146 ГЛ. И. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [18 Замечание 18.4. Теоремы 18.2 и 18.3 показывают, что всякая r-мерная плоскость может быть описана уравнением (18.3), где в\9 ..., ег — линейно независимые векторы, а λ1, ... ..., λΓ пробегают (независимо друг от друга) все действительные значения, и обратно, всякое такое уравнение описывает некоторую r-мерную плоскость. Уравнение (18.3) называют векторным параметрическим уравнением r-мерной плоскости. В частности, при г = 1 уравнение (18.3) принимает вид 4«=Л0 + Яе; (18.9) это — векторное параметрическое уравнение прямой линии; здесь е — отличный от нуля вектор (пространства R)9 A0 — произвольная точка пространства X, а λ пробегает все действительные значения. Всякая прямая может быть записана в виде (18.9) и, обратно, всякое такое уравнение описывает некоторую прямую. Вектор е называют направляющим вектором этой прямой. Если Ρ — некоторая плоскость, LP — ее направляющее подпространство и еь ..., ег — базис подпространства LP, то систему векторов ви ..., ег называют также базисом плоскости Р. Таким образом, чтобы написать векторное уравнение плоскости Ρ (см. (18.3)), надо знать базис е\, ..., ег этой плоскости и какую-нибудь одну точку Л0> принадлежащую этой плоскости. Определение 18.5. Две плоскости Р9 Р' (рассматриваемые в одном и том же аффинном пространстве X) называются параллельными (обозначение: Р\\Р')9 если их направляющие подпространства совпадают. Это определение можно перефразировать, сказав, что две плоскости параллельны, если базис одной из них является в то же время базисом и другой плоскости. Заметим, что две совпадающие плоскости считаются в Ылу этого определения параллельными. Отметим также, что в силу этого определения параллельными могут быть только плоскости одинаковой размерности, причем отношение параллельности (г-мерных плоскостей) обладает свойствами рефлексивности, симметричности и транзитивности. Иногда, впрочем, придерживаются иной терминологии, согласно которой прямая может быть параллельна плоскости и, вообще, плоскость одного числа измерений может быть параллельна плоскости другого числа измерений. Именно, две плоскости Р, Q считают параллельными, если для их направляющих подпространств LP, LQ справедливо включение LP zd Lq (или LpczLq). Мы этой терминологии придерживаться не будем. Теорема 18.6. Через любую данную точку В0^Х проходит единственная плоскость, параллельная данной плоскости Ρ cz X. При этом любые две параллельные между собой плоскости либр
18] § б. ЕВКЛИДОВА ГЕОМЕТРИИ 147 пвпадают либо не имеют общих точек. Таким образом, если дана плоскость РаХ, то все пространство X заполняется попарно непересекающимися плоскостями, параллельными плоскости Р. η Доказательство. Пусть данная плоскость Ρ имеет векторное параметрическое уравнение (18.3), т. е. Л0<=Л и векторы е\9 .. ·, ег составляют базис плоскости Р. Тогда плоскость, имеющая уравнение A = BQ + Vel+ ... + λ%, параллельна плоскости Ρ и проходит через точку β0· Этим доказано первое утверждение теоремы. Пусть, далее Рь Рг— Две параллельные плоскости, имеющие общую точку Со. Выберем какой-либо базис еи ..., ет плоскости Р\. Так как плоскости Pi, P2 параллельны, то еи ..., ег являются также базисом и плоскости Рг. Итак, плоскости Рь Рг имеют общую точку С0/и общий базис elf ..., ег. Следовательно, обе эти плоскости описываются одним и тем же векторным параметрическим уравнением А = С0 + Х1е{+ ... + λΓβΓ и потому совпадают. Теорема 18.7. Пусть Ρ — плоскость размерности г в пространстве X и Л о, Ль ..., Аг — независимая система точек, расположенных в этой плоскости. Точка А е X в том и только в том случае принадлежит плоскости Р9 если найдутся действительные числа λ°, λ1, ..., λ7*, удовлетворяющие условиям λ° + λ! + ... +λΓ=1, (18.10) Α = λ°Α0 + λιΑι+ ... + λΜΓ. (18.11) При этом числа λ°, λ1, ..., λΓ определяются точкой А е Р однозначно. Доказательство. Так как точки Л о, А\, ..., Лг независимы, то векторы βι — А0А{, ..., ег = А0Аг линейно независимы. Все эти векторы принадлежат направляющему подпространству LP плоскости Я, и потому составляют базис подпространства LP и плоскости Р. Таким образом, точка ЛеХв том и только в том случае принадлежит плоскости Р, если ее можно записать в виде A = A0 + Ve{+ ... +λΓβΓ, т. е. если Α^Α = λιΑοΑ{+ ... +KrA^Ar.
148 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [18 (При этом числа λ1, ..., λΓ определяются точкой ДбР одно-' значно.) Выбрав теперь произвольную точку QeX, мы перепишем это соотношение в виде QA-QAo = V№i-QAo)+ ... +lr(QAr-QAo), или Q^4 = (l —λ1 — ... -Kr)QA0 + VQA{+ ... + λΓ0Λ, а это соотношение равносильно соотношениям (18.10), (18.11) (гдеЯ°= 1— λ1 — ... — λ'). Следствие 18.8. Пусть Р —некоторая прямая и А0, Ах— две ее различные точки. Точка А е X в том и только в том случае принадлежит прямой Р, если найдется действительное число λ, удовлетворяющее условию Α = {\~-λ)Α0 + λΑι. Из этого следствия вытекает также, что через любые две различные точки А0, Аг&Х проходит одна и только одна прямая. Мы ее будем называть «прямая АоА\». Далее, очевидно, что для любых двух точек A0i A\ eJi отрезок [Л0, Л ι] (см. пример 17.5) целиком содержится в прямой Α0Αχ. Теорема 18.9. Пересечение двух (или любого числа) плоскостей представляет собой плоскость. Доказательство. Пусть Pi и Р% — две плоскости и ρ = рх П Рг— их пересечение. Пусть, далее, Ль ..., As — произвольные точки множества Ρ и λ1, ..., λδ — действительные числа, удовлетворяющие условию λι+ ... +λ*=1. (18.12) Так как Аи ..., А8^Р аР\ и так как Pi — плоскость, то точка Α = λ{Α{+ ... +KSAS (18.13) принадлежит плоскости Р\. Из аналогичных соображений точка А принадлежит плоскости Рг. Следовательно, А^РгС\Р2=Р. Итак, всякая точка вида (18.13), где Аи ..., AS^P и числа λ1 Xs удовлетворяют условию (18.12), принадлежит множеству Р% и потому Ρ — плоскость. Аналогичное рассуждение применимо в случае пересечения любого числа плоскостей. Из теоремы 18.9 вытекает, что для любого множества Q czX существует в X наименьшая плоскость, содержащая множество Q, т. е. такая плоскость Pq, содержащая множество Q, что если некоторая плоскость Ρ содержит множество Q, то Ρ zd PQ (ср. стр. 108). Она называется плоскостью, порожденной множеством Q. Теорема 18.10. Пусть Q — множество, содержащееся в X, и Pq — порожденная этим множеством плоскость. Точка А^Х
181 § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 149 том и только в том случае принадлежит плоскости PQi если найдутся такие точки Аи ..., A8<=Q и такие действительные числа λ1, ..♦, λ8, удовлетворяющие условию (18.12), что имеет место равенство (18.13). Доказательство. Выберем в Q наибольшее число независимых точек, т. е. такие г+ 1 точек β0, Ви .., Br^Q9 что эти точки независимы, а каждые г + 2 точки множества Q зависимы. Обозначим через Ρ плоскость размерности г, содержащую точки В0, Ви ..., Вг. Согласно теореме 18.7 плоскость Ρ состоит из всех точек В вида β = λ°Β0 + λΙθι + шлш +λΓβη (18.14) где λ°, λ1, ..., λΓ — действительные числа, удовлетворяющие условию J λ° + λ]+ ... +λΓ=1. (18.1-5) Так как плоскость Pq содержит множество Q и, значит, содержит точки Во, Ви ..., Вг, то PQ содержит любую точку вида (18.14), где числа λ°, λ1 λΓ удовлетворяют условию (18.15), т. е. PqzdP. Заметим, что векторы е, = ад, ..., ег = ВоВг (18.16) составляют базис плоскости Р. Если теперь В — произвольная точка множества Q, то точки fio, В, Ви ..., Вг зависимы, т. е, векторы В0В, Β0Βι, .. ν» BQBr линейно зависимы. Следовательно, вектор В0В линейно выражается через векторы (18.16) (поскольку векторы (18.16) линейно независимы): т. е. В = В0 + μιβ{ + ... + μΓβΓ. Отсюда в силу теоремы 18.2 вытекает, что ВеР. Таким образом, QcP, и потому PQ с Р. Из доказанных включений PqZD P, PQcz Ρ вытекает равенство PQ = P. Из (18.14), (18.15) следует поэтому, что каждая точка плоскости Pq записывается в требуемом виде (см. (18.12), (18.13)). Ясно и обратное, что если точка А записывается в виде (18.12), (18.13), где Аи ..., As <= Q и, значит, Аи ..., A8ePQ, тоДе PQ. Теорема 18.11. Пусть Ρ — плоскость размерности г β аффинном пространстве X, и О — точка плоскости Р. Превратим X
150 ГЛ. П. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [\8 в векторное пространство, как указано в теореме 17.7. Тогда Ρ будет r-мерным подпространством этого векторного пространства. Доказательство. Пусть А, В е Р. Тогда точка С=Л + + В — О принадлежит Ρ (так как Ρ — плоскость). Но в рассматриваемом векторном пространстве точка С является суммой точек А и В: Итак, если А, В^Р, то Л+БеР. Аналогично показывается, что если Л е Р, то ХА е Ρ для любого действительного λ. Таким образом, Ρ — подпространство. Теорема 18.12. Пусть Pi и Р2 — две плоскости в аффинном пространстве X, имеющие хотя бы одну общую точку, и пусть Ρ = Ρι Π Р2 — пересечение этих плоскостей, а Р* — плоскость, порожденная множеством Pi U Ρ2- Тогда dim Ρ* = dim Px + dim P2 — dim P. Доказательство. Выберем какую-либо точку ОеРи превратим X в векторное пространство, как указано в теореме 17.7. Тогда Р\, Р2, Ρ, Ρ* будут подпространствами этого векторного пространства X. Доказываемое соотношение теперь непосредственно следует из теоремы 14.9. Определение 18.13. Пусть {R9X) — аффинное пространство. Плоскости Р, Q czX называются взаимно дополнительными, если их направляющие подпространства LP, LQ являются прямыми дополнениями друг для друга, т. е. R = LP(& LQ. Из этого определения непосредственно следует, что если Pi и Р2 — взаимно дополнительные плоскости и если Ρι||Ρι, Р2ЦР2, то плоскости Р\ и Р2 также являются взаимно дополнительными. Далее, в силу теоремы 14.10 для взаимно дополнительных плоскостей Pi, Р2 пространства X справедливо соотношение dim Рх + dim P2 = dim X. Теорема 18.14. Две взаимно дополнительные плоскости в аффинном пространстве имеют ровно одну общую точку. Доказательство. Пусть (R, X) — аффинное пространство'^ Р, Q — две взаимно дополнительные плоскости в X. Направляющие подпространства плоскостей Р, Q обозначим через LP, LQ соответственно. Положим dim LP = ρ, dim LQ = q, dim/? = я. Тогда p + q = n. Выберем базис eh ..., ep в подпространстве LP и базис βρ+ι, ..., еп в подпространстве LQ; в силу замечания к теореме 14.10 векторы еи ..., ePt ep+i, ... ,,., еп образуют базис векторного пространства R.
§ 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 151 Выберем теперь произвольные точки А <= Я, B^Q. Тогда, разложив вектор АВ по векторам базиса еи ..., еп> мы получим /fi=salel+ ... +α^ρ + αρ+,βρ+1+ ... + а»еп. (18.17) Обозначим через СеХ точку, определяемую равенством АС = а1е{ + ... + а*>ер. (18.18) Из (18.17) и (18.18) находим непосредственно: ВС = АС-АВ-= — аР+{ер+1— ... — апеп. (18.19) Учитывая включения /IgP, fieQ и соотндшения (18.18), (18.19), в силу теоремы 18.2 мы находим, что СеР, C&Q. Таким образом, плоскости Ρ и Q имеют общую точку С. Если D — другая общая точка этих плоскостей, то CD e LP, ~CD e LQ, и потому в силу соотношения R — LPQ) LQ мы имеем ~CD = 0, т. е. С = D. Теорема доказана. В заключение введем понятие луча, которое нам понадобится в дальнейшем. Пусть Л0еХ, e&R. Лучом с концевой точкой А0 и направляющим вектором е называется множество всех точек вида А = А0 + Хе, λ>0. (18.20) От уравнения (18.9) это соотношение отличается тем, что здесь λ принимает не все действительные, а только неотрицательные значения. Таким образом, луч с концевой точкой А0 и направляющим вектором е целиком содержится в прямой, проходящей через точку А0 и имеющей направляющий вектор е. В этой же прямой содержится и луч с концевой точкой А0 и направляющим вектором —е, который называется противоположным лучу (18.20). Никакой третий луч с концевой точкой Д0, кроме этих двух, не содержится в прямой (18.9). Поэтому указанные два луча на- ^ ^ зываются лучами, определяемы- Α0Λ=λΑ0Β ми точкой А0 ни прямой (18.9). #*# Заметим, что если k — произвольное положительное число, то лУч (18.20) совпадает с лу- Рис.51, чом, имеющим ту же концевую точку Л0 и направляющий вектор ke. Иначе говоря, если / — некоторый луч с концевой точкой А0 и если β —любая отличная от А0 точка этого луча, то вектор А0В является направляющим вектором луча /; в этом случае говорят также, что / есть луч, исходящий из точки А9 и проходящий через точку В. Таким
152 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [19 образом, луч, исходящий из точки Л0 и проходящий через точку β, представляет собой множество всех таких точек Л, для которых АоА = %А0В, где λ ^ 0 (рис. 51). 19. Аффинные отображения. Пусть (R,X) и (S, У)—аффинные пространства. Отображение φ: Χ-+Υ называется аффинным (или линейным) отображением, если из справедливости соотношения А = (1-Х)В + ХС, где Л, β, С^ХУ вытекает соотношение φ(Λ)-(1-λ)φ(β) + λφ(0). Теорема 19.1. Пусть φ: Χ-+Υ— аффинное отображение. Тогда из справедливости соотношения A = VA{+ ... + λΜ„ (19.1) где Л, Аи ..., AS^X и λι + ... +λ*=1, (19.2) вытекает соотношение Ф(Л) = Я1Ф(Л1)+ ... +λ'φ(Λ). (19.3) Доказательство. Проведем индукцию по 5. При s = 2 доказываемое соотношение непосредственно вытекает из определения аффинного отображения. Пусть доказываемое соотношение установлено для случая, когда в правой части имеется меньше, чем s, слагаемых, и пусть выполнены соотношения (19.1), (19.2), где s<>3. Ясно, что хотя бы одно из чисел λ1, ..., λ8 отлично от единицы (иначе не могло бы выполняться соотношение (19.2)). Пусть, для определенности, Xs φ 1, т. е. 1 —λ8 φ 0. Рассмотрим точку β = Τ^χτΑ+ ... +τ^τΛ-ι; (19.4) здесь сумма коэффициентов в правой части равна единице: λ1 λ5"1 _ λ1 + ... + λ*"1 _ 1 - λ* _ . Ι-λ* + ··' + 1-λ5 Ι-. V 1-λ5 1# По предположению индукции, справедливо соотношение ψ(Β)=14ττ<ρ(Α1)+ ... +^9(4-,). (19.5) Из (19.1) и (19.4) вытекает, что A = {l-XS)B + XSAS,
19] § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ . 153 и потому, в силу определения аффинного отображения, φ(Λ)-(1-λ»)φ(β) + λ#φ(^). (19.6) Из (19.5) и (19.6) вытекает соотношение (19.3). Следствие 19.2. Пусть φ: X-> Υ ~ аффинное отображение и пусть <p(At)*=A*i9 φ(Βι) = Β*ι, /=1, ..., k (где Ah В,еД Тогда из справедливости соотношения а1А${ + ... +а*Д[вл —0 (19.7) вытекает, что alA\B\+ ... +a*A*kBl = 0. (19.8) Доказательство. Равенство (19.7) означает, что- αΙ(Βι-Λι)+ ... + α*(βΛ-ΛΑ)-0, Q = Q + a%+ ... + а*Вк-а1Ах- ··· -αΜ* (где Q — произвольная точка пространства X). Следовательно, по теореме 19.1, Q*eQ' + aiB;+ ... +α*β;-αΜ;— ... — аМ; где Q* = q>(Q)), т. е. а<(в;-л;) + ... +а*(в;-л;)-о, а это и есть соотношение (19.8). Теорема 19.3. Пусть <р:Х -> У — аффинное отображение и PczX — некоторая плоскость. Тогда ее образ φ(Ρ) является плоскостью в пространстве У, причем dim φ (Я) <: dim Я. Доказательство. Пусть 5Ь ..., В8 — произвольные точки множества φ (Я), и пусть λ1, ..., λ8 — действительные чис« ла, удовлетворяющие условию λΓ+ ..; +λ*=ι. Рассмотрим точку Β = λιΒ{+ ... +lsBs пространства Υ и докажем, что βεφ(Ρ). Так как /^еср(Я), i=l, ..., 5, то найдется такая точка Л*еР, что (р(Лг) = Вг·. Мы получим, таким образом, точки Аи ..., А8 плоскости Р. Следовательно, точка Л —λΜ,+ ... + λ*Λ также принадлежит плоскости Р. В силу теоремы 19.1 мы имеем Φ(4) = φ(λ4+ ... +λΜ,)-λΙφ(4)+ ... + λ*φ(Λβ)- ^λ'β^ ... +XSBS = B.
154 ГЛ. It. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИЙ [19 Так как ДеР, το δ'=φ(4)εφ(Ρ). Таким образом, φ(Ρ) есть плоскость. Если точки В и ..., Bs плоскости'φ (Ρ) независимы, то точки Аи ..·> А8, удовлетворяющие условиям <р{А{) = Ви /= 1, ... .., 5, также, очевидно, независимы. Отсюда и вытекает неравенство dim φ (Ρ) ^ dim P. Аналогично доказывается Теорема 19.4. Прообраз qr1 (Ρ) любой плоскости Ρ α Υ при аффинном отображении φ: X -* Υ является плоскостью пространства X. Теорема 19.5. Пусть (R9X) и (S, У) -—аффинные пространства и φ: Χ-+Υ — аффинное отображение. Тогда существует {и притом только один) гомоморфизм ψ: R -> S, обладающий тем свойством, что из справедливости соотношения А = В + а {А,В<=Х, a<=R) (19.9) вытекает φ (Α) = φ (Β) + ψ fa). (19.10) Доказательство. Фиксируем в пространстве X некоторую точку О. Если теперь а — произвольный вектор пространства /?, то мы возьмем точку А еХ, для которой О А — а, и положим ψ(α) = φ(Λ) —φ(0) = φ(0)φ(^€=5. (19.11) Таким образом, определяется некоторое отображение ψ: /?-*S. Докажем, что ψ — гомоморфизм. Пусть atb ^ R. Выберем такие точки А,В,С & X, что ОЛ = а, 05 = 6, OC = a + 6. Тогда ОС — ОЛ — ОВ = 0\ и потому в силу следствия 19.2 φ(Ο)φή-φ(Ο)φ(1)-φ(Ο)φ(β) = 0, т. е. ψ (α + 6) — ψ (α) — ψ (6) = 0, Итак, Ψ (« + *) = Ψ (*) + ♦(*) (19.12) для любых векторов a, 6 <= /?. Далее, пусть aei? и λ — действительное число. Выберем такие точки Ау D ^ Ху что ОА = а, OD = ka. Тогда OD —-λΟΑ = 0, и потому в силу следствия 19.2 φ(Ο)φ(£))-λφ(Ο)φ(Λ) = 0,
19] § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 155 т.е. φ (λα) — λψ(α) = 0. Итак, ψ(λα) = λψ(α) (19.13) для любого ttEi? и любого действительного λ. Из (19.12), (19.13) следует, что ψ — гомоморфизм. Если выполнено соотношение (19.9), то мы имеем в силу (19.11) _^ φ (В) - φ(Λ) = (<Ρ(θ) - Ф(0» - (φ(Λ) - <р(0)) = ψ(Οβ) - — ψ (δϋ) = ψ (δβ — δί) = ψ (лв)=ψ (β - Л) = — ψ (α), т. е. построенный гомоморфизм ψ является искомым. Единственность вытекает из того, что соотношение (19.11) является следствием соотношений (19.9), (19.10) (получающимся, если в (19.9), (19.10) точку В считать совпадающей с О). Поэтому всякий гомоморфизм, удовлетворяющий наложенным требованиям (см. (19.9), (19.10)), должен, в частности, удовлетворять соотношению (19.11),чТ. е. должен совпадать с ψ. Следующая теорема является, в некотором смысле, обратной к предыдущей. Теорема 19Д. Пусть (/?, X) и (S, У) —аффинные пространства и пусть ψ: 7?->S — некоторый гомоморфизм, О — некоторая точка пространства X и О' — некоторая точка пространства У. Тогда отображение φ: Χ->Υ, определенное формулой <р(Л)«0' + Ч>((Й), является аффинным. Доказательство. Пусть А = (1 — λ) В -f- %С (где Л, В, СеХ). Тогда ОЛ = (1— 1)ОВ + КОС, и потому φ{Α) = 0' + ${θΧ) = 0' + ${(1--λ)δΒ + λδζ) = = ο, + (ΐ~λ)ψ(δβ) + λψ(^) = (ΐ~λ)(ο, + ψ(6β)) + + λ(0/ + ψ(0?)) = (1-λ)φ(β) + λφ(ϋ). Теорема 19.7. Пусть φ: Я->У— аффинное отображение. Выберем произвольную точку О ^Х и обозначим через О' точку φ (О) пространства У. Фиксировав точку О, превратим X в векторное пространство и, фиксировав точку О', превратим Υ в векторное пространство. Тогда отображение φ будет гомоморфизмом векторного пространства Χ φ векторное пространство У,
156 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [19 Доказательство. Пусть А, В ^ X; рассмотрим точку С = А + В— О. Тогда С есть сумма точек Л и β в векторном пространстве X. Из соотношения С = Л + В — О вытекает в силу аффинности отображения φ, что φ (С) = φ (Л) + φ (В) — φ(0) = = φ (Α)-\-φ (В)—О', а это означает, что точка ср(С) является в векторном пространстве У суммой точек φ (Л) и φ (β). Таким образом, отображение φ: Χ -* У сохраняет операцию сложения. Аналогично устанавливается соотношение ф^Л)=Я(р(Л). Заметим, что из теоремы 19.7 можно получить новые доказательства, теорем 19.3 и 19.4. Непосредственно доказывается и следующая теорема, обратная теореме 19.7. Теорема 19.8. Пусть X, У — аффинные пространства и φ: X —> У — некоторое отображение. Выберем произвольную точку О^Х и положим 0' = <$(0). Как и в предыдущей теореме, превратим X и Υ в векторные пространства, фиксировав точки О и О'. Если φ является гомоморфизмом этих векторных пространств, то φ — аффинное отображение пространства X в пространство У. Теорема 19.9. Пусть X и У — аффинные пространства. Предположим, что dim X =* η, и пусть Л0, Л ι, ..., Ап — независимая система точек в X. Тогда для любых точек B0i Ви ..., Вп пространства У существует и притом только одно аффинное отображение φ: Χ -* У, удовлетворяющее условию <р(Л0) = Я0, (f>(At) = Bu ..., <р(Ап) = Вп. (19.14) Доказательство. Пусть Л — произвольная точка пространства X. Тогда в силу теоремы 18.7 (примененной к случаю Р = Х) Α = λ°Α0 + λιΑι+ ... + ληΑη, (19.15) где λ°, λ1, ..., λη — действительные числа, удовлетворяющие соотношению λ° + λι+ ...λΛ=1. При этом числа λ°, λ1, ..., λη однозначно определяются точкой Л. Положим φ(Α) = λ°Β0 + λιΒι + ... +λΛβΛ. (19Л6) Мы получаем, таким образом, некоторое отображение φ: Х-*У, удовлетворяющее, очевидно, соотношениям (19.14). Фиксируем теперь в X точку О = Л0, а в У — точку О' = φ (Л о) = В0, превратив тем самым X и У в векторные пространства. Тогда в силу операций, имеющихся в этих векторных пространствах, соотношения (19.15), (19.16) запишутся в виде Α = λιΑ{+ ... +ληΑη, φ(Α)-λ4ρ(4)+ ... +λ\(Αη).
191 § 5. ЕВКЛИДОВА ГЕОМЕТРИИ 157 Отсюда следует, что φ — гомоморфизм рассматриваемых векторных пространств, и потому в силу теоремы 19.8 φ —аффинное отображение. Единственность вытекает из того факта, что для любого аффинного отображения φ: Χ -> Υ из (19.14), (19.15) вытекает Определение 19.10. Пусть (/?, X) — аффинное пространство и Р, Q — взаимно дополнительные плоскости в X. Через произвольную точку Де! проведем плоскость Q', параллельную плоскости Q (теорема 18.6). Тогда Ρ ιι Q' также будут взаимно дополнительными плоскостями в X, и потому Ρ и Q' имеют единственную общую точку (теорема 18.14). Обозначим эту общую точку через π (Л). Таким образом, мы получаем некоторое отображение π: Χ->Χ. Оно называется проектированием пространства X на плоскость Ρ в направлении плоскости Q. (Ср. определение 15.6.) Теорема 19.11. Пусть (R, X)—аффинное пространство и Я, Q — взаимно дополнительные плоскости в X. Тогда проектирование пространства X на плоскость Ρ в направлении плоскости Q является аффинным отображением. Доказательство. Пусть О — общая точка плоскостей Ρ и Q (теорема 18.14). Превратим X в векторное пространство, фиксировав точку О. Тогда Ρ и Q будут подпространствами этого пространства (теорема 18.11). Так как пересечение Ρ [} Q содержит только одну точку О (т. е. является тривиальным подпространством) и dim Я + dimQ = dim Я, то X = Ρ ф Q (теорема 14.10). Следовательно, мы можем рассматривать проектирование векторного пространства X на подпространство Ρ в направлении подпространства Q (см. теорему 15.7)..Обозначим это проектирование через π*. Согласно теореме 15.7 отображение π* векторного пространства Хъ себя является гомоморфизмом. Очевидно, что п*(0)=0. В силу теоремы 19.8 отображение π* аффинного пространства X в себя является аффинным. Поэтому для завершения доказательства достаточно установить, что отображения π и π* совпадают. Пусть А— произвольная точка пространства X и В = п(А). Тогда В есть общая точка плоскостей Ρ и Q', где Q'— плоскость, параллельная Q и проходящая через точку А. Так как A^Q' и о е Q'f то В А € Lq>, где Lq' — направляющее подпространство плоскости Q' (и, значит, плоскости Q). Пусть С—-такая точка, 22Р 0(5lt= β^· Тогда, по теореме 18.2, С е Q. Равенство ОС = ВА означает, что А = В + ОС, т.е. А = В + С-0>
158 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [19 а потому в векторном пространстве X справедливо соотношение А = В -f С (см. теорему 17.7). Из соотношений А = В + С, В&Р, C^Qy имеющих место в векторном пространстве X, вытекает теперь, что В = п*(А) (см. определение 15.6). Таким образом π*(Α) = π(Α) для любой точки Де^, т.е. отображения π и π* совпадают. Теорема 19.12. Пусть (R,X) — аффинное пространство и P9Q — взаимно дополнительные плоскости в X. Обозначим через π проектирование пространства X на плоскость Ρ в направлении плоскости Q. Тогда для любой плоскости NczP прообраз π~ι(Ν) представляет собой плоскость в Ху имеющую размерность dim Q + dim N. В частности, если N — гиперплоскость аффинного пространства Р, то π~χ{Ν) — гиперплоскость пространства X. Доказательство. То, что π*"1 (Ν) есть плоскость, непосредственно вытекает из теорем 19.11 и 19.4. Далее, обозначим, через О общую точку плоскостей Ρ и Q и превратим X в векторное пространство, фиксировав точку О. Тогда π будет проектированием векторного пространства <Х на подпространство Ρ в направлении подпространства Q (см. доказательство теоремы 19.11), и потому в силу теоремы 15.7 KerVt = Q, Ιιηπ=.Ρ. Обозначим через πι отображение π, рассматриваемое на подпространстве ;nH(iV), т. е. πι — проектирование пространства π~! (Ν) на N в направлении подпространства Q. Тогда Ιηιπι = Nt Κβτπι = Кегя = Q, и из теоремы 15.3 вытекает, что dim π""1 (Ν) = dim (Im π^ + dim (Ker щ) = dim Q + dim N. Если, в частности, Ν — гиперплоскость аффинного пространства Ρf т. е. dim N = dim Ρ — 1, то dimn-4^ = <Hmtf + dimQ —(dimP — 1)+ dimQ = dim Ζ — 1, τ. е. π-"1 (Ν) — гиперплоскость пространства X. Теорема 19.13. Пусть Pi и Р2 — две параллельные k-мер- ные плоскости в X. Тогда существует в X плоскость Ρ размерности & + 1, содержащая Рх и Р2 (причем при Рх Φ Ρ2 плоскость Ρ единственна). Доказательство. Пусть Q — плоскость, являющаяся прямым дополнением плоскости Р\. Через π обозначим проектирование пространства X на плоскость Q в направлении плоскости Pi. В силу определения операции проектирования π(Ρι) = Λι есть одна точка плоскости Q и π(Ρ2) = Α2 также есть одна точка плоскости Q. Проведем прямую Ν, проходящую через точки Αχ и А2. Тогда NczQ, и потому, по теореме 19,12, множество π-1^) представляет собой плоскость в X,
§ 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 159 имеющую размерность dim π-1 (Ν) = dim N + dim P{ = 1 + k. Ясно также, что n~l(N)ZDP{ и n-l(N)zDP2. Таким образом, плоскость π"1 (Ν) --искомая. Если Pi Φ ^2, то множество Рх U Рг не содержится в одной fe-мерной плоскости, т. е. плоскость Р, порожденная множеством Ρ U Р2> имеет размерность, не меньшую k + 1 (и не большую £4-1 в силу доказанного). Таким образом, dimP = £+l, и потому любая (&+1)-мерная плоскость, содержащая Pi U Яг, содержит {k + 1)-мерную плоскость Р, а значит, совпадает с Р. Пример 19.14. Пусть (Я, Я) — аффинное пространство, О е χ — некоторая точка и ν — действительное число. Положим f(A) = 0 + vOA, AgI Мы получаем, таким образом, некоторое отображение / пространства X в себя. Оно называется гомотетией с центром О и коэффициентом v. Так как отображение φ: /?-*/?, определенное равенством φ(α) = να, очевидно, является гомоморфизмом, то, по теореме 19.6, гомотетия есть аффинное отображение пространства X в себя. Гомотетия с центром О и коэффициентом ν = —1 называется симметрией относительно точки О. Эта симметрия переводит точку А ^ X в такую точку А\ что А' = О — О А, т. е. ОА' = —ОА. Это означает, что О — середина отрезка [Л, Л']. Если коэффициент гомотетии отличен от нуля, то каждая плоскость Ρ cz X переходит при гомотетии β параллельную ей плоскость. В самом деле, пусть Л0 ^ Ρ и еи ..., ей — базис плоскости Р. Тогда произвольная точка А е Ρ имеет вид A~Ao + Vex+ ... +ЯЧ, и потому ОА^ОА0 + Кхех+ ... +λ4· Следовательно, f(A) = O + vOA = O + v(OA0 + Xlel + ... +Xkek) = -О -fc vOA0 + ν (λ'β, + ... + λ4) =/(Α>) + νίλ'β, + ... + Xkek). Отсюда видно, что когда А пробегает плоскость Ρ (т. е. λ1, ..., λ* пробегают, независимо друг от друга, действительные значения), точка f(A) пробегает плоскость, проходящую через точку f{A0) и имеющую тот же базис еи ..., ek. Таким образом, f(P) есть плоскость, проходящая через точку f(AQ) и парал* Дельная плоскости Pt
160 ГЛ. Ιί. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИЙ [20 20. Аффинные функции. Пусть (R, X) аффинное пространство. Аффинной (или линейной) функцией на пространстве X называется аффинное отображение f: X —► Д где D — множество всех действительных чисел (рассматриваемое как аффинное пространство; см. замечание 17.9). Иначе говоря, функция / (с действительными значениями), заданная на X, называется аффинной, если из соотношения А = {1-Х)В + ХС, имеющего место в X, вытекает равенство /(Λ)-(ΐ-λ)/(β) + λ/(θ), Согласно теореме 19.1 из справедливости в X соотношений Α = λιΑ{+ ... +XsASi λι+ ... +λ5=1 вытекает для аффинной функции /: X-+D равенство f(A) = Vf(A{) + ... +lsf(As). Далее, согласно теореме 19.5 для аффинной функции/: X->D справедливо соотношение / (В) = / (А) + φ (Αδ), Α,ΒζξΧ, (20.1) где φ: R -* D — некоторый гомоморфизм, т. е. линейный функционал (однозначно определяемый аффинной функцией /). Из теоремы 19.6 следует, что и обратно, если отображение f:X-+D удовлетворяет условию (20.1), где φ — линейный функционал на 7?, то / — аффинная функция. Более того, если отображение /: X -* D удовлетворяет условию /(B) —λ + φ(0Β). Ве=Х, (20.2) где Q — фиксированная точка пространства Ху λ — действительное число, а φ: R->D— линейный функционал, то, по теор_еме 19.6, f — аффинная функция. Если фуцкционал φ (см. (20.1)) отображает все пространство R в нуль, т.е. φ (α) =0 для любого вектора a<=R, то f(A) —f(B) для любых двух точек Л,Ве^, т. е. аффинная функция /с постоянна на всем пространства X. Если же функционал φ не является нулевым, т. е. существует такой вектор йей, что φ (α) Φ 0, то и функция / не является постоянной. В этом случае для любого числа λ£ΰ найдется в X такая точка В, что f(B) = λ. В самом деле, полагая В = А +ха, мы находим f(B) = f(A) + x<f(a);
201 § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 161 следовательно, взяв произвольно точку А е= X и определив число х „з уравнения f(A) + X(p{a)==l /это уравнение имеет решение, так как φ(α)φθ) мы найдем точку β, Для которой f(B) = λ. Итак, если аффинная функция f. X-+D непостоянна, то она принимает на X все действительные значения. Заметим еще, что если f: X -* D — аффинная функция, то для любого числа λθΰ функция ft: Х-*Д определенная равенством f\(A) = f(A)+X, также является аффинной и ей соответствует тот же линейный функционал φ: R-+D, что и функции f (это непосредственно вытекает из (20.1)). Теорема 20.1. Пусть f: X-+D — непостоянная аффинная функция. Тогда множество всех точек ЛеХ, удовлетворяющих условию f(A) = 0 (это множество называется ядром функции f и обозначается через Kerf), представляет собой гиперплоскость пространства X. Доказательство. В силу теоремы 19.4 множество Kerf = f~1(0) является плоскостью в X (так как 0 — нульмерная плоскость в D). Чтобы вычислить размерность этой плоскости, выберем в X такую точку О, что f(O) =0 (такая точка существует, так как функция /, по предположению, непостоянна), и, фиксировав точку О, превратим X в векторное пространство (см. теорему 17.7). Тогда в силу теоремы 19.7 отображение f:X->D будет гомоморфизмом, причем ядро Kerf аффинного отображения f будет ядром этого гомоморфизма, а образом Im/ гомоморфизма f будет вся прямая R (так как функция f непостоянна), т. е. dim(Imf) = 1. Из теоремы 15.3 мы теперь получаем dim (Ker f) = dim X - dim (Im f) = dim X - 1, и потому Kerf является гиперплоскостью аффинного пространства X. Теорема 20.2. Для каждой гиперплоскости. Г аффинного пространства (R, X) найдется такая (непостоянная) аффинная функция f: X-+ Д что Г = Kerf. Доказательство. Пусть aimX = η и, значит, dimr =s= ~п~ 1. Выберем в Г произвольные η независимых точек Ло, Ль ..., An_j и пусть Ап — произвольная точка пространства X, не лежащая в гиперплоскости Г. Тогда точки Л0, Ль ... ·. .,ЛП_Ь Ап независимы. В силу теоремы 19.9 существует (и притом только одна) аффинная функция f: X-+D% удовлетворяющая условиям /(А>)-/(4)~ ... -/(Д^-О, f(An) = l. ^Очевидно, что функция f непостоянна. Ядро Kerf этой аффинной функции содержит все точки Л0, Ah ..., Ап-}9 и потому
162 ГЛ. II. ОСНОЁНЫЁ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [20 содержит плоскость, порождаемую этими точками, т. е. Кег/гэГ. Если бы гиперплоскость Кег/ содержала какую-либо точку В ψ Г, то она содержала бы п-\-1 независимых точек А0, Аг, ..., Ап-и ^» что невозможно, так как dim (Кег/) = η— 1. Таким образом, Кег/ не содержит точек, не принадлежащих гиперплоскости Г, т. е. Кег/ = Г. Теорема 20.3 Пусть }\, /2: X-+D — две аффинные функции, отличающиеся друг от друга на константу. Тогда гиперплоскости Ker/ь Кег/2 параллельны. Доказательство. Так как функции /ь /г отличаются на константу, то им соответствует один и тот же линейный функционал φ: R-+D (см. стр. 161): МВ) = МЛ) + (р(ЛЯ), f2(B) = f2(A) + <?(AB). Следовательно, направляющие подпространства у ядер Кег/Ь Кег/г этих аффинных функций совпадают (а именно, они совпадают с ядром Кег φ линейного функционала φ). Но это и означает, что гиперплоскости Кег/Ь Кег/2 параллельны. Теорема 20.4. Пусть f\, --> fk — непостоянные аффинные функции, заданные на n-мерном аффинном пространстве (R, X), и пусть Гь ..., Th — ядра этих аффинных функций, α φι, ... ..., ерь — соответствующие линейные функционалы, заданные на векторном пространстве R: и(В) = и(А) + у<(АВ), /=1, ..., k. Если φι, ..., q>fe, рассматриваемые как векторы сопряженного пространства /?*, линейно независимы, то пересечение Γι Π ... Π Th гиперплоскостей Γι, ..., Th представляет собой (η — k)-мерную плоскость в X. В таком виде можно представить любую (п — k)-мерную плоскость пространства X. Доказательство. Дополним векторы φι, ..., φ& до базиса φι, ..., φ&, φ/н-ь · ·, фп пространства /?*. Далее, в пространстве R выберем такой базис еи ..., еп, что (см. теорему 15.12) Г 0 при / Φ и "(•/>-\1 при /-/. Возьмем произвольную точку А ^ X и положим λ'~-ΜΑ), ...,λ* —МЛ), Λ = Λ + λ'βι + ... +Vek. Тогда мы имеем (при /=1, ..., k): h{A0) = fi(A) + Vi{Vel+ ... +λ4)« -ΜΛ) + λ'φ»(βΙ) + ... +λ*φί(β*) = /ί(Λ) + λ,=»0.
20J § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 163 Таким образом, точка А0 принадлежит гиперплоскости Кег/ч при i = 1, · ·, *, т. е. Л0 е Γι Π .., Π Tk. Пусть теперь В— произвольная точка пространства X Запишем ее в виде В = Л0 + *Ч+ ··· +*пеп. Для любого /=1, ..., k мы имеем h (В) = U (А0) + Φι (х1ех + ... + хпеп) = *'. (20.3) Если точка В принадлежит пересечению Г! Π ... Π Γ*ι т. е. fi{B) = 0 при / = 1 Λ, то отсюда следует, что х1 = 0, i= 1, ..., k, т. е. точка β имеет вид В = Λ + **+1е*-н + ... + хпеп. (20.4) Обратно, если точка В имеет вид (20.4), то из (20.3) следует, что й(В) = 0.при 1= 1, ..., fc, т. е. β<=ΓιΓ) ... Л Th. Итак, Γι Π ... Л Tk есть множество всех точек вида (20.4), т. е. это множество представляет собой (п — k) -мерную плоскость, проходящую через точку А0 и имеющую в качестве направляющего (п — k) -мерное подпространство, порожденное в R векторами eh+u ..., еп. Докажем последнее утверждение теоремы. Пусть Ρ — произвольная (п — k)-мерная плоскость в X. Выберем базис е&+ь ... ..., еп плоскости Ρ и дополним его векторами ех, ..., въ. до базиса еь ..., еп пространства R. Далее, выберем в Ρ произвольную точку А0. Определим теперь линейные функционалы φι, ..., щ на /?, положив для любого вектора χ = ххе\ +... q>i (χ) = χ\ /= 1, г.., k. Наконец, определим аффинные функции fu ..., fk на Ху положив fi(A) = q>i(A0A), /=1, ...f k. Если А =\40 + ххех + ... + хпеп — произвольная точка пространства X, то AqA = Χ βγ -р ... "Τ Χ €η9 и потому fi(A) = (pl(A^A) = (fi(xlel+ ... +хпеп) = х\ / = 1, ..., к. Таким образом, система равенств /,(Л) = 0, .... fk(A) = 0 равносильна тому, что точка А имеет вид A = Ao + xk+lek+l+ ... +>«»,
164 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [20 т. е. принадлежит плоскости Р. Иначе говоря, Р = (Кег/,)П ... П(КегМ- Определение 20.5. Пусть Г — гиперплоскость в аффинном пространстве (R, X) и Л, β — две точки пространства X, не лежащие в гиперплоскости Г. Если отрезок [А, В] не пересекается (т.е. не имеет общих точек) с гиперплоскостью Г, то точки Л, В называются лежащими по одну сторону от гиперплоскости Г. Если же отрезок [Л, В] пересекается с гиперплоскостью Г, то точки Л, β называются лежащими по разные стороны от гиперплоскости Г. Теорема 20.6. Пусть Г — гиперплоскость в аффинном пространстве (R, X) и f.— аффинная функция на X, ядром которой является гиперплоскость Г. Пусть, далее, А, В—две точки пространства X, не лежащие в гиперплоскости Г. Если числа f(A), f(B) имеют одинаковые знаки, то точки А, В лежат по одну сторону от Г, а если эти числа имеют противоположные знаки, то точки Л, В лежат по разные стороны от Г. Доказательство. Пусть С — произвольная точка отрезка [Л, β], т.е. С=(1 — λ)Α + λΒ, где 0<λ<1. В силу аффинности отображения f мы имеем f(C) = (l-k)f(A) + Kf(B). (20.5) Если оба числа f(A), f(B) имеют одинаковые знаки, то, поскольку λ ^ 0, 1 — λ ^ 0 (причем оба числа λ, 1 — λ одновременно в нуль не обращаются), число f(C) также имеет тот же знак и потому в нуль не обращается. Таким образом, f(C) φ Ο для любой точки С^[А,В], т.е. отрезок [А,В] не пересекается с гиперплоскостью Г = Ker f. Пусть теперь числа /(Л) и f(B) имеют противоположные знаки. Положим г_ Ж) _ f(A) _ \f(A)\ Λ - f{A)-f(B) — f(A) + (-f(B)) — \t{A)\ + \f(B)\ · Ясно, что 0 < λ* < 1, и потому точка С* = (1 — λ*)Л + λ*β принадлежит отрезку [Л, В]. Из (20.5) непосредственно следует, что ДС*) = 0, т. е. С* еГ. Таким образом, в этом случае отрезок [Л, β] имеет с гиперплоскостью Г (единственную) общую точку С*. Теорема 20.7. Пусть Г — гиперплоскость β аффинном пространстве (R, X). Тогда все, точки пространства X, не лежащие в гиперплоскости Г, можно (и притом только одним способом) распределить на два непересекающихся множества Пь Пг, обладающих следующими свойствами: если точки Л, В принадлежат одному и, тому же из этих двух множеств, то они лежат по одну сторону гиперплоскости Г, а если точки Л, В лежат
20J § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 165 в разных множествах, то они расположены по разные стороны от Г. Доказательство. Выберем аффинную функцию f: X-+D, ядром которой является гиперплоскость Г, и обозначим через Πι множество всех точек ЛбХ, удовлетворяющих условию f(A) > 0, а через П2 множество всех точек А е X, удовлетворяющих условию /(Л)<0. Ясно, что любая точка Л, не лежащая в гиперплоскости Г, принадлежит одному и только одному из множеств Πι, П2. Из теоремы 20.6 непосредственно следует, что множества Пь П2 обладают указанными в теореме 20.7 свойствами. Остается доказать однозначность распределения. Пусть Πί, Щ —другие два множества, обладающие такими же свойствами. Ясно, что множество Πί целиком содержится в одном из множеств Пь П2 (иначе в Πί нашлись бы две точки, лежащие по разные стороны от Г). Пусть, для определенности, Щ cz Πι. Точно так же множество П2 целиком содержится в одном из множеств Ul9 П2. Если бы было выполнено включение ЩсПь то точки из разных множеств Щ, П2 лежали бы в П{, т. е. по одну сторону от Г, что невозможно. Следовательно, ЩсгПг. Так как Π1ΙΙΠ2 —Ш11Ш» то из включений Щ сг Πι, П2с:П2 вытекает, что Πί = Πι, Щ = П2. Определение 20.8. Множества Πι, Π2, построенные в теореме 20.7, называются открытыми полупространствами, определяемыми в X гиперплоскостью Г (или открытыми полупространствами, на которые гиперплоскость Г разбивает пространство X). Таким образом, πιηπ2 = 0, п,пг = 0, п2пг = 0, π,υπ,υτ^. Каждое из множеств Πι = Πι U Г, П2 = П2 U Г называется замкнутым полупространством. Таким образом, π,ηπ^Γ, π,υπ^*. Иногда, учитывая связь полупространств с аффинными функциями, вводят также термины «положительное» и «отрицательное» полупространства. Именно, пусть /: X-+D — непостоянная аффинная функция, ядром которой служит гиперплоскость Г, и пусть обозначения Пь П2 — те же, что и в доказательстве теоремы 20.7 (т. е. в точках множества Ш функция f положительна, а в точках множества П2 — отрицательна). Тогда Πι называют открытым положительным полупространством, а П2_-~ открытым отрицательным полупространством. Точно так же Πι называют замкнутым положительным полупространством, а П2 — замкнутым отрицательным полупространством.
166 ГЛ. ΙΓ. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ f20 Следует, однако, иметь в виду, что эти термины условны. В самом деле, аффинная функция f\ = —f также имеет своим ядром гиперплоскость Г, но по отношению к этой аффинной функции уже, наоборот, Пг является положительным полупространством, а Πι — отрицательным. Таким образом, по отношению к гиперплоскости Г оба полупространства равноправны и любое из них мы можем условиться считать «положительным» (надлежащим образом выбрав аффинную функцию, имеющую гиперплоскость Г своим ядром). Теорема 20.9. Пусть Г — гиперплоскость пространства X и A, BsX — такие точки, что вектор АВ принадлежит направляющему подпространству гиперплоскости Г (в этом случае говорят также, что вектор АВ параллелен гиперплоскости Г). Тогда либо обе точки Л, В принадлежат гиперплоскости Г, либо они расположены по одну сторону от нее. Доказательство. Пусть С — произвольная точка гиперплоскости Г и D^X — такая точка, что CD = AB. Тогда ВеГ (поскольку вектор АВ принадлежит направляющему подпространству гиперплоскости Г). Выберем аффинную функцию /, ядром которой служит гиперплоскость Г, Тогда f(C) = = f(D) = 0. _ _ Соотношение CD = АВ можно записать в виде D = C+AB = C + B-Ai из этого соотношения вытекает, что f(D) = f(C) + f(B)-f(A), т. е. f(B) = f{A). Остается применить теорему 20.6. Теорема 20.10. Пусть (R, X) —аффинное пространство и Р, Q — взаимно дополнительные плоскости в X. Обозначим через π проектирование пространства X на плоскость Ρ в направлении плоскости Q. Тогда, если Π — открытое (замкнутое) полупространство пространства Я, то прообраз лг^П) представляет собой открытое (замкнутое) полупространство пространства X. Доказательство. Пусть Г — гиперплоскость пространства Р, ограничивающая полупространство П. Тогда в силу теоремы 19.12 лг^Г) есть гиперплоскость пространства X. Пусть А, В — точки плоскости Я, не лежащие в Г, а Л', β' — такие точки пространства X, что п(А') = А, п(В')=В. Тогда в силу аффинности отображения π мы имеем π ([Л', β7]) = [Л, В]. Если точки Л, β плоскости Ρ расположены по одну сторону гиперплоскости Г, т. е. отрезок [Л, β] не пересекается с Г, то отрезок [А\В'\ не пересекается С π-1 (Г), т, е. точки Л', В' рас-
21] § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 167 положены в X по одну сторону гиперплоскости яг1 (Г). Если же д В расположены в Ρ по разные стороны от Г, то Л', В' расположены в I по разные стороны гиперплоскости π-1 (Г). Из этого и вытекает доказываемое утверждение. 21. Евклидово пространство. Аффинное пространство (/?, X) называется евклидовым пространством, если в R введено скалярное произведение, т. е. R является евклидовым векторным пространством. Таким образом, пара (R, X) есть n-мерное евклидово пространство, если векторы (элементы множества R) и точки (элементы множества X) удовлетворяют всем пяти группам аксиом I—V* Это позволяет ввести в множестве X метрические понятия (расстояния, углы и др.). Именно, пусть Л, В— две точки пространства X. Расстоянием между точками Л и В называется длина вектора АВ\ обозначается расстояние одним из символов р(А,В) или \А — В\: р(А,В) = \А-В\ = \АВ\. Далее, пусть Л, В, С — три точки пространства X, причем В Φ Α9 В Φ С. В таком случае векторы ВА, ВС отличны от нулевого вектора. Угол между этими векторами (см. замечание 16.6) обозначается символом Ζ ABC. Заметим, что при нашем определении угла всегда выполняется неравенство 0<Z ABC^n. Наконец, если 1\ и k — два луча с общей концевой точкой β, то под углом Ζ (lu l2) между этими лучами Рис. 52. понимается угол между направляющими векторами лучей l\9 /г, т. е. угол Ζ ЛВС, где Ле/ь Се /2, причем А Ф В, СФВ (рис. 52). Другие метрические понятия (длины кривых, площади фигур, объемы тел и т. п.) нам не понадобятся. Теорема 21.1. Всякое евклидово пространство является метрическим пространством, г. е. введенное в евклидовом пространстве расстояние обладает следующими тремя свойствами (для любых точек А9 β, С): 1° р(Л, Л) = 0; ρ (Л, В)>0 при АфВ\ 2° ρ (Л, S) = p(S, Л); 3° р(Л, β) + ρ(β, С)>р(Л, С). Доказательство. Соотношение р(Л,Л) = 0 означает, что |ЛЛ| =0, т. е. что длина нулевого вектора равна нулю (см. стр. 126). Неравенство р(Л, β)>0 при АфВ означает, что
168 ™. Ι*· ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [21 \а\ > О при а = АВ ФО (см. аксиому IV4). Таким- образом, свойство 1° справедливо. Далее, соотношение р(Л, В) = ρ (β, А) означает, что \АВ\ = = \ВА\, т. е. что (—а)2 = а2\ это соотношение также справедливо. Наконец, неравенство р(Л, В)+р(В, С)^р(Л, С) означает, что |АВ| + |В?|>|ЛС|. Так как АС = АВ + ВС, то доказываемое неравенство можно записать в виде \АВ\ + \ВС\>\АВ + ВС1 Это соотношение непосредственно вытекает из теоремы 16.5 (см.- соотношение (16.3)). Теорема 21.2. Для любых трех точек А. В, С евклидова пространства справедливо (при В Φ Α, Β φ С) соотношение (р(Л, С))2 = (р(Л В)Г + (9(В, С))2- — 2р (А, В) ρ {В, С) cos (Ζ ABC). (21.1) В частности, если угол Ζ ABC прямой, то (р (A, C)f = (ρ (Д β))2 + (ρ (В, С))2. (21.2) —> —> Доказательство. Положим ВА = а, ВС = с. Тогда А^=ВС-В~А = с — а, и потому (р(Д C)f = \ ЛСр = (Л02 = (с-а)2 = с2 + с2-2ас = = |ap + |cp-2|a|.Mcos(Z(a, с)) = = |S^P + |iCp-2|sl|-|fiC|cos(Z^fiC) = = (ρ (А, В))2 + (р (В, С))2 - 2р (А, В) ρ (В, С) cos (Ζ .ЛЯС). Замечание 21.3. Теорема 21.2 вместе с некоторыми ранее установленными предложениями ясно показывает, что двумерное евклидово пространство совпадает по своим свойствам с плоскостью, изучаемой в школьном курсе планиметрии, а трехмерное евклидово пространство — с пространством, изучаемым в курсе стереометрии. Так, на стр. 148 мы установили, что через две различные точки проходит прямая и притом только одна, на стр. 146 установили, что через каждую точку проходит единственная прямая, параллельная данной, и что две прямые, параллельные третьей, параллельны между собой (транзитивность понятия параллельности) и т. п. Далее, если вместо р(Л, В) писать обычное «школьное» обозначение АВ для длины отрезка с концами в точках Л и В, то соотношение 3° в теореме 21.1 превратится в известное утверждение о том, что каждая сторона треугольника меньше суммы двух других его сторон, а соотношения (21.1), (21.2) превратятся соответственно в теорему косинусов и Теорему Пифагора. Аналогичным образом можно было бы доказать и осталь-
211 § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 169 теоремы школьного курса. Таким образом, рассмотренные выше пять ные аКсиом I—V дают (при η = 2 и η = 3) полное аксиоматическое описание элементарной геометрии *). Пусть Ρ — плоскость в пространстве X. Вектор a&R называется ортогональным плоскости Р, если для любых точек А В ^ Ρ векторы а и АВ ортогональны. Если еи ..., eh — базис плоскости Р, то для ортогональности вектора а к плоскости Р, очевидно, необходимо и достаточно, чтобы вектор а был ортогонален каждому из векторов еи ..., eh. Две плоскости Pi,P2czX будем называть ортогональными, если для любых точек А,В^РХ\ С, ΰ g Р2 векторы АВ и CD ортогональны**). Если при этом dim Р\ + dim Р2 = dim X, то каждая из" плоскостей Р\, Р2 называется ортогональным дополнением для другой плоскости. Теорема 21.4. Через любую точку А0^Х можно (и при- том единственным способом) провести плоскость, являющуюся ортогональным Дополнением для данной плоскости Ρ cz X. Далее, если плоскость Pf является ортогональным дополнением плоскости Ρ cz X, то плоскости Ρ и Рг являются взаимно дополнительными (и, следовательно, имеют единственную общую точку). Наконец, если вектор А0В ортогонален плоскости Р, то точка В принадлежит плоскости Р', проходящей через До и являющейся ортогональным дополнением плоскостц. Я. Доказательство. Пусть Ρ cz X, А^^Х. Обозначим размерность плоскости Ρ через k и выберем ортонормированный базис е\, ..., ek плоскости Р. Далее, дополним ортонормирован- ную систему векторов е\, ..., ek до ортонормированного базиса е\, ..., eki ем-i, ..., еп пространства X. Через Р\ обозначим множество всех точек вида В - Λ + i^Wi + ... + λη*η. (21.3) где. λ^+1, ..., λη — произвольные действительные числа.. Таким образом, Ρχ есть (п — k) -мерная плоскость в X, содержащая точку Л0. Ясно также, что dim Ρ + dim P{ — k + {η — k) = η = dim X. Наконец, для любых точек А,В^Р{; C,D&P мы имеем _ ΑΒ = μ*+*βΗ+ι+ ... + μηβη, θδ=*μι€χ+ ... + μ***. *) Эта аксиоматика геометрии была предложена выдающимся немецким геометром Г. Вейлем. **) Заметим, что это определение не соответствует укоренившейся в школе терминологии, согласно которой две «ортогональные» друг другу плоскости имеют общую прямую. Согласно принятой здесь терминологии две (двумерные) плоскости в трехмерном пространстве не будут никогда ортогональными.
170 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [21 и поэтому векторы АВ и CD ортогональны. Таким образом, Р\ есть ортогональное дополнение плоскости Р, чем установлено существование, Докажем единственность. Пусть Р2— плоскость, проходящая через точку А0 и являющаяся ортогональным дополнением для Р. Покажем, что плоскости Pi и Р2 совпадают. Пусть А — произвольная точка плоскости Р2. Тогда Α^Α = λιβχ+ ... +ληβη. (21.4) Поскольку Р2 есть ортогональное дополнение для Р, вектор А0А ортогонален каждому из векторов еь ..., е&. Отсюда следует, что в соотношении (21.4) все коэффициенты λ1, ..., Kh обращаются в нуль. Таким образом, А0А = λ ek+\ + ... + ληβη, или A=A0 + Xk+lek+l+ ... +Kneni откуда вытекает, что А е Рь Итак, Р2 cz P\. Так как dim Ρ + dimPj = dim Ρ + dimP2 = dim Xt το dim.Pi = dim P2, и потому из включения Р2 сг Р{ вытекает, что Р2 == Рь Этим доказана единственность. Далее, так как направляющее подпространство LP плоскости Ρ порождается векторами еь ..., **, а направляющее подпространство LPl плоскости Pi порождается векторами ek+u ..., *η, то LP φ LPl— R, т. е. плоскости Ρ и Pi являются взаимно дополнительными. Наконец, если вектор AqB ортогонален плоскости Р, то этот вектор удовлетворяет соотношению (21.3), и потому В е Р\. Теорема 21.5. Из данной точки Л0е1 на данную плоскость Ρ cz X можно опустить единственный перпендикуляр. Иначе говоря, в плоскости Ρ существует и притом только одна точка Ву обладающая тем свойством, что вектор А0В ортогонален плоскости Р. Расстояние р(А0, В) называется расстоянием от точки А0 до плоскости Р. Доказательство. Проведем через точку А0 плоскость Рь являющуюся ортогональным дополнением плоскости Р, и обозначим через В общую точку плоскостей Ρ и Р\. Так как А0, В е Рь то вектор А0В ортогонален к плоскости Р, т. е. точка В — искомая, Если В' —другая точка плоскости Р, для которой вектор А0В' ортогонален к плоскости Р, то в силу теоремы 21.4 В'&Ри т. е. В' — общая точка плоскостей Ρ и Рь и потому В' = В,
21J § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 171 Точка β, существование и единственность которой доказаны в теореме 21.5, называется ортогональной проекцией точки А0 на плоскость Р. Таким образом, ортогональное проектирование на плоскость Ρ представляет собой проектирование пространства X на плоскость Ρ в направлении плоскости Pi, где А — ортогональное дополнение плоскости Р. Поэтому для ортогонального проектирования справедливы утверждения, указанные в теоремах 19.11, 19.12, 20.10. Пример 21.6. Пусть Pi и Р2 — две параллельные плоскости евклидова пространства X. Тогда расстояние от точки АХ^Р\ до плоскости Р2 не зависит от выбора точки Αχ е Р\ и оно равно расстоянию от произвольной точки В е Р2 до плоскости Р\. Это расстояние называется расстоянием между параллельными плоскостями Р\ и Р2. В самом деле, пусть AUA2 e Pi; обозначим через В\ ортогональную проекцию точки ЛА на плоскость Р2. Вектор ΑχΑ2 принадлежит направляющему подпространству плоскости Pi, а потому и направляющему подпространству плоскости Р% (так как P1IIP2). Следовательно, точка принадлежит плоскости Р2. Из написанного равенства следует, что А2В2 = ΑχΒχ. Так как Βχ—ортогональная проекция точки Αχ на плоскость Р2, то вектор ΑχΒχ ортогонален плоскости Р2. Значит, и вектор А2В2 ортогонален плоскости Р2, и потому, поскольку В2 е Р2, точка В2 является ортогональной проекцией точки А2 на плоскость Р2. Теперь ясно, что расстояния от точек Αχ и А2 до плоскости Р2 одинаковы: р(Л„ θι) = ΙΛβιΙ = |Λβ2|==ρ(Λ, Β2). Таким образом, расстояние от точки А е Pi до плоскости Р2 не зависит от выбора точки А е Ρχ. Наконец, заметим, что вектор ΑχΒχ ортогонален не только плоскости Р2, но и плоскости Рь т. е. Αχ — ортогональная проекция точки Βχ на плоскость Р{. Поэтому расстояние от точки Αχ До плоскости Р2 (т. е. р(Аь Βχ)) равно расстоянию от точки Βχ До плоскости Рь Теорема 21.7. Пусть (R,X) и (S,Y)—евклидовы пространства и f: X-+Y — аффинное отображение. Тогда существует такое число Μ > 0, что для любых точек /4,,ВеХ справедливо соотношение P(f(A)> f(B))~\f(B)-f(A)[^M\B~A\ = MP(A, В).
172 ГЛ. 1Г. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [21 Доказательство. В силу (20.1) f(B)-f(A)=fp(AB) = fp(B-A). Поэтому доказываемая теорема непосредственно вытекает из теоремы 16.15. Теперь мы рассмотрим способы записи гиперплоскостей, полупространств и плоскостей в евклидовом пространстве. Теорема 21.8. Пусть (/?, X) — евклидово пространство. Для всякой аффинной функции f: X-+D существует (и притом только один) вектор я, удовлетворяющий соотношению f(B) = f(A)+nAB, Л, fieZ; (21.5) этот вектор будет обозначаться символом grad/. Далее, если Q — фиксированная точка пространства X, п—^некоторый вектор и λ— действительное число, то формула f{B) = X + nQB, B<=X, (21.6) определяет аффинную функцию на X, причем grad f = п. Доказательство. Пусть f: X-+D — аффинная функция. Тогда для любых точек Α,Β^Χ справедливо соотношение (см. (20.1)) /(Я) = /(Л) + ср(ЛЯ), где φ: R-+D — некоторый линейный функционал. В силу теоремы 16.16 мы имеем φ (AS) = η AS, где η a= grad φ — градиент линейного функционала φ. Таким образом, соотношение (21.5) справедливо. Если я' — Другой вектор, обладающий тем же свойством: f(B)-f(A) + n'AB9 A, Bel, то, вычитая это соотношение из (21.5), получим (п-п')АВ = 0 для любого вектора АВ е R. Отсюда следует, что η — η' = 0, т. е. η = η'. Аффинность функции (21.6) вытекает из того, что φ (α) = па есть линейный функционал на R (ср. (20.2)). Теорема доказана. Пусть теперь Г — произвольная гиперплоскость пространства X и f: X-»D — непостоянная аффинная функция, ядром которой служит гиперплоскость Г. Градиент функции / обозначим через я. Для любых двух точек Л,ВеГ мы имеем f(A) = 0, j{B) = 0,
21] § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 173 и потому в силу (21.5) пАВ = 0. Следовательно, вектор η ортогонален гиперплоскости Г. Итак, если Г — гиперплоскость и f — непостоянная аффинная функция, ядром которой является гиперплоскость Г, то вектор η = grad / ортогонален гиперплоскости Г. Этот вектор называется нормалью (или нормальным вектором) гиперплоскости Г. Нормальный вектор гиперплоскости Г можно также получить следующим образом. Выберем ортонормированный базис еи ... еп-\ гиперплоскости Г и дополним его вектором еп до орто- нормированного базиса еи ..., еп пространства X. Тогда вектор %еп при любом λ φ 0 отличен от нуля и ортогонален каждому из векторов в\9 ..., en_i, т. е. ортогонален гиперплоскости Г. Иначе говоря, вектор Кеп (λ φ 0) является нормальным вектором гиперплоскости Г. Легко видеть, что при этих обозначениях справедливо и обратное утверждение: если η — нормальный вектор гиперплоскости Г, то η = %еп (λ Φ 0). Теорема 21.9. Пусть Г — некоторая гиперплоскость,·А0 — некоторая точка гиперплоскости Г и η — нормальный вектор этой гиперплоскости. Тогда гиперплоскость Г задается уравнением ядД = 0, (21.7) т. е. точка А е X в том и только в том случае принадлежит гиперплоскости Г, если она удовлетворяет условию (21.7). Далее, открытые полупространства, определяемые гиперплоскостью Г, задаются неравенствами я/О>0, лД2<0, (21.8) т. е. точка А е X в том и только в том случае принадлежит положительному {отрицательному) полупространству, если вектор А0А образует с вектором η острый (тупой) угол. Наконец, замкнутые полупространства, определяемые гиперплоскостью Г, задаются неравенствами лДИ>0, лДЗ<0. (21.9) Доказательство. Положим МЛ) = МА Ле! Функция f: X-+D аффинна и gradf = п. Если А — произвольная точка гиперплоскости Г, то пА^А = 0 (так как η — нормальный вектор гиперплоскости Г), т. е. f(A) = 0. Таким образом, Гс с: Кег/. Но так как обе плоскости Г, Кег/ имеют одну и ту же размерность η—1, то Г = Kerf. Итак, Г есть ядро аффинной функции f, т. е. Г определяется уравнением f(A) = 0, или, что то же самое, уравнением (21.7),
174 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [21 Далее, открытые полупространства Πι, Пг, определяемые гиперплоскостью Г, задаются неравенствами f(A) > О, f(A) < О (см. доказательство теоремы 20.7), т. е. неравенствами (21.8). Наконец, неравенству пА0А ^ 0 удовлетворяют точки, для которых пАоА > 0, и точки, для которых пА0А = 0. Таким образом, первое из неравенств (2L9) описывает множество Πι U Г = = Πι, τ. е. соответствующее замкну- *sgrad/' ^ Тое полупространство. То же относится ко второму неравенству (21.9). Определение 21.10. Пусть Г — некоторая гиперплоскость, А0 — ее точка и η — ее нормальный вектор. Чтобы различать полупространства, определенные гиперплоскостью Г, условимся говорить, что вектор η на- правлен в сторону полупространства, состоящего из всех точек Л, удовлет- ™^0 воряющих неравенству пА0А > 0 (или неравенству яЛ0Л^0). Таким образом, если f: X-+D аффинная функция, ядром которой служит гиперплоскость Г, то вектор n = grad/ направлен в сторону положительного полупространства (рис. 53). Теорема 21.11. Пусть Л о— произвольная точка евклидова пространства X и Ль..., я&е R — линейно независимые векторы. Тогда множество Ρ всех точек А е X, удовлетворяющих системе соотношений Л1ЛИ = 0, ..., %ЛИ = 0, (21.10) представляет собой (п — k)-мерную плоскость, проходящую через точку Л0. В таком виде можно представить любую (п — k)- мерную плоскость пространства X, проходящую через точку А0. Доказательство. Определим в X аффинные функции й(Л)«*М<И, ..., fk(A) = nkA^A. Тогда, по условию, векторы /i1 = grad/1, ..., nk=gradfk линейно независимы. Обозначим через Г* ядро аффинной функции fil Г* = Кег/„ /-!,..., *. Тогда, по теореме 20.4, пересечение Γι Π ... Π 1\ представляет собой (η — k)I-мерную плоскость в X. Но это пересечение
22] § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 175 описывается системой соотношений МЛ)-0, ..., М<4)=0, (21.11) τ е системой соотношений (21.10). Таким образом,системаурав- нений (21.10) определяет в X некоторую (п — &)-мерную плоскость. Очевидно, что эта плоскость проходит через точку Л0 (так как А0 удовлетворяет системе соотношений (21.10)). В силу той же теоремы 20.4, любая (п — k) -мерная плоскость, проходящая через точку Л0, может быть записана в таком виде. 22. Топология евклидова пространства. Пусть О — произвольная точка евклидова пространства (/?, X) и г—положительное число. Множество всех точек Лб1, удовлетворяющих условию Ρ (О, Л)<г, называется открытым шаром с центром О и радиусом г. Мы будем обозначать этот шар символом Ur(0). Пусть теперь Η — некоторое множество в пространстве X. Точка О е X называется внутренней точкой множества Я, если существует такое_ положительное число г, что Ur(0) czH. Множество GczX называется открытым (в пространстве X), если каждая точка 4g0 является внутренней точкой этого множества. Пустое множество также считается открытым. Пример 22.1. Всякий открытый шар Ur(0) является в X открытым множеством. В самом деле, пусть Л Εί/Γ(0), τ. е. р(0, Л)<г. Положим г' = г — ρ (О, Л). Число г' положительно, и мы можем рассмотреть шар Urr{A) с центром Л и радиусом г'. Для любой точки β, принадлежащей этому шару, имеем р(Л,Б)<г', и потому в силу теоремы 21.1 р(0, β)<ρ(0, Л) + р(Л, 5)<р(0, Л) + г' = = р(0, Л) + (г-р(0, А))=г. Таким образом, р(0, В) < г, т. е. B^Ur{0). Тем самым доказано включение Urf (A) cz Ur (О), которое и означает, что шар Ur(O) является открытым множеством. Множество Fd X называется замкнутым, если его дополнение X\F (т. е. множество всех точек пространства X, не принадлежащих F) является открытым множеством. Пример 22.2. Замкнутый шар с центром О и радиусом г, г. е. множество всех точек А е X, удовлетворяющих условию 9(0, A) sg; r, является замкнутым множеством. Действительно, Дополнением этого замкнутого шара является множество G всех точек ΛεΧ, удовлетворяющих условию ρ (О, Л) > г. Пусть 4e=G, т. е. р(0, Л) >г. Положим г' = р(0, А)—г. Число г' положительно, и мы можем рассмотреть шар Ur>{A). Цсдц
176 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [22 β€Ξί/Γ'(Λ), т. е. ρ (А В)<г\ то ρ (О, B) = p(Of S) + p(fi, Л) — р (Bf Л)>р(0, Λ)-ρ(β, Л) = =p(OJ)-p(AB)>p(OJ)-r' = p(OM)-(p(0)A)-r) = r, т. е. ρ (О, В) > г, и потому β е G. Тем самым доказано включение i/r'(i4)c:G, которое и означает, что множество G открыто. Теорема 22.3. Объединение любого (конечного или бесконечного) числа открытых множеств является открытым множеством. Пересечение конечного числа открытых множеств является открытым множеством. Пересечение любого (конечного или бесконечного) числа замкнутых множеств является замкнутым множеством. Объединение конечного числа замкнутых множеств является замкнутым множеством. Эта теорема без труда доказывается на основе определения открытых и замкнутых множеств. Пусть теперь Η — произвольное множество пространства X. Рассмотрим все замкнутые множества, „содержащие Я, и обозначим через Η пересечение всех этих замкнутых множеств. В силу теоремы 22.3 множество Η замкнуто, причем оно является наименьшим замкнутым множеством, содержащим Я (т. е. если F— замкнутое множество, содержащее Я, то Fz^H). Множество Я называется замыканием множества Я. Следующая несложно доказываемая теорема (доказательства мы не приводим) дает описание замыкания в иных терминах. Теорема 22.4. Пусть HczX. Точка ДеХ в том и только в том случае принадлежит множеству Я, если при любом г 5> О шар Uг (А) содержит хотя бы одну точку множества Я. Точка А е X называется граничной точкой множества Η аХ, если при любом г>0 шар Ur(A) содержит как точки, принадлежащие множеству Я, так и точки, не принадлежащие этому множеству. Множество, состоящее из всех граничных точек множества Я, называется границей множества Я и обозначается через bd Я. _ Из теоремы 22.4 вытекает, что bd Я cz Я. Точно так же bd Я с: с= Х\Н, где Х\Н — дополнение множества Я. Таким образом, bdЯ cz Я Г\Х\Н. Легко видеть, что справедливо и обратное включение, т. е. __ bdЯ = ЯίU\Я. Непосредственно проверяется также соотношение я=яио^я), показывающее, что операция замыкания означает присоединение К множеству всех его граничных точек. В терминах границы мо-
22] § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 177 жно дать следующее определение открытых и замкнутых множеств: множество замкнуто, если оно содержит свою границу: Η zd bd Я; множество открыто, если оно не имеет общих точек со своей границей: Я Π (bd Я) = 0. Напомним теперь понятие непрерывного отображения. Пусть (R X) и (S, Υ)—евклидовы пространства и Η а X. Предположим, что задано отображение /: Η-+Υ, т. е. каждой точке Ле е Η поставлена в соответствие некоторая точка f(A) пространства К. Множество Я, фигурирующее в этом определении, называется областью определения отображения f. Отображение f: H-+Y называется непрерывным, если для каждой точки /1е еЯи каждого числа ε > О можно подобрать такое число 6 > О, HH[\Ub(A))czU.ii{A)). Таким образом, это определение означает, что если точка ВеЯ отстоит от А менее чем на δ (т. е. \А — β|<δ, fie Я), то образ f(B) точки В отстоит от f(A) менее, чем на ε, τ. е. \f(A)—f(B) I < ε. Заметим, что число б зависит, вообще говоря, и от точки Л и от числа ε, т. е. δ = δ (Л, ε). Если пространство У совпадает с числовой прямой D, то непрерывное отображение /: H-*D называют также непрерывной функцией. Теорема 22.5. Всякое аффинное отображение одного евклидова пространства в другое является непрерывным. Доказательство непосредственно вытекает из теоремы 21.7. Достаточно положить δ = ε/Λί, и тогда из р(Л, β)<6 будет следовать р(/(Л),/(Б))< ε. В рассмотренном доказательстве для каждого ε > 0 удалось подобрать число δ > 0, не зависящее от Л (т. е. пригодное для всех точек А^Н). В таком случае отображение /: Η-+Υ называется равномерно непрерывным. Следующие три теоремы мы сформулируем без доказательства; они доказываются в курсах математического анализа. Теорема 22.6. Пусть (R, X) и (S, Y) — евклидовы пространства. Если область определения Я непрерывного отображения /: Η —*Υ является замкнутым ограниченным множеством пространства X, то отображение f равномерно непрерывно, а образ /(#) является замкнутым ограниченным множеством пространства Y. Теорема 22.7. Если область определения Я непрерывной Функции f: H->D является замкнутым ограниченным множеством пространства X, то функция f достигает на Я наибольшего и наименьшего значения, т. е. существуют такие точки Л0, В0 е s Я, что для любой точки А^Н справедливы неравенства, ДА)Х/(Л)</(Я0).
178 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [22 Теорема 22.8. Пусть f: X —► Υ — непрерывное отображение, областью определения которого является все пространство X. Тогда прообраз f~l(G) любого открытого множества Gcr У является открытым множеством пространства X, а прообраз f~l (F) любого замкнутого множества F α Υ является замкнутым множеством пространства X. Пример 22.9. Пусть f: X-+D — непостоянная аффинная функция. Эта функция непрерывна (см. теорему 22.5) и потому к ней применима теорема 22.8. Так как множество, состоящее из одной точки 0, замкнуто в D, то его прообраз f~l(0)*= Kerf является, согласно теореме 22.8, замкнутым множеством пространства X. В силу теоремы 20.2 отсюда следует, что каждая гиперплоскость TczX является замкнутым множеством. Следовательно (см/теорему 20.4), любая плоскость РаХ является замкнутым множеством. Далее, так как множество [0, оо), состоящее из всех неотрицательных чисел, и множество (— оо, 0], состоящее из всех неположительных чисел, являются замкнутыми множествами числовой прямой Д то множества f^flOf °°)) и f-1((—оо, 0]) замкнуты в X. Иначе говоря, замкнутые полупространства (см. (21.9)) являются замкнутыми множествами пространства X. Аналогично, открытые полупространства (см. (21.8)) являются открытыми множествами пространства X. Пример 22.10. Так как каждая гиперплоскость TczX является замкнутым множеством (пример 22.9), то в силу теоремы 22.3 объединение Γι U ... U Γδ любого конечного числа гиперплоскостей в X также является замкнутым множеством. Мы покажем, что это замкнутое множество нигде не плотно в X, т. е. для любой точки А&Х и любого числа г > 0 найдется такой шар, целиком содержащийся в Ur(A)f который не пересекается с множеством Γι U ... U Γδ. Рассмотрим такие непостоянные аффинные функции /ь...,/«, что Ti = Кег/г, i= l,...,s, и обозначим через щ градиент функции /г·. Наибольшее из чисел \щ\9 ..., \ns\ обозначим через а. Определим точку Αλ следующим образом: если f\{A) Ф0, то положим Αγ = Α\ если же'/ι (Λ) = 0> то положим А{ = Α + γ-щ. В первом случае очевидно, что Ах е Ur(A) и /ι(Лι) Φ 0. Во втором случае р(Д Ах) = \ Д |-|-£Л1|-^|Я1|<^.а»4 2а »"м^ 2а " _ 2 т. е. A{&Ur(A). Кроме того, в этом случае U(А) = h (Л) + л,Д -щ Д =щ[^п^Ф0,
22] § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 179 Тяким образом, в любом случае мы находим такую точку А{ е JU (А) что ίι(Αλ)Φ0. Иначе говоря, A1^Ur(A) и Лк=£Гь f e i, еХ\ ГЬ и потому Л, ε l/r(A) П (*\ Г,). Каждое из множеств Ur(A), Х\Т\ открыто (см. примеры 22 1 22.9), а потому открыто и их пересечение. Следовательно, Л является внутренней точкой множества ϋτ(Α) Г) (Я\Г0, т.1 е. найдется такое число т\ > 0, что υΓι(Αι)^υΓ(Α)(](Χ\Γ{). Иначе говоря, ϋΓχ(Α\) <= υΛΑ) и U^A^a Х\Г}. Второе из этих включений означает, что шар υΓχ(Αλ) не пересекается с гиперплоскостью IV Итак, найдется шар ί/ΓιΜι)» содержащийся в Ur{A) и не пересекающийся с гиперплоскостью Г{. Точно так же найдем шар Ur2(A2) с ί/Γι(^4ι), не пересекающийся с гиперплоскостью Г2 (и не пересекающийся с f j в силу включения £/г,(Л)с:£/г,(Д)). Итак, мы нашли шар £/Г2(Л2)с: с: С/г (Л), не пересекающийся с Гх U Г2. Теперь найдем (таким же способом) шар £/Гз(Л3) с: £/г(Л), не пересекающийся с Гх (J Г2 U Г3, и т. д. Продолжая этот процесс, получим шар, содержащийся в U r (А) и не пересекающийся с Г! U ··· UIY Пример 22.11. Пусть НаХ — некоторое множество и^0е 6^-фиксированная точка. Определим на X функцию /, положив ДЛ) = р(Л0, Л), Ае=Н. Легко видеть, что эта функция непрерывна. В самом деле, положим (для любой точки Л е #) б = ε. Если ρ (Л, В) < б, то /(Я) = р(Ло, В)<Р(Л0, Л) + р(Л, 5)<р(Л0, Л) + 6 = /(Л) + е, /(Л) = р(Л0, Л)<р(Л0, β) + ρ(β, Л)<р(Л0, 5) + + р(Л, B)<f(B) + s. Таким образом, f(B)~f(A)<e, f(A)-f{B)<e9 т. е. |/(В)-/(А)|<в. Из непрерывности функции f и теоремы 22.7 вытекает следующее утверждение: пусть Η — непустое замкнутое ограниченное множество в X и Л0еХ; тогда функция f(A) = р(Л0, Л), рассматриваемая на множестве Я, достигает своего наибольшего и наименьшего значения, т. е. в Η найдется ближайшая к Л0 точка и наиболее удаленная от Л0 точка. Заметим, что если замкнутое множество НаХ не предполагается ограниченным, то утверждение о существовании ближайшей к Л0 точки остается справедливым. В самом деле, пусть Л— произвольная точка множества Я. Обозначим через Σ
180 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [23 замкнутый шар с центром А0 и радиусом г = р(Л0, А) (рис. 54). Тогда множество Я Π Σ замкнуто и непусто (например, оно содержит точку А). Поэтому в ЯП Σ найдется ближайшая к А0 точка В0. Ясно, что В0 будет также ближайшей к А0 точкой множества Я (поскольку точки множества Я, не принадлежащие множеству Я Π Σ, находятся от А0 на расстоянии, большем чем р(Л0, А)). 23. Координаты. Дадим координатную запись некоторых соотношений, рассмотренных в предыдущих пунктах. Прежде всего рассмотрим факты, относящиеся к аффинному пространству (не предполагаемому евклидовым). Пусть (R, X) — аффинное пространство размерности п. Выберем базис е\, ..., еп векторного пространства R и, кроме того, выберем точку О ^ X. Будем говорить, что (О; еи ..., еп) есть система координат в рассматриваемом аффинном пространстве X. Точку О будем называть началом координат, а векторы е{у ..., еп — базисными векторами. Каждая точка CgX однозначно записывается в виде С^=0 + х1е{-^ ... +хпеп. Числа х\ ..., хп, участвующие в этой записи, называются координатами точки С в рассматриваемой системе координат; мы будем писать L» === ^л , · · ·» X )» Далее, любой вектор a&R однозначно записывается (в том же базисе вь ·.., βη) в виде а = уге{+ ... + упеп. Числа у1, ♦♦., уп называются координатами вектора а в рассматриваемой системе координат; мы будем писать а = {у\ ..., уп}. Таким образом, имея систему координат (О; е\, ..., еп)у можно рассматривать координаты точек и векторов. В дальнейшем система координат (О; еи ..., еп) предполагается фиксированной (о чем мы упоминать не будем). Теорема 23.1. Если С = (х1 *"), D = (y\ ..., у% то CD = {yx-x\ ..., у»-х"}.
§ 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 181 Доказательство. Мы имеем С = 0+х1е{+ ... + хпеп, D = 0+yle{+ ... +у*еп> т. е. _^ _^ ОС = ххе{+ ... +^Λβη, OD = i/1e1+ ... + улея, и потому (Ю = 0D - ОС = (у1 - х1)е{ + ... +(ул-^)вл. Следствие 23.2. Если С = (х\ ..., *я), α = {ί/!, ..., у*}, то С + а = {х1+у\ ..., хп + уп). Теорема 23.3. Если а = {х\ ..., хп}, Ъ = {у\ ..., ί/Λ}, то а + Ь = {х1+у1 хп+.уп}> λα = {λχι, ..., λχη). Доказательство очевидно. Теорема 23.4. Если i ==*\?i* * ' ·» *ip 1= \у . . ., S, и то^/са С определяется соотношениями С = К1Сг+ ... +XSCS, где λ1+...+λ'=1, (23.1) то ο=(ς λ'*},..., Σ Μχη. (23.2) Доказательство. Соотношение (23.1) означает, что ОС = Х1ОС1+ ... +XsOCs. Поэтому соотношение (23.2) вытекает из очевидного равенства О = (0, 0, ..., 0), теорем 23.1, 23.3 и следствия 23.2. Из теоремы 23.4 легко получаются координатные формулировки ряда теорем (18.7, 18.8, 18.10 и др.). Мы их не приводим. Теорема 23.5. Отображение φ одного аффинного пространства в другое в том и только в том случае является аффинным, если оно записывается в координатах линейными (неоднородными) формулами* Доказательство. Пусть (/?, X), (S, У) — аффинные пространства и пусть в X введена система координат (О; еи ..., еп), а в У введена система координат (О'; е'г ..., е^). Положим С0 = О, Cx = 0 + elt C2 = 0 + e2, ..., Сп = 0 + еп,
182 ГЛ. Ιϊ. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [23 так что Со —(0, 0, 0, .... 0), С,=(1, 0, 0, ..., 0), с2 = (о, ι, о, ..., о),..., с„ = (о, о, о, ..., 1). (23-3> Пусть теперь φ: Χ-+Υ — аффинное отображение и пусть точки Л) = Ф(С0), Д1=ф(С1), ..., Dn = q>(Cn) имеют в системе (О'; е[9 ..., е^) следующие координаты: 0*=W, ..., 6Г), / = 0, 1, ..., п. Возьмем произвольную точку С = (х{ хп)^Х и координаты ее образа £> = <р(С) обозначим через у1, ..., ут: D = {y\ ..., ут). (23.4) Нам нужно выразить координаты у1, ..., ут через я1, ..., хп. Так как С = 0+^ + ...+^Ч-=Со + ^(С,~С0) + ...+^(Сл--Со)=== = (l-*i- ... -хп)С0 + х1Сг + ... + хпСП9 то в силу теорем 19.1 и 23.4 Z> = (1 —jc1 — ... -xn)D0 + xlDl+ ... +xnDn = = ((1-^!- ... -xn)bl0 + [xlb\ + ... -f*rt^, ... ..., (1 —λ;1 — ... -xn)bZ+xlb?+ ... + *Χ). Сравнивая эту запись с (23.4), получаем (23.6) Таким образом, отображение φ записывается в координатах линейными формулами. Обратно, пусть некоторое отображение φ: Χ-+Υ записывает* ся в координатах линейными формулами: yi = a[xl+ ... + а{пхп + с*9 / = 1, ..., т, (23.6) т. е. точка С= (х19...,хп) еХ переходит при отображении φ в точку D = (yl9...tym) sY9 координаты которой вычисляются по формулам (23.6). Из теоремы 23.4 непосредственно вытекает, что если С = (1— %)С'+%С"9 то <р(С) = (1—Ь)у(С')+Ъ,<р(С")9 т. е. отображение φ аффинно. Следствие 23.6. Всякая аффинная функция f: X-+D записывается в координатах в виде f(xl9 ..., хп) = (1 - х1 - ... - *") bo + x% + ...+ хпЬП9 (23.7) где bi = f(Ci)} ί = 0, 1,...,я (см. (23.3), (23.5)).
& 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 183 23] Теорема 23.7. Всякая гиперплоскость Г с: X записывается в координатах уравнением Агх1 + А2х2 + ... + Апхп + В = 0, (23.8) где хотя бы один из коэффициентов Аи ...,Ап отличен от нуля. Обратно, всякое уравнение этого вида определяет в X некоторую гиперплоскость. Далее, открытые полупространства, определяемые гиперплоскостью (23.8), задаются в координатах неравенствами А1х1 + А2х2+ ... +Апхя + В>0, Агх1 + А2х2 + ... +Апхп + В<0 [ } (23.9) а соответствующие замкнутые полупространства задаются неравенствами А{х1 + А2х2 + ... + Апхп + В^0, | Α{Χι + А2х2 + ... + Апхп + В < 0. J (23ί 10) Доказательство. Пусть Г — гиперплоскость и f: X->D— непостоянная аффинная функция, ядром которой является гиперплоскость Г. Функция / записывается в координатах формулой (23.7), т. е. формулой f(x\ ..., x*) = Alxl + A2?+ ... +Апхп + В, где мы положили АЛ = Ъх — &о,..., Ап = bn — b0, В = bo. Если бы здесь все коэффициенты А\, ..., Ап были равны нулю, то, очевидно, функция f была бы постоянной, что противоречит построению. Следовательно, хотя бы один цз коэффициентов Ль ..., Ап отличен от нуля. Теперь равенство f{A) = 0, описывающее гиперплоскость Г, принимает вид (23.8), а неравенства f(A) > 0, f(A) < 0, описывающие открытые полупространства, и неравенства f(A) ^ 0, f(A) ^.0, описывающие замкнутые полупространства, принимают вид (23.9), (23.10). Обратно, если задано уравнение вида (23.8), в котором хотя бы один из коэффициентов Аи ..., Ап отличен от нуля, то левая его часть в силу теоремы 23.5 определяет непостоянную аффинную функцию на X и потому, согласно теореме 20.1, уравнение (23.8) определяет гиперплоскость. Теорема 23.8. Гиперплоскости А{х1+ ... +Апхп + В = 0, (23.11) А\х1 + ... +A'nxn + B' = Q ' (23.12)
184 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [23 в том и только в том случае совпадают, если существует такое число k Φ О, что Ax = kAu A2 = kA* ..., An = kA'n, θ —ΛΒ'. (23.13) Доказательство. Обозначим через /, /' аффинные функции, стоящие в левых частях соотношений (23.11), (23.12). Таким образом, уравнение (23.11) определяет гиперплоскость Г = Kerf, а уравнение (23.12) — гиперплоскость Г'= Kerf. Ясно, что если имеют место соотношения (23.13), т. е. / = kf\ то гиперплоскости Г и Г' совпадают. Докажем обратное. Пусть Г = Г7. Выберем η независимых точек С\9 С2, ...,СП гиперплоскости Г и пусть С0 — точка, не лежащая в этой гиперплоскости. Тогда /«;,)= ... =/(cj = o, f(c0)#o, Г (с,)- ... -псп)-о, ПСо)фо. f (С ) Полагая k = *>\г \ > найдем, что справедливы соотношения f(Ct) = kf'{Ct), / — 0, 1, ..., п. Таким образом, аффинная функция f — k\r обращается в нуль во всех точках С0, Сь..., Сп. Аффинная функция, тождественно равная нулю, также обращается в нуль во всех этих точках. Но тогда в силу единственности (теорема 19.9) эти аффинные функции совпадают (поскольку система точек С0, Сь..., Сп независима), т.че. f — kf = 0. Иначе говоря, (A{-kA[)xl + .Г. +(An-kA'n)xn + (B-kB') = 0 для любой точки (χ1,...,хп). Следовательно, справедливы соотношения (23.13). Теорема 23.9. Гиперплоскости (23.11), (23.12) β том и только β том случае параллельны, если существует такое число кфО, что ' ' Ai^kA'u ..., An = kA'ni (23.14) Доказательство. Рассмотрим те же аффинные функции /, /', что и при доказательстве предыдущей теоремы. Ясно, что если имеют место соотношения (23.14), то гиперплоскости Г = = Кег/ и Г' = Kerf7 параллельны (см. теорему 20.3). Докажем обратное. Пусть ГЦ Г7. Выберем произвольную точку Се Г7 и положим K = f(C). Тогда аффинная функция /j=/ —λ обладает тем свойством, что /,(С*) = /(С) — λ = 0, т. е. гиперплоскость Ker f ι проходит через точку С. Кроме того, гиперплоскость Ker/i параллельна гиперплоскости Г (теорема 20.3), % значит, и гиперплоскости Г'. Таким образом, гиперплоскости
s 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 185 231 r/ __ Κθτ f и Кег U параллельны и имеют общую точку; следо- _ о Kerf ι = Kerf (теорема 18.6). Иначе говоря, гиперплоскости ^1+ _ +AnXn + {B_k) = 0t А[х1 + .·. +А'пхп + В' = 0 совпадают, а потому в силу теоремы 23.8 выполнены соотношения (23.14). Перейдем теперь к координатному описанию фактов, относящихся к евклидову пространству. Теорема 23.10. Если система координат, (О; еь...,еп) является ортоноржированной {т. е. базис еь ...,еп — ортонормиро- ванный), то расстояние между точками С = {х\ ..., *«), D = (y\ .... у") определяется формулой ρ (С, D) = VV - х1)2 + · · · + (Уп - *л)2· Доказательство непосредственно вытекает из теорем 23.1 и 16.9. Теорема 23.11. Пусть в евклидовом пространстве (/?, X) задана ортонормированная система координат (О; еь..., еп). Тогда градиент аффинной функции f{x\ ..., д:«) = Л1д:1+ ... +Λλ:λ + 5 равен gradf = {ЛЬ...,ЛП}. Доказательство. Обозначим вектор {Л1э...,Лп} через л. Тогда для любых двух точек С = (х\ ..., *»), D = (y\ ..., у") пространства X имеем f(D)-f(C) = (Aiy1+...+Anyn + B)-(Alx> + ...+^Anxn + B)=* = Al{yi-xi)+...+An(yn-xn) = nc3 (см. теоремы 23.1 и 16.9), а это означает, что η = gradf (см. (21.5)). Следствие 23.12. Пусть в ортонормированной системе координат задана гиперплоскость А{х1+ ... +Апхп + В = 0. Тогда вектор η = {Аи ...,ЛП} ортогонален этой гиперплоскости. Теорема 23.13. Пусть в n-мерном евклидовом пространстве {R, X) введена ортонормированная координатная система и
186 ГЛ. II. ОСНОВНЫЕ ПОНЯТИЯ МНОГОМЕРНОЙ ГЕОМЕТРИИ [23 заданы k гиперплоскостей Axixl+ ... +Anixn + Bt = 0, /=1, ...,*. (23.15) Если векторы ni = {A\i> ···» AiJ. * = 1» ···. &> линейно независимы, то пересечение всех гиперплоскостей (23.15) представляет собой (п — k) -мерную плоскость в X. В таком виде можно представить любую (п — k) -мерную плоскость пространства X. Доказательство непосредственно вытекает из теорем 23.11 и 20.4. Замечание 23.14. Теорема 23.13 носит аффинный характер, т. е. справедлива не только в евклидовом, но и в любом аффинном пространстве. В самом деле, если в аффинном пространстве (R, X) введена система координат (О; еь ..., еп), то мы можем ввести в R скалярное произведение по формуле {х\ ..., хп}{у\ ..., уп}*=х1у1 + ... +хпуп (где координаты векторов берутся в рассматриваемой координатной системе). Тогда (R, X) превратится в евклидово пространство, и окажется применимой теорема 23.13. Теорема 23.15. Открытый шар с центром в точке 0 = = (а1,..., ап) и радиусом г определяется неравенством {х1-ах)2+ ... +(хп-ап)2<г2, а соответствующий замкнутый шар — неравенством (х1-а1)2+ ... +(хп-а»)2<,г2 (система координат — ортонормированная). Это непосредственно вытекает из теоремы 23.10. В заключение рассмотрим вопрос о координатной записи непрерывных отображений. Пусть (#, X), (S, Y) —евклидовы пространства некоторого числа измерений и пусть задано некоторое отображение f: #-*У, где НаХ. Введем систему координат (О; еи ..., еп) в пространстве X и систему (О'; е{, ..., e'm) в пространстве Y. Наконец, возьмем произвольную точку С = = (х\ ..., хп)еЯи обозначим через у1, ..., ушкоординаты точки /(C) е=К Задание точки С = (л;1, ..., хп)&Н однозначно определяет точку f(C)~(yl, ..., ym.)t т. е однозначно определяет числа у\ ..., ут. Иными словами, каждая из координат у19 .*., ут точки /(C) представляет собой функцию, заданную на множестве Я: У* = е*(х\ ··.. хп). *=1. .... пг. (23.16)
23] § 5. ЕВКЛИДОВА ГЕОМЕТРИЯ 187 Итак задание отображения f: H-+Y определяет т функций «i. H-+D (см. (23.16)). * Очевидно, что и обратно, если заданы на множестве π произвольные функции (23.16), то этим для каждой точки (Xх ...,хп)^Н однозначно определяется некоторая точка f(x\ ..., *я)-(*!(*!. ···■ **)* ёЧ*1, .... хп)> ···, gm(x\ .... *")) пространства У, т. е. определяется отображение f: #-> У. Мы видим, что задание отображения f: H-+Y равносильно заданию функций (23.16) на множестве Н. Набор функций (23.16) представляет собой координатную запись отображения /: H->Y. Обозначим через Г* гиперплоскость пространства У, проходящую через точку О' и имеющую базис е{, ..., e*_i, e'i+u ... ..., е«,а через Р% — прямую, проходящую через точку О' и имеющую направляющий вектор е\. На прямой Р\ рассмотрим систему координат (О'; e'i). Плоскости Г* и Р\ являются взаимно дополнительными. Проектирование пространства У на прямую Pi в направлении гиперплоскости Г* обозначим через π*. Для любой точки (У1, ···» Ут)е У имеем ^(г/1,..., ут)~М<У + 1114+ ··· +г/т<)=о^ + г/^ = (г/0, т. е. проекция точки (у1,..., ут) имеет на прямой Pi координату у*. Из этого следует, что число g*(x\ ...,#п), т. е. i-я координата точки f(C) = fi*1,...,*11), равно координате (на прямой Pi) точки Яг(/(С)) = (яг о /) (С). Так как отображение щ непрерывно (см. теоремы 19.11 и 22.5), то отсюда непосредственно следует, что если отображение f: H-+Y непрерывно, то непрерывны и функции (23.16). Несложно доказывается и обратное. Таким образом, отображение f: #->У β том и только в том случае непрерывно, если непрерывны функции (23.16), осуществляющие координатную запись этого отображения.
ГЛАВА III ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ § 6. Выпуклые множества 24. Определение выпуклого множества. В дальнейшем через Еп = (#, X) мы будем обозначать /г-мерное евклидово пространство. И для точек, и для векторов будем писать включения Ле= Еп, а<=Еп (вместо Ле1, α6Ξ R). Пусть Ν — некоторое множество точек пространства Еп. Множество N называется выпуклым, если для любых двух точек Л, В этого множества отрезок [Л, В] целиком принадлежит множеству N (рис. 55). При η = 2 (т. е. в случае, когда Еп представляет собой евклидову плоскость) можно указать следующие примеры выпуклых множеств: треугольник, параллелограмм, трапеция, круг, эллипс. Фигура, изображенная на рис. 56, не является выпуклой. Приведем важные для дальнейшего примеры выпуклых множеств пространства Еп. Всякая плоскость (любого числа измерений) является выпуклым множеством пространства Еп. В самом деле, пусть Л и В — две произвольные точки плоскости Р. Тогда для любого действительного λ точка (1 *-λ)Α + λΒ также принадлежит плоскости Ρ (см. п. 18). Отсюда следует, что [Л, В]аР, т. е. множество Ρ выпукло. Всякое полупространство является выпуклым множеством пространства Еп. Действительно, пусть Π — некоторое (замкнутое) полупространство, Г — ограничивающая его гиперплоскость, Q -— произвольная точка гиперплоскости Г и η — вектор, орто- Рис. 55. Рис. 56.
24] § 6. ВЫПУКЛЫЕ МНОЖЕСТВА 189 тональный гиперплоскости Г и направленный в сторону полупространства П. Далее, пусть Л, β— две произвольные точки полупространства П. Тогда nQA^O, nQB^O. Если теперь С — произвольная точка отрезка [Л, В], то справедливо соотношение (17.6), где 0<λ<1, ή потому nQC===n((l-X)QA + XQB) = (l-X)nQA+XnQB^O. Таким образом, Cell. Тем самым доказано, что [A,B]czTl, т. е. множество Π выпукло. (Аналогично доказывается, что всякое открытое полупространство также является выпуклым множеством.) Замкнутый шар с центром Q и радиусом г > О является выпуклым множеством. В самом деле, пусть Л·, β —две точки рассматриваемого шара, т. е. p(Q, Л)<г, p(Q, β)<Γ. Пусть, далее, С — произвольная точка отрезка [Л, β], так что выполнено соотношение (17.6), где Ο^λ^Ι. Учитывая соотношения |0Л|==р((?, Л)<г, |Q£M = p(Q,B)<r и соотношение (16.2), находим: \dc\2 = QC2 = ((l-X)QA+XOB)2 = = (1 - λ)2 QA2 + 2λ(1 - K)QAQB + X2QB2< <(1-λ)2|^|2 + 2λ(1-λ)|^||0β| + λ2|0β|2< <(1 - λ)2г2 + 2λ(1 - λ)τ2 + X2r2 = r2. Таким образом, | QC |_<>, т. е. точка С тоже принадлежит рассматриваемому шару. Тем самым доказано, что весь отрезок [Л, В] принадлежит шару, т. е. шар является выпуклым множеством. (Аналогично доказывается, что открытый шар Ur(Q) с центром Q и радиусом τ является выпуклым множеством.) Теорема 24Л. Пересечение любого числа выпуклых множеств также является выпуклым множеством. Доказательство. Рассмотрим пересечение двух выпуклых множеств (пересечение любого числа выпуклых множеств, в том числе и пересечение бесконечного числа выпуклых множеств, рассматривается совершенно аналогично). Пусть Μ и N — выпуклые множества. Пусть, далее, Л и β — две произвольные точки множества Р = М (]Ν и С —некоторая точка отрезка [Л, В]. Так как ЛеР, то точка А принадлежит каждому из множеств Λί, Ν и, точно так же, точка β принадлежит каждому из множеств Λί, N. Так как Л е Λί, β е Λί, то в силу выпуклости множества Μ весь отрезок [Л, β] принадлежит множеству Λί и, следовательно, С е Λί. Точно так же,
190 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [24 поскольку А <= N, В е N, то в силу выпуклости множества N весь отрезок [А, В] принадлежит множеству N и, следовательно, С s N. Таким образом, точка С принадлежит каждому из множеств Λί, Ν9 т. е. С ^Μ()Ν — Р. Тем самым доказано, что любая точка С отрезка [Л, В] принадлежит множеству Р, т. е. [A, B]czP, и потому множество Ρ выпукло. Теорема доказана. Заметим, что пересечение нескольких выпуклых множеств может оказаться и пустым множеством. Например, на рис. 57 каждые два из выпуклых множеств Ми М2, Щ имеют непустое пересечение, а пересечение Aii f| Λί2 Π Μ3 всех трех множеств пусто. Так как всякое полупространство является выпуклым множеством пространства £"*, то в силу доказанной теоремы пересечение любого числа полупространств также является выпуклым множеством. Нас будет сейчас интересовать пересечение конечного числа полупространств. Обратимся сначала к случаю η = 2, т. е. к случаю, когда рассматриваются фигуры на плоскости. В этом случае мы будем говорить о пересечении конечного числа полуплоскостей. Пересечение двух полуплоскостей может быть углом (в частности, полуплоскостью), полосой ида прямой линией (рис. 58). Таким образом, пересечение двух полуплоскостей (если оно непусто), всегда является неограниченной фигурой. Пересечение трех полуплоскостей либо является неограниченной фигурой (рис. 59), либо может быть треугольником или точкой (рис. 60). Четыре полуплоскости могут дать в пересечении (кроме уже перечисленных случаев) выпуклый четырехугольник или отрезок (рис. 61). Вообще, пересечение нескольких полуплоскостей может либо быть неограниченной фигурой, либо же представляет собой точку, отрезок или выпуклый многоугольник. При этом любой выпуклый многоугольник можно себе представлять как пересечение конечного числа полуплоскостей (рис. 62) — достаточно взять столько полуплоскостей, сколько имеется сторон у многоугольника. Если условиться считать точку нульмерным многогранником, отрезок — одномерным выпуклым многогранником, а выпуклый многоугольник — двумерным многогранником, то можно сказать, что пересечение конечного числа полуплоскостей, если только оно непусто и представляет собой ограни- ченную фигуру, является выпуклым многогранником (нульмерным, одномерным или двумерным). Рис. 57.
W/SMJfy Рис. 59. *ά мШ Рис. 60. Рис. 61. Рис. 62.
1§2 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ \% Аналогично обстоит дело и в трехмерном пространстве: пересечение конечного числа полупространств (если оно непусто и ограничено) является либо нульмерным многогранником (точкой), либо одномерным выпуклым многогранником (отрезком), либо двумерным выпуклым многогранником (т. е. выпуклым многоугольником, лежащим в некоторой плоскости), либо же трехмерным выпуклым многогранником (т. е. выпуклым многогранником в обычном смысле слова). В n-мерном пространстве при η > 3 у нас нет тех непосредственно наглядных геометрических представлений, которые помогают при рассмотрении фигур на плоскости и в трехмерном пространстве. Поэтому слово «многогранник» не вызывает у нас зрительного впечатления тела в я-мерном пространстве. В связи с этим - указанное выше предложение принимают в случае л-мерного пространства за определение выпуклого многогранника: пересечение конечного числа замкнутых полупространств, если оно является непустым ограниченным множеством, называется выпуклым многогранником. Всякий выпуклый многогранник является выпуклым множеством, т. е. вместе с любыми двумя точками содержит весь соединяющий их отрезок (ибо полупространство выпукло, а пересечение выпуклых множеств также является, согласно теореме 24.1, выпуклым множеством). Обратное, конечно, неверно: не всякое выпуклое множество является выпуклым шар в n-мерном пространстве является выпуклым множеством, но не является (при п>\) выпуклым многогранником. Одним из простейших выпуклых многогранников в /г-мерном пространстве является п-мерный параллелепипед, определяемый в координатах неравенствами: ах<,хх^Ь\ α2<*2<62, ... ..., αΛ<*Λ<ίΛ (24.1) где а1 < Ь\ а2 < Ь\ ..., ап < Ьп. Заметим, что при η = 2 точки {х\ г2), координаты которых подчинены неравенствам (24.1), заполняют прямоугольник (рис. 63); при п = 3 неравенства (24.1) - определяют в пространстве переменных х\ х2, х3 параллелепипед. То, что /г-мерный параллелепипед действительно является выпуклым многогранником, нетрудно понять, если записать неравенства (24.1) в следующем виде: *'>а!, х2>а\ ..., хп^а\ *><6\ х2<>Ь2, ..., хп^Ь\ многогранником Например,
25] § 6. ВЫПУКЛЫЕ МНОЖЕСТВА 193 Кяжттое из написанных неравенств определяет некоторое полу* пространство (см. теорему 23.7), а так как /г-мерный паралле* епипед состоит из точек, удовлетворяющих всем этим неравенствам, то он представляет собой пересечение 2п полупространств. Кроме того, /г-мерный параллелепипед является, очевидно, ограниченным множеством. Поэтому он представляет собой выпуклый многогранник. 25. Выпуклая оболочка. Под выпуклой оболочкой некоторого множества F понимают наименьшее выпуклое множество, содержащее F. Такое наименьшее выпуклое множество непременно существует, так как если мы возьмем все содержащие F выпуклые множества, то их пересе- ' чение будет как раз наименьшим выпуклым множеством, содержащим F. Выпуклую оболочку множества F будем в дальнейшем „обозначать через conv F. На рис. 64 заштриховано множество F и пунктиром показана линия, ограничивающая выпуклую оболочку. Выпуклая оболочка трех точек, не ле- Рис. 64. жащих на одной прямой, представляет собой треугольник. Наглядное представление о выпуклой оболочке плоской фигуры F дает туго натянутая «резиновая» нить, охватывающая эту фигуру (ср. рис. 64): фигура, ограниченная натянувшейся нитью, и есть выпуклая оболочка. В трехмерном пространстве аналогичным образом можно представить себе натянутую упругую пленку («пузырь»), охватывающую множество F\ тело, ограниченное натянувшейся пленкой, и есть выпуклая оболочка. Разумеется, такое наглядное представление не может заменить точного описания выпуклой оболочки; к тому же оно неприменимо при /г>3. Следующая теорема дает точное алгебраическое описание выпуклой оболочки произвольного множества F. Теорема 25.1. Для того чтобы точка С принадлежала выпуклой оболочке множества F а Еп, необходимо и достаточно, чтобы существовали такие точки Л0, Аи ..., Ап множества F (не обязательно все различные между собой) и такие числа λ > λ , ..., λΛ, что выполнены соотношения: λ°>0, λ!>0, ..., λΛ>0, λ° + λ!+ ... +λΛ=1, (25.1) С = λ°Α0 + λιΑ{ + ... + ληΑΗ. (25.2) Доказательств о. Обозначим через F* множество всех точек С, для каждой из которых существует такое натуральное число т, такие точки Л0, Аи ·.., Ам множества F и такие
1Й4 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ J25 числа λ°, λ1, ..., λ"\ что выполнены соотношения λ°>0, ^>0, ..., Ят>0, λ0 + λ! + ... +λ'η = 1, (25.3) С = λ°4, + λ1 Л! + ... + ЛтЛт. (25.4) Заметим, что в соотношениях (25.3) и (25.4) число т никак не связано с размерностью- η рассматриваемого пространства и, более того, для каждой точки С множества F\ возможно, придется выбирать свое значение т. Докажем, что множество F* выпукло. Пусть С и D — две произвольные точки множества F\ Тогда для точки С существуют число т, точки Л0, Аи ..., Ат и числа λ°, λ1, ..., λ™, удовлетворяющие соотношениям (25.3), (25.4), а для точки D существуют натуральное число р, точки B0i Blt ..., Вр и числа μ°, Μ·1! *··> μρ> удовлетворяющие соотношениям μ°>0, μ'>0, ..., μ*>0, μ° + μ1 + ... + μ' = 1, ϋ = μ°Β0 + μιΒι+ ... + μρΒρ. Пусть теперь £ — произвольная точка отрезка [С, D]. Тогда £ = (l-v)C + vD (ср. (17.6)), где число ν удовлетворяет неравенствам 0<Х1, так что оба числа ν, 1 — ν неотрицательны. Имеем £β (1-ν) (λ%+λΜ, + ... + bmAm)+v (μ*Β0+μ*Βι + ... + μρΒρ)=* = λ°(1-νΜο + λ,(1-ν)Λ1+ ... + Лт(1-г)Лш + + μ°νβ0 + μ*νβ, + ... + μρνΒρ (25.5) (заметим, что если среди точек At и β/ имеются совпадающие, то в правой части может быть произведено приведение подобных членов, что, впрочем, для нас несущественно). Легко вчдеть, что все коэффициенты в правой части соотношения (25.5) неотрицательны, а сумма их равна единице: λ° (1 - ν) + λ1 (1 — ν) + ... + Хт (1 - ν) + μ°ν + μ1 ν + ... + μ'ν= -(l-v)(X° + tf + ... +λΛ) + ν(μ° + μ1+ ... +μΡ) = = (1—ν)· 1+ν·1 = 1. Но тогда равенство (25.5) показывает, что точка Ε принадлежит множеству F\ Итак, любая точка Ε отрезка [С, D] принадлежит множеству Ζ7*, т. е. [С, D] cz F\ и потому множество F* выпукло. Ясно, кроме того, что множество F* содержит F: для любой точки Cef мы можем положить т = 0, Л0=*=С, λ°=1 и написать: C = X°AQi так что для точки С соотношения (25.3), (25.4) выполнены.
25] § б. ВЫПУКЛЫЕ МНОЖЕСТВА 195 Докажем теперь, что всякое выпуклое множество М,_ содержащее F, содержит таюке и F*. В самом деле, пусть Μ zd F и пусть С — произвольная точка множества F*, так что для нее выполнены соотношения (25.3), (25.4). Мы можем при этом предполагать (выкинув, если нужно, в (25.4) лишние слагаемые), что все числа λ°, λ1, ..., Хт положительны. Обозначим теперь через Bt точку, определяемую соотношением Bi = W + V+ ... + а/(λΜ° + λΜι + ·■ ■ + λ<^ (25·6) / = 0, 1, ..., т. Непосредственный подсчет показывает, что справедливы соотношения: β,+,«ν<Β< + (1-ν<Μι+1, где vf=^++f++;;++^lt(25.7) i = 0, 1, ..., m— 1. При ЭТОМ ЯСНО, ЧТО ЧИСЛО V; удовлетворяет УСЛОВИЮ 0 < V; < 1. Так как, очевидно, точка В0 совпадает с А0 (см. (25.6)), то соотношение (25.7) при /=0 принимает вид Β^νο^ + Ο — ν0)Λι. Следовательно, Βλ^[Α& Αχ]. Но обе точки Л0, А} принадлежат множеству F, а значит, и множеству Μ (так как MzdF). Поэтому [А0, Ах]аМ (ибо множество Μ выпукло); в частности, В{^М. При 1=1 соотношение (25.7) принимает вид β2=νι^ι + + (1 — vl)A2t так что В2£Е[Ви Л2]. Но [Ви А2]аМ (поскольку В{^М9 A2^FaM и множество Μ выпукло). Следовательно, В2^М. Продолжая таким образом, мы установим, что все точки В0, Ви Въ ..., Вт принадлежат множеству М. Но из (25.3), (25.4), (25.6) непосредственно следует, что Вт = С. Таким образом, любая точка С множества F* принадлежит множеству М9 т. е. F*aM. Мы доказали, что F* есть выпуклое множество, содержащее F, причем F* содержится в любом выпуклом множестве М, которое содержит F. Иными словами, F* есть наименьшее выпуклое множество, содержащее F, т. е. F*—convF. Из этого уже вытекает, что условие, сформулированное в теореме 25.1, является достаточным: если точка С удовлетворяет соотношениям (25.1), (25.2) (т. е. удовлетворяет соотношениям (25.3), (25.4) при т —я), то С ^F\ т.е. точка С принадлежит выпуклой оболочке множества F. Докажем необходимость. Пусть С — произвольная точка, принадлежащая выпуклой оболочке conv F множества F. Тогда в силу доказанного точка С удовлетворяет соотношениям (25.3), (25.4) (где точки A0i Аь ..., Ат принадлежат множеству F). Если т = /г, то соотношения (25.3), (25.4) являются
196 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [25 искомыми (т. е. они имеют требуемый вид (25.1), (25.2)). Если т< я, то для приведения к требуемому виду достаточно добавить в правой части (25.4) несколько нулевых слагаемых, Ят-И а т-Ь2 α η г% _. =λ = ... =λ =0 и принять за Ат+и ..., Лп любые точки множества Μ (например, Лт+1 = — Лт+2 === · · · == Ля == ^о)· Остается рассмотреть случай т> п. Итак, пусть точка С удовлетворяет соотношениям (25.3), (25.4), где т> п. Можно при этом предполагать, что все числа λ°, λ1, ..., %т положительны. Рассмотрим векторы До Л], ..., Л0Ат» Так как число этих векторов равно т>п> то они линейно зависимы: α44+ ··· +«mAA = 0, где хотя бы одно из чисел а1, ..., ат отлично от нуля. Так как Л0Л/==Л^ —Л0, то это соотношение можно переписать в виде α% + αΜ,+ ... +<хтЛт = 0, где а ο=_αι_ — а , т. е. + а" 'О. (25.8), (25.9) отличные от \ат/Хт\ наи- Ясно, что среди чисел а0, а1, ..., ат имеются нуля. Выберем среди чисел | α°/λ° |, | αι/λι |, . г. большее; мы всегда можем считать (изменив, если нужно, нумерацию точек Л0, ..., Ат)9 что наибольшим является число | <xmAm |: π I I т ι III \ т \ ι „т— 1 1 I ..я I (25.10) < т а » а1 λ1 < т а ) "·» Я"1-1 < %т Очевидно, что число ат отлично от нуля (иначе, в силу (25.10) все числа а0, а1, ..., ат были бы равны нулю). Мы можем при этом считать, что ат = Хт (для этого достаточно умножите все числа а0, а1, ..., ат на Кт/ат, что не нарушит соотношений (25.8), (25.9)). Тогда (в силу. (25Л0)) <1, <1. „т-1 \т— 1 <ι. (25.11) Вычтем теперь соотношение (25.8) из (25.4); получим <: = λΜ0 + λ'Α+ ... +λ"4,-(οΛ40 + αΜ,+ ... +аиЛт) = -λ°(ι -^+λ'(ι -$)*+ ··· + λ""",(1 -fS-)^-.· (25.12)
25] § б. ВЫПУКЛЫЕ МНОЖЕСТВА 197 В силу (25.11) все коэффициенты в правой части неотрицательны. Далее, согласно (25.3), (25.9) сумма этих коэффициентов равна единице: *(■-■$+*'('-£)+-+*"('-Я- _(λο+λ! + ... +η-(α°+α4 ... +сГ-1) = = (λ0 + λ1+...+λ")-~(α° + α1+...+α^ = 1-0=1.(25.13) Соотношения (25.12) и (25.13) имеют тот же вид, что и (25.3), (25.4), но число т, по сравнению с (25.3), (25.4), уменьшилось на единицу. Если теперь т — 1=я, то полученные соотношения (т. е. (25.12), (25.13)) является искомыми —они имеют вид (25.1), (25.2). Если все еще т — \>п> то число т — 1 можно таким же способом уменьшить еще на единицу и τ д После конечного числа таких шагов мы приведем соотношения (25.3), (25.4) к виду (25.1), (25.2). Пример 25.2. Пусть k — любое из чисел 1, ..., п. Возьмем в пространстве Еп произвольные k + 1 независимых точек Л0, Α ι, .. ·, Ak (т. е. не лежащих в одной (k — 1)-мерной плоскости). Выпуклая оболочка множества всех этих точек обозначается через [Л0, Аи ..., Ak] и называется k-мерным симплексом. Согласно определению выпуклой оболочки, ^-мерный симплекс является выпуклым множеством. Одномерным симплексом является выпуклая оболочка двух различных точек, т. е. некоторый отрезок. Двумерный симплекс есть выпуклая оболочка трех точек, не лежащих на одной прямой, т. е. двумерными симплексами являются треугольники. Трехмерный симплекс есть выпуклая оболочка четырех точек, не лежащих в одной (двумерной) плоскости, т. е. некоторый тетраэдр. При k > 3 симплекс размерности k представляет собой многомерное обобщение отрезка, треугольника, тетраэдра. В силу теоремы 25.1, точка С в том и только в том случае принадлежит симплексу [А0, Аи ..., УЦ], если С = Х°А0 + Х1А{ + ... + XkAk, где числа λ°, λ1, ..., Xk удовлетворяют соотношениям λ°>0, λχ>0, ..., λ*>0, Χ° + Χι+ ... + λ*«1. Множество Λί, расположенное в пространстве Еп, условимся называть выпуклым телом, если это множество выпукло и содержит хотя бы одну внутреннюю точку. Пример 25.3. Любой n-мерный симплекс является в про- странстве Еп выпуклым телом.
198 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [25 В самом деле, возьмем в симплексе [AQi Au ..., Ап] произвольную точку C=λM0 + λ1Лl+ ... -f- ληΑη, у которой все числа λ°, λ1, ..., λη положительны: λ°>0, λ!>0, ..., λΛ>0, λ° + λ!+ ... +λΛ=1. (25.14) Пусть ε — такое положительное число, что λ°>ε, λ*>ε, ..., λΛ>ε. (25.15) Векторы ex =A0Ai9 ..., еп = А0Ап линейно независимы (см. теорему 17.6), т. е. образуют базис пространства Еп. Возьмем произвольные числа х\ ..., хп, удовлетворяющие условиям 1*Ч<£. .··, Unl<7' (25Л6) Тогда точка D = C + xleA+ ... +хпеп (25.17) также принадлежит рассматриваемому симплексу. Действительно, П—(#Л1+ЯМ,+ ... +ληΑη) + χιΑ^Α{+ ... + х*ДА== = (λο_*ι_ ... _ хп) Αο + {λι + χΐ) А{ + л. л +{λη + хп)Апл Непосредственно видно, что сумма коэффициентов в правой части этого соотношения равна единице (см. (25.14)), причем в силу (25.15), (25.16) все эти коэффициенты неотрицательны. Следовательно, точка D принадлежит симплексу. Пусть теперь ft,..., /rt — некоторый ортонормированный базис пространства Еп. Каждый вектор ft можно представить в виде линейной комбинации векторов еи ..., еп* fi = а\е\ + · · · + afen> isssl> · · ·» П- Обозначим через а наибольшее из чисел \а\\, так что |α{|<α, /, /= 1, ..., я, и положим г = г/(п2а). Покажем, что шар радиуса г с центром в точке С целиком содержится в симплексе [Л0, Ах Ап], откуда и будет следовать, что этот симплекс является выпуклым телом. В самом деле, пусть D — произвольная точка этого шара, т. е. ρ (С, D)<>. Тогда CD = ylfx+ .,. +//*
251 § 6. ВЫПУКЛЫЕ МНОЖЕСТВА 199 где (у')2+ ··· +(УПТ = (Р(С, D))2<r2, и потому \У1\<г, .... |г/"|<г. Теперь имеем: СЕ> = у%+ ... +УпГп = У1(а\е1+ ... +«fe„) + + ί/2(α'βι+ ... +а»е„)+ ... +у"Ке,+ ... + ajfc,)« = (a\yl+ ... + ау)е,+ ... + (α?*/' + ... +α«ί/»)β„ = = ^'e!+ ·.. +Λη> где χι = а'г/i + ... + αιχ. Ясно, что |*Ч<|а|||уЧ+ ... +\а>п\\уп\^паг = па.1±г = ±. Таким образом, точка D удовлетворяет соотношениям (25.16), (25.17) и потому принадлежит симплексу [Л0, Аи ..., Ап]. Итак, шар радиуса г с центром в точке С целиком принадлежит рассматриваемому симплексу. Теорема 25.4. Всякое выпуклое множество пространства Еп либо является выпуклым телом, либо целиком расположено в некоторой плоскости, размерность которой меньше п. Доказательство. Пусть Μ — произвольное выпуклое множество, расположенное в Еп. Фиксируем в Μ произвольную точку А0 и будем рассматривать всевозможные векторы вида Л0Л, где А пробегает множество М. Из этих векторов выберем максимальное число линейно независимых; пусть это будут векторы А0Аи ..., AQAk- Имеются две возможности: k=n или k < п. Рассмотрим эти возможности отдельно. Если k=n,ro в силу линейной независимости векторов А0Аи ..., А0Ап точки AQi Д, ..., Ап не содержатся в одной гиперплоскости, т. е. являются вершинами n-мерного симплекса [Л0, Д, ..., Ап]. Так как множество Μ содержит все тонки Л0, Д АП9 то оно содержит и выпуклую оболочку этих точек, т. е. содержит симплекс [А0, Аи ..., Ап]. Но, как мы знаем, /г-мерный симплекс является выпуклым телом, т. е. содержит внутренние точки. Тем более множество Μ содержит внутренние точки, т. е. является выпуклым телом. Пусть теперь k < п. Возьмем произвольную точку С е Λί. Тогда векторы Л0Д, ..., A0Aki A0C линейно зависимы (поскольку их число больше чем fe), и потому в силу теоремы 13.3 вектор А0С линейно выражается через Л0Д, ..., AQAk: * „ι * * ДС = а1Л0Д + ... + αΜ0ΛΛ,
200 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [25 т. е. точка С расположена в ^-мерной плоскости Я, проходящей через точку А0 и имеющей векторы А0Аи ..., A0Ak своим базисом. Так как это справедливо для любой точки С <= М9 то все множество Μ целиком расположено в ^-мерной плоскости Р. Плоскость Р, построенная при доказательстве теоремы 25.4 (в случае k < η), обладает важными свойствами. Это есть плоскость наименьшей размерности, содержащая множество Λί. Действительно, так как множество Μ содержит точки Aq9 Au ..., Aki причем векторы А0Аи ..., A0Ak линейно независимы, то точки A0i Аи ..., Ak независимы, т. е. эти точки (а тем более множество Λί) не могут располагаться в плоскости, имеющей размерность, меньшую чем k. Далее, плоскость Ρ однозначно определяется * выпуклым множеством Μ — как плоскость наименьшей размерности, содержащая Λί. В самом деле, если бы существовали две различные fe-мерные плоскости, содержащие Λί, то множество Λί содержалось бы в их пересечении, т. е. в плоскости меньшей размерности, что невозможно. Наконец, отметим, что если плоскость Ρ рассматривать как Α-мерное евклидово пространство, то множество Λί относительно этого пространства является выпуклым τ е л о м, т. е. Μ содержит внутренние точки относительно пространства Р. Действительно, выпуклая оболочка точек Д,, Аи .../Л^ является ^-мерным симплексом [Л0, Аь ..., Ak] в ^-мерном пространстве Ρ и потому содержит в Ρ внутренние точки; тем более множество Λί содержит в пространстве Ρ внутренние точки. Плоскость Ρ (рис. 65) называется несущей плоскостью выпуклого множества Λί (не являющегося выпуклым телом в Еп). Рис. 65. Если же Μ является выпуклым телом пространства Еп9 то его несущей плоскостью уславливаются считать само пространство Еп. Сопоставляя все сказанное, мы приходим к следующему предложению. Следствие 25.5. Для всякого выпуклого множества Μ пространства Еп существует единственная плоскость наименьшей размерности, содержащая М. Она называется несущей пло-
26) § 6. ВЫПУКЛЫЕ МНОЖЕСТВА 201 с костью выпуклого множества Λί. Множество Μ является выпуклым телом пространства Еп в том и только в том случае, если его несущая плоскость совпадает с пространством £**. Всякое выпуклое множество является относительно его несущей плоскости выпуклым телом, В заключение введем еще одно определение: выпуклое множество называется k-мерным, если его несущая плоскость имеет размерность k. _ 26. Граница выпуклого тела. Теорем а 26.1. Замыкание Μ выпуклого множества Μ также является выпуклым множеством. Доказательство. Пусть Л и β —две произвольные точки множества М. Докажем, что и весь отрезок [Л, В] содержится в М, т. е. что каждая точка С = (1—λΜ + λβ, где 0<λ<1, принадлежит множеству Λί. Для этого надо установить, что любой шар с центром С пересекается с множеством Λί. Рассмотрим шар радиуса г с центром в точке С. Так как Ле Λί, то шар радиуса г с центром Л пересекается с множеством Λί, т.. е. найдется такая точка Ах <= Λί, что ρ (Л, Л!)^/·. Точно так же найдется такая точка Вх е М, что ρ (β, B{)^r. Рассмотрим точку Тогда Ci^[Ai9 Bj] и потому, в силу выпуклости множества Λί, точка Сх принадлежит Λί. Далее, ССХ = сг - С = (1 - λ) А{ + ХВ{ - (1 - λ) Л — ХВ = = (1 - λ) (Л, - Л) + λ (Вх - В) = (1 - λ) Д + КВВ{. Отсюда получаем (учитывая, что числа λ и 1 — λ неотрицательны): р(С, 0 = 10^1 = 1(1-λ) Д +λΒβ1|< <|(1-λ) Д | + |λθθιΙ = (1-λ)| Д Ι + λΙΑΒ^ — = (1-Я)р(Л, Л,) + Яр(В, β,)<(1-λ)Γ + λτ = Γ. Итак, мы нашли такую точку Q е Λί, что ρ (С, Сх)^г9 т. е. установили, что шар радиуса г с центром С пересекается с множеством М. Теорема доказана. В дальнейшем мы, как правило, будем рассматривать только замкнутые выпуклые множества, т. е. условимся считать (если специально не оговорено противное), что каждое рассматриваемое выпуклое множество содержит все своиграничны$
202 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [26 Рис. 66. точки. Заметим, в частности, что каждый выпуклый многогранник является (согласно его определению) замкнутым множеством. Пусть Μ — произвольное выпуклое множество пространства Еп. Множество всех его внутренних точек обозначается через intM и называется внутренностью множества Λί. Множество всех граничных точек Граница множества Μ обозначается через bd Λί и называется границей множества Μ (рис. 66, η = 2). В силу принятого выше со- глашения мы будем считать (если не оговорено противное), что ЪаМаМ, т. е. M=(intM)U(bdAi). Заметим, что если выпуклое множество Μ не является выпуклым телом (т. е. совсем не содержит внутренних точек), то все его точки являются граничными, т. е. в этом случае выпуклое множество Μ совпадает со своей границей. Иначе говоря, изучение свойств границы и граничных точек осмысленно лишь в случае выпуклого тела. Впрочем, всякое выпуклое множество пространства Еп является выпуклым телом относительно своей несущей плоскости. Поэтому можно говорить о внутренности и границе выпуклого множества Μ относительно его несущей плоскости (рис. 67, п = 3)\ мы их будем обозначать соответственно через relint Λί и relbd Λί. В соответствии со сказанным, мы в дальнейшей части этого параграфа ограничиваемся рассмотрением границы выпуклого тела. Теорема 26.2. Если А и В — внутренние точки выпуклого тела Λί, то каждая точка отрезка [Л, В] также является внутренней точкой этого тела. Если А —граничная, а В — внутренняя точка выпуклого тела Λί, то каждая точка полуинтервала (Л, В] является внутренней точкой этого тела. Наконец, если А и В — граничные точки выпуклого тела Λί, то либо все точки интервала (А, В) являются внутренними точками этого тела, либо же все точки этого интервала являются граничными для тела Λί. Доказательство. Пусть А я В — внутренние точки выпуклого тела Λί, Тогда шар некоторого радиуса г{ с центром А целиком содержится в теле Λί и шар некоторого радиуса г« Рис. 67.
26] § 6. ВЫПУКЛЫЕ МНОЖЕСТВА 203 с центром В целиком содержится в теле Λί. Обозначим через г наименьшее из положительных чисел гь г2. Тогда в теле Μ содержится шар радиуса г с центром Л и шар радиуса г с центром β. Докажем, что если С — произвольная точка отрезка [Л, В], то шар радиуса г с центром С целиком содержится в теле Λί (рис. 68). Мы имеем С = (1-Х)А + ХВ, где 0<λ<1. Пусть Сх — произвольная точка, принадлежащая шару радиуса г с центром С, т. е. ICCjKr. Обозначим через Ах и Вх такие точки, что аТх=]Щ^ССх*. Тогда | ААХ \=\ ССХ |<г, т. е. точка Ах принадлежит шару радиуса г с центром Л. Но этот шар целиком содержится в теле М, и потому точка Ах принадлежит телу Λί. Точно так же точка Вх принадлежит телу М. Далее: С, = С + ССХ = (1 - λ) Α + λΒ + ССх = = (1 - λ) А + KB + (1 - λ) ССХ + КСС{ = = (1 — λ) А + KB + (1 - λ) Д + λβ^! = = (1-λ)(Λ + Д^Яф + Й) —(1-λΜ,+λΒρ Полученное соотношение означает, что точка С, принадлежит отрезку [Ах, Вх] (поскольку Ο^λ^Ι). Но так как обе точки Аи Вх принадлежат телу Λί, то в силу его выпуклости и весь отрезок [Аь В{] принадлежит этому телу. В частности, Сх е М. Тем самым доказано, что шар радиуса г с центром С целиком содержится в теле Λί, τ. е. С —внутренняя точка этого тела. Этим установлена первая часть теоремы. Докажем вторую часть. Пусть Л —граничная и В — внутренняя точка выпуклого тела Λί. Тогда шар некоторого радиуса г с центром В целиком содержится в теле Λί. Пусть теперь С — произвольная точка полуинтервала (Л, В]: С = (1-Я)Л + ЯВ, где 0<λ<1; Докажем, что чшар радиуса Кг с центром С целиком содержится в теле Μ (рис. 69).
204 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [26 Пусть С\ — произвольная точка этого шара, т. е. ICCJs^r. Обозначим через В{ такую точку, что ВВ{=(1/Х)СС1. Тогда \BBl\ = (l/X)\CCl\<ir, т.е. точка В{ принадлежит шару радиуса г с центром В. Но этот шар целиком содержится в теле Λί, и потому точка В{ принадлежит телу Λί. Далее: С{=С + СС{=С + ХВВ1 = = (\~Х)А + ХВ + ХВВ{ = = {1-Х)А + Х(В + ВВ1) = *=(1-λ)Α + λΒχ. Полученное соотношение означает, что точка С{ принадлежит отрезку [Л, В{]. Но так как обе точки Л, рис. 69. В\ принадлежат телу Μ (напомним, что мы условились рассматривать только замкнутые выпуклые множества, так что каждая граничная точка, в частности, точка Л, принадлежит телу Λί), то и весь отрезок [Л, β,] принадлежит этому телу. В частности, С1^М. Тем самым доказано, что шар радиуса Хг с центром С целиком содержится в теле М, т. е. С — внутренняя точка этого тела. Этим установлена вторая часть теоремы. Пусть, наконец, Л и β — граничные точки тела М. Возможно, что все точки отрезка [Л, В] являются граничными точками тела Λί (рис. 70). Если же найдется хотя бы одна точка Се е [Л, В], являющаяся внутренней точкой тела Λί Рис. 70. Рис. 71. (рис. 71), то согласно уже доказанному все точки полуинтервала (Л, С] являются внутренними и все точки полуинтервала (В, С] являются внутренними, т. е. все точки интервала (Л, В) являются внутренними точками тела Λί. Теорема 26.3. Пусть Q—внутренняя τ >чка выпуклого тела Μ и l — луч, исходящий из точки Q. Тогда луч I либо целиком принадлежит телу Μ (рис. 72)., либо же пересекается с грани- цей тела Μ ровно в одной точке А (рис. 73), причем в последнем случае луч I пересекается с телом Μ по отрезку [Q, Л].
26] § б. ВЫПУКЛЫЕ МНОЖЕСТВА 205 Доказательство. Допустим, что луч / не содержится целиком в теле Λί. Тогда найдется на луче / точка β, не принадлежащая телу Λί. Ясно, что если точка С лежит на луче / за точкой В (т. е, Se [Q, С]), то точка С не принадлежит телу Μ (иначе весь отрезок [Q, С] содержался бы в теле Λί, а значит, и точка В принадлежала бы телу Λί). Следовательно, пересечение 1[\М целиком , расположено на отрезке [Q, β]. Пусть Л — наиболее удаленная от Q точка множества If] Μ Рис. 72. Рис. 73. (такая точка существует, так как Μ — замкнутое множество, а потому и / Π Λί — замкнутое множество). Тогда l(]M cz[Q9 А]. Но так как обе точки Л, Q принадлежат телу Λί, то [Q, Α] α Λί, и, следовательно, [Q, A]czlf]M. Таким образом, / f) Μ = [Q, Л]. Так как Q — внутренняя точка тела Λί, то в силу теоремы 26.2 все точки полуинтервала [Q, А) являются внутренними точками тела Λί. Очевидно, что Л —граничная точка тела Λί, поскольку как угодно близко к Л имеются и точки, принадлежащие телу Μ (например, точки полуинтервала [Q, Л)), и точки, не принадлежащие телу Λί (например,- точки полуинтервала (Л, В]). Следствие 26.4. Прямая, проходящая через внутреннюю точку Q выпуклого тела Λί, пересекает его границу не более чем в двух точках. Если тело Μ ограничено, то такая прямая пересекает его границу ровно в двух точках. Следствие 26.5. Ограниченное выпуклое тело совпадает с выпуклой оболочкой его границы. В самом деле, пусть Λί — ограниченное выпуклое тело. Так как ЪаМаМ, то и сопу(ЬсШ)с:Л4. Обратно, пусть Л —произвольная точка тела М. Если Л —граничная точка тела Λί, то А^ЪаМ и, значит, Л е conv(bd Λί). Если же Л —внутренняя точка тела Λί, то прямая, проходящая через Л, пересекает ЬсШ в двух точках В, С, причем Ле[В, С]; так как [β, C]cz с: conv (bd Λί), то и в этом случае Л е conv(bd Λί). Таким образом, Мс:соп\{ЪаМ).
206 гл· ш· ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [27 Заметим, что следствие 26.5 остается справедливым и для неограниченного выпуклого тела Λί, если только оно не совпадает со всем пространством Еп или с полупространством; доказательство в этом случае несколько сложнее. В заключение докажем еще одну теорему, которая понадобится нам в конце главы. Теорема 26.6. Если выпуклые множества Λί,, ..., Λί^ обла* дают тем свойством, что (relintΑίΟfl ··· Л (relint Λί,) #= 0, то несущая плоскость множества Λί, Л ... [\MS совпадает с пере- сечением несущих плоскостей множеств Λί,, ... , Ms и справедливо соотношение relint {Мх П .·* П Μ*) = (relint Λί,) Л ... Л (relint Λί,). Доказательство. Достаточно установить справедливость теоремы для 5 = 2 (далее идет очевидная индукция). Итак, пусть даны два выпуклых множества Λί,, М2, удовлетворяющие соотношению (relint Λί,) Π (relint Λί2) Φ 0. Несущие плоскости множеств Λί,, Λί2 обозначим соответственно через Ри Р2у а несущую плоскость множества М=МХ(]М2 обозначим через Р. Так как Λί, ciP,, M2czP2, то Μι(]Μ2αΡι[\Ρ2, и потому РаР1(]Р2. Далее, если А <= (relint Λί,) Π (relint Αί2), то все достаточно близкие к А точки плоскости Рх принадлежат множеству Λί,, а все достаточно близкие к А точки плоскости Р2 принадлежат множеству Λί2. Следовательно, все достаточно близкие к А точки плоскости Р, Л Р2 принадлежат множеству М = МХ{\М2. Отсюда, во-первых, вытекает, что Рх{\Р2аРу и потому Р = РХ[]Р2> т.е. несущая плоскость множества МХ(]М2 совпадает с пересечением несущих плоскостей множеств Λί, и Λί2. Из сказанного выше вытекает, во-вторых, что А е relint Λί, т. е. (relint Λί,) Л (relint M2) cz relint (Λί, Π Λί2). Остается доказать обратное включение. Пусть В — произвольная точка множества relint (Λί, Π Л^г) и по-прежнему А <= (relint Mx) Л (relint Λί2). Тогда A^Mx(]M2i и потому существует такая точка С е Λί, ΠΛί2, что В — внутренняя точка отрезка [Л, С]. Так-как [А, С] cz Λί, и А <= relint Λί,, toBg relint Λί, (теорема 26.2). Точно так же В^ relint Λί2. Таким образом, relint (Λί, Л Λί2) cz (relint Mx) Л (relint Λί2). 27. Выпуклый многогранник· Определение выпуклого многогранника было приведено выше (стр. 192). Здесь мы докажем
27] § 6. ВЫПУКЛЫЕ МНОЖЕСТВА 207 несколько теорем, вскрывающих «строение» выпуклых многогранников. Теорема 27.1. Граница выпуклого n-мерного многогранника представляет собой объединение конечного числа (п—\\мерных многогранников, причем никакие два из них не лежат в одной гиперплоскости. Эти (п—- \\мерные многогранники называются главными гранями исходного n-мерного многогранника. Доказательство. Пусть Μ — некоторый я-мерный выпуклый многогранник. По определению, его можно представить в виде Αί-Π,Π ··· ПЩ, (27.1) где IIlf ..., Щ — некоторые полупространства в Еп. Полупространство Ui условимся считать лишним в записи (27.1), если пересечение всех остальных полупространств совпадает с Λί. На рис. 74 (относящемся к случаю η = 2) полуплоскости П2 и П6 являются лишними, так как пересечение четырех полуплоскостей П1э П3, П4, П5 уже дает многоугольник Λί. Мы можем считать, что в записи (27.1) уже выброшены все лишние полупространства, т. е. что ни одно из полупространств Пи ... ..., Uk не является лишним. Это означает, что для каждого ί = 1, ..., k найдется точка Aiy не принадлежащая полупространству II; (и, значит, не принадлежащая многограннику Λί), но принадлежащая каждому из остальных полупространств. Выберем такую точку для каждого i9 т. е. найдем такие точки Аь ..., Aky что Л*^ПЬ но Л^П/ при 1Ф\ (W = l, ..., ft). Обозначим через Гг гиперплоскость, ограничивающую полупространство П/, и положим: /^Г^ПаППзП ^-щпгзППзП ... nHk-,ηπ*, • · ·» Fk = Докажем, что множества Fu мыми (п— 1)-мерными многогранниками, составляющими границу многогранника Λί, Рис. 74. .. ПП*-1ППЛ, :П,ПП2ПЦзП ... ПП^ПГ*. F2. *k и являются иско-
208 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [27 Пусть С — произвольная граничная точка многогранника Λί. Тогда С е Λί, τ. е. точка С принадлежит каждому из полупространств П1? .... Uk (см. (27.1)). Если бы точка С была внутренней точкой каждого из полупространств nlf ..., ΠΛ> то для каждого /=1, ..., k мы могли бы найти такое число ti > 0, что шар радиуса г* с центром С целиком принадлежал бы полупространству П*. Но тогда, обозначая через г наименьшее из чисел rlf гъ ..., rk, мы нашли бы, что шар радиуса г с центром С содержится в каждом из полупространств Щ, ..., rife, т.е. содержится в Λ4, и потому С — внутренняя точка многогранника Λί, а это противоречит предположению. Таким образом, найдется такое i (хотя бы одно), что точка С не является внутренней точкой полупространства П/, т. е. Се Г/. Так как, кроме того, точка С принадлежит всем остальным полупространствам (ибо Се Λί), то Се Fh и потому Се е Т7! U ... U-Ffe. Итак, каждая граничная точка тела Λί принадлежит множеству Т7! U ..· U/V Обратно, пусть С е F, U ... U /V Тогда найдется такое i (хотя бы одно), что CeF£ и, следовательно, Се Г*. Так как С е Λί, то С является либо внутренней, либо граничной точкой многогранника М. Но внутренней точкой С быть не может, поскольку как угодно близко к точке С е Tt имеются точки, не принадлежащие многограннику Μ (например, точки, лежащие по другую сторону гиперплоскости Τι, чем полупространство П/). Следовательно, С —граничная точка тела М. Итак, hdM = F{[] ... U/V Докажем теперь, что F{ является (п — 1)-мерным многогранником, несущая плоскость которого совпадает с Г*. Прежде всего заметим, что 1\ = 1ЪПШ, где П* —второе (тоже замкнутое) полупространство, определяемое гиперплоскостью IV Поэтому можем написать: Λ = (ΠιΠ ... ПΠ*)ПΠ?. Таким образом, Ft есть пересечение конечного числа полупространств. Кроме того, множество Ft ограничено (ибо/7* czM). Следовательно, Ft есть выпуклый многогранник. Ясно, далее, что Fi с: Г*. Поэтому нужно лишь доказать, что Ft содержит внутренние точки относительно гиперплоскости Г*. Пусть В — произвольная внутренняя точка многогранника Λί. Точки Αι и В лежат по разные стороны гиперплоскости 1\ (ибо Αι е Щ, В е П/ и ни одна из точек Ai9 В не лежит в гиперплоскости rt), и потому отрезок [Ait В] пересекается с этой гиперплоскостью. Иначе говоря, существует такое число λ, что
27] § 6. ВЫПУКЛЫЕ МНОЖЕСТВА 209 0 < λ < 1 и точка C = (l-X)Ai+KB принадлежит гиперплоскости Гг. Обозначим через г такое положительное число, что шар радиуса г с центром В целиком содержится в многограннике М. Докажем, что каждая точка D гиперплоскости Гг·, находящаяся от С на расстоянии, не превосходящем Яг, принадлежит многограннику Fh Действительно, пусть D е Гг-, причем ρ (С, D)^Xr. Обозначим через Ε такую точку, что BE = (1Д)С£). Тогда ρ (β, £) = |fi£| = ||cD| = l|CD| = |p(C, /))<-1.Яг = г, е. точка Ε принадлежит шару радиуса г с центром β, и гому Ε е Λί. Далее, τ потому D = С + CD = (1 - λ) Αι + λβ + λΒΕ = = (1 - λ) Αι + λ (Β + BE) = {\ - λ) Д, + λ£, откуда следует, что Ζ) <= [Л*, E]. Но точка Ε принадлежит всем полупространствам П„ ..., Пк (ибо Ε е Λί), а точка А{ принадлежит всем этим полупространствам, кроме П/. Следовательно, весь отрезок [Ait E] (и, в частности, точка D) содержится в пересечении всех полупространств П^ ..., ГЦ, кроме П£. Кроме того, по построению, D <= Г\·. Следовательно, . /)еП,П ... ηπ^ΠΓ,ηΠί+ιίΊ ... ПЩ, т. е. D^Fi. Итак, каждая точка гиперплоскости Гь находящаяся от С на расстоянии, не превосходящем λΓ, принадлежит многограннику Ft. Это означает, что Ft содержит внутренние точки относительно гиперплоскости Гг·, т. е. является (п — 1)-мерным многогранником с несущей плоскостью IV Для завершения доказательства остается установить, что гиперплоскости Ти ..*, Г*, являющиеся несущими плоскостями многогранников Fu ..., Fki попарно различны. Действительно, допустим, что гиперплоскости Г* и Г/ совпадают. Тогда полупространство П/ должно совпадать с одним из двух полупространств, определяемых гиперплоскостью Ι\, τ. е. с одним из полупространств Ш, П*. Но равенство П/ = П; означает, что одно из двух полупространств Π/, Π/ является лишним (вопрек предположению), а равенство П/ = Ш означает, что М = П,П ... ПШсП/ПП/ = П/ПШ = Гь —это также невозможно, поскольку многогранник Μ является ft-мерным. Таким образом, все гиперплоскости Ти ..., Г$ различны,
210 · ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [27 Доказанная теорема в действительности относится не только к n-мерным многогранникам, но и к многогранникам любой размерности. В самом деле, пусть Μ — многогранник размерности г, где г < п. Многогранник Μ можно представить в виде пересечения конечного числа полупространств (пространства Еп): Μ = =11! Π · · · ΠIV Несущую плоскость многогранника Μ обозначим через Р. Так как Μ cz Ρ, то можем написать: М = Р(](П{(] ... ПП,) = (П,ПЯ)П ... П(П,ПР). (27.2) Рассмотрим каждое из пересечений Uif]P (* = 1, ···, ?). Это пересечение непусто (так как Μ czUi(]P). Могут представиться две возможности: либо Ρ целиком содержится в полупространстве Пг·, либо Ρ не содержится целиком в П/. В первом случае (Р cz IU) пересечение Пг· Π Ρ совпадает с Ρ, и потому может быть отброшено (см. (27.2)). Во втором случае (Р не содержится в и() пересечение Ih()P представляет собой полупространство евклидова пространства Р. Таким образом, многогранник Μ может быть представлен в виде Αί = Πίη ... ПШ, где Иь ..., Щ-—некоторые полупространства евклидова пространства Р, т. е. Μ является r-мерным многогранником в r-мерном евклидовом пространстве ЕГ = Р. Но в таком случае к многограннику Μ непосредственно применима теорема 27.1, позволяющая сформулировать следующее утверждение: граница г-мерного многогранника Μ (относительно его несущей плоскости) представляет собой объединение конечного числа (г — 1)-мерных многогранников, никакие два из которых не лежат в одной (г —- 1)-мерной плоскости. Эти (г — 1)-мерные многогранники называются главными гранями г-мерного многогранника Λί. Теперь мы можем более детально описать строение границы многогранника. Пусть Μ — некоторый r-мерный многогранник пространства Еп (в частности, может быть г = п). Главные грани этого многогранника называются его (г — 1)-мерными гранями. У каждой из этих граней (представляющей собой (г— 1)-мер- ный многогранник) в свою очередь можно рассматривать главные грани. Они также считаются гранями исходного г-мерного многогранника Μ (а именно, его (г — ^-мерными гранями). Таким же образом определяются (г — Ъ)-мерные грани многогранника Μ (как главные грани его (г — 2)-мерных граней) и т. д. Итак, у каждого г-мерного многогранника имеются грани размерностей г —1, г —2, ..,, 1,0. Нульмерные грани много*
27] § 6. ВЫПУКЛЫЕ МНОЖЕСТВА 211 Рис. 75. гранника называются его вершинами (они представляют собой точки); одномерные грани многогранника называются его ребрами (они представляют собой отрезки). Например, при г = 1, т. е. в случае одномерного многогранника (отрезка), имеются нульмерные грани, которыми являются вершины (или концы) рассматриваемого отрезка. Граница одномерного многогранника состоит из двух точек (концов отрезка). При г = 2, т. е. в случае дву м ерного выпуклого многогранника (выпуклого многоугольника; см. рис. 65, а\ имеются одномерные грани— ребра (стороны многоугольника) и нульмерные грани — вершины многоугольника. Границей является в данном случае контур многоугольника. При г = 3, т. е. в случае трехмерного выпуклого многогранника (рис. 75), имеются двумерные (т. е. «обычные») грани, одномерные грани (ребра) и нульмерные грани (вершины). Границей является поверхность рассматриваемого многогранника. Теорема 27.2. Всякий выпуклый многогранник является выпуклой оболочкой своих вершин. Множество Μ в том и только в том случае является выпуклым многогранником, если оно представляет собой выпуклую оболочку конечного множества точек. Доказательство. Первую часть теоремы докажем индукцией по размерности г рассматриваемого многогранника М. При г=1, т. е. если Μ — некоторый отрезок [А, В], у многогранника Μ имеются две вершины Л, В и Μ является их выпуклой оболочкой. Таким образом, при г = 1 первая часть теоремы справедлива. Пусть первая часть теоремы уже доказана при г < m и пусть М — некоторый многогранник размерности т. Обозначим через Fu ..., Fk главные грани многогранника М, так что bd Λί ===== Fj (J ... [)Fk, а через ΛΓ обозначим выпуклую оболочку всех вершин многогранника Λί. Ясно, что M*czM (так как выпуклое множество Μ содержит все вершины, а значит, и их выпуклую оболочку). С другой стороны, каждый многогранник Fi (имеющий размерность т — 1), согласно предположению индукции, является выпуклой оболочкой своих вершин. Поэтому Fi cz ΛΓ (ибо выпуклое множество ΛΓ содержит все вершины многогранника Μ и, в частности, все вершины много-
й\й ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ Г27 гранника Ft). Так как это верно для любого /=1, ..., k, то bdMczAf, а потому в М* содержится и выпуклая оболочка множества bd Λί, т. е. весь многогранник Μ (см. следствие 26.5). Итак, M*zdM, а потому ΛΓ = М, т. е. Μ совпадает с выпуклой оболочкой своих вершин. Проведенная индукция и доказывает первую часть теоремы. Так как каждый многогранник имеет конечное число вершин, то из доказанного следует, что всякий выпуклый многогранник можно представить как выпуклую оболочку конечного числа точек. Остается доказать обратное, т. е. что выпуклая оболочка любого конечного множества точек есть выпуклый многогранник. Пусть Ν = {ΑΪ9 ..., Αι} — конечное множество точек и Μ = conv Ν — его выпуклая оболочка. Обозначим через Ρ плоскость наименьшего числа измерений, содержащую все точки А1у ..., Αι. Так как Ρ — выпуклое множество, содержащее точки Аь ..., Аи то Ρ содержит и выпуклую оболочку этих точек, т. е. Pzd Λί. В то же время никакая плоскость меньшего числа измерений не содержит целиком множества Μ (она не содержит даже всех точек Аи ..., At). Следовательно, Ρ есть несущая плоскость выпуклого множества М. Обозначим через г размерность плоскости Ρ и докажем, что Μ есть выпуклый многогранник в евклидовом пространстве Ег — Р'. Полупространство Π евклидова пространства Ρ условимся называть отмеченным (по отношению к множеству точек Α. ..., Αι), если оно обладает следующими двумя свойствами: 1) все точки Аи ..., At принадлежат полупространству П; 2) те из точек Аи ..., Аи которые лежат в граничной гиперплоскости полупространства П, однозначно определяют эту гиперплоскость (т. е. не лежат все в одной плоскости размерности г — 2). Легко понять, что существует лишь конечное число отмеченных полупространств. В самом деле, отмеченное полупространство однозначно определяется, если указано, какие из точек Аи ..., Αι лежат в граничной гиперплоскости этого полупространства. Поэтому, перебрав всевозможные подмножества множества {Аи ..., Л/}, мы заведомо не пропустим ни одного отмеченного полупространства (хотя не любому такому подмножеству соответствует отмеченное полупространство). Пусть Пь ..., П5 — все отмеченные полупространства. Докажем, что M = U{f] ... Г)П5. В самом деле, так как каждое полупространство П/ (t = 1 s) содержит все точки Аи ..., Аи то пересечение Щ f) ··. ПП5 также содержит все эти точки, а потому содержит и их
й7] § 6. ВЫПУКЛЫЕ МНОЖЕСТВА 213 выпуклую оболочку: ВЫ У П,П ... ПЦ,=>А1. Докажем обратное включение. Пусть Q — точка пространства Р, не принадлежащая выпуклому телу М. Выберем из точек А{, ..., Αι какие-либо г—1 точек и рассмотрим плоскость наименьшего числа измерений, содержащую точку Q и выбранные г — 1 точек. Размерность этой плоскости не превосходит г—1. Построим все такие плоскости, по-разному выбирая г—1 точек из Аь ..., Аи и обозначим построенные плоскости через /?,, ..., Рр. Возьмем какую-либо внутреннюю точку В тела Λί, не лежащую ни в одной из плоскостей Pi, .··, Rp (см· пример 22.10). В таком случае ни одна точка интервала (Q, В) не лежит ни в какой из плоскостей Ru ..., Rp (если бы некоторая точка С е (Q, β) принадлежала плоскости Rlf то, поскольку Q е Рь и вся прямая QC принадлежала бы плоскости Рь а значит, и точка В принадлежала бы плоскости Pf). Луч BQ пересекает границу тела Μ в некоторой точке С (теорема 26.3), причем точка С принадлежит интервалу (Q, В), так как Se=intAf, Q<£Ai. Так как С е Μ (легко видеть, что выпуклая оболочка конечного множества точек является замкнутым множеством), то согласно теореме 25.1 найдутся такие г+1 точек среди Аи ..., Αι (пусть это будут точки Аи ..., Лг+1) и такие числа λ1, ..., λΓ+Ι, что С=КХА{+ ... +λΓ+4+ι. λ!>0, ..., λΓ+1>0, λ' + ... +λΓ+, = 1. Если бы все числа λ1, ..., λΓ+1 были положительными, то точка С была бы внутренней точкой симплекса [Аи ..., Аг+{] (см. пример 25.3), а значит, и внутренней точкой тела Λί, что противоречит выбору точки С. Следовательно, хотя бы одно из чисел λ1, ..., λΓ+1 равно нулю; пусть, для определенности, λΓ+1 = 0, так что С = К1Аг + ... +ХГАГ. (27.3) Нетрудно понять, что все коэффициенты λ1, ..., λΓ положительны. В самом деле, если бы, например, было λΓ = 0, то точка С лежала бы в плоскости, содержащей точки Аи ..., Аг-и т. е. в одной из плоскостей Ru ..., Rp9 что невозможно, так как С <= (Q, 5). Итак, числа λ1, ..., λτ в соотношении (27.3) удовлетворяют соотношениям λ}>0, ..., λΓ>0, λι+...+λΓ=1, (27.4)
214 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [27 Ясно, что точки Q,. А{, ..., Аг не лежат в одной гиперплоскости пространства Ρ (иначе плоскость наименьшего числа измерений, содержащая эти точки, была бы одной из плоскостей /?!, ..., Rp и точка С лежала бы в этой плоскости). Из этого следует, что точки Аи ..., Аг однозначно определяют некоторую гиперплоскость Г пространства Р. Обозначим через Π полупространство пространства Р, определяемое гиперплоскостью Г и содержащее точку В (т. е. не содержащее точки Q). Покажем, что все точки Аи ..., Л/ лежат в полупространстве П. Действительно, допустим, что некоторая точка Л/ не лежит в полупространстве П. Тогда ясно, что / > г (поскольку все точки Аь ..., Аг лежат в гиперплоскости Г cz 11). Так Как точки Q, Аи ..., Ат независимы, то Α!=*μ^ + μιΑι + ... +μ%, (27.5) где μ° + Μ·1 + · · · + μΓ — 1 · Положим ΰ = μ°Ρ + (μ1+ ... +μΓ)^ (27.6) Тогда Αβ = D-A} = μ1 (C—A{)+ ... +μΓ(0 - Ar)=^~Afi+... +μΓΑ£. Отсюда видно, что вектор AjD принадлежит направляющему подпространству гиперплоскости Г, и потому точка Z), как и Л/, не принадлежит полупространству П. Так как в силу (27.6) β = μ0ρ + (1-μ0)Ο = Ο + μ°<?ρ, то отсюда следует, что μ° > 0. Из (27.5) мы теперь получаем Рассмотрим точку C1 = eQ + (l-e)C = =ε(ΐ^>~^4~ ··· -#Λ) + (1-β)(λ4+...+λ4)- =^^/ + (λΙ(ΐ-β)-.^)Λ+ ... +(λ'(ΐ-β)-^)Λ. (27.7) Так как μ0 > 0, то в силу (27.4) все коэффициенты в правой части равенства (27.7) будут при достаточно малом ε>0 положительными. Выберем число ε, обладающее этим свойством. Тогда согласно теореме 25.1 точка С\ принадлежит множеству М. Далее, Сх e(Q, С), и потому Cg(C1( В). Отсюда следует (в силу теоремы 26.2), что С —внутренняя точка
27] § 6. ВЫПУКЛЫЕ МНОЖЕСТВА 215 тела Μ9 вопреки построению. Полученное противоречие показывает, что все точки Аь ..., Αι лежат в полупространстве П. Итак, полупространство II содержит все точки Аи ..., Л/. Кроме того, граничная полуплоскость Г этого полупространства содержит точки Аи ..., Аг (не лежащие в одной (г — 2)-мерной плоскости), т. е. Г однозначно определяется теми из точек д, ..., Л/, которые в ней лежат. Иначе говоря, П — отмеченное полупространство, т. е. Π есть одно из полупространств nlf ..., И,. Так как Q^II, то Q^U{(] ... ПП,. Итак, если Q ψ Λί, то Q^EI^ Π · · · П П„ т. е. Ц f| · · · П П5сМ. Вместе с установленным ранее включением это означает, что Πι Π · · · iins = Ai, т. е. Μ есть выпуклый многогранник евклидова пространства Р. Если теперь г = η (т. е. Ρ совпадает с £"*), то тем самым доказано, что Μ — выпуклый многогранник. Если же г < п, то мы можем выбрать такие полупространства Щ, ..., ГЦ пространства £*\ что U*if\P = Tli (i= 1, ..., s); кроме того, можно выбрать такие полупространства Щ+ь ..., Шъ что IIJ+i Π ·.· ... f)irm = p (ибо, в силу теоремы 20.4, Ρ можно представить как пересечение нескольких гиперплоскостей, а каждую гиперплоскость — как пересечение двух полупространств). Тогда имеем Αί = ΠιΠ ... ПП* = = (ШПР)П ··· Л(ШПР) = =шп... пшпя= -шп... пшпш-ып... ηικ., т. е. и в этом случае М — выпуклый многогранник пространства Еп. В добавление к теореме 27.2 от- Рис. 76. метим, что если Аи ..., At — произвольные точки пространства Еп и Μ — выпуклая оболочка этих точек, то вершинами многогранника Μ могут служить только взятые точки Аи ..., Аь но, возможно, не все: некоторые из них могут оказаться лежащими на гранях или во вну-_ тренней части полученного, многогранника (рис. 76). Доказательство этого факта получается с помощью следующего утверждения (которое дает характеристическое свойство вершин многогранника): точка А многогранника Μ в том и только β том случае не является его вершиной, если существуют такие точки Ву С<^М, что Ле(В, С). Доказательство мы опускаем. Π ρ и м е ρ 27.3. Пусть [Л0, Ль ..., Ап) — произвольный /г-мер- ный симплекс в Еп. Обозначим через Г* гиперплоскость, содержащую все точки Л0, Аи ..., Л„, кроме Ai (/ = 0, 1, ..., η),
216 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [28 а через Щ — полупространство, определяемое гиперплоскостью Г* и содержащее точку At. Из доказательства теоремы 27.2 ясно, что П), Ц,, ..., Пп являются отмеченными полупространствами (по отношению к множеству точек Л0, А{, ..., Ап\ и потому [А,, А, ..., Ля] = ПоПП,П ... Γ|Π„. Следовательно (ср. доказательство теоремы 27.1), главными гранями симплекса [Л0, Аь ..., Ап] являются (п — 1)~мерные симплексы [Аи Л2, . .., An-iy Ап]9 [Л0, Л2, . .., Ап-г, Ап], ... ..., [Л0, Ль Аъ ..., ^J. (27.8) Далее, можно найти все (п — 2)-мерные грани симплекса [Л0, Ль ..., Ап] (как главные грани симплексов (27.8)), затем (п — 3)-мерные и т. д. В результате мы приходим к следующим утверждениям. Каждая грань симплекса Τ = [Л0, Аи ..., Ап] также является симплексом некоторой размерности. Именно, если взять лишь часть точек Л0, Ль ..., АП9 то выпуклая оболочка этих точек (т. е. симплекс вершинами которого являются взятые точки) будет гранью симплекса Г. Этим способом получаются все грани симплекса Г, т. е. каждая грань многогранника Τ является симплексом, вершинами которого служат некоторые из точек Л0, Аь ..., Ап. В частности, п-мер- ный симплекс Τ имеет η + 1 граней размерности п — \ (причем каждая из них получается, если взять все точки Л0, Аи ..., АП9 кроме какой-либо одной; см. (27.8)). Нульмерными гранями (вершинами) симплекса [Л0, Аь ..., Ап] служат точки Л0, Аи ..., Ап и только они. Разумеется, аналогичные утверждения справедливы и для симплекса любой размерности, поскольку β-мерный симплекс [β0, Β\9 ..., Bk\ можно рассматривать в ^-мерном евклидовом пространстве — его несущей плоскости. § 7. Опорные свойства выпуклых множеств 28. Опорный конус. Так как аффинное отображение /: Еп ->Ет одного евклидова пространства в другое непрерывно (см. теорему 22.5), то в силу теоремы 22.6 образ }(М) замкнутого ограниченного множества Μ а Еп также является замкнутым ограниченным множеством. Однако замкнутое неограниченное множество может при аффинном отображении перейти в незамкнутое множество. Например, замкнутое множество, определяемое на плоскости (х, у) неравенствами *У>1> x>Q
28] § 7. ОПОРНЫЕ СВОЙСТВА ВЫПУКЛЫХ МНОЖЕСТВ 217 («внутренность» одной ветви гиперболы; рис. 77), при ортогональном проектировании на ось абсцисс переходит в открытую полупрямую χ > О, т. е. в незамкнутое множество. Теорема 28.1. Образ f (Μ) выпуклого множества Μ аЕп при аффинном отображении f: Е^-^Е171 является выпуклым (возможно, незамкнутым) множеством пространства Ет. Если Μ ограничено, то и f(M) ограничено; если Μ замкнуто и ограничено, то f(M) также замкнуто и ограничено. Доказательство. Пусть Ах и Вх— две произвольные точки множества / (М). Тогда существуют такие точки А, В <= М, что А{ = / (А), В, = f (β). Пусть теперь С{ — произвольная точка отрезка [Аи Вх], т. е. Cl={l-k)Al+XBl9 (28.1) ° где λ — некоторое действительное Рис 77. число, удовлетворяющее неравенствам 0<λ^1. Обозначим через С точку пространства £"\ определяемую равенством С = (1 -λ)Α + λΒ. (28.2) Тогда С е [А, В], и потому в силу выпуклости множества Μ точка С принадлежит этому множеству. Так как f(A) = Au f(B) — Bu то из (28.1), (28.2) вытекает (в силу определения аффинного отображения), что f{C) = Cu и потому Cl<=f(M). Таким образом, любая точка С{ отрезка [А{, Вх] принадлежит множеству f(M)9 т. е. множество /(Λί) выпукло. Теорема 28.2. Пусть Μ — произвольное множество про- странства Еп. Тогда f(convAi) = conv/(Ai). (Здесь по-прежнему /: Еп-+Ет — аффинное отображение.) Доказательство. Так как /(convΛί) — выпуклое множество (теорема 28.1), содержащее f (Λί), то f (convAi)r> conv/(M). Докажем обратное включение. Пусть D — произвольная точка множества /(convAf), т. е. £) = /(С), где CeconvM. Согласно теореме 25.1 найдутся такие точки Л0, Аи ..., Ап множества Μ и такие числа λ°, λ1, ..., λη, что - C*=U>A(l + X1Al + ... +ληΑη; λ°>0, λ!>0, .,ο, λΛ>0; λ° + λ!+ ... +λη=1. В силу теоремы 19.1 имеем β=/(θ-λο/(Λ>) + λ1/(Λ1)+ ... +λΛ/(Λ).
218 ГЛ. III. ЭЛЕМЕНТЫ . ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [28 Так как все точки f{A0)9 f(A{)9 ..., f(An) принадлежат множеству /(Λί), то отсюда следует, что D e conv / (Λί). Итак, каждая точка D множества /(convM) принадлежит также множеству conv/(Ai), т. е. /(conv Λί) с: conv/(Μ). Следствие 28.3. Образ выпуклого многогранника при аффинном отображении также является выпуклым многогранником. Это непосредственно вытекает из теорем 28.2 и 27.2. В качестве примера на рис. 78 показан образ трехмерного параллелепипеда при аффинном отображении /: £3->£"2. Восемь вершин параллелепипеда переходят при этом отображении в восемь точек плоскости, а сам параллелепипед переходит в в ы- пуклую оболочку этих восьми точек. На рисунке показаны также отрезки, в которые переходят ребра параллелепипеда при этом отображении. Определение 28.4. Множество Μ пространства Еп называется конусом с вершиной в точке Q, если вместе с каждой отличной от Q точкой А множество Μ содержит и весь луч, исходящий из точки Q и проходящий через А. Если множество Μ выпукло и, кроме того, является конусом с вершиной в точке Q, то оно называется выпуклым конусом (с вершиной в точке Q). Если множество М, кроме того, замкнуто, то оно называется замкнутым выпуклым конусом. Пример 28.5. Пусть Ρ czEn — замкнутое полупространство, Г — ограничивающая его гиперплоскость nQsT. Тогда Ρ есть выпуклый конус с вершиной Q. В сэмом деле, выпуклость множества Ρ была уже установлена (стр. 188). Докажем, что Ρ есть конус с вершиной Q. Пусть η — отличный от нуля вектор, ортогональный гиперплоскости Г и направленный в сторону полупространства Р. Тогда для любой (отличной от Q) точки А^Р справедливо соотношение nQA^O. Если теперь С — произвольная точка луча /, исходящего из точки Q и проходящего через Л, то QC — XQA, где λ>0, и потому nQC = η (XQA) = λ (nQA) > 0, т. е. С<==Р. Таким образом, весь луч / принадлежит полупространству Р, т. е. Ρ есть конус с вершиной Q. Пример 28.6. Пусть / — некоторый луч в Еп, исходящий из точки Q. Обозначим через /С множество всех таких точек
§ 7. ОПОРНЫЕ СВОЙСТВА ВЫПУКЛЫХ МНОЖЕСТВ 219 А&Еп, что вектор QA образует с лучом / угол, не превосходящий φ, где 0 < φ < π/2. Покажем, что К является выпуклым конусом в Еп с вершиной Q. В самом деле, обозначим через а вектор, задающий направление луча /, и положим: λ = cos φ (так что λ>0). Точка А в том и только в том случае принадлежит множеству /С, если векторы а и QA образуют угол, не превосходящий φ, τ. е. если aQA^X\a\\QA\. Пусть А, В^К, т. е. выполнены соотношения: aQA^X\a\\QA\, аОВ>Ца \\ QB |. Тогда для любых чисел α^Ο, β^Ο мы имеем a{a^ + ^QB) = a(aQA) + ^(aQB)^al\a\\QA\ + ^\a\\QB\ = = λ|α||αθ1| + λ|α||βΟβ| = λ|α|(|αΟ^| + |βΟβ|)> ^X\a\\aQA + $QB\ (см. (16.3)). Это означает, что точка С, определяемая равенством QC=aQA + $QB, принадлежит множеству К (для любых α>0, β^Ο). Следовательно, К есть выпуклый конус с вершиной Q. Заметим, что в трехмерном пространстве множество /С, описанное в примере 28.6, представляет собой конус вращения с осью / и углом φ между осью и образующей. Теорема 28.7. Пусть Μ — выпуклый конус с вершиной в точке Q и пусть Аи ..., Ak — точки конуса Λί, α λ1, ..., λ* — неотрицательные числа. Тогда точка A = Q + XlQA{ + ... +%kQAk также принадлежит конусу Λί. Если при этом Д — внутренняя точка конуса Μ и λ1 > 0, то А — внутренняя точка конуса М. Доказательство. Точка fi/=Q + kl·}QAt принадлежит лучу QAh и потому принадлежит конусу Μ (/ = 1,..., k). Значит, в силу выпуклости, множеству Λί принадлежит и точка (см. теорему 25.1) Τβι+ ··· +T5fe = * =х(0 + ^й)+ ... +χβ + *λ*θίθ- *=Q + ^q1,+ .·. +XkQAk = A.
220 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [28 Пусть теперь А{ —внутренняя точка выпуклого конуса Μ и λ1 > 0 (причем по-прежнему Л2, ..., Ak <= Μ и λ2^0, ... ..., Xk^0). Если A{=Q, то Μ совпадает с Еп и все точки множества Μ являются внутренними. Если же А{ Φ Q, то все точки луча QАх, кроме Q, также являются внутренними точками тела Μ (теорема 26.2). В частности,. точка Bx = Q-\- + khlQAx является внутренней. Из соотношения =τ^ + Ατ1(τ^τβ2+ ■·· +T=r.Bk) вытекает, что А — внутренняя точка отрезка, соединяющего точки Вх и С = k _ t β2 + ... + ь ι Bk^M, и потому, в силу теоремы 26.2, Л есть внутренняя точка тела М. Теорема доказана. Легко убедиться, что на прямой (т. е. при п = 1) выпуклыми конусами являются только вся прямая, луч и точка. На плоскости (т. е. при /г = 2) вылуклыми конусами являются только а) б) Рис. 79. Рис. 80. следующие множества: точка; луч; прямая; угол, не превосходящий π; полуплоскость; вся плоскость (рис. 79). В пространствах более высокого числа измерений (даже при п = 3) выпуклые конусы могут иметь значительно более сложное строение. Если, например, Μ — произвольное выпуклое множество, расположенное в гиперплоскости Г пространства £*\ a Q—точка, не лежащая в этой гиперплоскости, то всевозможные лучи, исходящие из точки Q и проходящие через точки множества М, заполняют выпуклый конус с вершиной в точке Q (рис. 80). Теорема 28.8. Пусть Μ czEn — выпуклый конус с верши» ной Q и f: Еп-> Em — аффинное отображение. Тогда f(M) есть выпуклый конус с вершиной /(Q).
281 § 7. ОПОРНЫЕ СВОЙСТВА ВЫПУКЛЫХ МНОЖЕСТВ 221 Доказательство. Пусть Μ — выпуклый конус, с вершиной Q, расположенный в пространстве Еп. Согласно теореме 28.1 множество /(Λί) является выпуклым. Докажем, что оно является конусом с вершиной Ql=f(Q). Пусть А{ —произвольная точка множества /(Λί), отличная от точки Q{. Так как Al s/(M), то найдется такая точка А<^М, чт0 f(A) = Al. Ясно, что точка А отлична от Q (так как ^^Qi, т. е. }{А) φ /(Q)). Пусть теперь С!—произвольная точка луча, исходящего из точки Q{ и проходящего через точку Д. Тогда согласно определению луча Сх =λΑ{ +(1 — λ^, где λ^Ο. Обозначим через С такую точку пространства Еп> что С = КА-\- + (1 — λ)<2; тогда /(C)—я/(Л) + 0 —a.)f(Q) —ял, + (1 —λ)ο, —с,. Следовательно, Сг е/(ЛГ), т. е. весь луч, исходящий из точки Q{ и проходящий через точку Аь содержится в множестве /(Λί). Пример 28.9. Рассмотрим в трехмерном пространстве £3 с координатами χ, ί/, ζ множество Λί, описываемое неравенствами *2 + ί/2-ζ2<0, 2>0. (28.3) Это множество представляет собой замкнутый выпуклый конус в Ег с вершиной в начале координат. Он образован всевозможными лучами, исходящими из начала координат и составляющими с положительной полуосью ζ угол, не превосходящий π/4, τ. е. представляет собой (ср. пример 28.6) прямой Рис 81. круговой конус с углом π/4 между осью и образующими (рис. 81). Луч, исходящий из начала координат и проходящий через точку Л (0, 1, 1), является одной из образующих конуса Λί. Рассмотрим проектирование / пространства Ег на плоскость Е2
222 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [28 переменных х, у параллельно этой образующей. Оно представляет собой аффинное отображение, определяемое соответствием: (*, у, z)->{x, у— ζ) (т. е. переводящее точку (х, у, ζ) пространства £3 в точку (х\ у') плоскости £2, имеющую координаты х' = х, y'=:y — z). Из (28.3) легко следует, что для любой точки (х, у, ζ) конуса Μ справедливо неравенство y^z, и потому образ f(M) конуса Μ при рассматриваемом аффинном отображении целиком лежит в полуплоскости, определяемой в Е2 неравенством ί/<Ξ0. Легко видеть, что все точки открытой полуплоскости у <0 принадлежат множеству f(M) (например, в точку (х0, у0) плоскости £2, удовлетворяющую условию у0 = — А, где А > О, ( *о 4 \ переходит точка ^д:0, -^-, -кг + hj* принадлежащая, как легко проверить, конусу М). В тоже время на прямой у = 0, являющейся границей этой открытой полуплоскости, нет ни одной точки множества f(M)9 кроме начала координат (действительно, в точку (х, 0) переходят при отображении / только точки вида (х9 —А, А), а такая точка принадлежит конусу Μ лишь при # = 0). Итак, множество f(M) содержит все точки плоскости х, у, имеющие отрицательную координату у, а также содержит начало координат (см. рис. 81). Множество / (Λί) является (в полном соответствии с теоремой 28.8) выпуклым конусом, но этот конус незамкнут. Этот.пример показывает, что образ замкнутого выпуклого конуса при аффинном отображении может оказаться незамкнутым выпуклым конусом. Рассматривая рис. 79, легко понять, что на плоскости для всякого выпуклого конуса Μ с вершиной Q справедливо одно из двух обстоятельств: либо конус Μ совпадает со всей плоскостью, либо существует такая прямая, проходящая через точку Q, что весь конус Μ расположен целиком в одной из двух (замкнутых) полуплоскостей, на которые эта прямая разбивает плоскость. Как показывает следующая теорема, аналогичное положение имеет место и в пространствах большего числа измерений. Теорема 28.10. Пусть Μ czEn — выпуклый конус с вер- шиной Q. Если Μ не совпадает со всем пространством Еп9 то существует в Еп такая гиперплоскость Г, проходящая через точку Q, что конус Μ расположен целиком в одном из двух (замкнутых) полупространств, определяемых гиперплоскостью Г. (В этой теореме выпуклый конус Μ может быть и незамкнутым.) Доказательство. Проведем индукцию по размерности η пространства Еп, в котором лежит конус М. Допустим, что
§ 7. ОПОРНЫЕ СВОЙСТВА ВЫПУКЛЫХ МНОЖЕСТВ 223 Рис. 82. для евклидовых пространств размерности, меньшей п, теорема справедлива, и рассмотрим выпуклый конус ΛΙ с вершиной Q, расположенный в пространстве Еп и не совпадающий со всем этим пространством. Тогда существует точка А е Еп, не принадлежащая конусу Λί. Если конус Μ имеет размерность, меньшую п, то он целиком лежит в некоторой гиперплоскости и, значит, в любом из замкнутых полупространств, определяемых этой гиперплоскостью, так что в этом случае теорема справедлива. Будем поэтому предполагать, что конус Μ является выпуклым телом в Еп, т. е. содержит внутренние точки. Пусть В — внутренняя точка конуса Λί, не лежащая на прямой AQ (рис. 82). (Отметим, что прямая AQ может пересекаться с внутренностью конуса Λί.) Так как луч ВА не принадлежит целиком конусу Λί (ибо Α ψ Λί), то он содержит граничную точку С конуса Μ (которая может и совпадать с Л, если конус Μ незамкнут). Заметим, что точка С не совпадает с Q, так как иначе точка В лежала бы на прямой AQ. Возьмем на прямой АВ точку D, лежащую за точкой Л, т. е. такую, что /le(D, β), и проведем через D прямую /, параллельную QC. Докажем, что на прямой I нет ни одной точки конуса Λί. В самом деле, допустим, что на прямой I имеется точка Ε <= Λί. Все точки Q, β, С, Л, Ζ), Ε лежат в одной двумерной плоскости Ρ (теорема 19.13), причем точки В и D лежат в этой плоскости по разные стороны прямой QC, так как отрезок BD пересекается с этой прямой (рис. 83). Далее, так как DE\\QC, то точки D и Ε лежат по одну сторону прямой QC (теорема 20.9). Следовательно, точки β и £ лежат по разные стороны прямой QC, т. е. отрезок BE пересекает прямую QC в некоторой точке F. Так как Ε е Μ и В — внутренняя точка тела Λί, то и F — внутренняя точка этого тела (теорема 26.2). Значит, все точки луча QF (кроме Q) также являются внутренними точками тела Λί (теорема 26.3). А так как точка С (принадлежащая прямой QF) не является внутренней, то она не принадлежит лучу QF, т. е. принадлежит Рис. 83.
224 ГЛ. til. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [28 Рис. 84. противоположному лучу, исходящему из точки Q. Иначе говоря, Q^(C, F). Но тогда Q — внутренняя точка тела Μ (теорема 26.2), что невозможно. Полученное противоречие показывает, что прямая I не пересекается с конусом М. Пусть теперь Г — произвольная гиперплоскость, пересекающая прямую I (например, гиперплоскость, ортогональная прямой I). Через η обозначим проектирование пространства Еп на гиперплоскость Г параллельно прямой /. Это проектирование представляет собой аффинное отображение пространства Еп на (я — 1)-мерное евклидово пространство Г. Следовательно, образ п{М) конуса Μ при этом проектировании будет представлять собой также некоторый -конус с вершиной Qi = Jt(Q). Ясно, что всякая прямая, параллельная U переходит при отображении π в точку пространства Г. В частности, прямая Г переходит при отображении π в одну точку D{ e Г. Далее, точка К гиперплоскости Г в том и только в том случае принадлежит конусу π(Λί), если прямая, параллельная / и проходящая через точку/С, пересекается с конусом М. Но так как, в силу доказанного выше, сама прямая / не пересекается с конусом Λί, то точка D{ не принадлежит конусу π(Λί). Таким образом, выпуклый конус π(Λί), расположенный в пространстве Г, не совпадает со всем этим пространством. В силу предположения индукции существует в (я— 1)-мер- ном евклидовом пространстве Г такая гиперплоскость L, проходящая через точку Qu что весь конус π(Λί) целиком распо* ложен в одном замкнутом полупространстве ΙΓ, определяемом Рис. 85.
28] § 7. ОПОРНЫЕ СВОЙСТВА ВЫПУКЛЫХ МНОЖЕСТВ 225 Г гиперплоскостью L. (Заметим, что L является (п — 2)-мер- ной плоскостью исходного пространства Еп\ рис. 84.) Все прямые пространства £**, параллельные I и проходящие через точки плоскости L, заполняют гиперплоскость Г* = nrl(L) пространства Еп- Точно так же все прямые, параллельные / и проходящие через точки полупространства П* с Г, заполняют в Еп полупространство Р* — л~1(П*), для которого Г* является граничной гиперплоскостью (рис. 85). Так как f(M)czU\ то Μ cr n'l(U.*) = P\ Таким образом, гиперплоскость Г* (очевидно, проходящая через точку Q) обладает тем свойством, что весь конус Μ целиком расположен в одном полупространстве, определяемом этой гиперплоскостью, т. е. гиперплоскость Г* является искомой. Итак, если теорема 28.10 справедлива для конусов, расположенных в (п — 1)-мерном евклидовом пространстве, то она справедлива и для' конусов в /г-мерном пространстве. Но при я = 2 теорема, как мы отмечали выше, справедлива: все выпуклые конусы двумерного пространства показаны на рис- 79. (Впрочем, еще проще в качестве начала индукции выбрать случай п=\, где теорема совершенно тривиальна.) Определение 28.11. Пусть Μ — некоторое выпуклое множество пространства Еп и Q —-его граничная точка. Гиперплоскость, проходящая через точку Q, называется опорной гиперплоскостью множества Λί, если все множество Μ расположено целиком в одном из двух (замкнутых) полупространств, на которые эта гиперплоскость разбивает пространство Еп. Теорема 28.10 может быть теперь сформулирована следующим образом: если выпуклый конус Μ czEn не совпадает со всем пространством Еп, то через его вершину можно провести опорную гиперплоскость этого конуса. Интуитивно ясно (во всяком случае, для выпуклых множеств, расположенных на плоскости · или в трехмерном пространстве), что через каждую граничную точку выпуклого множества можно провести хотя бы одну опорную гиперплоскость этого множества (рис. 86). Доказываемая ниже теорема 28.12 показывает, что в этом вопросе интуиция нас не обманывает. Подчеркнем, что мы можем утверждать именно существование хотя бы одной опорной гиперплоскости, проходящей через заданную граничную точку: может случиться, что через
226 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ т некоторые граничные точки проходит бесконечно много опорных гиперплоскостей. Прежде чем переходить к доказательству теоремы 28.12, введем понятие, опорного конуса выпуклого тела. Пусть Μ — некоторое выпуклое множество и Q — его точка. Рассмотрим всевозможные лучи, каждый из которых исходит из точки Q и проходит хотя бы через одну отличную от Q точку множества Μ (рис. 87). Эти лучи заполняют некоторый конус К с вершиной в точке Q. Нетрудно видеть, что конус К является выпуклым. Действительно, пусть Л и В — две точки конуса /С. Если одна из них совпадает с Q, то очевидно, что отрезок [Л, В] содержится в /С. Если же обе точки Л, В отличны от Q, то Α = ς> + μΟΑι, B = Q + vQBu где Аь Вх s Λί и μ, ν — положительные числа. Пусть С — произвольная точка отрезка [Л, β], τ. е. С = (1-Л)Л + Я£, где 0<λ<1. Тогда α = (ΐ-λ)№ + μς&ι) + λ(<3 + νθΒι) = λ) μ PTt , λν Рис. 87. = ρ + ((ΐ~λ)μ + λν)(-α-α λ) μ + λν ■QA + τπτ (1-λ)μ + λν й)= — Q + ((1 — λ) μ + λ ν) QC. f (28.4) где _ (1 — λ)μ λν ■Βι. (28.5) ^ (1 - λ) μ + λν ι ^ (1 - λ) μ + λν Из (28.5) видно, что точка Сг принадлежит отрезку [Л,, В{], а потому принадлежит выпуклому множеству М. Если точка Сх совпадает с Q, то в силу равенства (28.4) точка С также совпадает с Q, а потому С е /G Если же С\ φ Q, то согласно определению конуса К весь луч, исходящий из Q и проходящий через точку Сь содержится в конусе /С, а потому в силу (28.4) точка С принадлежит конусу К- Итак, в любом случае С е К, т. е. весь отрезок [Л, В] содержится в конусе /С. Таким образом, выпуклость конуса К установлена. Вообще говоря, построенный конус К может оказаться незамкнутым. Замыкание конуса К называется опорным конусом выпуклого множества Μ в точке Q.
28] § 7. ОПОРНЫЕ СВОЙСТВА ВЫПУКЛЫХ МНОЖЕСТВ 227 Ясно, что опорный конус содержит множество Ми содержится в несущей плоскости выпуклого множества М. Ясно также, что если Q —внутренняя точка множества Μ относительно его несущей плоскости Ζ/, то опорный конус множества Μ в точке Q совпадает со всей несущей плоскостью L. Если же Q —граничная точка множества Μ относительно его несущей плоскости L, то, как легко видеть, опорный конус множества Μ в точке Q не совпадает со всей плоскостью L. В самом деле, пусть А — внутренняя точка множества Μ относительно его несущей плоскости и / _ Луч, исходящий из точки Q, расположенный на прямой AQ и не содержащий точки Л (рис. 88). Если бы какая-либо точка В луча /, отличная от Q, принадлежала мно- Рис, 88. жеству ΛΓ, то согласно теореме 26.2 точка Q была бы внутренней (относительно L) точкой множества Λί, что противоречит условию. Следовательно, ни одна точка луча /, кроме Q, не принадлежит множеству-М, а потому луч / не содержится в конусе /О Таким образом, конус К не совпадает со всей плоскостью L, и потому согласно т\еореме 28.10 конус К целиком содержится в некотором полупространстве евклидова пространства L. Но тогда и замыкание конуса К (т. е. опорный конус множества Λί в точке Q) содержится в этом полупространстве, т. е. опорный конус не совпадает со всей плоскостью L. Итак, опорный конус выпуклого множества Μ в точке Q в том и только в том случае совпадает со всей несущей плоскостью множества М> если Q — внутренняя точка множества Μ относительно его несущей плоскости. Теорема 28.12. Через каждую граничную точку выпуклого множества проходит хотя бы одна опорная гиперплоскость этого множества. Доказательство. Если выпуклое множество MczEn не является выпуклым телом, то оно целиком расположено в некоторой гиперплоскости Г пространства Еп. Ясно, что эта гиперплоскость является опорной гиперплоскостью множествам, так как Μ расположено целиком в (любом) замкнутом полупространстве, определяемом гиперплоскостью Г. При этом опорная гиперплоскость Г проходит через любую точку Q множества Λί. Таким обра'зом, если Μ не является выпуклым телом, то теорема тривиальным образом справедлива. Пусть теперь Λί —выпуклое тело пространства Еп и Q — граничная точка тела Λί, Обозначим через /С опорный конус
228 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [29 множества Μ в точке Q. Этот конус имеет точку Q своей вершиной. Так как Q — граничная точка тела М, то согласно сказанному выше конус К* не совпадает со всей несущей плоскостью тела М, т. е. не совпадает со всем пространством Еп. Согласно теореме 28.10 существует в Еп такая гиперплоскость Г, проходящая через точку Q, что конус К расположен целиком в одном из двух (замкнутых) полупространств, определяемых гиперплоскостью Г. Так как /С*:эЛГ, то в этом же полупространстве целиком расположено тело М. Следовательно, Г есть опорная гиперплоскость тела М. Согласно построению эта опорная гиперплоскость проходит через точку Q. 29. Аффинные функции на выпуклом множестве. Пусть Μ — произвольное выпуклое множествопрострйнства£,л, Q — его граничная точка и Г — опорная гиперплоскость множества М, проходящая через точку Q. Полупространство (замкнутое), определяемое гиперплоскостью Г и содержащее множество Λί, обозначим через Р. Наконец, пусть С —такая точка, не лежащая в полупространстве Р, что вектор n = QC ортогонален гиперплоскости Г (рис. 89)^ Тогда гиперплоскость Г состоит из тех и только тех точек А е Еп, для которых выполнено равенство nQA = 0, а полупространство Р состоит из тех и только тех точек А^Еп, для которых выполнено неравенство nQA^.0. Так как множество Μ целикЪм расположено в полупространстве Р, то для любой точки А&М выполнено неравенство лОЛ<0. Далее, определим в пространстве Еп аффинную функцию f равенством f(A) = nQA. Тогда в силу сказанного выше, функция f неположительна на множестве Λί, причем в тонке Q она обращается в нуль. Таким образом, мы доказали следующую теорему. Теорема 29.1. Пусть Μ — произвольное выпуклое множество пространства Еп и Q — его граничная точка. Тогда существует такой вектор η φ QK что для любой точки А множества Μ выполнено соотношение Далее, существует такая непостоянная аффинная функция
291 § 7. ОПОРНЫЕ СВОЙСТВА ВЫПУКЛЫХ МНОЖЕСТВ 229 на Еп, которая неположительна на Μ и обращается в нуль в точке Q. Заметим, что функция /, существование которой здесь утверждается, если ее рассматривать только на множестве М, достигает в точке Q максимума (равного нулю). Следующая террема является в некотором смысле обратной. Теорема 29.2. Пусть Μ czEn — выпуклое множество и f — непостоянная аффинная функция, заданная на Еп. Предположим, что функция f, рассматриваемая только на множестве Λί, достигает максимума в некоторой точке Q е Λί. Обозначим через f{ аффинную функцию, определенную равенством f{ (А) = = /(Л) — /(Q). Тогда ядро аффинной функции f{ представляет собой опорную гиперплоскость множества Λί, проходящую через точку Q. Аналогичное утверждение справедливо для минимума функции f, рассматриваемой на Λί. Доказательство. Неравенство f{(А)<0 определяет некоторое полупространство Ρ пространства Еп, причем граничной гиперплоскостью этого полупространства служит ядро аффинной функции f{. Далее, так как функция f, рассматриваемая на Λί, достигает в точке Q максимума, то f{Q)^f{A) для любой точки ЛеЛГ. Иначе говоря, МЛ).^0 ДЛЯ любой точки А е Λί, τ. е. множество Λί целиком расположено в полупространстве Р. Но это и означает, что ядро Г аффинной функции /j является опорной гиперплоскостью множества Λί (ибо, очевидно, Q <= Г). Следствие 29.3. Аффинная непостоянная функция, рассматриваемая на выпуклом теле Μ аЕп, · не может достигать своего максимума {или Минимука) во внутренней точке тела Λί. Действительно, если эта функция достигает своего максимума в точке Q е Λί, то согласно теореме 29.2 через точку Q проходит опорная гиперплоскость тела Λί, а потому точка Q не может быть внутренней. Следствие 29.4. Пусть Μ аЕп — выпуклое множество и Г — некоторая гиперплоскость. Тогда существует не более двух опорных гиперплоскостей множества Λί, параллельных Г. Если Μ — ограниченное выпуклое тело, то таких опорных гиперплоскостей существует ровно две. В самом деле, пусть f — аффинная функция на Еп, ядро которой совпадает с Г (см. теорему 20.2). Если в точке С <= Μ функция /, рассматриваемая только на Λί, не достигает ни максимума, ни минимума, то гиперплоскость Гс, проходящая через С и параллельная Г, не является опорной для тела Λί, так как в Λί найдется точка А, для которой f(A)<f(C), и точка В, для которой f(B) > f(C), и потому точки An В тела Μ лежат по разные стороны гиперплоскости Γς.
230 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ (29 Пусть теперь Q —точка, в которой функция /, рассматриваемая на Λί, достигает максимума (если такая точка существует), и rQl— проходящая через нее гиперплоскость, параллельная Г. Тогда TQ согласно теореме 29.2 является опорной гиперплоскостью множества Λί. (Заметим, что в этой гиперплоскости лежат все точки, в которых / достигает максимума: это будут точки множества TQ(]M и только они.) Аналогичное рассуждение относительно минимума может дать вторую опорную гиперплоскость. Для ограниченного выпуклого тела Μ (замкнутого) функция f действительно достигает на Λί и максимума, и минимума, причем они различны; следовательно, в этом случае существует ровно две опорные гиперплоскости, параллельные Г. Рисунки 90—92 показывают, что для неограниченных выпуклых тел число опорных гиперплоскостей, параллельных Г, Рис. 90. Рис. 91. Рис. 92. может быть равно 0, 1 или 2. Если же множество Μ замкнуто и ограничено, но не является выпуклым телом, то минимум и максимум функции f (рассмотренной в доказательстве) обязательно достигаются на М, но могут совпадать. Поэтому для такого множества может быть либо одна опорная плоскость, параллельная Г (если несущая плоскость множества Μ содержится в гиперплоскости, параллельной Г; рис. 93), либо две (рис. 94). Теорема 29.5. Пусть ΜczEn — замкнутое выпуклое множество и D — не принадлежащая ему точка. Тогда справедливы следующие утверждения: 1) в множестве Μ имеется ровно одна ближайшая к D точка; 2) существует аффинная функция f на Еп, неположительная на Μ и положительная в точке Ζ); 3) существует опорная гиперплоскость множества Λί, относительно которой точка D лежит в одном открытом полупространстве, α βςς множество D — в другом (замкнутом) полупро- дтранстве*
29] § 7. ОПОРНЫЕ СВОЙСТВА ВЫПУКЛЫХ МНОЖЕСТВ 231 Доказательство. Согласно сказанному в примере 22.11 существует ближайшаяк D точка В множества Μ. Докажем, что В —единственная ближайшая точк.а. Допустим, напротив, что существует отличная от β точка CgA[, для которой ρ (С, Ζ)) = ρ(β, D). Обозначим через F точку, определяемую равенством DF = lkDC + xkDB. Тогда имеем 0 = (р(С, D)Y-(p{B, D)Y = \DCf-\DBf= \DF + FC?~ -\DF + FBf: -■ (DF + FCf - (DF + FBY = = (DF + FC)2-(DF-FC)2-. ADFFC. Таким образом, DFFC = 0, и потому \DC\2 = \DF + FCf = (DF + FC)2^ DF\2 + \ FC p. Но так как β Φ С, то ВС Φ 0 и потому РС = х12ВСфЪ. Следовательно, | FCf > 0, т. е. | DC f > \ IDF |2, или, иначе, ρ (С, D) > >p(F, Ζ)). Мы видим, что точка F ближе расположена к D, Рис. 93. Рис. 94. чем С (или β). В то же время точка F принадлежит множеству Μ (так как β <= Λί, С е Μ и F <= [β, С]), что противоречит выбору точки β. Полученное противоречие доказывает, что ближайшая к D точка в множестве Μ единственна. Таким образом, первое утверждение теоремы установлено., Докажем второе утверждение. Будем по-прежнему обозначать через β ближайшую к D точку множества Λί. Определим функцию f равенством f(A) = BDBA. Тогда f есть аффинная функция с градиентом n = BD (тео: рема 21.8), причем /(β) = 0, f(D) = BDBD =\ BD f > 0.
232 ?Л. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ (29 Остается доказать, что функция f неположительна на М. Пусть ΑεξΜ и Аге=[А, В], т. е. ΒΑχ=λΒΑ, где 0<λ<1. Тогда точка А{ тоже принадлежит множеству Μ (в^ силу его выпуклости), и потому p(D, S)<Ip(D, A{). Иначе говоря, \^>f<,\DAJ = \^ + BA{f = {DB + ΒΑι)2=-(ΌΒ + λΒΑ)2 = = (- BD + λΒΑ)2 = I BD Ρ - 2λβ£ ВЛ + λ2 Ι ΒΑ \\ ->—> и потому 2λΒΰΒΑ^λ2\ ΒΑ\2 при 0<λ<1. Отсюда вытекает, что #5яЛ< Ί£\ΒΑ |2 при 0<λ< 1, и, следовательно, ΒΟΒΑζζβ, т. е. /(Л)^0. Тем самым доказано второе утверждение теоремы. Третье утверждение непосредственно вытекает из второго: ядро построенной аффинной функции / и является искомой гиперплоскостью. . Следствие 29.6. Всякое замкнутое выпуклое множество можно представить в виде пересечения конечного или бесконечного числа полупространств. Действительно, рассмотрим все замкнутые полупространства, содержащие замкнутое выпуклое множество Λί, и обозначим через ΛΓ пересечение всех этих полупространств. Так как каждое взятое полупространство содержит Λί, то и М*^эМ. Докажем обратное включение. Пусть D<£M. Тогда в силу третьего утверждения теоремы 29.5 найдется замкнутое полупространство, содержащее Λί и не содержащее точки D. Следовательно, D ф. М\ Итак, если D&M, то ΩφΜ*9 τ. е. М*аМ. Таким образом, Λί = Λί*, т. е. Μ есть пересечение всех рассмотренных полупространств. Теорема 29.7. Пусть Μ czEn — выпуклый многогранник и Τ— его опорная гиперплоскость. Тогда пересечение Т(]М либо совпадает со всем многогранником Μ либо является его гранью. Доказательство. Проведем индукцию по размерности η пространства Еп. При п = 1 теорема тривиальна: гиперплоскостями в одномерном евклидовом пространстве Е1 (т. е.-на прямой) являются точки, а выпуклыми многогранниками в Е1 служат точки и отрезки. Пусть теорема уже доказана для евклидовых пространств размерности меньше /г, и пусть Μ — выпуклый многогранник в Еп, а Г — опорная гиперплоскость этого многогранника. Обозначим через m размерность многогранника Λί. Тогда возможны два случая: m<nt m = n, которые мы рассмотрим отдельно.
29] § 7. ОПОРНЫЕ СВОЙСТВА ВЫПУКЛЫХ МНОЖЕСТВ 233 Пусть т<п и L — несущая плоскость многогранника Λί. Если гиперплоскость Г содержит плоскость L, то ГгэМ, и потому ΓΓ)Μ=Λί, т. е. в этом случае теорема справедлива. Если же Г не содержит целиком плоскость L, то пересечение ГП^ представляет собой некоторую гиперплоскость Г.* евклидова пространства Em = L. В этом случае r(]M = m(L()M) = (mL)[)M = r*()M9 т. е. нужно в m-мерном евклидовом пространстве L рассмотреть пересечение Г*(]М многогранника Μ и его опорной гиперплоскости Г*. Так как т< п, то, по предположению индукции, это пересечение представляет собой некоторую грань многогранника Λί. Таким образом, в этом случае теорема справедлива. Рассмотрим, наконец, случай m = n, т. е. случай, когда многогранник Μ является выпуклым телом пространства Еп. Ясно, что множество М = Т(]М представляет собой выпуклый многогранник, так как Μ есть пересечение конечного числа полупространств, а Г есть пересечение двух полупространств (определяемых этой гиперплоскостью). Пусть А — внутренняя точка многогранника N относительно его несущей плоскости L. Так как А^Г(]М9 то Л—граничная точка многогранника М. Согласно теореме 27.1 найдется {п — 1)-мерная грань М{ многогранника Λί, содержащая точку Л. Гиперплоскость, являющуюся несущей плоскостью {п — 1)-мерного многогранника Мь обозначим через IV Докажем, что многогранник N содержится в гиперплоскости Т{. В самом деле, пусть Β<^Ν. Так как Л —внутренняя точка многогранника N относительно его несущей плоскости L, то найдется такая точка С <= Ν, что А е {В, С). Если бы точка В не принадлежала гиперплоскости Гь то и точка С не принадлежала бы ей, причем точки В и С лежали бы по разные стороны гиперплоскости IV Следовательно, лишь одна из них могла бы принадлежать многограннику Μ (который целиком расположен в одном из двух полупространств, определяемых гиперплоскостью ΓΊ). Но это невозможно, так как обе точки β, С принадлежат многограннику NczM. Полученное противоречие показывает, что Ν ςζΓχ. Если теперь гиперплоскости Г и Гг совпадают, то Ν== = ΓΠΛί = ГХ (]М = МЬ т. е. N есть грань многогранника Λί. Остается рассмотреть случай, когда гиперплоскости Г и Г] не совпадают. В этом случае Г/ = ГГ)Г1 есть гиперплоскость (п —■ 1)-мерного евклидова пространства En~l =TU причем эта гиперплоскость является опорной для многогранника М{ cz Г{. Далее, так как JVciIV то мы имеем ^ = Γ1η^ = Γ1η(ΓΠΛί) = (Γ1ΠΓ)Π(ΛίΠΓ1) = Γ'ηΛίι.
234 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [29 Таким образом, N есть пересечение (п — 1)-мерного многогранника Мх и .его опорной гиперплоскости Г' (в евклидовом (л— 1)-мерном пространстве Еп~{ =ГХ). По предположению индукции, отсюда следует, что N есть некоторая грань многогранника Мх. Но тогда, по определению, N есть также грань многогранника Λί. Проведенная индукция и доказывает теорему. Нетрудно установить (продолжая эти рассуждения), что для любой грани многогранника Μ найдется такая опорная гиперплоскость многогранника М9 которая в пересечении с Μ дает именно эту грань. Если Μ есть я-мерный многогранник в Еп, а рассматриваемая грань (п — 1)-мерная, то существует только одна опорная гиперплоскость (а именно — несущая плоскость этой грани), дающая в пересечении с многогранником эту грань. В остальных случаях существует бесконечно много опорных гиперплоскостей, дающих в пересечении с многогранником рассматриваемую грань. Например, если η = 2, а рассматриваемый многогранник представляет собой выпуклый многоугольник, то (рис. 95) для каждой одномерной грани (стороны) существует только одна содержащая ее опорная гиперплоскость (т. е. в данном случае — опорная прямая), а для каждой нульмерной грани (вершины) — бесконечно много содержащих ее опорных прямых. Аналогично, в случае трехмерного многогранника в трехмерном пространстве (п = 3) через каждую двумерную грань проходит только одна опорная плоскость, а через каждое ребро и через каждую вершину —- бесконечно много. Следствие 29.8. Пусть МаЕп — выпуклый многогранник uf — аффинная функция, заданная на Еп. Тогда либо функция f постоянна на Λί, либо же множество всех тех точек, в которых эта функция (рассматриваемая только на многограннике Λί) принимает свое наибольшее значение, является гранью многогранника М. В частности, для любой аффинной функции f найдется вершина многогранника Λί, в которой функция /, рассматриваемая на Λί, достигает наибольшего значения. То же самое справедливо относительно наименьшего значения функции f на Λί. В самом деле, пусть Q е Λί — точка, в которой функция / достигает максимума на Λί. Тогда ядро Г аффинной функции fu определяемой равенством f{ (A) = f(A) — f(Q), представляет собой опорную гиперплоскость многогранника Λί, проходящую через точку Q. Во всех точках гиперплоскости Г (и только
29] § 7. ОПОРНЫЕ СВОЙСТВА ВЫПУКЛЫХ МНОЖЕСТВ 235 в этих точках) функция / принимает значение /(Q). -Следовательно, множество всех точек многогранника Λί, в которых функция f достигает на Μ наибольшего значения, совпадает с Μ П Г. Отсюда в силу теоремы 29.7 и вытекает требуемое утверждение. Теорема 29.9. Пусть ΜczEn — выпуклый многогранник и f — аффинная функция, заданная на Еп. Обозначим через Λί' ту грань многогранника М, на которой функция f (рассматриваемая на М) принимает наибольшее значение. Для того чтобы вершина А многогранника Μ принадлежала грани Λί', необходимо и достаточно, чтобы для каждого выходящего из А ребра [Ау В] многогранника Μ было выполнено соотношение пАВ^.0, где η — градиент аффинной функции /. В частности, для того чтобы аффинная функция f достигала на многограннике Μ максимума только β одной вершине А, необходимо и достаточно, чтобы для каждого выходящего из А ребра [А, В] многогранника Μ было выполнено соотношение пАВ<0. Доказательство. Пусть вершина А принадлежит грани Λί' и [А, В] — некоторое ребро, выходящее из вершины А. Тогда /(Л)>/(5), т. е. пАВ^О (см. (21.5)). Если при этом вершина В не лежит на грани Λί', то f(A)>f(B), т. е. пАВ<0. Таким образом, необходимость сформулированных условий установлена. Докажем достаточность. Можно предполагать, что размерность многогранника Μ не меньше двух, так как иначе теорема очевидна. Пусть А — некоторая вершина многогранника Λί, не принадлежащая грани Λί'. Возьмем произвольную точку С грани Λί' и пусть D — произвольная точка многогранника Λί, не лежащая на прямой АС (такая точка D существует, так как, по предположению, размерность многогранника Μ не меньше двух). Рассмотрим двумерную плоскость П, проходящую через точки А, С, D, и положим М* = U()M. Тогда Λί* есть двумерный многогранник (т. е. выпуклый многоугольник), для которого А является вершиной. Заметим, что функция / не является постоянной на Λί*, так как точка А не лежит на грани Λί', и потому f(A) < f(C). Пусть Ε и F — соседние с А вершины многоугольника М*. Если бы были выполнены неравенства f(E)^f(A), f(F)^.f(A), то во всех точках лучей АЕ, AF функция / принимала бы значения, не превосходящие f(A), и потому во всех точках угла, образованного этими лучами, значения функции f не превосходили бы f(A). Но тогда и во всех точках многоугольника Λί* (содержащегося в этом' угле; рис. 96) значения функции / не превосходили бы /(Л), что невозможно, так как /(С) > f(A).
236 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ (30 Таким образом, должно быть выполнено хотя бы одно из неравенств f(E)>f(A\ f(F)>f(A). Пусть, для определенности, f(E)>f(A). Возьмем на стороне [Л, Е] многоугольника М* произвольную точку /С. Точка К принадлежит многоугольнику ΛΓ и, значит, принадлежит многограннику М. При этом она является граничной точкой многогранника Μ (если бы она была / внутренней для М, то была бы внутрен- / ней и для ΛΓ). Следовательно, в силу \ / теоремы 27.1 найдется (т— 1)-мерная \£ЖГ^ / грань М1 многогранника Λί, содер- vi/*n/i/'^t\m\ш»^ жаи*ая точку /С, где т — размерность >ргГ^\\\\\\\\\/ многогранника Λί. Так как К^(А9 Е\ ^|\\ ш1'НШ то весь отРезок И» Е\ принадлежит u\\\\\rΑ)3^\ грани М{. При этом в точке А функ- ^<Ц>^^^ \^ ция f (рассматриваемая на Мх) не до- ^^^^^А ^ стигает наибольшего значения, так +^^ как f(A) <f(E). Итак, если в вершине- Рис. 96. А е Λί функция f не принимает наибольшего значения, то удается снизить размерность многогранника Μ на единицу (причем по- прежнему в вершине А функция / не будет достигать наибольшего значения). Снижая таким образом размерность многогранников, мы дойдем до одномерной грани [Л, В] многогранника М, причем по-прежнему функция f, рассматриваемая на ребре [Л, В], не будет достигать в точке А наибольшего значения, т. е. f(A)<f(B). Но тогда пАВ>0. Таким образом, если вершина А не принадлежит грани ΛΓ, то найдется такое ребро [Л, В], выходящее из этой вершины, что пАВ>0. Этим доказана достаточность сформулированных в теореме условий. § 8· Теоремы об отделимости выпуклых конусов 30. Отделение выпуклых множеств. Пусть Мх и М2 — два выпуклых множества пространства Еп. Множества Мх и Λί2 называются отделимыми в Еп, если существует такая гиперплоскость Г с: £*\ что множество Мх расположено в одном замкнутом полупространстве, определяемом гиперплоскостью Г, а множество М2 — в другом. Гиперплоскость Г, обладающая этим свойством, называется отделяющей гиперплоскостью для множеств Мх и Λί2 (или гиперплоскостью, отделяющей множества Λί! и М2). Подчеркнем, что множества Мх и М2 не предполагаются обязательно лежащими в открытых полупространствах,
301 § 8. ТЕОРЕМЫ ОБ ОТДЕЛИМОСТИ ВЫПУКЛЫХ КОНУСОВ 237 определяемых гиперплоскостью Г (как на рис. 97); они могут иметь общие точки с гиперплоскостью Г, отделяющей их (рис. 98). В частности, если множества Мх и М2 лежат в одной гиперплоскости Г (рис. 99), то эта гиперплоскость является отделяющей для множеств М{ и Λί2. Отметим также, что отделимость множеств весьма существенно зависит от того, в каком Рис. 97. евклидовом пространстве рассматриваются эти множества. Так, множества Мх и Λί2, изображенные на рис. 99, являются отделимыми, если их рассматривать в трехме ρ ном евклидовом пространстве, но будут неотделимыми, если их рассматривать в двумерном евклидовом пространстве Г. Этот пункт посвящен нахождению различных условий отделимости выпуклых множеств. Рассматриваемые выпуклые множества всегда предполагаются замкнутыми. Проще всего рассматривается вопрос об отделимости, когда выпуклые множества не имеют общих точек и хотя бы одно из них ограничено. В этом случае выпуклые множества всегда отделимы. Наиболее простой способ построения отделяющей гиперплоскости для таких множеств состоит в следующем. Пусть Aij и М2 — выпуклые непересекающиеся множества, причем множество Μλ ограничено. Для каждой точки Л е Мг найдем б л иж айшую к ней точку В множества ^(теорема 29.5) и длину отрезка [Л, В] обозначим через φ(Α). Иначе говоря, φ (Л) —это кратчайшее расстояние от А до точек множества М2 (рис. 100). Функция φ (Л) определена (и, как легко понять, непрерывна) на множестве Λί,. Поэтому существует точка Л0, в которой эта функция (рассматриваемая на М,) достигает наименьшего значения. Иначе говоря, мы найдем точки А0^Ми В0^М2, осуществляющие минимум расстояния между точками множеств М{ и М2. (Отметим, что пара точек Л0, В0, осуществляющая минимум расстояния между точками множеств Мх и М2, может быть не единственной; рис. 101.) Теперь достаточно провести гиперплоскость Г, ортогональную отрезку [Л0, В0] и проходящую через какую-либо внутреннюю
238 ГЛ III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [30 точку этого отрезка — эта гиперплоскость и будет отделяющей (см. рис. 100). Действительно', если бы нашлась в множестве Мх точка С, лежащая по другую сторону от Г, чем точка А0 (рис. 102), то Рис. 100. Рис. 101. весь отрезок [Л0, С] принадлежал бы множеству Мх. Но тогда близкие к А0 точки отрезка [Л0, С] были бы расположены ближе к В0у чем точка А0 (так как угол между отрезками [Л0, В0] и [А0у С] острый), что, однако, противоречит выбору точек Л0, В0. Следовательно, все множество Мх расположено по ту же сторону от Г, что и точка Л0. Так же доказывается, Рис. 102. Рис. 103. что множество М2 расположено по ту же сторону от Г, что и точка В0. Таким образом, Г —отделяющая гиперплоскость. Заметим, однако, что в случае, когда непересекающиеся выпуклые множества Ми М2 оба .являются неограниченными, это рассуждение неприменимо, такчкак наименьшего расстояния между точками множеств Мх и М2 может не существовать (рис. 103). Ниже мы распространим полученный ре-
30] § 8. ТЕОРЕМЫ ОБ ОТДЕЛИМОСТИ ВЫПУКЛЫХ КОНУСОВ 239 зультат и на неограниченные множества (см. следствие 30.8), но метод доказательства будет совершенно другим — мы воспользуемся следующим вспомогательным предложением, дополняющим теорему 25.1. Теорема 30.1. Пусть F — произвольное замкнутое множество, расположенное в пространстве Еп. Для того чтобы точка С е Еп была внутренней точкой множества conv F, необходимо и достаточно, чтобы существовали такое натуральное число т, такие точки Л0, Аь ..., Ат множества F, не лежащие в одной гиперплоскости, и такие числа λ°, λ1, ..., λ™, что выполнены соотношения: λ°>0, λ!>0, ..., lm>09 λ° + λ1 + ... + Ят=1, (ЗОЛ) С = λ°Α0 + λχΑχ + ... + XmAm. (30.2) Доказательство. Обозначим через F* множество всех точек С, для каждой из которых существуют такое натуральное число т, такие точки Л0, Аи ..., Ат множества F, не лежащие в одной гиперплоскости, и такие числа λ°, λ1, ..., Ят, что выполнены соотношения (30.1), (30.2). Множество F* выпукло (ср. доказательство теоремы 25.1). Докажем, что оно является открытым множеством. Пусть CeF*, т. е. выполнены соотношения (ЗОЛ), (30.2). Так как точки Л0, Аи .. л, Ат не лежат в одной гиперплоскости, то т^п и среди векторов А0Аи ..., А0Ат найдутся η линейно независимых. Предположим для простоты обозначений, что линейно независимыми являются векторы А0Аи ..., А0АПУ так что точки Л0, Ai9 ..., Ап являются вершинами /г-мерного симплекса. Положим 0 = λ% + λ4 + ... + λη'ιΑη^ι+{λη + λη+ι + .:. + Ят)Л„. (30.3) В силу (30.1) точка D является внутренней точкой симплекса [Л0, Аи ..., Ап] (см. пример 25.3), а потому является внутренней точкой многогранника Λί, служащего выпуклой оболочкой точек Л0, Л1э ..., Ат. Ясно также, что все внутренние точки симплекса [Л0, Л,, ..., Ап] принадлежат множеству F*. Если D = Cy то С является внутренней точкой множества F*. Пусть теперь СфВ, так что т>п (ср. соотношения (30.2) и (30.3)). Рассмотрим точку £ = C + eDC,
240 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ (30 где е > 0 (рис. 104). Ясно, что точка С принадлежит интервалу (Д £"). Далее, Е^=С + е (С—£>)—(1 + ε) C-eD=( 1 +ε) (λΜο+λ1 Αχ +... +ХтАт)~ -β(λ4 + λ4+ ··· +λη-ιΑη^+{λη+ ... +Хт)Ап) = -λ0Αο + λιΑχ+ ... +λΛ-4., +{λη -е(яй+1 + ... +ЯИ)) Л„+ + (1+β)λιι+ΙΛι+ι + ... +(1+е)ЛтЛт. Ясно, что при достаточно малом е>0 все коэффициенты в правой части положительны, причем сумма их равна 1, т. е. E^F*. Итак, обе точки Д Ε принадлежат множеству F*, причем D — внутренняя точка этого множества. Так как Се(Д £), ^ то отсюда следует (в силу тео- Е=С+е1Ю ремы 26.2), что С —внутренняя точка множества F*. Мы *f+£ ВИДИМ» что любая точка С мно- ^ * жества F* является его внутренней точкой, т. е. множество F* открыто. Докажем, наконец, что если Рис.· 104. множество F* непусто, то его замыкание совпадает с выпуклой оболочкой множества F. В самом деле, пусть Сх — произвольная точка множества conv F, так что €ι=μ*Β0 + μιΒι + ... +μ*β*. где B0i Bu ..., fife — некоторые точки множества F, а числа μ°, μ1, ..., μ* неотрицательны и удовлетворяют соотношению μ° + μ1 + .·. + μ* = 1· Можно предполагать (отбросив, если нужно,, лишние точки β/), что все эти числа положительны: μ°>0, μι>0, ..., μ*>0, μ° + μ1 + . . '. + μ* = 1. Возьмем произвольную точку С множества F* (напомним, что это множество предполагается непустым), т. е. точку, удовлетворяющую соотношениям (30.1), (30.2), где Л0, Аи ..., Ат не лежат в одной гиперплоскости. Пусть, далее, К — произвольная точка интервала (С, Сх\ т. е. tf = (l-v)C + vC„ 0<v< l. Тогда мы имеем * = (1-ν)(λ%+ ... +λ^/η)+ν(μθβ0 + μ1β,+ ...+μ^)= -(1-ν)λ% + ... +(1-ν)λ"ιΑ)η + + νμ°β9 + νμ1β1+ ... +νμ%
30J § 8. ТЕОРЕМЫ ОБ ОТДЕЛИМОСТИ ВЫПУКЛЫХ КОНУСОВ 241 причем все коэффициенты в правой части положительны и сумма их равна единице. Так как, кроме того, точки Л0, А{9 .··, Ат> &о> B{> ···» Bk не лежат в одной гиперплоскости (ибо уже точки Л0, Аи ..., Ат не лежат в одной гиперплоскости), то K^F*. Итак, любая точка К интервала (С, С{) принадлежит множеству F*9 так что как угодно близко к С{ имеются точки множества F* и потому Сх принадлежит замыканию множества F\ Иными словами, все, множество conv F содержится в замыкании множества F\ а так как множество conv/7 замкнуто и содержит F*, то conv/7 совпадает с замыканием множества F*. Из доказанного нетрудно вывести, что int(convF) = F*. (30.4) Действительно, если множество conv/7 не содержит внутренних точек, т. е. если все множество F (а вместе с ним и conv/7) расположено целиком в некоторой гиперплоскости, то в F не существует точек Л0, Аь ..., Лт, не лежащих в одной гиперплоскости, и потому множество F* пусто. Итак, если множество int(convF) пусто, то и F* пусто, т. е. равенство (30.4) в этом случае выполняется. Если же множество int(convF) непусто, т. е. conv/7 содержит внутренние точки, то F не лежит целиком в одной гиперплоскости, и потому найдутся в Сточки Л0, Аи ..., АП9 не лежащие в одной гиперплоскости, т. е. множество F* также непусто. В этом случае F* есть открытое выпуклое множество, замыкание которого совпадает с conv/7, и потому равенство (30.4) также справедливо. Итак, (30.1), (3012) (где точки Л0, Аи ..., Ат не лежат в одной гиперплоскости) есть необходимое и достаточное условие для того, чтобы точка С принадлежала множеству int (conv Ζ7). Замечание 30.2. В отли- Рис.105, чие от теоремы 25.1, в теореме 30.1 мы не можем утверждать, что в соотношениях (30.1), (30.2) число т можно считать равным п. Если, например, лг = 2 и F представляет собой множество, состоящее из четырех вершин квадрата (рис. 105), то центр Q квадрата является внутренней точкой множества conv/7. В соответствии с теоремой 30.1 имеем ' Q = λΜ0 + λ1 Αι + λ2Α2 + λ3Λ3,
242 гл. in. элементы теорий выпуклых множеств [зо где λ°=λ1 =λ2 = λ3= 1/4. Однако выбрать три точки, не лежащие на одной прямой, для которых справедливы соотношения (30.1), (30.2), невозможно. Таким образом, в этом примере лг = 2, т = 3. Вернемся теперь к вопросу об отделении выпуклых множеств. Прежде всего рассмотрим задачу об отделении двух выпуклых конусов с общей вершиной. Эта задача решается следующей теоремой. Теорема 30.3. Пусть Мх и М2 — два выпуклых конуса в пространстве Еп, имеющие общую вершину Q. Для того чтобы конусы Мг и М2 не были отделимы, необходимо и достаточно, чтобы существовали такие точки Ви ..., Bk конуса Мх и такие точки Си ..., Ct конуса Мъ что точки Ви ..., Bki С и ..., С ι не лежат β одной гиперплоскости и при этом QBi+ ... +Q5* = QCi+ ... +QC/. (30.5) Доказательство. Обозначим через Nx конус, симметричный конусу Мх относительно точки Q (см. пример 19.14), и положим F = Nl(j Λί2. Если конусы Мг и М2 отделяются гиперплоскостью Г, то оба конуса Nb M2 лежат в одном (замкнутом) полупространстве, определяемом гиперплоскостью Г, т. е. все множество F лежит в одном полупространстве, а потому и его выпуклая оболочка conv/7 лежит в том же полупространстве. Иначе говоря, Г — опорная гиперплоскость выпуклого множества conv/7 и потому точка Q является граничной точкой множества conv F (так как через нее проходит опорная гиперплоскость Г множества conv/). Обратно, если Q — граничная точка множества conv F, то через точку Q можно провести опорную гиперплоскость Г множества conv/7, и тогда все ' множество conv/7, а потому и оба конуса Nb M2 лежат в одном полупространстве, определяемом гиперплоскостью Г, так что конусы Мг и М2 отделяются этой гиперплоскостью. Итак, конусы Мх и М2 отделимы в том и только в том случае, если Q — граничная точка множества conv F. Значит, конусы неотделимы в том и только в том случае, если Q —внутренняя точка множества conv/7. Пусть конусы1 неотделимы, т. е. Q — внутренняя точка множества conv)7. Согласно теореме ЗОЛ существуют точки Л0, Аи ..., Ат множества F, не лежащие в одной гиперплоскости, и числа λ°, λ1, ..., λ"\ удовлетворяющие условиям (30.1), (30.2), где C=^Q. Так как F = Nx (J Λί2, то каждая из точек Л0, Аи ..., Ат принадлежит хотя бы одному из конусов Nu Λί2. Пусть, Для определенности, точки Л0, Л,, ..., Ak^ принадлежат конусу Nu где k^mt а остальные точки Aki ..., Ат — конусу М2. Положим теперь l = m — k-\-2 и определим точки Ви ..., Bk>
30] § 8. ТЕОРЕМЫ ОБ ОТДЕЛИМОСТИ ВЫПУКЛЫХ КОНУСОВ 243 Си ..., С/ соотношениями QBt = - λ'-'ΟΛ-ι (i = 1, ..., *); QC} = X!+k-lQAj+k-i (/—1 /— О; С, —Q. Тогда ясно, что точки Ви ..., Bk принадлежат конусу Мь а точки Си ..., Cj —конусу Αί2. Далее, точки В1э ..., Bki Сь ..., С^ не лежат в одной гиперплоскости (иначе в этой же гиперплоскости лежали бы и все точки А0, Аь ..., Лт). Наконец, из соотношения (30.2), в котором C — Q, мы находим QB{+ ... +Qfife = QC!+ ... +QC/-1+QC/.- Таким образом, указанное в теореме 30.3 условие выполнено, т. е. это условие является необходимым. Докажем достаточность, т. е. предположим выполненным условие, указанное в теореме 30.3, и установим, что конусы Мх и М2 неотделимы. Допустим, напротив, что конусы отделимы, т. е. существует такая гиперплоскость Г, проходящая через точку Q, что AilczPl, M2aP2t где Р{ и Р2 — замкнутые полупространства, определяемые гиперплоскостью Г. Определим точку D соотношением QD = QB{+ ... +Q|?* = QCi+ ... +QCi- Так как все точки Q, Ви ..., Bk принадлежат полупространству Ри причем точка Q лежит в граничной гиперплоскости, то точка D также лежит в этом полупространстве. Аналогично, точка D принадлежит и полупространству Р2. Следовательно, D е Г. Но тогда все точки Вь ..., Bk лежат в гиперплоскости Г (иначе точка D лежала бы в открытом полупространстве, а не на гиперплоскости Г) и, аналогично, все точки Си ..., Ct лежат в гиперплоскости Г. Но это противоречит тому, что точки Bit ···> Bky Сь ..., Ci не лежат в одной гиперплоскости. Полученное противоречие показывает, что конусы М{ и М2 неотделимы. Следующая теорема дает необходимое и достаточное условие неотделимости конусов с общей вершиной в более герме- тричной форме. Теорема 30.4. Пусть Мх и М2 —выпуклые конусы в Еп с,общей вершиной Q. Для того чтобы эти конусы были неотделимыми, необходимо и достаточно, чтобы выполнялись следующие два условия: 1) не существует гиперплоскости, содержащей оба конуса Ми М2; 2) существует точка А, являющаяся внутренней точкой каждого из конусов Ми М2 относительно его несущей плоскости.
244 ГЛ. HI. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ f30 Доказательство. Докажем достаточность сформулированных условий. Допустим, напротив, что (при выполнении указанных условий 1) и 2)) конусы Мх и М2 являются отделимыми, и пусть Г — отделяющая гиперплоскость. Возьмем произвольную точку В & Мх. Так как Л —внутренняя точка конуса Мх относительно его несущей плоскости, то можно найти такую точку С ^Ми что А^{В9С). Поскольку точка А принадлежит конусу Мх, то она лежит в одном (замкнутом) полупространстве, определяемом гиперплоскостью Г, а так как А принадлежит и конусу Λί2, то она лежит в другом полупространстве. Следовательно, ЛеГ. Если бы точка В не принадлежала гиперплоскости Г, то точка С также не лежала бы в этой гиперплоскости, причем В и С были бы расположены по разные стороны от Г. Но это невозможно, так как весь конус Λί! расположен в одном полупространстве, определяемом гиперплоскостью Г. Следовательно, ВеГ, т. е. весь конус Мх содержится в гиперплоскости Г. Аналогично доказывается, что М2аГ. Но это противоречит условию 1)ч Полученное противоречие показывает, что при выполнении условий 1) и 2) конусы неотделимы. Докажем теперь необходимость. Иными словами, докажем, что если хотя бы одно из условий 1), 2) не выполнено, то конусы Мх и М2 отделимы. Относительно условия 1) это очевидно: если конусы Мх и М2 лежат в одной гиперплоскости, то они отделимы. Остается доказать, что если не выполнено условие 2), то конусы Мх и М2 отделимы. Итак, предположим, что не существует точки Л, являющейся внутренней (относительно соответствующей несущей плоскости) для каждого из конусов Ми Λί2. Обозначим через Lu L2 несущие плоскости конусов Ми М2. Тогда точка Q не является внутренней (относительно несущей плоскости) хотя бы для одного из конусов Мь М2, т. е. хотя бы один из этих конусов не совпадает со всей своей несущей плоскостью. Пусть, для определенности, МХФЬХ. Рассмотрим множество relintAij всех точек, являющихся внутренними (относительно Lx) для конуса Мг. Добавив к этому множеству точку Q, мы получим выпуклый конус, который обозначим через М\. Аналогично, добавляя к множеству relintM2 точку Q, мы получаем выпуклый конус М°2. Согласно предположению, конусы М\ и М°2 не имеют других общих точек, кроме Q. При этом М\ Φ Lx (ибо Μ] cz Aij)t Докажем, что конусы М° и М°2 отделимы (откуда затем легко выведем, что и исходные конусы М1э М2 отделимы). Допустим, напротив, что конусы Ми М2 неотделимы. Тогда в силу теоремы 30.3 существуют такие точки Ви ..., Bk конуса All и такие точки Си ..., С/ конуса М2, что точки Βι, ...
30] § 8. ТЕОРЕМЫ ОБ ОТДЕЛИМОСТИ ВЫПУКЛЫХ КОНУСОВ 245 Въ Ci, ..., С/ не лежат в одной гиперплоскости и выполнено соотношение (30.5). Определим точку D соотношением QBX + ... +Q%k=*QCi+ ... +QCi = QD. Так как Q — вершина конуса М°и а точки Ви ..., β* принадлежат этому конусу, то и точка D принадлежит конусу ΛίΙ. Точно так же точка D принадлежит конусу М2. Но эти конусы имеют единственную общую точку Q. Следовательно, D=Qt т. е. QB{+ ... +QBk = QCi+ ... +QCi = 0, (30.6) Обозначим через N{ многогранник, являющийся выпуклой оболочкой точек Вх Bkt а через ^ — многогранник, являющийся выпуклой оболочкой точек Си ..., С/. Несущие плоскости этих многогранников обозначим соответственно через L* и Ц. Соотношение Q = y#i+ ... +-£-Вк9 непосредственно вытекающее из (30.6), показывает, что точка Q принадлежит плоскости L* и притом (в силу теоремы 30.1) является в евклидовом пространстве L\ внутренней точкой выпуклой оболочки точек Вх Bk9 т. е. внутренней (относительно Li) точкой многогранника N\. Но так как N\dM°\ и М\ есть конус с вершиной Q, то вся плоскость L\ содержится в ΛίΙ. Аналогично доказывается, что LlczM2. Отсюда следует, что плоскости L*, L\ имеют единственную общую точку Q. При этом обе плоскости L*, L\ не могут одновременно содержаться в некоторой гиперплоскости (так как в этой гиперплоскости содержались бы все точки Ви ..., Bki Cu ..., С/). Итак, плоскости L* и Ц являются взаимно дополнительными, т. е. они имеют единственную общую точку Q, а сумма их размерностей равна п. Отсюда нетрудно заключить, что M\=L*u Действительно, пусть Л—произвольная точка конуса ΛίΤ. —> —> —> Существуют такие точки BeL*, С^Ц, что QA = QB + QC. Обозначим через В{ точку, симметричную В относительно точки Q. Ясно, что В\ <= L*, причем QB\ = — QB. Следовательно, ^^QA-^QB = QA + Qb[. Так как А^М°и B>eAfI, то от- о сюда следует, что CeAfi. Таким образом, точка С принадлежит обоим конусам Ми Λί2, и потому C — Q. Из соотношения QA = QB + QC следует теперь, что QA = QB, т. е. А = β, и потому А е Li. Итак, конус 1ή\ совпадает с плоскостью L\. Но
246 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ (30 тогда L\ и есть несущая плоскость конуса Ми т. е. M°\=L*\=L\9 что, однако, противоречит предположению М°\ФЬ\. Полученное противоречие показывает, что конусы М\ и М°2 отделимы. Итак, существует такая гиперплоскость Г, что M°czPu M°2czP2, где Ри Р2 — замкнутые полупространства, определяемые гиперплоскостью Г. В силу замкнутости полупространства Р{ в нем вместе с конусом М\ содержатся и все граничные (относительно Lj) точки этого конуса, т. е. весь конус М} содержится в Ργ. Аналогично, M2czP2. Таким образом, Г является отделяющей гиперплоскостью для конусов Мх и Λί2. Следствие 30.5. Пусть Мх и М2 — выпуклые конусы в Еп, которые имеют общую вершину Q и не имеют других общих точек. Тогда либо конусы Ми М2 отделимы, либо же Мх и М2 являются двумя взаимно дополнительными плоскостями (г. е. сумма их размерностей равна п). Следствие 30.6. Пусть М{ и М2 —выпуклые конусы в Еп с общей вершиной Q, причем конус М{ телесный (т. е. имеет размерность п), а конус М2 не пересекается с внутренностью конуса М{. Тогда конусы Мх и М2 отделимы, В частности, два телесных конуса с общей вершиной, не имеющие общих внутренних точек, отделимы. Перейдем, наконец, к рассмотрению общего случая. Пусть Мх и М2 — произвольные выпуклые множества .в Ε . Рассмотрим (п+ 1)-мерное евклидово пространство Еп+1> содержащее Еп в качестве гиперплоскости, и пусть Q — произвольная точка пространства Еп+\ не лежащая в Еп. Всевозможные лучи, исходящие из точки Q и проходящие через точки множества М{, образуют выпуклый конус в Εη+ι, который мы обозначим через К\. Аналогично, лучи, исходящие из Q и проходящие через точки Рис. 106. множества М2, образуют выпуклый конус К2 cz En+l (рис. 106). Допустим, что Гс£я- гиперплоскость, отделяющая множества М{ и Λί2. Тогда гиперплоскость Г* пространства Еп+ , содержащая Г и проходящая через точку Q, отделяет в Еп+г конусы К\ и К2- Обратно, если конусы К\ и К2 отделимы в Еп+
30j § 8 ТЕОРЕМЫ ОБ ОТДЕЛИМОСТИ ВЫПУКЛЫХ КОНУСОВ 24/ й Г* — отделяющая гиперплоскость, то, очевидно, гиперплоскость Г* не параллельна гиперплоскости Еп в пространстве Еп+{ и потому пересекается с ней. Пересечение Г* Π Εη представляет собой гиперплоскость пространства Еп, причем эта гиперплоскость отделяет множества М{ и М2. При помощи этого приема задача отделения произвольных выпуклых множеств в Еп сводится к задаче отделения выпуклых конусов с общей вершиной в Εη+ι. Поэтому из полученных выше результатов 30.4—30.6 об отделении выпуклых конусов мы непосредственно получаем следующие факты (причем выпуклые множества М{ и М2, о которых идет речь, могут быть ограниченными или неограниченными, замкнутыми или незамкнутыми). Следствие 30.7. Для того чтобы выпуклые множества Мг и М2 пространства Еп были неотделимыми, необходимо и достаточно, чтобы выполнялись следующие два условия: 1) не существует гиперплоскости ГаЕп, содержащей оба множества М{, М2, 2) существует точка А, являющаяся внутренней точкой каждого из множеств Мх, М2 относительно его несущей плоскости. Следствие 30.8. Всякие два непересекающихся (непустых) выпуклых множества в Еп отделимы. Следствие 30.9. Пусть Мх — выпуклое тело пространства Еп, а ^М2 czEn — выпуклое множество, не пересекающееся с внутренностью тела Мх, тогда Мх и М2 отделимы. В частности, два выпуклых тела, не имеющие общих внутренних точек> отделимы. В заключение отметим весьма простую связь, существующую между понятием отделимости выпуклых множеств и аффинными функциями.. Пусть Г — отделяющая гиперплоскость выпуклых множеств Мх и М2. Рассмотрим непостоянную аффинную функцию /, ядром которой служит гиперплоскость Г. Функция / неотрицательна на одном из полупространств, определяемых гиперплоскостью Г, и неположительна на другом; поэтому она неотрицательна на одном из множеств Мх, М2 и неположительна на другом. Итак, если множества Мх, М2 отделимы, то существует непостоянная аффинная функция, неотрицательная на одном из множеств Мх и М2 и неположительная на другом. Очевидно и обратное: если такая функция существует, то множества Мх, М2 отделимы (ядро этой функции служит отделяющей гиперплоскостью). Таким образом, задача отделения выпуклых множеств эквивалентна задаче построения непостоянной аффинной Функции, неотрицательной на одном множестве и неположительной на другом. Это позволяет переформулировать
248 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [31 результаты 30.3—30.9 в терминах аффинных функций. Например, следствие 30.8 может быть сформулировано следующим образом: если Мь М2 —непересекающиеся непустые выпуклые множества в Еп, то существует в Еп непостоянная аффинная функция, неотрицательная на Мх и неположительная на Αί2. 31. Двойственный конус. Пусть Λί — выпуклый конус пространства Еп, имеющий точку Q своей вершиной. Через D(M) обозначим множество всех точек В е Еп> обладающих тем свойством, что для любой точки А&М выполнено неравенство QAQB<0. Легко понять, что множество D(M) является конусом -с вершиной Q. Действительно, пусть B^D(M), λ — неотрицательное число и fij—такая точка, что QB{=XQB. Тогда для любой точки А <= Μ имеем QAQB{ = QA {XQB) = λ (QAQB) < 0, т. е. В{ е= D (М). Нетрудно, далее, показать, что конус D(M) является выпуклым. Действительно, пусть Bl^D(M), B2^D(M) и С— точка отрезка [Ви В2], т. е. QC = (1 — K)QBX +>XQB2, где 0< ^λ^Ι. Тогда для любой точки А^М имеем: QAQC = QA((l -λ)0Β{+λ0Β2)=: = (\—k)QAQBl+XQAQB2^0i т. е. CeD(M). Заметим, .наконец, что выпуклый конус D(M) является замкнутым (даже если исходный конус Μ был незамкнут). В сахмом деле, если точка Ε не принадлежит конусу D(M), то найдется такая точка А е М, что QAQE > 0. Но тогда и для всякой точки £', достаточно близкой к £, выполнено неравенство QAQE'>0, т. е. Ε' φ D (Μ). * Следовательно, дополнение (в пространстве Еп) к множеству D(M) является открытым множеством, и потому D(M) — замкнутое множество. Итак, D(M) есть замкнутый выпуклый конус. Он называется двойственным конусом для Μ (в пространстве Еп). Рассмотрим в качестве примера двумерное пространство Е2. Если конус Μ совпадает со всей плоскостью £2, рассматриваемой как конус с вершиной Q, то конус Ζ)(Λί), очевидно, состоит лишь из одной точки Q. Если Μ — полуплоскость, то D(M) — луч, перпендикулярный к граничной прямой этой полуплоскости (рис. 107). Если М— угол, меньший π, то D(M) представляет собой угол, стороны которого перпендикулярны Я сторонам угла Μ (если величина угда Μ равна а, то велц-
31] § 8. ТЕОРЕМЫ ОБ ОТДЕЛИМОСТИ ВЫПУКЛЫХ КОНУСОВ 249 чина угла D(M) равна π —α; рис. 108). Наконец, если Μ — прямая, то D(M) — перпендикулярная к ней прямая (рис. 109), а если М— луч, то D(M) — полуплоскость (рис. ПО). Рис. 107. Рис. 108. Рис. 109. Рис. ПО. Теорема 31.1. Пусть №—выпуклый конус в Еп с вершиной Q. Точка В в том и только в том случае принадлежит двойственному конусу D{M), если аффинная функция fB, удовлетворяющая условиям MQ) = 0, graafB = QB, (31.1) неположительна'на М. Доказательство. Мы имеем (для любой точки Ае Еп): fB(A)~fB(A)-f(Q) = WgraafB = QAQB (см. (21.5)). Отсюда видно, что если B<=D{M) (т. е. QAQB^.0 для любой точки 4еМ), то fB(A)^0 для любой течки ЛеМ, т. е. функция fB неположительна на М. Обратно, если функция fB, определяемая соотношениями (31.1), неположительна
250 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [31 на Λί, т. е. ЫЛ)<0 ДЛЯ любой точки Ле=Л4, то QAQB <0 для любой точки /4еМи потому B^D(M). Теорема 31.2. Пусть Μ — замкнутый выпуклый конус с вершиной Q. Тогда D{D(M))=^M, т. е. конус, двойственный двойственному конусу Ζ)(Λί), совпадает с исходным конусом Λί. Доказательство. Если А^М, то для любой точки B^D(M) справедливо неравенство QAQB^O, и потому Μ а czD{D{M)). Пусть теперь СфМ. Тогда шар Σ некоторого радиуса г с центром С не пересекается с Λί (напомним, что Λί — замкнутое множество). Так как Σ и Λί — выпуклые непересекающиеся множества в Еп, то они отделимы (рис. 111), т. ,<е. существует аффинная непостоянная функция /, неположительная на Λί и неотрицательная на шаре Σ. Определим аффинную функцию flf положив f{(D) = f{D) — f(Q) для любой точки /)<=£*. Функция fx непостоянна. Далее, так как /(QX0, то f\(D)^f{D)9 и потому функция /,, как и /, неотрицательна на шаре Σ. Покажем, что она неположительна на конусе Λί. Действительно, пусть А — отличная от Q точка конуса Λί положительное число. Обозначим через А{ точку, определяемую равенством QAX=KQA. Тогда А{ е Λί fMXO. В силу (21.5) имеем Рис. 111. И λ- и потому f (А) - / (Q) = Й grad / - XQA grad / - λ (f (A) - / (Q)). Так как /(Д)^0, то отсюда получаем k(f{A)-f(Q))<-f(Q)- Это соотношение справедливо для любого λ > 0, и потому /(Л) — f(QX0. Иначе говоря, М^ХО, т. е. функция /j неположительна на Λ1. Итак, функция f{ непостоянна, причем она неотрицательна на Σ, неположительна на Λί и удовлетворяет соотношению /j(Q)=Q. Так как функция f{ неотрицательна на шаре Σ и непостоянна, то центр С шара Σ не принадлежит ядру функции fi (в силу теоремы 29.3) т. е. fl (С) Φ 0; следовательно, fi(C)>0.
31] § 8. ТЕОРЕМЫ ОБ ОТДЕЛИМОСТИ ВЫПУКЛЫХ КОНУСОВ 251 Обозначим через В такую точку, что QB = gV2iafx. Тогда для любой точки А е Μ имеем QAQB = QA grad f, = fx (Α) - U (Q) - Α (Α) < 0, и потому β<=£)(Λί). Далее, QBQC = QC grad /, = /, (С) - /, (Q) = /, (С) > 0. Таким образом, мы нашли такую точку B<=D(M), что QBQO0. В силу определения двойственного конуса это означает, что C&D(D(M)). Итак, если C^Ai,. то C&D(D(M))> т. е. Z)(Z3(Af)) cz Λί. Вместе с доказанным ранее включением Μ cz D (D (Λί)) это и дает соотношение D(D(M)) = M. Теорема 31.3. Пусть Ми ..., Λί* — выпуклые конусы с общей вершиной Q в Еп и пусть Μ — выпуклая оболочка множества Мх\] ... (JMk. Тогда Μ также есть выпуклый конус с вершиной Q, и справедливо соотношение D{M) = D{MX\(\ ... (]D(Mh). (31.2) Доказательство. Утверждение о том, что Λί —выпуклый конус с вершиной Q, очевидно. Докажем соотношение (31.2). Пусть SeD(M,)n ... (\D(Mk). Тогда Bz=D(Mi) для любого / = 1, ..., &, и потому для любой точки Л* <= Λί/ справедливо соотношение QBQAi ^ 0. Следовательно, для любой точки А <= Λί, (J ... U Λί* мы имеем QBQA < 0. Но тогда и для любой точки А^М выполнено соотношение QBQA^O (см. теорему 25.1), и потому B^D(M). Таким образом, D(M{)(] ... (]D(Mk)czD(M). (31.3) Докажем обратное включение. Пусть B^D(M). Тогда для любой точки А е Λί справедливо соотношение QBQA ^ 0. В частности, для любой точки Αι е Λί/ выполнено неравенство QBQAi < 0 (/=1 /г). Но это означает, что 5eZ)(Afj). Так как это включение справедливо для любого / = 1, ..., k9 то fieDiAi^n ·.. fl^(Aifc)· Таким образом, 0(М)сО(Мг)(\ ... n^(Af*). (31.4) Включения (31.3), (31.4) и доказывают равенство (31.2). Следствие 31.4. Пусть Ми ..., Mk —замкнутые выпуклые конусы с общей вершиной Q в Еп. Тогда D (Мх Π ... Π Αί$) есть выпуклая оболочка конусов D{Mx)t ..., D{M^
252 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [32 В самом деле, положим Νι*~0(Μχ)9 ..., Nk = D(Mk) и обозначим через N выпуклую оболочку конусов Ми ..., Ν&. Учитывая теоремы 31.3, 31.2, имеем D(N) = D(NX)[\ ■·■ (\*>Ш- = D(D(M1))n ... η0φ(Λί*))«ΑίιΠ ... ()Mk. Следовательно, /V = D(D(^)) = Z)(Al1n ... П Μ»). Теорема 31.3 и следствие 31.4 показывают, что если ограничиться рассмотрением только зам кну тых выпуклых конусов, то при переходе к двойственным конусам операция пересечения и операция взятия выпуклой оболочки объединения меняются местами, т. е. эти операции двойственны друг другу. 32. Свойство отделимости системы выпуклых конусов. Будем говорить, что система замкнутых выпуклых конусов /(ι, ..., /Cs с общей вершиной Q в Еп обладает свойством отделимости, если их можно так распределить в две подсистемы (каждая из которых содержит хотя бы один конус), что пересечение конусов первой подсистемы отделимо от пересечения конусов второй подсистемы. Прежде чем формулировать условия, при выполнении которых система конусов обладает свойством отделимости, докажем следующее вспомогательное предложение. Лемма 32.1. Пусть Ки ..., Κι-— выпуклые конусы в пространстве Еп с общей вершиной Q. Точка А^Епв том и только в том случае принадлежит выпуклой оболочке К конусов Ки ..., Ки если существуют такие точки Ах ^ Ки -.., Ах е Ки что QA = QAi+ ... +Й· (32.1) Доказательство. Пусть точка А определяется соотношением (32.1), где Аь ..., Αι — точки, принадлежащие соответственно конусам Ки -··■ Ки Обозначим через Ви ..., Bt такие точки, что Й—у<3„ ·... QAi = jQBi· (32.2) Точки В{9 ..., Ви принадлежат соответственно выпуклым конусам Ки ...» Κι (Β СИЛУ определения конуса). Соотношение (32.1) можно согласно (32.2) записать в виде QA = jQBi+ ... +jQBi и потому согласно теореме 25.1 точка А принадлежит выпуклой оболочке множества К\\} ... \]Ки т. §. А&К·
32j § 8. ТЕОРЕМЫ ОБ ОТДЕЛИМОСТИ ВЫПУКЛЫХ КОНУСОВ 253 Обратно, пусть Ле/(. Тогда, по теореме 25.1, QA = λ'οί + ... + XSQCS, (32.3) где λ'>0, ..., λ*>0, λ'+ ... +λ5=1, а все точки Сх Cs принадлежат множеству Κι U ·. · U Kt. Мы можем предполагать нумерацию точек Си ..., Cs выбранной таким образом, что первые qx из этих точек принадлежат множеству Ки следующие q2 точек принадлежат множеству /Сг, · ··, наконец, последние qt точек принадлежат множеству Κι (так что q{ + + q2+ ... +<!i = s): С^К} при ?,+ ...+ ?y < ί <?!+...+ ^ + qJ+l. Будем, кроме того, предполагать, что каждое из целых чисел qu ..., qt положительно; например, если <7ι=0, то мы можем добавить в правой части соотношения (32.3) слагаемое KQC, где С е Кг и λ = 0. Обозначим через Аи ..., Αι точки, определяемые соотношениями 0Л/= Σ VQCi, /=1, ..., /. (32.4) Тогда соотношение (32.3) запишется в виде (32.1), причем из (32.4) непосредственно вытекает в силу теоремы 28.7, что Ах&Ки ···> Аг^Ки Теорема 32.2. Для того чтобы система замкнутых выпуклых конусов Ки ···> Ks с общей вершиной Q в Еп обладала свойством отделимости, необходимо и достаточно существование таких точек A{^D(K\), ..., AS^D(KS), хотя бы одна из которых отлична от точки Q, что. Й+ ... +04 = 0. (32.5) Доказательство. Пусть система замкнутых выпуклых конусов Ки ..., Ks с общей вершиной Q обладает в Еп свойством отделимости. Без ограничения общности можно считать (изменив, если нужно, нумерацию конусов), что отделимы конусы Κι Π . · · Π Κι и /C/+i Π ... Π Ks; где / — некоторое натуральное число, меньшее 5. Иначе говоря, *,П ... n*i<=Plf Кш() ... ПК$аР2, где Pl9 P2 — два замкнутых полупространства, определяемых в Еп некоторой гиперплоскостью Г (проходящей через общую вершину Q конусов Ки ···> Ks)- Пусть η φ 0 — нормальный Вектор гиперплоскости Г, направленный в сторону полупро-
254 ГЛ. Ш. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [32 странства Р2, так что яС?Л<0 для любой точки А^РХ и nQA^O для любой точки А е Р2. Пусть, далее, В — такая точка, что n = QB. Тогда я(?Л<0 для любой точки Л e/Ci П · · · П*С/ (поскольку /<Ί Π · · - Π #/ <=: РО, и потому β е= D (^ П ... Π #/)· Из следствия 31.4 вытекает теперь, что точка В принадлежит выпуклой оболочке конусов 0(К{), ..., D(Ki), и потому (в силу леммы 32.1) n = QB = QA{+ ... +QAh (32.6) где Ai^D(Ki), /=1, ...,"/. Точно так же точка S', определяемая соотношением QB' = — я, принадлежит конусу β (tf/+i Π ... Π Я,), и потому -n = QB'*=QAl+{ + ··· +& (32.7) где Αι ^D(Ki), /==/+1, ..., s. Складывая соотношения (32.6) и (32.7), мы и получаем равенство (32.5). Заметим, что среди векторов QAU ..., QAS заведомо имеются отличные от нуля, так как я φ 0, и потому хотя бы одна из точек Ах% ..., As отлична от Q. Обратно, пусть существуют точки Ах ^D(K\), ..., AS<=D (Ks)> удовлетворяющие соотношению (32.5), причем хотя бы одна из точек Аи ..., As отлична от Q. Пусть для определенности А =т^ Q. Обозначим через Г гиперплоскость, проходящую через точку Q и ортогональную вектору я = QAX Φ 0. Так как Ax^D(K\)y то конус К\ находится в полупространстве Ри состоящем из всех точек А е £"\ для которых nQA ^ 0. Далее, обозначим через А' точку, определяемую соотношением <2Л' = — я = — QAU так что точка Л7 также лежит в полупространстве Р{. Так как <Й' = -Й=0А+ ... +о£, то, по лемме 32.1, точка А* принадлежит выпуклой оболочке конусов D(K2)> ···, D{Ks)y т. е. (в силу следствия 31.4) точка А' принадлежит конусу D (К2 (] ... f] Ks)- Иначе говоря, для любой точки А е К2 Π ... Π Ks справедливо соотношение QA'QA^O, т. е. nQA^O. Таким образом, конус /С2П ·-· П К5 содержится в полупространстве Р2, состоящем из всех точек А^Еп, для которых nQA^O. Итак, K\CiPu К2(] ... П^сгРг, т. е. гиперплоскость Г отделяет конусы К\ и #2 Π · · · Π Κ8> и потому система конусов К\, ...? Д$ обладает свойством отделимости,
32] § 8. ТЕОРЕМЫ ОБ ОТДЕЛИМОСТИ ВЫПУКЛЫХ КОНУСОВ 255 Следствие 32.3. Если ни один из конусов К\, ···» Ks не отделим от пересечения остальных, то система конусов К\> ···» Ks не обладает свойством отделимости, В самом деле, если система конусов К\, ..., Ks (которые, как и прежде, предполагаются замкнутыми, выпуклыми и имеющими общую вершину Q) обладает свойством отделимости, то, по теореме 32.2, найдутся точки A{<=D{K\), ..., 4еВ(Ц которые удовлетворяют соотношению (32.5) и среди которых имеются точки, отличные от Q. Но тогда вторая часть доказательства теоремы 32.2 показывает, что среди конусов Къ · · ·> Ks найдется такой,; который отделим от пересечения остальных. Следствие 32.4. Для того чтобы система замкнутых выпуклых конусов Ки · · ·» Ks с общей вершиной Q в Еп обладала свойством отделимости, необходимо и достаточно, чтобы суще- ствовали такие аффинные функции fu ..., fs на Еп, обращающиеся в нуль в точке Q и не все тождественно равные нулю, что функция fi неположительна на конусе Κι (ί = 1, ..., s) и при этом f,+ ... +f5^0. В самом деле, если эта система конусов обладает свойством отделимости, то в силу теоремы 32.2 существуют такие точки Ai^D(K\)t ·.·, А$^ D(KS), хотя бы одна из которых отлична от точки Q, что выполнено соотношение (32.5). Обо* значим через fu ..., fs аффинные функции на Еп, обращающиеся в нуль в точке Q и имеющие векторы QAU ..., QAS своими градиентами. Соотношение (32.5) означает тогда, что /ι + · · · + fs = 0. Далее, так как At^D (Κι), то ft {A) = = ОЛОЛ;<0 при Ле=/С*. Обратно, если существуют функции fx, ..., fs, удовлетворяющие условиям, указанным в следствии 32.4, то, определив точки Ах, ..., As соотношениями QAi = gradfi, /=1, ..., s, мы найдем, проводя рассуждения в обратном порядке, что точки Аи ..., As удовлетворяют условиям теоремы 32.2, т. е. система конусов Ки ..., К$ обладает свойством отделимости. Теорема 32.5. Для того чтобы система замкнутых выпуклых конусов Κι, ..., Ks с общей вершиной Q не обладала свойством отделимости, необходимо и достаточно выполнение следующих двух условий: 1) <relint/C,)n ··· n(relint/C5)=^0; 2) существуют такие подпространства Lx Ls, в прямую сумму которых распадается пространство Еп (причем, возможно, dimZ^ = 0 для некоторых Ϊ), что при любых i Ф j [i, j — 1, ..., s) Li содержится в подпространстве, параллельном несущей плоскости конуса /Су.
256 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ {32 Доказательство. Допустим, что условия 1) и 2) выполнены, и предположим, вопреки утверждению, что система конусов К\, ..., Ks обладает свойством отделимости. Тогда в силу следствия 32.3 какой-нибудь из этих конусов (скажем, К\) отделим от пересечения остальных, т. е. существует такая проходящая через Q гиперплоскость Г, что К\ с: Рь /(2 О ·.· Π Ks c ^2» где Ри Р2 — замкнутые полупространства, определяемые гиперплоскостью Г. з Пусть А — какая-либо точка множества f] (relint Кд (такая точка существует в силу условия 1)). Тогда А& K\CiPu А <= К2 П · · · Π Ks d Ръ и потому As Рх Π #2 = Г. При ί Φ 1 плоскость Μ;, параллельная Lt и проходящая через точку Д содержится в несущей плоскости конуса Кь а так как Л —внутренняя точка конуса К\ относительно его несущей плбскости, то все достаточно близкие к А точки плоскости Μι принадлежат конусу К\ и," значит, полупространству Рх. Из этого следует, что MiCiY (ί = 2, ..., s). Далее, плоскость Ми параллельная L{ и проходящая через Л, содержится в несущей плоскости каждого из конусов /С2, · · ·» Ks и все достаточно близкие к А точки плоскости Мх принадлежат каждому из конусов /(2, ..., Ks, а значит и их пересечению. Поэтому М{ а Г. Итак, все плоскости Ми ..., Λί5 содержатся в Г. Следовательно, все подпространства Lu ..., Ls (а потому и пространство £"1 = 11ф ... ®LS) содержатся в подпространстве L, параллельном гиперплоскости Г, что невозможно, так как L — гиперплоскость и потому она не может содержать все пространство Еп. Полученное противоречие показывает, что система конусов К\, ..., Ks свойством отделимости не обладает. Обратно, пусть система конусов К\, ..., Ks не обладает свойством отделимости. Покажем, что выполнены условия 1) и 2). Допустим, напротив, что условие 1) не выполнено, и выберем такое натуральное / < s, что (relintΚι)П ... П(relintΚι)¥*0> (32.8) (relint/Ci) П ... П (relint tf,) П (relint Кш) = 0. (32.9) Соотношение (32.8) показывает (в силу теоремы 26.6), что (relint Ц П ... П (relint Κι) = relint (Κι П ..· Π Kt)> и потому соотношение (32.9) переписывается в виде (relint(/d П ... П /C,))fl(relint/C/+I)=0. Из этого в силу теоремы 30.4 следует, что конусы К\ 0 · · · f]Ki и Κι+ι отделимы, а потому подавно отделимы конусы
2) § 8. ТЕОРЕМЫ ОБ ОТДЕЛИМОСТИ БыПУКЛЫХ КОНУСОЁ 257 Κι Л · · · Π Κι и Κι+ι Π · ·. Π Ks- Но это противоречит предположению. Следовательно, условие 1) выполнено·. Докажем, наконец, что выполнено условие 2). Для этого 'проведем индукцию по числу 5 рассматриваемых конусов. Пусть v сначала 5 = 2. Так как, по предположению, конусы К\ и К2 неотделимы, то, по теореме 30.4, эти конусы не лежат в одной гиперплоскости, т. е. подпространства Л и β, параллельные несущим плоскостям конусов К\ и /С2, обладают тем свойством, что А + В = Еп. В силу теоремы 14.13 существует такое подпространство Da В, что A@D = En. Таким образом^ подпространства Ll = Di L2= А являются искомыми, чем случай 5 = 2 полностью рассмотрен. Предположим, что- справедливость условия 2) доказана в случае, когда конусов меньше 5, и рассмотрим 5 конусов Ки ..., Ks (не обладающих свойством отделимости). Без ограничения общности можно считать, что точка Q является началом координат пространства Еп, так что любая плоскость, проходящая через Q, является подпространством соответствующего векторного пространства Еп. Обозначим через П5 несущую плоскость конуса Ks, а через П* — несущую плоскость конуса Κι Π ··· (]Ks-i· Так как конусы К\0 ..· Π Ks-{ и Ks неотделимы, то, по теореме 30.4, Ils и II* не лежат в одной гиперплоскости, т. е. Us + Π* = Еп. Следовательно, по теореме 14.13, найдется такое подпространство /,5с:1Г, что En = lls@Ls. Рассмотрим теперь конусы *ι№ .... tf,-ift*„ (32.10) лежащие в подпространстве П5. Покажем, что эта система замкнутых выпуклых .конусов (с общей вершиной Q) не обладает b пространстве Us свойством отделимости. Допустим, напротив (см. следствие 32.3), что один из конусов (32.10) (скажем, первый) отделим в Us от пересечения остальных, т. е. конус KiOKs отделим в Us от конуса К2{] ... (\Ks-i(\Ks. В силу уже доказанного условия 1) имеем (relint /Ci) П (relint /C2) Π .. · Л (relint Ks) Φ 0, и потому (по теореме 26.6) relint (tfi П 'Ks) *= (relint K{) Л (relint Ks), relint(K2П ··· П*,) —(relint ff2)fl ... П(relint/Q, так что (relint (Ki П Ks)) П (relint (K2 Л ... П Ks)) Φ 0. Следовательно, отделимость конусов Кх Π Ks и К2 Π ... Π Ks в [Js означает (по теореме 30.4), что несущие плоскости конусов К\ Π Ks и К2 Л · * · Л Ks лежат в одной плоскости Г с: llif
г 258 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ [32 имеющей размерность dimns—1. В силу теоремы 26.6 несущая плоскость конуса К\ О К$ совпадает с П{ Π П5, где Г^ — несущая плоскость конуса К\. Таким образом, Г^ПП^сгГ, т. е. IIj η π5 = Г Π Пр Обозначим через IP плоскость наименьшей размерности, содержащую Г и Пь т. е. П°=Г + П1. Тогда dim № Π Г) == dim (U{ Π Π,) > dim Π, + dim Us — /ι, dim Π° = dim Π, + dim Γ — dim (Щ Π Π < <dimJI, +dimr — (dim nt + dimll5 — n) = n — 1, т. е. Г и Πι содержатся в одной плоскости размерности, не большей п—1. Так как K\CiRlt К2О . · · ΠKs 'Ci Г, то это означает отделимость конусов К\ и /С20 ··· f)Ks> чт0> однако, противоречит предположению. Итак, система конусов (32.10) не обладает в Us свойством отделимости. Так как число этих конусов меньше 5, то. по предположению индукции, существуют такие подпространства Lu ..., Ls-U в прямую сумму которых распадается подпространство tlSi что при любых ьф\ (I, /=1, ..., 5—1) Li содержится в несущей плоскости конуса /С/ Π Ks- Непосредственно проверяется, что эти подпространства Lb ..., L^ вместе с построенным ранее подпространством Ls удовлетворяют условию 2), т. е. являются искомыми (напомним, что пространство Еп распадается в прямую сумму подпространств Ls и П5 и потому, по теореме 14.12, пространство Еп распадается в прямую сумму подпространств Lu ..., Ls~u Ls). Сопоставляя доказанную теорему со следствием 32.4, получаем следующее утверждение. Теорема 32.6. Пусть в Еп заданы замкнутые выпуклые конусы К\, ...» Ks с общей вершиной Q, удовлетворяющие условию 2) теоремы 32.5. Для того чтобы пересечение (relint/С,)Π ... iHrelint/Q было пусто, необходимо и достаточно, чтобы существовали такие аффинные функции /ι fs на Еп, обращающиеся в нуль в точке Q и не все тождественно равные нулю, что функция ft неположительна на конусе Ki (* = 1, ·.·, s) и при этом /,+ ... + f,-0. В этой теореме, как и в следствии 32.4, условие неположительности функции ft на конусе Κι, /=1, ..., s, можно заменить условием неотрицательности: достаточно изменить знаки всех функций /,, ..., /,. Теоремы 32.5 и 32.6 особенно упрощаются в случае, если все конусы К\, ..., Ks> кроме, может' быть, одного, являются
32] § 8. ТЕОРЕМЫ ОБ ОТДЕЛИМОСТИ ВЫПУКЛЫХ КОНУСОВ 259 телесными. В этом случае условие 2) теоремы 32.5, как легко видеть, выполняется автоматически. Действительно, пусть конусы Кг, · · ·» %s телесны, а К\ — произвольный конус. Чтобы убедиться, что выполнено условие 2), достаточно за L2 принять подпространство, параллельное несущей плоскости конуса /(,, за Lx—прямое дополнение этого подпространства, аза£3, ..., Ls— тривиальные (нульмерные) подпространства. Заметим еще, что в силу телесности конусов /Сг, ..., Ks условие 1) теоремы 32.5 равносильно условию /Ci П (int /С2) П ··. n(int/Q^=0. (32.11) Таким образом, получаются следующие два предложения. Следствие 32.7. Пусть Ки %2> ···> Ks — замкнутые выпуклые конусы с общей вершиной Q, причем конусы /Сг, ..., Ks — телесные. Для того чтобы система конусов К\, · · ·> Ks не обладала свойством отделимости, необходимо и достаточно выполнение условия (32.11). Следствие 32.8 (теорема Дубовицкого — Милютин а *)). Пусть /Сг, · · · э К8 — замкнутые выпуклые телесные конусы в Еп с общей вершиной Q и К\ с: Еп — плоскость некоторого числа измерений, проходящая через точку Q. Для того чтобы пересечение tfiiUint/Qfl ... fKintJQ (32.12) было пусто, необходимо и достаточно, чтобы существовали на Еп такие аффинные функции fu ..♦, fS9 обращающиеся в нуль в точке Q и не все тождественно равные нулю, что функция f{ тождественно равна нулю на плоскости К\, функция fi неположительна на конусе Ки 1 = 2, ..., 5, и выполнено соотношение /,+ ... +f,-0. (Заметим, что неположительность функции fx на К\ означает тождественное равенство нулю этой функции на /Ci.) Замечание 32.9. Теорема Дубовицкого — Милютина здесь получена, таким образом, как частный случай более общих результатов. В главе IV именно эти общие результаты будут служить основой для получения теорем математического программирования. Однако большая часть этих теорем может быть получена только на основе теоремы Дубовицкого — Милютина, чем объясняется ее популярность. Поэтому, хотя эта теорема не будет у нас служить в дальнейшем инструментом исследования, мы все же приведем здесь непосредственное доказательство теоремы Дубовицкого — Милютина, не опирающееся на более сложную теорему 32.5 и другие результаты этого пункта. *) А. Я. Дубовицкий, А. А. Милютин, Задачи на экстремум при наличии ограничений, Журнал вычислительной математики и математической физики 5, № 3 (1965).
260 ГЛ. III. ЭЛЕМЕНТЫ ТЕОРИИ ВЫПУКЛЫХ МНОЖЕСТВ 132 Прежде' всего установим необходимость, т. е. покажем, что если пересечение (31.12) пусто, то существуют требуемые функции fx fs. Для доказательства проведем индукцию по s. При s = 2 пересечение (32.12) имеет вид Κι Π (int K2) и, так как оно предполагается пустым, то плоскость К\ не пересекается с внутренностью конуса Кг- Следовательно, согласно следствию 30.6 плоскость К\ и конус /С2 отделимы, т. е. существует такая непостоянная аффинная функция / на Епу обращающаяся в нуль в точке Q, которая неотрицательна на /С2 и неположительна на К\- Из того, что f неположительна на Кь вытекает, что она тождественно равна нулю на Κι* Следовательно, полагая fi=f, /2 = — /» получаем требуемые функции flf f2. Таким образом, при s=-2 необходимость сформулированного условия доказана. Предположим, что в случае, когда конусов меньше s, необходимость уже установлена, и рассмотрим s телесных конусов /С2> ···> Ks* для которых пересечение (32.12) пусто. Если пересечение *ιΠ(ωΚ2)η ... П (int Ks-i) (32.13) пусто, то, по предположению индукции, существуют функции fu ..., fs_,f обладающие требуемыми свойствами, и потому, полагая fs ss 0, мы получаем нужные нам функции flf ..., fs. Остается рассмотреть случай, когда пересечение (32.13) непусто. В таком случае согласно теореме 26.6 множество (int/C2)f) ··· Π (int /C«—ι) представляет собой внутренность конуса /С2П ··· f\Ks-\> а множество (32.13) представляет собой внутренность конуса /<Ί Π ^Сг Π ··· C\Ks-\ (относительно его несущей плоскости). Таким образом, конусы ΚΊΠ^Π ··· f\Ks-i и Ks не имеют общих внутренних точек (поскольку пересечение (32.12) пусто) и потому в силу теоремы 30.4 эти конусы отделимы. Иначе говоря, существует непостоянная аффинная функция f, обращающаяся в нуль в точке Q, которая неотрицательна на Ks и неположительна на конусе Κι(]Κ2(] ·.· t)Ks-i- Определим точку В соотношением Q£ = gradf. Тогда согласно теореме 31.1 точка В принадлежит конусу О (/Ci Π Α^2 Π ··· DKs-i), т. е. в силу следствия 31.4 точка В принадлежит выпуклой оболочке конусов D(Ki), D(K2)> -.. ..., D(Ks-i)- Отсюда вытекает (согласно лемме 32.1), что существуют точки CX^D (Кг), C2€=D (K2) C,-i € D {Ks-ύ, удовлетворяющие соотношению QB = QC\+ ... +QCs-i. Определим теперь аффинные функции ft ..., fs-i на Еп, положив Л(Л)«0Л0Сь /— 1 s— 1- (32.14) Ясно, что все эти функции обращаются в нуль в точке Q и удовлетворяют соотношению ft(A)+ ... +f,-i(4)-Q2(QC,+ ... +QC,-!)- - QA QB = 0Л grad f = f (Л) - f (Q) = f (Л), fi+ ... +f,-i-f. (32.15) Далее, так как Ci^D(Ki) при ί = 2, ..., s— 1, то для любой точки А конуса Κι выполнено соотношение QA QC^O, и потому в силу (32.14) функция fi неположительна на конусе Ki. Аналогично, функция f 1 неположительна на плоскости Κι и потому тождественно равна нулю на Κι- Таким образом, полагая fs = — ft получаем (в силу (32.15)) требуемые функции flt ..., fs_b fs
32] § 8 ТЕОРЕМЫ ОБ ОТДЕЛИМОСТИ ВЫПУКЛЫХ КОНУСОВ 261 (заметим, что не все функции тождественно равны нулю, так как, например, функция f5 = — f непостоянна). Проведенная индукция доказывает необходимость сформулированного в теореме условия. Докажем достаточность, т. е. покажем, что в случае существования указанных в теореме функций fi fs пересечение (32.12) пусто. Допустим, наоборот, что пересечение (32.12) непусто и А — некоторая точка, принадлежащая этому пересечению. Поскольку А е Кь то fx (А) = 0. Так как, далее, А <= int Κι <= Ки то //(Л)<0 для любого / = 2, ..., s. Из< соотношения fi + . · · + is = 0 вытекает поэтому, что ЫЛ)= =ЫЛ) = 0. Так как f* < 0 на множестве /С/, то функция ft, рассматриваемая на Кь достигает максимума во внутренней точке А е int Ki тела Κι- Поэтому согласно следствию 29.3 функция U постоянна, т. е. fi = 0, / = 2, ..., s. Но тогда из равенства f\+ . · · + fs — 0 вытекает, что и fi s 0ν τ. е. все функции fi,...,/s тождественно равны нулю. Это, Однако, противоречит условиям, наложенным на эти функции в теореме. Полученное противоречие показывает, что пересечение (32.12) пусто.
ГЛАВА IV ЭКСТРЕМУМЫ ФУНКЦИЙ § 9. Теоремы существования 33. Касательное отображение. Пусть Μ — некоторое множество евклидова пространства £rt и Q- фиксированная точка множества Λί. Пусть, далее, g: Μ ->£"* — вектор-функция, заданная на множестве Λί, τ. е. отображение, ставящее в соответствие каждой точке А е Μ некоторый вектору (Л) евклидова пространства Ет. Условимся писать g{A) — oQ{A), если g(Q) = 0 и lim l8J^)l =0. (33.1 X А&М \QA\ A->Q 1Ч ' Иначе говоря, запись g{A) = oQ{A) означает следующее: для любого ε > 0 найдется такое число δ > 0, что при А е Μ и | QA |< δ справедливо соотношение | g (А) | ^ ε| QA |. Если Еп — арифметическое пространство и Q = (0, 0, ..., 0), то вместо Oq(A) обычно применяется обозначение о (А). Мы будем пользоваться символом oQ(A) как типическим обозначением: разные вектор-функции будут обозначаться одним и тем же символом oQ (А) — если, конечно, они обладают указанным выше свойством. При таком соглашении можно написать oQ(A) + oQ{A) = oQ(A)9 т. е. если/: M->Emu g: Μ-*Ет — две вектор-функции, каждая из которых имеет вид oQ(A), то вектор-функция f + g (определенная равенством (/ + g) (A) = f(A) + g (А)) также есть oQ (A). Аналогично, если λ (Л)— действительная непрерывная функция, заданная на множестве Μ (клц функция, ограниченная в некоторой окрестности точки Q), то λ (А) · oQ(A) = oQ(A). Заметим, что хотя определение символа oQ(A) было дано в евклидовом пространстве (так как в формуле (33.1) исполь-
33] § 9 fEOPEMbl СУЩЕСТВОВАНИЯ 2бЗ зуются длины векторов), само это определение носит аффинный характер *). Более точно, если в одном и том же аффинном пространстве двумя разными способами введено скалярное произведение, превращающее его в два (разных) евклидовых пространства Е\9 Е", то вектор-функция g(A), имеющая вид oQ(A) в одном из этих пространств, имеет вид oQ(A) и в другом пространстве. В самом деле, тождественное отображение £?->££ (т. е. отображение, переводящее точку А рассматриваемого аффинного пространства в ту же самую точку), очевидно, аффинно. Следовательно, в силу теоремы 21.7, | QA |, < М\ QA |2, где | QA \х означает длину вектора QA в метрике пространства £?, а | QA fe означает длину того же вектора в Е$. Но тогда l*WI <м \gJA)\ t \QA\2 ^ \QA\X откуда и вытекает, что справедливость соотношения (33.1) в метрике пространства £f влечет за собой справедливость этого соотношения в метрике пространства Е%. Аналогично устанавливается, что справедливость соотношения (33.1) не зависит от выбора метрики в £т. Иными словами, если Еп и Ет — аффинные пространства', то для любой вектор- функции g: М->Ет (где Μ а Еп) имеет смысл говорить, является или нет g(A) величиной oQ(A), где Q —заданная точка множества Μ (т. е. справедливо ли соотношение (33.1) при каком-то, а значит, и при любом введении евклидовых метрик в пространствах Еп, Ет). В соответствии со сказанным все факты, излагаемые в этом пункте, носят аффинный характер. Определение 33.1. Пусть Λί — некоторое множество евклидова пространства Еп и Q — фиксированная точка множества Λί. Пусть, далее, φ: Μ -> Ет — некоторое отображение множества Μ в евклидово пространство Ет. Пусть, наконец, / — аффинное отображение пространства Еп в Ет. Будем говорить, что отображение φ имеет / своим касательным аффинным отображением в точке Q, если (при А е М) имеет место соотношение Ф(Л) = /(Л) + од(Л). (33.2) Отметим один частный случай этого определения, важный Для дальнейшего. Пусть Μ — некоторый выпуклый конус в про- *) Об аффинных пространствах и аффинных отображениях см. стр. 133
264 ГЛ. IV. ЭКСТРЕМУМЬ! ФУНКЦИЙ (33 странстве ,£"\ имеющий вершину Q. Пусть, далее, φ — отображение (в пространство Ет), заданное на всем конусе Μ или лишь вблизи вершины этого конуса (т. е. в точках Л, удовлетворяющих условиям А е. Λί, | QA | < А, где h — некоторое заданное положительное число). В этом случае можно говорить о касательном аффинном отображении f для отображения φ в точке Q (если выполняется соотношение (33.2)). В общем случае отображение φ: М-^Ет может не иметь в точке Q е Μ касательного аффинного отображения. Отображение φ может иметь и не единственное касательное аффинное отображение. Однако, как показывает.следующая теорема, в том случае, когда множество Μ является вблизи точки Q «достаточно телесным», касательное аффинное отображение, если оно существует, единственно. Теорема 33.2. Если существует n-мерный симплекс с одной из вершин в точке Q, содержащийся в множестве Μ а Еп, то для отображения φ: M-+Em касательное аффинное отображение в точке Q (если оно существует) единственно,- Доказательство. Допустим, что φ имеет два касательных аффинных отображения fu f2 в точке Q. Иначе говоря, (f(A)^fl(A) + oQ(A)i <p(A) = f2(A) + oQ(A)9 A<=My где fu f2 — аффинные отображения пространства Еп в Ет. Тогда при А&М fi(A) = f2(A) + oQ(A). (33.3) Пусть [Q, Αϊ9 ..., Ап] — содержащийся в Μ симплекс размерности п. Соотношение (33.3) справедливо, в частности, на этом симплексе. Положим Βι = Q + XQAi9 i = 1, ..., п. При достаточно малом λ>0 точка Bt расположена как угодно близко к Q и принадлежит рассматриваемому симплексу. Следовательно, взяв произвольное ε > 0, можно подобрать такое λ > 0, что (в силу (33.3)) справедливо соотношение lf,(B,)-f2(^i)l<e|QS,|. (33.4) Но в силу аффинности отображений fx и f2 fi Ш = f, ((1 - λ) Q + λΛ) = (1 - λ) f, (Q) + Xf{ (Λ), f2 (Bt) = h ((1 - λ) Q + λΛ) = (1 - λ) h (Q) + λ/2 W, и потому ii(Bi)-f2(Bi) = X(fl(Ai)-f2(Al)).
33] § 9. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 265 Далее, | QBt \ = \ XQAi | = λ| QA{ |; Из соотношения (33.4) находим теперь \fi(Ai)-f2(Ai)\<8\QAi\. Так как это неравенство справедливо для любого ε > 0, то 1МА)-ЫЛ-)1 = 0, т. е. f,(i4|)=f2(i4,) (/=1, ..., η). Кроме того, fi(Q) = f2(Q) (ибо при Л = <3 величина oQ(A) в (33.3) обращается в нуль согласно (33.1)). Таким образом, аффинные отображения f{ и /2 совпадают во всех вершинах симплекса [Q, Аи ..., Ап\, а потому в силу теоремы 19.9 отображения fx и f2 совпадают. Следствие 33.3. Пусть Q — внутренняя точка множества Μ а Еп; тогда для отображения φ: Μ-+Εη касательное аффинное отображение в точке Q (если оно существует) единственно. Следствие 33.4. Пусть Μ — телесный выпуклый конус с вершиной Q в Еп и пусть φ — отображение (в пространство Ет), заданное на всем конусе Μ или лишь вблизи его вершины. Тогда для отображения φ касательное аффинное отображение в точке Q (если оно существует) единственно. Теорема 33.5. Пусть MczEn, NczEm и пусть φ: Af->£m, ψ: Ы-+Ер — такие отображения, что <p(Ai)czJV. Пусть, далее, отображение φ имеет в точке Q e M касательное аффинное отображение f: En->Em, а отображение ψ: Ν ->ΕΡ имеет в точке Q' = Φ (Q) касательное аффинное отображение g: Em ->£р. Тогда h = g°f является для отображения I = ψ о ф: М->ЕР касательным аффинным отображением в точке Q. Доказательство. Мы имеем V(A) = f(A) + oQ(A), Ле=М, q(B) = g(B) + oQ>(B), Be=N, и потому I (А) = ψ (φ (Α)) = g (φ (Α)) + oQ> (φ (Α)) = ~g(f(A) + oQ(A)) + oQ>(f(A) + oQ(A)). Так как | f (A) - Q'1 = | f (Л) - f (Q) |< Af | Q4 | (см. теорему 21.7), то oQ'(f(A) + oQ(A)) = oQ(A). Далее, в силу аффинности отображения g имеем g(f(A) + oQ(A)) = g(f(A)) + oQ(A). Следовательно, l(A) = g(f(A)) + oQ(A)?=h(A) + oQ(A). Рассмотрим касательное отображение в случае, когда пространство Ет (область значений) представляет собой числовую ось (т. е. т = \). В этом случае отображение φ: Μ->Ει представляет собой действительную функцию на множестве М.
266 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ 133 Будем при этом предполагать, что множество Μ аЕп открыто (в частности, оно может совпадать со всем пространством Еп). Согласно общему определению 33.1 аффинная функция f, заданная на Еп9 называется касательной к функции φ в точке Q е Λί, если имеет место соотношение (33.2). В силу следствия 33.3 касательная аффинная функция / в точке Q (если она существует) единственна. Градиент gradf этой касательной функции называется также градиентом функции φ в точке Q и обозначается через grad φ (Q). В силу (33.2) и (33.1) имеем (p(Q) = /(Q). Кроме того, согласно формуле (21.5) f(A) = f(Q) + QAgraaf = cp(Q) + QA§rad<v(Q). Таким образом, соотношение (33.2) принимает вид φ (Α) = φ (Q) + QA grad φ (Q) + oQ (A). (33.5) Мы видим, что если функция φ имеет в точке Q касательную аффинную функцию, то существует такой вектор η (а именно, η = grad φ (Q)), что φ (Α) = φ (Q) + nQA + oQ(A). (33.6) Обратно, если функция φ имеет вид (33.6), то аффинная функция f(A) = <p(Q) + nQA является, очевидно, касательной к ней в точке Q и при этом /i = grad/: = grad(p(Q). Итак, справедлива следующая Теорема 33.6. Пусть φ — действительная функция, заданная на открытом множестве Μ cz En. Функция φ в том и только в том случае имеет в точке Q ^ Μ касательную аффинную функцию, если φ имеет вид (33.6). Вектор η однозначно определяется функцией φ и точкой Q и обозначается через grad φ (Q). Отметим еще координатную запись этой теоремы. Введем в Еп ортонормированную систему координат х\ ..., хп, так что φ(Α) = φ(χ\ ..., хп) будет функцией η переменных. Далее, положим Q = (xl ..., χζ), Α = {χ\ ..., хп) и условимся также точку Q обозначать через х0, а точку Л —через х. Координаты вектора η = grad φ (Q) = grad φ (χ0) принято обозначать через ^*г°' , ..., у*0* ; erad,W-{i^L *Li£oL}. (зз:7)
331 § 9 ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 267 В этих обозначениях формула (33.6) принимает вид φ (х) = Ψ (*о) + (х — *о) grad φ (χ0) + оХо (х) = η = Ф(*о) + Σ "^гЧ*' ~ *$) + ° (* ~ *„), (33.8) т. е. превращается в хорошо известную формулу математического анализа. Замечание 33.7. Как и предыдущие факты, сротноше- ние (33.5) носит аффинный характер. При этом следует помнить, что вектор gradcp(Q) (т. е. градиент аффинной функции /, касательной к φ в точке Q) принадлежит не самому пространству £"\ а сопряженному пространству (или, как говорят, является ковариантным вектором). В отношении формулы (33.5) это означает, что скалярное произведение следует понимать в смысле п. 15. Если же пространство Еп — евклидово, а не аффинное, то сопряженное векторное пространство отождествляется с Еп (см. конец п. 16), и скалярное произведение в формуле (33.5) превращается в обычное скалярное произведение, имеющееся в евклидовом пространстве Еп. Формула (33.8) также сохраняет смысл для аффинного пространства Еп (в частности, в случае евклидова пространства она имеет смысл для любой, не обязательно ортонормированной, системы координат); при этом координатная запись (33.7) вектора grad<p(*) относится не к системе координат, (х\ ..., хп) в Еп, а к системе координат сопряженного пространства, связанной с системой координат (х19 ..., хп), как указано в теореме 15.12. Определение 33.8. Пусть Μ — открытое множество пространства Еп. Действительная функция φ, заданная на Λί, называется гладкой, если в каждой точке 4еуИ существует вектор gradcp(;4) и этот вектор непрерывно зависит от Л, т. е., в координатной записи, частные производные -Д-, /— 1, ..., п, существуют и непрерывны на множестве М. Определение 33.9. Пусть φ —гладкая (действительная) функция, заданная на открытом множестве Μ пространства Еп. Множество S всех точек А е Μ, удовлетворяющих соотношению ф(Л) = 0, будем называть гладкой гиперповерхностью в Еп, если вектор gradcp(i4) отличен от нуля в каждой точке ^4eS. Соотношение ср(Л) = 0 называется уравнением этой гиперповерхности. В координатах уравнение гиперповерхности записывается следующим образом: φ{χ\ ..., хп) = 0; (33.9)
268 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [ 33 здесь φ (л:1, ..., хп) — координатная запись гладкой функции, определенной в некотором открытом множестве пространства Еп. При /г = 2 уравнение (33.9) принимает вид φ(*ι, *2) = 0, и понятие гладкой гиперповерхности сводится в этом случае к понятию гладкой линии (на плоскости переменных х\ х2). При я = 3 уравнение (33.9) принимает вид φ(χ\ х\ *з) = 0, и понятие гладкой гиперповерхности сводится в этом случае к понятию гладкой поверхности (в пространстве переменных х\ х2, хг). Пусть Q — произвольная точка гладкой гиперповерхности S, определяемой уравнением φ (А) = 0. Вектор grad φ (Q) (или любой вектор λ grad φ (Q), где λ φ 0) называется нормальным век- тором (или просто нормалью) гиперповерхности S в точке Q. Гиперплоскость, проходящая через точку Q и имеющая вектор grad φ (Q) своим нормальным вектором, называется касательной гиперплоскостью гиперповерхности S в точке Q. Определение 33.10. Пусть Su 52, ..., Sk — гладкие гиперповерхности, заданные в пространстве Еп соответственно уравнениями Φι (А) = 0, φ2 (А) = 0, .,., φ, (А) = 0, (33.10) где каждая из функций <р1э ... <pk определена в некотором открытом- множестве пространстба Еп. Пересечение Ρ всех этих гиперповерхностей (т. е. множество всех точек А е Еп, удовлетворяющих одновременно всем уравнением (33.10)) называется (п — &)-мерным гладким многообразием в Еп, если выполнено следующее условие: в каждой точке А <= Ρ векторы grad <Р! (Л), grad <р2 (Л), ..., grad φ* (Л) линейно независимы. Таким образом, по определению, г-мерное гладкое многообразие в Еп задается системой η -— г уравнений *). *) Строго говоря, данное определение гладкого многообразия является слишком узким по сравнению с общепринятым. Общее определение утверждает, что гладкое многообразие вблизи каждой своей точки (или, как говорят, локально) удовлетворяет системе уравнений вида (33.10). Описание же всего многообразия в целом уравнениями (33.10) может оказаться невозможным. Однако эти тонкости (детальное разъяснение которых может быть дано лишь в рамках топологии) мы оставим в стороне, ограничиваясь, таким образом, рассмотрением лишь тех многообразий, которые можно задать уравнениями (33.10). Заметим, впрочем, что все дальнейшие рассуждения, в которых будут участвовать гладкие многообразия, будут, по существу, локальными, т. е. в действительности они применимы к любым гладким многообразиям.
33] § 9 ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 269 В частности, (п — 1)-мерное многообразие задается одним уравнением. Таким образом, (п — 1)-мерные многообразия пространства Еп совпадают с гиперповерхностями. Одномерные многообразия называются также линиями. Заметим еще, что условие линейной независимости векторов gradq?, (Л), ..., grad(pfc(i4) равносильно (в координатной записи) требованию* чтобы ранг функциональной матрицы ду(А) дх ( 0<Ρι(Λ) 1 дх1 θφ2(Α) дх1 d<pk(A) *Ρι (Α) дх2 дщ (А) дх2 афлМ)_ аФ,(А) дхп ду2 (А) дхп дчьМ дх1 дх2 дхг11 был максимальным (т. е. равен k). * Из сказанного вытекает, что если функции Φι (Л), ..., ф&(Л) обращаются в нуль в точке (Зинезависимыв этой точке, т. е. векторы grac^(Q), ..., grac^(Q) линейно независимы, то система уравнений (33.10) определяет (п — &)-мерное многообразие в некоторой окрестности точки Q. В самом деле, так как указан- d(p(Q) ные векторы линейно независимы, то матрица ^ имеет ранг k, т. е. некоторый определитель &-го порядка, составленный из столбцов этой матрицы, отличен от нуля. Этот определитель непрерывно зависит от А и, следовательно, он отличен от нуля в некоторой окрестности точки Q. Таким обра- 0Ф(Л) дх имеет зом, в некоторой окрестности точки Q матрица максимальный ранг k> т. е. векторы grac^i(i4), ..., grac^04) линейно независимы. Определение 33.11. Пусть Р—-гладкое (л — &)-мерное многообразие, определенное в пространстве Еп уравнениями (33.10), и Q —некоторая его точка. Обозначим через L{ касательную гиперплоскость гиперповерхности ф^(Л) = 0 в точке Q (/=1, ..., k). Пересечение гиперплоскостей Lu ..., Lk представляет собой (п — &)-мерную плоскость в Еп (так как нормальные векторы grac^t·(Q), /= 1 k, этих гиперплоскостей линейно независимы). Эта (п — &)-мерная плоскость называется касательной плоскостью многообразия Ρ в точке Q. Каждый вектор а, параллельный этой касательной плоскости, называется касательным вектором многообразия Ρ в точке Q. Теорема 33.12. Пусть Р{ и Р2 — гладкие многообразия в Еп, имеющие общую точку Q, и пусть Lu L2 —касательные плоскости многообразий P{i Р2 в точке Q. Если Ц и L2 не лежат в одной гиперплоскости пространства Е", то пересечение Р{ Л Ръ
270 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [33 представляет собой вблизи точки Q гладкое многообразие, имеющее в точке Q касательную плоскость Lif)^· Доказательство. Пусть Р{ задается (вблизи точки Q) уравнениями φ} (Л)=0, ..., φ^ (Л)=0, причем векторы grad φ^ (Q), /=1, ..., k, линейно независимы, а многообразие Р2 задается уравнениями ${ (Л)=0, ..., ifr (Л)=0, причем векторы grad ψ/ (Q), /=1, ..., I, также линейно независимы. Тогда L.-Lfn·..^. /^-^П.-.П^. -(О где/,\ — гиперплоскость, проходящая через точку Q и имеющая grad q>i (Q) своим нормальным вектором, a L2;)—гиперплоскость, проходящая через точку Q и имеющая grad ψ/ (Q) своим нормальным вектором. Допустим, что векторы grad ф1(<2), ..., grad cpfe(Q), grad ψ, (Q), ..., grad ψ, (Q) (33.11) линейно зависимы. Тогда выполняется соотношение aigrad(p,(Q)+ ... + ak grad q^ (Q) = = βι grad ψ, (Q) + ... + ft grad ψ, (Q), где хотя бы один из, коэффициентов <хь ..., <xfe отличен от нуля, и потому вектор α — α{ grad φ, (Q) + ··· + <^ grad φΛ (Q) отличен от нуля. Этот вектор ортогонален плоскости L1} а так как α = β! grad 'Φι (Q) Ч- ... + β/ grad ψ/ (Q), то он ортогонален и плоскости L2. Но тогда гиперплоскость, проходящая через точку Q. и ортогональная вектору а, содержит обе плоскости Lu L2, что противоречит предположению теоремы. Таким образом, векторы (33.11) линейно независимы. Из этого факта следует, что уравнения φ{ (А)= ... = ф^(Л)= == -ф! (Л) == ... = ф/ (Л) == 0 определяют в окрестности точки Q гладкое многообразие. Очевидно, что это многообразие совпадает (вблизи Q) с пересечением ^П^г» а его касательная плоскость в точке Q совпадает с ii,,n...nM*)nU,,n...nU,)=i.in^. Теорема 33.13. Пусть Ρ — гладкое (п — kyмерное многообразие, определенное в пространстве Еп уравнениями (33.10), м Q-некоторая его точка. Пусть, далее, L — касательная плоскость многообразия Ρ в точке Q, а М — дополнительная к L плоскость {k-мерная) в пространстве Еп. Обозначим через π проектирование пространства Еп на плоскость L* параллельно плоскости Λί. Тогда существует такой шар Σ с центром в точке Q, что часть многообразия Р, заключенная внутри шара Σ, взаимно однозначно отображается при проектировании π на некоторую
33] $ 9. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 271 окрестность точки Q в плоскости L (рис. 112). При этом справедливо соотношение π(Α) = Α + θς(Α), ЛеЯ. (33.12) Доказательство. Пусть векторы еи ..., ek образуют базис плоскости Λί, а векторы ek+u ..., еп — базис плоскости L. Тогда еь ..., еп — базис всего пространства Еп. Рассмотрим в Еп систему координат (Q; еь ..., еп). Далее, введем в евклидовом пространстве Еп новое скалярное произведение, положив аЬ = х1у1+ ... + хпуп для любых векторов а = х{е{ + ... +хпеп, - , . . Λ Рис. 112. (ср. пример 16.3). При таком введении скалярного произведения (вместо первоначального) пространство Еп превращается в новое евклидово пространство, которое мы обозначим через £?. Нам достаточно доказать теорему, рассматривая пространство Е", поскольку все факты, указанные в формулировке теоремы, носят аффинный характер и от выбора того или иного скалярного произведения не зависят. В пространстве £? система координат (Q; еи ..., е„) будет ортонормированной; в этой системе координат мы и будем вести рассуждения. , Обозначим через Lt касательную гиперплоскость гиперповерхности (pi(A) = 0 в точке Q (/=1, ..., 6), так что L = ==Li(] ... ()Lk. Мы можем написать grad φ*(Q) = а{ + Ьи /=1, ..., k, где вектор αι параллелен плоскости L, а вектор bi параллелен плоскости Λί. Легко видеть, что векторы &j, ..., bk линейно независимы. Действительно, если выполнено соотношение βι»ι+ ..· + βΑ = 0, то вектор βι δΓαάφ! (Q)+ ... + fagraa<pk(Q) = ?>{al + ... +βΛαΛ параллелен плоскости L (как линейная комбинация векторов аи ..., ak) и ортогонален плоскости L (как линейная комбинация векторов grad φ* (Q), /= 1, ..., k). Следовательно, ftgrad<p,(Q) + ... + P*grad(p*(Q) = 0?
272 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [33 и потому (в силу линейной независимости векторов grad (pt-(Q), i=l, ..., k) получаем $х = ... = β^ = 0. Заметим теперь, что из равенства Α ίΓΛ дЪ (Q) I дЬ (Q) grad(pt(Q) = —^— ег+ ... + ■ дхп еп вытекает соотношение аФ< (Q) ^ , аФ< (Q) bi = ———в! + ... i Т1~еь> * = 1» ···> *· (3d.Id) Линейная независимость векторов (33.13) означает, что определитель дь (Q) det drf (33.14) ϋ, /=ι k отличен от нуля, т. е. в матрице (dq>{(Q)/dxf) отличен от нуля определитель, составленный из k первых столбцов. Из теоремы о неявных функциях следует, что систему (33.10), или, в координатной форме, систему Ф,(Д .,., хп) = 09 .... <pk(x\ ..,, хп) = 0 (33.15) можно в некоторой окрестности точки Q = (х^, ..., ^разрешить относительно неизвестных х\ ..., xk (заметим, что каждая из функций фь ..., фи имеет своей областью определения открытое множество, и потому эти функции определены в некоторой окрестности точки Q). Это означает, что можно выписать соотношения χ< = ψ<(χ*+ι, ..., х% /=1, ..., k9 (33.16) которые вблизи точки Q эквивалентны системе уравнений (33.15). Более точно, функции «ψ* являются гладкими и существует та^ кой шар Σ с центром Q, что всякая точка шара Σ, удовлетворяющая системе (33.15), удовлетворяет также системе соотношений (33.16), и наоборот. Покажем, что каждая плоскость, параллельная М^ пересекает часть многообразия Р, лежащую в шаре Σ, не более чем в одной точке. Действительно, пусть А = (х\ ..., хп) и Д,= = (х\ ..., я")— такие точки, что Α,-Α ^Ρ(]Σ и при этом обе точки Д Д лежат в одной плоскости, параллельной Λί, τ. е. вектор ЛЛ# параллелен плоскости М. Включения Д A#<=Pf)2 означают, что точка А удовлетворяет соотношениям (33.16), а точка Д — аналогичным соотношениям χ< = ψ*^*+ι, ..., хпу i=\} ttt} k. (33.17)
33] § 9 ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 273 Далее, так как вектор АА = ί*1 — χ1 Л .., хп — хп\ параллелен плоскости М9 то sro координаты с ' номерами k+ U ..., η обращаются в нуль, т. е. yk+l у& + 1 ytl ytt Л/ " Л/ , · * · , Л/ —— j\, л * * Но тогда в силу (33.16), (33.17) справедливы соотношения у\ ■■ и. γΐ γΚ ■■ и. γΚ Λι ~^~ Л/ , . . . , Αι ~^~ >ν , * * т. е. точки А и Л# совпадают. Итак, множество Ρ(\Σ взаимно однозначно проектируется на свой/образ η(Ρ(]Σ). Заметим теперь, что точка Q = (0, 0, ..., 0) п|£инадлежит множеству Ρ()Σ, и потому в силу (33.16) ψ'(0, 01 ..., 0) = 0, / = 1, ..., k. (33.18) Следовательно, в силу непрерывности функций ψ*, если числа xk+l9 ..., хп достаточно близки к нулю, то и величины (33.16) также будут близки к нулю. Из этого вытекает, что если точка β = (0, ,.., 0, xkJr\ ..., хп) плоскости L достаточно близка к точке Q, то точка А = {х\ ..., xk, xk+\ ..., xn)t определяемая соотношениями (33.16), также достаточно близка к Q и потому принадлежит множеству Ρ()Σ. Ясно также, что эта точка А удовлетворяет соотношению В — п(А). Таким образом, все достаточно близкие к Q точки плоскости L содержатся в множестве η(Ρ(]Σ)9 τ. е. это множество является окрестностью точки Q в плоскооти L. Остается доказать справедливость формулы (33.12). Пусть А — произвольная точка многообразия Я. Мы имеем . Ф/ (А) = Ф| (Q) + QA grad φ, (Q) + oQ (Л), а так как ф/(Л) = 0, q>t(Q) = 0 (поскольку ЛеР, QeP), то Q^grad φ, (Q) = oQ (Л), /=1, ..., k, Ле=Р. Так как, далее, точкай = я(Л) принадлежит плоскости L, то вектор QB параллелен L, и потому QBgrad φ* (Q) = 0. Таким образом, АВ grad φ, (Q) = (Й-Й grad φ, (Q) = oQ (Λ). (33.19) Заметим теперь, что плоскость Μ является ортогональным Дополнением плоскости L (поскольку рассуждения ведутся
274 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [33 в пространстве £?)· Векторы grad φ{ (Q), ..., grad φ^ (Q) ортогональны плоскости L, т. е. параллельны Λί. Следовательно, поскольку эти векторы линейно независимы, они образуют базис плоскости Λί. Поэтому е* = an grad <pj (Q) + ... + α** grad φΛ (Q), /=1, ..., fc, где а^у — некоторые числа. Сопоставляя последнее равенство с соотношением (33.19), находим eiAB = oQ(A)9 /=1, ..., k. (33.20) Пусть, наконец, АВ = х1(А)е{ + ... +хк(А)ек — запись вектора АВ в виде линейной комбинации векторов базиса (заметим, что вектор АВ ортогонален плоскости L). Обозначим через ξ (А) наибольшее из чисел | х1 (А) |, ..., | xk {А) |. Так как xi(A) = eiAB (поскольку базис еи ..., еп — ортонор- мированный), то в силу (33.20) х1 (А) == oQ (Л), / = 1 &, а потому ^(Л)==Од(Л). С другой стороны, I АВ 1= Υ(χΐ{Α)Υ+ ... +(^И))2<|//г(|(Л))2= /л · ^Л), и потому |ЛВ( = Од(Л), или, что то же самое, AB = oQ(A). Вспоминая, что В = я(Л), мы получаем формулу (33.12). Теорема 33.14. Пусть Ρ — гладкое (п — 1г)-мерное многообразие β пространстве Еп^и Q — некоторая его точка. Тогда в окрестности точки Q можно на многообразии Ρ ввести локальные координаты |ι ξΛ~~*. Это означает следующее. Любой системе чисел ξ1, ..., ξΛ~*, удовлетворяющих условию Ι ξ* | < δ, / = 1, ..., η — k, ставится в соответствие на многообразии Ρ точка Л (ξ1, ..., ln~k)9 причем любая точка А^Р, достаточно близкая к Q, однозначно записывается в виде А = = Л(|1, ..., ζη~ ). Далее, имеет место соотношение А(1\ ..., 6ll~*)-Q + 61ai+ ... +6я-Ч|-* + о(й, (33.21) где аи ..., an-k — линейно независимые векторы в Еп> α ξ = = [l\ ..., ln~k) — вектор (п — к)-мерного арифметического пространства. Наконец, все векторы ах> ..., an-k являются касательными векторами многообразия Ρ в точке Q и любой касательный вектор многообразия Ρ в точке Q линейно выражается через векторы аи ..., α4_Λ.
33] § 9 ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 275 Доказательство. Продолжим рассуждения, проведенные при доказательстве теоремы 33.13'(сохраняя те же обозначение). Положим Л(|', ..., rWfe1 ln~k)ex+ ... ... + Ψ* (l\ · · ·> ^*)β* + 6Vi + · · · + Г"Ч, т. е. обозначим ерез A(l\ ..., ln *) точку, имеющую в системе (Q; е,, ..., *Л) ч координаты 1 ,1^1 <,n~k\ ^=♦15 Ε λ ^=♦15 5 λ r* + l _*1 (33.22) *Λ = Γ~*, hi «ih* где ψ1, ..., ψ — функции, стоящие в правых частях соотношений (33.16). Точка A(l\ ..., ln"k) определена для всех достаточно малых по абсолютной величине значений ξ1, ..., ξΛ~*, т. е. существует такое δ > 0, что любой системе чисел ξ1, ..., £rt""*, удовлетворяющих условию | ξ* |< δ, i = 1, ..., η — k, ставится в соответствие некоторая точка л(|\ ..., ln~k). Из (33.22) непосредственно вытекает, что координаты х\ ..., хп этой точки удовлетворяют соотношениям (33.16), и потому А(11 ln~k)<=P. При этом координаты х1 хп любой достаточно близкой к Q точки A gP удовлетворяют соотношениям (33.16), и потому существует (очевидно, однозначно определенная) система чисел ξ1, ..., ln~~k, удовлетворяющая соотношениям (33.22). Иначе говоря, любая точка А^Р, достаточно близкая к Q, однозначно записывается в виде Л=л(|\ ..., |Л~*). Далее, так как координаты хЛ+1, ..., хп точки Л (ξ1, ..., ξη""*) равны соответственно ξ1, ..., %n~k (см. (33.22)), то пА{1\ ..., !"-*) = Q + I4+1+ ... +Г"Ч, и потому, в силу (33.12), справедливо соотношение Л (&>, ..., t~k) - Q + ?ew + . · · + Г"Ч + oQ(A (ξ1, ..., ξ11"*)). •Из этого соотношения видно, что (33.23) IW+.+ ... +Γ-4=<3Λ(ξ' f~k) + oQ (Л (V tn-k)). и потому oQ(A(V Γ"*))-=ο(Ι'·*+ι+ ··■ +Г-Ч). Так как, наконец, длина вектора l'efe+1 + ... + l"-fee„ равна ^(V)2 + ·. · + (|п-*)2, т. е. равна длине вектора ξ = β1, ..., ξ"-*},
276 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [33 го о (llek+l + ... + ln еп) = о (ξ), и -формула (33.23) принимает вид Таким образом, справедливо соотношение (33.21), где αϊ = «*+!, ..., an-k = en. (33.24) Из (33.24) видно также, что все векторы а,, ..., an-k являются касательными, векторами многообразия Ρ в точке Q и любой касательный вектор многообразия Ρ в точке Q линейно выражается через векторы аи ..., an-k (поскольку векторы ek+u ..., еп составляют базис касательной плоскости L, проведенной к многообразию Ρ в точке Q). Теорема доказана. Обратимся теперь к случаю, который в известном смысле противоположен рассмотренному в теореме 33.6,. а именно, к случаю я= 1. Пусть h — некоторое положительное число (возможно, h = оо); через Μ обозначим полуинтервал [О, К) числовой прямой ЕК Непрерывное отображение φ: Ai->£w называется параметризованной кривой (или просто кривой), исходящей из точки Q = cp(0). Предположим, что φ имеет в точке 0 касательное аффинное отображение /: El->Em. В таком случае вектор fg=cp(0)=f(0) a = f(l)-f(0) = /(l)-Q Рис. ИЗ. называется касательным вектором кривой φ в ее начальной точке Q (рис. 113). В силу определения касательного отображения имеем (для точек t, принадлежащих полуинтервалу Λί = [0, h))\ φ(0-/(ί) + ο(0-Φ(0) + ^(ί)-/(0)) + ο(0- -φ(0)+ί^(1)-/(0))+θ(ί)-φ(0)+ία + ο(0. Итак, если кривая φ: [0, ti)->Em имеет в точке <3 = φ(0) касательный вектор а, то справедливо соотношение φ (t) = φ (0) +ta + o (/). (33.25) Легко видеть, что верно и обратное: если для кривой φ справедливо соотношение. (33.25), то fl~касательный вектор кривой φ в точке Q = q>(0). Бели в пространстве Ет введены координаты у\ ..., ут, то задание кривой φ(ί) равносильно заданию т числовых функций (координат точки φ(/)) на полуинтервале Λί = [0, Λ): <р(0 = (у'(0, yHt) Ут№
33] § 9 ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 277 Касательный вектор а кривой φ (t) записывается в этом случае (в той же системе координат) в виде _ Λφ (0) ■_ f dyl (0) dy* (0) dym(0) \ \ dt a dt dt dt Теорема 33.15. Пусть φ (t) — кривая, исходящая из точки q (= φ (0)) и имеющая в точке Q касательный вектор a (=d(p (0)/dt). Пусть, далее, ψ (А) — гладкая функция, заданная в некоторой окрестности точки Q. Тогда ψ (φ (ί)) - * (Q) + / (α grad ψ (Q)) + о (/), (33.26) т. е., иначе говоря, d^ (φ (Q) dt ■ a grad ψ (Q). (33.27) Отсюда вытекает, что если скалярное произведение (33.27) положительно, то для всех достаточно малых i > 0 справедливо неравенство ψ (φ (/)) > ψ (φ (0)). Другими словами, для любой №&φίΡ) W&p/PJ Рис. 114. Рис. 115. отличной от Q точки А, лежащей на рассматриваемой кривой достаточно близко к Q, справедливо неравенство ψ (Α) > ψ (Q) (рис. 114). Если же скалярное произведение (33.27) отрицательно, то ψ (Α) < ψ (Q) для всякой достаточно близкой к Q точки АФ(}, лежащей на рассматриваемой кривой (рис. 115). Доказательство. В силу (33.25) аффинное отображение f{t) = <p(0) + ta = Q + ta (заданное на числовой оси) является касательным для φ в точке 0. Точно так же в силу (33.5) аффинное отображение g (А) = ψ (Q) + QA grad ψ (Q) является касательным для ψ в точке Q. Следовательно, по теореме 33.5, аффинное отображение h = gof является касательным для ψ ° φ, т. е. Ψ (φ (/)) = А (0 + о (0. Остается
278 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [34 заметить, что h (t) = g (f (t)) = ψ (Q) + Qf (t) grad ψ (Q) = ψ (Q) + to grad ψ (Q). 34. Шатер множества. Определение 34.1. Пусть Ω — некоторое множество, расположенное в пространстве Еп и Q е Ω. Пусть, далее, Λί — некоторый выпуклый конус с вершиной Q, также расположенный в пространстве Еп. Конус Μ мы будем называть шатром множества Ω в точке Q, если можно найти такое непрерывное отображение ψ, определенное для всех до- ^аточно близких к Q точек конуса Μ и принимающее значения в пространстве £*\ что выполнены следующие условия: 1) тождественное отображение пространства Еп является касательным для отображения ψ в точке Q, т. е. $(A) = A + oQ(A); 2) для всех точек А е Λί, для которых отображение ψ определено, выполнено соотношение ψ(^)^Ω. Грубо говоря, это определение означает, что «с точностью до oQ (А)» конус Μ (т. е. шатер) содержится в множестве Ω (рис. 116). Заметим, что если Μ — шатер множества Ω в точке Q; то и любой меньший (т. е. содержащийся в Λί) выпуклый конус с вершиной Q также является шатром множества Ω в точке Q. Поэтому представляет интерес нахождение максимального шатра множества Ω в точке Q (если таковой существует). Максимальный шатер существует не всегда. Если, например, Ω — часть плоскости, представляющая собой угол, больший π (с вершиной Q), то всякий угол с вершиной Q, не превосходящий π и содержащийся в Ω, будет шатром множества Ω в точке Q* но максимального шатра не существует. Следующие ниже две теоремы дают описание шатра множества в двух наиболее важных для дальнейшего случаях *). Теорема 34.2. Опорный конус Μ замкнутого выпуклого множества Ω в произвольной точке Q е Ω является шатром множества Ω в точке Q. Доказательство. Обозначим через Еп несущую плоскость выпуклого множества Ω. Конус Μ также лежит в этой *) В действительности в обоих случаях построенный шатер является максимальным, но мы этого не доказываем, поскольку этот факт в дальнейшем не используется. Рис. 116.
34] § 9. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 279 плоскости. Согласно теореме 29.5 для любой точки А^Еп существует в множестве Ω единственная точка, ближайшая к точке Л. Эту ближайшую точку обозначим через ψ (Л). Точка ψ (А) совпадает с Л, если А е Ω. Если же точка А не принадлежит множеству Ω, то шар с центром Л, на границе которого лежит точка ψ (Л), не имеет с Ω других общих точек, кроме ψ (Л) (рис. 117). Отображение ψ определено и непрерывно на всем пространстве Епу но мы будем рассматривать его только в точках конуса М. Для доказательства теоремы остается установить, что отображение ψ удовлетворяет указанным на стр. 278 условиям 1), 2). Так как для любой точки ЛеМ мы имеем ф(Л)ЕЙ, то условие 2) выполняется. Рис. 117. Рис. 118. Проверим выполнение условия .1); Выберем произвольное положительное число ε (не превосходящее единицы), которое в процессе рассуждений менять не будем. Рассмотрим некоторую сферу с центром в точке Q и обозначим через Σ пересечение этой сферы с конусом Μ (рис. 118). Пусть SgE. Обозначим через 1В луч, исходящий из Q и проходящий через точку В, и рассмотрим все лучи, исходящие из Q и образующие с лучом 1В углы, не превосходящие ε. Эти лучи заполняют в пространстве Еп замкнутый выпуклый канус (см. пример 28.6), который мы обозначим через Кг(В). Так как ΒεΣ, т. е. луч 1В содержится в конусе Λί, то в конусе Кг(В) имеются лучи, проходящие через отличные от Q точки множества Ω. Иными словами, пересечение Κε(Β)0& содержит отличные от Q точки. Это пересечение является замкнутым выпуклым множеством. Если множество Κε(Β)(]Ω имеет точки, лежащие вне шара радиуса 1 с центром в точке Q, то НЫ положцм d(B)=l. Если же множество ΚΒ(Β)[\Ω целиком
280 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [34 расположено в этом шаре, то через d(B) обозначим наибольшее расстояние от Q до точек множества Кг (В) Π Ω. Ясно, что d(B)>0, поскольку множество Κε(Β)(]Ω содержит отличные от Q точки. Таким образом, d(B) представляет собой положительную функцию, заданную на замкнутом ограниченном множестве Σ. Несложно доказывается,,что эта функция непрерывна. Следовательно, минимальное значение функции d(B) положительно, т. е. существует такое h > 0, что d(B)^h для любой точки βΕΣ. Пусть теперь Л — произвольная отличная от Q точка конуса Λί, расположенная на расстоянии, меньшем h от Q. Обозначим через В точку, в которой луч, исходящий из Q и проходящий через точку Л, пересекается с множеством Σ. Так как d (В) ^ /г, то в множестве Κε (Β) (] Ω найдется точка С, отстоящая от Q не менее, чем на /г. Иными словами, CeQ и угол между лучами, исходящими из Q и проходящими через точки А и С соответственно, не превосходит ε (см. рис. 118). Точка Л', являющаяся ортогональной проекцией точки А на луч, проходящий через С, принадлежит множеству Ω (ибо она лежит на отрезке, соединяющем точки Q и С). Расстояние же между точками Л и Л' не превосходит | QA \ · sine, т. е. меньше ε| QA |. Но тогда ближайшая к А точка ψ (Л) множества Ω подавно отстоит от А менее, чем на e|Q,4|, т. е. \${A) — A\<e\QA\ при |0Л|</г, Ле=М. Так как в этом рассуждении число ε > 0 было произвольным, то мы имеем ,. | -ф (Л) — Л | Λ lim ' Ύ ν ; ,—L = 0, А еШ ' x ' а это (вместе с очевидным соотношением ty(Q) = Q) и означает, что 1|)(Л) = Л + Oq{A), т. е. условие 1) справедливо. Прежде чем формулировать следующие теоремы, дадим некоторые определения. Введем в пространстве Еп систему координат ζ\ ..., zn и каждую точку АеГ будем записывать ее координатами: Α = (ζ\ ..., zn) = z. Пусть gl(z), ..., gk(z) — некоторая система гладких функций, заданных в пространстве Еп. Обозначим через Ω множество всех точек Л = (2*, ..., ζη) е£л, удовлетворяющих условиям: *■(*)<о, ..., г*(г)<о. (34.1) Каждое из неравенств gi(z)^:0i входящее в определение множества Ω, условимся называть ограничением.
34] § 9. ТЕОРЕМЫ СУЩЕСТВОВАНИЙ 281 Если в некоторой точке z0 e Ω выполнено соотношение £/(20) = 0, т0 ограничение gi(z)^:0 будем называть активным в точке г0; если же g* (z0) < 0, то g*(г)<0 — неактивное в точке г0 ограничение. Таким образом, для любой точки 20ей все ограничения (34.1) разбиваются на активные и неактивные в этой точке. Множество всех индексов /, для которых ограничения gi(z)^0 являются активными в точке z0gS, назовем зоной активности и будем его обозначать через I(z0) (а иногда через J (z0)). z k Пример 34.3. Рассмотрим соотношения (г1)2-~^2<0, zl + z2-2^0, _zi_2<0 (34.2) на плоскости ζ\ ζ1, т. е. рассмотрим случай трех ограничений (34.1), " п ■■ζι+ζ2-29 где gl = (ζ1)2 — ζ g* = z2 y\ Рис. 119. ζ1 —- 2. Ограничения (34.2) определяют в плоскости ζ\ ζ2 множество Ω, показанное на рис. 119. В точке а активными являются первое и второе ограничения; иными словами, /(а)={1, 2}. В точке δ активно только второе ограничение, в точке с —только третье; 1(b) = {2}, 1(с) = {3}. В точке d все ограничения (34.2) неактивны, т. е. зона активности 1(d) является пустым множеством. Заметим, что среди ограничений (34.1) могут встретиться такие, которые не являются активными ни в одной точке множества Ω и которые, тем не менее, не могут быть отброшены при описании множества Ω. Рассмотрим в качестве примера множество Ω, определяемое на плоскости переменных ζ\ ζ2 соотношениями: 9 - (ζ1 - 4)2 - (ζ2)2 < 0, 9 - (ζ1 + 4)2 - (ζ2)2 < 0,) 9 - (zlf - (ζ2 - 4)2 < О, 9 - (ζ1)2 - (ζ2 + 4)2 < О, (34.3) (рис. 120). Ясно, что последнее из ограничений (34.3) не является активным ни в одной точке множества Ω. Однако отбросить это ограничение нельзя, так как множество, описываемое первыми четырьмя ограничениями (34.3), будет содержать, помимо Ω, внешность фигуры, изображенной на рис. 120 жирной линией. Так как функции g\ с помощью которых записаны ограничения (34.1), предполагаются гладкими, то в каждой точке г{) е Ω можно рассматривать векторы gradgl(z0), /=1, ..., k, и,
282 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ (34 в частности, векторы grad gl (z0), :/(*о), (34.4) соответствующие активным в точке zQ ограничениям. Будем говорить, что в точке ζ0^ Ω система ограничений (34.1) является невырожденной, если существует в Еп вектор а, образующий строго отрицательные скалярные произведения с каждым из векторов (34.4): agradg'(z0)<0 при ι /(*ο). (34.5) Если множество 1{ζ0) пусто (как, например, в точке d на рис. 119), то Система векторов (34.4) не содержит ни одного вектора, и система ограничений (34.1) считается, по определению, невырожденной. Заметим, что если векторы (34.4) линейно независимы, то система ограничений (34.1) является невырожденной, так как можно найти векторы biy /<=/(г0), обладающие тем свойством, что bigreidg}{zQ): 1 при i ч 0 при i Φ j 1\ Рис. 120. (где /, / е / (г0)), и тогда вектор а = -— 2 bi образует со *<=/(2о) всеми векторами (34.4) отрицательные скалярные произведения. Например, в каждой точке z0 множества Ω, показанного на рис. 119, система ограничений (34.2) является невырожденной, ибо/ как легко видеть, векторы (34.4) линейно независимы. Однако линейная независимость векторов (34.4) вовсе .не является необходимым условием невырожденности системы ограничений (34.1) в точке z0. В самом деле, возьмем в Еп произвольный вектор а и выберем любые векторы еи е2, ..., ek, образующие с а отрицательные скалярные произведения, причем число k этих векторов возьмем большим, чем п. Пусть далее, /,, ..., fk — аффинные функции, обращающиеся в нуль в точке z0 и удовлетворяющие условиям grad Д- = *и /=1, ..., k. Тогда система ограничений /^0, ..., /^^0 (они все активны в точке г0) является невырожденной в точке ζθ9 хотя векторы grad/f, /==1, ..., k линейно зависимы, поскольку их число больше, чем размерность η пространства £*\
34} § 9 ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 283 Геометрически условие невырожденности означает следующее. Рассмотрим при i^I(z0) полупространство Р{, со* стоящее из всех точек z^En, для которых (ζ — z0) gradg'(20)^0. Мы получаем тогда полупространства Ph i^I(zQ), соответствующие активным в точке z0 ограничениям (34.1), причем граничная гиперплоскости полупространства Pt ортогональна вектору gradg'(20) и проходит через точку ζ0, τ. е. является касательной гиперплоскостью гиперповерхности gl (г)=0,/<=/ (г0). Условие невырожденности означает, что пересечение всех полупространств Ри i^I{z0), представляет те лесны й конус в Еп, т. е. соответствующие открытые полупространства имеют непустое пересечение. Теорема 34.4. Пусть Ω -— множество, определяемое в пространстве Еп ограничением g(z)^.0} где g(z) — гладкая функция, заданная в открытом множестве пространства Еп. Пусть, далее, ζ0^Ω —такая точка, что g{z0) — O и gradg(z0)^0. Обозначим через Μ полупространство, состоящее из всех точек ζ^Εη, для которых (ζ — z0)grad g(z0)^0. Тогда М есть шатер множества Ω в точке ζ0 (рис. 121). Доказательство. Выберем такой луч I, исходящий из точки ζ0, что единичный вектор а, имеющий направление этого луча, образует отрицательное скалярное произведение с вектором grad g(z0). Рассмотрим гиперповерхность, определяемую уравнением g(z) = 0 (напомним, что g (z) — гладкая функция, определенная в открытом множестве; см. определение 33.9). Обозначим через F кусок этой гиперповерхности вблизи точки ζ0, причем кусок настолько малый (рис. 122), что любая прямая, параллельная лучу / и расположенная близко от него, пересекает F ровно в одной точке (см. теорему 33.13). Далее, через Г обозначим граничную гиперплоскость полупро-
284 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [34 странства Λί, τ. е. гиперплоскость, состоящую из всех точек г, для которых (г — z0) grad g (z0) = 0. Пусть ζ — произвольная точка пространства Еп. Обозначим через mz прямую, параллельную / и проходящую через точку г. Прямая mz пересекает гиперплоскость Г в некоторой точке γ (ζ) и, если точка ζ достаточно близка к z0i пересекает гиперповерхность F в некоторой точке f(z). Так как Г — касательная гиперплоскость гиперповерхности F в точке г0, то /(ζ)-γ(ζ) = θζ0(ζ), поскольку γ (ζ) = π (f (z))9 где π — проектирование пространства Еп на гиперплоскость Г параллельно / (см. (33.12)). Положим теперь *(*) = *+ (/(*)-Υ (2)). Отображение ψ определено вблизи точки ζ0 и принимает значения в пространстве Еп. Докажем, что отображение ψ, рассматриваемое вблизи вершины ζ0 конуса Λί, обладает свойствами 1), 2), указанными в определении 34.1, чем и будет установлено, что Μ — шатер множества Ω в точке ζ0, Так как ψ (ζ) — ζ = / (ζ) — γ (ζ) = ο2ο (ζ), то условие 1) выполнено. Остается проверить, что выполнено условие 2), т. е. что ψ(ζ)^Ω для достаточно близких к ζ0 точек ζ<^Μ. Так как / (z) gF, то g (/ (ζ)) = 0 (поскольку все точки гиперповерхности F удовлетворяют уравнению g(z) = 0). Следовательно, g (Ψ (г)) = g (Ψ (ζ)) - г (f (z)) = (ψ (ζ) - / (ζ)) grad g (I) - = (2 —Υ («)) grad fif (ξ), где | —некоторая точка отрезка, соединяющего точки ψ (ζ) и f(z). Но при г^М мы имеем ζ — γ (г) = λ (ζ) α, где λ(2)>0 (см. рис. 122). Далее, так как agradg"(z0) < 0, то, если точка ξ достаточно близка к ζ0 (а это будет, если трчка ζ достаточно близка к 2о), справедливо неравенство α grad g(Q < 0. Следовательно, g (ψ (ζ)) = (ζ - γ (ζ)) grad g (I) = λ (г) (α grad g (ξ)) < о, и потому ψ (г) е Ω. Таким образом, условие 2) также выполнено. Замечание 34.5. Обозначим через Ω* множество, содержащее точку ζ0 и все точки ζ&Εη, для которых g(z)<0. Ясно, что Ω* cz Ω. Тогда при условиях теоремы 34.4 можно сформулировать более сильное утверждение: Μ есть шатер множества Ω* в точке ζ0. В самом деле, положим V(z) = y(z) + (y(z)-zQ)2a.
34] § 9. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 285 Тогда ψ* (ζ) = ψ (ζ) + o2q(z), и потому отображение ψ*,' так же как и ψ, удовлетворяет условию 1) определения 34.1. Далее, если точка ζ е Μ не лежит на луче Ζ, то (γ (ζ) — 20)2 > О, и потому £ (Ψ* (г)) - £ (Ψ («)) = (Ψ* И - Ψ (^)) grad g (|) = = (Y(z)-z0)2(agrad(g(|))<0 (здесь | — некоторая точка отрезка, содержащего точки ψ (г) и ψ* (ζ)). Следовательно, £(ψ*(2))<#(Ψ(2))^0, и потому ψ*(ζ)^Ω\ Если же точка г <= Λί лежит на луче I, т. е. ζ = 20 + λα, где λ>0, то ψ* (г) = ψ (ζ) = 2, и потому также ψ*(ζ)<=Ω\ Таким образом, в любом случае ψ* (г) εΩ* (для точек ζ^Λί, достаточно близких к ζ0), т. е. условие 2) также выполнено. Теорема 34.6. Пусть Ω — множество, определяемое в пространстве Еп ограничениями (34.1), и пусть в точке z0 e Ω система ограничений (34.1) является невырожденной. Обозначим через Μ множество всех точек ζ^Εη, для которых вектор ζ — ζ0 имеет неположительное скалярное произведение с каждым из векторов (34.4). Тогда Μ есть шатер множества Ω в.точке'г0. Дока зательство. Прежде всегр заметим, что Μ есть пересечение полупространств Я/, i^I (z0), где Pi — полупространство, состоящее из всех точек ζ е Еп, для которых (ζ — z0) grad£' (z0) ^0. Поэтому Λί является выпуклым конусом с вершиной ζ0. Обозначим через s число индексов, входящих в зону активности / (z0). При s = 0 точка z0 является внутренней точкой множества Ω, и утверждение теоремы тривиальным образом выполняется. Поэтому в дальнейшем мы будем предполагать, что s^ 1. Пусть, для определенности, активными в точке z0 являются первые s ограничений (34.1), а остальные ограничения неактивны, т.е. /(z0) = {l, ...,s}. Тогда множество Ω определяется вблизи точки ζ0 неравенствами £'(*)< 0 g5(z)<0, (34.6) а система (34.4) состоит из векторов grad g* (*о). /=1, ..., s. (34.7) Выберем такой луч /, что единичный вектор #, имеющий направление этого луча, образует отрицательное скалярное произведение с каждым вектором (34.7): a grad gl (zQ) < 0, /» 1, ..., s. Для каждого /=1, .··, s построим отображение ψ/ (определенное вблизи точки ζ0) так, как это было сделано при доказательстве теоремы 34.4. Таким образом, ψ. (ζ) = ζ + α, (ζ) α, g'(ψ, (ζ)) < 0 при геР.. Обозначим через α (ζ) наибольшее из чисел αϊ (ζ), ..., as (ζ). Так как Функции α! (ζ), ..., as (ζ) непрерывны, то и функция α (ζ) (определенная вблизи точки ζ0) непрерывна. Положим теперь ψ (ζ) = ζ + α (ζ) α Функция φ (ζ) определена вблизи точки ζ0 и удовлетворяет условию 1) определения 34.1 (так как функции ψ ι (ζ), ..., ψ$(ζ) этому условию удовлетворяют).
286 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ 134 Остается доказать, что отображение ψ удовлетворяет условию 2), т. е. что φ (ζ) е Ω при ζ е Μ (если точка ζ достаточна близка к zQ). Мы имеем 8* (* («)) - *' (Ψί (*)Ы* (*) - Ψ* (г)) grad ^ (ξ)=(α (г) - а* (г)) α grad *' (ξ), где ξ — некоторая точка отрезка, соединяющего точки ψ (ζ) и ψ; (г). Но α(ζ)>α/(ζ) и α grad gl (ξ) < 0 (если точка ζ достаточно близка кг0). Сле- довательнф, gl (ψ (ζ)) — gl (ψ; (г)) < 0. Так как Μ cz Pt·, то для любого i = 1, ..., s имеем (при ζ е Λ1) Итак, если точка ге Λί достаточно близка к ζ0, то для всех fe/ (z0) вы* полнены неравенства £ί(ψ(ζ))<0, и потому ψ (г) s Ω, Таким образом, условие 2) также выполнено. Теорема 34.7. Пусть Ω — некоторое множество, располооюеиное в Ер, а М ~ шатер множества Ω в точке QeQ. Пусть, далее, φ: Ω->Ε4 — непрерывное отображение, имеющее в точке Q касательное аффинное отображение f: Ер -> Eq. Наконец, пусть С — внутренняя точка конуса f (Μ) οτ· носительно его несущей плоскости Р, отличная от его вершины Qx =:(p(Q)= = f (Q). Тогда существует в Eq такой замкнутый выпуклый конус Nczf (M) с вершиной Qu имеющий Ρ своей несущей плоскостью, что С — внутренняя точка конуса N и N является шатром множества φ (Ω) в точке Qx. Доказательство. Так как вектор ех = CQX отличен от нуля, то его можно дополнить векторами е2, ..., еп до некоторого базиса еи е2, *..,еп Рис. 123. плоскости Λ где я = dim Р = dim f (M), При этом можно предполагать (уменьшив, если нужно, длины векторов еъ ..., еп без изменения их направлений), что точки Ah Аъ ..., Лп, определяемые соотношениями —> С Αχ = — ех —- е2 — ... — еп, —> CAi = ei, i==2 η, принадлежат конусу f (Μ) (поскольку С е relint Μ; рис. 123). Так как, очевидно, 1ГТТ ^ + ТТТ6** + ΤΪΪ6** + - + ТТЛ ^.-e-cf.
341 § 9. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 287 то (ср. (17.3), (17.4)) ^-ThQl + ^hAi + i^At+-+Th^ (34·8) потому точка С принадлежит выпуклой оболочке точек Qb Ль ..., Лп. Если бы точки Qu Аь ..,, Ап лежали в одной (п — 1)-мерной плоскости, то в этой плоскости лежала бы и точка С, что невозможно, поскольку векторы _^ _^ ^ е, = CQU е2 = СА2 еп = САп линейно независимы и, следовательно, точки С, Qlt A2 Ап не лежат в одной (п — 1)-мерной плоскости. Таким образом, точки Qb Ах Ап не лежат в одной (п — 1)-мерной плоскости, т. е. являются вершинами некоторого n-мерного симплекса Т. Точка С является в силу (34.8) внутренней точкой этого симплекса (см. пример 25.3). Обозначим через N выпуклый конус, образованный всевозможными лучами, исходящими из точки Q\ и проходящими через точки (п— 1)-мер- ного симплекса [Л, Ап] (рис. 124). Покажем, что этот конус и является искомым. Рис. 124. Так как все точки Ах, ..., Лп принадлежат конусу f (M), имеющему Q\ своей вершиной, το Ν czf (Μ) Далее, очевидно, что Τ с: N. Отсюда вытекает, что конус N имеет Ρ своей несущей плоскостью и что С — внутренняя точка конуса N. Остается доказать, что N — шатер множества φ (Ω) в точке Qj. Так как точки А1у ..., Ап принадлежат множеству / (М)> то найдутся такие точки Вх Вп множества Λί, что f(Bi) = Ai, ί=1, ..., η Обозначим через g аффинное отображение плоскости Ρ в пространство Ер, переводящее точки Qlt Аь .,., Ап соответственно в точки Q, Bit ..,, Вп (см. теорему 19.9). Заметим,, что точки Q, θ, Вп являются вершинами n-мерного симплекса в Ер (если бы эти точки лежали в одной (п·— 1)-мер- ной плоскости, то и точки Q|, Au ..., Ап, являющиеся образами точек Q, Ви .... Вп при аффинном отображении f, лежали бы согласно теореме 19.3 , в одной (п — 1)-мерной плоскости, что не имеет места). Конус N переходит при аффинном отображении g в конус, образованный всевозможными лучами, исходящими из точки Q и проходящими через точки симплекса [Blt ..., θΛ]. Поскольку этот симплекс содержится в конусе М, то g (Ν) α Μ. Так как Μ — шатер множества Ω в точке Q, то существует такое отображение ψ: Μ -> Ер, что ψ (Л) е Ω для всех достаточно близких к Q точек ЛеМ и ψ имеет тождественное отображение пространства Ер своим касательным отображением в точке Q. Поэтому согласно теореме 33.5 отображение ψ1 = φ°ψ°£ (определенное для всех достаточно близких к Qt точек конуса N) имеет f°g своим касательным отображением в точке Qj.
288 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ № Так как №'ff)(Qi)-M*(Qi))eMQ)«Qi. и*§)(Ао = !^(А{)) = 1(В1) = А{> /«1, .... л, то согласно теореме 19.9 отображение f°g совпадает с тождественным отображением пространства Eq. Таким образом, отображение ψι, определенное вблизи вершины конуса Nt имеет тождественное отображение пространства Eq своим касательным отображением в точке Q\. Кроме того, для всех достаточно близких к Qx точек А конуса N имеем ψ, (А) = φ (ψ (g (A))) = φ (ψ (Л')) е φ (Ω) (где A' = g{A)^M). Следовательно, условия 1), 2), указанные в определении 34.1, выполнены, и потому N — шатер множества φ (Ω) в точке Q1# 35. Теорема о пересечении. В этом пункте мы докажем теорему, которая будет служить основой всего дальнейшего изложения. Наглядный смысл этой теоремы можно пояснить следующим образом. Пусть Ω — некоторое множество пространства Еп, а М — выпуклый конус с вершиной Q е Ω, являющийся шатром множества Ω в точке Q. Это означает, по определению, что существует отображение ψ: М->Еп, удовлетворяющее условиям 1); 2) определения 34.1. Так как тождественное отображение пространства Еп является касательным для ψ в точке Q, то множество ψ(Λί), содержащееся в Ω в силу условия 2), представляет собой «искривленный конус» с вершиной Q, «касающийся» конуса Μ в точке Q (рис. 125). Рис. 125. Рис. 126. Пусть теперь Ω^ Ω2—-два множества, имеющие общую точку Q, и пусть Ми М2 —шатры этих множеств в точке Q. Предположим, что конусы М{ и М2 не лежат в одной гиперплоскости и имеют общий луч /, являющийся внутренним для каждого из конусов Ми М2 относительно его несущей плоскости (рис. 126); такое расположение конусов будет иметь место, если они неотделимы и хотя бы один из них не является плоскостью. Так как «искривленные конусы» ψι(Αί1) и ^(Мг)
35] § 9 ТЕОРЕМЫ СУЩЕСТВОВАНИЙ 289 (где Ψι, Ψ2 — соответствующие отображения, удовлетворяющие условиям 1), 2) определения 34.1), «касаются» конусов Мх и М2, то представляется правдоподобным, что *MAfi) и $2{М2) пересекаются по линии Л, касающейся луча / в точке Q (рис. 127). Следовательно, найдется точка AgA, отличная от Q и принадлежащая обоим «искривленным конусам» ty\ (Af,), ψ2(Μ2). А так как ψ, (Λί,) (ζΩ^ ψ2 (Λί2) cz Ω2, το β^Ω,ΠΩ^· Итак, если множества &ь Ω2 имеют в их общей точке Q шатры Ми Λί2, причем конусы М{, М2 неотделимы и хотя бы один из них не является плоскостью, то существует отличная от Q точка β ^ Ω! Π Ω2. Это и есть содержание доказываемой ниже теоремы 35.1 в случае двух множеств. (Разумеется, изложенные наглядные соображения не дают строгого доказательства этой теоремы.) (ГЩ) Рис. 127. Рис. 128. Заметим, что неотделимость конусов Ми М2 является существенным условием для справедливости приведенного утверждения. Действительно, если существует гиперплоскость Г, разделяющая конусы М{ и М2, то (даже если эти конусы имеют общий луч /) «искривленные конусы» ι^ (Μ{) и ψ2(Λί2) могут оказаться расположенными по разные стороны гиперплоскости Г и могут не иметь, кроме Q, других общих точек (рис. 128). Приведенные соображения делают смысл теоремы 35.1 совершенно ясным. Доказательство же ее довольно сложно. Поэтому при первом чтении его можно пропустить. Более простое доказательство (при более ограничительных предположениях) приведено в замечании 35.2. Теорема 35.1. Пусть Qlt ..., Ω^ — некоторые множества, расположенные в Еп и имеющие общую точку Q, и пусть Ml9 ..., Mk — шатры множеств ΩΙ? ..., Ω^ в точке Q. Если система выпуклых конусов Λί,, ..., Mk не обладает свойством отделимости и хотя бы один из этих конусов не является плоскостью, то найдется отличная от Q точка В е Ωι Π ... ΠΩ/,.
290 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [35 Доказательство. Так как система конусов Ми ..., Mk не обладает свойством отделимости, то согласно теореме 32.5 существует точка OeirelintAiOn ... Π (relint Λί*) и, кроме того, существуют такие подпространства L\ Lk, в прямую сумму которых распадается пространство Епу что при любых i Φ j (ί, /=1,..., k) подпространство Ц содержится в несущей плоскости конуса Mj (Мы здесь считаем О нулевой точкой пространства Еп, так что всякая плоскость, проходящая через О, будет подпространством.) Заметим, что О Φ Q, так как, по предположению, хотя бы один из конусов Мь ... ..., Mk не является плоскостью и для этого конуса Q является граничной точкой относительно его несущей плоскости. Выберем теперь такой базис еь ..., еп пространства Еп и такие целые числа 0 = q0 < q{ < q2 < ... < qk = я, что при любом / = 1 k векторы V. +ь e"i- + 2> Ч1 образуют базис подпространства Lj. Выбрав этот базис, мы не будем его менять до конца доказательства. Кроме того, мы условимся считать базис ей · · Vf/i ортонормированным (это задает евклидову метрику в пространстве Еп). Введем теперь понятие r-мерного координатного параллелепипеда С этой целью обозначим через 5 множество, состоящее из чисел 1,.. и выберем произвольное подмножество Яс5. Далее, для любого / выберем некоторое число а1 в £*. • м п, fi=J,/t40,SW4&} а для любого / е S \ # выберем два числа аК Ь1, удовлетворяющие условию а1 < Ь1. Под координат' ним параллелепипедом будем понимать множество всех точек пространства Еп, координаты, х1, ..., хп которых в системе (О'; е„ ..., еп), где O'ef", удовлетворяют условиям (рис. 129): а1<х1<Ъ1 при при S\H. Если все числа а\ Ь1 рациональны, то мы будем говорить, что рассматриваемый координатный параллелепипед является рациональным (в системе (О'; еь ..., еп)). Построенный таким образом координатный параллелепипед представляет собой внутренность r-мерного многогранника (замкнутого г-мерного параллелепипеда) в Еп, где г — число элементов множества S\#. Пусть h — положительное число. Координатный параллелепипед убудем называть базисным h-кубом в системе координат (О'; eit ..., еп)у если для Рис. 129. каждого г=1,..., η мы имеем а1 «А?*, где ql — целое число, и, кроме того, для каждого i^S\H число Ь1 удовлетворяет условию Ь1 = а1 + h (рис. 130). Легко проверяется, что всевозможные базисные /г-кубы (размерностей 0, 1,..., п) в системе (О'; ех еп) попарно не пересекаются, а объединение всех базисных /г-кубов совпадает с Еп. Совокупность всех базисных /г-кубов в системе (О'; е\ еп) мы обозначим через Kh(0')
351 § 9. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 291 и будем называть кубильяжем, соответствующим числу h и точке О'. (Мы особо подчеркиваем зависимость кубильяжа от точки О', так как в процессе рассуждений базис еь ..., еп будет, как уже отмечалось, оставаться неизменным, но нам будут нужны кубильяжи,4 получающиеся при различном выборе начала О'.) Докажем теперь следующее утверждение. Пусть О., О. ■ такие точки в Еп, что для любых ιΦ j (/, /=l k) все координаты вектора J_ (Оу — Oi) —· нецелые, и пусть для каждого j = 1, ..., k в ку- бильяже Kh (0}) выбран некоторый базисный h-куб Rf, тогда и г*, ь\ а\ , 4 0' \ * \ -г ei h а' % 'У X λ r2=.dLmRt=2 I r3=dimR*=J Рис. 130, пересечение Rx(] ... ΓΙRk> если оно непусто, является координатным параллелепипедом размерности г{+ ... + rk — (k — 1) я, где ry=dim/?,» /= 1, ..., k (рис. 131). В самом деле, обозначим через Η, подмножество множества S, соответствующее /г-кубу Rp так что /г-куб R, определяется в системе координат (Оу; elf ..., еп) соотношениями вида x}=*hq\ при is Я/, 7 ' (35.1) hq\ < χ1 < h (q) + l) при igS' Η Г Hk имеют Легко видеть, что если какие-либо два из множеств Нъ непустое пересечение, то пересечение R{ П ... C\Rk пусто. Действительно, если, например, ι ^НХ{\Н2, то в определение /г-куба Rx входит уравнение х ^ hq\, а в определение я-куба R2 .входит уравнение х1~На\. Иными словами, я-куб Rx лежит в гиперплоскости, определяемой в системе координат (Ор е{, ..., еп) уравнением xl — hqlv а /г-куб /?2—· в гиперплоскости, определяемой в системе (02; ev ..., еп) уравнением **=я<72 (рис. 132). *г« / / 1 *«*к как числа #J, #2 — целые, а /-я координата вектора -г- (02 — Ох) — не- Делая, то эти две гиперплоскости параллельны, но не совпадают, так что ^0^ = 0 и потому tfjD ... П#£ = 0,
292 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [35 Итак, если пересечение R{ Π ··· 0Rk непусто, то все множества /У , ... ..., Hk попарно не пересекаются, и потому пересечение R{{\ ... f\Rk определяется столькими равенствами, сколько имеется элементов в множестве ■/У, U и**· (На рис. 131 /У, = 0, #2 = 0> ^зя {2}.) По остальным же координатам (номера которыХ|,не входят в множество Н) пересечение R{(] ... [\R. определяется неравенствами типа а1 < х1 < Ь1. (Так, на рис. 131 интервал (а1, Ь1) есть пересечение трех интервалов.) Отсюда видно, что R (] ... (] Rk и noiu-frtizunu -есть К0°РДинатнь1Й параллелепипед, "ГУМ ffg-W, 3€Htllltg xJ=fiq? причем его размерность равна η — ρ, где ρ — число элементов множества Я. Так как ρ = р. + ... + pk, где ру — число элементов множества Ну /= 1 k, то dim (Я, П ... ΠΛΛ)β = п-р = п~(р{+ ... +^) = β(Λ-Ρι)+··' + (Λ-Ρ*)- — (fc — 1) я « dim/?, + ... Рис. 132. ... + dim Rk — (k - 1) я, что и утверждалось. Введем теперь понятие цепи. Именно, r-мерной цепью (где г — одно из чисел 0, 1, ..., п) будем называть конечное число r-мерных координатных параллелепипедов, выписанных один за другим и соединенных между собой знаками +· Например, будем писать гг^р1 + р2+ _ +Ps и будем говорить, что |г есть г-мерная цепь, состоящая из г-мерных координатных параллелепипедов Ρ и -К» ···» Ps- Наглядно цепь можно представить себе в виде «изломанной» г-мерной поверхности (возможно, состоящей из нескольких отдельных кусков; см. рис. 133). При этом условимся считать, что дважды встречающийся параллелепипед можно в любой цепи вычеркнуть, т. е., например, Ρι + Ρι + Ρ2 + Ρ*~Ρ2 + Ρζ. Pl + P2 + P2 + P2 = Pl + P2, Ρι + Ρι + Ρ2 + Ρ2 = 0 (иными словами, мы будем, как еще говорят, рассматривать цепи по модулю 2). Цепи одинаковой размерности можно складывать как многочлены (вычеркивая ρ ,™ дважды встречающиеся параллелепипеды, если они появляются). Граница г-мерного параллелепипеда состоит из 2г главных (т. е. (/· — 1)- мерных) граней, и потому границу любого координатного параллелепипеда Ρ можно записать как цепь, выписывая все его главные грани. Эту цепь (границу координатного параллелепипеда Р) условимся обозначать через dP,
35J § 9. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 293 Например, на рис. 134 dP^Px + P2 + p[ + P^ а на рис. 135 граница dP трехмерного параллелепипеда Ρ выражается формулой dp = Р{ + Р2 + Р3 + р[ + р'2 + р'3. Таким образом, граница dP любого г-мерного координатного параллелепипеда представляет собой (г— 1)-мерную цепь. *Ί 0 \ % ρ/ '<%Ур/^ в р/ Ρ Рис. 134. Рис. 135 Теперь можно определить границу любой цепи; именно, границей /--мерной цепи |Г=Р1 + Р2+ ... +PS будем считать (г — 1)-мерную цепь dlr*=dPl + dP2+ ... +dPs. Например, на рис 136 изображена граница цепи ξ2 = Ρι+...+Яю. показан- ^ ной на рис. 133. Заметим, что д31 л это определение имеет смысл " ** лишь при г > 0. Для любой нульмерной цепи граница считается равной нулю. **1 О , А Ρ в X7 Рис. 136. Рис. 137. Ясно, что при таком определении границы для любых двух г-мерных цепей |г, ηΓ справедливо соотношение d(lr + J\r) = dlr + dr\r. Отметим особо случай г = 1, т. е. случай одномерных цепей. Каждый одномерный координатный куб представляет собой интервал, параллельный одной из координатных осей. Граница его состоит из двух точек;-так, на рис. 137 мы имеем: dP == Л + J3. Отсюда следует, что граница любой
294 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ Г35 одномерной цепи состоит из четного числа нульмерных параллелепипедов (точек). Пусть теперь 0{t ..., Ok — такие точки в Еп, что для любых / Φ j (/, / = ι, ..., k) все координаты вектора -τ- (О/ — Ог) — нецелые. Далее, пусть г , ..., rk — целые числа, причем 0^г^<« и |у — некоторая цепь размерности г,, состоящая из базисных /г-кубов кубильяжа Kh (О Л, /=1, ...,&. Будем при этом считать, что Γχ + ... + rk — (k — 1) я > 0. Возьмем для каждого /=1, ..)., /г некоторый /г-куб #у (размерности г^), входящий в цепь ξ,. Тогда, согласно доказанному выше, пересечение Rl Π ··· Л#£, если оно непусто, представляет собой координатный параллелепипед размерности /-j + ... + г^ — (& — 1) я. Взяв сумму всех получающихся таким образом координатных параллелепипедов (когда R* пробегает все базисные /г-кубы, входящие в цепь Ij, /—1, ..., &), получим некоторую цепь размерности г{+ ... + rk — (k — 1) пу которую назовем пересечением цепей lv ..., \k и обозначим через ^ X ... X lk. Нам понадобится теперь следующая формула *), которая дает выражение для границы цепи 1{ X |2 X ... Χ ξΛ: ^х^х.-.ху^ - (rfgj) Χ ξ2 Χ ... X %k + |j X (rfy X |3 Χ ... Χ \k + ... ... +6ΙΧ62Χ..."Χ(<*ξΛ)τ (35.2) Формулу (35.2) достаточно доказать для случая, когда каждая цепь ξ, состоит только из одного /г-куба |у = /?у, где сНтЯу = Гу (общий случай формулы (35.2) получается из этого частного случая очевидным сложением)· Итак, мы должны доказать соотношение d(R{XR2X...XRk) = °=(dR{)XR2X...XRk + RlX(dR2)X...XRk+... ... +RxXR2X...X(dRk)t (35.3) где Rj — базисный Λ-куб кубильяжа #л(Оу), /=1, ..., k. Пусть /г-куб Rj определяется в системе координат (О/; et, ..., βΛ) соотношениями (35.1). Обозначим через (о\ о?) координаты точки О, в системе (О; βρ ..., ert)% Тогда /г-куб /?/ определяется в системе (О; еь ..., еп) соотношениями χ = а\ при / е Я,; tit (35·4) α) < лр1 < а) + /г при ie5\ Hjt где aj = /i^y + 0/ (рис. 138; ср. рис. 130). Следовательно, координатный параллелепипед R{ Π ... (]Rk определяется в системе (О; е{, ..., ел) соотношениями , χί~α\ ПРИ /еЯ/' /-Ι.···. * (35.5) δ'<*'<(?' при ί<Ξ$\#, *) Она представляет собой частный случай формулы Лефшеца; см. М. Е. Г л е з е ρ м а н, Л. С. Понтрягин, Пересечения в. многообразия*! Успехи математических наук ?, щып. 1 (1947).
35] § 9. fEOfcEMbl СУЩЕСТВОВАНИЯ 295 и-= Η U ... \}НЬ> а. через (&*, с1) обозначено (при данном фиксирован- ГДе 1Л 1 л ί I I \ S\H) пересечение всех интервалов [а^ uj + hy /=l,v.., k. что bl является (для любого / е S\H) концом только о д - 1, ..., k (то же справедливо для с1)» ном ι е Заметим, ..- - . н о г о из интервалов (яу, а;· + /г], / Это следует из соотношения dj — а ■ h (»} - «,') + W - of) - a ((,} - ,|) + ijji) *=0, справедливого благодаря тому, что число q^ — q\f — целое, а число — •oj не является целым в силу выбора точек О Ot Рассмотрим / вой части доказываемого е слагаемое RXX. X*/-1X(d«/)X«/+1X...X«* в пра- соотношения (35.3). Цепь dRj, т. е. граница \1 t —т< ч Ι ι ff ι i/_ ) I 1 —J 0 [ IA 1 V—| £ ?/- ^ t t ■■ -—J —<j ^ r~~ h с -^· *Ί И Л Г ' ι #-W,£ w \ ! \ V A =*f \/ *' xyc=af+h Рис. 138. Рис. 139. Л-куба Rjy может быть записана следующим образом (рис. 139). Выбирается некоторый индекс /0 s S \ Я/ определяемый в системе (О; ер , л\ рассматривается координатный /г-куб, еп) соотношениями а\ < х{ < а\ + Л при i при при при Ι Ηjy :S\H}t (35.6) ί * Ό где с — одно из чисел alf или aj° + /г. Каждый такой куб является главной гранью куба Rj и этим способом описываются все главные грани куба Rf (когда ί0 пробегает множество 5\Я/ и каждый раз числу с придаются значения а\\ а tf + h). Пусть /tt —-одна из главных граней куба Rj (описываемая соотношениями (35.6)). Найдем пересечение Я, X ... X Л;-1 X R) X Л/+, X ... X Я*. Для этого обозначим через Н'} множество, содержащее все элементы
290 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ (35 * \ J=2,Hj=0,H3H2}Jo=£eH3 множества Я. и число iQ. Куб R'j определяется соотношениями вида х1 = const при i е Η *, a) <xl <a) + h при /eS\ н\. Следовательно, если множества Нр ..., #/_р Н'р #y_|_i Hk не являются попарно непересекающимися, то пересечение Rx (] ... Π/?/Π ··· П^ пусто. Иными словами, если /0 принадлежит одному из множеств #ь ..., Яу-Ь HJ+v...,Hk, то пересечение /^ X ... X #< X ... X Rk равно нулю (рис. 140; ср. рис. 131). Поэтому нужно рассмотреть лишь случай, когда /0 s e=S\tf. Итак, правая часть соотношения (35.3) есть сумма слагаемых вида Λ, X ... X Щ X ... X Rk. где Щ есть куб (35.6), ί'0 пробегает множество S\#; далее, / =1, ..·, &, а число с в соотношениях (35.6) принимает значения а'0, ау° + h. Рассмотрим куб Rj, описываемый соотношениями (35.6), где с = α|°. Поскольку интервал (bh, cio) является пересечением всех интервалов (а\\ α|β + λ), / = t /г, то α}°<£\ Легко понять, что если (для рассматриваемого индекса /) это неравенство строгое: af<bHt то пересечение П#/П ··· ORk п^сто. В самом деле, Ьи есть одно из чисел α£°. Так как а^<Ь1\ то biQ = al\ где / φ j. Но в определение куба (35.6) входит равенство xio = αγ> а в определение куба Rl входит неравенство а\*<хн<а\* + /г, т. е. xif>>bl\ Так как система соотношений *i0 = aj°, xH>bi0 при а^°<Ь1\ очевидно, несовместна (рис. 141), то пересечение R{ Π ... Π R'j Π . · · Π #fe в этом случае пусто. Итак, если в (35.6) с = а)\ то пересечение R{ X ... X /?^Х ... X #£ будет отлично от нуля лишь при условии bt0 = αιλ Легко понять, чему равно это пересечение при выполнении указанного условия. Ведь куб #у получается, если в системе соотношений, определяющих куб Rj (см. (35.4)), неравенство а1? < х1° < Яу° + h заменить равенством хн = bh = aje. Значит, пересечение /^ X ... X R'j Χ ... X #fe получится, если в системе соотношений (35.5), определяющей параллелепипед R\{] ... Π Rk> неравенство bio<xio<cto заменить равенством xiu = btQ Таким образом, при выполнении условия Ъи = a}° пересечение Rx χ ... X/?у Χ ... Χ /^представляет собой главную грань St0 {bh) параллелепипеда Ri(] ... f\Rk, определяемую условием хи = Ь1* (рис. 142). Аналогично, если в соотношениях (35.6) c=^aJ-° + /2, то пересечение R* X · · · X R] X · · · X #& будет отлично от нуля лишь при условии Рис. 140. я, η α{β, ·
35] § 9 ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 297 £*° = а*0 + п и будет в этом случае представлять собой главную грань Su {cio) параллелепипеда Ri Π ··· f\Rk, определяемую условием хи = сн· Фиксируем теперь некоторое iQ e S \ Я. Тогда, как мы знаем, существует только одно значение /(=1, ..., k), для которого а1,* = Ьн (ср. рис. 131). Поэтому из всех слагаемых вида RY X ... X Щ χ ... χ Rk в правой части (35.3), для которых / = iQ и с = а\* (/=1, ..., k), только одно отлично от нуля, и, в силу сказанного выше, это отличное от нуля слагаемое равно Sio(^0)· Точно так же из всех слагаемых в правой части т'\ ~Р \ Ψ1' Rr , /=/, И={2}, а/*=Ь*0 R» "2 < Ь *, 1 1 1 1 I 1 I 1 \ λ 1 7 с У Рис. 141. Рис. 142. ОТ" (35.3), для которых i — /0 и с = alf + h {j = 1. ..., k) только одно лично от нуля, и это отличное от нуля слагаемое равно S u(ch). Таким образом, правая часть соотношения (35.3) равна 2(S*°(b*°) + Siu(ci(i)), где сумма берется по всем i0^S\H. Но это, очевидно, и есть граница параллелепипеда R{ X ... X Rk. Так,им образом, соотношение (35.3) (а вместе с ним и (35.2)) полностью доказано. Прежде чем переходить непосредственно к доказательству теоремы 35.1, мы сформулируем еще одно утверждение относительно цепей. Для формулировки введем понятие тела цепи. Пусть |Γ = Ρι+ ... + Ps — некоторая ^-мерная цепь. Ее телом будем называть объединение всех параллелепипедов Ри ..., ps и всех их граней (т. е. объединение замыканий параллелепипедов Ри ..., Ps). Тело цепи %г будем обозначать через |gr|; оно представляет собой замкнутое ограниченное множество пространства Еп (ср. рис. 133). Заметим, что для любой цепи |г справедливо соотношение I d\r | с 11Г | (ср. рис. 135). Нужное нам утверждение формулируется теперь следующим образом. Пусть Kh (О') — некоторый кубильяж пространства Еп и |г — произвольная г-мерная цепь, составленная из кубов этого кубильяжа. Через обозначим диаметр n-мерных кубов рассматриваемого кубильяжа. Пусть, далее, f:\lr\-> Еп — непрерывное отображение и d — такое число, что ρ (*, f (χ)) < d для любой точки χ е | |г |. Тогда существуют в Щбильяже Kh(0') такие цепи £Г-И, ζΓ, ηΓ, что цепь ζΓ+1 расположена \d 4- у)-окрестности множества | |г |, цепь ζΓ расположена в у-окрестностц
298 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [35 множества f(||r|), цепь ηΓ расположена в (d + у)-окрест ноет и множества \d\T |, и при этом справедливы соотношения άζ'+ι - lr + ζΓ + η', άζΓ - dlr + dr\r. Доказательство этого утверждения (которое мы в дальнейшем будем называть аппроксимационной теоремой) проводится средствами алгебргаи* ческой топологии. Наметим его вкратце. Обозначим для любой точки *е||г| через Ф* (*) точку tx + (\ — t) f (χ) (рис. 143). Тогда Ф^, 0</<1, представляет собой непрерывную деформацию множества | |г |, происходящую в if-окрестности множества | |г |, причем деформация множества |dgr|cz| ξΓ| происходит в d-окрестности множества \dlr\. При этой деформации из Рис. 143, Рис. 144. Рис. 145, цепи |г возникает (г + 1)-мерная непрерывная цепь D (ξΓ) (называемая также «деформационной» цепью), а из цепи d\r возникает непрерывная г-мерная цепь D (dlr), причем d(D(D)-lr + f(lr) + D(dlr), где / (|г) — непрерывная г-мерная цепь, являющаяся образом цепи ξΓ при отображении f (рис. 144). Применяя к цепям D (|г)> f (ξΓ), D (dlr) теорему о клеточной аппроксимации (для случая, когда в качестве клеточного разбиения пространства Еп берется кубильяж Кн(О')), мы и получаем из них цепи ξΓ+ , £Γ, η^ удовлетворяющие требуемым условиям (рис. 145). По поводу теоремы о клеточной аппроксимации и других деталей этого доказательства отсылаем читателя к курсам алгебраической топологии. Перейдем непосредственно к доказательству теоремы 35.1. Положим г{ = η —- dim L., г = 1, ..., k. Тогда r{ + ... +rk — (k— 1) я = я — (dimLj + ... +dimL^) = 0. Выберем, далее, такие точки Оь ..., 0&, что точка О/ имеет в системе (О; е{ еп) координаты (oj, ... of)t удовлетворяющие следующим двум условиям: 1) Оу = 0 при i = qi_l + 1, qy_j + 2, ..., gf; / = 1 k (т. е. точка О у имеет по осям расположенным в плоскости L/, координаты, равные нулю); 2) числа oj — о/ являются при \Ф1 иррациональными (/ = 1, ...,«; /, /=1, ..., k). (Например, такие точки можно получить, если все числа о;· при / = ^/~i + 1, <7/-1 + 2, ..., of j = \t . ♦., k положить равными нулю,
35} § 9. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 299 а в качестве остальных чисел oj взять в любом порядке числа π, π2, л3 .... я(*-1)/г.) J J °j — °l Благодаря такому выбору точек Ох Ok число ——г— будет нецелым при любых / Φ Ι (ί = 1, ..., η; j, / = 1, ..., k) и при любом рациональном h> и это позволит нам, при любом рациональном /ζ, применять к кубильяжам Кн(Ох) Kh(Ok) формулу (35.2). Далее, благодаря такому выбору точек Оь ..., Ok уравнения х* = 0 при / = ^/в1+1, fy.,, + 2. ...»fy (где / — одно из чисел 1, ..., k) определяют в системе (О/; еи ..., еп) плоскость G/, которая проходит через точку О (т. е. является подпространством) и имеет размерность я --(<?/ — qj-\) = η — dim L/ = г/. Кроме того, подпространство G/ содержит подпространство L,- для любого ι Φ j и потому распадается в прямую сумму подпространств Llt ..., L/-i, L/-h, ..., Lk. Следовательно, Gf содержится в несущей плоскости конуса Mj. Пусть Ρ ·— некоторое множество пространства Еп. Будем обозначать через Us (Ρ) объединение всех открытых шаров радиуса ό с центрами в точках множества Р; иначе говоря, £/5 (Р) есть δ-окрестность множества Ρ (в пространстве Еп). Выберем для каждого /=1, ..., k координатный параллелепипед Р/, имеющий Gj своей несущей плоскостью _и содержащий точку О. Будем при этом предполагать, что Р/ cz Mj и Q φ. Ρ/, где Ρ/ = Ρ/ (J (relbd P/) — соответствующий замкнутый параллелепипед. Так как пе£есечение G\{\ ,.. fl G^ состоит только из одной точки О, то и пересечение Pj Π · · · Π Pk содержит только одну точку О, которая является внутренней точкой каждого из многогранников Р/ относительно его несущей плоскости <2у. Из этого вытекает что для любого /=1, ...; k пересечение (relbd Ρ/) П /РЫ пусто. Поэтому существует такое число ό>0, что для любого / = 1, ..., k множества £/4б (relbd Ρ/) и |) £/4δ (Ρι) имеют пустое пересечение. Кроме 1 + 1 того, можно дополнительно предполагать (уменьшив, если нужно, число о), что множество U& (Pj) не содержит точки Q. Так как М/ является шатром множества Ω/ в точке Q, то существует отображение ψ/, определенное вблизи вершины Q конуса М/ и удовлетворяющее условиям 1), 2) определения 34.1. Область определения отображения ψ у обозначим через My. Таким образом, все достаточно близкие к О точки конуса М/ принадлежат множеству Mj. Обозначим теперь через ge гомотетию с центром Q и коэффициентом ε>0. При гомотетии g& множество £/4δ (Ρ) переходит в 46е-окрестностъ множества ge (Ρ), т. е. 8*(и4ъ(Р)) = и4ыШР))-
300 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ (35 Из'этого вытекает, что для любого /= 1, .. .,& множества ί/4δε (relbd^ge (P/)) и (ι £/4δε (δ*ε (Ρι)) имеют пустое пересечение; кроме того, множество 1 + 1 _ #δε (g& (Pj)) не содержит точки Q. Так как ψ; (А) - А + oQ (Л), т. е. ρ (Л, ψ; (Л)) = oQ (Л), (35.7) то найдется такое е>0, что для всех /= 1, ..., k выполнено при Де^8 (Pj) неравенство _ ρ (Л, фу (А)) < δε (Α с= £ε (Ρ/)). (35.8) Мы выберем такое число ε и более менять его не будем. Координатный параллелепипед ge(Pj) (где /=1, ..., k) определяется в системе (О; elt ...-, еп) соотношениями вида х* = а\ при i*-q* j + 1, q*x +2, ...,<ь; ill (35'9) ay<* <β^ при остальных значениях /. Пересечение g&(Pi)(]... (]ge(Pk) состоит из одной точки, имеющей в системе (О; еи ·..» еп) координаты (а1, ..., ап). Если немного изменить числа (Ху, βί в соотношениях (35.9), то мы получим новый координатный параллелепипед Ру, «близкий» к параллелепипеду g (PA Произведем изменение чисел cty, fij в соотношениях (35.9) таким образом, что получающиеся в результате параллеле-пипеды PJ, ..., Р£, «близкие» к параллелепипедам £ε (Ρ\)> ···> ge(Pk)> обладают свойствами: а) параллелепипед Р*, является рациональным в системе (О л е{, ..., еп)\ б) параллелепипед P*j содержится в όε-окрестности множества ge (Ρ Λ а его граница relbd Ру содержится в όε-окрестности множества relbd ge(PA; в) пересечение PJfl . ·· ПР| непусто (и, следовательно, состоит из одной точки). Очевидно, что все эти условия будут выполнены, если при переходе от параллелепипеда g6 (P^) к параллелепипеду Ру числа aj·, β' в соотношениях (35.9) изменяются достаточно мало. Так как P*f является (для каждого / = 1, ..., k) рациональным параллелепипедом в системе (Of, ех, ..., еп), то существует такое рациональное число /г*, что параллелепипед Р% целиком составлен из базисных /г*-кубов ■ кубильяжа Kh*(Oj) и то же справедливо для relbd Ру. Ясно, что при любом натуральном ρ число /г = /г*/р обладает тем же свойством, т. е. каждое из множеств Р*-у relbd PJ представляет собой объединение конечного числа базисных /г-кубов кубильяжа /С^ (Оу), /=1, ..., k. Итак, существует как угодно малое число /г, обладающее тем свойством, что каждое из множеств PJ, relbd Ρ*ι представляет собой объединение конечного числа базисных /г-кубов кубильяжа Kh(Of),j = 1, ..., k. Мы докажем теперь, что пересечение *ι (8в (Ρι)) П ... П ** tee (Ph)) (35.10)
35j § 9 ТЕОРЕМЫ СУЩЕСТВОВАНИЯ 301 непусто. Допустим, напротив, что пересечение (35.10) пусто; тогда существует, такое число γ>0, что пустым будет и пересечение <МММЛ)))П ··· Мч(*к(еЖ)))· («.и) При этом можно дополнительно предполагать, что γ<όε. Выберем теперь такое h>0, что hYn <γ и при этом каждое из множеств Ру, relbd Ру представляет собой объединение конечного_числа базисных /г-кубов кубильяжа Kh(Oj), /=1,..., k. Соотношение hVn< γ означает, что диаметр каждого базисного /г-куба кубильяжа Kh(Of) меньше γ. Обозначим для любой точки Л е Ру через <fy (Л) ближайшую к А точку параллелепипеда ge(Pj). В силу теоремы 29.5 отображение qpy: P)^ge(Pj) однозначно_определено и, как легко видеть, непрерывно, причем для любой точки Α^Ρ*ι справедливо соотношение ρ (Л, фу (Л)) < δε (см. условие б) на стр. 300). Учитывая (35.8), получаем отсюда, что для любой точки А^р* справедливо соотношение ρ (Л, 1|)/(Ф/(Л)))<р(Л, Ф/ (Л)) + ρ (φj (Л), фу (ф/ (Л))) <δε + δε = 2 δε. Таким образом, отображение fj — tytotyi, определенное и непрерывное на параллелепипеде Ру, обладает тем свойством^ что ρ (Л. fl(A))<2 6s\ А<=Р)} /=!,..., к. (35.12) Обозначим теперь через ξ, цепь размерности г., состоящую из всех Гу-мерных кубов кубильяжа Kh(OX содержащихся в "параллелепипеде Р,, / = 1,..., k. Таким образом, | |у | — Ру, | dgy | = relbd Py. Применяя к цепи |у и отображению f* аппроксимационную теорему, сформулированную на стр. 297—298, и учитывая соотношение (35.12) и соотношение γ<δε, получим в кубильяже Kh (Oj) такую цепь £у размерности Гу + 1 и такие цепи 5у, ηy размерности г., что Ι ε; | = υ36ε(ι ι, ι) = um(ty <= ui6e(gB (p,)), 11,1c uy (f, (I h I))c ϋν (ψ/ (*Λ)))c ^m. <*. (P/))· 11/ 1=^3ββ(Ι «*6/ |)=^3ee('-elbdP;)cC/4ee(relbdire(P/))> | d|/1 = relbd J) с I/te (relbd g£ (P,)) (см. условие б) на стр. 300 и соотношение (35.8)) и при этом справедливы соотношения < = 1/ + £/ + Л/. <*S/-«f6/ + <*4/. /=1 *· Рассмотрим теперь цепь λ/ = SiX ... ΧΖ^Χζ',ΧΙι+ΐΧ ··· Χ|»· /=ι ft.
302 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ (35 Эта цепь определена в силу выбора кубильяжей Kh (Oj), /=1, ..., & и имеет, размерность а\тк^г{+ ... +'/-ι + (Γ/+Ι) + Γ/+ι+ ··· + rfc — (Λ — 1) л — 1. Согласно формуле (35.2) граница цепи λ/ имеет следующий вид: /-1 λ,-^Κ··· χ λ, χ ··· xt]x ···)+(♦·· χ^/χ ···) + к + Σ (··· Х£/Х ··· ХЛЪХ '...). (35.13) где многоточия означают невыписанные члены (которые перед ζ^ имеют вид £j, а после ζ^ имеют вид |;). Рассмотрим имеющееся в; первой сумме слагаемое ... Xd^X ... Х£уХ ..., или, более подробно, dx ... χδί-ιΧ^χε,+ιΧ .... χε/_,χε;χξ/+ιΧ ... χε*. (З5.н) Так как каждая из цепей ζ^ ζ^ \t расположена ,в ί/4δε (gB (Ρχ))* а цепь ^ = άξ( + dr\i расположена в ϋ46ε (relbd g£ (/^)), то цепь (35.14) расположена в множестве U4be (relbd ge (Pi)) П / Π ^δε (ffe (?/))). Так как это пересечение, по построению, пусто, то цепь (35.14) равна нулю. По тем же соображениям равно нулю и каждое слагаемое второй суммы, стоящей в правой части соотношения (35.13). Следовательно, формула (35.13) принимает вид ^λ; = ζ, X ... XS/_,X«Jxg/+1X ... Xlk. Вспоминая соотношение άζ] = ξ/ + ζ/ + Ή/> получаем .отсюда: άλι = ζχΧ ... ΧζΗιΧΙ;Χ ... Χξ^ + ξ,Χ ... Χζ7Χξ/+1Χ ...X£fe + + ζ{Χ ... XC/e,X^X6/+1X ... Xlk. Последнее слагаемое в правой части здесь равно нулю (по тем же соображениям, что и прежде), и потому Λ,^ζ,Χ... ΧζΙ_ιΧΙίΧ ... ΧΙ^ + ζ,Χ ... ΧΕ7Χ6/+ΙΧ ... Xlk. Напишем эти соотношения для /=1,..., k и сложим все получившиеся таким образом равенства; тогда получим (учитывая, что дважды встречающиеся слагаемые можно в сумме цепей вычеркивать): d(\ + ··· +λΑ) = ι1χ...χξ, + ξ,χ...χξ,. Вспомним теперь, что | ζ^ | с: U (ψ^ (g& (Р^))), / = 1 k> и потому тело цепи ζ1 χ ... Χζ^ содержится в множестве (35.11). Так как, по предположению, множество (35.11) пусто, то ζχΧ ... χζ^==0. Следовательно, <*(λ,+ ... +λ4)-ξ,χ...Χ6Α.
35] § 9. ТЕОРЕМЫ СУЩЕСТВОВАНИЯ ' 303 Но цепь | X · · · X %ь представляет собой одну точку, так как пересечение Ρ* Π · · — Π P*h представляет собой одну точку. Мы получили, что граница одномерной цепи λι + ... + λ& есть одна точка, между тем как граница любой одномерной цепи должна состоять из чет наг о числа точек. Полученное противоречие показывает, что пересечение (35.10) непусто. Пусть В — произвольная точка множества (35.10). Так как в силу (35.8) ВЕ=гММЛ))с:^е(£е(Л)) и Q £ U6e (gt (P,)), т0 β φ Q. Далее, для любого /== 1, ..., k имеем Де*/(*в(^))<=*/(^|) = 0/. и потому В е Ωι Π · · · Π &k- Таким образом, точка В является искомой. Замечание 35.2. Можно предложить другое, значительно- более простое доказательство теоремы 35.1, однако при выполнении дополнительного условия, что отображения ψι, ..., ψ* (показывающие, что Ми ..., Mk являются шатрами множеств Ω1? ..., Qk) определены в некоторой окрестности точки Q и являются гладкими отображениями. Пусть О, по-прежнему, общая внутренняя точка конусов Ми ..., Mk. Обозначим через Nu ..., Nk несущие плоскости конусов Ми ..., Mk. Выберем такие открытые шары Еи ..., Ek в плоскостях N\f ..., Nk с центром Q, что Et содержится в области определения отображения ifo, /=1, ..., k. Тогда ф*(£*) есть гладкое многообразие (размерности dimJV;) в пространстве Еп9 проходящее через точку Q и имеющее в точке Q касательную плоскость Ni (/=1, ..., k). Докажем, что при любом /==1, . ·., k пересечение Ψι(£Ί)η ... Π ψ/(£7) представляет собой вблизи точки Q гладкое многообразие, имеющее в точке Q касательную плоскость Νλ[\ ... (]Nj. При j=l это утверждение справедливо. Допустим, что оно справедливо для некоторого j < k, и докажем его справедливость для числа /+1, т. е. докажем, что Ψι(£ι)η ··· Π'Φ/(£'/)Π'Ψ/+ι(£,/+ι) есть гладкое многообразие, имеющее в точке Q касательную пло:кость Ν{(] ... (]Nj(]NI+l. Так как *i№)fl ... η*/№/)η*/+ι№/+ι) = = (*,№)П ... ηψ/(£/))ηψ/+ι(β/+ι), причем ^(f^n ... f]^i(Ef) и -фж (EJ+l) являются вблизи точки Q гладкими многообразиями, имеющими в точке Q касательные плоскости Νχ Π · · · Π Nj и N/+1, то достаточно установить, что Ν{ Π ... Π Nj и Nj+i не лежат в одной гиперплоскости (см. теорему 33.12). Но это непосредственно вытекает 83 того, что Li czyVif) ··· (]Nf при / = /+1, ..., k и LtciNi+l
304 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [35 при /==1, ..., / (где Lu ..., Lk — подпространства, построенные в начале доказательства теоремы 35.1; стр. 290). Таким образом, наше утверждение доказано для всех /= 1, ».., k. В частности, при j = k находим, что ^(f^f) ... O^k(Ek) представляет собой вблизи точки Q гладкое многообразие, имеющее в точке Q касательную плоскость N{ П · · · Π Nk. Так как OeJV,(1 ... [\Nki то существует на многообразии ifr (£,) Π . ·. Π 'Φλϊ (Ek) кривая Λ, исходящая из точки Q и имеющая в точке Q касательный вектор QO. Отображение ψ/ΐ Ef->^f(Ej) является (если шар Е} достаточно мал) взаимно однозначным,#т. е. существует отображение φ μ ψ/(£/)-~>Ej, обратное к ψ/. Это означает, что Ψ/(φ/ (χ))=χ Для любой точки Λ^ψ/ (£/), лричем отображение ср/, как и ψ/, имеет тождественное отображение своим касательным отображением в точке Q. Следовательно, кривая φ/(Λ), расположенная в шаре £/, также имеет QO своим касательным вектором в точке Q. А так как О —внутренняя точка конуса Mf относительно его несущей плоскости, то найдется на кривой φ/(Λ) такая точка С/, что вся дуга этой кривой от точки Q до С/ принадлежит М/ (рис. 146). Следовательно, вся Рис. 146. Рис. 147. дуга кривой Ψ/(Φ/(Α)) = Λ от точки Q до точки β;· = ψ/((?/) принадлежит множеству ^}(Mf(]E})czQj. При этом Bj φ Q, так как отображение ψ/ взаимно однозначно. Указанное положение вещей имеет место для любого /=1, ..., k. Таким образом, вся дуга кривой Л от точки Q до некоторой отличной от Q точки В содержится в множестве Ω{(] ... Π Ω^, откуда и вытекает справедливость теоремы 35.1,
36] § 10. КРИТЕРИИ ЭКСТРЕМУМА 305 Если ограничиться этой версией доказательства (т. е. дополнительно считать в теореме 35.1, что ift, ..., ψ^, — гладкие отображения), то придется ограничиваться такими множествами Ω/ и такими их шатрами Mh для которых существует гладкое отображение ψ/, удовлетворяющее условиям 1), 2) определения 34.1. Нижеследующий пример показывает, что гладкое отображение ψ; требуемого вида существует не всегда, т. е. приведенное в этом замечании доказательство, хотя и является более простым, но позволяет получить лишь более слабый результат, чем теорема 35.1. Пример 35.3. Построим на плоскости х, у бесконечно- звенную ломаную А0А1А2А3 ... с вершинами * = (Т'±)' '-О. 1.2.... Добавив к этой ломаной точку Q(0, 0), получим замкнутое множество на плоскости, которое обозначим через Ω (рис. 147). Далее, через Μ обозначим неотрицательную полуось абсцисс. Наконец, за ψ примем проектирование отрезка [0, 1] оси абсцисс на множество Ω параллельно оси ординат. Это отображение ψ удовлетворяет условиям 1), 2) определения 34.1, т. е. Μ есть шатер множества Ω в точке Q. Легко видеть, что гладкого отображения ψ, обладающего требуемыми свойствами, не существует. § 10. Критерии экстремума 36. Необходимое условие экстремума функции. В этом пункте мы сформулируем и докажем необходимое условие экстремума функции, которое является более общим (т. е. имеет более широкую область применимости) и более сильным (т. е. накладывает больше требований), чем условие п. 7. Кроме того, приводимое в этом пункте условие выгодно отличается еще и тем, ζο ^^ что оно, во всяком случае, по форме ^^.^^S^^"^ является универсальным, формули- *д^ΰζ руется одинаково для любой точки области определения функции, в то · время как метод п. 7 требует раздельного рассмотрения точек, лежащих внутри «криволинейного многогранника» или^на его гранях различного числа измерений. Пусть Μ — выпуклый конус с вершиной в точке zQi расположенный в пространстве^, и Ьг = {6г\ ..., δζη} — некоторый вектор пространства Еп. Будем говорить, ψγο направление
306 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [36 вектора Ьг принадлежит конусу М, если найдется такая точка z^M, что вектор ζ — ζ0 равен бг (рис. 148)., Теорема 36.1. Пусть Qu ..., Ω/ — некоторые множества в пространстве Еп. Пусть, далее, Ρ {ζ) —гладкая функция, определенная на некотором открытом множестве пространства Еп, содержащем множество Σ = ΩΙ f) ... Г) Ω/. Поставим задачу: найти точку, в которой функция Ру рассматриваемая лишь на множестве Σ, достигает своего наименьшего значения. Пусть 20εΣ и Μι — шатер множества Ω^ в точке ζ0, /= 1,..., /. Для того чтобы точка ζ0 давала решение поставленной задачи, т. е. чтобы имело место соотношение F°(zQ)^F°(z) при ζεξΣ, необходимо существование такого числа ψ0 и таких векторов аи ..., аь что направление вектора аь принадлежит двойственному конусу D(Mi), /=1, *..,/, и выполнены следующие условия: (α) Ψο<0; (β) Ψο gr ad F° (z0) = a{ + a2+ ... + at; (v) если ψ0 = 0, то хотя бы один из векторов аи а2у ..., а/ отличен от нуля. Если ставится задача о максимуме (а не о минимуме) функции F0 на множестве Σ, то знак неравенства в (а) заменяется на противоположный *). Доказательство. Если grad F°(z0) = 09 то, полагая ψ0 = —1, а{ =а2 = ... = ak = 0, получим величины ψ0, al9...,ah удовлетворяющие всем условиям (α) — (ν) (независимо от того, достигает ли функция F°(z) в точке z0 минимума или нет). Таким образом, при grad F° (z0) = 0 утверждение теоремы тривиальным образом справедливо. Поэтому в дальнейшем будем предполагать, что grad F° {z0) φ 0. Обозначим через Ω* множество, содержащее точку ζ0 и все точки ζ^Εη, для которых функция g {ζ) = F° (ζ) — F° (zQ) принимает отрицательные значения (т. е. F°{z)< F°(z0)). Далее, через Μ* обозначим полупространство, состоящее из всех точек ζ^Εη, для которых (ζ — z0) grad g (г0Х 0 (или, что то же самое, (ζ — z0) grad F° (z0) ^ 0). Согласно замечанию 34.5, множества Μ* является шатром множества Ω* в точке ζ0. Докажем, что система конусов Μ*, Μ{, ..., М/ с общей вершиной ζ0 обладает в Еп свойством отделимости. В самом деле, допустим, что эта система конусов не обладает свойством отделимости. Тогда согласно теореме 35.1 найдется отличная -*) Это замечание (о замене знака неравенства в (а) на противоположный при рассмотрении задачи о максимуме функции) относится и ко всем дальнейшим теоремам этого пункта.
зб] § 10. КРИТЕРИИ ЭКСТРЕМУМА • 307 от z0 точка zl^Q*(]Qlf] ... Π Ω/ (заметим, что Μ* есть полупространство, т. е. М* не является плоскостью). Так как z,eQ* и Ζχ¥=ζ09 то g(zx)<09 т. е. F°(z{)< F°(z0). Таким образом, мы нашли такую точку 2,е2, что Ε°(ζ{) < F°(z0). Но это противоречит тому, что функция F0, рассматриваемая на Σ, достигает в точке z0 наименьшего значения. Полученное противоречие и доказывает, что система конусов ЛГ, Мь ..., Мг обладает свойством отделимости. Согласно теореме 32.2 существуют такие векторы а\ аи ..., at, направления которых принадлежат соответственно конусам £)(ЛГ), D(M{), ..., D(M{), что хотя бы один из этих векторов отличен от нуля и а* + а{+ ... +Я/ = 0. Так как ЛГ — полупространство, определяемое неравенством (z--z0)gradF0(z0)<0, то а* = - <ψ0 grad F° (zQ), где ψ0<0. Очевидно, что величины ψ0, αΐ9 ..., at^—искомые. Случай задачи о максимуме функции F°(z) непосредственно сводится к разобранному случаю: нужно лишь рассмотреть задачу о минимуме функции — Я(г0). Теорема 36.2. Пусть Ω' — множество, определяемое в пространстве Еп переменных z\ ..., zn уравнениями Я(г) = 0, ..., Fk{z) = 0] ' (36.1) далее, Ω" — множество, определяемое неравенствами /■(*)<0, ..., Р(г)<09 (36.2) и Qu ..., Ω/ — произвольные множества пространства Еп. Пусть, наконец, F° (z) — гладкая функция, определенная на некотором открытом множестве пространства Еп, содержащем множество Σ = Ω'ηΩ//Γ)ΩιΠ •••ΠΩ/· Поставим задачу: найти точку, в которой функция F0, рассматриваемая лишь на множестве Σ, достигает своего наименьшего значения. Пусть ζ0^Σ и Μι — шатер множества Ω/ в точке z0, i=l, ..., /. Через I(z0) обозначим зону активности в точке ζ0. Для того чтобы точка ζ0 давала решение поставленной задачи, т. е. чтобы имело место соотношение F°(z0)^F>(z) при ζ€=Σ, необходимо существование таких чисел ψ0, ifr, ..., ψ^, таких векторов а{, ..., аь направления которых принадлежат соответственно двойственным конусам D(M{), ..., D{Mt), и таких неположительных чисел λ/, /<=/(г0), что выполнены следующие условия: (α) ψ0<0; . (β) StagradFa(z0)+ Σ ^grad//(20) = a1 + ...+a/; α=0 /е/(,г0)
303 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [36 (V) если все числа ψ0, Ψι, ..., Ψ* α λ7, /e/(z0), /?дв/ш нулю, то хотя бы один из векторов а,, ..., #/ отличен от нуля. Доказательство. Обозначим через Ω* гиперповерхность, определяемую в Еп уравнением /7'(г) = 0, а через Ω"— множество, определяемое в Еп ограничением fj(ζ) ^0 (/=1, ..., k\ j^I(z0)). Заметим, что если grad Fl(z0) = 0 при некотором / = α, то, полагая ψα = — 1, а все остальные величины ψ,·, λ/, ah считая равными нулю, мы удовлетворим требованиям теоремы (независимо от того, достигает ли функция F°(z) минимума в точке z0). Точно так же, если grad fJ(z0) = Q при некотором ;=β^/(20), то мы удовлетворим требованиям теоремы, положив λρ = — 1, а все остальные величины ψ,,·, λ/, ah считая равными нулю. Поэтому мы можем считать, что gradF(20)^=0, gradf^o) φ 0 для всех /, /. В этом случае'гиперплоскость Λί{, определяемая уравнением (z—z^gradF1 (z0)=0, является шатром множества Ω* в точке ζ0 (ί=1, ..v., k), а полупространство, определяемое неравенством {ζ — z0) grad f (z0) ^ 0, является шатром множества Ω/' в точке 20(/<=7(ζ0)). Применяя к функции F°(z), рассматриваемой на множестве"!, теорему 36.1, найдем, что существуют такое число ф0<0 и такие векторы а\ (/ = 1, ..., k), сС[ {] <= / (z0)), ah (h = 1, ..., Ι), что tograd F4z0) = Σ υ + Σ в? + 2*α, причем в случае ψ0 = 0 хотя бы один из векторов а\, a", ah отличен от нуля. Остается заметить, что в силу определения множеств Mi и М\ имеем < = - % grad F* (ζ0)9 а'! = - λ, grad />(z0), где x|)t- (/ = 1, ..., k) — действительные, а Яу (/ е / (г0)) ~ неположительные числа. В доказанной теореме k, q, I могут быть любыми неотрицательными целыми числами. В частности, любое из них (или любые два из них) можно считать равными нулю, в результате чего мы из теоремы 36.2 получим шесть частных случаев. Например, теорема 36.1 является частным случаем теоремы 36.2, получающимся при & = 0, q = 0. Из всех остальных частных случаев мы сформулируем лишь один, получающийся при /==0. В этом случае множеств Ω}, ..., Ω/ нет совсем, т. е. в качестге пересечения Ω, f| ... Π'Ω/ следует рассматривать все пространство Еп (можно также считать, что 1=1 и Ωι=£,/ι, так что Мх=Еп и DiAM-foJ). Теорема 36.3. Пусть Σ — множество, определяемое в пространстве Еп соотношениями (36.1), (36.2), и F0 (г) — гладкая
361 § 10 КРИТЕРИИ ЭКСТРЕМУМА $09 функция, определенная на некотором открытом множестве пространства Еп, содержащем множество Σ. Поставим* задачу: найти точку, в которой функция F°9 рассматриваемая лишь на множестве Σ, достигает своего наименьшего значения. Для того чтобы точка г0 £Ξ Σ давала решение поставленной задачи, т. е. чтобы имело место соотношение F (z0) < F (ζ) при 2GU, необходимо существование таких чисел ψ0, Ψι, ..., Ψλ и таких неположительных чисел λ/, j^I(z0), что хотя бы одно из чисел ψ*, λ/, где ί=0, Ι, ..., k, /e/(zfl), отлично от нуля и при этом выполнены следующие условия: (α) ψ0<0; (β) Stagradfa(^0)+ Σ Mrad/'(*o) = 0. α=0 / e= / (го) Заметим, что если при j&I(zQ) положить λ;· = 0, то условие (β) примет вид Σ ΨαgradFa(z0) + Σ λ/grad/'(z0) = 0, a=0 /=1 причем будут справедливы равенства (так как fJ{z0) = 0 при j<=I{z0) и λ, = 0 при j&I(z0)). Таким образом, из теоремы 36.3 непосредственно вытекает теорема 11.4, сформулированная в главе I (стр. 85—86): достаточно λ; заменить на — σ*. Замечание 36.4. Рассмотрим частный случай теоремы 36.3, получающийся, если неравенств (36.2) нет совсем, т. е. множество Σ задается в Еп уравнениями (36.1). В этом случае условие (β) в теореме 36.3 принимает вид k 2^agradFa(z0) = 0, (36.3) a=0 или, в координатной записи, ^М = 0, /=1, ..., п. (36.4) k Σ*· д2г α=0 Таким образом, для того .чтобы функция F°(z), рассматриваемая на множестве Ω, определяемом уравнениями (36.1), достигала в точке zQ экстремума, необходимо существование отличного от нуля вектора ^ = {^о» Ψι> ♦*·> ^J> удовлетворяющего
310 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ (36 условию (36.3) [или (36.4)). Это— классическая теорема Ла- гранжа об условном экстремуме. Теорема 35.3 (а тем более 35.2) является обобщением этой теоремы. Замечание 36.5. В теоремах 36.2, 36.3 не требуется, чтобы функции Я,/71, ..., Fk были независимыми, т. е. чтобы / dFl \ ранг функциональной матрицы —т! был равен fe + Ι. Однако в случае зависимости функций F°, F\ ..., Fk утверждения этих теорем становятся бессодержательными. Рассмотрим более общую теорему 36.2. Если в точке 20εΣ ранг функциональной матрицы ί—j) меньше £+1, т. е. векторы grad Я (20), grad Я (z0), ..., grad Fk (z0) линейно зависимы, то условия (α), (β), (γ) в точке ζ0 выполняются (независимо от вида множества Σ и от поведения функции F0 на этом множестве). В самом деле, в рассматриваемом случае существуют такие числа ψ0, ψ^ ..., \|)ь не все равные нулю, что 2tagradFa(z0) = 0. a=0 Поменяв, если нужно, знаки всех чисел ψ0, ψ,, ..., ψ^ на противоположные, мы можем считать, что ψ0^0, и потому при λ/ = 0, αΛ = 0 все условия (α), (β), (γ) будут выполнены. Таким образом, формально теорема 36.2 справедлива всегда, но в действительности она представляет интерес лишь в случае, если векторы grad Fl(z0)y / = 0, 1, ..., k, линейно независимы. То же относится и к последующим теоремам. Замечание 36.6. В теореме 36.1 не требуется, чтобы система конусов Ми ..., Mt не обладала свойством отделимости. Однако в случае, если эта система конусов обладает свойством отделимости, утверждение теоремы 36.1 становится -бессодержательным. В самом деле, пусть система конусов Μϊ9 ..., Mt обладает в Еп свойством отделимости. Тогда в силу теоремы 32.2 существуют такие векторы аи ..., аи хотя бы один из которых отличен от нуля, что направление вектора а} принадлежит конусу Ζ)(Λί/), /==1, ...,/, и имеет место соотношение а, + ... +Я/ = 0. Поэтому при ψ0 = 0 все условия (α), (β), (γ) теоремы 36.1 будут выполнены. Таким образом, формально теорема 36.1 справедлива всегда, но в действительности она представляет интерес лишь в случае, если система конусов М{) ..., Μι не обладает свойством отделимости.
36] § 10. КРИТЕРИИ ЭКСТРЕМУМА 311 Аналогичное замечание относится и к дальнейшим теоремам (поскольку они выводятся из теоремы 36.1). Обратимся, например, к теореме 36.2 и обозначим через П/ (/ е / (z0)) полупространство, определяемое неравенством {z — 20)grad /'(г0)^0, а через Г* (i=l, ..., k) — касательную гиперплоскость гиперповерхности Fi(z) = 0, проведенную в точке г0. Теорема 36.2 представляет интерес лишь в случае, если система конусов Л\·, П/, Mh (i= 1, ..., k\ /e/(z0); h= 1, ..., /) с общей вершиной 20 не обладает в Еп свойством отделимости (иначе утверждение этой теоремы бессодержательно). Заметим, в частности, что утверждение теоремы 36.2 (так же как и теоремы 36.3) становится бессодержательным, если система ограничений (36.2) не является в точке z0 невырожденной. В самом деле, условие невырожденности этой системы ограничений в точке z0 означает, что все полупространства П/, /е/(20), имеют общую внутреннюю точку. Если это условие не выполнено, то в силу теоремы 32.5 система конусов Π у (/ е / (zQ)) обладает свойством отделимости, а потому подавно и система конусов Γ\·, Π/, Mh обладает свойством отделимости. Таким образом, хотя формально в теоремах 36.2, 36.3 это и не требуется, но указанные теоремы представляют интерес лишь в том случае, если система ограничений (36.2) является в точке 20 невырожденной. Теорема 36.7. Пусть Qu ..., Ω/, Ξ,, ..'., Sm — некоторые множества в пространстве Еп. Пусть, далее, F°(z)—гладкая функция, определенная на некотором открытом множестве пространства Еп, содержащем множество Σ = Ωι[) ... f) Ω/Π^ι Π ··· Π-m· Поставим задачу: найти точку, в которой функция F°t рассматриваемая лишь на множестве Σ, достигает своего наименьшего значения. Пусть. z0 е Σ и пусть Μι — шатер множества Qt в точке z0 (i = 1, ..., /), a Nj — шатер множества Ξ} в точке z0 (/=1, ..., m). Предположим, наконец, что система конусов Λ/Ί, ..., Nm {с общей вершиной z0) не обладает свойством отделимости. Для того чтобы точка г0 давала решение поставленной задачи, т. е. чтобы имело место соотношение F>{z0)^F0(z) при ζ€=Σ, необходимо существование такого числа ψ0 и таких векторов а{, ..., аи что направление вектора at принадлежит двойственному конусу D(Mi), /=1, ..., I, и выполнены следующие условия: (α) ψ0<0; (β) (Ψο£racl ^°(zo) ~~ a\ "" · · · — ai)bz^0 для любого вектора bz, направление которого принадлежит конусу N{ f) ,.. f| Nm;
312 ГЛ IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [36 (у) если ψ0 —0, то хотя бы один из векторов ah аъ ..., щ отличен от нуля. Доказательство. В силу теоремы 36.1 существует такое число ψ0<0 и такие векторы аь ..., аи Ъх, ..., Ьт, что направление вектора аь принадлежит конусу D(Mi), /=1, ..., /, направление вектора 67 принадлежит конусу D(Nj), )' = 1, ..., m, и выполнено соотношение q0grad F(z0) = al + Λ. + α, + »,+ ... + bm, (36.5) причем в случае ψ0 = 0 хотя бы один из векторов ах, ..., at, 6j, ..., bm отличен от нуля. Если мы предположим, что Ψο — Ο, а{ — ... = aL = 0, то получим Ьх+ ... + Ьт = 0, причем среди векторов Ьх, ..., Ьт должны быть отличные от нуля. Но это противоречит тому, что система конусов Nb ..., Nm не обладает свойством отделимости. Следовательно, среди величин ψ0, ах, ..., at имеются отличные от нуля, т. е. условие (у) выполнено. Как мы видели, ψ0^0, τ. е. условие (а) также выполнено. Остается проверить выполнение условия (β). Положим n = t|)0gradF(z0) — ах — ... — а/. (36.6) Так как п = Ьх + ... + Ьт (см. (36.5)), то в силу леммы 32.1 направление вектора η принадлежит конусу, который служит выпуклой оболочкой конусов D(NX), ..., D{Nm). Согласно следствию 31.4 это означает, что направление вектора η принадлежит конусу D (Νχ Π · · · Π Nm), т. е. п bz < 0 для любого вектора Ьг, направление которого принадлежит конусу Νχ О ... О Nm. Но это и означает в силу (36.6), что выполнено условие (β). Теорема 36.8. Пусть Ω' — множество, определяемое в пространстве Еп уравнениями Я(г) = 0, ..., F*(z) = 0, и В' —· множество, определяемое в Еп уравнениями G'(z) = 0, ..., Gr(z) = 0, Пусть, далее, Ω" — множество, определяемое неравенствами Пг)<0, ..., f(z)<0, Ξ" — множество, определяемое неравенствами gl(z)<0, ..., g*(z)<0, (36.7) и Ωχ, ..., Ω/, ΞΙ? ..., Em — произвольные множества пространства Еп. Пусть, наконец, F° (z) — гладкая функция, определенная на некотором открытом множестве пространства Еп, содержащем множество 2 = Ω'ΠΩ"ΠΩ1Π ... ПЙгПЗ'П2/'Па1П ··· Π Зщ-
36] § 10. КРИТЕРИЙ ЭКСТРЕМУМА 313 Поставим задачу: найти точку, в которой функция F0, рассматриваемая лишь на множестве Σ, достигает своего наименьшего значения. Пусть £0 ^ Σ и пусть Mi — шатер множества Ω, в точке z0 (/ = 1, ..., /), Nf — шатер множества Ei в точке z0 (/ = 1, ..., τη). Через I(z0) обозначим множество тех чисел /=1, ..., q, для которых р (z0) = 0, а через J (z0) — множество тех чисел /=1, ..., ρ у для которых gj{z0) = 0. Будем предполагать, что βοβ векторы grad Gl (z0), i = 1, ..., r; grad gj (z0), / e= / (z0), отличны от нуля. Обозначим через Lt касательную гиперплоскость гиперповерхности Gl(z) = 0 в точке z0 (i= 1, ..., г), а через Pf — полупространство, определяемое неравенством (z — 20)grad ёЧго)^®> и предположим, что система выпуклых конусов Lu Pjy Nh (где /=1,..\, г; / е /(г0); h= 1, ..., m) не обладает свойством отделимости. Для того чтобы точка z0 давала решение поставленной задачи, т. е. чтобы имело место соотношение F°(z0)^F°{z) при ζεξΣ, необходимо существование таких чисел ψ0, ψ,, ..., ψ^, таких векторов а{, ..., аь направления которых принадлежат соответственно двойственным конусам D(MX), ..., D(Mt), и таких неположительных чисел λ;·, j^I(z0), что выполнены следующие условия: (α) Ψο<0; (M-(StagradFa(20)+ Σ ^grad//(z0)-a1-...-a/)6^<0 для любого вектора bz, направление которого принадлежит пересечению конусов Li, Ρ ι, Nh(i= 1, ..., г; /е /(г0); h= 1, ..., m); (v) если все числа ψ0, ψ,, ..., ψ^ w λ/, j^I(z0), равны нулю, то хотя бы один из ^векторов аь ..., а/ отличен от нуля. Эта теорема непосредственно вытекает из предыдущей (ср. доказательство теоремы 36.2). Теорема 36.8 является наиболее общей из содержащихся в этом пункте теорем. В ее формулировке k, r, q, ρ, /, m могут быть любыми неотрицательными целыми числами. Считая некоторые из них равными нулю, мы получим из теоремы 36.8 целый ряд частных случаев. Например, теорема 36.2 является частным случаем теоремы 36.8, получающимся при r = p = т=0 (или можно считать, что r = p — 0, m=\ и 3, = jV, = Еп). Из всех остальных частных случаев мы сформулируем лишь
314 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [30 две теоремы (первая из них получается при f = q = р = 1 = 0, а вторая получается' при r = q = l— m = 0, если учесть, что условие невырожденности системы ограничений (36.7) в точке z0 равносильно свойству неотделимости конусов Р}) j е / (z0)). Теорема 36.9. Пусть Ω' — множество, определяемое в пространстве Еп уравнениями Fl(z) = 0, ..., /*(*)»0, и В, Sm- некоторые множества в пространстве Еп. Пусть, далее, F° (ζ) — гладкая функция, определенная в некотором открытом множестве пространства Еп, содержащем множество Σ = Ω'Γ)"ι Π · - · D^m- Поставим задачу: найти точку, в которой функция F0, рассматриваемая лишь на множестве Σ, достигает своего наименьшего 'значения. Пусть z0 е*2 u-Nj — шатер множества Sy в точке zQ (/= 1, ..., m). Предположим, что система конусов N{, ..., Nm не обладает свойством отделимости. Для того чтобы точка z0 давала решение поставленной задачи, т, е. чтобы имело место соотношение F°{z0)^F°(z) при ζεΣ, необходимо существование отличного от нуля вектора ψ = = M>o» Ψΐι · · ·» W» удовлетворяющего следующим двум условиям: (α) ψ0<0; (β) Ι Σ ihxgrad/^izoijte^O для любого вектора Ьг, напра- \а=о / вление которого принадлежит конусу N{(] ... f) Nm. Следствие 36.10. Пусть Q'— множество, определяемое в пространстве Еп переменных ζ1, ..., ζη уравнениями Я(г)-= 0, ..., Я(*) = 0, и Е" — множество, определяемое неравенствами «ЧгХО, .... gp(z)<0. (36.8) Пусть Ζο^Ω'Ο Ε" и пусть в точке zQ система ограничений (36.8) является невырожденной, т. е. существует в Еп вектор а, образующий отрицательное скалярное произведение с каждым из векторов .gradg'fco), ie/(4 (36.9) Пусть, наконец, F0 (ζ) — гладкая функция, определенная в не- котором открытом множестве пространства Еп, содержащем множество Ω'ΠΞ". Для того чтобы функция F°(z), рассматриваемая на множестве Q! [\Е1\ достигала минимума в точке г0, необходимо существование отличного от нуля вектора ψ== *= (Ψο» Ψΐι · · ·ι Ψ/J» удовлетворяющего следующимдвумусловиям:
36] § 10. КРИТЕРИИ ЭКСТРЕМУМА 315 (α) ψ0<0; (β) ( 2 ^agrad Fa(zQ))bz^0 для любого вектора bz, имеющего неположительное скалярное произведение с каждым из векторов (36.9). Отметим еще один частный случай теоремы 36.8, получающийся при r = /? = 0, т=1. Этот случай интересен тем, что условие неотделимости системы конусов Li9 Ρ/, Nh здесь отсутствует. Τ е о ρ е м а 36.11. Пусть Ω' — множество, определяемое в пространстве Еп уравнениями Я (г)-0, ..., Ffe(*) = 0, Ω" — множество, определяемое неравенствами Η*)<0, .... Г(*)<0, и Ωΐ9 ..., Ω/, S — произвольные множества пространства Еп. Пусть, далее, F° (z) — гладкая функция, определенная на некотором открытом множестве пространства Еп, содержащем множество Σ = Ω'Γ|Ω"ηΩιη ··· Γ)Ω/Π3. Поставим задачу: найти точку, в которой функция f°, рассматриваемая лишь на множестве Σ, достигает своего наименьшего значения. Пусть ζ0^Σ и пусть Mi — шатер множества Ω( в точке z0 (i=l, ..., /), α Ν — шатер множества 3 в точке ζ0. Для того чтобы точка ζ0 давала решение поставленной задачи, т. е. чтобы имело место соотношение F°(z0)^P{z) при ζεξΣ, необходимо существование таких чисел ψ0, ι^, ..., ψ*,, таких векторов а{, ..., аи направления которых принадлежат соответственно двойственным конусам 0(М{), ..., D(Mi), и таких неположительных чисел λ/, /е/(20), что выполнены следующие условия: (α) ψ0<0; (β) (StagradFa(^0)+ Σ XJgradf!(z0)-al-\..-ai\bz<0 для любого вектора δζ, направление которого принадлежит конусу N; (у) если все числа ψ0, ifr, . ..,^% α λ/, j^I(zQ), равны нулю, то хотя бы один из векторов аи ..., а/ отличен от нуля. Для доказательства достаточно заметить,, что рассуждения, проведенные при доказательстве теоремы 36.7, сохраняют свою силу и при т=1 (причем на конус Nx в этом случае никаких условий накладывать не нужно). Впрочем, теорему 36.11 можно Получить из теоремы 36.8, не обращаясь к ее доказательству,
316 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [36 Достаточно положить r = p = 0, т = 2, 21=Ξ, Ν, = Ν, 32 = = Ν2 = Εη\ тогда Νι(]Ν2 = Ν, а так как система конусов Νί9 Ν2 не обладает свойством отделимости, то непосредственно применима теорема 36.8. Замечание 36.12. Если какое-либо из множеств Qlf ..., Ω/, Ξ,, ..., Ет в теореме 36.8 (или в других теоремах этого пункта) является замкнутым и выпуклым, то за соответствующий конус Λί,, ..., Λί/, Νϊ9 ..., Nm можно принять опорный конус этого выпуклого множества в точке г0. В самом деле, согласно теореме 34.2 этот опорный конус является шатром рассматриваемого выпуклого множества в точке г0. Это замечание позволяет сформулировать ряд теорем, * относящихся к случаю, когда множества Ω,, ..., Ω/, 31э ..., Ет (или некоторые из них) являются выпуклыми. Приведем для примера следующую теорему, получающуюся на основе замечания 36.12 из теоремы 36.11 (при этом ограничимся случаем 1 = 0, # = 0). Теорема \ 36.13. Пусть Ω' — множество, определяемое в пространстве Еп переменных ζ\ ..., ζη уравнениями Я(г) = 0, .... /*(*) = 0, « Ξ- некоторое замкнутое выпуклое множество в Еп. Пусть, далее, F° (ζ) — гладкая функция, определенная на некотором открытом множестве пространства Еп, содержащем множество Ω'f)2. Для того чтобы функция F°(z), рассматриваемая на множестве Ω'Γ|3, достигали минимума в точке ζ0^Ω'()Ξ, не' обходимо существование отличного от нуля вектора ip = = {^o» Ψι» ···» Ψ J» удовлетворяющего следующим двум условиям: (α) Ψο<0; (β) 2 Ψα grad Fa (z0) δζ ^ 0 для любого вектора bz, напра- . Va^O / вление которого принадлежит опорному конусу \множества Ξ в точке ζ0. Пр и мер 36.14 (лемма Гиббса). Пусть φ{ (t), φ2(0> ···> Φ*(0~ непрерывно дифференцируемые функции. Если функция Я(г) = ср1(г1) + Ф2(г2)+ ... +<ρη(ζ»), рассматриваемая на множестве Σ, определяемом соотношениями ζι+ζ2+ ... +zn = a\ z{>Q, z2>0, ..., z">0, достигает максимума в точке z0 = (zl0, z\, ..., zg), то существует такое число λ, что Φ/(4) = λ пРи 2о>0> Φί(^)^λ при zj = 0.
36] § 10. КРИТЕРИИ ЭКСТРЕМУМА 317 Для доказательства применим теорему 36.3 *). Множество Σ определяется в пространстве Еп переменных г1, ..., ζη уравнением Fl(z) = zl + ... +ζ*-α = 0 (36.10) и неравенствами f(z) = _z'<0, /=1, ..., п. (36.11) Если все ограничения (36.11) активны (т. е. zl0 = .. .^=2£ = 0), то лемма Гиббса ничего не утверждает. Можно поэтому считать, что хотя бы один индекс не является активным. Согласно теореме 36.3 существует такой вектор ψ = {ψο> Ψι)» чт0 выполнено условие ψ0^0 (поскольку функция F0 достигает в точке го максимума, а не минимума) и условие (β). Так как gradF°(2) = {9i(21), Ф2Чг2)> ··., ч'я(г% гга(1/"(г) = {1, 1, ..., 1}, grad /'(z) = {0, 0, ..., 0, -1, 0, ..., 0} (где —-1 стоит на ί'-м месте), то условие (β) принимает вид Ш(4). Φ2(*2θ)> ···- Φ^^+Φίίΐ, 1 1} = {λ', λ2 λ"}, где λ'<;0, причем λ^ == 0 при /§έ/(20)(τ. е. при zlQ > 0). Иначе говоря, В частности, для неактивных индексов (хотя бы один такой есть) мы имеем ψ0φ^(^ο)==="~ Ψι» откуда видно, что ψ0 φ 0, т. е. ψ0 > 0. Таким образом, <^=-т*+Ь i=l п' т. е. φ^(^)=—ψ,^^λ ^ля неактивных индексов и ф/(4)^^ (поскольку λ1 ^0) для активных индексов. Пример 36.15 **). Применим лемму Гиббса для нахождения максимума функции Ρ(ζ)=-ΣαΛΐ-^2ί) й=1 *) Лемма Гиббса несложно доказывается и непосредственно, без применения содержащихся в этом пункте необходимых условий экстремума. Здесь она приведена лишь для иллюстрации. **) См. J. M. D a n s k i n, The theory of Max-Min and its application to weapons allocation problems, Springer-Verlag, New York, 1967, стр. 11.
318 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [36 на множестве Σ, определяемом соотношениями (36.10), (36.11). Числа йи bi предполагаются положительными. Пусть г0 = (г£, ..., 25) — точка, в которой функция F°(z), рассматриваемая на Σ, достигает максимума. Согласно лемме Гиббса существует такое число λ, что aibie-bizo = K при 2/>0 и а1Ь0-ь*г*^ при 4 = 0. При zlQ > 0 имеем е~ ^°< 1, и потому atbt > λ. Значит, г*0 = 0 при dibi ^ λ. Обратно, при αφι > λ имеем ζ\ > 0. Таким образом, , (J-In А при α^>λ; 4 = \ bi λ (36.12) ( 0 при uibi^X Остается определить λ. Для этого заметим, что в силу (36.10), (36.12) справедливо соотношение Σ >Ψ=°. aibi > λ которое представляет собой уравнение относительно λ. Левая часть этого уравнения, как легко видеть, представляет собой непрерывную.функцию от λ, заданную при 0< λ < оо л монотонно убывающую от оо до 0. Следовательно, для любого а > 0 это уравнение имеет единственное решение. Пример 36.16. Если гладкая функция F°(z), рассматриваемая на множестве Σ, определяемом соотношениями (36.10), (36.11), достигает максимума в точке zQ = (zlQ, z% ..., ζ%), то существует такое число λ, что 6*gradF>(z0)oi] Ьг* (36.13) для любого вектора 62 = {ог1, ..., δζη}9 удовлетворяющего условиям: δζ'>0 при ζ1 = 0 (τ, е. при ie/(z0)). (36.14) Для доказательства заметим, что в силу следствия 36.10 существует ненулевой вектор -ψ ===== {*ф0, ψ,}, удовлетворяющий условию (ψ0 grad f* (г0) + Ψ, grad F (z0)) Ьг < 0 (36.15) для любого вектора Ьг = {6г19 ..., δζ*}, удовлетворяющего усло- риям (36.14), причем ψ0^0. Зтр соотношение переписывается
щ § 10. КРИТЕРИИ ЭКСТРЕМУМА 319 в виде η iM^grad F°(20)K - *ι 2 Ьг*. Если ψ0 =7^ 0 (т. е. ψ0 > 0)» то> полагая λ = —ψι/ψο, получаем отсюда соотношение (36.13). Остается рассмотреть случай, когда ψ0=·0. В этом случае Ψι # О, и соотношение (36.15) принимает вид f , ψ, (бг1 + ... +δζΛ)<0 для любого вектора 6г, удовлетворяющего условиям (36.14). Если имеется хотя бы один неактивный индекс I (т. е. ζ[ φ 0), то, полагая бг*=± 1, δζ! — 0 при / φ i9 получаем вектор 6г, удовлетворяющий условию (36.14). Следовательно, ±ih^0, откуда вытекает соотношение ψι = 0, противоречащее сказанному выше. Таким образом, все индексы активны, т. е. zQ = = (0, 0, ..., 0). Но в этом случае соотношение (36.13) очевидно: достаточно за λ взять наибольшее из чисел dF° Ы dFQ (z0) dzl » " ·> dz" ' Прежде чем формулировать? следующее предложение, напомним понятие выпуклой функции. Пусть F (z) — функция, заданная на некотором выпуклом множестве Ρ пространства Еп (возможно на всем этом пространстве). Функция F называется выпуклой, если для любых двух точек zu z2 множества Ρ и любой точки ζ отрезка [zu z2]> т. е. точки 2 = = (1 — λ)ζχ +λ£2, где (ΧΙλ^Ι, справедливо соотношение F(z)^(l-X)F(z{)+KF(z2). (36.16) Функция F(z) называется вогнутой, если функция —F(z) является выпуклой, т. е. если функция F(z) удовлетворяет условию (при г = (1 — %)zx^-Kz2i где 0<λ<1): F(z) >(1 - X)F(zl) + XF (z2). (36.17) Ясно, что аффинная функция (рассматриваемая на произвольном выпуклом множестве) является одновременно и выпуклой, и вогнутой. Нетрудно доказать, что, обратно, если функция F ^заданная на выпуклом множестве Р) является одновременно выпуклой и вогнутой, то она аффинна (точнее, F совпадает с некоторой аффинной функцией, рассматриваемой на множестве Р). Из анализа известно следующее условие выпуклости функции. - Пусть Ρ (г) —дважды непрерывно дифференцируемая функция, заданная на открытом' выпуклом множестве Ρ пространства Еп. Для выпуклости функции F(z) необходимо и
320 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [36 достаточно, чтобы для любой точки ζ0^. Ρ квадратичная форма %β$Μ <36·18> принимала {при любых ξ1, ...,ln) только неотрицательные значения. Если, в частности, в некоторой точке 20еР квадратичная форма (36.18) является положительно определенной (т. е. для любого отличного от нуля вектора ξ = {ξ1, ..., ζη] она принимает положительное значение), то в некоторой достаточно малой окрестности точки ζ0 функция F(z) будет выпуклой. Функцию, обладающую этим свойством (т. е. являющуюся выпуклой в некоторой окрестности точки z0), называют локально выпуклой в точке z0. Следствие 36.17. Пусть Ω'— множество, определяемое в пространстве Еп переменных ζ\ ..., ζη уравнениями Я(г) = 0, ..., F*(*) = 0, (36.19) и Е" — множество, определяемое неравенствами £'(*)<0, ..., £*(г)<0. (36.20) . Пусть, далее, F° (z) — гладкая функция, определенная в некотором открытом множестве пространства Еп, содержащем множество Ω' Π Ε",- Пусть, наконец, ζ0 е Ω' Π Ε" и пусть в точке zQ функции g'(z), i^J(z0), являются локально вогнутыми. Для того чтобы функция F°(z), рассматриваемая на множестве Ω'Π^"» достигала минимума в точке z0, необходимо существование отличного от нуля вектора Ψ = {'Φο» Ψι> ···> Ψ^}» удовлетворяющего следующим двум условиям: (α) ψ0<0; (β) 2 Ψα Srad ^α teo) )bz ^ 0 для любого в&ктора bz, имею- W=o / щего неположительное скалярное произведение с каждым, из. векторов grad gl (25), A^J (z0). Это утверждение отличается от следствия 36.10 тем, что система ограничений (36.20) не предполагается невырожденной в точке 20. Вместо этого наложено требование, чтобы функции gl(z), i^'J(z0), были локально вогнутыми в точке z0. Справедливость следствия 36.17 вытекает из следующих соображений. Пусть i^J(z0), т. е. gi(z0) = 0. Обозначим через Pt полупространство, состоящее из всех точек ζ, для которых (ζ — zQ) grad gi (z0) ^ 0. Пусть zx — точка, достаточно близкая κ ζ0 (точнее, расположенная в области локальной вогнутости функции gl(z)). Если gi{zl)>0f то для любой точки г =
361 § 10. КРИТЕРИИ ЭКСТРЕМУМА 321 = (1 —λ)ζ0 + λζΐ9 принадлежащей интервалу (ζθ9 ζχ) (т. е. при 0<λ< 1), имеем согласно (36.17) έ(2)>(1-λ)έ(ζύ + λέ(ζχ)9 т.е. gi(z)>Xgi(zl). Следовательно, \7=Ϊ7\ Я I an — аг01 ^ λ | ^ - г01 I ^i — ^o I ~ const > υ· Отсюда вытекает, что производная функции gl{z), взятая в точке zQ по направлению вектора гх — ζθ9 положительна, т. е. (2! — z0)grad gl(zQ) > 0, и потому точка zx не принадлежит полупространству Piu Итак, если g' fo) > 0 (где точка гх достаточно близка к г0), то гхфРи т. е. все точки полупространства Pi9 достаточно близкие к ζθ9 удовлетворяют ограничению gi{z)^0. Пересечение N = f] Pi всех полупространств Pit соответ- *е/(гь) ствующих активным в точке z0 ограничениям (36.20), представляет собой выпуклый конус с вершиной ζθ9 причем согласно доказанному все точки этого конуса, достаточно близкие к его вершине,- удовлетворяют всем ограничениям (36.20), т. е. все точки конуса Ν9 близкие к его вершине, содержатся в множестве Н". Таким образом, N есть шатер множества В" в точке ζ0 (в качестве отображения ψ, удовлетворяющего сформулированным в определении 34Л условиям 1), 2), можно взять тождественное отображение конуса Ν). При этом, по построению, конус N состоит из всех точек г е Еп, удовлетворяющих условиям (ζ — *о) grad g* (z0) < 0, / е= / (г0). Следствие 36.17 теперь непосредственно вытекает из теоремы 36.11 (при <7 = / = 0). Замечание 36.18. Просматривая доказательство, легко понять, что требование^ вогнутости функций g'(£), /е/(г0), можно несколько ослабить. В самом деле, достаточно потребовать, чтобы проведенное рассуждение было справедливо лишь для точек zl9 принадлежащих конусу N (и достаточно близких к его вершине ζ0)9 τ. е. достаточно потребовать, чтобы каждая из функций g( (z)9 i e / (г0), была вогнутой не на всей окрестности точки ζθ9 а лишь на конусе N (вблизи его вершины). Иначе говоря, требование локальной вогнутости функций g^z), /s/(z0), можно заменить следующим более слабым требованием: каждая из функций gt{z)9 i e/(z0), является при некотором ε>0 вогнутой на множестве Ν(]Σε9 где Af = = f] Pi — конус, построенный при доказательстве следствия *e/(z.)
322 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ (36 36.17, а Ъг — шар радиуса ε с центром zQ. Это замечание позволяет несколько расширить область применимости следствия 36.17. Пример 36.19. Пусть Ω'— множество, определяемое в пространстве Ег переменных z\ z29 zs уравнением г3 = 0, и Ξ" — множество, определяемое неравенствами (г1)8-*2^/ г2<0. (36.21) Иначе говоря, Ω' и S" определяются соотношениями такого типа, как указано в следствии 36.10, причем /г = 3, & = 1, р = 2 и F (г1, г2, г3) = z\ gx (ζ1, г2, г3) = (ζ1)3 - *\ g2 (г1, ζ2, г3) = г2. Рассмотрим, далее, функцию F0 = — г\ — г2 — г3 и поставим задачу об отыскании минимума функции F0 на множестве Ω'Π3". Легко видеть, что множество ΩΉ^" целиком лежит в квадранте г1<!0, г2^0 плоскости г3 —0 (рис. 149), и потому минимум функции Р° на этом множе- Ьтве достигается в точке 20 —(0, 0, 0). Далее, в точке zQ активными яв- / ляются оба ограничения (36.21). Мы / имеем: / gradP(*0) = {.-l,-l,-1}; ^—^, grad F1 (z0) = {0, 0, 1}; gradg'(*o) = {0,-1,0}; gradg2(z0) = {0,1,0}. Рис. 149. (36.22) Условие (β), входящее в формулировку следствий 36.10 и 36.17, принимает вид ОМ-1.-1.-1> + Ыо,о,1>)**<о для любого вектора bz = {6z\ бг2, бг3}, имеющего неположительное скалярное произведение с каждым из векторов (36.22), т.е. для любого вектора 62 = {бг1,0, бг3}. Отсюда находим: ψ0 = 0, ih=0. Таким образом, ненулевого вектора ψ = *= ίΨι» 'ФгЬ удовлетворяющего условию (β), не существует, т. е. хотя в точке ζ0 = (0, 0, 0) достигается минимум, но необходимые условия, указанные в следствиях 36.10, 36.17, не выполняются. Объясняется это тем, что указанные следствия здесь неприменимы. Следствие 36.10 неприменимо, так как система ограничений (36.21) не является в точке ζ0 невырожденной (не существует вектора а, образующего отрицательное скалярное произведение с каждым из векторов grad gl (z0),
3SJ § 10. КРИТЕРИИ ЭКСТРЕМУМА 323 gradg2(zo))· Следствие 36.17 неприменимо, так как функция σι(ζ\ζ2,ζ3) не является локально вогнутой в точке ζ0. Этот пример показывает, что условие невырожденности системы ограничений (36.8) в точке ζ0 является в следствии 36.10 существенным (и, следовательно, в теореме 36.7 предположение о том, что система конусов Nu ..., Nm не обладает свойством отделимости, является существенным). Замечание 36.20. В этом пункте мы доказали ряд теорем, дающих необходимые условия экстремума функции. Основой доказательства во всех случаях служила теорема 35.1 и доказанная с ее помощью теорема 36.1. Теоремы этого типа могут быть получены и с помощью других методов. Наметим вкратце метод, принадлежащий Иордану и Полаку *). Рассмотрим его на примере доказательства теоремы 36.9, причем в случае т β Ι (т. е. будем рассматривать только одно множество Ξ = 2Ь имеющее в точке ζ0 шатер Ν = Ν\). Пусть г0 — точка, дающая решение поставленной задачи о минимуме функции F0 на множестве Ω'Γ)Ξ. Рассмотрим (k + 1)-мерное пространство Ek+l переменных x°f χ , ..., xk и обозначим через g отображение пространства Еп в Ek+\ определенное формулами xl = Fl (ζ), ι = 0, ..., k. Положим flj-iLJSiLf /-о, 1,...,*; /— 1 п. С помощью чисел ai мы можем определить аффинное отображение f: En->Ek*1 по формулам: χι~Σαίί(ζ!~4)+ρί{ζο)> '-о. ι..... *. Так как функции F°tFl, ..., Fk — гладкие, то " dFl (z0) h или, в векторной форме, g(z) = f(z) + oZt(z). Это соотношение показывает, что f есть касательное аффинное отображение в точке z0 к отображению g пространства Еп в Ek+l. Образом выпуклого конуса N при аффинном отображении f является выпуклый конус f (N) в пространстве Ε +ι с вершиной в точке f (z0) ==» g (z0). Обозначим через Λ луч, исходящий из точки f (z0) =g (z0) пространства Ek*1 и идущий в направлении отрицательной полуоси х°; иными словами, луч Λ состоит из точек (я0, х1, ..., xk)f удовлетворяющих условиям х°< F° (г0), хХ - F1 (z0), х2 = F2 (z0), .. ., xk - F* («б). *) См. первую статью, указанную в сноске **) на стр. 79, а также статью: М. С а η η ο η, С. С и 1 1 и ш, Ε. Ρ о 1 a k, Constrained minimization Problems in finite dimensional Spaces, J. SIAM Control 4, № 3 (1966),
324 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ Г36 Допустим, что Л является в пространстве Ek+l внутренним лучом выпуклого конуса f {N). Тогда в силу теоремы 34.7 (примененной к множеству Ξ и отображению g) существует такой конус Μ czf (Ν) с вершиной g (z0), что Л является внутренним лучом конуса Μ и при этом Μ есть шатер множества g (Ξ) в точке g (z0). Таким образом, конусы Μ и Л неотделимы в Ek+l и потому в силу теоремы 35.1 найдется отличная от g (z0) точка χ е g (Ξ) Π Л, т. е. найдется такая точка геВ, что точка χ = g (z) отлична °т g (zq) и принадлежит лучу Л. Иначе говоря, F0 (ζ) < F° (го), Fl (z) = Fl (z0) Fk(z) = Fk (z0), т. е. г е Ω' и F° (z)<F° (z0). Кроме того, как мы видели, ге2. Таким образом, «εΩ'ΠΞ и F° (z)<F° (zo). Но это противоречит тому, что функция F0, рассматриваемая на множестве Ω'Γ)2> достигает в точке ζ0 минимума. Полученное противоречие доказывает, что Л не является внутренним лучом выпуклого конуса f (Ν), и потому в силу теоремы 30.4 существует гиперплоскость Г, отделяющая луч Л от конуса f {N). Обозначим через *Ψ = {*фо» Ψι> · · ·> Ψ^} нормальный вектор гиперплоскости Г, направленный таким образом, что конус J (Ν) расположен в отрицательном (замкнутом) полупространстве (и значит, луч Л — в положительном), и покажем, что вектор ψ является искомым. Так как вектор /0/= = {—1, 0, ..., 0} имеет направление луча Л и, следовательно, направлен в сторону положительного полупространства, то 10^ ^0, т. е. — 1 · ψ0 + + 0·ψ1+ ... +0·ψΛΞ^0. Таким образом, условие (α) теоремы 36.9 выполнено. Далее, пусть bz — произврльный вектор, направление которого принадлежит конусу N. Иными словами, δ2 = ζ — ζ0, где ζ —некоторая точка конуса N. Тогда направление вектора f (bz) = f(z) — f (z0) — f (ζ) — g (z0) принадлежит конусу f (Ν), и потому этот вектор направлен в сторону отрицательного полупространства. Следовательно, tyf(bz) ^ 0. Вспоминая определение отображения / и записывая это скалярное произведение в координатной форме, получим неравенство, указанное в условии (β) теоремы 36.9. Это изящное рассуждение можно (несколько усложнив его) применить к доказательству теоремы 36.11. Однако наиболее общую теорему 36.8 получить этим методом невозможно (для этого надо было бы доказать, что если множества Sj, ..., 2m имеют в их общей точке z0 шатры Nl9 ..., Nm причем система конусов Niy ..., Nm не обладает свойством отделимости, то ΝιΟ ... (]Nm есть шатер множества Ех Π ««. Π 2m B точке z0; однако это в общем случае просто неверно). Замечание 36.21. Широко известный метод Дубовицкого—Милютина состоит (в применении к задачам об экстремумах функций) в том, что вместо общей теоремы 32.5 применяется теорема 32.8, а вместо более тонкой теоремы 35.1 применяется результат того же типа, но относящийся лишь к случаю, когда функции ψ* являются гладкими (ср. замечание 35.2), а все конусы Λίι, Λί2, ..., Mk, кроме одного, являются телесными*. Таким образом, примененный здесь метод получения необходимых условий экстремума является обобщением метода Дубовицкого — Милютина. В соответствии с этим и результаты, содержащиеся в этом пункте, являются более общими, чем те, которые можно получить с помощью метода Дубовицкого — Милютина. Приведем для примера доказательство следствия 36.10 методом Дубовицкого — Милютина. Обозначим через L касательную плоскость (п — &)- мерного многообразия Ω7, определяемого в Еп уравнениями Fl (ζ) = 0, ... ..., Fk(z) = 0. (Напомним, что в силу замечания 36.5 можно предполагать функции F1 (ζ), ..., Fk (ζ) независимыми в точке ζ0, т. е. определяющими (п — &)-мерное многообразие в окрестности точки zQ.) Далее, предположим для простоты обозначений, что активными в точке z0 являются первые s
361 § 10. КРИТЕРИИ ЭКСТРЕМУМА 325 ограничений (36.8) и обозначим через Mit * = 1, ..., sf полупространство пространства Еп, состоящее из в-сех точек ζ, для которых (z-2o)gradg*(zo)<0, а через М0 — полупространство, состоящее из всех точек ζ, для которых (*-2o)gradF°(«o)<0. Ясно, что Λί0, Ми ..., М$ — замкнутые телесные конусы в Еп с общей вершиной ζ0 и что плоскость L также проходит через точку z0. Это позволяет применять теорему 32.7. Предположим, что пересечение L П (int Λίо) П (int M,) П ... П (int Ms) (36.23) непусто, т. е. существует исходящий из точки z0 луч /, лежащий в плоскости L и являющийся внутренним лучом каждого из конусов M0f Ми ..·> Ms. Тогда существует гладкая кривая Л, исходящая из точки z0, имеющая / своим касательным лучом в точке z0 и лежащая на многообразии Ω'. Так как / — внутренний луч полупространства Λί0, то угол между лучом / и вектором grad F° (z0) —тупой. Следовательно, для всех точек линии Л, достаточно близких к z0 и отличных от z0, выполнено соотношение F° (z) < F° (z0). Аналогично^ для всех точек линии Л, достаточно близких к z0 и отличных от z0, выполнено соотношение gl (z) <g* (z0) = 0, / = 1, ..., s. Таким образом, на кривой Л можно выбрать такую точку ζ, удовлетворяющую всем соотношениям F1 (ζ) = 0, ..., Fk (z) = 0 и всем ограничениям (36.8) (т. е. принадлежащую множеству Ω'[\Е")У что F° (z)<F° (z0). Но тогда функция 7го, рассматриваемая на множестве Ω' Π 3", не достигает в точке ζ0 минимума. Итак, для того чтобы функция Я\ рассматриваемая на множестве Q'flS", достигала в точке z0 минимума, необходимо, чтобы пересечение (36.23) было пусто. Но если это пересечение пусто, то согласно теореме 32.8 существуют такие аффинные функции f*> f°, flt ..., fst обращающиеся в нуль в точке z0 и не все тождественно равные нулю, что функция f* тождественно равна нулю на плоскости L, функция f* неположительна на полупространстве М^ / = 0, 1,..., st и "выполнено соотношение fm + f° + fl+ ..·. +fs=o. Так как f° (z0) = 0 и функция f° неположительна на полупространстве M0i то grad f° = — ψ0 grad F° (z0), где ψ0 < 0. Аналогично, grad fl = λ/ grad gl (z0), где λ/ >0 (/ = 1, ..., s, т. е./ε/ (ζ0)). Далее, так как аффинная функция /* тождественно равна нулю на L, то grad Г = - Ь grad Fl (z0) - ... - фа grad Fk (z0). ' Покажем, что вектор г|> = {'фо» ψι, ..., ψ/ζ·} является искомым. Условие (α) следствия 36.10, как мы видели, выполнено. Пр.оверим выполнение условия (β). Пусть δζ — вектор, имеющий неположительное скалярное произведение с каждым из векторов (36.9), т. е. с каждым из векторов gradg'(zo), /=l,...> s. Тогда f° (*о + δζ) = f° (z0 + όζ) - /° (ζο) = Ьг grad f° = - ψ0 ** grad Я> (z0)\ k Г (z0 + δζ) = Г (zo + δζ) - f (*o) = δζ grad f * - - 2 Ψί ** grad Я (z0); f («ο + δζ) = /' (z0 + δζ) - f/ (z0) = δζ grad f' = — λ/ δζ grad g' (z0)< 0 при j«l s.
326 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИИ [36 Складывая эти соотношения и учитывая, что f* + f° + f1 + ... + Ρξ=0· получаем 0 = f (z0 + δζ) + /° (z0 + oz) + f*(z0 + δζ) + ... +ρ(ζ0 + όζ)< k <-2^a(^gradFa(z0)). a=0 Таким образом, соотношение (β) следствия 36.10 также выполнено. Остается доказать, что вектор ψ = {ψο» ψΓ, ..., ψ&} отличен от нуля. Допустим, напротив, что ψ0 = ψι = ... = ψ& = 0. Тогда f0=s0, f*s=0, и потому функции f1, ..., Ρ связаны соотношением f! + ... + р==0. Пусть a — вектор, имеющий отрицательное скалярное произведение с каждым из векторов (36.9). Тогда fl (zo + а) = ft (z0 + а) - f! (z0) = a grad f* = λ/ (α grad ^ (z0)) < 0 для любого /s /(z0), т. е. для любого /= 1, ..., s. Отсюда, в силу соотношения fl + ... + fs s 0 получаем ^ (z0 + α) = 0, / = 1, ..., s, т. е. %j (a grad ^ (z0)) = 0, и потому λ/ = 0 для всех / = 1, ..., s. Из этого вытекает, что f1 s 0, ..., f5s0, Таким образом, все функции /*, f°, f1, ..., fs тождественно равны нулю, что противоречит построению. Полученное противоречие показывает, что вектор ψ = {ψ0, ψι, ..., фЛ отличен от нуля. Приведем пример применения теоремы 36.8, не укладывающийся в рамки метода Дубовицкого — Милютина. Пример 36.22. Обозначим через Pi множество, описываемое в пространстве Еп соотношениями | ζ21 < (ζ1)2, ζ1 ^0, через Ξ2 — множество, описываемое соотношениями | ζ41 < (ζ3)2, ζ3 ^ 0, а через Ω' — гиперповерхность, определяемую уравнением fi(z) = z6-(z5)2 = 0. Легко видеть, что полуплоскость Νί9 определяемая соотношениями ζ2 = 0, ζ1 ^0, является максимальным шатром множества Si во всех точках (п — 2)- мерной плоскости Lb определяемой уравнениями ζΙ = ζ2 = 0; точно так же полуплоскость N2t определяемая соотношениями z4 = 0, z3^0, является максимальным шатром множества Ξ2 во всех точках (п — 2)-мерной плоскости L2, определяемой уравнениями ζ3 = ζ4 = 0. Наконец, максимальным шатром гиперповерхности Ω' (в любой ее точке) является гиперплоскость Г, касающаяся этой гиперповерхности. Таким образом, в точках каждого из множеств Lx{\Z2{\Qi, ΞιΠ^ΠΩ' д в а из трех" шатров Nu N2t Г не являются телесными, а в точках множества Li Π L2 Π Ω' все три шатра не являются телесными, так что в точках этих множеств метод Дубовицкого — Милютина неприменим (какова бы ни была функция F0, минимум которой ищется на множестве Ω'ΠΞιΠ^)· (Конечно, можно отдельно исследовать функцию F0 в точках каждого из мно- ж ест в £ιη22ηΩ', Ξ,η£2ηΩ', Ζ,,η^ηΩ'» а также в точках, не принадлежащих ни одному из этих множеств, но это уже напоминает изложенный в п. 7 метод отдельного исследования функция на гранях «криволинейного многогранника».)
3$ § 10. КРИТЕРИИ ЭКСТРЕМУМА 327 Рассмотрим применение теоремы 36.8 в этих условиях, причем для примера будем искать на множестве Й'П^ПЗг минимум функции *·<«>- Σ (*>·+■& 2* Допустим, что эта функция достигает минимума в точке ζ0 = (zj, ..., Zq) e ^Ω'Π^ιΠ^. Через Λ/Ί, JV2 будем теперь обозначать максимальные шатры множеств Si, 52 в точке z0 (при ζ0 £έ Lt· эти максимальные шатры описываются теоремой 34.4). Заметим, что конусы А/", и N2, как легко видеть, неотделимы, и это позволяет применять теорему 36.8. Условие (β) теоремы 36.8 принимает вид (ψ0 grad F° (zQ)) bz + ψ, (δζ6 - 2г\ δζ5) < 0 (36.24) для любого вектора Ьг = {дг\ ..., δζ"}, направление которого принадлежит конусу. Νι Π #2· Непосредственно проверяется, что при bzl=*-zlQi 6z2 = -2zg, 6zz = -zl δζ4 2z£ (36.25) (и при любых δζ5, ..., δζ71) направление вектора δζ принадлежит конусу Νι(]Ν2. Поэтому при ψ0 = 0, ψι φ 0, в силу (36.24) получилось бы,^что ψ,(2δζ6-2ζ§δζ5)<0 при любых δζ5, δζ6, что невозможно. Следовательно, ψ0 Φ 0. В силу условия (а) получаем ψ0<0, так что можно считать ψο = — 1. Условие (36.24) теперь принимает вид η - J (2го + -gg-) bzl + ψ, (δζ6 - 2ζ5 δζ5) < 0. (36.26) Так как это соотношение справедливо, в частности, когда δζ1, δζ2, δζ3, δζ4 принимают значения (36.25) и δζ5 = ... = δζ*1 = 0, то Κ+ίΙ)ζό+2Η+ί|)^+(^+1)^+2Η+1)4<ο. Записав это соотношение в виде -|W+^+lW+^)+iJ(4)2+-jJ(4)2+ + 4(4)2+4(4)2 + |-(4 + ^)<0 и замечая, что все слагаемые слева, кроме последнего, заведомо неотрицательны (первые два слагаемых неотрицательны в силу определения множеств Е{ и S2), находим: Zo+'Zq<0. Отсюда, опять же в силу определения множеств Sp Ξ2, получаем Zq = 0, Zq = 0 и потому Zq==0, Zq = 0. Теперь соотношения (36.25) принимают вид δζ1 = δζ2 = δζ3 = δζ4 = 0, а соотношение (36.26) при этих значениях переписывается следующим образом: η - 2 (2ζό + -Ц) **' + Ψι (δ*6 - 24δ*5) < о.
328 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [36 причем это соотношение справедливо для любых όζ5, ..., бгя. Следовательно, -(22о+ж)-2*'2о = 0. -(2г°+жН· Первые два из этих соотношений вместе с соотношением ^о — (zq) =0 (справедливым, так как zQ е Ω') составляют систему трех уравнений с тремя неизвестными ζ% ζ% ψ^ Исключая из этой системы Zq и ψ1} получаем или Отсюда находим z\ = — 1/6 и, следовательно, Zq=1/36. Наконец, дальнейшие из соотношений (36.27) дают значения z\ — ... = z% = — 19/72. Итак, минимум функции F° (z) на множестве Ω'ΠΕιΠ^ может достигаться только в точке zQ, имеющей координаты го— ζο — ζο — ζο— υ» го— β"» ζο — "35"» ζοτ ··· —ζο— j2* Значит, в этой точке функция F° (z) действительно достигает минимума, поскольку множество ΩΉ^ιΓ)^ замкнуто, а функция F0 непрерывна и неограниченно возрастает при удалении точки ζ в бесконечность (по любому направлению). Замечание 36.23. Отметим в заключение, что необходимые условия, выведенные в этом пункте, накладывают больше требований, чем условия, получаемые по методу п. 7. В самом деле, пусть, например, zQ — точка «криволинейного многогранника» Μу лежащая, скажем, на его (п — 1)-мерной «грани», причем в этой точке выполняются необходимые условия п. 7, т. е. производные функции F0 (г), взятые в точке ζ0 по направлениям, лежащим в этой грани, равны нулю. С точки зрения методов этого пункта указанное положение вещей можно осмыслить следующим образом. «Криволинейный многогранник» представляет собой /г-мерное множество Ω", описываемое системой ограничений типа (36.2), а его (л — 1)-мерная «грань» есть множество точек, в которых одно из ограничений (скажем, первое) является активным, а остальные активными не являются. Таким образом, «грань», о которой идет речь, описывается соотношениями f1 (*)-0, /3 (а)<0,..., f {г) <0. (36.28) Далее, соотношений (36.1) нет совсем (так что £=±0), т. е. множество Ω' совпадает со всем пространством Еп, и потому Ω'Π^^Ω7 есть рассматриваемый «криволинейный многогранник».
371 § 10. КРИТЕРИИ ЭКСТРЕМУМА 329 Допустим, что функция F°(z), рассматриваемая на Ω", достигает минимума в некоторой точке, принадлежащей (п — 1)-мерной «грани» (36.28), так что в этой точке активным является только первое ограничение (36.2). Тогда условия (α), (β) теоремы 36.3 принимают вид *о grad Ζ70 (20) = — λι grad f'fo). <ψ0<0, λι<0 (36.29) (если бы было ψ0 = 0, то в силу соотношения grad fl (z0) φ 0 мы имели бы также λι=0, что невозможно). Если а — произвольный вектор, касающийся «грани» (36.28) в точке ζ0, τ. е. вектор, удовлетворяющий соотношению a grad f1 (z0) = 0, то в силу (36.29) имеем a grad F° (z0) = 0. Иными словами, производная функции F° (ζ) в точке ζ0 по любому направлению, касательному к «грани» (36.28), равна нулю. Но это и есть то необходимое условие экстремума, которым мы пользовались в п. 7, т. е. из теоремы 36.3 вытекают необходимые условия п. 7. Но из теоремы 36.3 (т. е., в данном случае, из соотношения (36.29)) вытекает несколько больше. Ведь мы пока воспользовались только коллинеарностью векторов grad F° (z0) и grad f1 (z0), а соотношение (36.29) утверждает, что, кроме того, направления этих векторов должны быть противоположными. Это в данном случае (т. е. для точек, принадлежащих (п— 1)-мерным «граням») и есть та дополнительная информация, которая содержится, по сравнению с методами п. 7, в теореме 36.3. Геометрический смысл этого дополнительного условия ясен: если векторы gradF°(zo) и grad fl (z0) противоположно направлены, то внутрь „области Ω" (т. е. в направлении убывания функции f1 (ζ)) функция F° (z) будет возрастать, а именно это и соответствует достижению минимума функции F0 (ζ) в точке ζ0. Аналогично можно было бы проследить ту дополнительную информацию, которую содержит теорема 36.3 в случае, когда минимум достигается на «гранях» меньшего числа измерений. Таким образом, теорема 36.3 (являющаяся лишь частным случаем содержащихся в этом пункте общих результатов) представляет собой уточнение и усиление методов, обсуждавшихся в п. 7. 37. Достаточное условие экстремума функции. В этом пункте мы выведем — при определенных ограничениях на рассматриваемые функции и множества — необходимые и достаточные условия экстремума. Необходимость этих условий вытекает из результатов предыдущего пункта, а достаточность будет установлена здесь. Основой изложения будет служить следующая теорема о минимуме аффинной функции *) на пересечении выпуклых *) Термин «линейный» не имеет в математике однозначного смысла. Так, в функциональном анализе при рассмотрении линейных операторов и линейных функционалов обязательно предполагается однородность. Наоборот, в алгебре и геометрии (линейные уравнения, линейные преобразования) этот термин однородности не предполагает. Во избежание нечеткости, в этой книге говорится о гомоморфизмах векторных пространств (вместо линейных операторов, стр. 114) и об аффинных отображениях (стр. 152). Термин же «линейный» оставлен кое-где лишь в алгебраическом смысле, т. е. линейным Уравнением называется уравнение вида FW = 0, где F (х) — аффинная Функция (стр. 160).
330 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [37 конусов. Как и в предыдущем пункте, в случае задачи о максимуме функции знак неравенства в приводимом ниже условии (а) меняется на противоположный. Теорема 37.1. Пусть /° — аффинная функция в Еп и пусть Ml9 ..., Μ ι, Ν ι, ..., Νm — система выпуклых конусов с общей вершиной z0 в Еп9 не обладающая свойством отделимости. Для того чтобы функция /°, рассматриваемая на конусе /C = Af,n ... ΠΛί,η^η ... (]Nmi достигала минимума в точке ζθ9 необходимо и достаточно существование такого числа ψ0 и таких векторов аи ..., Я/, направления которых принадлежат соответственно двойственным конусам D(M{)9 ..., D(Mi), что выполнены следующие условия: (α) ψ0<Ό; (β) (Ψο grad /° — aj — ... — at) bz < 0 для любого вектора bz, направление которого принадлежит конусу Ыг(] ... f] Nm. Доказательство. Пусть функция /°, рассматриваемая на конусе /С, достигает минимума в точке z0. Так как каждый конус Μι является шатром множества Ω^ = Μι в точке ζ0 (/=1, ..;, /) и каждый конус Nj является шатром множества Sfssxffj в точке z0 (/=1, .... т), то из теоремы 36.7 (примененной к функции F°==f°) вытекает существование числа ψο и векторов аи ..., Я/, удовлетворяющих условиям (α), (β), (γ) теоремы 36.7. Условие (β) теоремы 36.7 совпадает с условием (β) теоремы 37.1. Докажем, что ψ0<0. Допустим, напротив, что ψ0 = 0. Тогда условие (β) (его справедливость уже доказана) принимает вид: {-^ах — ... — ai)bz^0 для любого вектора bz9 направление которого принадлежит конусу Νι Π ... Π Nm. Это означает, что направление вектора — а{ — ... — di принадлежит конусу D {NY (] ... Π Nm), и потому в силу следствия 31.4 и леммы 32.1 найдутся такие векторы Ьи ...» bm, что направление вектора 6/ принадлежит конусу £(N/) (/=1, ..., m) и при этом — а{ — ... — at = Ьх + ... + bm. Но это в силу теоремы 32.2 противоречит тому, что система выпуклых конусов Ми ..., Mi, Nl9 ..., Nm не обладает свойством отделимости (заметим, что в силу условия (γ) теоремы 36.7 и предположения ψ0 = 0 среди векторов аи ..., at имеются отличные от нуля). Итак, предположение о том, что ψο = 0, приводит к противоречию; следовательно, в силу условия (а) теоремы 36.7 ψ0 < 0. Таким образом, необходимо сть сформулированных условий установлена. Докажем достаточность. Пусть существуют чиоло ψ0 и векторы аи ..., ah удовлетворяющие условиям (α), (β) те9#
371 § 10. КРИТЕРИИ ЭКСТРЕМУМА 331 ремы 37.1. Возьмем произвольную точку ζ конуса /С. Так как направление вектора bz = z — г0 принадлежит конусу N[(] · · · Π Nm, то, согласно условию (β), (togradf0 — a{~- ... — at){ζ — ζ0)<0. Далее, так как направление вектора аь принадлежит конусу D(Mi)> а направление вектора ζ — ζ0 принадлежит конусу К и, подавно, принадлежит конусу Aft- (ί= 1 i), тоа*(г—20)<0, и потому (Ψο grad Ρ) (г-г^<(ах+ ... + at) (ζ - ζ0) < 0. Это означает, в силу теоремы 21.8, что ψ0 (f° (ζ) — f° (z0)) < 0. Вспоминая, что i|)0<0, получаем отсюда: f°(z) — f°(zo) >0, т. е. f°(zo)^f0{z). Таким образом, функция /°, рассматриваемая на конусе К> достигает минимума в точке г0. Замечание 37.2. При доказательстве достаточности не использовалось предположение о том, что система выпуклых конусов Ми ..., Λί/, Ν\9 ..., Nm не обладает свойством отделимости. Поэтому если существует число ψ0 и векторы аи ... ..., аи удовлетворяющие условиям (а) и (β) теоремы 37.1, то функция /°, рассматриваемая на конусе К, достигает минимума в точке ζ0 (причем это справедливо без наложения каких-либо требований на систему конусов Мх Ми Nu ..., JVm). Замечание 37.3. Условие (а) в теореме 37.1 можно еще ослабить. Именно, можно заменить его условиями (α), (γ) теоремы 36.7 (оставив условие (β) в теореме 37.1 без изменения). Действительно, "если выполнены условия (α), (ν) теоремы 36.7 и условие (β) теоремы 37.1, то, как мы видели при доказательстве необходимости, условие ψ0 < 0 (в предположении, что система выпуклых конусов Ми ..., Ми Nu ..., Nm не обладает свойством отделимости) также выполнено. Замечание 37.4. В формулировке теоремы 37.1 конусы Nu ..., Nm не рассматриваются отдельно, а везде фигурирует лишь их -пересечение Nx f) ... [) Nm. Поэтому можно было бы ограничиться лишь одним конусом N = N\(] ... f]Mm9 т. е. рассмотреть лишь случай т=1. Однако мы привели теорему именно в такой формулировке, так как в этом виде она будет несколько более удобной в дальнейшем. Перейдем теперь к рассмотрению задачи о минимуме функции F° на множестве Σ = Ω!Π ... ΠΩ/Π3ιΠ Г)2т (как и в теореме 36.7). При этом на множества Uit Ξ} и на функцию F0 наложим некоторые ограничения. Прежде всего отметим следующее требование, которое в этом пункте будем накладывать на функцию F°(z)-
332 ЯД. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ £37 (а) функция F°{z) определена в открытом множестве, содержащем Σ, является гладкой, и существует аффинная функция f°{z), удовлетворяющая условию f°{z)^F°(z) в области определения функции F°{z) и f°(z0)=F°(z0). (37.1) (Впрочем, было бы достаточно предполагать, как и в предыдущем пункте, что F°(z) не является гладкой, а имеет непрерывные первые производные лишь вблизи рассматриваемой точки z0.) Заметим, что из выполнения условия (а) следует справедливость равенства grad/?0^o) = gradf°. (37.2) В самом деле, так как F°{z)^f°(z)9 то для любой отличной от z0 точки ζ (принадлежащей области определения функции F°(z)) Я (г) - F° (г0) > f* (г) - F<> (г0) = f° (ζ) - f* (zQ) I a: — 2г01 ""*" I г — z0\ _ \z — г0| и потому производная функции F°(z) в точке z0 по любому направлению не меньше, чем производная функции f°(z) по этому же направлению. Иначе, говоря, agradT70^) ^agradf0, или a(gradF0(z0)-gradf°)>0 для любого вектора а. Заменяя здесь α на — а, находим a(gradf°(zo)-gradf°) = 0 для любого вектора а. В частности, при a = grad F°(z0) — — grad/0 получим gradF°(20) — grad/° = 0, что и доказывает равенство (37.2). Заметим, что условие (а) заведомо выполняется, если функция Ρ (ζ) удовлетворяет следующему требованию: (аО функция F°(z) определена в выпуклом открытом множестве, содержащем Σ, и является гладкой и выпуклой. В самом деле, предположим, что условие (а7) выполнено, и определим аффинную функцию f°(z) равенством - f°(z) = F>(z0) + (z-zQ)gradFO(z0). Ясно, что f°{z0) — F°(z0). Далее, пусть гх — произвольная отличная от z0 точка, принадлежащая области определения функции F°(z). Тогда для любого λ, удовлетворяющего условиям О < λ < 1, точка ζ «а (1 — χ) ζ0 + λζ{ принадлежит интервалу (г0, Ζγ), и потому функция F0 в точке ζ определена* В силу выпуклости этой функции имеем (см. (36.16))
зЛ § 10. КРИТЕРИИ ЭКСТРЕМУМА 333 и потому FQ (ζ) - F° (zq) = F° (г) - Я (г0) < Я (г,) - Я (г0) | ζ — z01 λ | ^! — z01 ^ | г! — z0 \ Левая часть этого соотношения имеет при λ~>0 (λ > 0) предел, равный производной функции F°(z) в точке z0 по направлению вектора z{ — z& Иначе говоря, этот предел равен agradF°(z0), где а —единичный вектор, имеющий то же направление, что и вектор z{ — z0. Таким образом, agrad ^feX^'g:^'1. (37.3) Так как, далее, гх — ζ0 = \ ζλ — ζ0 \α (ибо вектор ζχ — ζ0 имеет то же направление, что и а, а длина его в | z{ — zQ | раз больше), то, умножая соотношение (37.3) на положительное число | zx — ζ01, находим (ζι - *g)grad Я(z0) = I 2, - z0 \αgrad F°(z0) < f0(z,) - Я(z0), или Я (2,) > Ρ (ζο) + {Ζ{ _ Ζο) gra(J ρθ {Zq) = fO (^ι)# Итак, при ζ^Σ справедливо неравенство Pizi)^!70^^, т. е. функция Ζ70 (ζ) удовлетворяет условию (а). Заметим, что условия (а) и (а') сформулированы применительно к рассматриваемой далее задаче о минимуме функции F°(z) на некотором множестве. В случае задачи о максимуме функции знак неравенства в условии (а) меняется на противоположный, а в условии (а') функция предполагается не выпуклой, а вогнутой. Впрочем, задачу о максимуме функции F°(z) всегда можно заменить задачей о минимуме функции —F°{z). Укажем теперь требования, которые будут накладываться на множество Σ. Именно, будем предполагать, что для каждого /=1, ..., / существует конус Mh удовлетворяющий следующему условию: (б) конус Mi является шатром множества Ω/ в точке, z0 u, кроме того, Q{czMit /=1, ..., /. Далее, будем предполагать, что для каждого /—1, ..., m существует конус Af/, удовлетворяющий следующему условию: (в) конус Nj является шатром множества 57 в точке z0 и, кроме того, BycrJV/, /=1, ..., т. Наконец, наложим еше одно условие, которое будем называть условием общности положения:
334 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ 137 (г) система выпуклых конусов Ми ..., Ми Nu ..., Nm не обладает в Еп свойством отделимости. Прежде всего выясним смысл условия общности положения. Предположим, что условие общности положения не выполнено. Тогда в силу теоремы 32.2 существуют такие векторы аь ..., Я/, &!, ..., bmt хотя бы один из которых отличен от нуля, что направление вектора щ принадлежит конусу D(Mi)9 i= 1, ..., /, направление вектора 6/ принадлежит конусу D(N)), /= 1, ..., m, и при этом выпаянено соотношение аг+ ... +а1 + Ь{+ ... +6m = 0. (37.4) Рассмотрим два возможных случая в соответствии с тем, равен вектор ах + ... + аь нулю или нет. Пусть ах + ... +а/ = 0. Тогда в силу (37.4) справедливо также равенство Ьх + ··· +bm = 0. Рассмотрим случай, когда среди векторов ах аг имеются отличные от нуля (если ах = ... =а/ = 0, то проводимое ниже рассуждение нужно применить не к Ми ..., Ми а к Νϊ9 ..., JVm). Тогда по теореме 32.2 система выпуклых конусов Ми ..., Λί/ обладает свойством отделимости, т. е. существует гиперплоскость Г, отделяющая один из них от пересечения остальных. Следовательно, М{(] ... (\MtCzY и потому подавно Λί,Π ·■· ηΛίζη^η ... ClNmCzT. В силу условий (б), (в) отсюда вытекает, что^ множество Σ-^f] "... ΠΩ/ΗΞιΠ ... П2т целиком содержится в гиперплоскости Г. Но тогда можно и функцию F°(z) рассматривать только на гиперплоскости Г, т. е. вместо Еп рассматривать евклидово пространство Гс£п, имеющее меньшую размерность. Итак, если, кроме (37.4), выполнено еще соотношение ах-\~... ... -}- αχ = 0, то можно снизить размерность пространства Еп, содержащего множество Σ, на котором ищется минимум функции F°. (Если же в пространстве Г система конусов Мь ..., Λί/, Νχ, ..., Nm все еще не будет удовлетворять условию общности положения, то можно снова применить те же рассуждения.) Пусть теперь ах + ... + агФ0. Положим ψο==0. Тогда число ψ0» очевидно, удовлетворяет условию (а) теоремы 36.7. Ясно также, что среди векторов аи ..., α/ имеются отличные от нуля, т. е. выполняется и условие (ν) теоремы 36.7. Наконец, в силу (37.4) мы имеем ~~ах — ... — а/ = Ьх + ... + bmi и потому согласно следствию 31.4 и лемме 32.1 направление вектора — ах — ... — at принадлежит конусу D{NX{\ ... ЛNm)9
37] § 10. КРИТЕРИИ ЭКСТРЕМУМА 335 (— ах — ... — α/)δ2<0 для любого вектора bz, направление которого принадлежит конусу Ν{(\ ... П Nm. Но это означает (в силу равенства ψ0 = 0), что выполнено и условие (β) теоремы 36.7. Итак, при ах + ... ии9 -j- α,ι φ 0 необходимые условия минимума, указанные в теореме 36.7, заведомо выполняются независимо от того, какой была взята функция F°(z) (ведь в силу равенства ψο = 0 роль функции F°(z) в этих необходимых условиях элиминируется). Иными словами, если условие общности положения не выполняется, то либо можно снизить размерность пространства Еп, содержащего множество Σ, либо же необходимые условия минимума, выведенные в предыдущем параграфе, обязательно выполняются, независимо от того, достигает ли функция F°(z) в точке z0 минимума или нет, т. е. эти необходимые условия становятся бессодержательными и не имеет смысла говорить о достаточности этих условий. Все это показывает, что условие общности положения является совершенно естественным. Теорема 37.5. Пусть в Еп заданы множества Qu ..., Ω;, si, ···» 2щ и конусы Μϊ9 ..., Μι, Ν{, ..., Nm с общей вершиной z0, принадлежащей множеству Σ = Ω,η ... ηΩ,η2ιΠ ... П2т, причем выполняются условия (6),N (в) и (г). Пусть, далее, задана функция F°(z), удовлетворяющая условию (а). Для того чтобы функция F°(z), рассматриваемая на множестве Σ, достигала минимума в точке z0, необходимо и достаточно существование такого числа -ф0 и таких векторов ах, ..., аи что направление вектора at принадлежит двойственному конусу D(Mt), ''=1, ..., /, и выполнены следующие условия: (α) Ψο<0; (β) (Ψο grad F° (z0) — ax— ... — aD bz < 0 для любого век- тара bz, направление которого принадлежит конусу Nx(] ... " ()Nm. Доказательство. Пусть функция F°fe), рассматриваемая на множестве Σ, достигает минимума в точке 20еИ. Тогда согласно теореме 36.7 существуют такое число ψ0 и такие векторы а{, ..., аи что направление вектора а* принадлежит конусу D(Mi), /=1, ..., /, и выполнены условия (α), (β), (ν) теоремы 36.7. Так как условие (β) формируется в теоремах 36.7 и 37.5 одинаково, то нужно лишь убедиться, что ψ0 < 0· Это доказывается дословно так же, как и в теореме 37.1. , Таким образом, необходимость сформулированных услр- Вий установлен^
336 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [37 Докажем достаточность. Пусть выполнены условия (а) — (г) и условия (α), (β), указанные в теореме 37.5. Тогда аффинная функция /°(г), существование которой предполагается в условии (а), удовлетворяет соотношению gradF°(20) = grad/0. Следовательно, условие (β) принимает вид (Ψο grad f° — ах — ... — at) Ьг < О для любого вектора Ьг, направление которого принадлежит конусу Νλ{\ ... (}Nm. Отсюда вытекает в силу теоремы 37.1, что функция f°(z), рассматриваемая на конусе tf«Af,n ··· ΠΛίιΠΛΤ,η ··· ilWm, достигает минимума в точке zQ. Так как в силу условий (б) и (в) Ее /С, то функция f°(z), рассматриваемая на Множестве Σ, достигает минимума в точке ζ0ι τ. е. /°(ζο)</°(ζ) при 2GS. Из условия (а) теперь непосредственно вытекает, что F4zo) = f4zo)<f0(z)<F°(z) при ζ€=Σ, т. е. функция F°(z), рассматриваемая на множестве Σ„ достигает минимума в точке г0. Замечание 37.6. При доказательстве достаточности условие (г) не использовалось (ср. замечание 37.2). Поэтому если существует такое число ψ0 и такие векторы аи ..., at {направления которых принадлежат конусам D{MX)> ..., Z)(Af/)), что выполнены условия (а), (б), (в) и условия (α), (β) теоремы 37.5, то функция F° (z), рассматриваемая на множестве Σ, достигает минимума в точке ζ0 (причем это справедливо без наложения каких-либо требований на систему конусов М{9 ..., Мь Ν» ··., Nm). Для того чтобы получить ряд следствий из теоремы 37.5, отметим некоторые специальные ситуации, в которых заведомо выполняются условия (б) и (в). Пусть F — некоторая непостоянная аффинная функция, заданная на пространстве Еп, и Q = KerF —ее ядро. Ясно, что множество Μ = Ω является шатром множества Ω (в любой точке ζ0 <= Ω), причем Ω с Λί. Таким образом, условие (б) заведомо выполнено, если множество Ω/ и конус Mt удовлетворяют следующему требованию: (б') множество Ω/ является ядром некоторой непостоянной аффинной функции (т. е. гиперплоскостью) и Μι = 8'
37] § 10. КРИТЕРИИ ЭКСТРЕМУМА 337 Точно так же условие (в) заведомо выполнено, если Ξ/ и Nj удовлетворяют следующему требованию: (в') множество Зу является ядром некоторой непостоянной аффинной функции (т. е. гиперплоскостью) и N} = 3r. Другой ситуацией, в которой справедливы требования (б) и (в), является случай выпуклого множества и его опорного конуса. Пусть- Ω — выпуклое множество и Μ — его опорный конус в точке ζ0 ^ Ω. Тогда в силу теоремы 34.2 Μ есть шатер множества Ω в точке ζ0, причем, очевидно, Ω cz Λί. Таким образом, условие (б) заведомо выполнено, если удовлетворяется следующее требование: (б") множество Ω/ выпукло и Mi — опорный конус множества Ω/ в точке z0<^Qi. Точно так же условие (в) заведомо выполнено, если удовлетворяется следующее требование: (в") множество Зу выпукло и Nj — опорный конус множества 5у в точке г0еЗу. Частным случаем рассмотренной ситуации является случай выпуклых ограничений. Пусть /(г) —гладкая выпуклая функция и Ω — множество всех точек, удовлетворяющих условию f(zX0. Пусть, далее, z0 — произвольная точка, в которой f(z0) = 0, и М — полупространство, определяемое неравенством (ζ — z0) grad / (z0) <! 0. Из определения выпуклой функции (см. (36.16)) непосредственно вытекает, что множество Ω выпукло, а так как функция / — гладкая, то полупространство Μ является опорным конусом выпуклого множества Ω в точке г0. Таким образом, условие (б"), а потому и (б), заведомо выполнены, если удовлетворяется следующее требование: (б'") множество Ω/ определено ограничением fl(z)*^0, где fl — гладкая выпуклая функция, обращающаяся в ну ль в точке z0t a Mi есть полупространство (ζ — z0) grad /' (z0) < 0. Точно так же условие (в) выполнено, если удовлетворяется следующее требование: (в'") множество By определено ограничением gf(z)<^0, где g} — гладкая выпуклая функция, обращающаяся в нуль в точке z0t a Nj есть полу прост ранство (ζ — z0) grad g1 (z0) ^ 0. Предполагая,, что в теореме 37.5 часть множеств Ω/ и конусов Mi удовлетворяет требованию (б7), а часть — требованию (б'") (и то же относится к множествам Зу и конусам Nj)t получаем из теоремы 37.5 следующее утверждение: Теорема 37.7. Пусть Ω' — множество, определяемое в про* странстве Еп уравнениями Г(г) = 0, ..., F*(z) = 0,
338 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ 137 и S' — множество, определяемое в Еп уравнениями Gi(z) = o, ..., Gr(z) = 0, где Fl (ζ), ..., F* (ζ), G1 (ζ), ..., Gr (ζ) — непостоянные аффинные функции. Пусть, далее, Ω" — множество, определяемое неравен- ствами ИгХО Иг)<0, 3" — множество, определяемое неравенствами йГЧгХО, .... £р(гХО, где f1 (г), ..., f7 (г), g1 (г), ..., gp (z) — гладкие выпуклые функции. Пусть, наконец, Ω{, ..., Ω/, 31э ..., 3m — произвольные множества пространства Еп и F° (z) — функция, определенная на некотором открытом множестве пространства Еп, содержащем множество Σ=ο'πο"~ηθιη ... n^ns'ns^nsiii... пзт. Предположим, что в точке 20εΣ функция F°(z) удовлетворяет условию (а) (или условию (а')) и что заданы конусы Ми...., Μι, Ν ι, ..., #от с вершиной ζ0, удовлетворяющие условиям (б), (в). (Например, эти условия выполнены, если множества Ω{, ..., Ω/, 31э ..., 3m выпуклы и Мх, ..., Ми Nl9 ..., Afm— опорные конусы этих множеств в точке z0.) Через /(г0) обо- значим множество тех чисел i = 1, ..., q, для которых f (zQ) = 0, а через J(z0) — множество тех чисел /=1, ..., р, для /сого- рых gi (20) = 0. Будем предполагать, что все векторы grad /* (20), i^I(zQ), а также gradg!(z0), /е/(г0), отличньь от нуля. Положим /Ci = KerF', /= 1, ..., &; L/ = Ker G;, /=1, ..., r, и обозначим через Щ полупространство, определяемое неравенством (ζ — z0) grad f (г0) *ξΙ 0, ί<=Ι(ζύ), α через Рj —полупространство, определяемое неравенством (ζ — z0) grad g7 (г0Х0, j<=J(z0), причем предположим, что система выпуклых конусов Ki(i=U ..., k), Lj(j=l, ..., r), Π, (is/(*„)), P/(/e/(2o)), Af,(/=1, ..., Ζ), ^(/=1, .... m) (37.5) не обладает в Еп свойством отделимости. Для того чтобы функция F°(z), рассматриваемая на множестве Σ, достигала минимума в точке z0, необходимо и достаточно существование таких чисел ψ0, tyu ..., ψ&, таких неположительных чисел %ι, i е 1{ζ0), и таких векторов а{, ..., а^ направления которых принадлежат соответственно двойствен*
37] § Ю- КРИТЕРИИ ЭКСТРЕМУМА 339 ным конусам Ώ(Μ{)9..., D(Mt)y что выполнены следующие условия: (α) ψ0<0; (β) (StagradFa(z0) + + 2 λ7grad/y(z0) — ax — ... — a/ 6*^0 / e / (z0) / для любого вектора bz, направление которого принадлежит пересечению Конусов Ζ,*, Ρ/, ΝΛ (/=1, ..., г; /<=/(г0); А = = 1, ..., т). Для доказательства достаточно применить теорему 3?.5 и заметить, что множество W, определяемое соотношениями /<(*)<0, 1ф1(г& ί7(г)<0, /^/Ы имеет z0 Своей внутренней точкой (в пространстве Еп) и потому множество W имеет все пространство £"* своим шатром в точке z0. Поэтому можно добавить множество W к системе множеств *,(/-1......*), 1,(/-1, .... г), /* (ζ) <0(/е/(*«,)), g'(z)<0(/e=/(z0)), Ω,(/=1, ..., Ο, 3/(/=1, ..., m) (и конус Еп к системе конусов (37.5)) без нарушения свойств (б), (в), (г). Замечание 37.8. Как и в предыдущих теоремах, предположение о том, что система всех конусов (37.5) не обладает свойством отделимости, использовалось только при доказательстве необходимости. Достаточность же сформулированных условий имеет место и без этого предположения. Заметим также, что гладкими и выпуклыми достаточно в этой теореме считать лишь те из функций f\ gf, которые соответствуют активным в точке z0 ограничениям fl(z)^0, g}(z)^0. Теорема 37.7 является наиболее общей из содержащихся в этом пункте теорем. В ее формулировке k, r, q, p, U m могут быть любыми неотрицательными целыми числами. Считая некоторые из н»их равными нулю, мы получим из теоремы 37.7 целый ряд частных случаев. Например, теорема 37.5 является частным случаем теоремы 37.7, получающимся при k — r = p = q = 0. Из всех остальных частных случаев мы сформулируем лишь три теоремы (первая из них получается при k = r = p = q = l = 0, вторая получается при г = р = / = т = 0, а третья —при г — *ί*/ = /η«0).
340 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ (37 Теорема 37.9. Пусть Σ = Ξ, f) ... Пат> где 3,, ..., Зт — некоторые множества пространства Еп, и пусть Nu ..., Nm —такие выпуклые конусы с вершиной в точке ζ0^Σ, что Nt есть шатер множества Et в точке z0, причем NtZDEiy i=\, ..., т. Предположим, кроме того, что система конусов N{, ..., Nm не обладает в Еп свойством отделимости. Пусть, наконец, F°(z) — функция, удовлетворяющая условию (а) (или (а7)). Для того чтобы функция F°(z), рассматриваемая на множестве Σ, достигала минимума в точке z0, необходимо и достаточно, чтобы вектор grad F°(zQ) имел неотрицательное скалярное произведение с каждым вектором, направление которого принадлежит конусу Νι Π · · · Π Nm (г. е. чтобы существовали такие векторы ах, ..., ат, направления которых принадлежат соответственно двойственным конусам D(NX), ..., D(Nm), что gradF°(z0) = — a{ — ... ... — am). Последнее замечание (в скобках), содержащееся в формулировке этой теоремы, вытекает из следствия 31.4 и леммы 32.1. Заметим, что условие, наложенное в этой теореме на множества Sj и конусы Nh выполняется, в частности, если множество Зу выпукло, a Nj — опорный конус этого множества в точке 20εΣ, / = 1, ..., m. Теорема 37.10. Пусть в Еп задана плоскость Ω', определяемая системой линейных уравнений Fl{z) = 0, .... /*(*)■= 0 (г. е. функции F1, ..., Fk аффинны*)), причем векторы grad F1, ..., grad/7* линейно независимы, и пусть Ω" — множество, определяемое неравенствами fl(z)^0, ..., Р(г)<0. (37.6) Пусть, далее, z0 — некоторая точка множества Ω' Π Ω" и F°(z) — функция, удовлетворяющая условию (а) {или (а')). Предположим, что все функции f (z), i ^ / (ζ0), выпуклы и являются гладкими. Наконец, предположим, что найдется точка z{ e Ω', для которой все скалярные произведения (*ι - *о) grad /' (z0), i е= / (z0), (37.7) отрицательны. Для того чтобы функция F°(z), рассматриваемая на множестве Ω' Π Ω", достигала минимума в точке ζ0, необходимо и достаточно, чтобы вектор grad F°(zQ) мог быть представлен *) См. сноску на стр. 329.
37J § Ю. КРИТЕРИИ ЭКСТРЕМУМА 341 в виде gradF°(*o) = S*igrad/*(zo)+ Σ λ, grad f!(z^9 (37.8) ί=1 /e/(ze) где все числа λ/, / е / (г0), неположительны. Доказательство. Положим Л^ = Ker F', / = 1, ..., β, и обозначим через П/ полупространство, определяемое неравенством (г — z0) grad fy (г0) ^ 0, / e / (г0). Покажем, что система выпуклых конусов /<СЬ Пу (/=1, ..., k\ /е/(г0)) не обладает свойством отделимости. Допустим Противное. Тогда в силу теоремы 32.2, существуют такие векторы aiy bj (где /=1 k\ /е/(20)), не все равные нулю, что направления векторов ait bj принадлежат соответственно конусам D(Ki), D(Uj) и при этом Учитывая вид конусов Κι, Пу, получаем отсюда, что существуют такие числа aiy β/ (/=1 k; j^I(zQ)), не все равные нулю, что числа β/ неотрицательны и выполнено соотношение Σα, grad F'+ Σ ^grad//(20) = 0. (37.9) Μ /e/(ze) Заметим, что в этом соотношении не все числа β/ равны нулю (т. е. найдется среди чисел β/ хотя бы одно положительное), так как иначе оказалось бы, что векторы grad F\ i=\ k, линейно зависимы. Так как z0^Kt, zx^Ku то (ζι — z0)graaFi = 0t /=1,..., k. Поэтому, умножая соотношение (37.9) скалярно на вектор z{—z0t получаем Σ Mzi-^grad/^Zo^O. /е/(20) Но это противоречит тому, что все числа (37.7) отрицательны, а среди неотрицательных чисел β/, /<=/(г0), имеются отличные от нуля. Полученное противоречие и показывает, что система конусов Κι, Π/ (/=1, ..·, k\ /е/(г0)) не обладает свойством отделимости. Положим теперь Ξί = Νι =Εη и применим теорему 37.7 при г = <7 = / = 0, т=1. Тогда получим, что существуют числа Ψ*, λ/ (/ = 0, 1,..., k\ /е/(г0)), удовлетворяющие соотношению Σψ^^^(*ο)+ Σ Xygradf'(*0))ft*<0
342 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ {37 для любого вектора Ьг (т. е. вектора 6г, направление которого принадлежит конусу Nx=En), причем -ф0 < 0, а все числа λ/, /е/(20), — неположительны. Это означает, что k 2*igradF'(2o)+ Σ l}graafj(z0) = 0, i*=0 / €= / (zo) причем можно считать ψ0 = — 1, откуда и вытекает соотношение (37.8). Теорема 37.11. Пусть в Еп задана плоскость Ω', определяемая системой линейных уравнений Fl(z) = 0, /= 1, ..., k, причем векторы grad У7', i=l k, линейно независимы, и пусть S" — множество, определяемое ограничениями g} (ζ) ^ 0, /=1, ..., р. Пусть, далее, ζ0 —некоторая точка множества Ω' Π Ξ" ti F° (z) — функция, удовлетворяющая условию (а) (или (а7)). Предположим, что все функции gj\z), j<=J(z0), выпуклы и являются гладкими. Наконец, предположим, что найдется точка г{ е Ω', для которой все скалярные произведения (*ι — *о) grad g! (z0), j εξ / (z0), отрицательны. Для того чтобы функция F°(z), рассматриваемая на множестве Ω'(]Ξ"9 достигала минимума в точке ζ0, необходимо и достаточно существование такого вектора ψ = {ψ0> Ψι> ···» Ψ&}> что выполнены следующие два условия: (α) Ψο<0; (β) 2 Ψα gra^ Fa (2o)) bz ^ 0 для любого вектора Ьг, имею- щего неполоэттельное скалярное произведение с каждым из векторов grad g1 (z0), /g/(г0). Эта теорема доказывается так же, как и предыдущая. Замечание 37.12. Рассмотрим частный случай теоремы 37. И, соответствующий & = 0, т. е. случай, когда ищется минимум функции F°(z), заданной на множестве Ξ", определяемой системой неравенств gj(z)^0, /=1, ...,/?, причем эта система является в точке z0 невырожденной. Обозначим через К конус, определяемый системой неравенств (ζ — z0) grad g! (z0) < 0, / e / (z0). Пусть I — некоторый луч, исходящий из точки z0 и расположенный внутри конуса /С. Тогда существует такая точка ζ луча /, что весь отрезок [ζ0, ζ] содержится в множестве В". Иначе говоря, каждый такой луч входит внутрь мно-
зЯ § 10. КРИТЕРИИ ЭКСТРЕМУМА 343 по любому направлению, W&fffy Рис. 150. ясества 3" (рис. 150). Поэтому условие, указанное в теореме 37.11 (а именно, osgrad/70^) Ξ^Ο для любого вектора 6г, направление которого принадлежит конусу /С), означает, что производная функции F°(z) в тонкого -- ■-*-■' входящему внутрь множества В", неотрицательна. Легко видеть, что эта производная положительна. Иными словами, вдоль любого луча, исходящего из точки z0 и входящего внутрь множества В", функция F°(z) вблизи точки z0 возрастает. Это обстоятельство хорошо согласуется с тем фактом, что в точке z0 функция F°(z), рассматриваемая на множестве 3", достигает минимума. Следует, однако, отметить, что одно это обстоятельство без выполнения других условий теоремы 37.11 (в частности, без предположения о выпуклости функций gi (г), / е / (z0)) еще не гарантирует достижения минимума в точке z0. Следующий пример иллюстрирует сказанное. Пример 37.13. Рассмотрим множество 3", описываемое в плоскости переменных ζ\ ζ2 соотношениями (г1)2 + (г2)2 - 8Ζ1 - 6ζ2 < 0, 4г! - (ζ1)2 - (ζ2)2 - 2ζ2 < 0, (37.10) и рассмотрим задачу о нахождении минимума функции F°(zl, z2) = z2 на этом множестве. Таким образом, множество В" задается неравенствами вида gl (zl, г2)^0, g2(z\ г2)^0, где g\ g2 —функции, стоящие в левых частях соотношений (37.10). Точка г0 = (0, 0), очевидно, принадлежит множеству В", причем в этой точке оба рграничения (37.10) являются активными. Рассмотрим вопрос о поведении функции F0 на множестве В" вблизи точки z0. Так как grad gl (z0) - {-8, -6}, grad g2 (z0) = {4, -2}, то конус /С, указанный в замечании 37.12, имеет здесь вид угла, целиком расположенного в верхней полуплоскости (рис. 151). Поэтому вектор grad F°(z0) = {0, 1} имеет положительное скалярное произведение с каждым вектором 6г, направление которого принадлежит конусу /С, т. е. вдоль каждого луча, исходящего из точки z0 и входящего внутрь множества В", функция F°(z) вблизи точки г0 возрастает. Иными словами, в точке г0 условие, указанное в теореме 37,11, выполнено,
344 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ Г37 Однако теорема 37.11 здесь неприменима, так как функция g2(z\ ζ2) не является выпуклой. И действительно, в точке (4, —2), также принадлежащей множеству S" (рис. 152), функция F°(z) принимает меньшее значение, чем в точке z0: /70(0,0) = О, ЯЧ4, -2) = -2. Этот пример показывает, что требование выпуклости функций gi(z)y i^J (z0), наложенное в теореме 37.11 (или в теореме 37.10), gradyV Рис. 151. лугШ является существенным. (Нетрудно привести пример, показывающий, что и требование о выпуклости функции F°(z) существенно.) Заметим, что в разобранном примере функция F°(z) достигает в точке 20 = (0, 0) локального минимума, т. е. ее значение в точке z0 является наименьшим среди значений, принимаемых функцией F° (z) на множестве Ξ" (] Σε, где Σε — шар достаточно малого радиуса ε с центром 20. Однако теорема 37.11 (как и другие теоремы этого параграфа) говорит об абсолютном минимуме функции F°(z)t рассматриваемой на множестве Ξ", т. е. о минимуме функции F°(z) не в окрестности точки z0, а на всем множестве 2". Рис. 153. Замечание 37.14. Если все функции, стоящие в левых частях ограничений ^;(г)^0, являются выпуклыми (а не только те, которые соответствуют активным в точке ζ0~ ограничениям), то множество 3", как нетрудно доказать, является выпуклым, Еслц же выпуклым^ являются лишь функции, соответ-
3β] § 10. КРИТЕРИИ ЭКСТРЕМУМА 34β ствующие активным в точке ζ0 ограничениям, то множество 3" в теореме 37.11 может быть и невыпуклым (рис. 153). Замечание 37.15. Необходимые и достаточные условия минимума, выведенные в этом пункте, представляют собой обобщения классических методов исследования * экстремумов по первым и вторым производным. Рассмотрим, например, теорему 37.10 в том частном случае, когда £ = д = 0, т. е. когда область определения функции F°(z) совпадает со всем пространством Еп. Тогда получаем следующее утверждение. Пусть F° (z) — выпуклая функция, заданная на Еп\ для того чтобы функция F°(z) достигала минимума в точке z0t необходимо и достаточно выполнение равенства grad Fd(z0) = 0. Это — классическое условие минимума; равенство grad F°(z0) = 0, . dF°(z0) . . т.е. обращение в нуль частных производных —V^, ι = 1,.. ., /ζ, dzl совпадает с классическим необходимым условием экстремума, а выпуклость функции (накладывающая определенные требования на вторые производные; ср. стр. 319—320) гарантирует достижение экстремума (и притом именно минимума) в точке z0: 38. Принцип максимума. В этом пункте будут сформулированы несколько теорем, которые мы объединим под общим названием «принцип максимума». Эти теоремы дают необходимое и достаточное условие экстремума, эквивалентное теоремам предыдущего пункта, но отличающееся от них по форме. Будем снова, как в теореме 37.11, рассматривать задачу о минимуме функции F°(z) на множестве Q'f)S", причем Ω' есть плоскость, определяемая уравнениями F1 (ζ) = 0, i = 1, ..., &, где функции F\ ..., Fk аффинны; предположения относительно функции F°(z) и множества S" будут указаны ниже/Введем в рассмотрение вспомогательный вектор tp = {\|)0, ψι, ..., ψ^}, аналогично тому, как это было сделано в теореме 37.11, и рассмотрим функцию Я-Я(г)-я|)о/?0(2) + *1Я(2)+ ··· +**/*(*)· (38.1) Введение этой функции позволяет проще записать условие (β) теоремы 37.11: bz grad Η (ζ0)^ 0 для любого вектора. Ьг, направление кото· рого принадлежит конусу К, определяемому неравенствами (* — ZoJgradg'fcoXO, je£j(zQ). Иначе говоря, производная функции Η в точке ζ0 по любому направлению, входящему в конус К, неположительна. Похоже на то, что (при тех значениях ψ0, i^, ...,.ψ^, существование которых утверждается в теореме 37.11) функция Я убывает (точнее, не возрастает), когда мы из точки ζ0
346 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ ί38 сдвигаемся в конус К, т. е. что функция Я, рассматриваемая на конусе К (а потому и на множестве Н" cz К) достигает локального максимума в точке ζ0. Более того, можно ожидать, что функция Я, рассматриваемая на S", достигает в точке ζ0 абсолютного максимума: поскольку функция F°(z) выпукла, то функция ,ty0F0(z) вогнута (ибо ψ0 < 0), а значит, в силу аффинности функций Fx(z\ ...,Fk(z), вогнутой является и функция Я,(рис. 154). Рис. 154, Таким образом, мы приходим к следующей гипотезе: для того чтобы {при выполнении условии теоремы 37.11) функция F°(z), рассматриваемая на множестве Q'(]E"y достигала минимума в точке z0, необходимо и достаточно существование такого вектора ψ = {ψ0, фь ..., г|^}, что ψ0 < 0 и функция Я перемен· ного г, определяемая равенством (38.1), достигает на множестве 2" максимума в точке ζ0. Заметим, что достаточность этого условия доказывается тривиально (и притом без всяких ограничений на множество 3" и на функции Fl(z), .·., Fk(z), задающие множество Ω'). В самом деле, на множестве Ω' (а значит, и на Ω' Г) 2") все функции Fl(z)9 ..., Fk(z) обращаются в нуль, и потому функция Я на множестве Ω'Γ|2" сводится к выражению ^qF°{z). Но тогда ясно, что если функция Я, рассматриваемая на Ξ", достигает максимума в точке ζ0, то на множестве Ω'(]Ξ" эта функция, т. е. ty0F°(z), подавно достигает максимума в точке z0i а потому F°(z) на Ω'f)2" достигает минимума в точке г0 (ибо % < 0). Наоборот, необходимость сформулированного выше условия не очевидна: ведь утверждается, что функция Я достигает в точке ζ0 максимума не только на множестве Ω'{]Ξ", где справедливо соотношение Я = /ф0Я)(а:), а на всем мно-
381 § 10. КРИТЕРИИ ЭКСТРЕМУМА 347 экестве S". Покажем, что при ограничениях, наложенных в теореме 37.11, необходимость также имеет место, т. е. справедлива следующая теорема, подтверждающая правильность высказанной гипотезы. Τ е о р"е м а 38.1 (принцип максимума). Пусть в Еп задана плоскость Ω', определяемая системой линейных уравнений F* (ζ) = 0, I = 1, ..., k, причем векторы grad F\ i = 1, ..., k, линейно независимы, и пусть Ξ" — множество, определяемое неравенствами g!(z)^i0, /=1, ..., р. Пусть, далее, z0 —некоторая точка множества Ω' Π 2" и F° (z) — функция, определенная на множестве, содержащем 8", и удовлетворяющая условию (а) (или (а')) (см. стр. 332). Предположим, что все функции g^z), j <= / (z0), выпуклы и являются гладкими. Наконец, предположим, что найдется точка zx e Ω', для которой все скалярные произведения (*ι — *о) g^d g1 (z0), / €= / (z0), отрицательны. Для того чтобы функция F°(z), рассматриваемая на множестве 0'Г|2", достигала минимума в точке z0, необходимо и достаточно существование такого вектора -ψ = {i^0> Ψι, ···, ψ&}, что ψ0 < 0 и функция Η(ζ), определяемая формулой (38.1) и рассматриваемая на множестве Е", достигает максимума в точке г0. Доказательство. Достаточность, как мы отмечали выше, очевидна. Докажем необходимость. Пусть функция F°(z), рассматриваемая на множестве Ω'Γ|2"» достигает минимума в точке 20. Тогда существует вектор ty = {i|)o, Ψι, ..., %}, удовлетворяющий условиям (α) и (β) теоремы 37.11 (ибо мы здесь наложили те же условия, что и в теореме 37.11). Докажем, что этот вектор ψ и является искомым. Пусть ζ — произвольная точка множества Ξ", так что в этой точке функция Ρ определена. Так как функция F°(z) удовлетворяет условию (а) (стр. 332), то f°(z)^F°(z)9 где /^ — аффинная функция, существование которой утверждается в условии (а). Следовательно, учитывая, что ψ0<0, находим (см. (37.1) и (37.2)): Η (ζ)-Η (ζ0) = %Я> (ζ) + ψ^1 (ζ) + ... + ψΛ/* (ζ) - ψ0Ρ (ζ0) - -ιΜ^ο) - · · · -**/*(*ο)< W°(*) + *,/*(*) + · · · + **/*(*)- - Ψο/° (Ζο) - Ψι^1 (*ο) -'.,.- **/* (ζ0) = Ψο (/° (ζ) - /° (26)) + + ψ1 (Я (2) - Л (30)) +...+** (Fk (ζ) - Fk (z0)) = ==ψ0(2: — 20)gradf0 + ^(2: —20)gradF1 + ... + ^(2:-2:o)grad^ = -=(z-20)(^ogradf°r+^gradFI+ ... +i|)fegrad^) = -=(3-20)(i|)0gradF0(30) + ^gradFI+ ... + ψ* grad F*),
348 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ (38 Но последнее выражение неположительно в силу условия (β) теоремы 37.11, так как геЗ" czK, где /С — конус, определяемый неравенствами (ζ — z0) grad gf (z0) < 0, /g/ (zq), и потому направление вектора δζ = ζ—ζ0 принадлежит конусу /(. Следовательно, ff(2)-ff(z0)<0j. е. Я(г)<#(z0). Поскольку в этом рассуждении точка ζ е 3" была произвольной, функция Η (ζ), рассматриваемая на множестве 3", достигает максимума в точке zQ. Совершенно аналогично (только с использованием из теоремы 37.11, а теоремы 37.7 при q — I = 0) доказывается и следующее утверждение: Теорема 38.2 (принцип максимума). Пусть Of—-множество, определяемое в пространстве Еп уравнениями Я (г)-0, ..., Fk(z) = 0, и 3' — множество, определяемое в Еп уравнениями G4z) = 0 Gr(z) = 0, где Fl (ζ), ..., F* (z), G1 (ζ), .. ♦, Gr (z) — непостоянные аффинные функции. Пусть, далее, 3' — множество, определяемое неравенствами gl(z)<0 gp(z)<0, где gl (z), ..., gp (ζ) — гладкие выпуклые функции. Пусть, наконец, Зь ..:, Sm — произвольные множества пространства Еп и F° (z) — функция, область определения которой содержит множество Ξ = 3'η3"η3ιί1 ... ПЗт. Предположим, что в точке ζ0^Ω;(]Ε функция F°(z) удовлетворяет условию (а) (или (а7)) (стр. 332) и что заданы конусы Νχ, ..., Nmc вершиной z0, удовлетворяющие условию (в) (стр. 333). (Например, эти условия выполнены, если множества Ξ, Зт выпуклы и N\,..., Nm —опорные конусы этих множеств в точке z0). Будем предполагать, что все векторы grad g! (z0), j<=J(zQ), отличны от нуля. Положим Ki = KevFl, i=\, ..., k\ Li = Ker Gi, j=\, ..., г, и обозначим через Я/ полупространство, определяемое неравенством (ζ — zQ) grad g1 (z0) ^ 0, причем предположим, что система выпуклых конусов Ki\t = l, ··., k), Lt(i=\ г), PiUezJM, Nj(j=l, ..., m) не обладает в Еп свойством отделимости. Для того чтобы функция F°(z), рассматриваемая на множестве Ω'()Ξ, достигала минимума в точке ζ0, необходимо и
381 § 10. КРИТЕРИИ ЭКСТРЕМУМА 349 достаточно существование такого вектора Ψ = [ψ0, tfo, ..., tyk}, что Ψο<° и ФУнЩия Η (ζ), определяемая формулой (38.1) и рассматриваемая на множестве 2, достигает максимума в точке zc. Наконец, сформулируем принцип максимума для случая, когда множество Ω задается линейными уравнениями и выпуклыми ограничениями. Теорема 38.3. Пусть Ω' — множество, определяемое в пространстве Еп уравнениями F1 (ζ) = 0, /= 1, ...,· k, еде Fl(z), .. . ..., Fk(z) — непостоянные аффинные функции. Пусть, далее, Ξ{, ..., Зт~произвольные множества пространства Еп, и F°(z) — функция, область определения которой содержит множество 3 = Ξι Π · · · Π 2т- Пусть, наконец, Ω" — множество, определяемое неравенствами ^(ζ)^0, / = 1, ..., q, где fl(z) fq{z) — гладкие выпуклые функции, область определения каждой из которых содержит множество Ξ. Предположим, что в точке zQ е Ω7 Π Ω" Π 2 функция F° (z) удовлетворяет условию (а) (или (а')) (стр. 332) и что заданы конусы Nl9 ..., Nm с вершиной z0, удовлетворяющие условию (в) (стр. 333). Будем предполагать, что все векторы grad ff(zQ), j^I(zQ), отличны от нуля. Положим /Q:=KefFl, ί=1, ..., k, и обозначим через Π/ полупространство, определяемое неравенством (ζ — z0) grad f! (z0) ^ 0, причем предположим, что система выпуклых конусов Kt(i=U .··> k), П/(/е/(20)), Nk{h=l, ..., m) не обладает в Еп свойством отделимости. Для того чтобы функция F°(z), рассматриваемая на множестве Ω' Π Ω" Π 3, достигала минимума в точке ζ0, необходимо и достаточно существование таких чисел ί|)0, ψι, ..., ψ^ и таких неположительных чисел λϊ9 ..., λφ что выполнены следующие условия: («) ψ0<0; к q (β) функция Η (ζ)=2 Ψα^α(2)+ Σ λ//'О2), рассматриваемая на множестве S, достигает максимума в точке z0; (Υ) λ,Η*ο)= ... =Я,Г(г0) = 0. Доказательство. Пусть условия (α), (β), (ν) выполнены. Возьмем произвольную точку ζ ^ Ω' f) Ω"(]2. Тогда Я(г)<Я(г0) (в силу условия (β)). Так как на множестве Ω' (и, в частности, в точке ζ) все функции Fl (z), ..., f*(z) обращаются в нуль, то в силу условия (ν) это неравенство принимает вид Ψο^ω + Σλ/^ΧΨο^^ο).
350 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИИ [38 Таким образом, Ψο (F° (ζ) - Я (го)) < ~ Σ λ/ (ζ) < 0, т. е. согласно (α) имеем F°(z) —- F°(z0) ^0. Но это и означает, что функция F°(z), рассматриваемая на множестве Q'f)Q"f)3, достигает в точке z0 минимума. Итак, * достаточность сформулированных условий установлена. Докажем необходимость. Пусть функция F°(2), рассматриваемая на множестве Ω' Π Ω" f) 2, достигает минимума в точке 20. Тогда существуют числа ψ0, Ψι, ..., ψ^ и неположительные числа λ/, /<=/(г0), удовлетворяющие условиям (α), (β) теоремы 37.7 (при г = р=/=0). Положим λ/ = 0 при j&I(z0) и покажем, что полученные таким образом числа -ф0, ψΜ ..., -фъ ^ι> ···» ^ удовлетворяют условиям (α), (β), (γ) теоремы 38.3. Условие (а) совпадает с условием (а) теоремы 37.7 и, следовательно, выполнено. Условие (γ) также выполнено, так как при /е/(г0) имеем //(г0) = 0, а при j&I(z0) имеем λ/= 0. Остается проверить справедливость условия (β) теоремы 38.3. Пусть ζ — произвольная точка множества S, так что в этой точке все функции Я (г), Ρ {ζ), ..., fq (z) определены. Так как функция F°(z) удовлетворяет условию (а) (стр. 332), τοϊ°(ζ)*ζ. k^F°(z), где /° — аффинная функция, существование которой утверждается в условии (а). Учитывая, что ψ0 < 0, находим (см. (37.1), (37.2)): H(z)-H(z0) = q0F»(z) + qlF*(z) + ... + ♦*/*(«) + + λ{Ρ(ζ)+ ... +λβΗ*)- Ψο/70^)- ЪР1(*о)- · · · - **/*(2ϋ)- -λ№θ)~ ·.· -λ/(ζ0)<^Μ/°(2)-/°(Ζθ)) + + ^ (Я (ζ) - Я (ζ0)) + ... + ψ, (F* (г) - F* (г0)) + + Σ λ/ (f («) - f Ы) = W(* - *o) grad Ρ + + Σ Ь (ζ - z0) grad F'+Σ У (г) = = Σ t|)a(2-20)gradFa(2o)+ Σ λ/(г). α=*0 / e / (zQ) Так как функция ff(ζ) — выпуклая, то при j^I{z0) имеем: Ρ (ζ) = /> (г) - р (zQ) >{z- zQ) grad f (*0)
38] § 10. Kt>HtEt>tftf ЭКСТРЕМУМА 351 (ср. стр. 332—333), и потому, учитывая соотношение λ/ < 0, получаем Η {ζ)-Η (ζ0) < Σ Ψα (2 - 20) grad Fa (ζ0) + + Σ λ/(2-2o)grаd//(гo) = / e / (20) \α=0 / е / (г0) / Но правая часть неположительна в силу условия (β) теоремы 37.7, так как геЗс^П ... (]Nm9 и потому направление вектора ζ — ζ0 принадлежит конусу Ν{ f) ... f| Nm. Следовательно, Я(2)-Я(20)<0, т. е. #(гХ#(г0). В доказанной теореме можно (как и в теореме 38.2) считать, что часть множеств 31э ..., Ет и конусов Ν{9 ..., Νη удовлетворяет условию (в7), часть — условию (в'") и остальные удовлетворяют условию (в). Таким путем из теоремы 38.3 непосредственно получается более общая теорема (ср. теорему 38.2), которую, однако, мы здесь не формулируем. Замечание 38.4. Как видно из доказательства, в теореме 38.3 выпуклость и гладкость функций Ρ {ζ) достаточно потребовать лишь для /е/(г0). Замечание 38.5. Если в теореме 38.3 потребовать лишь локальную выпуклость функций F°(z) и fi{z)i i^I(z0), в точке 20, то получится необходимое и достаточное условие локального минимума, т. е. минимума функции F° (z), рассматриваемой на множестве ΣΓ f) Ω' f) Ω" Π Ξ, где ΣΓ — шар некоторого достаточно малого радиуса г с центром ζ0 (при этом и максимум функции Η (ζ) надо рассматривать на множестве ΣΓΠΞ). Но ясно, что необходимое условие локального минимума является вместе с тем и необходимым условием абсолютного минимума (т. е. минимума функции F°(z), рассматриваемой на всем множестве Q'f\Q"(\Щ. Таким образом, если потребовать лишь локальную выпуклость функций F°(z) и fl(z)9 i^I(z0), в точке г0, а заключительное требование заменить условием, что функция Я (г), рассматриваемая на множестве Ξ, достигает локального максимума в точке г0, то из теоремы 38.3 получится необходимое условие (абсрлютного) минимума. Таким же образом можно получить необходимое условие (абсолютного) минимума в форме принципа максимума и из теорем 38.1 и 38.2. Пример 38.6. Пусть F°(z) — гладкая выпуклая функция, заданная в открытом множестве пространства £"\ и пусть 2 — выпуклое множество, содержащееся в области определения функции F°(z). Пусть, наконец, Ω'— некоторая плоскость и
352 гл. tv. экстремумы функций (38 Ζο^Ω'ΠΞ. Через N обозначим опорный конус выпуклого множества 2 в точке ζ0 и предположим, что Ω' и N неотделимы в Еп. Выберем такие аффинные функции Fx(z), ..., Fk(ζ) градиенты которых линейно независимы, что ' ' 0' = (КегЯ)П ... П(Кег/*). Легко видеть тогда, что система выпуклых конусов КегЯ, ..., KerF*, N не обладает в Еп свойством отделимости, т. е. все условия теоремы 38.2 (в которой теперь следует положить г = 0 = 0 т= 1) выполнены. ' Следовательно, для того чтобы функция F°(z), рассматриваемая на множестве Ω'ΠΞ, достигала минимума в точке ζ0, необходимо и достаточно существование такого вектора ψ = {ψ0, ψ„ ..., ψ^}, что ψ0<0, и функция Я (г), определенная формулой (38.1) и рассматриваемая на множестве Ξ, достигает максимума в точке ζ0. При этом можно предполагать, что ψ0= — 1. Дадим геометрическую интерпретацию сформулированного утверждения (рис. 155). С этой целью обозначим через Еп+Х про- Рис. 155. странство размерности п+1, содержащее Еп, и вве'дем в Ε такую (ортонормированную) систему координат ζ1, ..., ζη, ζη+ι, что гиперплоскость ζη+{ = 0 совпадает с Еп. Через W обозначим график функции z"+l = F°(z), рассматриваемой на множестве 2, т. е. множество всех точек (ζ1, ..., ζη, ζη+ι)9 для которых точка ζ = (ζ1, ..., ζη) принадлежит 3 и F° (ζ) = zft+1! Далее, через Ω* обозначим плоскость в Еп+{, параллельную Ω' и проходящую через точку z* = (zj, ..., ζ», F°(z0))z=W (где го> ···» *o — координаты точки z0 в Еп). Наконец, через Г обозначим гиперплоскость пространства Еп+\ служащую графиком функции ζΛ+1=Φ(ζ), где • =ч>\£)9 где (38.2)
39] § 10. КРИТЕРИИ ЭКСТРЕМУМА 353 Так как Fl(z) — ... =F*(z) = 0 при ζ^Ω' (и, в частности, при ζ = ζ0), то O(z) = F°(z0) при ζ<=Ω'. Следовательно, гиперплоскость Г содержит плоскость Ω*. Заметим теперь, что Η (ζ0) = — F° (z0), и потому Ρ(ζ)-Φ(ζ) = #(ζ0)-#(ζ). Следовательно, из того, что функция Я (ζ), рассматриваемая на множестве 3, достигает максимума в точке ζ0, вытекает, что F°{z)^0(z) на множестве 3, и потому множество W расположено в Еп+{ над гиперплоскостью Г (т.е. в полупространстве ζΛ+Ι>Φ(ζ)). Обратно, если существует такая гиперплоскость Г, проходящая через плоскость Ω*, что множество W расположено над гиперплоскостью Г, то Г определяется уравнением ζΛ+1=Φ(ζ), где функция Φ (ζ) имеет вид (38.2), и потому на 3 выполнено неравенство Я(2)<Я(20). Итак, для того чтобы гладкая выпуклая функция F°(z)t рассматриваемая на множестве Ω' f) 3 (где. 3 — выпуклое множество, содержащееся в области определения функции F°(z) и неотделимое от плоскости Ω'αΕη), достигала минимума в точке г0ей'П3, необходимо и достаточно существование в пространстве En+l zd En такой гиперплоскости Г, что график функции zn+l = F°(z), рассматриваемой на множестве 3, расположен над Г, причем Г содержит плоскость Ω\ параллельную Ω' и проходящук) через точку ζ* = (z0, F° (z0)). Это утверждение (геометрически достаточно очевидное; см. рис. 155) и служит иллюстрацией принципа максимума в рассматриваемом случае. 39. Метод динамического программирования. В этом пункте мы опишем метод отыскания минимума, совершенно отличный от методов, рассмотренных в предыдущих пунктах, и называемый методом динамического программирования. Метод этот восходит к работам Р. Беллмана. Для того чтобы уяснить идею метода, рассмотрим еще одно решение задачи, поставленной в примере 7.1 на стр. 46. Пример 39.1. Найти минимум функции (7.4), рассматриваемой на прямоугольнике — 1^д:^3, 0^у^2, Решение. Придадим переменному χ фиксированное значение (принадлежащее отрезку — 1 ^ л: ^ 3) и будем рассматривать F как функцию одного только переменного у (изменяющегося на отрезке О^у ^2). Минимальное значение этой функции обозначим через ω(χ) (рис. 156). Таким образом, для любого у, удовлетворяющего неравенствам 0^у^2, справедливо соотношение F(x, у)^а>(х), причем на отрезке 0^у<2 найдется хотя бы одна точка, для которой достигается
354 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [39 равенство F(xy у)=а>(х). Число ω (л;) определено для любого х, принадлежащего отрезку — 1 < х<3, т. е. ω(χ) есть функция, заданная на этом отрезке. Обозначим через т минимальное значение этой функции. Нетрудно понять, что т совпадает с минимальным значением функции F(x,y) на рассматриваемом прямоугольнике. Действительно, так как т= min ω (я), -1<Х<3 то найдется на отрезке <й(х0) = т. Далее, так как 1^а:^3 такая точка х09 что ω(χ0)= min F(x0ty), 0<ί/<2 то найдется на отрезке 0<у<2 такая точка у0,_ что F(x0y Уо)= = со(л;0), т. е. F(x0, Уо) — т. С другой стороны, для любой точки (я, у) рассматриваемого прямоугольника имеем F(x,y)^ min F(xty) = 0<ί/<2 = ω (χ) ^ min ω (χ) = m. -i<x<3 Итак, F(x,y)^m для любой точки прямоугольника, причем имеется (по крайней мере, одна) такая точка (x0i y0), для которой F (χο> У о) — т· Но это и означает, что т есть минимальное значение функций F. Рис. 156. Из сказанного следует, что минимальное значение функции F(xfy) можно отыскать в два этапа: сначала найти функцию ω (я), а затем определить ее минимальное значение. Приступим к осуществлению этого плана. Для нахождения функции со(л:)= min F(x,y) 0<У<2 приравняем нулю частную производную Fy функции F (см. второе соотношение (7.6)). Ясно, что если χ Φ 0, то производная Fy обращается в нуль только в одной точкеу=\. Следовательно, при фиксированном хфО функция F(x, у) может достигать на отрезке 0<^у^2 своего минимума либо в точке #—1, либо в концевых точках отрезка, т. е. при у = 0 или у = 2. Иначе говоря, ω(χ) есть наименьшее из трех чисел: F(x, 0), F{x, l),
39J § 10. КРИТЕРИИ ЭКСТРЕМУМА 355 F(x, 2) (причем это утверждение справедливо и при л: = 0, ибо /7(0, у) = 3 = const). Согласно (7.4) F (*, 0) = F(*, 2) = у χ* + χ* - 4χ + 3; F(x, 1) = 4^з + 3. (39.1) Так как функция х2 — Ах == χ (χ — 4) положительна при — 1 ^ χ < 0 и отрицательна при 0 < χ ^ 3, то мы имеем следующее выражение для функции <ύ(χ): ω(χ) = -f*3 + 3 при — 1<*<0, |·λ;3 + *2-4λ; + 3 при 0<*<3. Теперь ясно, что свое наименьшее значение т функция ω (л;) может принимать либо в одной из точек л: = — 1, # = 0, # = 3, либо же в точках, где ее производная обращается в нуль, т. е. в точках χ = — 2, χ = 1. Но точка χ = — 2 не принадлежит отрезку — 1^д:^3. Следовательно, остается сравнить числа ω(—Ι), ω(0), ω(1), ω(3). Непосредственный подсчет показывает, что наименьшим из них является значение ω(1) = 2/3. Таким образом, минимум функции F{x>y) равен т = 2/3; из (39.1) видно, что это минимальное значение функция F принимает в двух точках: (1,0) и (1,2), Примененный при рассмотрении этого примера метод решения сводится к последовательному вычислению минимумов функций от одного переменного. Сначала ищется минимум функции F(x, у) от одного переменного у при фиксированном (но произвольном) значении χ — этот минимум обозначается через ω (а:), — а затем ищется минимум получающейся функции ω (л:) переменного х. Этот метод может быть применен и для отыскания минимума функции от любого числа переменных. Именно, пусть F(z\ ..,, zn) — функция, заданная на некотором множестве ОсГ. Фиксируем произвольно числа zl — z{0, ..., zn~l=z%~1' и рассмотрим функцию F(zlQ z£-1, zn) одного переменного ζ* (она определена для тех значений znt для которых точка (zj, ..., ζβ~ι, ζη) принадлежит множеству Ω). Наименьшее значение этой функции (зависящее, конечно, от выбора чисел 4» ··., ζ*-1) обозначим через ωη_χ(ζι0, ..., г*"1). Таким образом, мы получаем функцию ω^-^ζ1, ..., ζη~ι) от /г—1 переменных ζ1, ..., 2й"1: ωη-χ(ζι, ..., zn-l) = minF(zl, ...? гп~\ zn). (39.2)
356 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [39 Теперь фиксируем произвольно числа ζ\% ..., z£-2 и рассмотрим функцию <V-,(zJ, ..., ζ*"2, ζη~ι) одного переменного ζη~{. Наименьшее значение этой функции обозначим через ωη-2(ζο*··"» ζο~2)· Мы П0ЛУчаем функцию ωη-2(ζ\ ···, *п~2) от η — 2 переменных ζ1, ..., zn~2: <*n-2(zl ζ11"2) —πιΐηω^!^1, ..., ζ""2, ζη'1). ζη-\ Вообще, если уже определена^ функция щ(гх% ..., zk) от k переменных, то определим ω^_ι (ζ1, ..., zk~l) как минимум этой функции по переменному zk (при фиксированных ζ1, ..., zk~l): ω^-ιί*1. ..., zk-l) = min<ub{zl> ···> *к~х> zk)\ k = 29 ..., л — 1. 2* (39.3) Таким образом, последовательно определяются функции <йп-г(г\ ..., ζ*"2, ζ^1), ωΛ-2(ζ!, ..., ζ*-2), ... ..., α*(ζ1, ζ2), (Μζ1). (39.4) Наименьшее значение последней из этих функций обозначим через т: m = mincD1(zI). (39.5) ζ1 Нетрудно понять, что т есть наименьшее значение исходной функции F(z\ ..., ζη). (Более точная формулировка и доказательство этого факта содержатся в следующей ниже теореме 39.2.) Таким образом, рассмотрение последовательности функций (39.4), определяемой рекуррентными соотношениями (39.2), (39.3), позволяет по формуле (39.5) найти наименьшее значение m функции F(z\ ..., ζ"), причем при применении этого метода каждый раз приходится находить минимум функции, зависящей лишь от одного переменного. Это и есть метод динамического программирования (примененный к задаче о нахождении минимума функции). Несомненным достоинством этого метода является универсальность (т. е. большая широта его области применимости). Из того описания, которое в общих чертах было проведено выше, ясно, что для применения этого метода не требуется делать никаких предположений о характере функции F(z\ ..., гп) и ее области определения. Таким образом, среди всех рассмотренных (и не рассмотренных) методов отыскания экстремумов динамическое программирование обладает наибольшей общностью. Другим достоинством метода является то, что он позволяет снизить размерность рассматриваемой задачи, т. е. (в приведенном выше аспекте) сводит вычисление минимума функции
39] § 10. КРИТЕРИИ ЭКСТРЕМУМА 357 многих переменных к последовательному нахождению минимумов функций одного переменного. Однако в действительности это достоинство является, как правило, лишь кажущимся и в подавляющем большинстве случаев превращается в недостаток метода. Дело в том, что в последовательности (39.4) функции становятся все более сложными — даже при хорошей аналитической записи исходной функции F(z\ ..., zn). Мы видели это уже в примере 39.1, где была в «последовательности» (39.4) всего одна функция ω(Α:)(=ω1 (ζ1)): в отличие от исходной функции F(x, у), функция ω (а;) уже не имела единого аналитического представления и по-разному определялась на двух отрезках, составляющих ее область определения. Поэтому легко можно представить себе, что будет происходить при применении метода в общем случае: число «кусков», на которых будет по-разному определяться функция ω%(ζ\ ..., zk), будет все более возрастать по мере уменьшения k, что сделает вычисления, требуемые для последовательного проведения метода, практически необозримыми. К тому же, хотя формально все время идет речь о минимуме функции одного переменного, в действительности задача осложняется наличием нескольких параметров (например, чтобы найти функцию ωΛ-! (ζ1, ..., ζη~ι) по формуле (39.2), нужно искать минимум функции, зависящей от одного переменного ζη9 но искать его при всевозможных значениях параметров г*, ..., z%~ly И это неизбежно, поскольку при рекуррентном вычислении функций (39.4) мы так и не знаем до последнего момента (т. е. до нахождения числа т), каковы же будут те значения переменных ζ\ ..., ζη, при которых исходная функция F(z\ ..., ζη) достигает минимума. Приходится искать (и запоминать) значения функций (39.4) для всех значений аргументов. Поэтому в общем случае, при сколько-нибудь большом ана- чении пу метод динамического программирования не может быть полностью проведен даже с помощью электронных вычислительных машин, так как он требует слишком большого количества вычислений и слишком большого объема памяти. Это и неудивительно: ведь, по существу, метод динамического программирования предполагает перебор всех значений функции F(z\ ..., ζη). Так, в примере 39.1 мы сначала изучали значения функции F'(x, у) на каждом отрезке я — const (т. е. перебирали все значения этой функции), после чего из минимумов функций на этих отрезках выбирали наименьший. Указанные обстоятельства затрудняют применение метода динамического программирования. Однако иногда удается привлечь какие-либо дополнительные соображения, позволяющие
358 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ Г39 до конца провести решение задачи этим методом. Пример 39.3, приводимый ниже, иллюстрирует сказанное. Теперь сформулируем и докажем теорему, дающую изложение метода динамического программирования (в применении к задаче об отыскании минимума функции). Прежде всего введем необходимые обозначения. Пусть F(z\ ..., zn) — функция, заданная на некотором множестве Qc£ft. Обозначим через Еп~1 пространство переменных ζ1, ..., zn_I, а через Ωη-{ — множество всех тех точек (ζ1, ..., ζη~ι)<=Εη~ι, для каждой из которых можно подобрать такое число ζη, что (ζ1, ..., 2я"1, 2η)εΩ. Иначе говоря, точка (ζ1, ..., ζη~ι) в том и только в том случае принадлежит множеству ΩΛ-.!, если прямая, проходящая через эту точкГу параллельно оси ζη; пересекается с множеством Ω. На множестве Ω^-! мы определим функцию ωΛ_ι(ζ1, ..., ζη~ι) формулой (39.2), где минимум берется по всем значениям ζη, для которых (ζ1, ..., ζη~ι, ζη)^Ω. Будем предполагать, что функция ωΛ-ι (ζ1, ..., ζη~ι) определена на всем множестве Ωη-\9 τ. е. что для любой точки (ζ1, ..., ^^ΕΩη-! минимум (39.2) существует. Пусть уже построена (при некотором k = 2, ..., η —■ 1) функция ω* (ζ1, ..., zk), определенная на некотором множестве Ω& пространства Ek переменных ζ1, ..., zfe. Обозначим через Ek~l пространство переменных ζ1, ..., zk~l, а через Ω^ — множество всех тех точек (ζ1, ..., zk~~l)<^Ek~\ для каждой из которых можно подобрать такое число zk, что (ζ1, ..., zfe-1, zk) <= Ω^. На множестве Ω^ определим функцию ω^-^ζ1, ..., zk~l) формулой (39.3), где минимум берется по всем значениям ζ*, для которых (ζ1, ..., ζ*-1, zk)^Qk. Будем предполагать, что функция ω^-ιίζ1, ..., zk~l) определена на всем множестве Ω^, т. е. что для любой точки (ζ1, ..., z^JeQ^j минимум (39.3) существует. Предположение о существовании минимумов (39.2), (39.3), (39.5) — единственное ограничение, накладываемое при применении метода динамического программирования. (Заметим, что это предположение заведомо выполняется, если Ω — замкнутое ограниченное множество пространства Еп9 а функция F(z\ *.., zn) непрерывна на Ω.) Теорема 39.2. Пусть F (ζ1, ♦.., ζη) — некоторая функция, заданная на множестве Ω cz En. Предположим, что для любой точки (ζ1, ..., z^-'jsQrt-, существует минимум (39.2). Предположим, далее, что для любой точки (ζ1, ..., zk~x)^Qk^x су- ществует минимум (39.3), k = 2, ..., η —· 1. Предположим, наконец, что существует минимум (39.5) (по множеству Ω{). Тогда число m есть минимум функции F(z\ ..., zn) на мно-
39] § 10. КРИТЕРИИ ЭКСТРЕМУМА 359 жестве Ω. Далее, точка z, = (zj,..., ζ?)<=Ω в том и только в том случае является точкой минимума функции F{z\ ..., ζη) на множестве Ω, если выполнены соотношения: = %-2 (*ί. · · ·, 2Г2) = ... = ω2 (zl z2) — ω, (ζ') = m. (39.6) Доказательство. Для любой точки ζ■»(г1, ..., 2η)εΩ имеем /Ч*1, .... z")^minF(z\ ..., ζ») = <*>„-, (ζ1, ..., ζ*-1), ω„-, (ζ\ · · ·, 2я"1) > min ωΛ«, (ζ1, ..., ζ""1) = ωη_2 (ζ1, ..., ζη~2)9 ζη—\ ω2 (ζ1, ζ2) > min ω2 (г1, г2) = ω4 (г1), Ζ2 ωι (г1) > min ω! (г1) = m. Ζ1 Таким образом, F(z\ ...,ζΛ) ><*>„-, (ζ1, ...,^-!)> > ω„_2 (ζ1, ..., ζ"-2) > ... > ω2 (ζ1, ζ2) > ω{ (ζ1) > m. (39.7) В частности, /^ζ1, ..., гЛ)^/пдля любой точки (ζ1, ..., 2n)eQ, Докажем, что найдется точка (ζι0, ..., ζ*)^Ω, для которой F(zJ, ..., z£) = m. Этим будет доказано, что m есть наименьшее значение функции F(zl9 ..., zn) на множестве Ω. В самом деле, из соотношения (39.5) вытекает, что существует число zJeQp для которого cu1(z£) = m. Далее, из соотношения . M*J) = mjn(D2(zJ, ζ2) (см. (39.3)) вытекает существование такого числа ζ\, что (zj, zg)eQ2 и ω2(ζ£, ζ2) = ω1(ζ^ι), т. е. ω2(ζ*, ζ2) = m. Аналогичным образом доказывается существование такого числа z;j, что (2о» z% zo) е ^з и ω3(2ο» 2о> 2о) — т> и τ· д· Продолжая этот процесс, мы найдем, наконец, такие числа zj, ..., ζΛ-1, что (2о> ···. zo~l)^Qn-\ и ω*-ι(4> ■··» *о~1) = т- Теперь из соотношения <*η-ι(ζο> · · ·» *Γθ = ™η/7(2ό· '" "· *о~!. **) г вытекает существование такого числа zj, что (zj, ..., z£) е Ω и л—1 \ 0' ' 0 / \ 0' * ' "' 0 ' 0/'
360 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [39 т. е. F(z\9 ..., z$) = m. Следовательно т есть минимум функции F(zl zn) на множестве Ω. Докажем заключительную часть теоремы. Пусть ζ# = = (zl, ..., ζΛ) —точка минимума функции F(z\ ..., zn), т. е. F(zl, ..., zn) = m. Тогда в соотношениях (39.7) должны всюду иметь место знаки равенства (иначе было бы F(zl, ..., ζη) > > m), т. е. выполнены соотношения (39.6). Обратно, если выполнены соотношения (39.6), то, в частности, F(zl, ..., zn) = m, т. е. (ζ1, ..., ζη) есть точка минимума. В качестве иллюстрации применения метода динамического программирования рассмотрим снова задачу, содержащуюся в примере 9.2 (стр. 61). Пример 39.3. Найти η неотрицательных чисел ζ1, ..., ζη, сумма которых не превосходит а и которые имеют при этом максимальное возможное произведение. Решение. Речь идет о нахождении минимального значения функции F(Z\ ..., zn) = - zlz2 · ... ■ ζ", (39.8) рассматриваемой на множестве Ω, заданном неравенствами ζ!>0, 22>0, ..., ζ*>0, ζ! + ... + ζΛ<α. (39.9) Будем последовательно вычислять функции (39.4). Ясно, что множество Ωη-{ определяется неравенствами ^ ζ!>0, ..., ζΛ-'>0, ζι + ... +ζΛ~1<α. (39.10) Пусть (ζ1 ζ*"1) — произвольная точка множества Ωη-ι- Для того чтобы точка (ζ1, ..., ζη~ι, ζη) принадлежала множеству Ω, т. е. удовлетворяла неравенствам (39.9), необходимо и достаточно, чтобы число ζη было неотрицательно и удовлетворяло последнему неравенству (39.9), т. е. чтобы выполнялись соотношения 0<ζΛ<α —(ζ1 + ... +z*-{). (39.11) Теперь находим (минимум берется по отрезку (39.11)): ωη-ι(ζ\ ..., zn~l) = minF(z1, .·., ζη)~ ζη = min (— ζιζ2 · ... · ζη) = — max (ζιζ2 · ... · ζη~ιζη) == = — ζιζ2 · ... · ζη'1 · max zn = ζη = -ζιζ2- ... ·ζη-ι(α-(ζι+ ... +ζη~1)). (39.12) Перейдем к нахождению функции ωη-2(2!, . .·, ζη~2). Из (39.10) ясно, что множество Ωη_2 определяется неравенствами ζ^Ο, ..., ζ"-2^0, ζ!+ ... +ζη~2<,α. (39.13)
39] § Ю. КРИТЕРИИ ЭКСТРЕМУМА 361 Пусть (ζ1, ..., ζη~2) <= ΩΛ-2 и ζη~ι^Ο. Для того чтобы точка (ζ1, .··» 2Л~2, ζ71"1) принадлежала множеству Ω„_|, τ. е. удовлетворяла неравенствам (39.10), необходимо и достаточно, чтобы число ζη~ι удовлетворяло неравенствам 0<ζη"1<α-(ζ1+ ... + ζη~2). Обозначим число α — (ζι+ ... + ζη~2) через с. Тогда число ζη~ι может меняться на отрезке 0^zn"l^.c, и потому <йп-2(г1 zn~2) = min ωη-χ(ζι9 ..., г*~\ ζ*"1) — = min [— ζιζ2 · ... · ζ*"1 (α — (ζι + ... ,+ ζΛ~2 + г'1"1))] -» = min [—ζ1 ... ζη~2 · (ζ"""1 (с — ζ"-1))] = 0<2/1-1<С = min Γ-ζ1 ... ζ»-2(χ(- = -ζ! ... ζ"-2· max xf-i-^V —— ζ1 ... ζ"'2 · (^f = — ζχζ" .... „ .,,-.. (°-<>' + у+"~>)Г (здесь использована лемма 9.1, стр. 61, при & = 1). Итак, *.-*&..... *-«)—,■.... >ζ^2(-(-ϊ+-+^η2. (39.14) Вычислим, далее, функцию ωη~ζ(ζ\ ..., ζ"""3). Множество ΩΛ_3 описывается неравенствами ζ!>0, ..., ζ*-3>0, ζ1 + ... + ζ*~3<α. Пусть (ζ1, ..., ги)ей„_3 и ζ*-2>0. Для того чтобы точка (ζ1, ..., ζΛ~3, ζ"~2) принадлежала множеству ΩΛ_2 (см. (39.13)), необходимо и достаточно, чтобы число ζη~2 удовлетворяло неравенствам 0<ζΛ"2<α~(ζ1+ ... +2Л~3). Обозначим число а — (ζ! + · · · + г""3) через rf. Тогда число zn"2 может меняться на отрезке 0^zn~2^.dt и потому ω*-3 (ζ1, ..., ζ"-3) = min ω„-2 (ζ1, ..'., ζΛ~3, ζ*~2) = = min [-2-...^(-(-1+·2·+-"-η21^
= min = — zl ... zn~° · max 362 ГЛ. IV. ЭКСТРЕМУМЫ ФУНКЦИЙ [39 = min [- ζ1 ... ζ»"3 (ζ*-2 (^~**~Ί2)] = -.гй,[-«'-*-И^П]- . -«-*(«-(*' + ··· +г"-3)\з (здесь использована лемма 9.1 при 6 = 2). Итак, *-.(*' г-·) —г· ... г^.("-<* + Г +«-">)*. Продолжая таким же образом, найдем по индукции: <Мг' 2*)~-*'·...·ζ*·("-(*'+_7+^Λ &= 1, ..., л — 1. 0<*<d В частности, при Λ = 1 будем иметь / ΐ\ л ι и — «с- ω! Γ .<*>--«■££)■ Следовательно (поскольку множество Ω! определяется неравенством 0 < ζ1 < а), т =ο<^αω· (2ΐ> -иг. [-г' (^тП - (здесь использована лемма 9.1 при k = n—l). Итак, mtaW>... ,*·)--(£)", т. е. произведение z!z2 ... ζΛ достигает (при ограничениях (39.9)) наибольшего значения, равного (а/п)п. С помощью леммы 9.1 легко проследить, что это наибольшее значение достигается лишь при ζ1 = ζ2 = ... = ζη = α/η — в полном соответствии с результатом примера 9.2.
ГЛАВА V КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ §11. Динамическое программирование 40. Описание метода. Для простоты мы вначале ограничимся основной задачей (см. п. 3). Иначе говоря, рассматривается управляемый объект *(0-М*(*-1). «(0), *=1. .... N. (40.1) u(t)€=Ut(x(t-l))9 f=l Ν, (40.2) для которого начальное состояние х(0) = х0 фиксировано, а на дальнейшие состояния #(1), ..., χ(Ν) никаких ограничений не накладывается. Ставится задача найти такой процесс и(1). и(2), ..., u(N), (40.3) х(0)9 *(1), ..., *(JV). (40.4) удовлетворяющий условиям (40.1), (40.2), для которого выполнено начальное условие χ (0) = х0 и при этом функционал /-Σ/$(*(*-1), и(t)) (40.5) принимает наименьшее возможное значение. (В случае задачи о максимуме, а не о минимуме функционала (40.5) во всех приводимых ниже формулах — и, в частности, (40.6), (40.7) — знак минимума следует заменить знаком максимума.) Определим множества Ω0, Ω], ..., Ω#, расположенные в фазовом пространстве, следующим образом. Множество Ω0 состоит из единственной точки #0. Далее, если множество Qt-X Уже определено (где 1 < / < N), то через Ω, обозначим множество всех точек вида ft(x, и), где х, и удовлетворяют условиям jteQf..!, u^Ut(x) (функция ft и множество Ut указаны в соотношениях (40.1), j^40.2)). Из этого определения непосредственно следует, что если процесс (40.3), (40.4) удовлетворяет соотношениям (40.1), (40.2), то для всех / = 0, 1, . s., N выполнены соотношения x(t)&Qt.
364 ГЛ. V. КРИТЕРИЙ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ (40 Теперь индуктивно определим некоторые функции ω# (λ:), ω^-ιΟΟ» ···» ®iW» ωοΜ· Прежде всего положим ωΝ(χ) = 0. Функция ωΝ(χ) определена во всем фазовом пространстве Еп (и, в частности, на множестве Ω^). Пусть уже построена функция щ(х) (где l^t^N), определенная на множестве Ω, (или на каком-либо множестве, заведомо содержащем Ω*). Тогда функцию (ty-] (x) определим соотношением *) ω,-,(χ)« min (ω, (Μ*, α))+ /?(*, и)), (40.6) где f°t — функции, с помощью которых записан функционал (40.5). Заметим, что для любого JiE2H точка ft(x9 и) принадлежит (при ueUt(x)) множеству Ω,, так что выражение, стоящее в (40.6) под знаком минимума, имеет смысл. Теперь предположим — и это есть единственное ограничение, накладываемое при применении метода динамического программирования,—что функция ω*-ι определена на всем множестве Q>t-u т. е. что для любого χ <= Ω,-, стоящий в правой части соотношения (40.6) минимум существует. Динамическим программированием называется метод отыскания оптимальных процессов (в дискретных системах) с помощью следующей теоремы. Теорема 40.1. Пусть (40.3), (40/4) — некоторый процесс (с начальным состоянием х{0)) в дискретном управляемом объекте (40.1), (40.2). Для оптимальности этого процесса (в смысле минимума функционала (40.5) при фиксированном начальном состоянии χ (0) и отсутствии ограничений на состояния x(l) x(N)) необходимо и достаточно, чтобы для каждого /=1, ..., N выполнялось соотношение fj(*(<-l), u(t)) + *t(ft(x(t-l)t ιι(0))- *= min (fj {x (t - 1), и) + ω, (ft(x (t - 1), и))). (40.7) Доказательство. Докажем необходимость условия (40.7). Пусть процесс (40.3), (40.4) оптимален. Выберем произвольное τ, 1 ^x^CJV, и произвольную точку ug ϋχ{χ(τ— {)). Пользуясь этими величинами, мы сейчас построим некоторый процесс *(0), *(1) *(Λ0; δ(ΐ), ..., u(N) с начальным состоянием *(0) = л;(0), удовлетворяющий соотношениям (40.1), (40.2). Прежде всего положим *(*) = *(*), u(t) = u{t) при < = 0, 1 т— 1. (40.8)) *) Это соотношение называется уравнением Беллмана\ в нашей трактовке это «уравнение» является лишь определением функций ω*.
40] § И. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 365 Далее положим 3(τ) = ο, χ(τ) = /τ(2(τ-1), β (τ)). (40.9) Наконец, при / = τ+1, .♦., N выберем точки x(t)t u(t) таким образом, чтобы выполнялись соотношения ω^(*('-1)) = ΜΜ*(*--1). u{t))) + + f°t(2(t-l)9 S(/))t ί«τ+1, ..., Ν. (40.10) Нетрудно видеть, что такой выбор точек x(t), u{t) (при ^ = τ+ Ι» ···» W) возможен. В самом деле, подставим в (40.6) значения / = τ+1. а: = х(т). Так как х(т)ейт, то соотношение (40.6) справедливо при этом значении х. Следовательно, существует такая точка и=й(т+1)е= υτ+ι(χ(τ)), для которой в (40.6) достигается минимум, т. е. имеет место соотношение (40.10) для ί = τ + 1. Пользуясь этим значением й(т+1), определим #(τ+1) из (40.1): * (τ+1)«/τ+ι (*(*). S(t + 1)). Тем самым найдены требуемые точки й(т+1), £(τ+1). Подставив в (40.6) значения / = τ + 2, χ = χ(τ+1), мы таким же образом определим β(τ + 2), а затем #(τ + 2)> и т. д. Итак, процесс x(t)9 u(t) построен. В силу (40.1) соотношение (40.10) переписывается в виде ω,., (/,_,(*(*-2), й(/-1))) = = ω((ϊ{(χ(ί-1), u(t)))+-p>(X(t-l), fl(0), / = τ+1, ..., Ν. Суммируя эти соотношения по всем / = τ+1 Л/ и производя взаимное уничтожение одинаковых членов слева и справа, находим (учитывая еще соотношения (40.8), (40.9) и соотношение ω^ΞΞδΟ): ωτ(/τ(χ(τ-1), ν)) = Ρτ+ι(χ(τ), й(т+1))+ ... ... +f%(x(N-l), U(N)). (40.11) Далее, так как x{t), u(t) — оптимальный процесс, то, по определению, /?И0), «(1))+ ... + f°N(x(N-l), u(N))< </?(*(0), fi(l))+ ... +f°N(x(N-l), β (АО). В силу (40.8) первые τ — 1 слагаемых в левой и правой частях взаимно уничтожаются, и мы получаем /?Ит-1), и{х))+ ... +PN(x(M-l), и (ЛОХ </°(*(τ-1), β(τ))+ ... Η-^ίχ(Λ'-Ι), Й(Л/)),
366 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [40 а это соотношение в свою очередь переписывается в виде (см. (40.9), (40.11)) %(х(х-1)9 и(т))+ ... +fON(x(N^-l)) u(N))< </°τ(*(τ-1), σ) + ωτ(/τ(*(τ-1), υ)). (40.12) Напомним, что это соотношение справедливо при любых τ=1, ..., N и ое£/,(*(т- 1)). Положим в (40.12) τ=ΛΛ Мы получим (поскольку ω^^Ο) fr(*(JV-l), α(Α0)<^(χ(^-1), ϋ), ^i/,(^(JV-l)), а это и означает, что при t = N соотношение (40.7) выполнено. Пусть уже доказано, что соотношение (40.7) справедливо при t = N, ..., τ + 1. В силу (40.6) это соотношение переписывается в виде /?(*(*-1), u(t)) + vt(ft(x(t-l)9 u(t)))~wt^(x(t-l))t или (см. (40.1)) /J(*(*-l), u(t)) + + ©,(/,(*(*-1), u(t))) = *t-i(ft-i(x(t-2), u(t-l))). Суммируя эти соотношения по t = N, ..., τ+l и производя взаимное уничтожение одинаковых членов слева и справа, получаем β+1(*(τ), α(τ+1))+ ... +ft(*(tf-l). u{N)) = = ωτ(/τ(Α:(τ-1), α (τ))). Поэтому соотношение (40.12) переписывается в виде /°τ(*(τ-1), α(τ)) + ωτ(/τ(*(τ-1), α(τ)))< </°(*(τ-1), ι,) + ωτ0τ(*(τ-1), *)), а это и означает, что выполнено соотношение (40.7) для f = τ. Проведенная индукция доказывает, что равенство (40.7) имеет место для всех t = N, ..., 1. Тем самым необходимость условия (40.7) доказана. Докажем достаточность. Пусть процесс χ(t), и(t) удовлетворяет условиям (40.7) и пусть x*(i)9 u*(t) — любой другой процесс (удовлетворяющий условиям (40.1), (40.2)) с тем же начальным состоянием #*(0) = х(0). Так как x*(t — 1) е Qf-u то соотношение (40.6) имеет место при x = x*(t— 1): «w^C"1))* min (ω, (/,(** ('-!)■ α)) + /?(*·('-0^))
40] §11. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 367 и потому из включения u*(t)& Ut(x*(t— 1)) (см. 40.2)) следует неравенство сом(^(/-1К^(^(/(^1), «40)) +/?(*·(<-О, «·(<))· Согласно (40.1) это неравенство переписывается в виде ^(^('-•Kwi^CH/f^C-i), um(t)). Суммируя эти соотношения по t=l9 ..., JV, получаем ω0(**(0))</?(**(0), *Г(0) + ... + ft(**(tf-l); ιΓ(ΛΟ). С другой стороны, переписав (40.7) в виде /?(*(*-1), u(t)) + <ut(x(t)) = <i>t_{(x(t-l)) (см. (40.1), (40.6)) и суммируя эти соотношения по t= 1, ..., N> получаем ω0(*(0)) = /?(*(0), ιι(1))+ ... +/o,(*(tf-l). ιι (Λ0). (40.13) Так как д;*(0) =#(0), то из найденных соотношений выводим /?(*(0), и(1))+ ... +&(*(tf-l), и(Л0)< </°(*·(0), iT(D) + ■■· + f°N(x*(M-l), ii'(AO)f а это и означает, что процесс x(t)f u(t) оптимален. Следствие 40.2. Минимальное значение, которое может принять функционал (40.5) при движении по закону (40.1), (40.2) из начального состояния χ (О), равно ω0(χ(0)). В самом .деле, это минимальное значение достигается для оптимального процесса, т. е. процесса, удовлетворяющего условию (40.7), и потому, согласно (4Θ.13), оно равно ω0(*(0)). В теореме 40.1 существенно использовалось, что функция ω*.^*) определена на всем множестве Qt-\, / = 1, ..., Ν, т. е. что в соотношениях (40.6) минимум для любого χ g Ω^-ι достигается. Следующая ниже теорема 40.3 указывает простое и часто применяемое условие, при выполнении которого эти требования выполняются (и, следовательно, описанный в теореме 40.1 метод динамического программирования применим). Для того чтобы сформулировать теорему 40.3, введем необходимые понятия: Прежде всего напомним, что множество Μ (расположенное в пространстве Ег переменных и\ ..., ит) называется компактным, если оно замкнуто и ограничено. Далее, пусть Μ а Ег — некоторое множество и ε — положительное число; г-окрестностью множества Μ называется множество, состоящее из всех точек пространства £г, находящихся от Μ на расстоянии, меньшем ε. Иными словами, точка χε£Γ
368 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [40 в том и только в том случае принадлежит ε-окрестности множества Д1, если найдется такая точка а е М, что расстояние между а и χ меньше ε. Например, ε-окрестностью окружности (в плоскости переменных и1, и2) является кольцо ширины 2ε; на рис. 157 изображена ε-окрестность треугольника (рассматриваемого как контур, т. е. без внутренних точек). Наконец, будем говорить, что множество U (х) (в пространстве Ет переменных и\ ..., ит) непрерывно зависит от точки χ <= Еп, если выполнено следующее условие: каковы бы ни были точка х0 е Еп и число ε > 0, найдется такое δ > 0, что для любых двух точек х' отстоящих от х0 менее Рис. 157. чем на δ, каждое из множеств U (xf), U {х") целиком расположено в ε-окрестности другого. Непрерывная зависимость множества U (х) от точки χ означает с наглядной точки зрения, что множество U {х) «плавно» меняется при перемещении точки х. Теорема 40.3. Предположим, что в фазовом пространстве Еп задано некоторое множество G и функции ft(x> "), f°t(x> и) определены и непрерывны (по совокупности перемен- ных х, и) при χ eG и любом и. Предположим, далее, что для любого χ е G множество Ut (x) компактно и непрерывно зависит от х. Наконец, предположим, что при любых χ <= G, u^U(x) точка ft{x, и) принадлежит множеству G. Тогда функции щ(х) определены на всем множестве G и непрерывны, а потому при любом начальном состоянии x(0)gG применима теорема 40.1. Доказательство. Функция ωΝ==0, очевидно, определена и непрерывна на всем множестве G. Пусть уже доказано, что функция <ut(x) (где l^f^JV) определена и непрерывна на множестве G. Тогда в соотношении (40.6), определяющем функцию ω*-! (λ:), выражение под знаком минимума имеет смысл (ибо ft{χ, «)gG)h представляет собой непрерывную функцию. Когда и пробегает компактное множество Ut(x) (где χ е G), эта функция, по известной теореме анализа, непременно достигает своего наименьшего значения, т. е. минимум (40.6) существует для любой точки χ е G. Таким образом, функция (ut~i(x) определена на всем множестве G. Ее непрерывность несложно доказывается (с использованием того факта, что Ut(x) непрерывно зависит от х). Этим завершается индукция, устанавливающая непрерывность всех функций ωί{χ) на множестве G.
40] §11. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 369 Остается заметить, что при любом начальном состоянии x(0)eG все множества Ω0, ..., QN содержатся в G (поскольку ft(x, u)^G при любых χ <= G, и е Ut(x)). Следовательно, функция щ(х) определена, в частности, на всем множестве Ω, (/ = 0, 1, ..., Ν), т. е. теорема 40.1 применима. Замечание 40.4. При выполнении условий теоремы 40.3 минимальное возможное значение функционала (40.5) непрерывно зависит от начального состояния #(0) (ибо в силу следствия 40.2 это минимальное значение равно ω0(Λ:(0)), а функция ω0(χ) согласно теореме 40.3 непрерывна). Этим и завершается изложение метода динамического программирования для случая основной задачи. В случае задачи с ограничениями на фазовые координаты (в частности, в случае задачи с подвижными концами) имеются малосущественные усложнения. Именно, будем рассматривать для объекта (40.1), (40.2) лишь такие процессы (40.3), (40.4), которые для всех ^ = 0, 1, ..., N удовлетворяют условию x(t)^Mt. Состояния x(t\ входящие в процессы такого вида, заполняют некоторое подмножество множества Mt. Это подмножество мы и обозначим теперь через Ω,. В соотношении (40.6) минимум берется по всем и <= Ut (x)t удовлетворяющим дополнительному условию ft{xi u)&Qt. Аналогичное видоизменение касается и формулы (40.7). Наконец, если множество Ω0 содержит более одной точки, то к системе соотношений (40.7) надо еще добавить очевидное дополнительное условие ®о (* (0)) = min ω0 (д:) (можно формально считать, что это есть соотношение (40.7) при / = 0). Таковы изменения в формулировке теоремы 40.1. Доказательство остается тем же (с очевидными изменениями). Пример 40.5. Рассмотрим управляемый объект xl(t)*=(l—xl(t—l)-x*(t—l))u (ή, jfl(f) = xi(t-l) + k*(t-l)9 где и — скалярный управляющий параметр, которому разрешено принимать значения на отрезке [0, 1]. Иначе говоря, изучается объект (40.1), (40.2) с двумерным фазовым пространством (т. е. п = 2), причем Ъ(х{,х2,и) = (1-х1-х*)и, f]{x\x\u) = xl+x\ Ut(x) = [09 1] Для любого t=l, ..., N. Для этого объекта поставим задачу 0 максимуме функционала (40.5), где
370 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [40 При этом начальное состояние х0 фиксировано, а на дальнейшие состояния никаких ограничений не накладывается; кроме того, задано число N. Для решения этой задачи (т. е. нахождения искомого оптимального процесса) можно применить теорему 40.1; заметим, что возможность применения этой теоремы гарантируется теоремой 40.3 (где G совпадает со всей плоскостью Е2 переменных х\ х2). Согласно определению, (0^ = 0. Далее, в силу (40.6) (где берется, в соответствии с постановкой задачи, максимум, а не минимум), имеем %-ι(*'' *2) = max (ω^ (fN(x\ х2, и)) + f°N(x\ χ2, α)) = — max ((и)2 — χ1) — 1 — х\ и е [0, 1J причем максимум здесь достигается при и=19 и потому согласно (40.7) для оптимального процесса справедливо соотношение u(JV)=l (при любом состоянии д:1^—1), дг2(Л^ — 1)). Далее, ω^ί*1, х2)= max ((aN^(fN_v(x\ x29 u)) + f°N_{(x\ x2, и)) = = max (1 — (1 — χ1 — λ:2) u + (w)2 — л:1). и «ξ [0, 1] Так как выражение, стоящее в правой части этого равенства под знаком максимума, представляет собой квадратный трехчлен относительно и с положительным коэффициентом при (и)2, то это выражение, рассматриваемое на отрезке [0, 1], достигает максимума в одном из концов отрезка. Следовательно, ω#_2 (χϊ> χ2) = max (1 — (1 — χ1 — χ2) и + (и)2 — д:1) = = тах(1 — х\ х2 + 1), причем при 1— х1^х2 + 1 максимум достигается в точке и = 0, а при 1 — а:1 ^л:2 + 1 — в точке и-=1. Согласно (40.7) это означает, что для оптимального процесса справедливо соотношение ί0 при l~-xl(N-2)^x2(N-2) + l9 u(N-l) = { j при ! _ д.1 (^ _ 2Х χ2 (ΛΓ — 2) + 1. (Таким образом, при 1 — хх (N — 2) = x2(N — 2) + 1 оба значения u(N— 1) = 0, α (Л^ — 1) = 1 удовлетворяют условию опти- додльрости.)
40] § 11. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 371 Аналогично вычисляется функция ω#-3: = max ((«)2-^1+тах(1-/],_2(д:1, jc2, w), ^_2(Л ^2, w)+D)= = "max (Μ2 - *! + max (1 — (1 — a:1 — x2) u9 xl + x2 + 1)) = и ев [0, 1] ^ max (max((и)2-*1 + 1 - 0 - *'- *2)", (u)2 + *2 + l)) = и e [0, 1] = max (max ((u)2 - *! + 1 - (1 - xl - x2) u, (u)2 + x2 + 1)) = tt=0, 1 = max (max ((и)2-*1 + 1 - (1 - xl - x2) u)9 max ((и)2+*2 + 1))== и=0, 1 и=0, 1 = max (max (1 — x\ x2 + 1), тах(л;2 + 1, χ2 + 2)) = = max(l—Jt1, х2 + 2). Здесь при I —х1^х2 + 2 максимум достигается в точке # = 0, а при 1 — Xх <Ξ л;2 + 2 — в точке и = 1. Согласно (40.7) это означает, что для оптимального процесса справедливо соотношение Г 0 при I — χ1 {Ν — 3)^χ*[Ν — 3) + 2, и(ЛГ-2) = | j при j_^(iV_3)<*2(Af-3) + 2. Отсюда видно, что, вычислив функции ωΝ~2> ©лг-з» мы еще не имеем возможности найти значения u(N—1), ιι(Ν·—2) оптимального управления; мы только знаем, как они зависят от χ(Ν — 2), χ (Ν — 3), которые пока не известны. Продолжая таким же образом, найдем дальнейшие функции щ(х\ х2): щ(х\ *2) = тах(1-Д x2 + W-/-l), t = N — 2% ..., 1, 0, причем для оптимального процесса справедливо соотношение ГО при \-xi{t)>x>{t) + N-t-\, "(ί+1)==(ΐ при l-x4t)<x4t) + N-t-l. (40Л5) «(!)-{ В частности, при t=0 получаем 0 при xl{0) + x2(0)<!-(N-2)> 1 при xl(0) + x2(0)^-{N-2). Если точка х$ = (л;1 (0), х2 (0)) удовлетворяет условию *'(0) + *2(0)<-(W-2), то и (1) = 0, и потому из (40.14) получаем л:1 (1) = 0, х2(1) = х1{0) + х2{0).
372 ГП. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [41 (40.16) Но тогда в (40.15) при t=\ справедливо верхнее условие (так как х1(\) + x*(l) = xl(Q) + *2(0)< - (Af-2)< - (Ν - 3)), т. е. и(2)=0. Следовательно, в силу (40.14) х1 (2)=0, хЦ2)=х2(1). Продолжая таким образом, находим оптимальный процесс: α (1) = α (2) = ... =u(W-l) = 0, u(N)=U ^(1) = ^(2)= ... =д;1(^— 1) = 0, λ;1(^)=1 _(^Ч0) + ^2(0)); x2(l) = хЦ2)= ... = x2(N- l) = x2(N) = xl{0) + x2(0). Если же точка х0 = {х1(®)> *2(0)) удовлетворяет условию л:1 (0) + л:2 (0) > — (TV — 2), то и(1)=1, и потому из (40.14) получаем χΐ (1) = 1 — л:1 (0) — х2{0), х2(1) = х{ (0) + х2(0). Но тогда дг1 (1) + я2(1)= 1, т. е. в (40.15) при t=\ справедливо нижнее условие, и потому α(2) = 1. Следовательно, в силу (40.14) х1(2) = 0, л;2(2)=1. Продолжая таким образом, находим оптимальный процесс: и(1) = и(2)= ... =u{N-l) = u(N)=U | χΐ(1)=1-χΐ(0)-*2(0), χ*(2)*= ... =χι(Ν) = 0; (40.17) **{1) = χι(0) + χ2(0)9 χ2{2) = ... = χ2(Ν)=\. 1 При χι(0) + χ2(0) = -{Ν-2) оба процесса (40.16) и (40.17) оптимальны. 41. Связь с теорией экстремумов функций. В этом пункте мы покажем, каким образом теорема 40.1 может быть выведена из теоремы 39.2. Прежде всего заметим, что теорема 39.2 сохраняет силу и в том случае, если под г1,..., ζη понимать точки m-мерного пространства. Именно, пусть ζ1 =(г(, ..., г^), ί'=1, ..., я, где 2у — с к а л я ρ н ы е переменные, так что пространство переменных г1,..., ζη является в действительности пространством размерности тп\ несмотря на это, будем пространство переменных г1, ..., ζ11 по-прежнему обозначать через Еп. Иначе говоря, символ zi (для любого /=1 η) обозначает теперь точку (m-мерного пространства), объединяющую т координат точки в /шг-мерном пространстве Еп- При таком понимании символов ζ1, ..., ζη и Еп теорема 39.2 (вместе с приведенным в п. 39 ее доказательством) остается справедливой. Этим фактом мы и воспользуемся для доказательства теоремы 40.1. Введем вспомогательные переменные х\у и\, где / = 1, ..., п\ j = 1, ..., г, ί= 1, ..., Ν, и обозначим через zf точку, объединяющую те из указанных переменных, которые имеют нижний индекс t ** = (*}, ..., *?, и\ «Q.
41] §11. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 373 Пространство переменных Zj,..., ζ^ (τ. е. пространство всех переменных х*> ut) обозначим через EN. Будем также писать **-»(*} *t)> ut = {u\ "О· zr('i· ttt)> *=■!.···. Ν. Пусть теперь Ω — множество всех точек Z = (Zl ΖΝ) *" (XV "ΐ* *2' «2 *ΛΓ «*) пространства £^, удовлетворяющих соотношениям: *t-U(*t-vuil· t==l M; (41Л) utt=Ut{xt_x), t=\, ..., AT, v (41.2) где #0 = χ (0), /7 (*, «), Ut (x) — элементы, входящие в определение дискретного управляемого объекта (40.1), (40.2). Йа множестве &czEN определим функцию F (ζ), положив: N F{z)~F(zv...,zJN)~F(xvuvxvu2....9 xN,tiN)=21f°t(xt_l,ut), (41.3) ί=1 где ft(x, и), t = 1, ..., Ν, — функции, входящие в определение функционала (40.5). Пусть теперь (40.3), (40.4) — какой-либо допустимый процесс в рассматриваемом дискретном управляемом объекте, т. е. для него выполняются соотношения (40.1), (40.2). Определим точку ζ = (χχ, υ,χ> *2, «2, ..., x^t uN) пространства Ε , положив xt = x(t), ut = u(t), /=1 N. (41.4) Из (40.1), (40.2) вытекает, что точка ζ удовлетворяет соотношениям (41.1), (41.2), τ е. ζ е Ω. Обратно, любая точка ζ^Ω определяет по формулам (41.4) допустимый процесс в рассматриваемом дискретном управляемом объекте. Таким образом, допустимые процессы находятся во взаимно однозначном соответствии с точками множества Ω. При этом значение функционала / для допустимого процесса (40.3), (40.4) равно, в силу (40.5) и (41.3), значению функции F в соответствующей точке гей, Следовательно, соотношения (41.4) сводят рассматриваемую задачу оптимального управления к задаче о минимуме функции F (ζ), заданной на множестве Ω. К этой последней задаче можно применить теорему 39.2. Итак, мы имеем функцию F (zv ..., ζΝ) (см. (41.3)), заданную на множестве QczEN. Построим множества Ω..,, ..., ΩΓ о которых говорилось в связи с теоремой 39.2 (стр. 358). Обозначим через ΕΝ~ι пространство переменных ζχ, ..., ζ„_χ, тогда Ω.,, есть множество всех тех точек (2р · · ·» ζΝ-\)^ ΕΝ~ι, для каждой из которых можно подобрать такую точку zNt что (zr ..., ^j.z^jeQ, Из определения множества* Ω ясно» что точка (ζχ, ..., ζΝ_{) в том и только в том случае принадлежит множеству Ω^__Γ если выполняются соотношения (41.1) и (41.2) для t = 1, ..., N — 1 (ибо тогда можно выбрать произвольную точку uN e UN(xN~i)> a xN определится из (41.1) для t = N, и мы получим тем самым такую точку zN, что (z\> · · ·> ΖΝ-Χ> ΖΝ) ^ Ω). Аналогично, точка (ζχ, ..., zfe) в том и только в том случае принадлежит множеству Й£, если выполняются соотношения (41.1) и (41.2) для *-1 k.
374 ГЛ V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ Построим, далее, функции ω^_}, ..., ωρ заданные на множествах Ω»,, ..., Ω., в соответствии с формулами (39.2), (39.3), но только эти функции мы будем теперь обозначать через ω^_ρ ..., (ΰ{ (оставив обозначения ©..j, ..., cuj для тех функций, которые мы в дальнейшем построим и которые будут удовлетворять условиям теоремы 40.1). Согласно (39.2) ®n-i(zi %-i)==min/7(2ri zn-\> *лг)в ZN Ν ΛΓ—1 = min 2 f? (**-!· «<) = Σ f°t(xt-i> ut) + min^ (*λγ-ι· %)· Здесь точка [zv ..., ζΝ_χ) s ^дг-l пРеДполагается фиксированной, а минимум берется по всем z^, для которых (Zj, ..., ζΝ_ν г^ей, Но если (z} ^^jsQ^j, т. е. выполняются соотношения (41.1), (41.2) для t = 1, ..., JV — 1, то для того чтобы точка (ζ., ..., z^_lf z^) принадлежала множеству Ω, необходимо и достаточно, чтобы точка zN = (*^, un) удовлетворяла соотношениям (41.1), (41.2) при t — N, т. е. чтобы было иN^UN (xN_j)» а точка *„ определялась из (41.1) при t = N. Заметив теперь, что точка xN в выражение f5v(*iv-i> un) не вх°Дит» мы заключаем, что минимум берется по всем и„ ^ UN (Χχ-i)· Итак, N-1 *>*-ΐ(*1· .... «AT-О"" Σ f? (**-!» "<)+ ,1™ 4 fSr(*AT-l. %)' *-ι un&un(xn-i) Вспомнив теперь, что ω^ (*) = 0 (см. стр. 364), получаем un&un(xn-\) u^un(xn^i) Правая часть согласно (40.6) равна ®Ν„Χ (χΝ_χ). Таким образом, ЛГ-1 ω^^ζρ ..., z^i)= 2 f?(**-i*M+%-i(*tf-i)> ί—ι где ω^_j — функция, введенная перед формулировкой теоремы 40.1. Итак, функция ω^! вычислена. Пусть уже установлена для некоторого k = 2, ..., N — 1 формула k *k {z\ zk) β Σ ft (**-ι· «ί) + «fe (**> (41.5) Покажем, что эта же формула остается справедливой и при замене k на k—\. Мы имеем (опуская детали, которые аналогичны имеющимся в предыдущем рассуждении) в силу соотношений (39.3), (41.5), (41.1) и (40.6): •Л—I (^1 ^-l)==min(0I(2:i» '··> *k-fzk)s zk =^P:^[kft{xt-i-ut)+M4)l·
4I] § 11. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 375 - *Σ f?(*,-.. "t) + ™™, (fk (4-v 4) + »* Ы) = k-l - Σ fi(xt-i> ut) + /Ymln , Ы (xk-v 4) + ω* (fk (*;_P uk))] « t^\ \xk> uk) = 2 ft (**-!· «,) + ee min К (*,_„ a) + ω, ft (,Λ_ρ «))] - i=l U^Uk(Xk-\) β Σ #(**-!' "f) + ®A-l(*A-ll· Таким образом, проведенная индукция показывает, что формула (41.5) справедлива для всех &=1, ..., JV—1. В частности, ωί (*ι) = fι (*ο· "ι) + ωι (*ι)β /ι (** «ι) + ωι (fι (*ο· «ι)). и потому согласно (39.5) m = minroj(^I)= min [/J(*0> a,) + ωι (fx (xQ9 u{))\ (41.6) Применяя теперь теорему 39.2 и заменяя в соотношениях (39.6) функции F, (dk и число т их выражениями (41.3), (41.5), (41.6), получаем следующее утверждение. Точка z = (zv ..., z^jeQ в том и только в том случае является точкой минимума функции F(гу ..., г^), если выполнены соотношения: Ν ΛΓ—1 Σ #(*<-!' ^)= Σ #(**Μ."ί) + ®ΛΓ-!(*ΛΓ-ΐ)β fe=l *=1 Но эти соотношения (если учесть, что ω.. =в0) эквивалентны следующим: f°N (%-Р «АГ) + ωΛΤ (%) = ωΝ-1 (%-l)> ta-1 (%-2» %-l) + ωΛΤ-1 (%-l) = ωΛΤ-2 (%-2)' /ϋ(*1· "2) + ω2(Λ:2)==ωΐ(^ΐ)' tf (*ο· "ι) + ωι (*ι) = min ч [/?(*ο. "ι) + ωι (fi (*ο> "ι))]· Если теперь правые части всех этих соотношений (кроме последнего) записать с помощью соотношений (40.6), то получим f°t (*ί-ι. «*) + ω, (xt) = min [ω, (ft (*,_,, и)) + /J (*,_,, «)J,
376 гл· ν· КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [42 а это, в силу (41.1), (41.4), совпадает с соотношениями (40.7). Этим и завершается доказательство теоремы 40.1. (Заметим еще, что из (41.6) вытекает в силу первого утверждения теоремы 39.2 справедливость следствия 40.2.) Приведенное доказательство хорошо иллюстрирует тесную связь между задачей о минимуме функции и задачей оптимального управления дискретными объектами. Формально теорема 40.1, как мы убедились, выводится из теоремы 39.2 и, в этом смысле, ничего нового не содержит, кроме формы записи. Но сам вывод теоремы 40.1 из теоремы 39.2 является достаточно громоздким, он не проще прямого Доказательства теоремы 40.1. К тому же теорему 39.2 пришлось (для получения из нее теоремы 40.1) специализировать, считая ζ\ ..., ζη точками, т. е. считая, что аргументы функции F объединены в группы: ζχ =(*(, «(), ..., ζΜ=={χίΝ* un)- Ясно поэтому, что для решения задач оптимального управления дискретными объектами нецелесообразно каждый раз проводить редукцию к задаче о минимуме функции (т. е. повторять рассуждения, проведенные в общем виде на стр. 372—376), а удобно иметь отдельную теорему, приспособленную к случаю дискретного управляемого объекта, т. е. теорему 40.1. То же относится к дальнейшим теоремам. § 12. Необходимые условия оптимальности Излагаемые в этом параграфе методы решения дискретных задач оптимального управления являются непосредственным приложением методов п. 36; впрочем, получаемые результаты могли бы быть доказаны самостоятельно, а не выведены как следствие теорем п. 36. Приводимые здесь теоремы не обладают такой широтой, как метод динамического программирования, так как они накладывают на дискретный управляемый объект определенные ограничения, т. е. несколько сужают класс рассматриваемых объектов (в частности, функции f\(x, и), см. стр. 363, здесь предполагаются гладкими). Однако этот класс дискретных объектов все еще остается весьма широким, а получаемые результаты оказываются более глубокими (т. е. содержащими больше информации, чем теорема 40.1). Достаточные условия оптимальности будут приведены в § 13. 42. Основная задача. Рассмотрим сначала основную задачу (стр. 21). Иными словами, будем рассматривать дискретный управляемый объект (40.1), в котором управления u(t) подчинены ограничениям (ср. (40.2)) u(t)e=Utt /=1, ..., Ν, (42.1) где Uu ..., UN — некоторые множества. Начальное состояние х(0) = х0 задано, а на состояния x(t) при t*=*l, ..., N не накладывается никаких ограничений. Требуется для объекта (40.1) выбрать управление (40.3), удовлетворяющее условиям (42.1) и придающее функционалу (40.5) наименьшее возможное значение (где (40.4) —траектория, исходящая из состояния х0 и соответствующая выбранному управлению). При этом все функ-
42] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 377 ции flt(x, и) (/=0, 1, ..., п\ /=1, ..., Ν) предполагаются непрерывно дифференцируемыми по х, и (т. е. по л;1, ..., хп, и\ ..., иг). В формулировках всех дальнейших условий оптимальности участвуют вспомогательные переменные ψ0 и ifo(/) (ср. формулировку дискретного принципа максимума на стр. 69), а иногда и другие вспомогательные переменные. С помощью этих переменных определяется вспомогательная функция Ht(x, и), которая также будет участвовать в формулировках условий оптимальности. Так, в первой из рассматриваемых ниже теорем функция Ht(x, и) имеет следующий вид: Ht (χ, и) - *of? (*, и) + Σ Ь (0 ή (*, и). (42.2) Заметим, что в левой части (42.2) явно отмечена зависимость функции Ht только от х, и (хотя в определении этой функции участвуют и переменные ψ;). Объясняется это тем, что именно по х9 и придется эту функцию дифференцировать (при фиксированных ψ0 и ψ*(ί)). В частности, определены векторы grad,tf,(*. и) = {*Ц£*- Щ^}, gradaHt(x. <*)-{&&£...., -^И}· Теорема 42.1. Пусть (40.3) — некоторое управление, а -(40.4) — соответствующая траектория (с начальным состоянием х(0)) в дискретном управляемом объекте (40.1), (42.1)» Пусть, далее, Lt—шатер множества Ut в точке u(t), t= 1, ..., Ν. Для оптимальности этого процесса (в смысле минимума функционала (40.5) при фиксированном начальном состоянии х{0) и отсутствии ограничений на состояния x(t), t=lt ..., Ν) не- обходимо существование такого числа ψ0 и таких векторов Ф(0 = М>.(0 Ψ„(0>, *-1, .... Ν, что выполнены следующие условия (в которых участвует функция Ht(x, и), определенная равенством (42.2)): (Α) ψ0<0; (B) ψ(Λ0=0; tH0=grad*#,+I (*(/), u(t+l))9 ί-1, ..., tf-1; (C) для любого t=l, ..., N и любого вектора 6и, направление которого принадлежит конусу Lu справедливо неравенство Ьи graau Ηt(x{t-l), α (ОКО. Доказательство. Обозначим через Е* пространство переменных х\ч и[\{— 1, ..., п\ \— 1, ..., г; /=!,...,# (таким
378 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [42 образом, размерность этого пространства равна Nn + Nr). В функции Ц, *' = 0, 1, ..., п\ /=1, ..., N, характеризующие рассматриваемый дискретный управляемый объект, подставим в качестве аргументов переменные x\_v и\: ii\xt-v ut) = 'i\xt-v ··*» χΐ1-ν ut> ·■■» ut) (где при ^=1 под xl0, ..., х% понимаются координаты начального состояния д;(0) = л;0е Еп). Теперь эти функции можно считать заданными (и непрерывно дифференцируемыми) на всем пространстве Е*. С помощью этих функций определим на пространстве Е* новую систему функций: Я(*) = Я(*, iiW°(*oi ηλ)+ΪΙ(χν u2)+...+f°N(xN^ uN), (42.3) F*(z) = F*(x, u) = -x\ +fl(x^v ut); / = 1 /ι; f=l, ..., N. (42.4) Обозначим, далее, через Ω* множество всех точек ζ е £*, удовлетворяющих системе уравнений fj(«) = 0; *=1, ...-, n; f=l, ..., N. (42.5) Множество Ω* непосредственно связано с рассматриваемым дискретным управляемым объектом. Именно, пусть (40.3), (40.4)— некоторый процесс (с начальным состоянием л;(0) = л;о) в управляемом объекте (40.1). Положим χ\=χι{ί\ α{ = α/(τ); /=1, ..., п\ /=1, ..., г, ί, τ=1, ..., Ν. (42.6) Из (40.1) следует тогда, что точка ζ с координатами х\, и^ определенными по формулам (42.6), удовлетворяет соотношениям (42.5) (см. (42.4)), т. е. принадлежит множеству Ω*. При этом значение функционала (40.5) для рассматриваемого процесса равно значению функции F°(z) в указанной точке ζ (см. (42.3)). Обратно, если точка z=(xlt, u{) принадлежит множеству Ω*, то, определяя x(t), u{t) по формулам (42.6), получим процесс (40.3), (40.4) с начальным состоянием х0, удовлетворяющий соотношениям (40.1). Обозначим, наконец, через 3* множество всех точек г = = (*{, ufy пространства £*, удовлетворяющих для всех τ = = 1, ..., N соотношениям (на переменные х\ никаких ограничений не накладывается). Тогда ясно, что в результате замены (42.6) система включений (42.1) заменится одним включением: геЗ*. Итак, вместо рас-
42] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 379 смотрения различных процессов в управляемом объекте (40.1), (42.1) и значений функционала (40.5) можно рассматривать различные точки множества Ω* (] 2* и значения функции F°(z) в этих точках. Иными словами, поставленная задача оптимального управления заменой (42.6) сводится к задаче об отыскании точки z9 в которой функция F° (ζ), рассматриваемая на Ω* Π ^*» достигает наименьшего значения. Пусть (40.3), (40.4) — искомый оптимальный процесс. Соответствующую точку пространства £*, координаты которой определяются формулами (42.6), обозначим через г0. Тогда ζ0^Ω* f| 2* и в этой точке функция F°(z), рассматриваемая лишь на множестве Ω*Π2*, Достигает своего наименьшего значения. Обозначим, далее, через L* подмножество пространства £*, состоящее из всех точек z={x\, u{), удовлетворяющих для всех τ=1, ..., N соотношениям "т=К О^г Легко видеть, что Ь*есть выпуклый конус пространства Е* с вершиной в точке ζ0 и этот конус является шатром множества 2* в точке ζ0\ далее, направление вектора Ьг={Ьх\, 6их} в том и только в том случае принадлежит конусу L*, если для каждого τ = 1, ..., N направление вектора δ«τ = [6u[f ..., 6urx} принадлежит конусу Lx. Из этих утверждений в доказательстве нуждается только то, что V есть шатер множества 2* в точке z0. Так как Lx есть шатер множества Ux в точке их = и{%) (см. (42.6)), то существует такое отображение ψτ; определенное вблизи вершины конуса Lx и принимающее значения в пространстве переменных и\9 ..., итх> что выполнены условия 1), 2) определения 34.1. Положив Ψ (г) = ♦(**■ их) = (хи ψτ(ατ)), ί = 1, ..., Ν\ τ = 1, ..., W, мы получим отображение ψ, определенное вблизи вершины конуса V и принимающее значения в пространстве £\ Непосредственно проверяется, что это отображение ψ удовлетворяет условиям 1), 2) определения 34.1, и потому V есть шатер множества 2* в точке ζ0. Согласно теореме 36.9 *), существуют такие числа Ψ0<°> Ψ/> * = !..··. η; * = i, ..., Ν9 что хотя бы одно из этих чисел отлично от нуля и выполняется условие (β), указанное в теореме 36.9. Введем обо- *) Заметим, что здесь имеется только один конус Ζ,*, и потому Условие неотделимости конусов Nu ..., Nm в теореме 36.9 становится ненужным; ср. теорему 36,11.
380 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [42 значения ψ,(0 = ψ{, ί = 1, .,·, η; t = l9 ..., Ν, и покажем, что из условия (β) вытекают условия (В), (С), указанные в формулировке теоремы 42.1. В самом деле, соотношение (β) принимает в данном случае такой вид: S(*ograd^(*o)+ Σ iUkrad^(z0)W + + sLgrad„tF°(20) + 2 2 ^gradatF?(2o))6«T<0 (42.7) для любого вектора {δ**,· ow{] = {δ*^ δ«τ}, направление которого принадлежит конусу L*. Соотношение (42.7), в частности, должно выполняться, если все Ьих считать равными нулю, а векторам bxt придавать произвольные значения (поскольку в определении конуса L* на переменные х\ никаких ограничений не накладывается). Поэтому множитель при δ*, в (42.7) должен обращаться в нуль: Ψο grad,, F* (z0) + Σ Σ $1 grad*, F? (z0) = 0, t = 1, ..., N. Учитывая вид функций F° и F\ (см. (42.3), (42.4)), получаем отсюда условие (В), указанное в формулировке теоремы 42.1. Положим теперь все bxt равными нулю; кроме того, выберем некоторое целое число Θ(Ι^Θ^Ν) и все Ьи^ при τ φ θ также положим равными нулю, а в качестве δαθ будем брать всевозможные векторы, направление которых принадлежит конусу Le. Полученный вектор {bxti Ьих} имеет направление, принадлежащее конусу L*, и потому для негЬ справедливо соотношение (42.7). Таким образом, I п N \ (*о grad„e Ρ (ζο) + Σ Σ Ψ2 gradtte F? (ζ0) J Ьщ < 0 (для любого вектора δαθ, направление которого принадлежит конусу LQ). Учитывая вид функций F0 и Ft (см. (42.3), (42.4)), получаем отсюда условие (С), указанное в формулировке теоремы 42.1. Остается заметить, что ψ0 φ 0 (и, следовательно, ψ0 < 0), так как при гр0=0мы получили бы из уже доказанного условия (В), что ψί(/) = ψί = 0 при всех /, t, а это противоречит выбору чисел ψ0, ψ/.
421 § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 381 Замечание 42.2. Если рассматривается задача о максимуме (а не о минимуме) функционала (40.5), то теорема сохраняется в том же виде, с той лишь разницей, что в соотношении ψ0 < 0 знак неравенства заменяется на противоположный. Это замечание относится и ко всем последующим теоремам. Отметим, что в теореме 42.1 можно условие (А) заменить равенством ψ0 = — 1 (а в случае задачи о максимуме — равенством ψ0 = 1), так как величины ψ0, ih(f) входят в формулу (42.2) однородно, т. е. умножение их всех на один и тот же множитель k > 0 ничего не меняет в теореме 42.1. Однако в дальнейших теоремах будет участвовать неравенство ψ0^Ξ0, где случай Ψο = 0 не исключается. Замечание 42.3. Условию (С) теоремы 42.1 можно (при сохранении вида условий (А) и (В)) придать следующую форму: (С) для каждого f = l, ..., N направление вектора gT*duHt(x(t-l)9 и(t)) принадлежит двойственному конусу D(Lt). Эквивалентность условий (С) и (С') непосредственно вытекает из определения двойственного конуса. Заметим еще, что в такой форме (т. е. с заменой условия (С) условием (С7)) теорема 42.1 может быть (тем же путем) выведена из теоремы 36.2, в которой следует положить q = 0, l = N9 а за Qb ..., QN принять множества, соответственно определяемые в Е* соотношениями ut^Ub /=1, ...,.Ν. Замечание 42.4. Согласно теореме 34.2 условие, наложенное в формулировке теоремы 42.1 на конусы Lt (т. е. требование о том, что Lt есть шатер множества Ut в точке u(t), f=l, ..., Λ0, будет, выполнено, если каждое из множеств Ut выпукло, а за Lt принимается опорный конус выпуклого множества Ut в точке u(t), f=l, ..., N. Аналогичное замечание относится и к дальнейшим теоремам этого параграфа. Отметим еще, что если принять ΗΝ+Ϊ(χ, и)==0, то условие (В) теоремы 42.1 запишется в виде *(*)-вгаажЯж (*(f), u(t+l)\ t=l, ..., Ν. Аналогичные соглашения при формулировке условия (В) мы будем принимать и в дальнейшем. Теорема 42.1 и ее доказательство дают образец применения теорем п. 36 к получению необходимых условий оптимальности Для дискретных управляемых объектов. Мы сформулируем ниже более общие теоремы (для случая основной задачи), которые можно таким образом получить из результатов п. 36. Но для этого нам понадобится следующее вспомогательное предложение.
382 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [42 Теорема 42.5. Пусть векторное пространство R распадается в прямую сумму своих подпространств Du D2y ..., Ds. Через D*i(i = \, ..., 5) обозначим подпространство пространства R, порожденное объединением всех подпространств Du ..., Ds, кроме D/. Таким образом, R = Di@Di и DiCzD] при 1ф\ (/, j = 1, ..., s). Пусть, далее, для каждого / = 1, ..., 5 в пространстве задана система замкнутых выпуклых конусов С</>, ..., С}« (42.8) с общей вершиной в нулевом элементе ОеУ?, либо состоящая только из одного конуса (т. е. г£ = 1), либо не обладающая в Di свойством отделимости. Обозначим через L(P (где i = = 1, ..., 5; /= 1, ..., Ti) выпуклую оболочку множества С{р[)0]. Тогда ч L(}\ ί = 1, ..., s; /=1 ru (42.9) есть система выпуклых конусов с общей вершиной О, не обладающая в R свойством отделимости. Доказательство. Допустим, напротив, что система конусов (42.9) обладает в R свойством отделимости, т. е. найдется среди конусов (42.9) такой, который отделим от пересечения остальных. Без ограничения общности можно считать (изменив, если нужно, нумерацию подпространств Di и конусов (42.8)), что конус L\l) отделим в R от пересечения остальных конусов (42.9). Таким образом, существует в R такая гиперплоскость- Г, проходящая через 0, что L\l) сгЯь где Pi — одно из замкнутых полупространств, определяемых гиперплоскостью Г, а пересечение пУ* всех остальных конусов (42.9) содержится в другом полупространстве Р2, определяемом гиперплоскостью Г. Предположим сначала, что г{ > 1, и допустим, что плоскость Dx не содержится целиком в гиперплоскости Г. Тогда ГПД есть гиперплоскость пространства Du a Pl(]Dl и P2(]Di представляют собой замкнутые полупространства, на которые эта гиперплоскость разбивает пространство D{. Так как C^cL^nA сгЛПЯь Л С*/0 <= ( f]LT Wi с П\1) П А с Р2 П D{ (поскольку £/°=э Dx при Ι Φ l), то гиперплоскость Г Π Οι отделяет в пространстве D{ конус С\1) от пересечения С2ПП · ·. С\С(г?, Т, е. система конусов (42.8) обладает при I = 1 свойстврм ОТ-
42] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНЪСТИ 383 делимости, что, однако, противоречит предположению. Полученное противоречие показывает, что (при гх > 1) гиперплоскость Г должна содержать плоскость D,. Если же г, = 1, то пересечение Πι0 всех конусов (42.9), кроме L{\\ содержит плоскость D{ (поскольку при 1Ф 1 имеем L{P zd D\zd Di), и потому D{ cz Πι0 с: Ρ2· Отсюда следует, что и в этом случае D{ cz Г. Итак, D{czT. Кроме того, для любого / = 2, ...,s имеем PiCZ D\cz L\l) с: Pi, и потому Dt cz Г. Следовательно, все плоскости Du ..., Ds содержатся в Г, т. е. R cz Г, что невозможно. Таким образом, система конусов (42.9) не обладает в R свойством отделимости. Теорема 42.6. Пусть (40.3)—некоторое управление, а (40.4)— соответствующая траектория (с начальным состоянием х(0)), в дискретном управляемом объекте (40.1), (42.1). Пусть, далее, для каждого t = 1, .. .к N множество Ut имеет вид 6/ί = Ω(ί1)η....ηΩί'')ΠΩ/ίΠΩ;,η41)Π...η3^), где множество Q't определяется в пространстве переменных и\ ..., ит системой уравнений G{(u\ ..., 0 = 0, /== 1, ..., ku (42.10) множество Ω" определяется системой неравенств g\{u\ ..., иг)<0, ί=ι, ..., qtt (42.11) α Ω{ρ, ..., Ω(ζ'), Ξ^\ ..., Ξ(^)—некоторые множества пространства переменных и1, ..., иг. Пусть, наконец, κψ' — шатер множества Ω[ι) в точке u(t)\ ίψ — шатер множества Ξ{Ρ в точке u(t). Будем предполагать, что в окрестности точки u(t) все функции G{, /=1, ..., kt\ gt, /е/Д«(/)), являются гладкими и что для каждого t=\, ..., N система выпуклых конусов Lt (A=l, ..., mt) не обладает в пространстве переменных и1, ..., иГ свойством отделимости. Для оптимальности процесса (40.3), (40.4) (в смысле минимума функционала (40.5) при фиксированном начальном состоянии х(6) и отсутствии ограничений на состояния x(t), *=1, ..., Ν) необходимо существование такого числа ψ0^0 и таких векторов *(<)■= (*ι(0. ···> *и(0Ь <-ι, ···, М; φ(*)-{<Ρι(0. ···> <Pkt(t)}, ί-Ι/..., ΛΤ; λίΟ-μ,'ί/), ..., λ«,(ί)}, ί-1, ..., ЛГ;
384 гл· ν· КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [42 что направление вектора αψ принадлежит двойственному конусу D (К(Р) и выполнены следующие условия (А) — (Е), в формулировке которых участвует функция Ht(x, и), определенная равенством Ht (*, и) = W? (*, «О + Σ *ι (0 ft (*, и) + Σ Φι (0 0{ (а) + + Σ λ, (0 *,'(«): (A) если ψ0 = 0, то хотя бы для одного t хотя бы один из векторов ψ(ί), φ(ί), λ(ί), αψ отличен от нуля'^ (B) ♦(0 = gradjetfi+I (*(f), а(/+1)), *=1, ..., Ν9 где при- нято #дг+1=0; (C) для любого t = l, ..., N и любого вектора Ъи, 'направление которого принадлежит пересечению конусов Ц/)(/=1, ..., mt\ справедливо неравенство (grad„ Ht (x (t - 1), и (<)) - 21 α</>) δ« < 0; (D) λ/(/)<0 для всех / = 1, ..., qt\ t'=l, ·.., Ν] (Ε) h}(t)gl(u(t))=0 для всех / = 1, ..., ^; ί=1, ..., N. Доказательство. Как и при доказательстве теоремы 42.1, рассмотрим пространство Е* переменных х\, и[ и функции (42.3), (42.4), заданные на этом пространстве. Множества Ω* и S* определим так же, как и при*доказательстве теоремы 42.1. Таким образом, если (40.3), (40.4) — искомый оптимальный процесс, аг0- соответствующая точка пространства Е* (координаты которой определяются формулами (42.6)), то функция F°(z\ рассматриваемая на множестве Q*f)3*, достигает в точке z0 своего наименьшего значения. Множество Ω*Γ)2* можно записать в виде Ω*η2* = Ω°ηΩ00η(η^>)η(Γ|Ξ(/>)( где Ω0 определяется системой уравнений (42.5) и уравнений (см. (42.10)) Gl(ut) = 0, /=1, ...,*,; * = 1 Ν; (42.12) далее, Ω00 определяется системой неравенств (см. (42.11)) g\(ut)<0, ί==1 q(; t = l, ..., Ν; наконец, множества Ω(/' и 3(/> (г = 1 lf; /'==!,..., tnt;
42]- § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 385 = 1, ..., Ν) определяются соответственно включениями Uf ΕΞ lit , Ut ΕΞ Ctf . Обозначим через Л^г), L(/} множества, определяемые в £* соответственно включениями Тогда Ktl) есть шатер множества Ω*0 в точке 20 (ι = 1, ..., lt\ /=1, ...,. ЛО, a L^ есть шатер множества S{/; в точке Легко видеть при этом, что система выпуклых конусов Ιψ% /=1, ..., mt\ ί=1, .... AT, (42.13) не обладает в Е* свойством отделимости. Действительно, будем считать z0 нулевой точкой пространства Е* (превратив его таким образом в векторное пространство) и обозначим через Z)0, Du ..., DN подпространства пространства Е\ определяемые условиями: D0: ut = u(t) для всех ^=1 N; D%: xt = x(t) для всех /=1, ...,Ν и ut = u(t) для всех ίφτ. Тогда Е* распадается в прямую сумму подпространств Ζ)0, Du ..., DN. Далее, через Do, D*9 ..., Dm обозначим такие подпространства, что , D.©D: = £*,/==0, 1, ..., Ν, и Dtc:D] при ιφ\% /, j = 0, 1, ..., Ν. Соотношение щ е iJp определяет в подпространстве Dt некоторый выпуклый конус Ltf) с вершиной z0 (/= 1, ..., m*), причем L(/} есть выпуклая оболочка множества L{P\]Dt (j=U ···, /и,; t = 1, ..., Λ0· Положив теперь Lo = zQ и L0 = Do, найдем в силу теоремы 42.5, что система выпуклых конусов L0, L{t\ /= 1, ..., Щ\ t= 1, ..., Ν, не обладает в Е* свойством отделимости. Тем более не обладает свойством отделимости система конусов (42.13). Теперь ясно, что можно применить теорему 36.8 (в которой г == ρ = 0, а вместо Ω' и Ω" здесь будут множества Ω0 и Ω00). Обозначим через It(z0) множество всех тех чисел i= 1, ..., qu для которых gj(«f) = 0. Тогда в силу теоремы 36.8 существуют такие числа Ψο> ψί, Φ/. i=l, ···> λ; /=1» ···> К t=U ..., iV
386 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [42 (где числа т!р\ соответствуют равенствам (42.5), а числа φ/ — равенствам (42.12)), такие векторы a\i](i= 1, ..., lt\ /= 1, ..., Ν), направления которых принадлежат соответственно двойственным конусам D (/С(/}), и такие неположительные числа λ/ (/ ^ If (z0), t= 1, ..., Ν), что выполнены условия (α), (β), (γ) теоремы 36.8. Положим еще λ/ = 0 при jt£It(z0)9 так что неположительные числа λ/ будут определены для всех /= 1, ..., qt\ f = 1, ..., W, причем для всех этих значений /, t выполнены соотношения λ/£ί(^) = 0. (42.14) Заметим теперь, что условие (β) теоремы 36.8 в рассматриваемом случае выглядит следующим образом: i>UogradXrF»(z0)+% Σ ^grad^(z0)W + ί=1 \ τ α=1 γ=1 τ J . + Σ (ψοgradWt Я (ζ0) + £ 2 Ψα grad^ F* (г0)) bux + τ=1 \ τ α=1 γ=1 ■ T / + S(ir<Pagrad„ G?(z0) + Σ llgradUtgax(z0))bux- -2 2^1)6г<0 (42.15) для любого вектора bz = {bxti Ьих}, направление которого принадлежит пересечению конусов L^(/= 1, ..., mt\ t=\, ..., Ν). Соотношение (42.15), в частности, должно выполняться, если все Ьих считать равными нулю, а векторам bxt придавать произвольные значения (поскольку L)P zd D*t => А>). Отсюда, так же как и при доказательстве теоремы 42.1, мы получим условие (В) теоремы 42.6. (Условие (А) непосредственно вытекает из условия (ν) теоремы 36.8.) Заметим, что в силу соотношений R{ti}=>D0, K{P=>DX при ίφτ (т. е. Ш) => D*t) вектор αψ может рассматриваться как вектор, направление которого принадлежит конусу й(к\1)), причем' а\1) Ьг = а[1) but) в рассматриваемом случае а(/)6г = 0, поскольку 6^ = 0. Положим теперь все bxf равными нулю; кроме того, выберем некоторое целое число θ(1 ^.Θ^Ν) и все Ьих при τφθ также положим равными нулю, а в качестве δαθ будем брать всевозможные векторы, направление которых принадлежит пересечению конусов Δ(θι), ..., Цт®\ Полученный вектор 6г== =={bxt) Ьих} имеет направление, принадлежащее пересечению всех конусов L{t1){j=\\ ..., m,;./=1, ..., iV), и потому для
42J § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 387 него справедливо соотношение (42.15). Таким образом, (ψο gra(4 F° (z°) + Д 2 ψ" ёгасЧ f" (г°7 δ"θ + + ( Σ Φα grad„_ Οθα (2ο) + Σ λα gradw„ g% (ζ0)) Ьщ - \α=1 υ α=1 * σ / — Σ α^Η^0 для любого вектора δαθ, направление которого принадлежит пересечению конусов Lq\ ..., Цт®\ Учитывая вид функций F0 и Ft (см. (42.3), (42.4)), получаем отсюда условие (С), указанное в формулировке теоремы 42.6. Наконец, условие (D) выполняется, поскольку все числа λ/ были выбраны неотрицательными, а условие (Е) вытекает из (42.14). Замечание 42.7. Обозначим через Г/° касательную гиперплоскость (в пространстве переменных и\ ..., иг), проведенную к гиперповерхности G\(u\ ..., иг) = 0 в точке u(t), а через ρψ — полупространство, определяемое неравенством (и-и (0) grad g[ {и (/)) < 0, / е /, (α (f)). £сли для каждого t=\, ..., JV система выпуклых конусов K$\i = U ..., /Λ 4°(' = 1, ···, m,), Г(/>(/=1, ...f ft,), P(/>(/e=/,(u(0)) (42.16) не обладает в пространстве переменных и1, ..., аг свойством отделимости, то условие (Α) β теореме 42.6 можно заменить неравенством i|)0 < 0. В самом деле, допустима что ψο=0· Тогда из условия (В) теоремы 42.6 следует, что ψ(^):=0, ί= 1, ..., N. Следовательно, в силу условия (А) той же теоремы, хотя бы для одного / хотя бы один из векторов φ(^), λ(^), αψ отличен от нуля. Выберем такое t. Условие (С) теоремы 42.6 означает, что направление вектора grad, Ht (*(f-l), u{f))-^af *=α принадлежит конусу D(L^(] ... (]Цт*У)9 и потому (в силу следствия 31.4 и леммы 32.1) этот вектор равен Ь{^ + ... + Ь\т*\ где направление вектора btj) принадлежит конусу θ{ί,ψ). Таким
388 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [42 образом, учитывая, что i|)0 = 0, ·ψ(^) = 0, получаем - Σ φ, (t) grad G\ (u (0) - Σ λ, (t) grad g\ {a (t)) + Так как в силу выбора числа t в левой части этого равенства имеются отличные от нуля векторы, то согласно теореме 32.2 система конусов (42.16) обладает свойством отделимости. Полученное противоречие и показывает, что ψ0¥=0. Заметим еще, что если хотя бы для одного t система конусов (42.16) обладает свойством отделимости, то утверждение* теоремы 42.6 становится бессодержательным (ср. замечание 36.6).. В формулировке теоремы 42.6 lh mt, kt, qt могут быть любыми неотрицательными целыми числами. Считая некоторые из них равными нулю, можно получить из нее ряд частных случаев. Например, теорема 42.1 получается из теоремы 42.6 при lt = kt = qt = 0, mf = l (для всех t = 1, ..., Ν). Кроме того, в формулировке теоремы 42.6 можно считать, что для каждого /=1, ..., N среди множеств Ξ\ί] некоторые являются гиперповерхностями (в пространстве переменных и\ ..., иг), некоторые определяются неравенствами типа /|;)(«)^0, а некоторые являются произвольными множествами, имеющими шатер Ltn. Это позволит еще более разнообразить различные следствия теоремы 42.6. Из всех получающихся таким образом следствий мы сформулируем две теоремы, первая из которых получается при lt = mt = 0 (для всех t), а вторая получается при lt = kt=qt=0 и при дополнительном соглашении, что часть множеств 3^ является гиперповерхностями, а остальные определяются неравенствами типа ήΙ^ί/χΟ, Теорема .42.8. Пусть (40.3) — некоторое управление, а (40.4) — соответствующая траектория (с начальным состоянием х(0)) в дискретном управляемом объекте (40.1), (42.1). Пусть, далее, для каждого t = \, ..., N множество Ut имеет вид ί/, = Ω* Π Ω", где множество Ω* определяется в пространстве переменных и1, ..., ит системой уравнений (42.10), а множество Ω" определяется системой неравенств (42.11). Будем предполагать, что в окрестности точки u(t) все функции G|, / = 1, ..., kt\ gty i^It(u(t)), являются гладкими. Для оптимальности процесса (40.3), (40.4) (в смысле минимума функционала (40.5) при фиксированном начальном состоянии х(0) и отсутствии ограничений на состояния χ (ή,
42] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 389 /sssl, , .·, Λ0 необходимо существование такого числа ψ0^0 и таких векторов ♦ (О = {*,('). ···> **(*». ^ = 1, ..., iV; φ(0 = {ψι(α .... ф*,(0}, '«ι,..-, #; λ(0 = {λι(0, .... V*)}, * = ι, .... tf. ^го выполнены следующие условия (А) — (Ε), β формулировке которых участвует функция Ht(x, и), определенная равенством η Ht(x, и)*= W?(*. «) + 2 ЫО/Н*. «) + + Σφ/(0θί(«)+Σλ,(/)ί;(α): (A) если Ψο —0» то хотя бы для одного t хотя бы один из векторов ψ(/), <p(f), λ(ί) отличен от нуля; (B) + (0 ==grad,tfi+I (*'(f), u(t+l))9 ί = 1, .... N9 где принято #/V+|==0; (C) gradetf,(*('-D. «(0) = 0, /=1, ..., ЛЛ, (D) λ/(0<0 для всех /—1, ..., ^; <=1, ..., JV; (Ε) λ/(0^/(«(0) = 0 для β^ /=1, ..., ?,; t=\, ..., ΛΛ Теорема 42.9. Пусть (40.3) — некоторое управление, а (40.4) — соответствующая траектория (с начальным состоянием х(0)) в дискретном управляемом объекте (40.1), (42.1). Пусть, далее, для каждого t=l9 ..., N множество Ut имеет вид Ut = Щ Π Ξ", где множество Ξ£ определяется в пространстве переменных и1, ..., ит системой уравнений ф{(и\ ..., иг) = 0, / = 1, ..., s,, а множество Ξ'{ определяется системой неравенств h\{u\ ..., иг)<0, ί = 1, ..., pt. Через It(u(t)) обозначим множество тех чисел / = 1, ..., ри для которых ht(u(t))—0. Будем предполагать, что все векторы gTSLaOl{u(i))9 /=1, ..., st\ gra4A[(w(0), te=It(u(t))9 f=l, .... tf, отличны от нуля. Обозначим через Li касательную гиперплоскость гиперповерхности ф|(и) = 0 в точке u(t) (/=1, ..., st; '= 1, ..., Af), α ί/ерез Pt — полупространство, определяемое неравенством (w-w(0)gradA{(a(i))<Of i <z= It(u(t)), ί-1, ..., tf,
390 ГЛ*. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [43 и предположим, что для каждого t=l9 ..., N система выпу* клых конусов Lu Pi /=1, ..., st\ i<=Elt(u(t))9 (42.16) не обладает в пространстве переменных и\ ..., ит свойством отделимости. Для оптимальности процесса (40.3), (40.4) (в смысле минимума функционала (40.5) при фиксированном начальном состоянии х(0) и отсутствии ограничений на состояния x(t)9 t=l9 ..., Ν) \ необходимо существование такого числа ψ0 и таких векторов *(*) = {*ι(0, ·;·> tM*)}, ..t = l,...9 Ν, что выполнены следующие условия (А) — (С), в формулировке которых участвует функция Ht (x9 и), определенная равенством (42.2): (Α) ψ0 < 0; (B) *{t) = gTaaxHt+x{x(t), u(t+\))9 t=l9 ..., Ν9 где принято ΗΝ+Χ ξξ=0; (C) для любого вектора Ьи9 направление которого принадлежит пересечению конусов (42.16), справедливо неравенство bugradttHt{x{t-A)9 w(0)<0, *=1, .._., N. (Неравенство ψ0 < 0 здесь доказывается так же, как и в теореме 42.1.) 43. Задача с фазовыми ограничениями. Мы рассмотрим в этом пункте задачу оптимального управления дискретным объектом с постоянной областью управления и при наличии фазовых ограничений. Иначе говоря, будем изучать управляе- * мый объект (40.1), (42.1), на фазовые состояния которого наложены ограничения- x(t)e=Mi9 t = 09 1, ..., Ν. Для этого объекта поставим, задачу о нахождении процесса (40.3), (40.4), удовлетворяющего наложенным ограничениям и доставляющего минимум функционалу (40.5). Прежде всего рассмотрим случай, когда каждое из множеств Ми / = 0, 1, ..., Ν9 представляется в виде Mt = Utf]lu где Ш — множество, определяемое в Еп системой соотношений W\{x) = W\{x\ ..., **) = 0, ί=1, ..., rt9 (43.1) a Σ/- некоторое множество пространства Еп (причем далее будем предполагать, что нам известен шатер этого множества^ в точке χ (t)). Точно так же будем предполагать, что каждое из множеств Ux, τ = 1, ..., Ν9 представляется в виде Uχ = Ωτ Π St,
43] § 12 НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 391 где Ωτ — множество, определяемое в пространстве переменных и} ..., ит системой соотношений G{(u\ ..., и') = 0, /=1, ...,^χ, (43.2) а St — некоторое множество в том же пространстве (причем будем предполагать, что нам известен шатер множества Ξτ в точке и (τ)). Функции W\ и G[ предполагаются гладкими. При этих условиях справедлива следующая теорема. Теорема 43.1. Пусть (40.3) — некоторое управление, а (40.4) — соответствующая траектория с начальным состоянием х(0) е М0 в дискретном управляемом объекте (40.1), (42.1), причем выполнены включения x(t)^Mt, t=\, ..., N. Пусть, далее, множество Mt представляется в виде Mt = Щ Π Σ/, / = 0, 1, ..., Ν, -где множество Ш определяется в Еп системой соотношений (43.1), а множество Ux, τ=1, ..., N представляется в виде Ux = Ωί Π Sti где множество Ωχ определяется в пространстве переменных и\ ..., иг системой соотношений (43.2). Пусть, ' наконец, Lx — шатер множества Ξτ β точке и (χ), τ=1, ..., JV, a Qt — шатер множества 2t в точке χ (t), t = 0, 1, ..., Ν. Для оптимальности рассматриваемого процесса (в смысле минимума функционала (40.5) при наличии ограничений χ (t)^Mt, / = 0, 1, ..., Ν) необходимо существование такого числа ψ0^0 и таких векторов *W = {*iW, ·■·, +»W}· '=i W Ф(0—{Φι(α .... Ф*,(0), '-1 W μ(0-{μι(0. ···. Μ')}, ί = 0. 1, .... Ν, что выполнены следующие условия (А) — (С), в формулировке которых участвует функция Ht(xt и), определенная равенством Ht {X, U) = ψ</° (Χ, U) + t Ψ, (0 П(х,и) + Σ Φα (0 Ο? («)·' ί=1 α=1 (A) если ψο^Ο» то хотя бы для одного t хотя бы один из векторов ty(t), q>(/), μ(/) отличен Ότ нуля; (B) для любого t = 0, 1, ..., N и любого вектюра Ъх, направление которого принадлежит конусу Qt, справедливо не- равенствок ~4>W+gradx//i+1(jc (t),u(t+l)) + S μα<0 grad ^(jc (/))) 6* <0f a-l / где принято ψ(0) = 0 и #Ν+1=0;
392 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [43 (С) для любого /=1, ..., N и любого вектора Ьи, направление которого принадлежит конусу Lti справедливо неравенство bugraduHt(x(t-~ 1), и(<))<0. Доказательство этой теоремы следует по тому же пути, что и доказательство теоремы 42.1. Обозначим через Е* пространство переменных xlv u^ где ί = 1, ..., η; j = l, ..., г; t = 0, 1, ..., N\ τ=1, ..., Ν. Таким образом, в отличие от доказательства теоремы 42.1, величины х(0, 1 = 1, ..., п, здесь также считаются переменными. Функции (42.2) заданы на пространстве Е\ непрерывны и непрерывно дифференцируемы. Функции F0 и F\ (см. (42.3), (42.4)) также заданы и непрерывно дифференцируемы на пространстве Е\ Добавим к (42.3), (42.4) еще следующие функции: А'(г) = А*(х9 u) = W*(x\9...9 xfy ί = 1 rt\ f = 0, 1, ..., Ν, Ф}х(2) = Ф1х(х,и) = 0[(и[, ..., «;); /=1, ..., k%\ τ=1, ..., Ν, где Wt и G!x — функции, участвующие в определении можеств Mt и Ux (см. (43.1), (43.2)). Через Ω* обозначим теперь множество всех точек z = (x\, uj%) пространства £*, удовлетворяющих системе уравнений F{(2) = 0; / = 1, ..., п\ t=l9 ..., Ν; At(z) = 0; ί = 1, ...; г,; f = 0, 1, ..., tf; Φ>(ζ) = 0; / = 1, ..., /γ, τ = 1, ...,ΛΛ Далее, через Ξ* обозначим множество всех точек г=(л^, ufx) пространства £*, удовлетворяющих условиям: *, = (*'* *?)^Sf ί = °· 1> ···■ ^ Как и при доказательстве теоремы 42.1, замена (42.6) (в которой теперь / меняется от 0 до N) приводит рассматриваемую задачу оптимального управления к задаче об отыскании точки г, в которой функция F°(z), рассматриваемая на множестве Ω*Γ)Ξ*> достигает наименьшего значения. Пусть (40.3), (40.4) — искомый оптимальный процесс. Соответствующую точку пространства Е\ координаты которой одре- деляются формулами (42.6), обозначим через г0. Тогда z0eQ* f|a*
43] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 393 и в этой точке функция /^(z), рассматриваемая лишь на мно- жестве Ω*Π2*> достигает своего наименьшего значения. Обозначим, далее, через L* подмножество пространства Е\ состоящее из всех точек ζ=(χιν и(), удовлетворяющих соотношениям *,=(*}, ..., x?)eQif t = 0, 1, ..., Ν\ "τ = Κ> "·. "rt)eLt, τ=1, ..., Ν. Ясно, что L* есть выпуклый конус пространства Е* с вершиной в точке z0 и этот конус является шатром множества Ξ* в точке z0 (ср. соответствующее рассуждение при доказательстве теоремы 42.1). Ясно, далее, что направление некоторого вектора bz = {bxt, Ьих} в том и только в том случае принадлежит конусу L\ если для каждого * = 0, 1, ..., W направление вектора 6^ принадлежит конусу Qt и, кроме того, для любого τ = 1, ..., N направление вектора δατ принадлежит конусу Lx. Согласно теореме 36.9 существуют такие числа %<0, ψ', /=1, ..., п\ ί = 1, ..., ΛΤ; μ\, i=U ..., rt\ / = 0, 1, ..., Ν, <pj, /=1, ..., k%\ τ = 1, ..., Ν, что хотя бы одно из этих чисел отлично от нуля и выполняется условие (β) теоремы 36.9, которое в данном случае принимает следующий вид: S(togradx<JP(2o)+i Σ tfgrad, Fay(z0))bxt + + Σ Lgrad„xP(2o) + i l^„gradu F°(z0)W + + ΣΣμα(*Χ(ΖΤ*ά А°(г)) + + Σ Σ <ΡΙ (δ«τ grad^ Φ" (ζ0)) < 0. (43.3) Это соотношение должно выполняться для любого вектора bz = {bxh 6нт}, направление которого принадлежит конусу L*. Положим все Ьи% равными нулю; кроме того, выберем некоторое целое число θ(0^θ<;Λ0 и все bxt при7 / Φ Θ также положим равными нулю, а в качестве 6λ:θ будем брать всевозможные векторы, направление которых принадлежит конусу Q0. Получаемый вектор 6* =={&*;, 6ит) имеет направление, принад-
394 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ (4з лежащее конусу L*, и потому для него справедливо соотношение (43.3). Таким образом, Lgrad*eF*(z0) + i 2 ^grad ^(z0) + \ α=ι γ=ι β + 2 t^grad 4α(2ο))δχθ<0 α=1 У / для любого θ = 0, 1, ..., Μ и любого вектора δ#θ, направление которого принадлежит конусу Qe. Учитывая вид функций F0 и Fy (см. (42.3), (42.4)), перепишем это условие в виде следующего соотношения: к% grad,e /»β+1 (*β, «θ+1) - Г + Σ Ψθα+1 grad,e /θα+1 (*„ «Θ+Ι) + + ^grad <(*θ))δ*θ<0, α=ΐ которое справедливо для любого θ=0, 1, ..., Ν и любого вектора δ#θ, направление которого принадлежит конусу QG. Здесь через ψθ обозначен вектор {г|^, ..., ψ^}, причем мы считаем, что ф° = 0 и /^+1=0 (/=0, 1, ..., η). Если теперь применить замену (42.6), в которой t меняется от 0 до Nt и положить ψ^(ί) = ψ|, μ. (/) = μ^, φ (ί) = φ|, то из этих соотношений непосредственно получится условие (В), указанное в формулировке теоремы 43.1. Положим теперь все bxt равными нулю; кроме того, выберем некоторое целое число θ (1 <!θ<Λ0 и все Ьих при τ#θ также положим равными нулю, а в качестве Ьщ будем брать всевозможные векторы, направление которых принадлежит конусу LG. Получаемый вектор bz = {bxtt &ux) имеет направление, принадлежащее конусу L*, и потому для него справедливо соотношение (43.3). Таким образом, (♦o-gradBefO(z0)+ Σ Σ <§rad%Fay(z0) + + iy„grad Φ°(ζ0))δ«θ<0 для любого θ = 1, ..., Ν и любого вектора δ«θ, направление которого принадлежит конусу LQ. Учитывая вид функций F0 и F? (см. (42.3), (42.4)) и применяя замену (42.6), в которой / меняется от 0 до N, из этого соотношения непосредственно получим условие (С), указанное в формулировке теоремы 43.1*
431 § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 395 Замечание 43.2. Разумеется, в теореме 43.1 может случиться, что для какого-то значения / = 0, 1, ..., N (или даже для всех /) соотношений (43.1) нет совсем, т. е. Ш совпадает с0 всем пространством Еп и потому Mt = Ш Π Σ* = Еп[\ Σ, = Σ* (и тогда Qt есть шатер самого множества Мгв точке x(t)). В этом случае в формулировке теоремы 43.1 будет отсутствовать соответствующий вектор μ{ή, τ. е. в условиях (А), (В) теоремы 43.1 можно просто вычеркнуть все члены, содержащие μί(/), ί = 1, ..·, rt. Аналогично, если для какого-то τ= 1, ..., N (или для всех τ) нет соотношений (43.2), т. е. Ωτ совпадает со всем пространством переменных и\ ..., иг и потому [/τ = Ξτ (так что Lx есть шатер самого множества ί/τ в точке и (τ)), то в формулировке теоремы 43.1 будет отсутствовать вектор φ (τ), т. е. в условии (А) теоремы 43.1 и в выражении функции Ht{x, и) можно просто вычеркнуть все члень;, содержащие φ,- (τ), ί = 1, ..., kx. В частности, если нет ни соотношений (43.1), ни соотношений (43.2) и при этом множество М0 состоит из одной точки jt(0), а все остальные множества Ми /=1, ..., N, совпадают со всем пространством Еп (так что Qt = En9 /=1, ..., Ν), то теорема 43.1 превратится в теорему 42.1. Замечание 43.3. Предположим, что соотношения (43.1) независимы в точке χ(ί) (для каждого ^=0, 1, ..., Ν), т. е. что Щ представляет собой многообразие вблизи точки χ(t). Касательную плоскость к этому многообразию в точке x(t) обозначим через Щ. Предположим, далее, что конусы Щ и Qt (с общей вершиной x(t)) неотделимы в £*\ т. е. не существует такой гиперплоскости Г, что ЩсГи весь конус Qt расположен в одном замкнутом полупространстве, определяемом гиперплоскостью Г. Предположим точно так ^ке, что соотношения (43.2) независимы в точке и(х) (для любого τ=1, ,.., Л0, т. е. что Ωτ представляет собой многообразие вблизи точки и (τ). Касательную плоскость к'этому многообразию в точке и{х) обозначим через Ωτ. Предположим, далее, что конусы Ωτ и LT (с общей вершиной и (τ)) неотделимы в пространстве переменных и\ ..., иг. В этих предположениях условие (А) в теореме 43.1 может быть заменено следующим: (А') если ψ0 = 0, то хотя бы для одного t вектор ψ (t) отличен от нуля. В самом деле, допустим, что выбраны число ψ0 и векторы "Ψ(0, ф(0» (*(')» удовлетворяющие условиям (А), (В), (С) теоремы 43.1, и предположим, что при этом ψ0 = 0 и все векторы \p(t) равны нулю. Тогда в силу условия (А) хотя бы один из векторов φ(/), μ(/) хотя бы для одного / отличен от нуля. Предположим, для определенности, что для некоторого
396 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [43 / (= О, 1, ..., Ν) вектор μ (/) = [μχ (t), . .., μ^ (Щ отличен от нуля (в случае, если один из векторов <р(/) отличен от нуля, рассуждения аналогичны). Тогда в силу условия (В) получаем 4α!ι M0eradU^*(0))<0 (43.4) для любого вектора Ьх, направление которого принадлежит конусу Qt. Так как вектор μ(/) = {μ, (t), ..., μΗ (/)} отличен от нуля и так как соотношения (43.1) независимы в точке x(t), т. е. векторы grad ИР? (*(/)), а = 1, ..., ть линейно независимы, то вектор rt η=Σ μα (0 grad <(*(*)) отличен от нуля. Обозначен через Г гиперплоскость пространства Еп, ортогональную вектору η и проходящую через точку χ (ί). Из записи вектора η ясно, что он ортогонален плоскости ГП, и потому ШсГ. Далее, из (43.4) следует, что пЬх^.0 для любого вектора Ьх, направление которого принадлежит конусу Qt. Следовательно, конус Qt целиком расположен в одном замкнутом полупространстве, определяемом гиперплоскостью Г, и потому гиперплоскость Г отделяет конусы П* и Qt, а это противоречит предположениям. Полученное противоречие показывает,, что выполнено условие (А'). Теорема 43.4. Пусть в предположениях теоремы 43.1 множество Ef задается в пространстве Еп неравенствами w[{x) = w\{x\ .".., *я)<0; / = 1, ..., ρν (43.5)) где w\ — гладкие функции, причем система ограничений (43.5) является в точке x(t) невырожденной, t = 0, 1, ..., N. Тогда условие (В) теоремы 43.1 может быть заменено следующим: (В') существуют такие векторы ν (t) = [v{ (t), ..., vPt(t)}r /==0, 1, ..., Ν, что справедливы соотношения ν,ΡΚΟ, v/(0W(^W)=0; / = l РГ» f=0, 1, ...; ΛΓ; rt + (0-дга<1,Яж (*(/), и(*+1)) + 2 μα(0β™ά <(*(*)) + Cts=l + 2!v,(f)gradwf(*(0); t = 0, 1, ..., ЛГ, где принято ψ(0) = 0, ΗΝ+ί^0. Доказательство. В силу теоремы 34.^ множество всех точек х^Епу для которых вектор x — x{t) имеет неположи-
43] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 397 тельное скалярное произведение с каждым вектором gT2Law{(x(t))t /€=/,(*(*)), (43.6) является шатром множества Σ* в точке χ (t) (здесь t есть фиксированное число, которое может принимать любое значение О, 1, ..., Ν). В теореме 43.1 под Qt можно понимать именно этот шатер множества Σ,. Условие (В) теоремы 43.1 означает, что вектор grad, Яж (х (t), и (t + 1)) - ψ (t) + Σ μα (0 grad Wf (χ (ή) (43.7) α=1 имеет неположительное скалярное произведение с каждым, вектором, направление которого принадлежит конусу Qt. Таким образом, направление вектора (43.7) принадлежит двойственному конусу D(Qt)? и потому вектор (43.7) выражается в виде линейной комбинации векторов (43.6) с неотрицательными коэффициентами. 1С этой линейной комбинации можно добавить с нулевыми коэффициентами также и те векторы gradw/(*(/))» для которых j&It(x(t)). В результате мы найдем, что вектор (43.7) представляется в виде -ΣνΛί)ζ™άΜΐ(χ(ί))9 (43.8) /—ι где все коэффициенты Vj(t) неположительны, причем V/(/) = 0 при j<£It{x{t)). Приравнивая векторы (43.7) и (43.8), получаем второе соотношение в условии (В7). Так как, кроме того, Vj (t) = 0 при / ψ It (χ (t)) и w[ (х (*)) = 0 при / е= It {x (t)), то v} {t) w\ (x {t)) = 0 при всех /=1, ..., pti т. е. выполнено и первое соотношение в условии (ВО· Мы сформулируем теперь более общую теорему (для случая задачи с фазовыми ограничениями), для которой приведенные выше теоремы являются частными случаями. Доказательство этой теоремы получается на основе теоремы 36.8 и вполне аналогично доказательству теорем 42.1, 42.6 и 43.1. Теорема 43.5. Пусть (40.3) — некоторое управление^ а (40.4) — соответствующая траектория с начальным состоянием х(0) е М0 в дискретном управляемом объекте (40.1), (42.1), причем выполнены включения x(t)^Mty t=l, ..., N. Пусть, далее, для каждого t = ly ..., N множество Ut имеет вид Ut = Q't(]Q't'[]Q\l)(] ... nQ^na^n ··· flSj4
398 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [43 а множество Мх для каждого τ=0, Ι, ..., Ν имеет вид Μτ = π;ηπ;'ηπ(^η ... nn^)ns^n ... ηΣ(Μ, еде множество Ω{ определяется в пространстве переменных и\ ..., иг системой уравнений G\{u\ ..., ur) = 0, / = l ku множество Ω'{ определяется системой неравенств g\{u\ ..,, α0<0, ί=1, ..., qv множество Πτ определяется в пространстве переменных χ1, ...,χη системой уравнений . W{(x\ ..., χη) = 0, /=1, ..., rT, множество Π? определяется системой неравенств wl%{x\ .,,,ή<0, i = l, ..., ρτ; Ω(/* Ω^\ 3(Д ..., Ξ(^) — некоторые множества пространства переменных и\ ..., и\ а П^,} п£Ч Σ{*\ ..., Σ(?*> — некоторые множества пространства переменных ^х\ ..., лЛ Пусть, наконец, К\1) — шатер множества &\ι) β ro^/ce и(t); L{tl) — шатер множества Ξ\1) β точке и (/); Ρ(τ7) — шатер множества Пт' β то^/се л: (τ); Q{% — шатер множества Σ(τ/} β го^/сё α: (τ). Будем предполагать, что все функции G*, g\t W[, w[ являются гладкими и что для каждого t = \, ..., N система выпуклых кону сов L(/)(i = l, ..., mt) не обладает в пространстве переменных и\ ..., ит свойством отделимости, а для каждого τ — = 0, 1, ..., N система выпуклых конусов Q{1] (7=5=1, ..., sj не обладает в пространстве переменных х\ ..., хп свойством отделимости. Для оптимальности процесса (40.3), (40.4) {в смысле минимума функционала (40.5) при наличии ограничений x(t)^Ait, t = 0y Ι, ..., Ν) необходимо существование такого числа ψ0^0 и таких векторов: м Ψι»(0). .. φ*,(0}, ·, νρ,(0), 1, ..., /,; *(0 = {Ψι(0. ·· *(0-{φι(0. ·· μ(0-{Μ0. ·· ад <> ί: / = / f * = ί = -U = 1, = 1, = 0, = 0, ι, ·. ο, ι . . . ι, ι, . > ) · · Ν; ■ Ν; Ν; .., Ν; ··, Ν; Ν; ., Ν,
43] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 399 цто направление вектора alti] принадлежит двойственному конусу D(K{tl))> направление вектора Ь\1) принадлежит двойственному конусу θ(ρ[ι)) и выполнены следующие условия (А) —(Е), в формулировке которых участвует функция Ht(x, и), определенная равенством Ht{x9 u) = %f°t(x, u)+t%(t)fit(x) и) + + Σφι(0Ο{ώ + Σ λα(0β?(«): ί=1 α—1 (A) если ψ0 = 0, то хотя бы для одного t хотя бы один из векторов ψ(t), φ(0, Ч0> Μ-(0» v(0> <ti\ b\l) отличен от нуля; (B) для любого t = 0, 1, ..., N и любого вектора Ьх, направление которого принадлежит пересечению конусов Qt (/=1, ..., st)9 справедливо неравенство ч [-W) + gr*bxHt+x(x(t)Mt +l))+2 μα(*) grad ИГ? (*(*))+ pt nt \ + Σ va(t)grad wt (x(/)) - Σ bf )bx <0, где принято ψ(0) = 0 и Я^+1="0; (С) для любого / = 1, ..., iV и любого вектора Ьи, направление которого принадлежит пересечению конусов Lt (/ = 1, ..., mt)9 справедливо неравенство (gradw#,(* (/ - 1), α (0) - Σ <) 6и < 0; (D) Яу(0<0, ν£(τ)<0 для всех /= 1, ..., ft; /== 1, .·., W; / = 1, ..., ρτ; т = 0,Л, ..., Ν; (Ε) \(0ffi(«(0) = 0, ^(т)<(х(т)) = 0дляв(?«/=1 ft; * = 1, ..., JV; i=l, ..., ρΤ; τ = 0, 1, ..., Ν. В формулировке теоремы 43.5 lu mt, nu sti kti ft, rb pt могут быть любыми неотрицательными числами. Считая некоторые из них равными нулю, мы можем получить из теоремы 43.5 большое число частных случаев. Кроме того, в формулировке теоремы 43.5 можно считать, что для каждого t== = 1, ..., N среди множеств 3(/} некоторые являются гиперповерхностями, некоторые определяются неравенствами типа Н\!)(и)^0, а некоторые являются произвольными множествами, имеющими шатер L(A To же относится к множествам Σ(Λ Это
400 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [44 позволит еще более разнообразить различные следствия теоремы 43.5. Например, теорема 43.ί получается из теоремы 43.5 при qt = lt = 09 ρτ = /ζτ = 0, щ=\, sx=\ (t=l, ..., yV; τ = 0, 1, ..., Ν). Точно так же теорема 43.4 получается из теоремы 43.5 при <7ί = ί* = 0, ητ = 5τ = 0, mt=l (заметим, что формально мы получаем таким путем более сильный результат, так как при применении теоремы 43.5 не требуется, чтобы система ограничений (43.5) была в точке χ (t) невырожденной; но если эта система ограничений не является невырожденной, то утверждение теоремы 43.4 бессодержательно; ер. замечание 36.6). Замечание 43.6. Согласно теореме 34.2 условие, наложенное в формулировке теоремы 43.5 на множества Ω(Α Ξ\ι\ Ώ.%\ ς¥\ будет выполнено, если эти множества выпуклы, а за K{t\ L(t\ P%\ Q(t;) принимаются опорные конусы этих множеств в соответствующих точках. Точно так же эти условия будут выполнены, если множества Q{t\ Ξ\ι) определяются системой локально вогнутых ограничений (ср. следствие 36.17) типа ξ'(")<0 6»<0, а за K{t\ ύί] берется пересечение полупространств (tt-aW)grad£'(a(*))<.(), / = 1,..., α, (и аналогично для Πχ\ Σψ). Возможно также, что некоторые из множеств ίΐ\ι\ Ε\ι\ ц[!\ Σψ являются выпуклыми, а остальные определяются системами локально вогкутых ограничений. 44. Теорема существования. Доказанные в предыдущих пунктах (а также ниже, в пп. 45, 46) теоремы содержат лишь необходимое условие оптимальности. Поэтому решение задачи оптимального управления, полученное на основе этих теорем, всегда нуждается для полного обоснования в привлечении каких-либо дополнительных соображений. В самом деле, допустим даже, что применение необходимых условий к поставленной задаче оптимального управления оказалось особенно удачным, и нам удалось установить, что имеется лишь один процесс, удовлетворяющий сформулированным в теореме 43.5 (или 42.6) необходимым условиям. Это означает лишь, что доказан следующий факт: если оптимальный процесс в рассматриваемой задаче существует, то им может быть только найденный процесс. Но это вовсе еще не означает, что найденный процесс действительно является оптимальным (так как возможно, что оптимального процесса вовсе не существует, т. е. никакой процесс, кроме найденного, не является оптимальным, но и найденный тоже не оптимален).
44] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 401 Если, однако, из каких-либо соображений нам известно, что оптимальный процесс заведомо существует, то им может быть только найденный процесс, поскольку другие процессы необходимым условиям не удовлетворяют, т. е. заведомо не оптимальны. Нижеследующая теорема дает достаточно удобные условия, при выполнении которых оптимальный процесс непременно существует *). Теорема 44.1. Пусть функции f\(x, и) (см. (40.1), (40.5)) непрерывны по совокупности переменных х, и, множества Μ о, U и ···> Un компактны, а множества Мь ..., ΜΝ замкнуты. Предположим, Кроме того, что существует в объекте (40.1), (42.1) хотя бы один процесс, удовлетворяющий фазовым ограничениям x(t)^ Mt, ί = 0, 1, ..., Ν. Тогда задача оптимального управления (40.1), (42.1), (40.5) с ограничениями Mt на фазовые координаты имеет решение (т. е. оптимальный процесс существует). В частности, если функции \\ непрерывны, а множества Ulf ..., UN компактны {и непусты), то основная задача (см. стр. 21) имеет решение. Доказательство. Обозначим через W{ множество всех точек вида ft (χ, и), где χ е М0, u^U{. Так как М0 и U{ компактны, а функция f{ непрерывна, то Wx — компактное множество. Ясно, что для любого процесса в рассматриваемом объекте (с начальным состоянием χ (0) <= Αί0) справедливо включение д:(1) <= W{. Учитывая фазовое ограничение х(1)еМ,, получаем включение х(1) е М{ (] Wx. При этом, так как множество М{ замкнуто, то множество Мх Π W\ также замкнуто и, следовательно, компактно (поскольку W{ компактно). Обозначим, далее, через W2 множество всех точек вида f2(x, и), где χ е Mlf]Wl, u^U2. хЧножество W2 компактно, и для любого процесса в рассматриваемом объекте (с фазовыми ограничениями χ (0) е М0, χ (1) е Μ{) имеет место включение x(2)^W2. Учитывая фазовое ограничение х(2)<=М2, получаем включение χ (2) <= М2 [) W2, причем множество М2 f] W2 компактно. Продолжая таким образом, мы построим для каждого / = = 1, , N такое компактное множество Mtf] Wt, что для любого процесса, удовлетворяющего фазовым ограничениям x(t)^Mt (t = 0, 1, ..., Ν), выполнено включение x(t)^ Mtf\Wt. Для единообразия обозначим через W0 все пространство Еп переменных х{, ..., хп\ тогда включение х(0)^М0 также можно будет записать в виде χ (0) <= Λί0 f) WQ, так что соотношение x(t)<=Mt0Wt будет иметь место для всех t = 0, 1, ..., N. *) Условия существования оптимального управления для дискретных систем частного вида были получены в работе А. И. Пропоя (О принципе максимума для дискретных систем управления, Автоматика и телемеханика 20, № 7 (1965)).
402 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [44 Итак, всякий процесс в объекте (40.1), (42.1), удовлетворяющий фазовым ограничениям x(t)^Mu удовлетворяет также включениям x(t)^Mt(]Wtt причем Μ ι f) Wt — компактное множество. Применим теперь замену (42.6), в которой t меняется от 0 до N. Тогда соотношения (40.1) превратятся в уравнения (42.5)' (см. (42.4)), а включения (42.1) примут вид щ^ Uu t=\, ..., N. Таким образом, при замене (42.6) множество всех процессов в объекте (40.1), (42.1), удовлетворяющих фазовым ограничениям x(t)^Mt9 переходит в множество всех точек пространства £* переменной z = (xlt, и{), удовлетворяющих уравнениям (42.5) и включениям xt^ Mt(]Wh ux<=Ux (/ = 0, 1, ..., Ν; τ = 1, ..., Ν). Обозначим это множество через Ω. Заметим, что включения xt^Mt[\ Wu ux e U% (где / = = 0, 1, ..., Ν\ τ = 1, ..., Ν) определяют в простр1анстве Е* некоторое компактное множество (так как множества Mt f) Wt и. U% компактны); обозначим его через Р. Уравнения же (42.5) определяют в пространстве £* некоторое замкнутое множество Q (в силу непрерывности функций Ц(х9 и)\. Следовательно, множество Q = P{\Q также компактно. Кроме того, это множество непусто, поскольку, согласно предположению, существует в объекте (40.1), (42.1) хотя бы один процесс, удовлетворяющий фазовым ограничениям x(t)<=Mt. Итак, замена (42.6) сводит рассматриваемую дискретную задачу оптимального управления при наличии фазовых ограничений к задаче о минимуме непрерывной функции 7го (ζ) (см. (42.3)), рассматриваемой на непустом компактном множестве Ω. Как известно, минимум в этом случае достигается, т. е. существует точка 206Ω, в которой функция F°(z), рассматриваемая на множестве Ω, достигает минимума. Но тогда процесс, соответствующий точке z0 в силу замены (42.6), является оптимальным. Заметим, что лишь незначительно усложняя рассуждение, можно доказать аналогичную теорему не для процесса (40.1), (42.1), а для процесса (40.1), (40.2) при условии, что множества Ut(x) компактны, непусты и непрерывно зависят от χ при всех t= 1, ..., N. В качестве примера рассмотрим применение теоремы 43.4 к задаче о максимуме произведения, рассмотренной в примере 9.2 и решенной в п. 39 методом динамического программирования. Прежде всего заметим, что в приведенной постановке задачи область управления Ut(x) в действительности зависит от х, что мешает применению методов, рассмотренных в пп. 42,43. Однако если отбросить ограничение и^а — х\ потребовав эместо этого, чтобы сумма всех чисел и(1), ..., u(N) не пре*
44) § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 403 восходила а (т. е. xl(N)^a), то получится несколько иная (эквивалентная) постановка задачи, в которой область управления U будет уже постоянной. Итак, будем рассматривать объект (40.1), где f\(xl, *\ и) = х] + и, /*(*', х\ ц) = х2и; * = 1, ..,, Ν, (44.1) с постоянной областью управления ί/, определяемой неравен- ством и>0, . (44.2) а на конечное фазовое состояние наложим ограничение χ1 (Ν)^.α. Если ввести функцию wlN = xl(N) — a, то это ограничение запишется в виде o>i,<0. (44.3) Получается задача оптимального управления для объекта (40.1), (42.1) (см. (44.1)) с постоянной областью управления (44.2), причем начальное фазовое состояние х!(0) —0, #2(0) = 1 задано, а на конечное состояние накладывается ограничение x(N)<^MN, где множество MN определяется неравенством (44.3). Для этого объекта рассматривается задача о максимуме функционала (40.5), где /о= ... =/0^ = 0, ^(х1, x\ и) = х2и. Пусть и (t)9x{t) — оптимальный процесс. Согласно теореме 43.4 существуют такие числа ψ0^0, ν^Λ^^Ο (в дальнейшем вместо ν! (Ν) будем писать просто ν) и такие векторы *(0 = {*ι(0.+*('». '=1, .... Ν, что выполнены условия (А), (В7), (С). Условие (В7) в данном случае принимает следующий вид *): ♦г (АО-ν; *ι(0-*ι('+1). f=l, .... Ν-Ι; Ь(М) = 0, Ь (Ν - 1) = ψο" (Λ0 + ψ2 (Ν) и (Ν); ^2(t) = ^2(t+l)u(t+l)y /=1, ..., tf-2.. Из этих соотношений непосредственно получаем: *i(0-v, f=l, ..., Ν; fy(t) = $0u(t+l). ... -и(Ν), t = l,...KN-U ψ2(Λ0 = Ο. Заметим теперь, что если и (0 = 0 хотя бы для одного t, то в силу (44.1) x2(t)= ... === χ2(Ν) = 0, и потому функционал *) Мы выписываем условие (В') лишь для / = 1, ..., N. Соотношение (В') для t = 0 включает величины μι (0) (ибо множество AfQ определяется уравнениями а:^ (0) — j^q = 0, / = 1,2). Поэтому условие (в') для * = 0 позволяет в данном случае определить числа μ: (0), μ2 (0), но никакой новой информации о величинах ψ0, ψ* (/) не дает. Такое положение вещей характерно для задач с закрепленным левым концом.
404 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [45 (40.5) принимает значение 0. Оставим этот случай (очевидно, не дающий решения задачи) в стороне, т. е. будем рассматривать лишь такие процессы, для которых u(t) φ 0, /= 1, ..., ΛΛ В этом случае Ьи в условии (С) (см. теорему 43.1) может принимать как положительные, так и отрицательные значения, и потому условие (С) принимает вид q0x*(N- 1) + tM*0 + b(N)x2(N- l) = 0, *iW + *2(0^(<-l) = 0/ t=l, ..., JV-.l. Подставляя сюда найденные выше значения величин ψ, (/), ψ2(0» получаем ψ0*2(#~1)=-ν, *o^2('-l)tt(i+l)-...-tt(^) = -vf (44.4) ■f=l, ..., N-l. Отсюда видно, что ψ0 Φ 0 (иначе было бы ν = 0, и потому Ψι(0 = ψ2(0 = 0 для всех /, что противоречит условию (А)). Так как, кроме того, χ2{Ν — 1) Φ 0 (в силу сделанного предположения, что все числа и (t) отличны от нуля), то ν Φ 0. Итак, ψ0 > 0, ν< 0. Из соотношения vwlN(x(N)) = 0 в условии (В7) теперь получаем wlN(x(N))=0, т. е. χι(Ν) = α. Далее, учитывая, что x2(t) = u(l) · ... · и (t) (см. (40.1), (44.1)) и умножая первое из соотношений (44.4) на u(N), а второе — на u(t), получаем vu(N) = vu(t)9 t=l ΛΛ — 1, т. е. и(1)= ... =u(N). Наконец, так как и{\) -f ... + u(N)=a, то окончательно и(1)= ... =u(N) = ±. Итак, существует единственный процесс, который удовлетворяет необходимым условиям, указанным в теореме 43.4. В силу теоремы 44.1 (которую можно применить, так как из соотношения и (1) + ... + и (Ν) = л;, (Ν) ^ а вытекает, что 0^u(t)^a, / = 1, ..., Ν, т. е. каждая из величин u(t) может изменяться лишь в компактном множестве С/? = [0, а]) этот процесс действительно является оптимальным. Тем самым мы вновь пришли к результату, полученному на стр. 360 — 362 методом динамического программирования. 45. Дискретные объекты с переменной областью управления. До сих пор мы рассматривали объекты, у которых для каждого / область управления Ut(x) = Ut не зависела от х. Здесь мы это ограничение снимем, т. е. рассмотрим объект (40.1), (40.2) в общем виде. При этом ограничимся случаем, когда множество Ut(x) при каждом х = (х\ ..., /)е£" задается системой
45] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ' 405 равенств и неравенств типа G[(x\ ..., хп,и -№>·· \ и\ ..., «r) = 0, j = l, ..., kt\ (45.1) iV. , ..., Λ и1, ..., ί/Γ)<0, /=1, ..., ?,. (45.2) Относительно множеств Μχ сохраним те же предположения, что и в теореме 43.5, т. е. будем предполагать, что Мх = п; П Π? П Π(τ° П ... Π π£**> П Σ(τ° П ... П Σ(Μ, (45.3) где множество ΐΓτ определяется в пространстве переменных х\ ..., хп системой уравнений (45.4) Wttx\ ..., хп) = 0, j=U ..., гх, множество Πι определяется системой неравенств <(*', ···, хп)<09 1 = 1 ..... ρτ, (45.5) а П^, ..., Ихп%\ Ъ(х\ ..., Σ<5Λ — некоторые множества пространства переменных х1, . ...У1. Все функции G\, g\, W\, w\ предполагаются гладкими. Теорема 45.1. Рассмотрим управляемый объект (40.1), (40.2), где множество Ut(x) при каждом χ=(χ\ ..., χη) е Еп определяется системой соотношений (45.1), (45.2). Кроме того, предположим, что для каждого ^ = 0, 1, ..., N задано множество Mt вида (45.3) (см. (45.4), (45.5)). Пусть (40.3), (40.4) — некоторый процесс в рассматриваемом объекте, удовлетворяющий фазовым ограничениям x(t)<=Mt, t=0, 1, ..., N. Предположим, что для каждого τ = 0, 1, ..., N заданы в Еп выпуклые конусы Р{х\ Qx* (ί = Ι, ·> Λτ;/=1, ..., s%) с вершиной χ (τ), являющиеся шатрами соответственно множеств lH\ Σψ β точке χ (χ), причем для каждого τ = 0, 1, ..., N система выпуклых конусов Q(x\ 1= 1, ..., sx, не обладает в Еп свойством отделимости. Для оптимальности рассматриваемого процесса (40.3), (40.4) (в смысле минимума функционала (40.5) при наличии фазовых ограничений x(t)^ Μt, t = 0, 1, ..., Ν) необходимо существование такого числа ψο^ΞΟ и таких векторов *(0 = {*ι(0, ·· φ(0={Φι(0, ·· λ(9={мо,..: μ(0 = {μ,(0. ··· ν(0 = {ν,(0, ··· bf, ί-1, , Ψ„(0). ·. %Щ . λ,,ίο), • »rti% > vPi{t)), .... nt; t = t = \, .. t = l, .. t = \, .. t = o, i, t = o, i, 0, 1, ... , N; ·, N; ·, N; ..·, ΛΓ; ■ ■·, Ν; , Ν,
406 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [45 что направление вектора b\l) принадлежит двойственному конусу θ(ρ\ι)) и выполнены следующие условия (А)—(Е), в формулировке которых участвует функция Ht(x, и), определенная равенством Ht (х,и) = V? (*, «) + Σ *, (0 f \ {х, и) + + Σ Φβ(*Κ(*, α)+Σ Xa(t)gat(x, и): α=1 α=1-^ (A) если ψ0=0, то хотя бы для одного t хотя бы один из векторов ψ (/), <р(0> МО» МО* v(0> b\l) отличен от нуля; (B) для любого ^==0, 1, ..., N и любого вектора блс, направление которого принадлежит пересечению конусов Q{P (/=1, ···> st)9 справедливо неравенство (- Ψ(0 + §гаа,Я,+1 (х {t\u{t + 1)) + 2 μα(ί) grad И?(* (/)) + Pt nf + Σ να (0 grad < (χ (t)) - 2 &</> Ι δ* < 0, где принято ψ(0)=0, Hy+i^0; (C) gmdttHt{x(t-l), «(<)) = 0, /=1 AT;. (D) λβ(/)<0, λβ(/)ί?(*(<-1),«(0) = 0 при всех a=l, ...,</,; ί=1 ΛΤ; (Ε) να(/χθ, va (t) wt (x {t)) — 0 при всех a = 1 pf; * = 0, 1 N. Доказательство. Замена (42.6) сводит рассматриваемую дискретную задачу оптимального управления к задаче о минимуме функции F°(z) (см. (42.3)), рассматриваемой на множестве Σ*, которое описывается системой равенств (42.5), (45.1), (45.4), системой неравенств (45.2), (45.5) и системой включений Jt,enf, i=l, ..., nt; t=0, 1, ..., Ν; *,€=Σ</>, /=1, ..., st; t=0, 1 Ν. Это дает возможность применить теорему 36.8. Согласно этой теореме, существуют такие числа %<0, ψ*, г=1, .... л; t=l Ν; ф}, /=1 kt; t=\, .... Ν; λΐ i<=It(x(t-l),u(t)), < = 1, .... Ν;' μ{, k = \ rt; t = 0, 1, ..., Ν; vj, js/t(x(t)), ί = 0, 1, ..., Λί,
451 § l2· НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 407 и такие векторы Ъ\1\ /=1, ..., nt\ t = 0, 1, ..., Ν, что выполнены условия теоремы 36.8. Здесь через /,(*(/ —1), u(t)) обозначено множество всех тех чисел /=1, ..., qt, для которых выполнено равенство g\ (x(t — 1), u(0) = 0, а через Jt(x{t)) — множество всех тех чисел /= 1, ..., ри для которых выполнено равенство w\ {χ (t)) = 0. Далее, вектор Ыр имеет направление, принадлежащее конусу D(p\l)). Наконец, условие (β) теоремы 36.8 принимает здесь следующий вид (где через ζ0 обозначена точка, соответствующая процессу (40.3), (40.4) в силу замены (42.6)): 2(*овга(1Я//»(*„) + + Σ Σ *UradXtF«(z0)j Ъх,+ Σ (^grad„t F°(z0) + + S I +>»Ч^Ы)Ч +111фЦЧ^аа^0;(2о))+ + |1||i9:(ft«,grad.tG;(^) + +||I?x:(4gr.dJ(<^e))+ τ=1 v=sl α V τ Τ Ν '/ + ΣΣ Hvj(6*tgrad o»5(z0))-S Σ&<ί)δ*<° для любого вектора 6г = {Ьхи δ«τ}, обладающего тем свойством, что для каждого / = 0, 1, ..., N направление вектора 6*, принадлежит пересечению конусов Qf){i=lf ..., st). Здесь все величины λα, νβ неположительны, причем в тех суммах, в которых не указаны границы изменения индексов α, β, предполагается, что суммирование ведется по αΕ/ν (#(γ — 1), "(γ))> β е /γ (χ (γ)). Однако, полагая ΛΥ=0 при a<£Iy(x(y — 1), и (γ)) и vj = 0 при β <£/Y(χ(γ)), можно считать, что суммирование ведется по всем<х=1, ..., #Υ и β = 1, ..., ρν а все встречающиеся величины λα, vl цеполо· жительны,
408 гл. v. критерии оптимальности дискретных процессов ив Пусть теперь θ — одно из чисел 0, 1, ..., N. Положим δατ= 0 для всех τ. Кроме того, положим бдс, = 0 при ί^θ, а в качестве δ*θ будем брать всевозможные векторы, направление которых принадлежит пересечению конусов Q[>0, ί=1, ..., se. Получаемый таким образом вектор 6г={6*,, Ьих} обладает тем свойством, что при любом t = 0, 1, ..., N направление вектора 6*, принадлежит каждому из конусов Q<°, / = 1, ..., sv и потому для этого вектора должно выполняться выписанное выше условие (β). Учитывая вид функций F°, Flf9 Gj, Wlv g\, wlv получаем отсюда условие (В) теоремы 45.1: достаточно положить *«(') = *'„. Фв(0 = ч£. μ„(0 = μ1, λ«(0 = & να(ί) = ν<. Далее, выберем произвольное θ (1 ^9<CAf) и положим Ьих = 0 при τ Φ θ; кроме того, положим &х,=0 для всех /; наконец, в качестве δίίθ будем брать произвольные векторы. Для полученного вектора 5г = {5д^, Ьих} также должно выполняться выписанное выше условие (β) и это дает условие (С) теоремы 45.1. Наконец, выполнение условий (A), (D), (Е) проверяется непосредственно. Заметим, что если функции (45.1), (45.2) не зависят от х, т. е. определяют постоянную область управления Ub то теорема 45.1 превращается в теорему того типа, который был рассмотрен в предыдущем пункте, а именно в теорему 43.5 для случая lt= mt = 0. 46. Дискретный принцип максимума (метод локальных сечений). В этом пункте мы дадим другое решение задачи оптимального управления для дискретного объекта с переменной областью управления, отличающееся большей общностью. Будем говорить, что объект (40.1), (40.2) обладает локальными сечениями *), если для любых /, лс0, и0, удовлетворяющих условию щ e Ut(x0), можно найти такую гладкую функцию %t {x)t определенную в некоторой окрестности точки х0 и принимающую значения в пространстве переменных и1 и\ что %i(x)eUt(x) и χ,(*ο) = Ηο. Функцию %t(x) будем называть локальным сечением, соответствующим выбранным значениям /, χθ9 α0. Заметим, что функция %t(x) предполагается гладкой, т. е. обладающей непрерывными частными производными d%i(x) i=i ... г I = 1 ... пи *) Этот термин заимствован из теории косых произведений, являющейся одной цз важнейших ветвей современной топологии.
46] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 409 однако о характере зависимости функции χ,(л;) от х0, щ ничего не предполагается (даже непрерывности). Заметим, далее, что если у объекта (40.1), (40.2) области управления не зависят от х, т. е. имеют вид (42.1), а функции Н(х, и) непрерывно дифференцируемы по х, то этот объект заведомо обладает локальными сечениями. В самомг деле, пусть и0 е Ut\ Положим %t (χ) Ξ= и0; тогда %t (x) есть локальное сечение (в данном случае определенное не локально, т. е. не вблизи некоторой заданной точки *0, а во всем пространстве £л). Теорема 46.4 (принцип максимума). Рассмотрим управляемый объект (40.1), (40.2), обладающий локальными сечениями. Обозначим через Vt(x) подмножество (п + ^-мерного пространства Еп+1> заполняемое всеми точками ft (х, и) = (/? (χ, и), f\ (χ, и), ..., ft (x, и)), когда и пробегает множество Ut(x), и предположим, что для любой точки х^Еп и любого t=l, ..., N множество Vt{x) является компактным, выпуклым и непрерывно зависит от χ е Еп. Функции ϊ\ {χ, и) предполагаются непрерывно дифференцируемыми по х, и. Предположим, далее, что заданы множества Ми t = 0, 1, ...,,Μ имеющие вид Λί,-nfn ... пп<4 где Щ1) — некоторые множества пространства Еп. Пусть (40.3), (40.4) — некоторый процесс в рассматриваемом объекте, удовлетворяющий фазовым ограничениям x(t) e Mt, / = 0, 1, ..., N, и пусть Ρψ — шатер множества Щ] в точке x\f). Выберем для каждого /=1, ..., N некоторое локальное сечение xt{x), определенное вблизи точки x(t — 1): Xt(x)<=Ut(x), fc(*(f-l)) = ii(0, ί=1,...,ΛΛ Для оптимальности рассматриваемого процесса (40.3), (40.4) (в смысле минимума функционала (40.5) при наличии ограничений x(t)<=Mt) необходимо существование такого числа Ψο^Ο и таких векторов *(0-{*ι(*), .... *»(*», t = lt ..., ЛГ; bf, i=\, ..., nt\ t = 0, 1, ..., Ν9 что направление вектора Ь[1) принадлежит (в пространстве Еп) двойственному конусу D{P{tl)) и выполнены следующие условия (А) — (С), в формулировке которых участвуют функции Ht{x, u)> НЦх), определенные равенствами Ht(x, α) = ψο/S (лг, и) + Σ ψ, (*)/*(*, и); H]{x)-*rdt{xf η (χ)):
410 ГЛ. V. КРИТЕРИЙ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [46 (A) если ψ0 = 0, то хотя бы для одного t хотя бы один из векторов ψ(ί), b[l) отличен от нуля; (B) ^{t) = gr*aH)+{{x/{t))-yZb{!\ t = 0, lr ...tN9 где при- /-ι нято ψ(0) = 0, Η*ν+\=0; (C)Ht(x(t-l)9 u(t)) = max Ht{x(t-l),u)J = l9 ...9N. U€=Ut(X(t-\)) Отметим, во избежание недоразумений, что при вычислении вектора gradHt+\(x(t)) необходимо применять формулу полной производной: а#;+| (*(/)) = дх1 /—1 Доказательство. Прежде всего несколько переформулируем поставленную задачу оптимального управления. Введем в рассмотрение новые переменные ν°9 ν\ ..., νη и обозначим через Εη+ι пространство этих переменных. При любых заданных х, и точка U{x, и), имеющая координаты v=ft{x, u\ vl=f\(x9'и\ ..., *» = /?(*, и), (46.1) принадлежит этому пространству. Будем по-прежнему под траекторией понимать произвольную последовательность точек *(0), *(1), ..., χ(Ν) (46.2) пространства Еп9 но под управлением теперь будем понимать некоторую последовательность точек ν(1), ..., ν (Ν) (46.3) пространства En+l. По условию теоремы для любой точки х^Еп и любого t = l9 ..., N задано некоторое множество V't(x)czEnJr\ Будем говорить, что траектория (46.2) соответствует управлению (46.3), если выполнены соотношения O(t)t=Vt(x(t-l)), t = l9 ...9 N; (46.4) x*(t) = Ol(t)9 ί=1, ...,λ; / = 1, ..., Ν. (46.5) В качестве минимизируемого функционала для объекта (46.4), (46.5) возьмем / = о°(1) + о°(2)+ ... +xfi(N). (46.6)
46] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 411 Соотношения (46.4) — (46.6) позволяют сформулировать некоторую дискретную задачу оптимального управлений. Именно, требуется найти такой процесс (т. е. управление (46.3) и соответствующую ему траекторию (46.2)), который удовлетворяет условиям x(t)^Mt9 t = \9 ..., Ν, (46.7) и при этих условиях осуществляет минимум функционала (46.6). Ясно, что к задаче оптимального управления в форме (46.4) — (46.7) сводится задача (40.1), (40.2), (40.5), (46.7). Это сведение как раз и осуществляется формулами (46.1). В самом деле, пусть (40.3), (40.4) — некоторый процесс для объекта (40.1), (40.2), удовлетворяющий ограничениям x(t) e Ми t = 0, 1, '.., N. Положим vi{t) = f\{x{t-\l и (ή); ί = 0, 1 л; f-1, ..., Ν. (46.8) Тогда в силу (40.1), (40.2) будут справедливы соотношения (46.4), (46.7), а функционал (40.5) примех вид (46.6). Иными словами, замена (46.1) переводит каждый процесс в объекте (40.1), (40.2) в некоторый процесс в объекте (46.4), (46.5), причем значение функционала (40.5) оказывается равным соответствующему значению функционала (46.6). Ограничения χ (t) e Mt остаются выполненными (поскольку замена (46.8) вводит лишь новые управления, а траектория не ^меняется). Обратно, для любого процесса в объекте (46.4) — (46.6) (удовлетворяющего ограничениям x(t)^Mt) можно найти переходящий в него при замене (46.8) процесс в объекте (40.1), (40.2), (40.5). Для нахождения такого процесса достаточно разрешить соотношения (46.8) относительно и(t\ t==l9 ...,JV, что всегда возможно в силу определения множеств Vt(x). Заметим, что этот обратный переход, вообще говоря, неоднозначен (т. е. одному процессу x(t), v (t) может соответствовать много процессов χ (t)9 и (t) вследствие неоднозначности решения уравнения (46.8)). Однако все процессы x(t)9 u(t), соответствующие в силу (46.8) одному и тому же процессу x(t), v(t)9 дают функционалу (40.5) одноитоже значение (равное значению функционала (46.6) для процесса x(t), Ό(ή). Остается заметить, что если процесс x(t)9 u(t) является оптимальным для объекта (40.1), (40.2), (40.5) при ограничениях x(t)^Mt9 то соответствующий ему в силу (46.8) процесс x(t), v(t) будет оптимальным1 для объекта (46.4) —(46.6) при тех же ограничениях x(t)^Mt9 и наоборот. Поэтому задача отыскания оптимальных процессов объекта (40.1), (40.2), (40.5) равносильна задаче отыскания оптимальных процессов объекта (46.4)—(46.6). Эту последнюю задачу мы теперь и будем рассматривать, а после ее решения' вернемся к объекту (40.1), (40.2), (40.5).
412 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [46 Обозначим через Е* пространство переменных xlp ντ, где / = 1, ..., п\ / = 0, 1, ..., п\ t = 0, 1, ..., Ν; τ = 1, ..., Ν. На пространстве Ε* будем рассматривать функции /*(*) = ι>? + *° + ... +υ%; (46.9) Ρ\(ζ) = -χ\ + Όιν / = 1, ..., щ * = 1, ..., N. (46.10) Обозначим через Ω' множество всех точек пространства Е\ координаты которых удовлетворяют системе уравнений ВД=0, / = 1 я; t = l,...,N; (46.11) далее, через П^ обозначим множество всех точек ζ = {χ\, ν{) пространства £*, удовлетворяющих условию xt e П^, а через Ξτ — множество всех точек ζ, удовлетворяющих условию "*,=К 0ί> ···■ ^)e^(v.)=^K-, *?.,). Замена *{=*'(*); * = 0f l, ..., Ν; /=1, ..., λ; 4 = ο/(τ); / = 0, 1 η; τ=1, ..., JV, (46.12) приводит рассматриваемую задачу оптимального управления к задаче об отыскании точки, в которой функция F°(2), рассматриваемая на множестве 2* = й'п(лПп(/))п(па1 достигает наименьшего значения. Пусть (46.2), (46.3) — оптимальный процесс в объекте (46.4)— (46.7), соответствующий в силу (46.8) заданному оптимальному процессу (40.3), (40.4) в объекте (40.1), (40.2), (40.5) (при ограничениях x(t)^Mt). Положив Ц = *' (0, ϋ{ = */ (τ) = fix (χ (τ - 1), и (τ)), мы получим точку z==(ij, б(), в которой функция F° (ζ), рассматриваемая на множестве Σ*, достигает минимума. Поэтому применимо необходимое условие экстремума, содержащееся в теореме 36.8. Чтобы использовать эту теорему, обозначим через Ρψ множество всех точек z=(a:j, v!x) пространства Е\ удовлетворяющих условию Xt е Р{Р. Тогда Pti] есть шатер множества Щ1) в точке ζ (ί = 1, ..., щ\ / = 0, 1, ..., Λ0· Далее, положим &(*) = Ы*, &(*))·
46] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 413 Тогда %t(x) есть гладкая функция, определенная вблизи точки й-1. причем %(x)ezVt(x) и xt(*t-i) = Vf Наконец, для любого 9=1, ..., N через Le обозначим множество всех точек вида ζ + Ьг, где bz = [6xj, δντ] удовлетворяет следующему условию: (а) направление вектора bve —· V —ei^e-i) бл;*^ принадле- я/шг конусу Le, где Le — опорный конус выпуклого тела V0(£q-{) в точке ϋθ. Множество Le является, очевидно, замкнутым выпуклым конусом пространства Е* с вершиной в точке ζ. Докажем, что "этот конус является шатром множества Ξθ в точке г и что система выпуклых конусов Σθ, θ= 1, . .., Ν, не обладает в Е* свойством отделимости. Допустим, что этот факт уже установлен, и йокажем, как в этом случае завершается доказательство теоремы. В силу сделанного предположения, к функции F°(z), рассматриваемой на множестве Σ*, можно применить теорему 36.8 (в которой следует положить г = ^ = р = 0). В самом деле, множество Σ* представляется в виде пересечения множества Ω', определяемого системой равенств (46.11), и двух систем множеств Й{Р и Ξτ, причем нам известны шатры Р{/\ Lx этих множеств в точке г, и, кроме того, система конусов Ζτ, т= 1, ..., Ν, не обладает в Е* свойством отделимости. Согласно теореме 36.8 существуют такие числа г|)0^0, ^\ (/ = 1, ..., /г, /== 1, ..., Ν) и такие векторы Ь\1) (*'= 1, ..., щ\ / = 0, 1, ..., Ν), что направление вектора Ъ\1) принадлежит двойственному конусу 0(Р{/]) и выполнены условия (β), (γ) теоремы 36.8, которые в данном случае принимают следующий вид (см. (46.9), (46.10)): (β) %UogradXtF>(z)+t 21^ега'с1^а(г))б^ + Ν Ι η Ν для любого вектора bz = {bxt, bvx}, направление которого принадлежит пересечению конусов Lx (τ = 1, ..., Ν); (γ) если все числа i|)0, tyj равны нулю, то хотя бы один из векторов bii] отличен от нуля.
414 ГЛ. V. КРИТЕРИИ'ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [4 6 Учитывая вид функций F и F%, можно переписать условие (β) в виде %Σ Κ-Σ Σ¥Μ + Σ Σψ;δ0/-2 Σ&'/'δζ^ο. (46.13) Выберем некоторое целое число θ(0^Θ^Λ0 и все блс^ при t Φ θ положим равными нулю, а в качестве δ*θ = \hx\y ..., δχ^} будем брать произвольные векторы. Далее, определим векторы bvt с помощью равенств ^-Σ-^Η-Κ-.^Ο- /-1 Ν, так что условие (а) будет выполнено. Иными словами, η 6ре+1=У afe"(*e)6x&, 6^ = 0 при ί^θ + 1. Получаемый вектор 5г = {бх{, δϋ(} имеет направление, принадлежащее каждому из конусов Γτ, τ=1, ..., Ν, и потому для него справедливо соотношение (46.13). Таким образом,, полагая для удобства ψ? = 0 (/=1, ..., η\ χ£+1 = 0 (<х = 0, Ι, ..., /г), получаем /Γΐ ^θ S Я /Γΐ θ -2*&°δ*><0, θ = 0, 1 tf, (46.14) где бе0 — вектор пространства Еп, имеющий (по осям х\ ..., хп) те же координаты, какие имеет вектор W по осям x1q, ..., дге (остальные координаты вектора Ье] равны нулю в силу выбора конуса Ре0· Соотношение~(46.14) справедливо для любого вектора 6лсе={бл:^, ..., 6χξ), откуда и вытекает условие (В) теоремы 46; 1 (в силу замены Ψα(0 = Ψα И соотношения %{х) = = h(x> fc (*)))· Наконец, выберем произвольно число θ(== 1, ..., Ν) и все bvx при τ =^= θ положим равными нулю, а в качестве bve = = {δϋ£, ..., δα£} будем брать произвольные векторы, направление которых принадлежит конусу Le. Кроме того, положим
46] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 415 bxt — 0 для всех t. Полученный вектор bz = [Ьхи bvx) имеет направление, принадлежащее каждому из конусов Ζτ, τ = = 1, ..., Ν, и потому для него справедливо соотношение (46.13). Таким образом, Vue+|l*/4<°. θ=1 Ν9 для любого вектора δνθ={δυ§, ..., δυ£}, направление которого принадлежит конусу Ц. η Это означает, очевидно, что функция \υ^ + 2 Ψαϋθ> Рас" сматриваемая на конусе Le, достигает максимума в вершине этого конуса, т. е. в точке όθ· Но выпуклое множество Κθ(£θ-ι) содержится в его опорном конусе Ье (что непосредственно вытекает из определения опорного конуса). Поэтому функция η Ψ0^θ+ Σ Ψαϋθ> рассматриваемая на множестве Κθ(£θ-ι)> Дости- гает максимума в точке vQ: %v°b + Σ €ϋΒ = max W° + Σ €υΊ· θ = ι> · · · ι Ν. Отсюда и получается (в силу замены ψ{ = ψί(0 и соотношения (46.8)) условие (С) теоремы 46.1.-Наконец, условие (А) теоремы 46.1 непосредственно вытекает из сформулированного выше условия (γ). Итак, для завершения доказательства теоремы 46.1 остается установить, что конус Lx является шатром множества St в точке ζ и что система выпуклых конусов Ζτ, τ=1, .<., Ν9 не обладает в Е* свойством отделимости. Выберем произвольное θ(=1, ..., JV). Пусть z = (xt, υ^ = (χιν t>{) т-произвольная точка конуса Ζθ. Через ^Pq(z) обозначим ближайшую к vQ точку выпуклого множества V^x^). Далее, точку z = (xti ϋτ), удовлетворяющую условиям xt = хи * = 0, 1, ..., Ν; νθ = %{ζ), ντ = νχ при τ Φ θ, обозначим через Ψθ (ζ). Таким образом, определено отображение Ψ0: LQ->E*. Без труда проверяется, что это отображение непрерывно (напомним, что множество VQ{x) непрерывно зависит от хеЕп). Из включения tyQ(z) ^Ke(*o-i) (вытекающего из определения точки ^Pq(z)) непосредственно следует (в силу определения отображения Ψϋ и множества Ξ0), что Ψ$(ζ)^Ξβ для любой точки ζ е L0. Таким образом, отображение Ψθ удовлетворяет условию 2) определения 34.1.
416 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [46 Покажем, что отображение Ψθ удовлетворяет и условию 1), т. е. что имеет место соотношение Ψθ(;ε) =ζ + ο^(ζ). Для этого выберем произвольное положительное число ε (не превосходящее единицы), которое в процессе рассуждений менять не будем. Проведем в пространстве Εη+ι некоторую сферу с центром в точке vQ и обозначим через Σ0 пересечение этой сферы с конусом Le (т. е. с опорным конусом тела Ув(&в-г) в точке vQ). Пусть {/0^Σο· Обозначим через /θ(#θ) луч, исходящий из точки Vq и проходящий через точку ί/θ. Пусть, далее, Ζθ-! — замкнутый шар пространства Еп с центром £θ_, и радиусом δ > 0. При достаточно малом δ функция χθ определена на всем шаре Ζ0-{. Выберем произвольную точку xQ^ ^ Ζ^λ и рассмотрим в пространстве £η+1 все лучи, исходящие из точки χθ(*θ-ι) и образующие с лучом /θ({/ο) углы, не превосходящие ε: Эти лучи заполняют в пространстве Ε замкнутый выпуклый конус, который мы обозначим через Ке, ei^e-i» Уо)- Так как #Θ<=ΣΘ, т. е. луч /θ(#θ) содержится в конусе Ιθ, то как угодно близко к этому лучу имеются лучи, исходящие из vQ и проходящие через отличные от vQ точки множества ν$(χ$-χ). Следовательно, внутри конуса Λ^θΟ^θ-ι» Уо) найдется луч, исходящий из точки б0 и проходящий через отличную от uQ точку множества VQ(x^{). По непрерывности (учитывая компактность множества Σθ) можно выбрать радиус δ шара 1§-х настолько малым, что для любых точек yQ ^ Σ0, х^х ^ ZQ^ найдется внутри\конуса /(β>θ(*θ-ι» Уо) ЛУЧ» исходящий из вершины χθ(*ο-ι) этого конуса и содержащий отличную от χο(#θ-ι) точку выпуклого множества Κθ(*ο-ι)· Выберем число δ так, чтобы оно удовлетворяло этому условию, и больше менять его не будем. Итак, пересечение ^β.β(*θ-ι^θ)η^β(*β-ι) (46.15) содержит отличные от χθ(*β-ι) точки> расположенные внутри конуса /ίβιθ(*β-ι. Ув) (ί/θ ^ Σθ, χβ-{ eZe-i); точка χθ(*θ-ι) также, очевидно, принадлежит этому пересечению. Пересечение (46.15) является выпуклым компактным множеством. Нетрудно доказать, что оно непрерывно зависит от пары переменных Если множество (46.15) имеет точки, лежащие вне шара радиуса 1 с центром в точке χθ(*θ-ι)» то положим d(*e-n #θ) — 1· Если же множество (46.15) целиком расположено в этом шаре, то через d(xQ-u yQ) обозначим наибольшее расстояние от χθ(#θ-ι) до точек множества (46.15). Ясно, что d(*e-i. Уе)> °> поскольку множество (46.15) содержит отличные от χ0(#θ-ι) точки. Кроме
461 § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 417 того, функция d(xQ-lt уе) непрерывна, поскольку множество (46.15) непрерывно зависит от пары переменных *θ_,, yQ. Таким образом, d(#θ-ι> Уо) представляет собой положительную непрерывную функцию, аргументы которой пробегают замкнутые ограниченные множества: х^х е ZQ-U уе ^ Σθ. Следовательно, минимальное значение функции d(xQ-uyQ) положительно, т. е. существует такое h > О, что d(xQ-u ye)^h для любых Χβ-,ε^, ί/θ^Σθ· Выберем теперь настолько малое положительное число А0, меньшее радиуса шара ZB-b что если вектор z — z — bz = = [6х\9 dvty имеет длину | ζ — ζ \ < Λ0, то вектор 0Χθ(*θ-ι) δρ. -Σ -δχ< имеет длину, меньшую А. Если теперь ζ 62 = 2 — 2 удовлетворяет условию (α) при ление вектора (46.16) принадлежит конусу LQ дется такая точка j/eG^ чт0 вектор (46.16) направлен по лучу /θ(ί/θ)· Следовательно, найдется в множестве (46.15) точка wQ, отстоящая от χθ(*θ-ι) не менее, чем на А. Точка (46.16) = Ζθ, т. е. вектор τ = θ, то направ- Поэтому най- (46.17) .,, ув). Этому Рис. 158. лежит на оси конуса К8у θ (*θ _ . Же конусу принадлежит и точка wQ. Следовательно, угол между векторами 5Θ — Xe(^e-i) и ^θ — Xe(*e-i) не превосходит ε. Кроме того, первый из этих векторов (т. е. вектор (46.16)) имеет длину, меньшую /г, а второй — длину, не меньшую /г. Поэтому точка Se, являющаяся проекцией точки Sq на луч, исходящий из %в(хе^{) и проходящий через точку w6, принадлежит множеству Vq(xq-i) (ибо она лежит на отрезке, который соединяет точки χθ(*θ-ι) и wQi принадлежащие выпуклому множеству Vq(xq-i)', рис. 158). Расстояние же между точками se и sq не превосходит | sQ — χθ(#β-ι) I sin ε, т. е. меньше, чем η bva dXeUe-i) έί a^-i δ*θ-ι
418 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ 14в (см. (46.17)). Далее, в силу (46.17) =Xe(Vi) + ο(δ*θ-ι) + Η = #θ + δ»θ + ο(δ*θ-,) = t»e + ο(δ«θ-ι). т. е. расстояние между точками se и ι>θ есть ο(δΛ:θ_,). Таким образом, от точки νβ на расстоянии, не превосходящем ^-Σ-^f2-^ + o(**e-i). (46.18) имеется точка ^θ^^θ^θ-ι)· Следовательно, расстояние от vQ до ближайшей к ней точки ψθ(2) множества Κθ(*θ-ι) подавно не превосходит (при | Ьг |< λ0) величины (46.18). Так как в этом рассуждении число ε > 0 было произвольным, то lim IV«)-'el_0> ι«ιμο Ιδ*Ι т. е. имеет место соотношение %(ζ) = νϋ + οέ{ζ), означающее, что отображение Ψθ удовлетворяет условию 1) определения 34.1. Таким образом, Lx есть шатер множества S, в точке 2, τ = 1, ..., ΛΛ Остается доказать, что система выпуклых конусов Ζτ, τ = = 1, ..., Ν, не обладает в Ε* свойством отделимости. Обозначим через Оь (где 9 = 1, ..., N) множество всех точек ζ =(% υχ\ удовлетворяющих условиям xt = Jtt при t — Ο,Ι,...,Ν, νχ = ΰχ при τ =τ^θ. Далее, через D0 обозначим множество всех точек z — (xt9vx)f удовлетворяющих условиям Ясно, что £*, рассматриваемое как векторное пространство с нулевой точкой ζ, распадается в прямую сумму своих подпространств £>о, £>ъ ···> dn- Обозначим через Lq (где 9 —одно из чисел 1, ..., Ν) множество вс§х точек z = (xlt, vx)^DQ9
χ46] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 419 удовлетворяющих условию ve e Le. Легко видеть, что Ιθ есть выпуклая оболочка множества, являющегося объединением конуса Ц a Dq и всех подпространств D0, Du ..., D^, кроме D0. Поэтому из теоремы 42.5 непосредственно вытекает (ср. стр. 385), что система выпуклых конусов Ζτ, τ=1, ..., Ν, не обладает в Ε* свойством отделимости. В теореме 46.1 можно считать, что для каждого t = 0, 1, ..., N среди множеств П*1) некоторые являются гиперповерхностями (в пространстве Еп переменных х\ ..., хп), некоторые определяются неравенствами типа w(p(x)^0, а некоторые являются произвольными множествами, имеющими шатер Р[1\ В результате мы из теоремы 46.1 получим следующее более общее предложение. Теорема 46.2 (принцип максимума). Будем рассматривать управляемый объект (40.1), (40.2), (40.5), в котором область управления Ut(x) компактна и непрерывно зависит от х^Еп, а множество Vt(x) всех точек вида ft(x,u)f u^Ut(x) (см. (46.1)), является для любого х^Еп выпуклым. Предположим, далее, что рассматриваемый объект обладает локальными сечениями и что функции flt(x, и) непрерывно дифференцируемы по х, и. Предположим, наконец, что множества Mt, t*=0, 1,..., Ν, имеют вид Μ,-πίηπΓηπ^η ...ηπί4 где множество Щ определяется в пространстве Еп системой уравнений Wt(x\ ..., хп) = 0, /«1, ..., ти (46.19) множество П" определяется системой неравенств w\{x\ ..., χΛ)<0, i=\, ..., pt, (46.20) α Τ$\ / = 1 Щ, — некоторые множества пространства Еп. Пусть (40.3), (40.4) — некоторый процесс β рассматриваемом объекте, удовлетворяющий фазовым ограничениям χ (t) e Mt, t — 0, 1 Ν, и пусть Ρψ — шатер множества Π*0 в точке x(t). Будем предполагать, что в окрестности точки x(t) все функции W\, / = 1, ..., /у, w\, i=l, ..., ρν являются гладкими. Выберем для каждого t = \, ..., N локальное сечение %и определенное вблизи точки x(t— 1): fc(*(i-l))-a(0, %t(x)eUt(x). Для оптимальности рассматриваемого процесса (40.3), (40.4) (в смысле минимума функционала (40.5) при наличии ограни-
420 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [46 чений χ (t) <= Aif) необходимо существование такого числа ψ0 ^0 и таких векторов *(0 = {*iW. ···> *Я(0}, *==1 AT; μ(0 = {μι(0, ..., MO}, f=o. ι, ..., лг·, ν(0 = {ν,(0, ..., νΡί(0}\ '=0, 1, ..., JV; 6(Д ί = 1, ..., щ\ * = 0, 1, ..., iV, <ίτο направление вектора Ь\1) принадлежит (в пространстве Еп) двойственному конусу D(Ptl)) и выполнены следующие условия (A) — (D), в формулировке которых участвуют функции Ht(xt u\ #*(#), определенные равенствами Ht(χ, и) = %f°t(x, и) + Σ %(t) f\(*, и); Η](χ) = Ht(χ, χ,(χ)): (A) если ψο = 0, то хотя бы для одного t хотя бы один из векторов ψ(0, μ (0> ν(0» $] отличен от нуля\ (B) ψ (0 = grad Ht+i (χ (0) + Σ μ/ (0 grad W\ (χ (ή) + + Σν Μ) grad w( (χ (t))-Σ Ь[!\ , / = 0, 1, ..., ЛГ, где принято ψ(0) = 0, Я^+1 = 0; (C) Ht(x(t - 1), u(0) = шах Ht(x(t - i), u), t = 1, ..., N\ (D) v1 (t) < 0, v/ (0 w\ (x (t)) = 0 для всех j = 1, ..., ρ,; * = 0, 1, ..., N. Доказательство: Обозначим через Vt(x) множество всех точек ft (χ, и) = (ft (χ, и), f\ (χ, и), ..., ft {χ9 uj), получающихся, когда и пробегает множество Ut(x). Так как функции f^(xt и) непрерывны, а множество Ut(x) компактно, то множество Vt(x) является компактным. Кроме того, по предположению, множество Vt(x) выпукло. Наконец, Vt(x) непрерывно зависит от х, так как Ut(x) непрерывно зависит от х, а функции ^(х, и) непрерывны. Таким образом, требования, наложенные в теореме 46.1 на множества Vt{x\ выполнены. Из теоремы 46.2 можно получить некоторые результаты, установленные ранее различными авторами. Для примера по-
46] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 421 кажем, как может быть выведена теорема, принадлежащая Халкину (см. сноску**) на стр. 79). С этой целью предположим, что мы имеем объект (40.1), (42.1), т. е. что об ласти, управления Ut(x) = Ut не зависят от х. Тогда в качестве функций %t(x) можно принять %t(x) — u(t) = const. Полагая, кроме того, я, = 0, получаем из теоремы 46.2 следующее предложение. Теорема 46.3. Будем рассматривать управляемый объект (40.1), (40.2), (40.5), в котором области управления не зависят от χ (см. (42.1)) и компактны, а множество Vt(x) всех точек вида ft(x,u), u^Ut, является для любого х^Еп выпуклым. Предположим, далее, что функции Ц{х, и) непрерывны по паре переменных х, и и непрерывно дифференцируемы по х, а множества Мь * = 0, 1, ..., Ν, задаются соотношениями (4.6.19), (46.-20). Пусть (40.3), (40.4) — некоторый процесс в рассматриваемом объекте, удовлетворяющий ограничениям χ (t) е Ми t = 0, 1, ..., N. Для оптимальности этого процесса (в смысле минимума функционала (40.5) при наличии ограничений χ (t) s Mt) необходимо существование такого числа ψ0^0 и таких векторов *(0 = {*ι(0. -μ *я(0). *=1, .... Ν; μ(0-{Μ0 μΓ,ίΟ}. < = 0, 1, .... Ν; v(0»{vi(f). .... vPt(t)}, ί = 0, 1, ..., Ν, что выполнены следующие условия (функция Ht(x, и) определяется формулой (42.2)): (A) если ψ0 = 0, то хотя бы для одного ί хотя бы один из векторов ψ(ί), μ(/), ν(/) отличен от нуля\ (B) П> (t) = grad, Ht+l (x (t); и (t + 1)) + + Σ M<)gradlPf(*(0) + Σ vM)gvad w[(x{t)l t =0,1, · · ·, N> где принято ψ(0)=0, #ν+1ξ==0; (C) Ht{x(t-l), u(t))=maxHt(x(t-l)fu), f = l, ..., Ν; u<=Ut (D) v;(i)<0, vJ(t)w[(x{t)) = 0 для всех / = 1, ..., Pi; * = 0, 1 N. Замечание 46.4. Предположим, что все векторы grdLaW\{x{t)), grad w\(x(t)) отличны от нуля, и обозначим через L\ гиперплоскость (*-* (0) grad 1И(* (/)) = <>,
422 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [4в а через Qt — полупространство (* —*(*))grado>{ (*(*)) <0. Пусть, далее, для каждого ί = 0, ..., N система выпуклых конусов Lu Ql, Pf\ * = 1, ·.·, /V. Λ = 1, ..., /у j <= Jt(x(t))y (46.21) не обладает в пространстве Еп свойством отделимости. Тогда условие (А) в теореме 46.2 может быть заменено следующим: (А') если ψ0 = 0, то хотя бы для одного t хотя бы один из векторов ψ(ί) отличен от нуля. В самом деле, допустим, что выбраны число ψ0 и векторы ψ(ί), μ(ί), x(t), b(t\ удовлетворяющие условиям теоремы 46.2, и предположим, что при этом все числа ψ0, ψα(0 (α== 1, ..., п\ f=l, ..., Ν) равны нулю. Тогда в силу условия (А) хотя бы один из векторов μ(ί), ν(ί), 6(/} хотя бы для одного t отличен от нуля. В силу условия (В) получаем для этого t: rt pf nt - Σ μ, (t) gr ad W\ (x (t)) -Σν. (0 grad w\ (x (/)) + Σ &</> = 0 (причем не все векторы в левой части равны нулю), а это в силу теоремы 32.2 противоречит тому, что система выпуклых конусов (46.21) не обладает в Еп свойством отделимости. Замечание 46.5. Если рассматривается основная задача, т. е. М0 состоит лишь из одной точки, а множества Ми ..., ΜΝ совпадают со всем пространством Еп, то в теореме 46.3 соотношение (В) при / = 0 станет ненужным (см. сноску на стр. 403), а при t — 1 N в соотношении (В) будут отсутствовать функции W\ и ш\. Иначе говоря, в случае основной задачи выписанные выше соотношения (В) и (С) в точности превратятся в соотношения (10.10), (10.12), (10.13). Таким образом, теорема 46.3 (при отсутствии фазовых ограничений) превращается в дискретный принцип максимума, рассмотренный в п. 10. Следует при этом отметить, что в теоремах 46.1—46.3 наложено дополнительное требование о выпуклости множеств Vt(x). Без этого дополнительного требования дискретный принцип максимума, сформулированный в п. 10, неверен —мы это видели в примере 10.3. Таким образом, содержащиеся в этом параграфе результаты представляют собой корректно доказанную (и притом значительно более общую) версию дискретного принципа максимума, сформулированного в п. 10 в виде гипотезы.
46] § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 423 Нижеследующая теорема показывает, каким образом можно выбрать локальные сечения в случае, если область управления Ut(x) определяется с помощью системы равенств и неравенств. Теорема 46.6. Будем рассматривать управляемый объект (40.1), (40.2), в котором область управления Ut(x) определяется соотношениями (45.1), (45.2), и пусть (40.3)," (40.4) — некоторый процесс в этом объекте. Обозначим через It(x{t — 1), u(t)) множество всех тех чисел /=1, ..., qt9 для которых выполнено равенство g\(x{t — 1), u(t)) = 0. Если функции G[9 g\ являются гладкими, а система векторов gradBG{(*(f-l), и(*)), /=1, ..., К %r?iaug\(x(t-\)%u(t))% ie=It(x(t-l)9u(t))9 линейно независима, то в рассматриваемом объекте существует локальное сечение %ti соответствующее значениям t9 x(t — 1), u(t): %t(x(t-l)) = u(t)9 It West/, (χ). Доказательство. Обозначим через lt число элементов множества It(x(t— 1), u(t)) и рассмотрим функциональную матрицу /ag{(*(f-i),tt(fl) dQl{x(t-\)9u(t)) I ди1 " ' . диг I dg\(x(t-\)yu(t)) 0g| (*(*-!), и(0) \ да' '" диг / = 1 Η izElt(x(t-l)9u{t))9 имеющую kt + U строк. Так как векторы (46.22) (т. е. строки этой матрицы) линейно независимы, то эта матрица имеет ранг kf + If. Следовательно, система соотношений G/(*,a) = 0, /=1, ..., kt\ g*(x,u) = 09 ί €=/,(*(<-1), α (<)), (46.23) разрешима в окрестности точек x(t— 1), u(t) относительно некоторых kt + lt из переменных и\ ..., иг. Без ограничения общности можно предполагать, что система соотношений (46.23) разрешима относительно первых m переменных и\ ..., ит9 где m = kt + lt. Иначе говоря, существуют такие гладкие функции <р*(х1, ..., хп9 ит+\ ..., иг)9 а = 1, ..., т, определенные в некоторых окрестностях точек x(t— 1), u(t), что φ?(χ!('-1λ ···. *я('-1). "m+,W> ..., «rW)-ttaW. (46,24) a=l, ..., m, (46.22)
424 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [46 и при этом подстановка «« = φ«(χ» χ», ит+\ .... иг), а = 1 т, (46.25) обращает соотношения (46.23) в тождества по л:1 хп, um+i W. Положим: Х?(*) = Ф?(*',··., *в;ит+,(0 "г(0). а = 1 т, X*(x) = uHt), β = /η+1 г. Мы получаем, таким образом, гладкую функцию %t(х) = (X)(*), ···,%?(х), Х?+1 (х) '%(*)).. определенную в некоторой окрестности точки x(t — 1). В силу (46.24) имеем χ, (л: (t — 1)) = и (<). Далее, так как подстановка (46.25) обращает соотношения (46.23) в тождества, то Gi(*,*(*))"-0; / = 1 kt; g} (x, Xt (χ)) ^ 0, is It (x(t-l),u (0). Наконец, при t ^/,(.*:(< — 1), u(t)) имеем gi(x(t-l),%t(x(l-l)))=git(x(t-l),u(t))<0, и потому (уменьшив, если нужно, ту окрестность точки x(t — 1), в которой определена функция %t(x)) можно считать, что #! (*ι 5Ь (*)) < 0 ПРИ ' ΦΙΑχ#— 0» «(0) во вс^й области определения функции %t{x). Таким образом, θί(*·Χί(*)) = 0, /=l, ..., А,; £{(*.ЗЬ(*))<0, * = 1, ..., qu в области определения функции %t(x), т. е. χ^(а;) е С/Дх). Теорема 46.7 (принцип максимума). Будем рас· сматривать управляемый объект (40.1), (40.2), (40.5), в котором область управления Ut(x) определяется соотношениями (45.1), (45.2) и является компактной, а множество Vt{x) всех точек вида ft{x, и), и е Ut(x), является для любого х^Еп выпуклым. Обозначим через It(x, и) множество всех чисел i = l, ..., qt, для которых имеет место равенство g\(x, u) = 0, и предположим, что при u^l Ut (x) векторы gradttG{{x, и), /=1, ..., kt\ grad„g*(*, u), i<=It{x,u), (46.26) линейно независимы. Предположим, далее, что множества Mif t = 0, 1, ..., Ν, имеют такой же вид, как и в теореме.46.2*
46J § 12. НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 425 причем все функции flt> W\, w\ являются гладкими. Пусть (40.3), (40.4) — некоторый процесс в рассматриваемом объекте, удовлетворяющий фазовым ограничениям x(t) е Ми ί = 0, 1, ..., Ν, и пусть Р{Р ■— шатер множества П*£) в точке χ (t). Для оптимальности этого процесса (в смысле минимума функционала (40.5) при наличии ограничений χ (t) e Mt) необходимо существование такого числа ψ0^0, таких векторов *(*) = {*ι(<). ···. ЪпШ '=1. ···. Ν\ μ(ή={μ{(ή, ..., μΓί(*)}, *«0, 1, ..., iV; v(0-{viW, .... vP/(*)}, <-0, 1 N\ b{t\ i=l, .>., nt\ / = 0, 1, ..., tf, u такой гУ^п-матрицы A(t), t=l, ...., N, что направление вектора Ь\1) принадлежит (в пространстве Еп) двойственному конусу D (Р{Р) и выполнены следующие условия (функция Ht (x, и) определяется формулой (42.2)): (A) если ψο —Q, то хотя бы для одного t хотя бы один из векторов ψ(ί), μ(ί), v(t), Ь{Р отличен от нуля; (B) П> (0 - grad, Нш (х (f), u{t+l)) + + (вга<1вЯж(х(0.в(*+1)))А(*+1) + rt / ' *t nt + Σμ/ (0 grad W[ (χ (ή) + 2 v. (t) grad w[ (x (t)) - 2 &</>, * = 0, 1 tf, где принято ψ(0) = 0, Я^+1=0; (C) #*(*(*-1), и(f)) = max Ht(x(t- 1), α), < = 1, ..., ΛΤ; (D) vy(0<0, v,(f)i0f(*(O) = O; / = 1, ...,p„ i=0# 1 ЛГ; (E) grad,i{(x(i-l),a(0) + (grade^(x(i--l)ia(0)A(/)-0 (Зля гел: /, <Элл которых gfait— 1), u(/))=0 (ί = 1, ..., Λ0'> (F) grad, Ci(x(i-l),a(i)) +(grade Ci(*(i-1), и (ί)))Α(ί)=0, Доказательство. Так как при u^Ut(x) система векторов (42.26) линейно независима, то отсюда нетрудно заключить, что множество Ut(x) непрерывно зависит от х. Кроме того, из теоремы 46.6 следует, что в рассматриваемом объекте существуют локальные сечения. Выберем для каждого *= 1, ..., JV локальное сечение %t, соответствующее значениям /, x(t— 1), u(t). Следовательно, применима теорема 46.2. Введем
426 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [46 обозначение *^-*|№ (46.27, ί=1, ...,г; /==1 п\ t = l,...,N, и гХ/г-матрицу (λ/(ί)) обозначим через Л(/). Тогда согласно теореме 46.2 существуют такое число ψ0^0 и такие векторы *(*) = {*!(0. ···> *л№ '-1 Μ μ(ί) = {μι(0. ···> μτ,ίΟ}, ' = 0, 1 Ν; v(0={v,W, ..., vP/(f)}, ί-0, 1, ..., iV; 6(Д /-ι щ\ *=о, ι,.... iv, что направление вектора 6(/J принадлежит (в пространстве Еп) конусу D{P{i]) и выполнены условия (А), (В), (С), (D) теоремы 46.2. Отсюда, учитывая (46.27), получаем условия (А), (В), (С), (D) теоремы 46.7. Далее, так как %t(x) <= Ut(χ), то glt(x, χ,(#))<0 при всех /==1, ..., qt. Кроме того, ίίΗ'-1). Xt(x(t-D))^8i(x(t-l)9 n(f))«0 при ί ε It (χ (t — 1), u (t)). Следовательно, при i е /Да: (ί — 1), α (/)) функция glt(x, %t{x)) достигает в точке x = x(t — 1) максимума, и потому (см. (46.27)) TJ8t(x'*W) !*=*(*-П ^7 + г + 2j 5^5 λ> w=0' / = 1, .... л; /е=/,(*(*-1), α(0); <=1, ...,#■ Это дает условие (Е) теоремы 46.7. Наконец, так как %t(x) е ί/Дх), то G£(a;, χ, (*))==() для всех /= 1, ..., 6Л и потому djG\{x,%t{x)) дх> dG{(x(t-l),u(t)) l*=xU-l) ^*' + 1 i7 λ, (0=о, Это дает условие (F) теоремы 46.7,
47) § 13. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 427 §13. Достаточные условия оптимальности 47. Объекты с постоянной областью управления. Для получения достаточных условий оптимальности мы применим результаты п. 37. В связи с этим на управляемый объект здесь будут наложены некоторые ограничения, соответствующие требованиям, указанным в п. 37. Прежде всего отметим, что множество Ω' определяется в теореме 37.7 линейными уравнениями. Поэтому мы здесь ограничимся рассмотрением дискретных управляемых объектов, линейных по χ и и. Иными словами, уравнения (40,1) теперь примут следующий вид: Xi(t) = c[(t)x*(t-l)+ ... + c*n{t)x*{t-l) + d\(t)ul(t) + ··· ... +d[{t)ur(ί) + βι(ί), / = 1, ...,λ, ί = 1, ...,ΛΛ (47.1) Далее, условие (37.1), наложенное в п. 37 на функцию F°(z), теперь принимает такой вид (ςρ. (37.2)): /J(*.M)>f?(x(i-l)fa(0) + (x-x(i-l))Brad,/J(x(i-l)fa(0) + + (u-u(t))gr*duf»(x{t-l)9 u(t))t f=lf ..., N. (47.2) В частности, условие (47.2) будет выполнено, если для каждого / = 1, ..., N функция /°(я, и) является выпуклой (в пространстве всех переменных х\ ..., хп, и\ ..., иг). Заметим, что условие (47.2) сформулировано применительно к задаче о минимуме функционала (40.5). В случае задачи о максимуме этого функционала знак неравенства в условии (47.2) заменяется на противоположный (в частности, это условие будет выполнено, если функции f°t(x, и), /== 1, ..., N, являются вогнутыми). Впрочем, задачу о максимуме функционала / (см. (40.5)) всегда можно заменить задачей о минимуме функционала —/. Условия, которые мы будем накладывать на множества Ut (t= 1, ..., Ν) и Λίτ (τ = 0, 1, ..., Ν), аналогичны условиям (б), (в), (г) в п. 37 (стр. 333 — 334); они будут включены в формулировки теорем. Теорема 47.1. Пусть (40.3), (40.4) — некоторый процесс в дискретном управляемом объекте (47.1), (42.1), причем выполнены включения x(t)^Mt, t = 0, 1, ..., N. Пусть, далее, для каждого t = 1, ..., N множество Ut имеет вид Ut = Q{?[\ ... ilQ^nS^il ... nsjm<>. а множество Мх для каждого τ=0, 1, ..., N имеет вид Λίτ = Π(τ"η ... ПП^п^'л ··· ИЧ
428 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ f47 где Ω(Α 3(/* — некоторые множества пространства переменных и\ ..., ιί, α Πτ0, Στ} — некоторые множества пространства переменных х\ ..., хп. Пусть, наконец, К\ —шатер множества ζίψ в точке u(t)\ L{tl) — шатер множества Ξ\ι) в точке и(t); Ρψ — шатер множества Π(τΛ в точке χ (τ), a Q^ — шатер множества Σψ в-точке χ(τ). Будем предполагать, что выполнены включения afcKf, a'/'cz/A ηψ<=ρψ, &<=(№ (для всех i, j, t, τ). Наконец, предположим, что функции f°t(x, u)t входящие в определение функционала (40.5), удовлетворяют условию (47.2) (в частности, это условие выполнено, если функции f°t(x, и) выпуклы}. Для оптимальности процесса (40.3), (40.4) (в смысле минимума функционала (40.5) при наличии ограничений χ (t) е Ми t = 0, 1, ..., Ν) достаточно существование такого числа ψ0<0 и таких векторов +(0-{*ι(0 *я(0}, ' = 1, ..., Μ af}\ i = \, ..., lt\ < = 1, ..., Ν; 6(Λ /=1, ..., ητ\ τ = 0, 1, ..., Ν, что направление вектора αψ принадлежит двойственному конусу ΰ(Κ{Ρ)> направление вектора Ь{Р принадлежит двойственному конусу D(P{P) и выполнены следующие условия (А), (В), в формулировке которых участвует функция Ht(x, и), определенная равенством Ht (х, и) = *J°t (χ, и) + Σ ψ (/) (Σ с£ (t) х- + Σ d'a (t) «e + e' (t)\ (A) для любого t = 0, 1, ..., N и любого вектора Ьх, направление которого принадлежит пересечению конусов QW (/=1, ..., st), справедливо неравенство ■ * (0 + grad* нш (χ (о, и (t +ι» - g ύη ьх < о, где принято -ψ (0) == 0, #N+1===0; (B) для любого t= 1, ..., N и любого вектора Ьи, направление которого принадлежит пересечению конусов ь\1) (ί= 1,..., mt)> справедливо неравенство ! grad„ Ht {x (t - 1), и (t)) - Σ a(p) &« < 0.
47] § 13. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 429 Доказательство. Замена (42.6) приводит рассматриваемую задачу оптимального управления к задаче о минимуме функции на множестве Σ*, которое определяется системой равенств F\(z) = -x\ + c\(t)x\_x+ ... + с*пМх*_г+а[№\ + ... ... + Wi + *'(0 = 0 (47.3) и системой включений ut€=Ut, χχ<=Μχ9 t=lt...,N; τ = 0, 1, ..., Ν. Для решения этой задачи о минимуме функции F°(z) на множестве Σ* непосредственно применима теорема 37.7 (в которой надо положить г = 0, p = q = 0) и замечание 37.8. Условие (β) теоремы 37.7 принимает в данном случае вид iUgrad F°(z0) + Σ Stfgrad Fay(z0))bxt + r=0 \ τ ct=i y=\ ι / + Σ U grad F° (z0) + Σ Σ tf grad /* (z0)) Ьих - Ν ιχ Ν nt -Σ Σ<»δ«Τ-2 Σνρίχ^ο для любого вектора δ* = {δ#*, δατ}, обладающего тем свойством, что направление вектора bxt принадлежит пересечению конусов Q{}\ ..., Q|s^ (* = 0, 1, ..., Ν) и направление вектора Ьих принадлежит пересечению конусов Lxl\ ..., Lxm^ (τ = 1, ..., Ν)\ здесь через ζ0 обозначена точка, соответствующая рассматриваемому процессу (40.3), (40.4) в силу замены (42.6). Пусть bz = {bxt, Ьих) — произвольный вектор, удовлетворяющий указанным условиям, т. е. обладающий тем свойством, чгго направление вектора bxt принадлежит пересечению конусов Q\l\ ..., Q\SA (/ = 0, 1, ..., Ν)Ι и направление вектора Ьих принадлежит пересечению конусов L{x\ ..., Lxm^ (τ = 1, ..., Ν). Тогда Ьг можно- представить в виде Ν η ^^Σ^ + Σ^Κ где вектор δ*Μ имеет ту же составляющую 6дсе, что и вектор bz, а остальные составляющие δ*,, Ьих у вектора Ьг^ равны нулю,
430 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [47 и, аналогично, вектор Ьг(£] имеет ту же составляющую δ#θ, что и вектор Ьг, а остальные составляющие bxt, Ьих у вектора Ьг^ равны нулю. Если мы докажем, что для каждого вектора bzf\ bz{f (/ = 0, 1, ..., Ν; τ=1, ..., Ν) выполнено выписанное выше условие (β), то, суммируя, убедимся, что и для вектора Ьг это условие выполнено, и этим доказательство будет завершено. Но легко видеть (учитывая вид функций F0 и F*)» чт0 Для вектора Щх) условие (β) совпадает с условием (А) теоремы 47.1 (надо лишь применить замену (42.6) и положите i|>j = i|>j(f)). Таким образом, при выполнении условия (А) теоремы 47.1 вектор Ьг{р удовлетворяет условию (β).. Аналогично, для вектора Ьг^ условие (β) совпадает с условием (В) теоремы 47.1. Замечание 47.2. Обозначим через К$ множество всех точек ζ = (χ\, uty, удовлетворяющих условию иее/$>; аналогично, определим множества Lq\ Pq\ <ЗеЛ включениями uQ<=L{j\ χΒ^Ρψ, Xq^Q^. Наконец, через Rlt обозначим гиперплоскость (пространства Е* всех переменных х\, «0, определяемую уравнением Ft = 0 (см. (47.3)). Если система-выпуклых конусов Κΐ, W, Ρψ, Щ\ #Й° (47.4) {для всех i, t) не обладает в пространстве Е* свойством отделимости, то условия, указанные в теореме 47.1, являются не- обходимыми и достаточными для оптимальности процесса (40.3), (40.4). Это непосредственно вытекает из теоремы 37.7. Однако требование о том, что система конусов (47.3) не обладает свойством отделимости, трудно проверяемо. Без выполнения же этого требования достаточное условие, указанное в теореме 47.1, не является необходимым; близкое необходимое условие содержится в теореме 43.5. Считая в теореме 47.1, что некоторые из множеств Ω/' являются гиперплоскостями, некоторые выпуклы (и в качестве К\1) берется их опорный конус), а некоторые определены выпуклыми ограничениями (ср. условия (б')> (б"), (б7") на стр. 336 — 337) и то же самое справедливо относительно множеств а(Д Πχ*, Σψ, мы сможем из теоремы 47.1 получить ряд различных теорем. Сформулируем одну из них, получающуюся, если множества Пт* определены линейными уравнениями и выпуклыми ограничениями, множества Ut выпуклы, а множества Σ* отсутствуют.
47) § 13. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 431 Теорема 47.3. Пусть (40.3), (40.4) — некоторый процесс в дискретном управляемом объекте (47.1), (42.1), причем выполнены включения x{t)^Mti t=0, 1, ..., N. Пусть, далее, для каждого τ = 1, ..., N множество ί/τ выпукло, а множество Mt для каждого t = 0, 1, ..., N определяется системой соотношений W\{x\ ..., хп) = 0, /=1, .... /у, (47.5) w{(xl хп)<0, /=1, ..., Ρν (47.6) где W\ — непостоянные аффинные функции, a w\ — гладкие выпуклые функции. Предположим, наконец, что функции f^(x, и), входящие в определение функционала (40.5), выпуклы. ' Для оптимальности процесса (40.3), (40.4) (в смысле минимума функционала (40.5) при наличии ограничений x(t)^Mti t = 0, 1, ..., Ν) достаточно существование такого числа ψ0<0 и таких векторов +(0 = {*iW. .... *Я(0}. ί = ι. ..., Ъ μ{0 = {μι(0, .... Μ*)). ί=0' ^ ·"· ^ ν(0-{νι(ί). ..., v„(f)}, f = 0, 1, ..., Ν, что все числа Vi(t) неположительны и выполнены следующие условия (функция Ht(x, и) та же, что и в теореме 47.1): (A) *овга<1,Я,+1 (*(*), a(f+l))- + W + rt vt + Σ μ, (t) gra d W\ (x (/)) + Σ ν, (f) grad w{ (* (f)) = 0, i = 0, 1, ..., N, где принято ψ(0) = 0, ΗΝ+ι=0\ (B) для любого t = \, ..., N и любого вектора 6и, направление которого принадлежит опорному конусу множества Ut в точке u(t), справедливо неравенство δα grad, Я,(* ('-О. «С))<0; (C) να(ί)<(^(<)) = 0, α—1, ..., pt\ f = 0, 1, ..., tf. Доказательство. Примем каждую из гиперплоскостей (47.5) и каждое множество, определяемое одним из ограничений (47.6), за множества Т$\ участвующие в теореме 47.1. Далее, для каждого множества U[i] (они все выпуклы) примем за Р[1) опорный конус множества Л(Р в точке x(f). Таким образом, если ϊΐ\ι) — одна из гиперплоскостей (47.5), то вектор Ъ{{\
432 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [47 направление которого принадлежит конусу θ(Ρ{Ρ), имеет вид ~ μ* (0 grad W\ [χ (t)), где μ. (t) — скаляр. Далее, если множество П(/} определено одним из ограничений (47.6), причем w[ (χ(/)) = 0, то вектор Ь{р имеет вид — v^Ograd w\{x(t)), где v.(t)^0. Наконец, если w[(x{t)) < 0, то ΰ(Ρψ) есть точка, и потому 6(/> = 0, т. е. &(/) = — vy(/)gradw\(x(t)\ где v.(t) = 0. Остается применить теорему 47.1. Нижеследующий частный случай теоремы 47.1, относящийся к основной задаче (т. е. задаче с фиксированным начальным состоянием д;(0) = л:0 и без фазовых ограничений) интересен тем, что он дает необходимое и достаточное условие оптимальности. Теорема 47.4. Пусть (40.3), (40.4) — некоторый процесс с начальным состоянием χ (0) = х0 в дискретном управляемом объекте (47.1), (42.1). Пусть, далее, для каждого /=1, . ·> N множество Ut выпукло. Предположим, что функции f°t(x, и), входящие в определение функционала (40.5), удовлетворяют условию (47.2) (в частности, это условие выполнено, если функции f°t(x, и) выпуклы). Для оптимальности процесса (40.3), (40.4) (в смысле минимума функционала (40.5) при фиксированном начальном состоянии л:(0) = л;о и отсутствии ограничений на состояния x(t), / = 1, ..., Ν) необходимо и достаточно существование такого числа ψ0 < 0 и таких векторов * (ο={*ι ω. -ν *i»w>. <=i аг, что выполнены следующие условия (функция Ht(x, и) та же что и в теореме 47.1): (A) +(0 = вгаажЯж(*Ю, u(t+l)), /=1, ..., Ν, где принято Ялг+1^0; (B) для любого /=1, ..., N и любого вектора Ьи, направление которого принадлежит опорному конусу Lt множества U в точке u(t), справедливо неравенство 6iigrade Я,(*(<-!). "(0X0. Доказательство. Достаточность сформулированных условий непосредственно вытекает из теоремы 47.1. Для доказательства-необходимости согласно'замечанию 47.2 нужно лишь установить, что система выпуклых конусов U, R\ (47.7) не обладает в пространстве Е* переменных х\, и[ (/= 1, ..., η j = 1, .. t)r; ^ = 0, 1, .. .,ΛΓ;τ = 1, ..., Λ?) свойством отделимости,
47] § 13. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ . 433 Обозначим через De (θ = 1, ..., Ν) множество всех точек z = {xt9 их) пространства £*, удовлетворяющих условиям xt = x(t) при всех * = 1, ..., W, их = и(х) при τΦΘ (uQ — произвольно). Далее, через Dq обозначим множество всех точек z=(xti их\ удовлетворяющих условию Uq=u(Q) (xt и их при τ Φ θ произвольны). Тогда Dq(]Dq есть точка z0 (соответствующая рассматриваемому процессу (40.3), (40.4) при замене (42.6)). Принимая z0 за нулевую точку пространства £*, найдем, что Dq и Дэ являются подпространствами векторного пространства £"*, причем £* = Ζ)θ0Ζ)θ· Заметим еще, что Lt^DDt (t=l9 ..., АО. Нетрудно видеть, что система подпространств R*u Du ί = 1, ..., η; ί = 1 Ν, (47.8) не обладает в Е* свойством отделимости. Действительно, гиперплоскость Rt определяется уравнением Ft(z) = 0 (см. (47.3)), а подпространство D) имеет вид Dt = D\() ... (]Du где гиперплоскость D\ определяется уравнением α{ = α'(0. (47.9) Занумеруем теперь все переменные х\, их в следующем порядке: Ир . . ., W|, ί*2> · · · > **2' # * #» JV* · · ·» ΛΓ* yl γίΐ γ\ ' γΐΐ γ\ γΐΐ -ν j, . . ., л, ^, л^, · · ·, ^2 > ···» "^Ν* ***> TV. Тогда матрица, составленная из коэффициентов при неизвестных в соотношениях (47.9), (47.3), будет треугольной, причем вдоль главной диагонали стоят числа ± 1. Следовательно, определитель этой матрицы отличен от нуля, и потому система гиперплоскостей R\, D\ не обладает в Е* сврйством отделимости. Но тогдз и система подпространств (47.8) не обладает в Е* свойством отделимости. Тем более не обладает свойством отделимости система конусов (47.7) (поскольку LtZD Z)*). Замечание 47.5. Легко видеть, что условие (В) теоремы 47.4 может быть записано в следующей эквивалентной форме: (В') Ht(x(t—l)t u(t)) = maxHt{x(t—l), u)t ί=1,...,ΛΛ В самом деле, так как -ф0 < 0, то в силу (47.2) функция Ht(x(t — 1), и) обладает следующим свойством: Ht(x{t-\), u)^Ht(x(t- l), u(t)) + + (tt-«(0)grad^(x(i-l)lii(i)).
434 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [47 Согласно условию (В) теоремы 47.4 отсюда следует, что функция Ht(x(t— 1), и) переменного и, рассматриваемая на опорном конусе Lt множества Uu достигает в точке u=u(t) максимума. Тем более эта функция, рассматриваемая на множестве Ut(z:Lf9 достигает в точке u = u(t) максимума, т. е. выполнено условие (В'). Обратно, из условия (В7) очевидным образом вытекает (В). Замечание 47.6. Теорема 47.4 может быть также получена как следствие теоремы 38.2. В самом деле, замена (42.6) сводит рассматриваемую задачу оптимального управления к задаче о минимуме функции F°(2), рассматриваемой на множестве Σ, которое определяется линейными уравнениями Flt(z)=0 (см. (47.3)) и включениями,*^ е Uu причем множества Ut выпуклы. Применяя теорему 38.2 (что допустимо, поскольку система конусов (47.7) не обладает в Ё* свойством отделимости), приходим к следующему утверждению. Для того чтобы функция F°{z), рассматриваемая на множестве Σ, достигала минимума в точке z0i необходимо и достаточно существование таких чисел ψ0<0 и ψ|(/= 1, ..., η; /—1, ..., Ν), что функция н (ζ) = ν* (ζ) ,+ ΣΣ W\ (*). (47 · ι ο) рассматриваемая при любых xt и при щ е Uu достигает максимума в точке z0. Если функция (47.10) достигает максимума в точке г0, то grad^#(z0) = 0 (это дает условие (А) теоремы 47.4) и справедливо условие (В'). .Обратно, если выполнены условия (А) и (В) теоремы 47.4, то аффинная функция D(z)*-%(z-zJgradF*(z)+% Σ ^Ψ\{ζ\= - % Σ (*,_, -x(i- \))gr*dx f°(x (t - 1), и (0) + t—i + *og(«t-"(0)grade/»(*(<-J),«(/)) + + Σ i*iW-2j StjflW не зависит (в силу условия (А)) от переменных х\ и потому (в силу условия (В)) при щ е Ut достигает максимума (рав-
47J § 13. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 435 ного нулю) в точке z0. Но так как согласно (47.2) H(z)^H(z0) + D(z), то Я {ζ) < Я (г0), т.е. функция (47.10) достигает максимума в точке 20. В заключение остановимся еще на случае, когда уравнения (40.1), определяющие дискретный управляемый объект, являются не линейными, но выпуклыми. Теорема 47.7. Пусть (40.3), (40.4) — некоторый процесс в дискретном управляемом объекте (40.1), (42.1), причем выполнены включения χ (t) e Mu t = 0, 1, ..., N. Предположим, что все функции f\(x, tl) (входящие в правые части соотношений (40.1)) выпуклы по совокупности переменных х\ ..., хп, и\ ..., иг. Пусть, далее, множества Ut и Мх имеют тот же вид, что и в теореме 47.1, а функции f°t(x, и) удовлетворяют условию (47.2) (в частности, это условие выполнено, если функции f°t(x,u) выпуклы). Для оптимальности процесса (40.3), (40.4) (в смысле минимума функционала (40.5) при наличии ограничений x(t)^Mt, t = 0, 1, ..., Ν) достаточно существования такого числа ψ0<0 и таких векторов + (0-{*ι(0. ···> *я(0>. '-1. ···. Ν, а?\ ί-1, ..., /,; f-1, ..., Ν; »</>, /=1, ..., ητ; τ-0, 1, ..., #, ^7Ό направление вектора αψ принадлежит двойственному конусу D(K{P), направление вектора &!/> принадлежит двойственному конусу D(PU)) и выполнены'следующие условия (функция Ht(x,u) определяется формулой (42.2)): (А) для любого t = 0, 1, ..., N и любого вектора Ьх, направление которого принадлежит пересечению конусов Q^, справедливо неравенство ί=1 * / -4>(0 + grad*tfi+1(*(0, u(t+ 1))- Σ *№*«>, где принято -ψ (0) == 0, Я^+1^0; (B) для любого t= 1, ..., Νμ, любого вектора Ьи = {6и\ ...,δί/}, направление которого принадлежит пересечению конусов L<')(i=l, ..., mt), справедливо неравенство [gT2LdttHt [x(t-\)>u (0) - Σ α\ηЬи < 0; (C) ψι(0<0, ί = 1, ..., /ι; ί=1, ..., tf.
436 гл· ν· КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [47 Доказательство. Обозначим через W\ множество всех точек £ = (#/, их), удовлетворяющих условию iFit(z)=fi(xt_l,ut)-xit^0. Так как f\ — выпуклая функция, то множество W\ является выпуклым. Если z0 — точка, соответствующая процессу (40.3), (40.4) в силу замены (42.6), то точка z0 лежит на границе множества W\ (ср. (40.1)) и опорным конусом выпуклого множества W\ в точке z0 служит полупространство (z-z0)grad2F<(20)<0. В силу замены (42.6) задача сводится к отысканию минимума функции F°(z) на множестве, определяемом системой включений z^W\, ut^Ut, χχ^Μχ, i—l, ·.., η; t=l, ..., Ν; τ = 0, 1, ..., Ν. Для решения этой задачи применима теорема 37.5 и замечание 37.6. Условие (β) теоремы 37.5 принимает в данном случае такой вид: Σ (Ψο grad* F° (z0)) Ьъ + 2 (ψ0 gradM/°(z0)) bux - N lt N "t Ν η -Σ ΣαΦ*ι*χ-Σ Σ&Ρ4-Σ Srf>6*<o для любого вектора Ъг = {Ъхи Ьи^у обладающего тем свойством, что направление вчектора bxt принадлежит пересечению конусов Q$\ ..., Q^^ (t = 0, 1, ..., Ν), а направление вектора Ьих принадлежит пересечению конусов 1{1Х\ ..., Lxm^(x=lt . ..t N). Здесь α*/* —вектор, направление которого принадлежит двойственному конусу 0(Κ{/]); Далее щ) _ вектор, направление которого принадлежит двойственному конусу D {Ρψ)\ наконец, ^ — вектор, направление которого принадлежит конусу, двойственному к полупространству (z-z0)grad/<(z0)<0, т. е. ^ = -*^Ograd^(Zo)>
48J § 13. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 437 где,ψ*(ί)^0. Теперь доказательство завершается так же, как и в случае теоремы 47.1. 48. Объекты с переменной областью управления. Мы будем здесь рассматривать объекты-(47.1), (40.2), у которых область управления Ut(x) при каждом х = {х\ ..., хп)<==:Еп задается системой равенств и неравенств (45.1), (45.2), причем функции G/ будем предполагать аффинными, а функции g\ — выпуклыми. Относительно функций f°t и множеств Mt сохраним те же предположения, что и в предыдущем пункте. В результате получаем следующую теорему: Теорема 48Л. Рассмотрим управляемый объект (47.1), (40.2), еде множество Ut(x) при каждом заданном х = = (х1, ..., хп)^Еп определяется системой соотношений (45.1), (45.2), причем функции G\ аффинны, а функции g\ выпуклы. Пубть (40.3), (40.4) — некоторый процесс в рассматриваемом объекте, причем выполнены включения χ{ί)ΕΞΜύ, t = 0, 1, ..., Ν, где Μτ — множество пространства Еп переменных х\ ..., хп, имеющее вид Μτ=π(τ°η ... ππ^πς^π ... πς(4 Предположим, что для каждого τ = 0, 1, ..., N заданы в Еп выпуклые конусы Р^\ QW (/=1, ..., пх\ /— 1, ..., sx) с вершиной л; (τ), являющиеся шатрами соответственно множеств Щ\ Σψ, причем выполнены включения Наконец, предположим, что функции f°t(x, и), входящие в определение функционала (40.5), удовлетворяют условию (47.2) (в частности, это условие выполнено, если функции f^(x,u) выпуклы). Для оптимальности процесса (40.3), (40.4), в смысле минимума функционала (40.5) при наличии ограничений x(t)e=Mt, f~0, 1, ..., Ν, достаточно существование такого числа ψ0 < 0 и таких векторов *(0 = {*iW iM0>. <-l, ..., N\ <Ρ(*)~{φι(0. .... <P*,(0), t=l, ..., Ν; λ(ί)-{λ,(α ..., %qt{t)}, /-1, ..., Ν; Ь$\ ί=1, ..., nt; / = 0, 1, ..., Ν9
438 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [48 что направление вектора Ц1) принадлежит конусу D(PW) и выполнены следующие условия (А) — (С), в формулировке которых участвует функция Ht(x, и), определенная равенством + Σ Φ„ (0 G? (*,")+ Σ λα (0 gf (χ, и): (А) для любого t = 09 1, ..., Ν и любого вектора Ьх9 направление которого принадлежит пересечению конусов Q</>(/ss51, ... ..., st)9 справедливо неравенство !л(/)) - Ψ (0 + grad, Ht+l (χ (f), и (t + 1)) - 2 Ц» J Ьх < 0, где принято ^(O) = 0, HN+i =0; (B) graduHt(x(t-l)9 u(t)) = 0, /=1, ..., Ν; (C) λα(0<0, λα(0*?(*(/-1), a(f)) = 0, α«1, ...,?,; /=1 Ν. Доказательство. Замена (42.6) приводит рассматриваемую задачу оптимального управления к задаче о минимуме функции F°{z) (см. (42.3)) на множестве Σ\ которое определяется системой равенств (47.3), (45.1), системой ограничений (45.2) и системой включений xtEEMt(t = 09 1, ..., Λ0. Для решения этой задачи о минимуме' функции F°(z) на. множестве Σ* непосредственно применима теорема 37.7 и замечание (37.6). Условие (β) теоремы 37.7 принимает в данном случае вдо: Σ (*о grad*, F° (z0) + Σ Σ Ψα ёгасЦ /»(ζ)) bxt + *=0\ τ α=1 γ«1 τ γ / + Σ(ψο grad„t F> («о) + Σ Σ Ψΐ grad„x ^(ζ0)) 6«τ + + Σ Σ S<Pa(4grad G«(2o)) + /=0 γ=1 α=*=1 * +| Σ |^(4grad„^(*0))+Jo Σ Σ^(δ*,^/^0))+ + Σ2 21 λΙ(6ατ grad- βξ(ζα)) — S ΣΛ,«>
48] § 13. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ 439 для любого вектора bz = {bxt9 Ьих}9 обладающего тем свойством, что направление вектора bxt принадлежит пересечению конусов / (#>, ..., (#*> (*=0, 1, ..., Ν); здесь через ζ0 обозначена точка, соответствующая рассматриваемому процессу (40.3), (40.4) в силу замены (42.6). Заметим еще, что в выписанном условии суммирование по индексу β ведется по всем тем числам /= 1, ..., qy, для которых ёг((^0)==^; однако, полагая для всех остальных значений / число λ] равным нулю, можно считать, что суммирование по β ведется от 1 до qyi причем для всех β, γ. Теперь доказательство завершается так же, как и в случае теоремы 47.1. Замечание 48.2. Сравнивая доказанную теорему с теоремой 45.1, мы убеждаемся, что содержащиеся в теореме 48.1 достаточные условия оптимальности весьма близки к необходимым условиям. Для того чтобы определить ситуацию, в которой условия, указанные в теореме 48.1, являются необходимыми и достаточными, надо поступить так же, как в замечании 47.2. Именно, обозначим через Ρθ° множество всех точек г — = (*f> их)> удовлетворяющих включению χθ е Р$)и9 аналогично, определим Qq] включением xQ <= Qq\ Далее, через Rt обозначим множество всех точек 2 = (λ^, ufy, удовлетворяющих условию (*,-, - х (< - D) gradx g\ (x(t-l)9u (t)) + + (ut~u (t)) grad„ g\ (x(t-l)9u (t)) < 0. Наконец, через S*t и Τ} обозначим гиперплоскости, определяемые соответственно уравнениями (см. (45.1),(47.3)). Если система выпуклых конусов Ш\ Q\\ Ri Si. Τί (для всех i, t) не обладает в пространстве всех переменных х\, и{ QQouQTeoM отделимости, то условия, указанные в теореме 48,1,
440 ГЛ. V. КРИТЕРИИ ОПТИМАЛЬНОСТИ ДИСКРЕТНЫХ ПРОЦЕССОВ [48 являются необходимыми и достаточными для оптимальности процесса (40.3), (40.4). Это непосредственно вытекает из теоремы 37.7. Замечание 48.3. В теореме 48.1 можно предполагать, что некоторые из множеств П(тР являются гиперплоскостями, некоторые определены неравенствами типа ф<Р<о, где <р(£> — в ы π у к л а я функция, а некоторые множества Щр выпуклы и в качестве PW принимается соответствующий опорный конус. То же относится к множествам Σ^. В результате из теоремы 48.1 можно получить более общую теорему и рассмотреть ряд ее частных случаев. Мы здесь эти теоремы не приводим.
ИМЕННОЙ УКАЗАТЕЛЬ Беллман (Bellman R,) 5, 12, 58, 60, 64, 353, 364 Бутковский А. Г. 5, 76 Вань Чу-сен 5, 15, 70 Вейль Г. (Weyl H.) 7, 169 Вентцель Ε. С. 14 Габасов Р. 5, 8, 79 Гамкрелидзе Р. В. 57 Гиббс (Gibbs W.) 316, 317 Глезерман М. 294 Данскин (Danskin J. M.) 317 Дубовицкий А. Я. 6, 7, 259, 324, 326 Иордан (Jordan В. W.) 5, 79, 323 Кац (Katz S.) 70 Кириллова Φ. Μ. 5, 79 Красовский Η. Η. 5, 8 Куллум (Cullum С.) 79, 323 Кун (Kuhn Η. W.) 7 Кэннон (Cannon M.) 79, 323 Лагранж (Lagrange J. L.) 86, 310 Лефшец (Lefschetz S.) 6, 294 Ли (Lee E. S.) 5 Милютин A. A. 6, 7, 259, 324, 326 Мищенко Ε. Φ. β, 57 Моисеев Η. Η. 6, 16 Мукурдумов Р. М. 8 Петров Б. Н. 8 Пирсон (Pearson J.) 79 Полак (Polak Ε.) 5, 79, 323 Понтрягин Л. С. 5, 8, 57, 65, 78, 79, 294 Пропой А. И. 5, 79, 91, 401 Пшеничный Б. Н. 5, 6 Розоз Н. X. 8 Розоноэр Л. И. 5, 78 Таккер (Tucker A. W.) 7 Фам Хыу Шак 5, 8 Фан Лянь-цень 5, 15, 70 Халкин (Halkin H.) 5, 79, 421 Хинчин А. Я. 26 Хольтцман (Holtzman J. M.) 5, 79 Чанг (Chang S. S. L.) 5
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Аксиоматика элементарной геометрии' Г. Вейля 169 Аргумент дискретный 55 Ассоциативность сложения векторов 93 — умножения вектора на число 94 Базис векторного пространетва 102 — ортонормированный 128 — плоскости 14? Вектор 93, 135, 142 , — касательный многообразия 269 параметризованной кривой 276 — ковариантный 267 — направляющий луча 151 прямой 146 — нормальный гиперплоскости 173, 174 гиперповерхности 81, 268 — нулевой 93 —, ортогональный гиперплоскости 173, 185 —,— плоскости 169 —,— подпространству 130 —, параллельный гиперплоскости 166 — противоположный 94 — свободный 134 — связанный 134 Вектор-функция 262 Векторы базисные 180 — линейно зависимые 99 независимые 99 — ортогональные 127 Вершина выпуклого многогранника 211 — конуса 218 — симплекса 216 Внутренность выпуклого множества относительно его несущей плоскости 202 — множества 202 Время дискретное 19, 52 — непрерывное 52 Вычитание векторов 97, 99 Геометрия евклидова 133 Гиперплоскости параллельные 146, 184 — совпадающие 146, 184 Гиперплоскость 142, 161, 183, 269 — касательная гиперповерхности 268 — опорная 225 — отделяющая 236 Гиперповерхность 44, 142, 183 — гладкая 267 Гомоморфизм 114 — сопряженный 121 . Гомотетия 159 Градиент аффинной функции 172 174, 185 — линейного функционала 131 — функции 80, 174* 266 Граница выпуклого множества относительно его несущей плоскости 202 тела 202 — координатного параллелепипеда 292 — множества 176, 202 — цепи 293 Грань выпуклого многогранника 210 главная 207 — симплекса 216 главная 216 График функции 73, 352 Деформация непрерывная 298 Динамическое программирование 60, 353, 364 Дистрибутивность скалярного умножения векторов 124 — умножения вектора на число 94 Длина вектора 126
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 443 Дополнение множества 175 — ортогональное подпространства 130, 169 — прямое подпространства 111 Дробь непрерывная 25 — подходящая для непрерывной дроби 25 — цепная 25 Зависимость линейная векторов 99 — между точками 137 — непрерывная множества от точки 368 Задача изопериметрическая 30, 35 — максимизации нескольких функционалов 31 — математического программирования 44, 82, 305, 329, 345 — об извлечении вещества из раствора 15, 22, 28, 34 — об экстремуме функции 39, 48, 70, 82, 305, 329, 345 , сведение к задаче оптимального управления дискретным объектом 39, 63 — о максимуме произведения 9, 11, 40, 50, 61, 86, 360, 402 — о мясопоставках 12, 24, 32 — оптимального управления 20 дискретным объектом 19,42 , достаточные условия оптимальности 427 1 необходимые условия оптимальности 376, 404 основная 21, 70, 88, 363, 376 , сведение к задаче об экстремуме функции 32, 40, 70, 88, 373, 376, 379 , оптимального управления непрерывным объектом 50, 57 _, теорема существования оптимального управления 401 непрерывным объектом 50, 52, 54, 63 : 1 сведение к задаче оптимального управления дискретным объектом 54 — с закрепленным временем 58 — с закрепленными концами 21 — с закрепленным левым концом и свободным правым концом 21, 403 — с ограничениями на фазовые координаты 22, 369, 390, 404, 409 — с подвижными концами 21, 369 — транспортная 17 Закон движения управляемого объекта 20 Замыкание множества 176 Значение функции в точке 38 наименьшее 38 Зона активности 281 Изоморфизм 104, 129 Интервал 138 Квадрат скалярный вектора 124 Комбинация линейная векторов 99 • нетривиальная 99 тривиальная 101 ■ точек 141, 181 Коммутативность скалярного умножения векторов 124 — сложения векторов 93 Композиция гомоморфизмов 119 Конус 218 — выпуклый 218 замкнутый 218 — двойственный 248 — опорный 226 — телесный 246 Концы интервала 138 — отрезка 137 Координаты вектора в базисе 102 в системе координат 180 — локальные на многообразии 274 — точки в системе координат 180 — фазовые 11, 19 Коэффициент гомотетии 159 Кривая параметризованная 276 Критерий эффективности 20, 29 Куб базисный 290 Кубильяж 291 Лемма Гиббса 316 Линия гладкая 268, 269 — прямая 142 Луч 12, 151 —, входящий внутрь множества 342 — противоположный 151 Максимум функции 31, 39, 307 Матрица функциональная 269 Метод динамического программирования 58, 60 в задаче об экстремуме функции 69, 353 оптимального управления дискретным объектом 58, 363 — — — — — — — непрерывным объектом 63
444 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Метод Дубовицкого — Милютина 324 — локальных сечений 408 Минимум функции 38 абсолютный 344 локальный 344 Многогранник выпуклый 192 — криволинейный 45 Многообразие гладкое 268 — линейное 142 Многоугольник выпуклый 190 Множества выпуклые отделимые 236 Множество выпуклое 188 замкнутое 201 ^-мерное 201 — дискретное 9, 19 — замкнутое 175 — компактное,367 — нигде не плотное 178 — открытое 175 Момент времени 19 Направление вектора, принадлежащее конусу 305 Начало координат 180 Неравенство активное 89 — неактивное 89 Нормаль гиперплоскости 173 — гиперповерхности 268 Область определения отображения 177 функции 38 — управления И, 20 Оболочка выпуклая 193 Образ гомоморфизма 114 — при отображении 114 Объект управляемый дискретный 11, 20 обладающий локальными сечениями 408 с запаздыванием 26, 27 с обратной связью 23 с переменным числом фазовых координат и управляющих параметров 28 непрерывный 50, 52, 54 Ограничение активное 83, 281 — выпуклое 337 — на управляющие параметры 10, 20 — на фазовые координаты 22, 390 — неактивное 83, 281 Окрестность множества 299, 367 Оптимальность, достаточные условия - для дискретного управляемого объ-J екта 427 Оптимальность, необходимые условия для дискретного управляемого объекта 91, 376, 404 —, непрерывного управляемого объекта 66 Отделимость выпуклых множеств 237 Откладывание вектора 135, 140, 141, 181 Отображение 104, 187 — аффинное 152 — изоморфное 104 — касательное аффинное 263 — линейное 152 — непрерывное 177, 187 — обратное 304 — равномерно непрерывное 177 —- тождественное 263 Отрезок 137 — вырожденный 138 — направленный 95, 135 Параллелепипед 49, 192 — координатный 290 рациональный 290 Параметры управляющие И, 19 Переменная фазовая 23 Пересечение цепей 294 Перпендикуляр из точки на плоскость 170 Плоскости взаимно дополнительные 150 — ортогональные 169 — параллельные 146 — совпадающие 146 Плоскость 142, 186 — касательная многообразия 269 — несущая 200 —, порожденная множеством 148 Поверхность 44 — гладкая 268 Подпространство 106 — направляющее плоскости 142 — несобственное 106 — нетривиальное 106 —, порожденное множеством 108 — собственное 106 — тривиальное 106 Полуинтервал 138 Полуплоскость 190 Полупространство замкнутое 165 — лишнее 207 — открытое 165 — отмеченное 212 — отрицательное 165 — положительное 165
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 445 Принцип максимума дискретный 69, 76, 78, 82, 422 для задачи об экстремуме функции 345 евклидов 75, 76 Понтрягина 65 Программирование динамическое 58, 60, 63, 353, 363 — математическое 44, 82, 305, 329, 345 Проектирование на плоскость 157 — на подпространство 117 — ортогональное 131 на плоскость 171 Проекция вектора на подпространство 117 *— ортогональная 131 точки на плоскость 171 Произведение вектора на число 93, 104, 181 — гомоморфизма на число 118 — скалярное 80, 122, 124, 186 Прообраз при гомоморфизме 114 Пространства векторные изоморфные 105 — евклидовы векторные изоморфные 129 Пространство арифметическое векторное 96, 102, 104, 123, 125 — аффинное 135 — векторное 93 — гомоморфизмов 119 — действительных матриц 119 — евклидово 167 векторное 124 — метрическое 167 —, распадающееся в прямую сумму подпространств 112 —, сопряженное к векторному пространству 121 — управляющих параметров 19 — фазовое 19, 21 Процесс 33, 52, 362 — оптимальный 365 Прямая 142, 148 — числовая 121 Равенство векторов 93 Радиус шара 175 Размерность аффинного пространства 135 — векторного пространства 102 — многообразия 268 — плоскости 142 — подпространства 107 — симплекса 197 — цепи 292 Ранг матрицы 269 Расстояние между параллельными плоскостями 171 — между точками 167, 185 — от точки до плоскости 170 Ребро выпуклого многогранника 211 Свойство отделимости системы замкнутых выпуклых конусов 252 Седло 75 Середина отрезка 138 Сечение локальное 408 Символ oQ(A) 262 Симметрия относительно точки 159 Симплекс 197 Система векторов линейно независимая 99 ортонормированная 128 — координат 180 ортонормированная 185 — ограничений 282 невырожденная 282 -Сложение векторов 93, 99 Состояние конечное 21, 29 — начальное 19, 21 — фазовое 19 Сумма векторов 93, 104, 181 алгебраическая 97 — гомоморфизмов 118 — подпространств 109 прямая 112 Тело выпуклое 197 — цепи 297 Теорема аппроксимационная 298 — Дубовицкого — Милютина 259, 324 — Лагранжа об условном экстремуме 86, 310 — о пересечении 288 — существования оптимального управления в задаче управления дискретным объектом 401 Точка 135, 141 — внутренняя множества 175 · отрезка 138 — граничная множества 176 — концевая интервала 138 луча 151 отрезка 137 — минимума функции 38, 46 — начальная параметризированной кривой 276 — управляющая 19 Точки внутренние отрезка \3& — зависимые 138
446 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Точки, лежащие по одну сторону от гиперплоскости 164 —, — по разные стороны от гиперплоскости 164 — независимые 138 Траектория 11, 19 —, соответствующая начальному состоянию и управлению 20 Угол между векторами 127, 167 — между лучами 167 Умножение вектора на число 93, 99 — векторов скалярное 124 Управление 11, 19 — допустимое (относительно начального состояния) 11, 20 Уравнение Беллмана 60, 65, 364 — векторное параметрическое плоскости 146 -— прямой 146 — гиперплоскости 183 — гиперповерхности 267 — линейное 329 Условие конечное 19, 21, 55 — начальное 11, 18, 21, 55 — общности положения 333 Условия достаточные оптимальности 427 экстремума функции 329, 345 — необходимые оптимальности 376, 404 экстремума функции 48, 79, 82, 85, 305, 345 Форма квадратичная 320 положительно определенная 320 Формула Лефшеца 294 — Тейлора 80, 267 Функции независимые 269, 310 Функционал линейный 121, 131 Функция аффинная 160, 182 — вогнутая 319 — выпуклая 319 — гладкая 79/267 — действительная 265, 266 — касательная аффинная 266 — линейная 160 — локально выпуклая 320 — непрерывная 177 Центр гомотетии 159 — шара 175 Цепь 292 — деформационная 298 — непрерывная 298 Шар замкнутый 175, 186 —- открытый 175, 186 Шатер 278 — максимальный 278 Экстремум функции 38 , достаточные условия 329 , необходимые и достаточные условия в форме принципа максимума 345 , — условия 48, 79, 82, 85, 305 Ядро аффинной функции 161 — гомоморфизма 115
Владимир Григорьевич Болтянский Оптимальное управление дискретными системами (Серия «Физико-математическая библиотека инженера») М., 1973., 448 стр. с илл. Редактор Я. X. Розов Техн. редактор В. Я. Кондакова Корректоры Е. А. Белицкая, Л. С. Сомова Сдано в набор 14/VIII 1972 г. Подписана к печати 29/ХП 1972 г. Бумага 60X90Vi6» тип. № 2. Физ. печ. л. 28. Условн. печ. л. 28» Уч.-изд. л. 29,47. Тираж 16000 экз. Т-20454. Цена книги 1^ р. 93 к. Заказ № 287 Издательство «Наука» Главная редакция физико-математической литературы 117071, Москва, В-71, Ленинский проспект, 15 Ордена Трудового Красного Знамени Ленинградская типография №2 имени Евгении Соколовой „Союзполиграфпрома" при Государственном комитете Совета Министров СССР по делам издательств, полиграфии и книжной торговли, г. Ленинград, Л-52, Измайловский проспект, 29.
i · , Η I Η a