Text
                    Экономико-
математическая
библиотека
В.И. ОПОЙЦЕВ
НЕЛИНЕЙНАЯ
СИСТЕМОСТАТИКА
МОСКВА "НАУКА"
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
198 6


ББК 22.18 О-60 УДК 519.6 Опойцев В.И. Нелинейная системостатика. — М.: Наука. Главная редакция- физико-математической -литературы, 1986. —248 с. В книге дается общесистемный подход к задачам о равновесии системы, его существовании и единственности, зависимости от внешних воздействий (управлений). Рассматриваются общие вопросы укрупненного описания систем и агрегирования, энтропийные методы и другие термодинамические аналоги. Изложение иллюстрируется многочисленными примерами из области экономики, биологии, техники, управления. Большое внимание уделяется стандартизации математического аппарата системостатики. Классический аппарат существенно адаптирован к специфике решаемых задач, развиваются также новые математические методы, непосредственно ориентированные на задачи статики сложных систем. Для специалистов по прикладной математике, математической экономике и теории управления. Табл. 1.Ил. 18. Библиогр. 70 назв. Серия "Экономико-математическая библиотека", выпуск 31 Рецензент доктор экономических, кандидат физико-математических наук К.А. Багриновский © Издательство "Наука". 1702070000-019 Главная редакция q 38-86 физико-математической 053 (02)-86 " литературы, 1986
ОГЛАВЛЕНИЕ Предисловие 5 Глава I. Содержательные постановки задач 7 § 1. Игровые и экономические модели 7 § 2. Задачи из разных областей 16 § 3. Предмет системостатики 26 § 4. Укрупненные описания, агрегирование и декомпозиция 29 Глава П. Геометрические принципы разрешимости уравнений 33 § 1. Основные топологические понятия 33 § 2. Интуитивно геометрическая картина теории вращения векторных полей 38 § 3. Теоремы о неподвижных точках 47 § 4. Вспомогательные технические приемы и дополнения 56 § 5. Гомеоморфизмы, накрытия, неявные функции 59 § 6. Неподвижные точки многозначных отображений 64 § 7. Векторные поля в банаховых пространствах 71 § 8. Принципы сжатия _ 73 Комментарии 82 Глава III. Равновесие и неподвижные точки 85 § 1. Оператор межэлементных связей 85 § 2. Пространства с конусом 88 § 3. Положительные решения . 91 § 4. К-системы 102 § 5. Линейные положительные операторы 109 § 6. Примеры и задачи , 114 Комментарии и задачи 121 Глава IV. Гетеротонные системы 123 § 1. Гомогенные системы 123 § 2. Гетеротонные системы 127 § 3. Единственность равновесия ' 132 § 4. Прикладные задачи 139 Комментарии : . 149 3
Глав а V. Реакция систем на внешние воздействия 151 § 1. Линейные неравенства 152 § 2. Теория Р-систем 155 § 3. Смещение равновесия 161 § 4. Теоремы о пересечениях 167 Комментарии и задачи 169 Глава VI. Системы с параметром 171 § 1. Градиентные системы v 171 § 2. Динамические характеристики равновесия 178 § 3. Структурная устойчивость 189 § 4. Прикладные аспекты теории катастроф 196 Комментарии и задачи 200 Глава VII. Термодинамика сложных систем 202 § 1. Равновесие в системах обмена 202 § 2. Статистические методы 211 § 3. Макропарамётры и агрегирование 219 § 4. Проблема обоснования 229 § 5. Агрегирование линейных систем 238 Комментарии 242 Обозначения 244 Список литературы 245
ПРЕДИСЛОВИЕ Под задачами системостатики мы будем подразумевать то, что обычно понимается под задачами статики в математической экономике и других прикладных дисциплинах. Это изучение равновесия системы, седловых точек, различных типов решений игр и вообще некоторых выделенных состояний системы, удовлетворяющих тем или иным специфическим требованиям. Предмет исследования здесь обычно составляют вопросы существования и единственности изучаемых состояний, их зависимости от внешних воздействий (управлений) и т.п. Другая составляющая системостатики — принципы агрегирования и декомпозиции. Статический аспект исследования систем часто представляет самостоятельный интерес (например, в межотраслевом балансе) и всегда лежит в основе комплексного изучения системы. Решение вопросов статики — как правило, первый необходимый шаг при постановке любых задач. Не случайно в математической экономике и других прикладных областях вопросам статики уделяется серьезное внимание и принципиальные продвижения (например, появление новых теорем существования) воспринимаются обычно как крупные вехи в развитии научной дисциплины. Признаки неудовлетворительного положения вещей заключаются в другом. Экономисты изучают экономическую статику, биологи — биологическую и т.д. Тогда как внимательный взгляд легко позволяет обнаружить, что в разных областях по существу решаются задачи единой математической природы, но изолированно друг от друга. Отрицательные последствия подобного разобщения усилий достаточно очевидны. Терминологические барьеры и концентрация внимания на специальных приемах решения вопросов тормозят решение вновь возникающих задач, мешают взаимному обогащению прикладных областей исследования. В результате многие исследования экономических, биологических, социологических и других моделей пестрят доморощенными доказательствами. Пути преодоления трудностей в подобной ситуации стандартны. Необходимо сводить воедино разнородные на первый взгляд вопросы, разрабатывать общие схемы, модели и методы. Резервы канонизации известных задач, наведения переходных мостов, разработки стереотипных схем, "переоткрытия" для нужд системного анализа старых математических дисциплин весьма велики. Однако более важным и перспективным здесь представляется развитие новых математических методов, которые позволили бы значительно расширить сферу приложений и сделать существ'енный шаг в исследовании сложных систем. В этом направлении за последние 10—15 лет была проведена большая работа. Появились общесистемные трактовки задач статики, выделены, и изучены многие классы систем, охватывающие широкий круг моделей из различных областей, развит довый математический аппарат, специально ориентированный на задачи системостатики. Однако итогом проделанной работы пока остаются разрозненные журнальные статьи. 5
В данной книге делается попытка представить системостатику как единую научную дисциплину. Излагается новый математический аппарат, развиваются общие точки зрения на задачи различной природы, даются многочисленнные приложения. Большая работа проделана по адаптации классического аппарата к специфике решаемых задач. Первая глава в книге занимает особое положение. Здесь делается попытка продемонстрировать общность задач статики на содержательных моделях из различных областей (экономики, управления, биологии, техники) , что позволяет грубо очертить предмет системостатики. Следующие три главы посвящены развитию математического аппарата, предназначенного для решения разнообразных задач, связанных с изучением равновесия системы. Основное внимание уделяется вопросам существования и единственности равновесия. При этом существо развиваемых методов заключается не просто в широком использовании геометрических принципов неподвижной точки (глава II), а в доведении результатов до выявления общесистемных свойств. На этом пути выделяются гомогенные и гетеротон- ные системы, К-системы (главы ΠΙ, IV), в рамки которых укладываются многочисленные содержательные модели. В то же время эти классы систем оказываются достаточно удобными для теоретического исследования и дают возможность указать серию простых и эффективных критериев существования и единственности равновесия. Центральные результаты главы V связаны с построением теории Р-сис- тем, которая служит базой для решения качественных задач о зависимости равновесия системы от внешних воздействий (управлений). В целом здесь на общесистемном уровне рассматриваются задачи, которые в математической экономике принято называть задачами сравнительной статики. В главе VI продолжается изучение влияния внешних воздействий на равновесие системы, но ориентация исследований уже иная. Проблема здесь заключается не в том, в каком направлении меняется равновесие под внешним воздействием (что характерно для задач сравнительной статики), а в том, как меняются свойства самого равновесия. В каких случаях, например, устойчивое равновесие может превратиться в неустойчивое и т.д. Естественно, что при этом приходится затрагивать вопросы динамики. В последней главе рассматриваются вопросы укрупненного описания сложных систем, содержащих большое число элементов.Прослеживаются аналогии с классической термодинамикой и статистической физикой. Рассматриваются разнообразные применения энтропийных методов. Заметим, что фигурирующие в названиях разделов: межотраслевой баланс, игровые модели, экономические модели равновесия и другие прикладные задачи изучаются не сами по себе, а как иллюстрация развиваемых общесистемных методов. На изложении это сказывается следующим образом. Модели изучаются в некоторых упрощающих предположениях, что дает возможность подчеркнуть основные идеи, не затемняя существа дела второстепенными деталями. Вместе с тем намечаются пути обобщений и показывается, как общесистемная точка зрения часто позволяет углубить классические результаты и получить новые. Внутри каждой главы принята самостоятельная нумерация параграфов и теорем. Если делается ссылка на теорему из другой главы, то в скобках римскими цифрами указывается номер главы. Знак D везде далее обозначает конец доказательства или рассуждения. В Μ Опойцев 6
ГЛАВА I СОДЕРЖАТЕЛЬНЫЕ ПОСТАНОВКИ ЗАДАЧ Главная цель системостатики — выделить то общее, что присуще задачам статики из разных прикладных областей. Поиск общесистемных, общематематических звеньев естественно должен начинаться с анализа конкретных примеров и моделей, чему и посвящена данная глава. Однако содержательная сторона моделей нас интересует лишь во вторую очередь, поэтому мы не будем заниматься серьезным углублением их прикладной значимости и тем более поиском принципиально новых моделей. Другими словами, мы не будем заниматься ни экономикой, ни биологией, ни техникой, хотя именно с этих дисциплин должны будем начать и в конечном итоге — ими закончить. § 1. Игровые и экономические модели 1.1. Межотраслевой баланс. Рассмотрим экономическую систему, состоящую из η взаимосвязанных отраслей; /-я отрасль выпускает z-й продукт в количестве *,·, который внутри системы затрачивается в количестве Pi (χι> · · · > хп) = Pi (*). Чистый выпуск ζ-го продукта при этом равен У\ = Xi - ρι (χ). Таким образом, исследование модели сводится к изучению векторного уравнения х-Р(х)=у9 (1.1) гдеР(х) ={рг (χ) у... ,рп(х)} „Если оператор Р(х) внутрисистемных затрат линеен, описанная модель называется моделью Леонтьева. При изучении балансовых моделей возникают следующие естественные вопросы. Можно ли обеспечить заданный набор чистых выпусков у = { у ι, . . . , уп) подходящим набором плановых выпусков χ = { Χι, . . . , χη) ? Единственным ли образом это можно сделать? Можно ли обеспечить в системе любой наперед заданный набор чистых выпусков? Что нужно делать, чтобы увеличить чистые выпуски некоторых продуктов? Решение последнего вопроса часто соприкасается с неожиданными моментами. Естественная рекомендация: увеличивать объем выпуска Xj, если надо увеличить чистый выпуск у ι, нередко оказывается ошибочной. С формальной точки зрения, игнорирующей экономическое содержание модели, перечисленные выше вопросы (а также их логические продолжения) звучат примерно так. Существует ли решение уравнения (1.1) при некотором заданном у1 Единственно ли это решение? Существуют ли решения (1.1) при всех (в данном случае неотрицательных) у1 Если да, то при 7
любом ли у решение единственно, непрерывно ли оно зависит от у и вообще каковы качественные характеристики зависимости решения (1.1) от векторного параметра у1 Наконец, обширная серия вопросов (задач) возникает в связи с построением и исследованием вычислительных алгоритмов. Что касается свойств оператора затрат Р, которые, собственно, и определяют специфику модели, то о них говорить подробно более естественно в других главах, где речь будет идти о конкретных результатах. Среди общих свойств отметим следующие. Затраты не могут быть отрицательны — поэтому оператор Ρ положителен. Разумным выглядит предположение об увеличении затрат при росте плановых выпусков, что влечет за собой монотонность?) оператора Р. Последнее, однако, не всегда верно. Затраты с ростом выпусков могут уменьшаться, причем скачкообразно, что может быть связано с переходом на серийный выпуск или другую технологию. Характеристики модели могут существенно зависеть от разложимости оператора Ρ (понятие разложимости широко известно для линейных операторов, матриц), асимптотики его поведения на бесконечности,выпуклости и т.д. Выше негласно предполагалось, что Р(х) — обычный однозначный оператор. При наличии различных способов производства (различных технологий) затраты будут неоднозначны — оператор Ρ многозначен. В этом случае старые вопросы приобретают новые оттенки. Теперь интерес представляет не только возможность обеспечения некоторого набора чистых выпусков, но и выбор при этом технологий в том или ином смысле наиболее выгодных. 1.2. Производственные функции и максимизация прибыли. Пусть экономическая ячейка потребляет различные ресурсы в количествах {х\, ..., хп } = χ и производит свой продукт в количестве^. Функция φ, описьюающая связь у = φ(χ), называется производственной функцией. Если набор факторов производства χ полный, то принято считать, что φ - положительно однородная функция первой степени, т.е. φ (λχ) - \φ{χ), λ > 0. Последнему требованию удовлетворяет часто используемая производственная функция Кобба - Дугласа *р(х) = ахг"*...х£п, Σα, =1, α, >0. (1.2) Однако на практике, как правило, интересуются зависимостями производимой продукции от неполного набора факторов. Например, можно изучать зависимость урожая кукурузы от количества вносимых удобрений при неизменной площади посева. В этом случае часть переменных в (1.2) оказывается фиксированной, в результате чего производственная функция приобретает вид φ(χ) = βχΐι...χ"^9 ос, +... + <*m <1, m<n. (1.3) Если φ (χ) дает денежное измерение выпускаемой продукции, а λι, ..., \m обозначают цены на потребляемые ресурсы, то задача максимизации *) Пока мы говорим о некоторых математических понятиях, не уточняя деталей и определений. Это будет сделано в следующих главах. 8
прибыли фирмы имеет вид φ(χ) — Σ λ/ Χι -> max, /= 1 χ что в естественных предположениях эквивалентно решению системы уравнений δφ , λ, =0, / =1,...,л, Эху ' или векторного уравнения grad<p(x)=X. (1.4) Возникающие здесь вопросы в своем формальном описании полностью совпадают с теми, которые уже упоминались в предыдущем разделе по поводу уравнения (1.1). Содержательная природа этих вопросов в данном случае, конечно, иная. Существуют ли оптимальные объемы закупок, как будет реагировать фирма на изменение цен? Данная задача может быть дополнена введением бюджетных и других ограничений, что в благоприятном случае приведет лишь к увеличению числа уравнений и появлению (возможно, фиктивных) вспомогательных параметров. Более интересные модели возникают в связи с изучением совокупностей взаимодействующих экономических ячеек. Такие модели будут рассматриваться в дальнейшем. Здесь же отметим, что описание фирмы производственной функцией лишь в исключительных случаях может адекватно отражать действительность. Предприятие, как правило, выпускает одновременно различные виды продукции, имея определенную свободу маневра в выборе ассортиментов выпуска и потребления. Подобная ситуация может моделироваться, например, так. Каждому z-му предприятию (фирме, ячейке) ставится в соответствие его технологическое множество Xf. Возможности предприятия ограничиваются выбором вектора Xj Ε Х^, положительные компоненты которого соответствуют выпуску, отрицательные - потреблению. 1.3. Сбалансированный рост. Пусть в fc-й плановый период некоторая экономика имеет запасы продуктов в количествах хк = {хк,..., χκη). На основе этих запасов в следующий период могут быть произведены продукты в количествах xk+1 = {xk+l,... >xk+l) . Связь определяется оператором F, что приводит к динамической модели xk+l=F(xk). (1.5) В данной динамической модели один из главных вопросов имеет чисто статическую природу. Существует ли сбалансированный рост, при котором все выпуски растут пропорционально? Поскольку обычно (и это естественно) отображение F предполагается положительно однородным первой степени, то в математическом оформлении поставленный вопрос звучит так. Существует ли λ > 1, при котором уравнение F(x) = λχ имеет положительное решение? Требование λ> 1 проистекает из необхо,- димости роста, а не затухания. 9
Таким образом, по сравнению с задачами предыдущих разделов здесь появляется новый элемент. Статическая задача сводится к изучению собственных значений и собственных векторов, вообще говоря, нелинейного оператора F. 1.4. Рыночная модель. Пусть на рынке продается η товаров, х{ - цена z-го товара, // (х) - избыточный спрос на /-и товар (спрос минус предложение). Понятно, что // может зависеть не только от xh но и от других цен, в общем случае от всего вектора х. Естественная реакция рыночных цен на ситуацию достаточно очевидна. Цена Xf растет, если // (х) > 0, и убывает, если // (х) < 0. В этом случае равновесным может быть лишь такой набор цен х, при котором все функции избыточного спроса обращаются в нуль, т.е. F(x) = 0, (1.6) где F(x) ={/,(*),...,/„(*)}. Вот более аккуратное определение рыночного равновесия. Вектор цен х* считается равновесным, если для любого i выполняется одно из двух: или// (**) = 0, или// (χ*) Φ О;я/ = 0. Последнее уточнение при разумном подходе к задаче едва ли служит ценным дополнением. Но даже в этом усложненном варианте основной статический вопрос о существовании равновесия сводится к разрешимости системы уравнений и неравенств. В этом и некоторых последующих примерах мы сталкиваемся с необходимостью изучения систем, точное (и даже неточное) количественное описание которых не задано. Действительно, разве можно рассчитывать, что функции избыточного спроса будут * известны исследователю сколько-нибудь точно в широких диапазонах изменения цен? В подобных ситуациях поначалу обычно возникает ощущение безвыходности. Как можно говорить о равновесии, если ничего неизвестно о системе? Конечно, при полном отсутствии информации вопрос о равновесии действительно не имеет смысла. Но в таких случаях, как правило, все-таки есть информация качественного характера — и часто этого оказывается достаточно. Не вдаваясь в подробности детального изучения свойств функций избыточного спроса, отметим лишь самые элементарные из них. Обычно считают, что товары на рынке могут находиться в одном из двух возможных отношений. Если // (х) возрастает при увеличении jc7 , то говорят, что /-й товар является валовым заменителем /-го; если же /,· (х) убывает при увеличении *,·, то говорят, что /-и товар обладает свойством валовой дополнительности по отношению к /-му товару. Мясо и рыба, нефть и уголь- взаимно заменимые товары. Спички и· сигареты, запчасти и автомобили, чай и сахар — взаимно дополнительные товары. В экономической литературе в основном изучались рыночные модели с валовой заменимостью товаров, в меньшей степени — с валовой дополнительностью товаров и почти совсем не исследовались (не считая общих теорем о существовании равновесия) смешанные рынки. Качественная информация в последнем наиболее общем случае, казалось бы, крайне бедна. Известно лишь, что каждая функция избыточного спроса по каждой в отдельности переменной или возрастает, или убывает. Но, как будет видно из дальнейшего, и этот факт можно весьма эффективно использовать. 10
IS. Оптимизация. Многие экономические задачи связаны с поиском абсолютных и условных экстремумов. Мы уже упоминали задачу максимизации прибыли. Рассмотрим теперь простейший пример условной оптимизации. Пусть некий управляющий орган (УО), которому подчинено «производителей, располагает запасом ресурса (сырья) в количестве/? и выдает z-му производителю ресурс в количестве X/, который из этого ресурса производит продукцию в количестве yf = φί (Xf). Если все выпускают один и тот же вид продукции или же производственные функции φ{ измеряют выпуски в деньгах, то естественной задачей управляющего органа является Σ <#(*,·)-> max, Σ Xi<R. (1.7) i i Другими словами, УО должен так распределить ресурс между производителями, чтобы обеспечить максимальный суммарный доход системы при имеющемся ограничении суммарного ресурса. Поскольку функции φι обычно монотонно возрастают, неравенство в (1.7) можно заменить на равенство и воспользоваться для решения задачи методом множителей Лагранжа. В результате задаче сводится к поиску экстремума лагранжиана L(x, λ) = Σ φ((χ) - λ(Σ xg - R), i i что равносильно поиску решения уравнения V(*A)M*,X)=0. (1.8) Вместо (1.8) можно рассматривать уравнение ν*Ζ,(χ,λ) = 0, но параметр λ выбирать так, чтобы на решении х(к) выполнялось ограничение Ση = Λ. Таким образом, статические вопросы здесь сводятся к изучению нулей градиентного поля 4XL (xs λ) с параметром λ, который в более общих ситуациях (при наличии многих ограничений) может быть векторным. Формулировка основных вопросов стандартна. Существуют ли решения и сколько их ? Поскольку исходной задачей является (1.7), то возникает дополнительный вопрос о связи между свойствами градиентного поля и характером экстремума. Это первое, что бросается в глаза. При исследовании задачи появляются новые вопросы. Например, может ли характер экстремальной точки меняться при деформации лагранжиана (при изменении параметра λ) ? 1.6. Равновесие по Нэшу. Пусть некая экономическая система состоит из η взаимосвязанных элементов (ячеек) Л/. Каждый элемент Af распоряжается выбором переменной XjGXj, Dt (χλ, .. ., χη) обозначает функцию выигрыша А{. Переменная x-t может быть скаляром, вектором, функцией, множеством. В теории игр х,- называют стратегией игрока Af, что плохо укладывается в семантику слова "стратегия", но термин общепринят. 11
Описанная ситуация типична для экономики. Каждая ячейка имеет свою степень свободы Xf (заявки на сырье, отчетные данные*), выбор ассортимента выпуска, внутренний график работ и т.д.), но выбор Xj не может однозначно определить свой выигрыш D{ - многое зависит от действий других элементов системы (если заявки других предприятий на дефицитный ресурс возрастут — вполне вероятно, что нам ресурс выделят в меньшем количестве). Возникает вопрос: какой набор стратегий jc = = {*ι,... ,хп) будет равновесным? В принципе ответов может быть много, но практика чаще всего показывает следующее. Если предприятие Af знает, что изменением д^ может увеличить свой выигрыш, то не удерживается от соблазна. При этом равновесной может быть лишь такая точка х, в которой ни один из элементов не может добиться'увеличения своего выигрыша изменением собственной переменной Х(. В теории игр такое равновесие называется равновесием {решением) игры по Нэшу. При изучении равновесия по Нэшу целесообразно ввести функции /,· (х) с помощью равенств Di(xi,. .. ,Хг-иМх),х^х,... ,хп)= max Д<х), в результате чего нэшевские решения становятся неподвижными точками, вообще говоря, многозначного оператора F(x) ={Д (х),. .. ,fn(x)} , т.е. статика сводится к изучению включения xGF(x). (1.9) В частном случае, когда все xt являются скалярными величинами, а функции Dj (x) — гладкие, искать равновесие по Нэшу можно, решая систему уравнений —^ =0, (1.10) OXj Остановимся теперь на одной принципиальной проблеме. Как реализуются равновесные решения? Часто предполагают, что элементы системы производят вычисления, например, решая систему уравнений (1.10), определяют таким образом равновесные решения и затем применяют их на практике. Подобное предположение вызывает сомнения. Если не говорить об исключениях, то обычно в экономике элементы А\ не знают функций выигрыша других участников и поэтому не имеют даже необходимой информации для расчетов. Эксперименты и наблюдения показывают, Что реально происходит нечто иное . Каждый элемент Αχ меняет с течением времени щ в сторону увеличения собственного выигрыша по переменной Xj. В устойчивых системах подобная динамическая тактика поведения приводит в конечном итоге к равновесию по Нэшу.Подробная информация на эту тему имеется в монографии автора [1]. *) Отчетные данные лишь на первый взгляд являются результатом формального соответствия между цифрами и фактическим положением дел. 12
Необходимо отметить, что как само равновесие по Нэшу, так и приводящая к нему тактика поведения не являются абсолютно и безусловно разумными. Трудности и парадоксы обнаруживаются уже в простейших ситуациях. Возьмем известный пример, дилемму заключенного, представляющий собой игру двух участников с матрицей выигрышей (в данном случае проигрышей) 1; 1 10; 0 β 0; 10 9; 9 Два бандита, подозреваемые в совершении тяжкого преступления, находятся изолированно друг от друга в предварительном заключении. Ввиду отсутствия прямых улик успех или неуспех обвинения зависит от признания (β) или непризнания (а) самих бандитов. Если оба бандита признаются (χι =β,Χ2 = β), то они будут признаны виновными при смягчающих обстоятельствах и будут приговорены к 9 годам тюрьмы. Если ни один из них не признается (xj = α, χ2 = α) , точю обвинению в главном преступлении они будут оправданы, но обвинителю все-таки удастся доказать их виновность в некотором сопутствующем менее тяжком преступлении, в результате чего они будут приговорены к 1 году тюрьмы. Если, наконец, признается только один из них ((*ι = ос, х2 = β) или (χχ = β, Хг = α)), то признавшийся будет освобожден (таково законодательство в условиях примера),.а неприз- навшийся будет приговорен к максимальному сроку — 10 лет. Рассмотрим ситуацию с позиции первого подследственного. Если он не признается (а), то получит год или 10 лет тюрьмы; если признается (β) — 0 (выйдет на свободу) или 9 лет тюрьмы. Очевидно, в данном случае 0 лучше, чем 1; 9 лучше, чем 10. Таким образом, однозначно определить свой проигрыш собственной стратегией он не может, но, признаваясь (β), в любом случае окажется в выигрыше. Но матрица симметрична, поэтому второй участник совершенно аналогичным образом приходит к заключению о выгоде признания (β). В результате оба признаются и получают по 9 лет тюремного заключения . Это и есть решение игры по Нэшу. Равновесие по Нэшу можно охарактеризовать как индивидуально разумное решение, В данном примере коллективно разумным решением представляется (а, а). Но парадокс не снимается даже возможностью предварительной договоренности. В конечном итоге каждый принимает решение самостоятельно, при этом оказывается выгодным нарушить коллективный договор. Кто думает, что данный пример являет собой редкую аномалию, глубоко ошибается. Парадоксальность нэшевских решений — скорее правило, нежели исключение. Тем не менее многие экономические системы находятся именно в таком равновесии. На первый взгляд еще более удивительным представляется тот факт, что для эффективности экономики в целом это часто не имеет ровно никакого значения (см. следующий раздел). 1.7. Метаигровой синтез. Главные проблемы управления экономикой обычно связывают с решением задач баланса и оптимизации. Перспективы при этом возлагаются на совершенствование методов решения задач большой размерности. Подобный подход широко распространен и глубоко 13
укоренился, но многое остается за кадром. Конечно, здесь не место обсуждать, что в управлении экономикой является главным, но рассматриваемый ниже простой пример позволит нам параллельно с обсуждением задач статики коснуться важных экономических проблем общего характера. Вернемся к модели распределения ресурса из раздела 1.5, дополнив ее следующими уточнениями. Управляющий орган (УО) располагает запасом ресурса в количестве R в каждый плановый период времени, производственные функции φι для определенности имеют вид φι(χ) =г^\/^, т.е. производители друг от друга отличаются лишь коэффициентами эффективности производства Г/. Стоящая перед УО задача Σ глД^тах, Σ xf = R (1.11) Ι Ι весьма элементарна и вроде бы имеет чисто оптимизационный характер. Попытка провести параллели с реальной экономической жизнью показывает, что это впечатление обманчиво. Во-первых, производственные функции φι (Χι) отражают скорее не жесткую связь между входом и выходом производителей, а их предельные возможности. Поэтому элементы необходимо заинтересовать в результатах работы, например, оплачивая труд пропорционально доходу Д = φ{ (*/) или прибыли где λ— цена на ресурс. Во-вторых, и это более важно (поскольку, хотя и очевидно, часто упускается из вида), производственные функции управляющему органу, как правило, неизвестны или, лучше сказать, известны весьма приблизительно. Но тогда УО не имеет возможности решать оптимизационную задачу (1.11), так как ему неизвестны коэффициенты Г/. Возникает дополнительная задача организации сбора информации. Прямолинейная попытка запросить значения .коэффициентов rf не гарантирует успеха, потому что производители будут отвечать, думая о собственных интересах, а не об интересах управляющего органа. В результате может оказаться, что им невыгодно сообщать достоверную информацию. Поясним сказанное более детально. УО посылает запрос элементу At о значении коэффициента г{ , элемент отвечает — sf. He имея другой информации, УО на основе полученных данных s ={ Si,. . ., sn} делит ресурс*/ (s) и назначает цену X(s). После подстановки закона распределениях,·^) и назначения цены \(s) в функцию прибыли элемента А{ получаем АО) = П V*/0)'- М*)*/0) , т.е. функция выигрыша каждого элемента оказывается зависящей лишь от вектора s. Другими словами, мы приходим к типичной игровой ситуации, в которой S{ является стратегией Л,·. В результате игрового взаимодействия в Ьистеме устанавливается некоторое равновесие s*, но нет никакой гарантии, что s* = r. Понятно, что положение и характер равновесия определяются функциями xf (s), X(s). Поэтому задачу УО можно сформулировать так: выбрать такие законы управления Xj(s), X(s), чтобы в равновесии получающейся игры было s* = r и равновесное распределение ресурса{Xf (s*)} было оптимальным по критерию (1.11). Иными словами, 14
задача УО есть синтез такой игры между производителями, в которой каждый, преследуя сугубо индивидуальные цели, обеспечивал бы тем самым оптимум функционирования системы в целом. Может показаться, что мы слишком многого хотим. Действительно, задача выглядит утопичной. Не имея информации о системе, мы хотим так организовать ее работу, чтобы каждый думал только о себе, но этого было бы достаточно для оптимального функционирования в целом. Тем не менее подобная задача часто имеет решение. Ряд моделей на эту тему будет рассмотрен в дальнейшем*). Богатство статических вопросов здесь очевидно. Помимо существования и единственности равновесия оказывается необходимым выяснение возможности его перемещения в заданную точку, связь между равновесиями в пространстве переменных Гив пространстве переменных хитл. Поясним теперь, почему тактика поведения производителей с точки зрения интересов системы и УО не играет принципиальной роли. Для УО важно лишь знать, какова тактика производителей. Если эта тактика "нэшевс- кая", то УО будет синтезировать такую игру, чтобы ресурс распределелял- ся оптимально в равновесии по Нэшу; если тактика иная — УО, синтезируя игру, будет ориентироваться на другое понятие равновесия, но при этом все равно будет добиваться оптимума распределения в равновесии. Осмысливая затронутую тематику в целом, читатель может возразить, что проблема отсутствия информации о производственных функциях не столь принципиальна, и наш метаигровой подход драматизирует ситуацию, из которой на самом деле есть простой выход. Ведь предприятия можно не запрашивать об их производственных возможностях, а извлекать необходимую информацию из наблюдений результатов их деятельности в прошлые плановые периоды. Подобный подход широко применяется на практике, реализуя в разных вариантах принцип планирования от достигнутого уровня. Увы, проблемы это не решает и приводит обычно к сознательному скрытию резервов производства. Главные причины неприятностей здесь достаточно очевидны и легко вскрываются на простейших опять-таки игровых моделях. Рассмотренный фрагмент из области метаигрового синтеза наглядно показывает, что чисто оптимизационные экономические задачи при более внимательном изучении теряют свою первоначальную форму и приобретают новое качество. Углубленное исследование экономической действительности неизбежно сталкивается с наличием в системе различных интересов и проблемой их разумного согласования. Мы далеки от мысли, что игровое взаимодействие подсистемы - главное звено в экономике, но это достаточно важный фактор, без учета которого едва ли возможен серьезный прогресс экономико-организационных исследований. 1.8. Общие замечания. Как уже отмечалось, наша цель — системостатика, а не экономика. Однако общий взгляд на экономические задачи заслуживает упоминания в данном месте хотя бы по следующей причине. Любые публикации, а в особенности монографии, соприкасающиеся с обсуждением тех или иных экономических моделей, сообщают дополнительный вес стажем, также [8,41]. 15
тусу общепринятое™ этих моделей. В результате вокруг рассматриваемых моделей начинают разрастаться исследования, чисто иллюстративные задачи превращаются в самостоятельные объекты изучения. Автору не хотелось бы содействовать развитию такого процесса. Дж. фон Нейман и О. Моргенштерн в предисловии к своей известной монографии писали: "Экономисты не должны надеяться на более легкую судьбу, чем та, которая постигла ученых других специальностей". Надежды на прогресс можно связать только с тяжелой и часто неблагодарной работой по созданию новых моделей и более глубокому проникновению в природу экономической действительности. Шлифовка старого здесь малоэффективна, ибо огрехи в постановке задач невозможно компенсировать совершенствованием методов решения. Сказанное вовсе не означает, что имеющиеся экономические модели нужно сдать на слом. Критиковать легко, но мы нуждаемся не в критике, а в новых альтернативах. А пока их нет, надо пользоваться тем, что есть. Ведь реальная экономика не может ждать, она требует постоянного нашего участия в управлении и принятии решений. Решения же в любом случае опираются на модели. Конечно, модели могут быть не обязательно математическими. Это могут быть мысленные образы, фрагментарные концепции, ложные выводы из прежнего опыта, чужие идеи, сомнительные аналогии и т.п. Но что бы это ни было — это модели. И вопрос может заключаться лишь в том, каким из них отдать предпочтение. Нередко предпочтение отдается здравому смыслу. Тем не менее история экономики изобилует примерами заблуждений здравого смысла, и у нас еще будет много поводов убедиться в порочности правдоподобных умозаключений. Ведь здравый смысл все равно опирается на некие модели, которыми нередко оказываются те же сомнительные аналогии, прошлый опыт, взаимно неувязанные представления о задаче. Математические модели в этом отношении, несмотря на все свои несовершенства, имеют неоспоримые преимущества*). Нужно лишь не забывать об их относительной ценности и не заниматься их фетишизацией, иначе модельная экономика начинает отождествляться с реальной, а это уже чревато неприятными сюрпризами. § 2. Задачи из разных областей 2Л. Статистика и парадоксы нелинейных цепей. Рассмотрим ориентированный граф G(β, S), где Q — множество вершин, S — множество дуг. Каждой дуге s GS однозначно ставится в соответствие пара вершин (q, г), q — начало, г — конец. Еще говорят, что в этом случае дуга s выходит из вершины q и входит в г. С каждой дугой sj GS свяжем три величины: у^ — ток, X/ — напряжение, е ι — э.д,с. Пусть вольт-амперные характеристики пассивных сопротивлений в дугах описываются функциями у}- -fj (xj). В результате мы имеем опи- *) Здесь уместно процитировать Т.Л. Саати: "Исследование операций представляет собой искусство давать плохие ответы на практические вопросы, на которые даются еще худшие ответы другими методами". 16
сание некой электрической цепи. Полный расчет выполняется на основе законов Кирхгофа, которые компактно описываются в виде R у = 0, Сх = = Се, где R — матрица инциденций графа G,C — матрица циклов (контуров)*). Таким образом,* все сводится к изучению, вообще говоря, нелинейной системы уравнений RF(x) = 09 Сх = Се. (2.1) Сразу оговоримся, что рассмотренная модель может иметь источником не обязательно электрическую цепь. Аналогичные задачи возникают при изучении пассажиропотоков, товарных потоков в экономике, информационных потоков в системах связи, потоков жидкости (воды, нефти) в сетях трубопроводов или каналов. Вся разница при этом заключается в содержательной интерпретации переменных. На электрической интерпретации мы остановились пока лишь по той причине, что в силу своей популярности она не требует подробных разъяснений, которые с общесистемной точки зрения были бы излишни. В данном случае для нас важен лишь сам факт, что задача сводится к нелинейной системе уравнений. При изучении конкретных цепей система (2.1) не совсем удобна (поэтому обычно используют другие эквивалентные системы уравнений), но она достаточна для формулировки общих вопросов. Как известно, постановка вопроса — самое трудное дело в научном ^исследовании. Так, в данной ситуации необходимо проявить определенную изобретательность, чтобы выйти за рамки очевидных проблем существования и единственности решения системы (2.1). Немного позже мы сделаем это, а пока остановимся на проблеме существования. Дж, Риордану принадлежит афоризм: "Действующая система не нуждается в доказательстве ее существования". В подобной точке зрения нередко действующую систему подменяют мысленно действующей. Замена вроде бы незначительна, но достаточна для ошибочных заключений, Например, существование решения системы (2.1) иногда обосновывают так. Соберем соответствующую электрическую схему и включим ее. Из физических соображений ясно, что в схеме установится некоторое распределение токов и напряжений, которое и будет искомым решением. Увы, рассуждение не выдерживает критики. Простейшие примеры показывают, что решения системы уравнений (2.1) может не существовать, и нетрудно понять, что в соответствующей электрической схеме при этом никакого стационарного распределения токов и напряжений не установится, а будет протекать сложный динамический процесс. Динамика процесса будет определяться малыми (паразитными) индуктивностями и емкостями, не учитываемыми моделью (2.1). Сказанное выше не только убеждает в принципиальной важности проблемы существования решения, но заставляет задуматься еще и о другом. Пусть решение системы уравнений (2.1) существует и даже единственно. Есть ли основания ожидать, что поведение реальной схемы будет ему соответствовать? Ведь паразитные индуктивности и емкости (которые спасли нас от противоречия в предыдущем случае) есть всегда. Так, может быть, и теперь они будут играть принципиальную роль? По существу это стандарт^ *) Мы здесь не уточняем деталей, так как в данном контексте они несущественны. · 17
ный вопрос о структурной устойчивости модели. Модель должна всегда быть нечувствительна к малым возмущениям. В противном случае, что модель может сказать о системе, которая заведомо, хотя и мало, но отличается от модели? Попытаемся теперь расширить круг статических вопросов. Фиксируем два узла в электрической цепи и заменим всю цепь одним пассивным нелинейным сопротивлением с подходящей вольт-амперной характеристикой. Это стандартная в электротехнике операция. Правомочна ли она? Оказывается, не всегда, но в достаточно свободных предположениях такой переход возможен. Если необходимые предположения выполняются, возникает серия вопросов о влиянии изменений в электрической схеме (скажем, изменений функций //(*)) на вольт-амперную характеристику эквивалентного сопротивления. Здесь можно указать ряд интуитивно неожиданных эффектов. Например, хорошо известно, что эквивалентное сопротивление линейной цепи (все /,· (χ/) =*//'Ί·) увеличивается с ростом любого одного или нескольких сопротивлений г,·. С интуитивной точки зрения такое положение вещей представляется вполне естественным. Если в некотором звене цепи мы создаем дополнительные препятствия для прохождения тока, то суммарный ток через цепь как будто должен уменьшиться. Оказывается, что для нелинейных цепей картина может быть иной. Рост сопротивлений отдельных звеньев цепи может сопровождаться уменьшением эквивалентного сопротивления. В частных случаях это может означать уменьшение пропускной способности транспортной сети в целом при увеличении пропускной способности отдельных магистралей (и даже строительстве новых магистралей), увеличение пропускной способности сети водоканалов при полном перекрытии ее отдельных участков и т.п. Проиллюстрируем соответствующую парадоксальную ситуацию простым примером. Рассмотрим электрическую цепь, изображенную на рис. 1. Нелинейные сопротивления R ι имеют здесь вольт-амперную характеристику χ - у2 sign у, вольт-амперная характеристика сопротивлений R2 описьюается связью χ = V) у\ sign .у. Определим результирующую вольт-амперную характеристику цепи между точками А и В. Для R3 =°° (точки Си Dразомкнуты) получаем где X — напряжение на зажимах А и В, a Y — суммарный так. Для R$ = = 0 (точки Си Ъ соединены) имеем Г/*\2 Гх 1 Легко проверить, что при фиксированном напряжении 0 < X < 2 увеличение R3 от 0 до °° влечет за собой увеличение тока Y, т.е. Л Рис. 1 f8
η /" χ Рис. 2 уменьшение эквивалентного сопротивления R = Χ/Υ. Другими словами, закрытие канала R$ увеличивает пропускную способность системы. Обратим внимание, что рассмотренная цепь содержит только положительные сопротивления, характеризуемые монотонным ростом напряжения при увеличении тока. Сюрпризы цепей, содержащих отрицательные сопротивления, более известны и менее удивительны. Нелинейным электрическим цепям посвящена обширная литература, в том числе и учебная. Так что заинтересованный читатель может обратиться к предметному каталогу любой технической библиотеки. Парадокс уменьшения эквивалентного сопротивления нелинейной цепи при увеличении сопротивления отдельного звена был подмечен в [И] .Любопытно, что наиболее сильное впечатление он произвел на электротехников, которые хорошо знакомы со свойствами линейных цепей. Это подчеркивает то очевидное обстоятельство, что парадоксальность ситуации обычно является субъективной характеристикой, результатом противоречия между новыми фактами и прошлым опытом. Кто не имеет опыта - не знает парадоксов. Рассмотренный пример дает повод для расширения списка статических вопросов. Может ли эквивалентное сопротивление быть отрицательным, если все сопротивления цепи положительны? Что можно сказать о цепи в целом, если она содержит насыщаемые элементы с характеристиками типа изображенных на рис. 2? Будет ли при этом ограничена пропускная сопособность цепи? Если да, то какие элементы являются "узкими местами"? К новым вопросам приводит расширение содержательной постановки задачи. Представим, что каждым сопротивлением управляет некий активный элемент с помощью собственного рычага. Рычагом может служить собственный регулируемый источник э.д.с. или любой параметр, от которого зависит собственная вольт-амперная характеристика. Цель элемента — установить желаемое значение тока через свое сопротивление. Для увеличения тока каждый элемент располагает стереотипным (прямолинейным) действием, например увеличением э.д.с. (в нужном направлении). Но система взаимосвязана, каждый влияет на других, поэтому неочевидно, что набором стереотипных действий можно добиться одновременного увеличения всех токов. Конечно, такая игрушечная задача может показаться надуманной. Вот более осмысленный бытовой пример. Душевые колонки в бане представляют взаимосвязанную сеть. Можно ли дополнительным открытием кранов горячей воды одновременно повысить температуру во- 19
^φ- Щ Λ Рис. 3 Рис.4 ды во всех колонках? В качестве упражнения читатель может придумать десяток аналогичных задач на экономических сетях. Понятно, что в математической формулировке подобные вопросы сводятся к проблеме разрешимости системы неравенств типа F(x)>0, х>0. (2.2) Но в форме (2.2) задача часто теряет колорит. Привлекательная окраска исходной содержательной задачи часто заключается в том, что оператор F бьюает задан неявно и то ли по техническим, то ли по принципиальным причинам его точное количественное описание оказывается невозможным. Поэтому вывод о разрешимости приходится делать на основе глубокого изучения качественных свойств системы. При этом иногда "всплывают на поверхность" нетривиальные связи с законами сохранения, инвариантностью системы к некоторой группе преобразований и тл. Выше рассматривались цепи, в которых каждая дуга графа характеризовалась двумя параметрами (ток и напряжение). В общем случае число таких параметров может быть большим (многопродуктовые потоки), а законы "стыковки" не обязательно кирхгофовскими. Широкое распространение получили также потоковые модели, в которых каждой дуге сопоставляется единственная величина — ток. Специфические модели получаются при рассмотрении блок-схем функциональных преобразователей. Здесь в наиболее простой форме проявляются аналогичные эффекты, характерные для нелинейных цепей. Рассмотрим для примера блок-схему, изображенную на рис. 3. Здесь в цепи положительной обратной связи стоит функциональный преобразователь типа f(y) = \/1 у I. Результирующая связь между входом χ и выходом^ системы определяется равенством что приводит к зависимости, изображенной на рис. 4. Неожиданным моментом здесь оказывается тот факт, что выход системы не определяется однозначно входом, хотя все.звенья системы детерминированы (осуществляют взаимно однозначное преобразование сигналов). 2.2. Биологические сообщества. Пусть имеется η взаимодействующих биологических популяций, Xf обозначает численность z-й популяции. Скорость изменения Xf (разность между рождаемостью и смертностью) 20
в общем случае зависит не только от хи но и от численностей других популяций, что является результатом взаимодействия видов (отношения типа "хищник-жертва", конкуренция и др.)· Таким образом, динамика сообщества описывается системой дифференциальных уравнений dXf — = Λ(*ι> ·■·>*«)> z=l,...,w, at или, в векторном виде, dx — = F(x). (2.3) dt В более общей ситуации в правую часть (2.3) может входить некий вектор у, символизирующий внешние воздействия (управления) на сообщество. Такими воздействиями могут быть отстрел или подкормка животных, использование ядохимикатов для борьбы с вредителями, промышленные отходы, вырубка леса, осушение болот, внедрение в сообщество новых видов и т.п. Динамика системы при этом описывается дифференциальным уравнением с параметром dx dt Описанная модель - один из главных объектов изучения в математической биологии. Богатство содержания определяется здесь разнообразием конкретных вариантов. Разнообразие изучаемых задач также достаточно велико: существование и устойчивость периодических режимов (колебаний), характер роста популяций, вырождение отдельных видов, бифуркационные изменения в системе и т.д. В этом ряду важное место занимает чисто статическая задача о существовании равновесия, в котором наступает стабилизация численностей всех видов (в результате взаимной компенсации процессов размножения и гибели). В случае (2.4) может изучаться зависимость равновесия от внешних воздействий. На формальном языке все сводится к исследованию уравнения/? (х) = 0, илиF (х, у) = 0. Характерно, что интерпретация простейших математических выводов в содержательных биологических терминах нередко проливает свет на известные экзотические инциденты. Экзотика в биологии обычно связана с тем, что прямолинейные усилия, направленные на достижение определенного эффекта, дают обратный результат. Например, непосредственная борьба с вредителями приводит к увеличению их численности. Многочисленные факты подобного рода дали некоторым биологам повод для гипотез о наличии едва ли не мистических каналов, по которым гибнущие особи передают оставшимся в живых сигналы о необходимости увеличения производства потомков. Конечно, игнорировать странные гипотезы дело рискованное, но научный подход заключается все же не в поспешной генерации новых предположений*), а в методичных попытках объяснить факты на основе простейших предпосылок. Скромный математический анализ *) А. Пуанкаре говорил, что можно объяснить любые факты, если придумать достаточно сложную гипотезу. 21
в данном случае позволяет указать весьма "грубо материальные" источники биологических казусов. Характерно, что то, что выглядит тривиальным и прозрачным на математической модели, в содержательной интерпретации нередко оказывается интригующим и неожиданным. Скажем, увеличение равновесных численностей популяции при уменьшении рождаемости и увеличении смертности представляется противоестественным. Однако математическая модель легко позволяет усмотреть такую возможность. По-видимому, дело заключается в том, что человеческая интуиция хорошо приспособлена для анализа линейных цепочек причин и следствий. Такие цепочки человек пытается выделить и при рассмотрении сложных комплексов взаимодействующих факторов, что-то считая главным, чем-то пренебрегая. Но такой путь, как показывает опыт, часто приводит к ошибочным заключениям. Необходимо отметить, что формальная модель (2.4) охватывает гораздо более широкий круг проблемных ситуаций, чем тот, который уже упоминался. С теми или иными уточнениями сюда укладываются исследования половой и возрастной структуры отдельной популяции, возникновение эпидемий, различные процессы сбора урожая и т.д. Заметим также, что вместо (2.4) с равным успехом может использоваться модель с дискретным временем xk + l =G(xk,y). (2.5) Статика связана здесь с изучением уравнения χ - G(x, у). 2.3. Химические реакторы. Пусть в реакторе идет химическая реакция между η веществами, χ,- обозначает процентное содержание /-го вещества в смеси. Динамика системы описывается неким уравнением типа (2.4), где вектор у определяет внешние условия: температуру, давление, катализаторы, ингибиторы и т.д. Любые задачи здесь упираются в статику. Существует ли равновесие, как сместить его в желаемом направлении, например, увеличить концентрацию полезного продукта и уменьшить содержание вредных примесей? На модельном уровне все сводится опять-таки к изучению, уравнения F(x, у) = 0. 2.4. Массовое обслуживание. Основное русло теории массового обслуживания связано главным образом со статистическими методами. Трудно сказать, плохо это или хорошо, поскольку статистический подход имеет свои плюсы и минусы. Досадный момент здесь заключается в том, что преимущества очевидны и значительны, а недостатки замаскированы и непринципиальны, хотя и наносят реальный трудно распознаваемый ущерб. Дефекты статистического подхода в данном случае состоят в безобидной на первый взгляд расстановке акцентов, при которой главный упор делается на переходе от микроописания системы к ее макроописанию. Примерно тем же, но "на своем поле" занимается статистическая физика. Но если в физике самостоятельное значение имеет еще и чисто термодинамический (агрегированный) подход, то в теории массового обслуживания соответствующего аналога практически нет. В результате многие задачи массового обслуживания оказываются за пределами основного русла теории то ли потому, что они малоинтересны со статистической точки зрения, то ли, наоборот, по причине их "статистической непробиваемости". Конечно, это тема для отдельного самостоятельного разговора. Здесь мы затронули 22
этот вопрос отчасти для оправдания следующего примера, который с точки зрения теории массового обслуживания имеет несколько нетрадиционный характер. Пусть система включает η обслуживающих устройств Αχ. Качество обслуживания Αχ, изменяя которое, элемент может так или иначе влиять на перераспределение потоков клиентов, будем характеризовать величиной Xj. Цель каждого Αχ состоит в обеспечении оптимальной для себя загрузки ξ/. Понятно, что значение χχ, при котором обеспечивается загрузка ξ/, является функцией всего вектора х. Таким образом, равновесие в системе определяется решением некоторой системы уравнений видах/ = //(*) (/ = 1,.. ., и), или, в векторном виде, x=F(x). (2.6) В который уже раз (и не в последний) мы сталкиваемся с моделью чисто качественного характера. Ясно, что точное (и даже приближенное) описание оператора F обычно неизвестно. Тем не менее здесь есть полезная качественная информация, которая может служить основой для различных рекомендаций. Элементарные рассуждения показывают, что оператор F является монотонно возрастающим. Этого вполне достаточно для многих содержательных выводов. Рассмотрим несколько более сложный вариант постановки задачи. Пусть элементы Af подразделены на т непересекающихся групп А^·, каждая группа Kj имеет свой диспетчерский пункт Dj, на котором величина потока клиентов к Dj делится между элементами данной группы пропорционально их оптимальным загрузкам. Правдоподобно выглядят здесь следующие предположения. Если элемент Αχ принадлежит группе Kj, то улучшение качества обслуживания другими элементами этой группы приводит к увеличению потока клиентов к Dj и соответственно к увеличению загрузки Αχ. Улучшение же качества обслуживания элементами, не принадлежащими Kj, приводит к уменьшению потока клиентов к Dj и соответственно к уменьшению загрузки Αχ, В соответствии с этим разумно признать, что каждая функция// (х) не возрастает по переменным хк, если Αχ иЛд- принадлежат одной группе, и не убывает по остальным переменным. 2.5. Теория полезности. Пусть вектор х€Х CR" описывает набор потребительских благ. Субъективные предпочтения потребителя на множестве X обычно описываются неким бинарным отношением >, удовлетворяющим тем или иным требованиям, например: 1) Рефлексивность, т.е. χ > χ для любого χ Ε Χ. 2) Транзитивность, т.е. χ >.у, у > ζ =>х > ζ. 3) Для любой пары х, у Ε Χ справедливо по крайней мере одно из условий χ > у, у > χ (возможно, оба одновременно). Набор требований может быть шире, уже, может связываться и сопоставляться со свойствами других отношений на том же множестве X (например, χ > у => χ > у) и т.д. Современный подход к изучению поведения потребителя состоит в непосредственном исследовании свойств отношения > . Такое исследование существенно облегчается, если на множестве X удается задать функцию полезности φ(χ), определяемую единственным характеристическим свойством: φ(χ) > φ{γ) тогда и только тогда, когда χ > у. 23
Закономерно возникает вопрос об условиях существования такой функции. Это пример своеобразной, но отнюдь не редкой статической задачи. Существует ли функция, оператор с заданным набором свойств? В теории полезности подобный вопрос имеет самостоятельное значение. В других задачах аналогичные вопросы могут быть вспомогательными, но от этого не менее важными. Разнообразные вопросы такого плана возникают в задачах метаигрового синтеза (см. раздел 1.7). 2.6. Социологические модели. Задачи статики в социологии многочисленны и разнообразны, но мы не будем приводить конкретных примеров, поскольку с общесистемной точки зрения это будет лишь повторением пройденного. Социологические модели приводят к стандартным статическим, динамическим и оптимизационным задачам с типовыми математическими проблемами. Трудности социологического порядка заключаются в следующем. Часто, и не без оснований, задаются вопросом, имеет ли решение этих задач хотя бы частичное отношение к социологии. Дело в том, что первичным материалом в социологических моделях являются весьма неудобные "параметры": напряженность взаимоотношений в коллективе, степень сотрудничества, стиль руководства, доверие, осторожность, дальновидность и т.п. Даже за пределами психологии "степени свободы" социальных систем в основном имеют качественный характер: степень централизации управления, средняя квалификация, качество управленческих решений и т.д. Этим весьма расплывчатым понятиям на модельном уровне сопоставляются численные меры — модели становятся удобными, но доверие к ним оказывается подорванным, поскольку вопросы о существовании этих численных мер и о практических способах измерений обычно остаются без ответов (по крайней мере без убедительных ответов). В результате появляются серьезные основания, чтобы социологические модели называть спекулятивными и бесполезными. Критиковать их оказывается проще и безопаснее, нежели защищать. Но повторим то, что уже говорилось по поводу экономических моделей. Нужна не критика, а новые альтернативы. Кто возражает против математических моделей в социологии, вынужден пользоваться описательными, словесными. Дефекты последних более существенны, но менее очевидны, поскольку в таких моделях вообще мало что очевидно. Положение дел в социологии на сегодняшний день можно охарактеризовать так: математические модели плохи, но другие еще хуже. Постон и Стюарт [1], пытаясь возродить надежды скептиков на прогресс в области применения математических методов к социологии, обращаются к сравнениям с физикой старых времен. Действительно, для открытия параметров, характеризующих состояние физической системы, таких как масса, сила, энергия, температура, энтропия, потребовались грандиозные усилия многих поколений ученых. До того как это было сделано, в механике и теории тепла царил хаос, вполне аналогичный "социологическому". Конечно, такая аналогия, подогревает оптимизм, но плоды поисков в социологии будут скорее всего иными, чем в физике. Точное количественное решение социально-психологических задач является утопией. Ориентация на качественное решение проблем (укрепить дисциплину, стимулировать внедрение новой техники, повысить расходы на рекламу и т.п.), видимо, сохранится и в будущем. А в этом случае от математических моделей вовсе 24
не нужно требовать количественного соответствия. Модели, опираясь на фиктивные, ненаблюдаемые параметры, могут тем не менее служить удобными категориями мышления и приводить к разумным рекомендациям. Подобный трезвый взгляд полезен и при оценке того, что мы имеем на сегодняшний день. Излишние претензии к точности и поспешная критика мешают видеть рациональное зерно, которое, безусловно, есть в социологических моделях. 2.7. Оптимум Парето. Мы уже сталкивались с оптимизационными задачами вида <p(jt)->max, xGX. В этом случае φ(χ) часто называют целевой функцией системы. На практике широко распространены задачи, в которых одновременно имеется несколько целевых функций. Например, при поиске выгодного режима работы предприятия мы вынуждены думать об улучшении не одного, а многих показателей (вал, прибыль, рентабельность, себестоимость, надежность выполнения плана и т.д.). Выбирая конструкцию самолета для серийного производства, нам также приходится думать о многих показателях: себестоимости, грузоподъемности, потолке, максимальной дальности перелетов, экономичности эксплуатации. На формальном уровне такие задачи выглядят следующим образом. Имеется m целевых функций (критериев) Dx (χ), ..., Dftlx), и на множестве альтернатив X надо выбрать jc Ε Χ так, чтобы значения всех Dj(x) были как можно большими. Конечно, это лишь интуитивное пожелание, а не математическая постановка задачи, поскольку ясно, что одновременная максимизация нескольких функций в общем случае противоречива. Первая осмысленная задача, которая здесь возникает, заключается в выделении множества неулучшаемых альтернатив. Альтернатива χ Ε Χ называется неулучшаемой, если не существует другой альтернативы у Ε Χ, для которой Di(y)>Di(x), ί=1,...,/и, (2.7) причем хотя бы одно из неравенств (2.7) строгое. Неулучшаемые альтернативы называют оптимальными по Парето. При определенных (довольно жестких, но часто приемлемых) ограничениях изучение решений, оптимальных по Парето, сводится к параметрической задаче оптимизации Σ щDj(x)-*max, xGX. (2.8) i Меняя в (2.8) набор параметров μ,-, можно "перебрать" все паретовс- кие решения исходной задачи. При достаточной гладкости функций все сводится к исследованию нулей параметрического градиентного поля ν^Ζ,(μ, xt χ), где L — соответствующий лагранжиан. В частном случае X = Rn достаточно ограничиться рассмотрением градиентного поля I Нужно отметить, что сведение задач оптимизации к исследованию градиентных полей является стандартным методом, но отнюдь не обязательным. Многие качественные вопросы удобнее изучать непосредственно в терминах исходных функционалов. Поэтому нередко возникает обратная 25
задача. Работая с той или иной системой уравнений, пытаются найти (изобрести) функционал, экстремумы которого совпадают с искомыми решениями. На этом пути иногда удается получить весьма глубокие результаты, раскрывающие природу изучаемого явления (объекта) с совершенно новой стороны. Грандиозным примером на эту тему может служить открытие вариационных принципов в механике. Отметим, наконец, что паретовские решения часто рассматриваются в связи с игровыми постановками задач. ЕслиО((х) — выигрыш, a xt — стратегия /-го игрока, то ясно, что результат разумного коллективного договора может быть лишь оптимальным по Парето. По этой причине в теории игр множество паретовских решений иногда называют переговорным множеством, констатируя тем самым бессмысленность переговоров за его пределами*). § 3. Предмет системостатики Если отвлечься от конкретного содержания примеров из предыдущих двух параграфов, то упоминавшиеся задачи статики относятся в основном к изучению уравнений типа /=·(*) = <>, (3.1) ИЛИ F(x,y) = 0, (3.2) где у — вообще говоря, векторный параметр. Уравнения (3.1), (3.2) могут иметь более специальный вид. Например, F(x) может быть градиентом некоторого потенциала. Вместо (3.1) иногда возникает уравнение Р(х) = х, что приводит к изучению неподвижных точек оператора Р. Более общие задачи статики оказываются связанными с исследованием многозначных операторов, при этом основные вопросы относятся к разрешимости включений типа OGF(jc), xGP(x). (3.3) Наконец, ряд статических задач приводит к изучению систем уравнений и неравенств F(x)=0, G(x)>0. (3.4) Рассматривая примеры, мы говорили о плановых и чистых выпусках, ценах, функциях избыточного спроса, нэшевских решениях, хищниках и жертвах, нелинейных цепях, законах Кирхгофа и т.д. Понятно, чтобы охватить задачи статики в целом, выработать общесистемную точку зрения, надо подняться над этим конкретно-прикладным уровнем. Однако, если мы поднимемся очень высоко и зададимся целью исследования задач (3.1)- (3.4) общего вида, то попадем в другую крайность. Научная дисциплина, занимающаяся изучением задач типа (3.1) —(3.4), давно существует — это *) Конечно, это не означает, что любая игра будет практически решаться в рамках переговорного множества; см. дилемму заключенного. 26
нелинейный анализ. Методы нелинейного анализа, бесспорно, играют важную роль в решении статических вопросов, но опыт показывает, что они далеки от конкретных приложений, плохо учитывают специфику решаемых задач. Поэтому представляется целесообразным развивать системоста- тику как научную дисциплину, занимающую промежуточное положение между нелинейным анализом и конкретными прикладными областями. В системостатике не должно быть доходов и прибылей, токов и напряжений, популяций и борьбы за существование, но уровень абстракции нужен едва ли не минимальный, чтобы теоретические исследования продвигались достаточно далеко, а получаемые результаты были полезны и удобны в приложениях. Конечно, эти соображения читатель вправе расценивать пока как благие пожелания. Возможности их реализации в некоторой степени раскрываются в последующих главах и, быть может в большей степени, ожидают своих первопроходцев. Детальный сценарий для развития системостатики, конечно, нельзя составить заранее. Многие прогнозы и рекомендации на деле оказываются малоинтересными, ведут в тупик, и, наоборот, пустяковые с первого взгляда задачи часто разрастаются и становятся главенствующими направлениями исследований. Поэтому планировать разумно лишь общую ориентацию. Одно из наиболее важных соображений заключается здесь в следующем. Желательно начинать не с уравнений, а с классов систем. Такое пожелание легче высказать, чем ему следовать, тем более что его нельзя воспринимать буквально. Вот несколько примеров, раскрывающих его содержание. 1. При изучении многих систем мы сталкиваемся с описанием динамики вида χ = F (х), причем состояние системы χ = {χ ι,..., χη} в любой момент времени представляет собой заведомо набор неотрицательных параметров (цены, объемы выпусков, численности, концентрации и т.п.). В этом случае оператор F должен быть так устроен, что любая траектория уравнения χ = F(x) не может выйти из неотрицательного ортанта. Возникает естественная задача: описать такие операторы (системы) в общих терминах и найти в рамках выделенного класса условия существования равновесия. Сначала может показаться, что лучшее, на что здесь можно рассчитывать, это о дна-две теоремы о разрешимости уравнений F(x) = 0 специального типа. Но, как будет видно из дальнейшего, здесь возможна своя маленькая теория (К-отображений, или К-систем) с разветвленной сетью результатов, далеко выходящих за рамки исходной постановки задачи. 2. Систему обычно мыслят как совокупность взаимодействующих частей (элементов). Кстати, это неплохое определение системы. Оно расплывчато и неточно, но, оставляя большую свободу трактовок, улавливает главное. Если речь идет о системе, то в центре внимания должны быть взаимосвязи ее звеньев, ибо характер взаимодействия частей в основном определяет поведение системы в целом. Межэлементные связи системы можно изучать под разным углом зрения. Простейшие но достаточно эффективный способ заключается в следующем. Если состояние системы описывается вектором χ = { Χι, ..., хп), а ее поведение в целом так или иначе зависит от оператора F(x) ={ /i(x), ..., fn(x))> T0 систему можно представлять как совокупность элементов, каждый из которых описывается своим параметром х,- и своей функцией /,- (χ). В этом случае межэлементные связи можно характеризовать влиянием параметров х,- на различные 27
компоненты оператора F. Первоначально идея выглядит малопривлекательной, поскольку наличие сходства в этом отношении у систем различной природы представляется маловероятным. Тем не менее такое сходство обнаруживается. Например, в моделях из предыдущих двух параграфов мы неоднократно сталкивались с операторами, обладающими свойством обобщенной монотонности (каждая функция //(*) по каждой в отдельности координате ху или возрастает, или убывает). В дальнейшем такие операторы (системы) будут называться гетерогенными. Правда, гетерогенность системы поначалу тоже едва ли может вызвать энтузиазм, поскольку свойство выглядит чересчур общим и малоперспективным для получения конкретных результатов. К счастью, это не так. Теория гетерогенных систем оказывается весьма продуктивной и достаточно конкретной. 3. В задачах, сводящихся к изучению уравнений вида^(х) -у, переменные Xj часто естественно интерпретировать как действия, aj>/ — как результаты. Зависимость yi = // (χ) не только от "своего" действия χί9 но и от других Xj, можно воспринимать как наличие побочных влияний. Казалось бы, что нет никакой разницы, говорить ли просто о переменных или же о действиях и результатах. Однако новые слова способны вызывать полезные ассоциации, расширять поле зрения. Так или иначе, но системы "действия — результаты" представляются весьма перспективным объектом исследования. Уже первые шаги (см. далее теорию Р-систем) оказываются здесь неожиданными и многообещающими. 4. В системах различной природы могут решаться близкие по духу задачи. Например, задачи распределения ресурсов, координации взаимодействий, перераспределения ответственности, синтеза оптимальных законов управления. Соответственно можно изучать классы распределительных систем, координируемых и т.п. Многие практические задачи связаны с оптимизацией целевых функций и, наоборот, с поиском целевых функций, другими словами, с поиском вспомогательных функционалов, которые оптимизируются в процессе работы системы. Это тоже один из важных и продуктивных источников общесистемных постановок задач. 5. Решение задач большой размерности часто приводит к необходимости перехода на принципиально иной уровень их описания, что может выражаться в агрегировании или декомпозиции. Принципы агрегирования и декомпозиции являются одними из весьма существенных аспектов общесистемного подхода. Возникающие здесь задачи многообразны, интересный мало исследованы. В рамках системостатики они занимают особое положение и поэтому будут обсуждены отдельно в следующем параграфе. Список аналогичных примеров можно было бы продолжить, но и этого вполне достаточно, если говорить об ориентации системостатики в целом, а не о детальном плане ее развития. Остановимся, наконец, на одном принципиальном моменте, который на самом деле важным не является, но может быть источником бесполезных споров. Если не сейчас, то после ознакомления с содержанием последующих глав некоторые читатели могут заметить, что, несмотря на системную терминологию и системное происхождение задач, речь в основном идет о проблемах нелинейного анализа. Поэтому, мол, системостатика не является самостоятельной научной дисциплиной, а представляет собой своеобразный раздел нелинейного анализа. Спорить здесь бесполезно и едва ли нужно. 28
Там, где это не создает помех, каждому лучше предоставить право на субъективный взгляд. Тот, кто научную дисциплину отождествляет с ее "теоремным" содержанием, всегда будет отрицать существование таких прикладных дисциплин, как автоматическое регулирование (это раздел дифференциальных уравнений), теория информации (это глава теории вероятностей) и др. Важно, что системостатика имеет собственный мощный источник практических проблем. Находится ли этот источник на территории нелинейного анализа или на нейтральной полосе — вопрос второстепенный. § 4. Укрупненные описания, агрегирование и декомпозиция Если система имеет много степеней свободы, то часто возникает необходимость ее описания с помощью укрупненных (агрегированных) показателей. Такую необходимость порождают причины двоякого рода: детальное описание системы оказывается или невозможным, или ненужным (или то и другое вместе). Скажем, при составлении государственного экономического плана использование детальных моделей практически невозможно из-за громадных размерностей возникающих задач. Поэтому план составляется на основе укрупненных (агрегированных) экономических моделей, в которых переменными являются суммарные объемы выпусков различных отраслей. Такой план (сбалансированный лишь в среднем) при последующем дезагрегировании практически всегда приводит к нестыковкам (нарушению детального баланса), а следовательно, к издержкам, но с этим приходится мириться. Прежде чем продолжить разговор в избранном направлении, остановимся на затронутом принципиальном вопросе. Целесообразно ли добиваться баланса экономики по всему ассортименту выпускаемых товаров? Допустим на минуту невозможное — мы располагаем детальным балансом всей экономики, т.е. знаем, что и в каком количестве должно производить каждое предприятие. Сможет ли экономика следовать такому плану? Конечно, нет. На отдельных предприятиях будут происходить неизбежные срывы выполнения плановых заданий. Причины всегда найдутся: погодные условия, аварии, эпидемия гриппа, ошибки в принятии решений и т.п. Любой же сбой в экономике по цепочкам распространяется весьма далеко. Приборостроительный завод не выполнил план. В результате "копеечных" приборов не хватило для пуска построенного металлугрического комбината. Задержка с пуском повлекла за собой задержки в снабжении металлопродукцией многих других предприятий. Далее процесс лавинообразно нарастает. Поэтому ясно, что в отлаженной экономической машине должны быть механизмы саморегуляции, резервы производственных мощностей и многое другое. В любом случае экономика не может работать как Часы. Накладки, неувязки, сбои, потери, — неизбежны. Это нужно признать. Не для оправдания существующих недостатков, а для постановки реальных целей, состоящих в минимизации неизбежных потерь. Вернемся теперь к основной теме. Рассмотрим какую-либо термодинамическую систему, например газ в оболочке. Детальное описание движения всех молекул газа, конечно, невозможно, но обычно оно и не нужно. Макровзаимодействия газа полностью определяют макропараметры (давление, температура, энтропия). 29
A = 1 12} Рассмотренные два примера (экономика и термодинамика) принципиально отличаются друг от друга. Если в термодинамике макропараметры позволяют практически точно отвечать на возникающие "макро- вопросы", то в экономике ситуация иная. Агрегирование в экономике часто приводит к потерям в качестве решений, причем не только при дезагрегировании. Причины возникающих потерь являются стержневыми вопросами всей проблематики агрегирования. Какие системы (задачи) допускают укрупненное описание без каких бы то ни было потерь? Если такое описание возможно, то как его найти? Если невозможно — то какое (приближенное) макроописание наиболее удовлетворительно? Возьмем простой пример. Пусть речь идет о леонтьевской модели межотраслевого баланса (см. § 1) х=Ах+у. (4.1) Разобьем матрицу А = [ai}] на блоки тАц Αι: и перепишем (4.1) в виде двух векторных уравнений Xх = АХ1х1 + А12х2 */, (4.2) х2 = А21х1 + А22х2 +/, (4.3) Таким образом, х* здесь представляет объединение первых, скажем, т компонент «-мерного вектора х, а х2 — объединение последних (п - т) компонент. Допустим, в решении (4.1) нас интересуют (пока или вообще) значения лишь двух параметров (агрегатов) т η Ί\χι\\= Σ xh II χ21|= Σ χ,. '1 = 1 / = 7И + 1 Для их определения поступим следующим образом. Сложим все уравнения (4.2), а потом также поступим с уравнениями (4.3). В результате получим два уравнения т η ΐι*4ι= ς [4n]f*f+ ς μ,^,.χ, + ιι/ιΐ, / = 1 i-m +1 (4.4) ||x2 ||= Σ [Λ2Ι ],·*,· + Σ И22],.*,·+ |lj>2II, 1 = 1 i = m +1 где Ир^]г· обозначает сумму элементов z-го столбца матрицы Apq. Если окажется, что [Apq]. = bpqy т.е. в каждом столбце сумма элементов одинакова, то (4.4) приобретает вид II*1 II = Ь1Х\\х1\\ +Ь,а||ха|| + ||/||, \\х2\\ = bl2\\xl || + й22||ха|| + ||j2||. Это означает, что система (4.1) в данном случае агрегируема. Значения агрегатов однозначно связаны между собой; не зная детальной информации, можно определить точные значения агрегатов. 30
В противном случае Ир<7]. Φ const выбранные параметры агрегатами по существу не являются и определены быть не могут (без дополнительной информации о системе). Означает ли это, что система (4.1) неагрегируема? Вообще говоря, нет. Ведь в качестве агрегатов можно попробовать взять другие параметры: другие наборы компонент вектора х, их взвешенные комбинации и т.д. Посмотрим теперь, что происходит при "насильственном" агрегировании (характерном для экономических приложений). Перепишем уравнения (4.4) в виде И*1 II =b11(x)IU1|l +*i2(*)IU2ll + НУ II, ( II*2 II = Ь21(х)\\х1\\+Ь2г(х)\\х2\\ + ||;;2||, ( ' } где, например, т х- ί = ι \\χ II Зависимость коэффициентов bpq от χ не позволяет решить (4.5) относительно агрегатов, если вектор χ неизвестен. Тогда проводят другую "насильственную" операцию. Берут ожидаемое (предположительное, прики- дочное, а иногда и произвольное) значение вектора χ и bpq(x) полагают равными соответствующим константам. В результате получаются уравнения, которые характеризуют не столько исходную систему, сколько гадательные способности исследователя. Представление о проблематике агрегирования будет далеко неполным, если оно будет опираться лишь на возможные нелинейные обобщения рассмотренного примера. Задачи агрегирования возникают и в ситуациях иной природы. Первый эталонный пример подобного сорта являют собой термодинамика и статистическая физика. Обе эти дисциплины по существу направлены на решение одних и тех же задач, но отличаются подходами. Если термодинамика сразу начинает с выяснения закономерностей на макроуровне, то статистическая физика пытается проложить мост от микроописания системы к макроописанию. Оба подхода имеют свои преимущества и недостатки, и оба их целесообразно сохранить при рассмотрении более широкого круга задач. К сожалению, практика часто дает крен в ту или другую сторону. Например, в теории массового обслуживания (которая в основном занимается задачами укрупнения описаний) доминируют сугубо статистические методы. При изучении экономических задач ни тот, ни другой подход пока не получил достаточно широкого распространения. Между тем в экономике есть довольно много проблем, где применение термодинамических или статистических методов буквально напрашивается. Конечно, реализовать это не так просто. От интуитивных впечатлений к практическим результатам всегда ведет долгий путь, и его наиболее трудоемкая часть приходится на то, чтобы переосмыслить и заново сформулировать старые задачи. Конкретные вопросы агрегирования отличаются большим разнообразием форм и содержания. Замена электрической цепи эквивалентным сопротивлением, введение равновесных цен и выяснение их роли, описание системы с помощью усредненных характеристик, поиск набора инвариант- 31
ных преобразований системы — все это вопросы, так или иначе связанные с агрегированием. Поэтому дать общематематаческие постановки задач агрегирования без ущерба для широты позиции практически невозможно. Конечно, можно (и даже нужно) выделять классы задач, и мы будем заниматься этим в дальнейшем. Пока же проблематику в целом можно охарактеризовать так. К агрегированию относятся задачи, связанные с выделением для систем большой размерности сравнительно небольшой группы параметров, которые так или иначе характеризуют поведение системы в целом и позволяют отвечать на некоторый круг "макровопросов". Отмеченные трудности общей формализации в равной мере относятся к задачам декомпозиции. Центральная идея здесь заключается в разбиении и решении исходной "большой" задачи по частям. Иногда такое разбиение позволяет анализировать эти части (куски) независимо друг от друга, иногда требуется дополнительная координация решений, но в любом случае декомпозиция подразумевает сведение задачи к решению нескольких более простых задач. Любые попытки уточнения этого "определения" лишь ограничивают поле зрения. Если говорить о характерных приложениях, то наиболее широкое распространение декомпозиция получила при построении вычислительных алгоритмов для задач оптимизации. Соответствующие результаты широко освещены в литературе и нас практически не будут интересовать. В решении качественных вопросов декомпозиция менее популярна, и ее возможности остаются далеко не выясненными. Быть может, в качественном анализе саму декомпозицию нужно понимать несколько иначе. Ведь в численных методах переход к серии более простых задач означает, как правило, переход к задачам меньшей размерности. И для машинного счета это существенно. При "теоремном" же анализе задачи фактор размерности обычно непринципиален. Простота здесь заключается в другом: в приведении задачи к виду, удобному для применения определенных теорий и методов. С этой точки зрения упрощение задачи может даже сопровождаться повышением размерности. И это отнюдь не экзотика. Подобное повышение размерности исходной задачи, например, резко упрощает анализ гетерогенных систем (см. гл. IV). Конечно, при таком широком понимании термин "декомпозиция" вступает в конфликт со своим семантическим содержанием, и ему лучше найти подходящую замену. Но еще лучше на первых порах заниматься не терминами, а результатами. На сегодняшний день в коллекции изобретений, позволяющих упрощать анализ нелинейных систем, переходить к решению более удобных задач, довольно много экспонатов. Тем не менее здесь еще остается обширное поле для новых поисков.
ГЛАВА II ГЕОМЕТРИЧЕСКИЕ ПРИНЦИПЫ РАЗРЕШИМОСТИ УРАВНЕНИЙ Основное внимание в главе уделяется топологическим методам, которые в системных исследованиях применяются сравнительно давно, однако в большинстве случаев это, как правило, ограничивается использованием теоремы Брауэра или Какутани. На Самом же деле теоремы Брауэра и Каку- тани — лишь маленький фрагмент общей идеологии, богатой другими полезными фактами. Последующие результаты базируются на фундаментальном понятии вращения векторного поля. Однако скрупулезное и абсолютно строгое изложение теории вращения в нашу задачу не входит. Наша единственная цель — ввести читателя, не знакомого с топологическими методами, в курс дела и подготовить аппарат для использования в системных приложениях. § 1. Основные топологические понятия Далее R" обозначаете мерное нормированное пространство. Как правило^ предполагается, что в R" фиксирована некоторая система координат (базис) . Это позволяет представлять элементы χ € Rn и отображения F: R" -> ->R" в виде * = {*!....."*,,>, ^*)=</ι(*)..--,Λι(*)>. Норма в Rn порождает топологию' (систему открытых множеств). Эта топология индуцирует топологию на любом подмножестве ICR": множество UCX считается открытым в X, если оно представляет собой пересечение X с некоторым множеством, открытым в Rn. 1Л. Связность. Пространство X называется связным, если его невозможно представить в виде объединения двух непересекающихся открытых (непустых) множеств; линейно связным, если для любых двух точек а, Ъ Ε X существует непрерьюное отображение Р: [0, 1] -> X такое, что Р{0) = а, Д1) = Ь, т.е. любые две точки могут быть соединены непрерывной кривой, целиком лежащей в X, Линейная связность X влечет за собой связность X (обратное неверно). 1.2. Сужение и продолжение отображений. Пусть F: X -> Υ — непрерывное отображение*). При этом для любого Ζ СХ естественным образом определяется отображение G: Ζ -> Υ такое, что G(x) = F(x) для всех χ G Ζ. Отображение G называется сужением F на Ζ и обозначается символом F\ z. *) Все рассматриваемые отображения предполагаются непрерывными, даже если это специально не оговорено. 33
В свою очередь F называется продолжением {распространением) отображения G на X. Одна из важных задач топологии — задача продолжения: можно ли данное отображение G: Ζ -> У, где Ζ СХ, продолжить наХ (конечно, имеется в виду непрерывное продолжение)? С прикладной точки зрения особо интересен тот случай, когда X представляет собой замкнутый шар В CR", а Υ совпадает с Ζ и является границей шара В, т.е. сферой S. Известно, например, что тождественное отображение сферы S на себя не может быть продолжено на шар А Негативный характер этого утверждения не умаляет его ценности. Будучи надлежащим образом переформулировано, оно приводит к позитивному утвервдению, а именно к теореме Бpayэра: Любое непрерывное отображение F: B-+B имеет неподвижную точку х* G В. Действительно, предположим, что существует отображение F: В -> В, не имеющее неподвижных точек, т.е. F(x) Φ χ при любом χ G В. Соединим тогда точки χ и F(x) отрезком и продолжим его за точку χ до пересечения со сферой S в некоторой точке Р(х). Очевидно, Р: В -+S представляет собой непрерывное продолжение на шар В тождественного отображения сферы на себя, что невозможно. 1.3. Гомотопия отображений и векторных полей. Частным случаем задачи продолжения является вопрос о гомотопности отображений. Отображения F0>Fii X^Y назьваются гомотопными, если существует непрерывное по совокупности переменных отображение Я: X X [0,1 ] -* Υ такое, что tf(x,0)sF0(jr), Я(х, l)sF!(x). (1.1) При этомЯ(д:, г) называют деформацией или гомотопией (гомотопическим мостом) от F0 к F\. Легко видеть, что построение гомотопии от F0 к Fx равносильно продолжению отображения Я: 1Х{0}Х{1}^У, определяемого условиями (1.1), на пространство XX [0,1]. Если F0 гомотопно Fl9 мы будем писать F0 - F'{. Очевидно, гомотопность является отношением эквивалентности. Если существует пара отображений F: X^Y, G: Υ ^Х таких, что GF ** IX\X-»X9 FG^IY: Y-+Y, где / — тождественное отображение, то пространства Χ, Υ называют гомо- топически эквивалентными и пишут X — Υ. Пространство, гомотопически эквивалентное точке, называют стягиваемым (по себе). Равносильное определение: пространство X стягиваемо,если оно может быть непрерывно деформировано в точку х0 G X, т.е. существует непрерывное отображение Я: XX [0,1] ->* такое, что #(jtf0)sjc, Я(х, 1) = *0. (1-2) Стягиваемым является, например, любое выпуклое множество. Отображение, переводящее все точки χ G X в одну общую точку, назы-. вается постоянным. Если F гомотопно постоянному отображению, to говорят, что F гомотопно нулю (и пишут F— 0). Отображения в R" иногда называют векторными полями (вектору χ G G R" сопоставляется вектор F(x) Ε R"). Как правило, векторное поле F 34
считается определенным на замыкании Ω некоторой ограниченной области *) Ω С R" или же на границе Ω. Точку х, в которой F(x) = 0 (здесь и далее 0 обозначает нуль пространства R"), называют нулем (или особой точкой) векторного поля. Поле F называют невырожденным на множестве Г С R", если F(x) Φ 0 для любого х е Г. Далее будут изучаться лишь непрерывные векторные поля, не вырожденные на границе рассматриваемой области Ω. Векторные поля F0 и Fx называются гомотопными на Ω (или просто гомотопными, когда заведомо ясно, о каком множестве идет речь), если существует невырожденная гомотопияЯ(х, г), Я: ΩΧ [0,1] ^R", от Fo к Fi. Другими словами, векторные поля F0n Fi гомотопны, если отображения Fc-Fi гомотопны как отображения из Ω вЛ"\(0). 1.4. Гомеоморфизмы. Отображение F: X -* У называется сюръектив- ным (сюръекцией), если для любого у G У найдется элемент χ Ε X такой, что F(x) = у. Другими словами, F: X -* Υ сюръективно, если F(X) = Υ. Отображение F: X -* Υ назьвается инъективным {инъекцией), если из F(x\) = F(x2) следует хг = х2, т.е. инъекция - это взаимно однозначное отображение (обратный оператор F"*1, однако, может не быть определен на всем Y). Если F: X -> Υ инъективно, сюръективно и непрерьгоно в обе стороны (т.е. оба оператора F и F"*1 непрерывны), то говорят, что F - гомеоморфизм X на У. В том случае, когда существует гомеоморфизм Хна У, говорят, что X и Υ гомеоморфньи Наконец, F: X -> У называется локальным гомеоморфизмом, если для любой пары x€ijGF такой, что F(x) -у, найдутся открытые окрестности Vx CX, Wy С Υ точек jc, у такие, что сужение F на Vx есть гомеоморфизм Vx на IVу. Для случая F: R" -*R" широко известны достаточные условия локальной гомеоморфности, состоящие в невырожденности матрицы Якоби F'(x) = Wi/bXf]. 1.5. Гладкие отображения и многообразия. Пусть X С R" и УС Rm — открытые множества. Отображение F: X -* У называется гладким, если все частные производные bkfijbxji ... Злу существуют и непрерывны. Отображение F: Χ ^Υ называется диффеоморфизмом, если F — гомеоморфизм и оба отображения F и F"1 -гладкие. Множество ICR" назьюается гладким m-мерным многообразием, если для любой точки xGX можно указать окрестность VOX, которая диффео- морфна открытому множеству U С Rm. Установление диффеоморфизма между U и V Π Χ равносильно введению параметризации области VOX: точки у Ε VH X описываются взаимно однозначным и взаимно гладким преобразованием Д7=Д7(*ь...>*т)» / = 1,...,и. Переменные х\, ».., xw называются локальными координатами на VOX. *) Областью назьюается открытое связное множество. 35
Если множество ХС R" открыто, то в любой точке χ G Xдифференциал отображения F: Х-* Rm определяется так: dFx (h) = lim . t -»·ο t Известно, что для гладких отображений dFx(h) = F'(x) h, где F'(x) = = [bff/bxj] —матрица Як оби. В общем случае гладкого отображения F: X^Y дифференциал (производная) определяется несколько более сложно. Если ICR" - т-мерное многообразие, то в каждой точке χ Ε Χ вводится касательная гя-мерная плоскость, которая наилучшим образом аппроксимирует ^вблизи х. Параллельная ей плоскость Тх, проходящая через начало координат, называется касательным пространством многообразия X в точке х. Аналогично определяются касательные пространства Ту (yGY). Если F (х) = у, то наилучшая линейная аппроксимация F в окрестности χ отображает Тх в Ту и называется производной F в точке х. Понятно, что эта производная может быть записана как матрица Якоби в локальных координатах. Пусть Qm обозначает полупространство Qm={x\x={xi,...,xm)eRm, хг>0). Краем Qm называется плоскость {OjXR'""1 CRm. Множество ХС R" называется гладким тп-мерным многообразием с краем, если для любого xGXможно указать окрестность V Π X, диффео- морфную открытому множеству ί/Π Qm полупространства Qm. Край X — это множество тех точек из X, которые под действием соответствующих диффеоморфизмов переходят в точки края Qm. Например, краем замкнутого шара является сфера. Сфера же (не нуль-мерная) — многообразие без края. Касательные пространства Тх для многообразий с краем определяются так же. Даже если χ — точка края, Тх представляет собой Rm. Два отображения F0) F\i X^Y называются гладко гомотопными, если существует гладкое отображение Н: XX [0, 1] ->F, удовлетворяющее условию (1.1). Отношение гладкой гомотопности также является отношением эквивалентности (хотя это и менее очевидно, чем для непрерывной гомотопности). 1.6. Теорема Сарда. Пусть F'(x) обозначает производную в локальных координатах гладкого отображения F: X-+Y многообразий одинаковой размерности. Если detF'(x) ^ О (=0), то χеX называется регулярной (критической) точкой отображения F: Х-+ Υ. Точкам е У называется регулярным (критическим) значением, если ее прообраз F~*(y) состоит только (не только) из регулярных точек. Очевидно, если X - компакт, то прообраз любого регулярного значения состоит не более чем из конечного числа точек. Теорема 1.1. Множество критических значений отображения F: X-+Y имеет нулевую лебегову меру. Схема доказательства довольно проста. Многообразие можно покрыть счетным множеством окрестностей, каждая из которых диффеоморфна открытому подмножеству из Rm. Далее достаточно рассматривать отображение G-FP: Rw-> Υ (где Ρ - соответствующий диффеоморфизм) лишь на некотором кубе С с Rm со стороной с. Разобьем этот куб на Ν171 равных кубиков, разделив каждое ребро на ТУ равных частей. Для любой пары точек х0, х, лежащих в одном из таких кубиков, G(x) = G'(x0)(x-x0)+o(c/N). 36
Если х0 является критической точкой, т.е. detG'(x0) = 0, то ясно, что объем образа этого кубика есть o(c/N)m. Если теперь kN обозначает число кубиков, содержащих критические точки, то суммарный объем образов таких кубиков eerbktfo(c/N)m, причем заведомо kpj^N™. В пределе (при N-+°°) приходим к выводу о том, что лебегова мера в У множества критических значений равна нулю. D Значит множество регулярных значений всюду плотно в Y. Если размерность многообразия Υ равна т и меньше размерности X, то регулярными называются те точки хе!,в которых ранг матрицы F'(x) равен т. Определение регулярных значений остается прежним. Теорема 1.1 сохрнаяет силу для случая многообразий Χ, Υ различных размерностей. 1.7. Ориентация. Дйа базиса{е1,..., еп} и {е[,. . ., е'п)пространства R" называются одинаково ориентированными, если е\ - ?^-е· и detty.·] > 0. В случае det[j^·] < 0 говорят, что базисы противоположно ориентированы. Очевидно, все базисы в R" распадаются на два класса эквивалентных (в смысле ориентации) базисов. Любое линейное невырожденное преобразование A: R"->R" переводит исходный базис {<?!, · · · у еп)в некоторый {е\,. . ., е'п). В этом случае говорят, что А сохраняет ориентацию пространства, если det/Ι > 0; изменяет ориентацию, если detA < 0. Пусть теперь X с Rn - связное, гладкое w-мерное многообразие. Для каждой точки х& X существует окрестность Vxc X и диффеоморфизм Р, отображающий Vx на открытое подмножеств ·» R,w или Qm с Rw. В R™ фиксируем некоторую систему координат со стандартным базисом ех ={1,0,...,0},..., ет={0 0,1). (1 3) Тем самым фиксируется ориентация Rm. Выберем также (локальные) базисы в каждом касательном пространстве Τχ. В достаточно малой окрестности точки χ диффеоморфизм Ρ аппроксимируется линейным отображением (производной) Р'(х), которое будем считать записанным в виде матрицы в соответствующих координатах, определяемых выбранными Лазисами. Если все локальные базисы одинаково ориентированы с (1.3) и detP'(x) > 0 для любого хе Ху многообразие X называется ориентированным. Поскольку восприятие понятия ориентации многообразия нередко вызывает затруднения, повторим определение, изменив точку зрения. Пусть по-прежнему Rm ориентировано базисом (1.3), локальные же базисы в 7^пока фиксировать не будем. Диффеоморфизм Ρ и производную Ρ '(χ) будем записывать в координатах пространства R", в котором расположено X. Ранг матрицы Ρ '(χ) равен m, и базис (1.3) она переводит в базис {Р' (х) <?,,.. .,Р'(х)ет) , который теперь будем считать локальным базисом в Тх. Если все базисы (1.4) одинаково ориентированы с базисом (1.3), многообразие X называется ориентированным. Таким образом, чтобы многообразие X было ориентируемо, необходимо следующее условие согласования. В пределах каждой окрестности Vx С X, взятой в отдельности, ориентации базисов (1.4), безусловно, совпадают друг с другом. Но в пересечении двух таких окрестностей действуют два различных диффеоморфизма, которые в каждой точке порождают два различных базиса вида (1.4). Совпадение ориентации последних обеспечивает ориентируемость X. Понятно, что любое открытое в Rn многообразие X ориентируемо, поскольку все диффеоморфизмы можно взять тождественными. Если многообразие X имеет край, то ориентация X (с помощью соответствующего набора диффеоморфизмов) естественно порождает ориентацию края X. Остановимся на этом более подробно. Пусть окрестности Ь\ V с X имеют непустое пересечение ив ί/η V имеются точки края X. Пусть .γ,, .. ., хт - локальные координаты в U, ylt . .., ут - локальные координаты в ί/. В пересечении Un V имеем V/ -yf{xl, . .., хт) (/ = 1, ..., т); точки края описываются условием хх =0 или ух =0. Из соотношения ух = ух (0, 37
λ*2,.. ., хт) вытекает Ъ(хг,...,. ,хт) 9л:, Э(х2,. .. ,хт) Поскольку якобиан * '''',Ут > 0 и —^i- > 0, то и якобиан Э(·^''' *'^ > 0. ЭЛ %) Эх, Э(*а,...,*т) § 2. Интуитивно геометрическая картина теории вращения векторных полей В этом параграфе дается нестрогое, но достаточно прозрачное определение вращения векторного поля. С помощью наглядных геометрических рассуждений выводятся основные свойства вращения и прослеживаются связи с принципами разрешимости уравнений. Изложение апеллирует к геометрической интуиции читателя. Интуитивные представления полезны во многих отношениях. Как правило, они служат путеводной нитью при изучении предмета, нередко позволяют выдвигать гипотезы, подсказывают схемы строгих доказательств и предостерегают от ошибок (но случается, что бывают источником заблуждений). Выработка интуитивных представлений в той или иной области — обычно весьма трудоемкий процесс, но в конечном итоге затраты с лихвой окупаются. 2.1. Предварительные соображения. Если непрерывная функция/задана ни отрезке [а, Ь] и в граничных точках принимает значения разных знаков, то уравнение f(x) = О разрешимо на [а, Ь]. Ситуация значительно усложняется при рассмотрении отображений в пространствах большего числа измерений. Пусть непрерывный оператор (отображение) F действует в R" (п> 2), и нас интересует вопрос о существовании решения уравнения F(x) = 0 в 1 некоторой ограниченной области Ω. Другими словами, мы интересуемся^ тем, принадлежит ли 0 образу Ω или нет. Действительно, если OeF(ft), то это означает существование такого x*G Ω, 4to.F(x*) =0, т.е. уравнение F (χ) =0 разрешимо в Ω. Если ответ на поставленный вопрос мы хотим получить в терминах зна-, чений оператора F на границе ή, то рассуждать можно примерно так. Пусть] F(U) обозначает поверхность, являющуюся образом Ω. Интуиция подска-| зывает, что образ Ω, т.е. F(£2), заполняет область (но не обязательно1 совпадает с ней), находящуюся внутри F(Q). Если при этом 0 лежит внутри F(Q), то 0 GF(U), и задача решена. На самом деле все не так просто, и главная трудность заключается в определении понятия "внутри". Например, окружность при некотором преобразовании F может перейти в замкнутую кривую, изображенную на рис. 5, а. Нетривиальность ситуации здесь достаточно очевидна*). Если же понятие "внутри" не определено, то интуитивный вывод о том, что F(Q) заполняет "внутренность" F(&), теряет *) Если внутренность определить подходящим для на9 образом [т.е. так, чтобы образ F(a) с необходимостью заполнял внутренность F(n) ], то точка Л на рис. 5,4 будет внутренней, а В — нет. Визуально легче оценить ситуацию, изображенную на рис. 5,6. 38
смысл*) (интуиция обычно основывается на совсем простых примерах). Наконец, если даже эти трудности будут преодолены, необходимо развить формализм, который бы в случае п>2 позволял обходиться без "чертежей". Перечисленные препятствия на избранном пути показывают, какие именно вопросы должны быть более детально продуманы и как стоит видоизменить подход. Оставим эти проблемы до следующего раздела и рассмотрим пока простейший случай, опираясь на следующее (временное) понятие "внутри". Пусть О Ε Ω. Договоримся, что в этом случае точка 0 лежит внутри поверхности Г, если мы можем, непрерывно деформируя Г, совместить ее с Ω и при этой деформации не задеваем точку 0 (т.е. деформируемая поверхность в процессе деформации не пересекает точку 0). Более того, при такой деформации различные точки из Г должны переходить в различные точки из Ω (в то же время каждая точка самопересечения Г может переходить в разные точки Ω). Это "определение" полезно продумать на нескольких конкретных примерах. Сначала для поверхностей Ω типа сферы S ={х\ 1Ы1= 1}, а затем для более сложных поверхностей, не ограничиваясь лишь плоским случаем (как на рис. 6). Итак, чтобы установить, что 0 лежит внутри F(U), достаточно деформировать указанным способом ^(Ω) на Ω. В процессе такой деформации каждая точка F(x) GF(U) описывает некоторую траекторию, заканчивающуюся на Ω. Допустим, что концами каждой траектории является *) Более того, даже в простейшем случае, когда Ω - сфера и F оставляет Ω на Месте, такой вывод - нетривиальный топологический факт, равносильный теореме Брауэра или утверждению о нестягиваемости сферы. 39
пара точек χξ Ω и F(x) GF(&). Эта деформация описывается некоторым непрерывным отображением Η: Ω Χ [0, 1 ] -> R", удовлетворяющим условиям #(*(» = F(x), #(х,1)=*, т.е. Я(х, т)в — невырожденная гомотопия от F к тождественному отображению /: Ω-*Ω. Условие невырожденности Н(х, τ) Φ 0 обеспечивается тем, что по предположению деформация не задевает точку 0. Итак, если существует отображение Н(х, т) с описанными свойствами, то уравнение F(x) = 0 разрешимо в Ω. Например, когда при любом xG Ω векторы χ и F(x) не направлены противоположно, в качестве Н(х, т) можно взять #(х, г) = тх+ (1 - г) F(x).. (2.1) Непротивоположная направленность χ и F(x) здесь гарантирует невырожденность Н(ху τ) Φ 0, т.е деформация (2.1) не пересекает точку 0. Следовательно, непротивоположная направленность векторов χ и F(x) при любом xG Ω обеспечивает разрешимость уравнения F(x) =0. Отсюда буквально в несколько строчек можно вывести теорему Брауэра и ряд других теорем о разрешимости уравнений, что будет сделано далее. Может встретиться также иной тип деформаций: концы каждой траектории (см. выше) представляют собой пару точек F(x) GF(U) и ссхАх G е Ω, где А — линейное невырожденное преобразование, ах>0. В случае detA < 0 это соответствует случаю, когда поверхность Ω отображением F. как бы выворачивается наизнанку. Использованное определение понятия "внутри" исключает из рассмотрения множество ситуаций, в которых указанная деформация невозможна, а уравнение F(x) =0 тем не менее разрешимо. Например, в случае Ω = S поверхность F(S), будучи деформирована на 5, а потом растянута по S (разглаживанием, растяжением складок), может окутывать S несколько раз (а не один раз, как в рассмотренных выше случаях). Число этих окутываний является абсолютным значением вращения векторного поля F(x) на S. Знак вращения (плюс или минус) определяется сохранением или изменением ориентации поверхности (выворачиванием наизнанку). В ситуации, изображенной на рис. 7,а, число окутываний равно 2, на рис. 7, £ — 1, а на рис. 7, в — нулю. 2.2. Вращение векторного поля. В предыдущем разделе мы довольно близко подошли к понятию вращения векторного поля, но для достиже- а δ β Рис.7 40
ния ясности и углубления представлений необходимы дополнительные усилия. Здесь мы не будем заниматься разрешимостью уравнений, а все внимание сконцентрируем на определении вращения векторного поля, вернувшись к исходным позициям и отказавшись от принятых допущений. Пусть Ω — некоторая ограниченная область в R",aF(n) - образ ее границы. Предположим пока, что поверхность F(Ω) связна*) и не имеет "слипшихся" участков. Возьмем любой достаточно маленький кусочек поверхности F (Ω) и одну (на выбор) сторону его назовем внешней, а другую - внутренней. Затем всю поверхность F (Ω) разобьем на маленькие кусочки так, чтобы они накладывались друг на друга. С исходным кусочком пересекается несколько других; на них внешнюю сторону определим так, чтобы на участках пересечения внешние стороны были согласованы. Продолжая этот процесс^ мы определим внешнюю и внутреннюю стороны на всей поверхности F (Ω). На рис. 8 внешняя сторона отмечена стрелочками. Напомним, что пока понятия внешней и внутренней сторон относительны. Главное, что есть две стороны. Мы произвольно выбираем одну и называем^ ее внешней. Здесь необходимо уточнить следующее. То, что граница Ω любой области является двусторонней поверхностью, очевидно. Для любой же поверхности Г гарантировать наличие двух сторон нельзя. Есть поверхности односторонние (лист Мёбиуса, бутылка Клейна). Однако непрерывный "неслипшийся" образ F(ti) двусторонней поверхности Ω — поверхность двусторонняя. Возьмем теперь произвольный луч / (выходящий из нуля), который "протыкает" поверхность F(U), но нигде ее не касается. На рис. 8 этому условию удовлетворяют лучи /ь /3, Ц\ луч/2 касается F(£l) в точке А. Пусть этот луч протыкает поверхность F(U) в точках У, . .., л*. Если в х1 луч "протыкает" F(U)изнутри, положим е(х*) = 1, в противном случае е(У) =-1. На рис. 8 е(С) = 1,е(Д) =-1. Рассмотрим величину 6(/) = Ze(i'). (2.2) / Если л? — точка самопересечения F(Q,), то в (2.2) она дает два слагаемых*) . Покажем, что δ(/) не зависит от /. *) Пример несвязной поверхности F(n) дают две сферы разных радиусов. В этом случае можно говорить также, что F(&) состоит из двух замкнутых поверхностей. ' Точнее, к слагаемых,если через х1 поверхность F(h) проходит к раз. 41
Очевидно, при достаточно малых шевелениях луча / величина δ(/) не меняется, т.е. функция δ(/) локально постоянна. Изменений можно ожидать, если при повороте луч пересекает точку касания. Например, на рис. 8 при повороте луча против часовой стрелки из положения 1Х в положение /3 критическим положением является /2. Но понятно, что при этом в окрестности точки касания появляются (или исчезают) обязательно две точки а, Ь, в которых луч протыкает F(U), причем е(а) + е(Ь) = 0. Так что δ(/) действительно не зависит от /. Если F(U) имеет "слипшиеся" участки, то все остается по-прежнему. Надо лишь считать, что в х* луч / "протыкает" F (Ω) столько раз, сколько в окрестности х1' "слиплось" слоев поверхности F(&). Общая для всех допустимых / величина δ и есть, с точностью до знака, вращение векторного nonaF на Ω. Понятно, что знак δ зависит от того, какую сторону F(U) мы назовем внешней. Аккуратное определение внешней стороны поверхности связано с необходимостью громоздких построений. Но по существу в теории вращения можно обойтись без такого определения. Для теорий вращения важно нечто иное: возможность согласования внешних сторон F(&) в том случае, когда граница Ω имеет несколько компонет связности, а также% возможность согласования внешних сторон различных поверхностей F(U;) при одновременном рассмотрении нескольких областей Ω;·, границы которых имеют общие участки. Однако подобное согласование возможно без априорного определения внешней стороны. Остановимся на этом подробнее. Пусть Ω,ι и Ω2 - ограниченные области с общим участком границы Ω1ΠΩ2=Γ. Внешнюю сторону границы любой области договоримся выбирать обычным образом. Фиксируем теперь внешнюю сторону F(Ux). Это определяет внешнюю сторону (ориентацию) участка поверхности F(T). Если Ω2 находится по другую сторону Г (по ту же сторону Г), получившуюся ориентацию F(T) меняем на противоположную (сохраняем). Полученная в результатев новая ориентация F(T) определяет ориентацию (внешнюю сторону) F*(i22). При большом числе областей внешние стороны определяются аналогично (индуктивным продолжением описанного процесса). Если область Ω имеет несвязную границу, то Ω можно представить в виде объединения Ω = int U Ω/ непересекающихся областей Ω/ со связными границами. Затем с помощью указанного выше способа согласования ориентации можно определить внешние стороны всех компонент связности F(£l). Тем самым величина δ(/) определяется для произвольных областей Ω. Согласование ориентации полезно проследить на ряде примеров. Вообще говоря, для указанного способа согласования ориентации надо было бы установить корректность, но она достаточно очевидна, по крайней мере в тех простых ситуациях, которые обычно возникают в практических задачах. Остановимся теперь коротко на более строгом определении внешней стороны поверхности F(U). Это определение менее наглядно, но более 42
удобно. Оно однозначно определяет внешнюю сторону [а значит, и величину δ(/)], избавляя от необходимости согласования ориентации*). Сначала заметим, что величина типа δ(/) не меняется при достаточно малых изменениях границы Ω и оператора F. Поэтому без ограничения общности Ω и F будем предполагать гладкими (в противном случае можно перейти к гладким аппроксимациям). Введем на Ω локальные координаты и в каждой точке λ*Ε Ω локальный базис {*!,..., *«} (2.3) выберем так, чтобы вектор е1 был направлен по внешней нормали, а векторы е2, .. · ,,e« лежали в касательном пространстве Тх. Нормаль е\ к поверхности F(&) в точке F(x) назовем внешней, если базис {e,uet2i...ie'n} = {efuF,(x)e2,...iFt(x)en} (2.4) одинаково ориентирован с базисом (2.3). Конечно, (2.4) является базисом, если detF'(x) ФО. Но по теореме Сарда множество регулярных значений у^рф) плотно в F(U), так что определенная выше внешняя нормаль существует почти во всех точках yGF(U). Можно показать, что все такие нормали находятся по одну сторону поверхности ^(Ω), т.е. однозначно определяют внешнюю сторону F (Ω) . Если внешняя сторона F(&) определена именно так, то общая для всех допустимых / величина δ(/) называется вращением векторного поля F на Ω и обозначается y(F, Ω). 2.3. Основные свойства вращения. Несмотря на слово "интуитивный" в заголовке параграфа, ниже даются точные формулировки ряда важных теорем. Что касается доказательств, то их строгость соответствует уровню строгости определения вращения. Очевидно, величина δ(/), а значит и γ(/<\Ω), не меняется при малых изменениях (деформациях) как оператора F, так и границы Ω. Это обстоятельство позволяет легко установить справедливость следующего результата. Теорема 2.1. Гомотопные векторные поля имеют одинаковые вращения. Доказательство тривиально. Гомотопический мост Н(х, т) = FT (x) в силу непрерывности Я по совокупности переменных и компактности сегмента [0, 1] дает возможность представить переход от Н(х, 0) =F0(x) к Н(х, 1) =F1(x) в виде конечной последовательности малых деформаций. D Несмотря на элементарный характер приведенного утверждения, оно играет чрезвычайно важную роль, поскольку служит основным инструментом для вычисления вращений векторных полей. Теорема 2.1 позволяет переходить с помощью гомотопии от изучаемых полей к более простым, часто стандартным, вращение которых известно. В связи с теоремой 2.1 закономерно возникает вопрос о справедливости обратного утверждения. Обязательно ли гомотопны поля с одинаковым *) Конечно, это объясняется тем, что трудности переносятся из одного места в Другое. Удобства в обращении некоторого определения обычно оплачиваются неудобствами при доказательстве его корректности. 43
вращением? В общем случае это не так. Если же Ω — шар, положительный ответ на поставленный вопрос дает знаменитая теорема Хопфа. Теорема 2.2. Невырожденные на некоторой сфере пространства Rn (n> 2) векторные поля с одинаковым вращением гомотопны. D При дальнейшем изложении основных результатов эта теорема нигде не используется. Поэтому мы не останавливаемся на доказательстве, которое довольно сложно. Гомотопический переходот FQ к векторному полю Fx деформирует поверхность F0(&) в Fl(U). Деформация поверхности F0 (Ω) может осуществляться, однако, не только за счет изменения оператора F0, но и за счет изменения области Ω. Как бы деформация ни происходила, для сохранения величины вращения существенно лишь, чтобы деформируемая поверхность не пересекала точку 0. Сформулируем это утверждение более точно. Пусть Ωτ (г € [0, 1]) описывает непрерывный переходот области Ω о к Ωχ. Результирующую деформацию FT (Ωτ) назовем невырожденной, если FT (χ) Φ 0 при любых г Ε [0,1],χΕΩτ. Теорема 2.3. Пусть деформация FT (Ωτ) невырождена. Тогда y(F0, Ωο)=7(^,ΩΟ. □ Это простое обобщение теоремы 2.1 иногда оказывается полезным, позволяя при вычислении вращения переходить не только к более простому полю, но и к более простой области. Теорема 2.4 Пусть векторное поле F определено и невырождено на границах областей Ω, Ω^,. .. Lfim, причем области Ω;· (/ = 1, . .., m) попарно не пересекаются и Ω = U Ω;·. Тогда / m γ(^,Ω)= Σ y(F9at). (2.5) / = ι Доказательство. Выберем луч /, допустимый одновременно '* для# всех областей, т.е. не касающийся ни одной из поверхностей F(U), F(nx), . .., F(Um). Через £у(/) обозначим величину типа (2.2) для случая, поверхности F(Uj). Нам необходимо показать, что m .δ(/)= Σ δ, (0, (2.6) 7 = 1 но это почти очевидно. Действительно, пусть F(x) = ζ (ζ Ε /), а х принадлежит пересечению границ Ω/ Π Ω^, т.е. в точке ζ луч / протыкает как поверхность F(i2j), так и F(Uk). Β^ этом случае совершенно очевидно, что одну из поверхностей /^(Ω/), F(£lk) луч / протыкает изнутри, а другую — извне. Поэтому при вычислении суммы (2.6) по формуле (2.2) все слагаемые типа е(х0> гДе точки xi лежат на попарных пересечениях границ Ω;·, взаимно сократятся. Останутся лишь те слагаемые е(х*)> которые в сумме как раз определяют величину δ (/). D Будем говорить, что невырожденное на Ω поле F выпускает направление, если F(x)=£\h для всех χΕΩ, λ>0 и некоторого ненулевого hGR". Теорема 2.5. Если векторное поле F на Ω выпускает направление, то 7(F, Ω) = 0. 44
Для доказательства достаточно в качестве / взять луч, задаваемый вектором h, / = {*|* = ift, 0< t<oo}. Тогда в сумме (2.2) не будет ни одного ненулевого слагаемого. D Теорема 2.6. Пусть векторное поле_F невырождено на замыкании Ω области £1,т.е. F(x) Φ О при любом χ G Ω. Тогда y(F, Ω) = 0. Разобьем Ω на конечное число замыканий Ω;· непересекающихся областей Ω7· настолько малых диаметров, что все векторы F(x) на каждом Ω/ друг с другом составляют острый угол. В этом случае на каждой границе Ω/ поле F завецомо выпускает некоторое направление. Поэтому (теорема 2.5) все y(F, Ω;·) = 0 и по теореме 2.4 y(F, Ω) = 0. D Из теоремы 2.6 немедленно вытекает следующий фундаментальный результат. Теорема 2.7. Если y(F, Ω) Φ 0, то существует точка χ*Ε Ω, в которой F(x*) = 0, т.е. уравнение F (х) =0 разрешимо в Ω. D Таким образом, любая теорема об отличии от нуля вращения векторного поля F может расцениваться как принцип существования решения уравнения F(x) = 0. Теорема 2.8. Пусть х0 G Ω и F(x) =х-х0. Тогда y(F, Ω)=1. Рассмотрим сначала случай Хо = 0, т.е. F — тождественное отображение. Пусть луч / нигде не касается Ω. Очевидно, в первый раз луч / протыкает Ω изнутри, затем извне, потомв снова изнутри. Поэтому по формуле (2.2) получаем δ(/) = 1, т.е. y(F, Ω) = 1. В случае Хо Ф0 образ Ω представляет собой параллельный перенос Ω, при котором точка 0 попадает внутрь Ω. Такие же рассуждения снова дают y(F, Ω) = 1. D Объединение теорем 2.7, 2.8 и использование различных гомотопических переходов приводят к серии простых (но нетривиальных по существу) принципов разрешимости уравнений. Эти вопросы будут рассмотрены в следующем параграфе. Остановимся на обобщении теоремы 2.4. Если учесть утверждение теоремы 2.6, то становится ясно, что равенство (2.5) сохраняется без предположения Ω = U Ω;·, но при условии невырожденности поля F на Ω\ U Ω;·. / / Предположение конечности числа областей Ω7· также несущественно. Вот точная формулировка соответствующего результата. Теорема 2.9. Пусть векторное поле F определено и невырождено оо на Ω\ U Ω7·, причем области Ω;· попарно не пересекаются и лежат в Ω. дексов j и 7(F,£2)= Σ y(F9Oj). Π 2.4. Вращения линейного поля. Пусть А — линейное невырожденное преобразование и 0 Ε Ω. Возьмем открытый шар В настолько малого радиуса, что В С Ω. Поскольку поле А невырождено на Ω\ В, то*) *) Наряду с 7(F, Ω) мы используем эквивалентное обозначение y(F, Ω). 45
у(А,П\ В) =0. Поэтому у(А,й) = у(А,В)+у(А,П\В) = у(А,В). Образ А В сферы В также является сферой, но в другой норме. Следовательно, любой луч / протыкает поверхность АВ ровно один раз, откуда Ι704,Ω)|=1. Чтобы определить знак вращения, необходимо проследить за ориентацией поверхности Α Ω. Пусть {ех, ..., еп ) — локальный базис в точке xG В, Как былсмэговорено выше, векторы ^, ..., ^ расположены в касательном пространстве Тх, а еу направлен по внешней нормали. Если det A > > 0, то в качестве локального базиса в точке Α χ Ε АВ можно взять *) {е'ь·.. ,е'п}=.{Аег,... ,Аеп), который в силу aetA>0 будет одинаково оринетирован с исходным. Таким образом, в случае deti4>0 любой луч протыкает поверхность АО изнутри, откуда у (А, й) = 1. Если же det A < 0, то в качестве локального базиса в А х G АВ можно взять { е'ъ ·. · , е'п } = {-Аех,Ае2 ,...,Аеп). Поверхность АВ при этом ориентируется так, что любой луч ее будет протыкать извне. В результате у (Α, Ω) = —1. Теорема 2.10. Пусть А - линейное невырожденное преобразование иОе Ω. Тогда y(^,n) = signdet^. D (2.7) 2.5. Формальные схемы определения вращения. Наиболее простой (но зато и наименее наглядный) способ введения вращения - аксиоматический. Если утверждения теорем 2.1, 2.8, 2.9 принять за аксиомы, то эти три свойства однозначно определяют целочисленную характеристику y(Ft Ω). Для тех, кто знаком с понятием степени отображения (детально изучаемым в любом курсе алгебраической топологии), достаточно сказать, что вращение y(F, Ω) есть степень отображения G(x) = F(x)/\\F(x)\\ (2.8) границы Ω в единичную сферу S. Определение степени отображения в алгебраической топологии традиционно опирается на серию специальных понятий (симплексы, комплексы, ориентации, цепи, циклы, гомологии и т.д.). Изучение этих понятий с единственной целью овладения аппаратом теории степени отображения едва ли оправдано, по крайней мере не обязательно. С тем же успехом здесь могут быть использованы простые нумерационные соображения [22] типа тех, которые обычно применяются в доказательстве леммы Шпернера. Для читателя с техническим образованием, по-видимому, наиболее предпочтительны аналитические способы определения степени отображения. Остановимся на схеме одного из таких способов. Пусть для начала отображения (2.8) и граница Ω - гладкие. Введем на Ω локальные системы координат, дополнив их до локальных систем координат в R" определением первой координаты точки в R" по внешней нормали к Ω, причем эти системы выберем одинаково ориентированными с основной системой координат в R". Такие же локальные системы координат введем на единичной сфере S = {х\ Η χ II = 1}, *) Векторе J не обязательно должен быть направлен по внешней нормали. Глав ное, чтобы он был направлен во внешнюю сторону. 46
предполагая Их II = (χ, χ) ιΙ2. Через G'(x) будем обозначать матрицу Як оби (в соответствующих локальных координатах) отображения G: Ω -> S в точке χ е Ω. Определим теперь для регулярных значений ye.S величину deg(G,^)= Σ signdetG'(x). xGG~l(y) Легко видеть, что величина deg(G, у) конечна (так как компактный прообраз регулярного значения состоит не более чем из конечного числа точек) и локально постоянна как функция у, пробегающего множество S регулярных значений (которое по теореме Сарда плотно в S). Более того, можно показать, что deg(G, у) вообще не зависит от у е &> т.е. deg(G, у) = deg G. Эта величина deg G и называется степенью гладкого отображения G: Ω-*5, Для определения степени отображения G: U->S в общем случае (без предположений о гладкости) необходимо взять достаточно точные гладкие аппроксимации Gx и &l.(Gl:Ul-*S) и положить .degС? = degGj. Нетрудно заметить, что такой способ введения вращения довольно близок к описанному в разделе 2.2. Упражнения. _ 2.1. Если F(x) =х-х0,гце х0 4 Ω, то τί^,Ω) =0". 2.2. Если направления из некоторой окрестности направлений *) векторное поле F на Ω принимает один-единственный раз, то | y(F, Ω) | =1. 23. Если направления из некоторой окрестности направлений векторное поле F на Ω принимает нечетное число раз, то y(F, Ω) φ 0. 2.4. Пусть 0е Ω. Тогда γ(-7, Ω) = (-1)", где/- тождественное преобразование, η - размерность пространства. 2.5. Пусть А — линейное невырожденное преобразование. Тогда y(AF, Ω) = sign detAy(F, Ω). 2.6. Пусть векторное поле F невырождено на границах Ult й2 и на множествах Ω^Ω,, Ω2\ Я,. Тогда 7(^,Ωι) =7(^Ω2). 2.7. Если все лучи допустимы, т.е. ни один луч не касается поверхности F(U), то y(F, Ω) Φ 0. Сформулируйте этот критерий в терминах параметрических уравнений F(x) =\y. § 3. Теоремы о неподвижных точках 3.1. Линейная гомотопия. Среди используемых обычно гомотопических переходов наиболее широко распространен л шейный #(х,т)«(1 -t)F0(x) + tF,(*). (3.1) Для невырожденности (3.1) достаточно потребовать, чтобы векторы F0(x) и Fi(x) не были противоположно направлены при любом χΕΩ. Этот простой признак гомотопности называют теоремой Пуанкаре-Боля. Теорема ЗА. Пусть при любом xGU векторы FQ(x) и Fx (x) невырожденных на Ω полей F0> Fl не направлены противоположно. Тогда поля FQ и Fi гомотопны на Ω (и, значит, имеют одинаковые вращения). D Достаточными условиями непротивоположной направленности полей F0 и Ft на Ω могут служить неравенства WF1(x)-F0(x)\\<\\F0(x)\\> (3.2) или же, менее ограничительные, И Fl (х) - F0(χ)К II Ft (χ) II + IIF0(χ) II. ν (3.3) *) Окрестностью направлений мы называем множество лучей, проходящих через достаточно малую окрестность ненулевой точки. 47
3.2. Простейшие принципы. Объединение теорем 2.7, 2.8 и 3.1 легко приводит к следующему результату. Теорема 3.2. Пусть ОΕ Ω и при любом л: Ε Ω векторы χ и F(x) не направлены противоположно. Тогда y(F, Ω) = 1 и, следовательно, уравнение F(x) = О разрешимо в Ω. D Условие непротивоположной направленности полей F (х) и/х= χ обычно удобно проверять с помощью тех или иных достаточных признаков. Различный выбор таких признаков приводит к разнообразным следствиям, часть которых формулируется ниже в виде самостоятельных теорем. Теорема 3.3. Пусть 0 Ε Ω и для любого χ Ε Ω ||F(x)-*IKIlF(x)ll+ llxll. (3.4) Тогда уравнение F(x) = 0 разрешимо в Ω. D Τ е о ρ е м~а 3.4. Пусть 0 Ε Ω и для любого χ Ε Ω можно указать такой номер j, что Xjfj (χ) > 0, где ή (χ) обозначает j-ю компоненту оператора F. Тогда уравнение F(x) = 0 разрешимо в Ω. D Теорема 3.5. Пусть 0 Ε Ω и для любого χ Ε Ω (F(x)9x)>0. (3.5) Тогда уравнение F(x) = 0 разрешимо в Ω. D Часто изучаемые уравнения имеют специальный вид х=Т(х). (3.6) В этом случае решение (3.6) называют неподвижной точкой оператора Τ Чтобы использовать здесь теоремы 3.3—3.5, достаточно перейти к векторному полю F(x) =x-T(x). Соответствующая переформулировка, например, теоремы 3.5 выглядит так. Теорема 3.6. Пусть 0 G Ω и для любого χ G Ω (Г(х),χ) <(*,*). (3.7) Тогда оператор Τ имеет неподвижную точку в Ω. D Конечно, условия непротивоположной направленности типа (3.5), (3.7) работают с большим запасом, но нередко они оказываются достаточно эффективными и удобными. 3.3. Теорема Брауэра и ее обобщения. Наиболее широкое распространение в прикладных задачах получая следующий принцип неподвижной точки, называемый теоремой Брауэра. Теорема 3.7. Пусть оператор Τ переводит в себя замкнутый шар В, Тогда у Τ существует неподвижная точка x*GB. Доказательство. Без ограничения общности центр шара В можно считать расположенным в нуле. Предположим противное, т.е. Τ не имеет неподвижной точки в В. Тогда поле F(x) =x — Τ (χ) невырождено на сфере 5, ограничивающей шар В. Легко видеть, что в предположении теоремы Т(В) С В на при каком xGB векторы χ и χ — Т(х) не могут быть противоположно направлены. Но тогда по теореме 3.2 поле F гомотопно тождественному и, значит, 7(F, S) = 1. Ссылка на теорему 2.7 теперь приводит к противоречию и завершает доказательство. □ Как показывает проведенное рассуждение, вращение векторного поля х— Т(х) на В в условиях теоремы Брауэра (при дополнительном предпо- 48
ложении невырожденности χ - Т(х) на В) равно 1. В дальнейшем мы увидим, что информация о конкретном значении вращения играет важную роль и помогает ответить на ряд дополнительных вопросов о свойствах решений изучаемых уравнений. Традиционно в условиях теоремы Брауэра фигурирует замкнутый шар, но ясно, что с равным успехом он может быть заменен произвольным замкнутым ограниченным выпуклым множеством*) Ω - прежняя схема доказательства будет работать без изменений. Легко заметить также, что Рис.9 приведенное доказательство не использует в полном объеме требование Т(В) С В, а опирается лишь на предположение тф) С В, и устанавливает по существу справедливость более общего результата. Теорема 3.8. Пусть оператор Τ _~ переводит границу Ω замкнутого ограниченного выпуклого множества Ω β Ω. Тогда у Τ существует неподвижная точка χ*ΕΩ. D На этом пути полезно отметить следующую теорему Лере-Шаудера, в которой выпуклость Ω не предполагается. Теорема 3.9. Пусть ΟΕΩμ оператор Τ на границе Ω удовлетворяет условию Т(х) Φλχ при xGU, λ> 1. Тогда у Τ существует неподвижная точка x*G Ω. Действительно, векторы χ € Ω и jc — Т(х) могут оказаться противоположно направленными лишь в случае Т(х) = λχ, где λ > 1. D Элементарным образом теорема Брауэра обобщается на случай множества Ω, гомеоморфного замкнутому шару. Предыдущая схема рассуждений в этом случае, правда, не работает, но несложное дополнительное построение быстро приводит к цели. Пусть оператор Τ переводит в себя множество Ω, гомеоморфное замкнутому шару В, и G — соответствующий гомеоморфизм (рис. 9). В этом случае оператор G'1 TG отображает в себя В и по теореме 3.7 имеет неподвижную точку** Ε В, т.е.G^1 TG(x*) = = χ*. Но тогда TG(x*) -G(x*), следовательно, y* = G(x*) ΕΩ - неподвижная точка оператора Т. D Говорят, что множество Я обладает свойством неподвижной точки, если любое его непрерывное отображение в себя имеет неподвижную точку. Поэтому теорему Брауэра можно сформулировать так: любой замкнутый шар обладает свойством неподвижной точки. При попытках усиления этого результата естественно идти по пути изучения тех классов отображений Τ: Λ -> «#>, относительно которых свойст- *) Не обязательно телесным и центрально симметричным, иначе в подходящей норме это опять-таки будет шар. 49
во неподвижной точки инвариантно. Таким достаточно общим классом является класс r-отображений, который существенно шире класса гомеоморфизмов. Отображение Τ: Χ-+ Υ (здесь предполагается Υ - Т(Х),т.е. Τ отображает Л^на У) называется r-οτο брожением, если существует отображение S: У-►Л'такое, что TS представляет собой тождественное отображение У на У (напоминаем, что все отображения считаются непрерывными). Другими словами, Τ: Χ-+Υ есть г-отображение, если для него существует правое обратное. Теорема 3.10. Если множество <R обладает свойством неподвижной точки, а Т: &-+&> является г -отображением, то ' & также обладает свойством неподвижной точки. Рис.10 Доказательство весьма просто. Пусть F - любое непрерывное отображение JJ в себя, a S - правое обратное для Т. Тогда отображение G - SFT: <R -* <R по предположению имеет неподвижную точку х*е Л, т.е. SFT(x*) -χ *. Но тогда FT (χ*) = TSFT (**)= Т(х *). Следовательно, Τ (χ*) е &> - неподвижная точка отображения F.D Объединение теоремы 3.10 с теоремой Брауэра приводит к довольно сильным следствиям и гарантирует наличие свойства неподвижной точки у весьма экзотических множеств. Обычно принято указывать более частную формулировку теоремы 3.10 для так называемых ретракций: г-отображение Т: X -» У называется ретракцией, если У СХ и правое обратное - тождественное отображение Уна У. Множество У сХ называется ретрактом X, если существует ретракция X на У. Иными словами, У сХ - ретракт X, если существует непрерывное отображение Τ: Χ -+ У, оставляющее все точки У сХ "на месте". Из теоремы 3.10 следует, что любой ретракт множества, обладающего свойством неподвижной точки, также обладает этим свойством. На рис. 10 изображены примеры ретрактов выпуклых множеств. Среди фольклорных теорем встречается следующая: любой стягиваемый по себе компакт в R" (в частности, звездный компакт) обладает свойством неподвижной точки. Это утверждение неверно. Соответствующие контрпримеры можно найти в интересном обзоре [3). Утверждение приобретает силу при дополнительном предположении. Теорема 3.11. Если стягиваемый по себе компакт в Rnлокально стягиваем, то он обладает свойством неподвижной точки, π 3.4. Индексы и алгебраическое число нулей. До сих пор величина вращения векторного поля для нас существенной роли не играла. Для теорем о неподвижных точках был важен лиШь факт отличия вращения от нуля. Установление взаимоотношения между вращением поля на границе и числом нулей поля внутри области позволяет получать более тонкие следствия. Нуль λ*ο £ Ω поля F (χ) назовем изолированным нулем, если в достаточно малой окрестности х0 поле F не имеет других нулей. Вращение поля F на сферах достоточно малого радиуса с центром в х0 называется. индексом нуля х0 и обозначается ind (F, х0). Корректность такого определения (т.е. независимость вращения от радиуса сферы, если радиус достаточно мал) немедленно вытекает из теорем 2.4,2.6. 50
Теорема 3.12. Пусть векторное поле F невырождено на Ω и имеет в Ω лишь изолированные нули. Тогда Iind(F,x/) = 7(F,n), (3.8) где суммирование идет по всем нулям xf. G Ω поля F. D Заметим, что число нулей х} G Ω заведомо конечно. Это вытекает из изолированности нулей Xj невырожденности поля F на Ω и компактности Ω. Сумма индексов (3.8) называется алгебраическим числом нулей поля F, а теорема 3.12 носит название теоремы об алгебраическом числе нулей. Эта теорема может использоваться для вычисления вращения y(F, Ω), если известны индексы всех нулей поля F. Если сумма индексов известных нулей отлична от y(F> Ω) — теорема 3.12 гарантирует существование нулей, отличных от известных. Наконец, при наличии априорных оценок индексов теорема 3.12 позволяет иногда устанавливать единственность решения того или иного уравнения. Последнюю возможность мы проиллюстрируем простым примером. Пусть отображение F — гладкое. Если х0 - нуль поля F и матрица Якоби Fx (x0) невырождена, то в достаточно малой окрестности точки λ'ο поле F(x) сколь угодно точно приближается линейным полем Fx (х0) (х - Хо) · Поэтому *) ind (F, хо) = sign detF'x(x0). Предположим теперь, что y(F, Ω) = 1 и det Fx (χ) > О при любом .ν G Ω. Поскольку якобиан преобразования отличен от нуля в любой точке χ Ε Ω, отображение.F локально обратимо в некоторой окрестности любого χ Ε Ω. Поэтому поле F(x) может иметь лишь изолированные нули. С другой стороны, в силу det Fx {x) > О любой нуль Xj поля F имеет индекс ind (F, Xj) = 1. Но тогда из (3.8) и условия y(F9 Ω) = 1 следует, ^ что поле F на Ω не может иметь более одного нуля (а один заведомо имеет, поскольку y(F> tl) ФО). Ранее было показано, что вращение поля χ - F (χ) в условиях теоремы Брауэра равно 1. Учитывая изложенное выше, приходим к утверждению. Теорема 3.13. Пусть область Ω выпукла и гладкое отображение F переводит Ω β Ω, причем det(I-F'x(x))>0 для любого χ € Ω. Тогда F имеет в Ω единственную неподвижную точку.П Иногда удобно пользоваться понятием индекса поля на бесконечности. Пусть поле F невырождено при достаточно больших по норме χ G R". В этом случае говорят, что особая точка °° поля F изолирована. При этом теоремы 2.4, 2.6 гарантируют, что вращение поля F на сферах достаточно большого радиуса одно и то же. Это общее вращение обозначают ind (F, °°). Если поле F имеет лишь изолированные нули Xj и определен индекс F на бесконечности (т.е. F невырождено при достаточно больших по норме *) На сферах достаточно малого радиуса с центром в х0 поля F(x) nFx(x0) (х - х0) будут непротивоположно направлены, так как в малой окрестности точки х0 F(x) = F'x0co) (х -х0) + о{1 х -х0Ъ). 51
χ G R"), то понятно, что число нулей Xj конечно и справедлива формула Σ ind (F, Xj) = ind (F, -). (3·9) Пусть r h^ (*)-*" («0*11 η ,Qlft. llm v~» = 0> (зл°) где Ff(°°) — матрица. В этом случае поле F называют асимптотически линейным, а матрицу Ff(°°) — производной на бесконечности оператора F. Теорема 3.14, Пусть поле F асимптотически линейно и det F9 (°°) Φ Φ 0. Тогда особая точка °° поля F изолирована и ind (F, <*>} = sign det Ff (°°) Доказательство совсем просто. По условию || F (х) - F9(°°) х\\ -о (|| χ||) Но так как матрица F'l00) невырождена, это влечет за собой справедливость неравенств ||F(x)-F4~)*II<IIF'(~)*II на сферах достаточно больших радиусов, что гарантирует непротивоположную направленность полей F (х) и F1 (°°) χ. G 3.5. Нечетные поля. Векторное поле F называется нечетным на центрально симметричном множестве Г, если F (-х) = - F (х) при любом χ Ε Γ. Пусть В обозначает шар с центром в нуле. Теорема 3.15. Вращение нечетного векторного поля F на В нечетно (и, значит, отлично от нуля). Схема доказательства довольно проста. Пусть г — радиус шара В. Шаровое кольцо, ограниченное сферами радиуса г и г/2, разобьем плоскостью, проходящей через 0, на две части Ωχ и Ω2 (рис. 11). Шар радиуса г/2 обозначим Ω з. На границе Ω3 положим F (х) = χ и продолжим F с В ий3 на Ωχ U ή2 так, чтобы результирующее отображение было нечетным и невырожденным *). Теорема 2.4 гарантирует y(F, B) = γ(^ΩΟ + 7(^,Ω2) + γ(^Ω3). (3.11) Пусть луч / протыкает поверхность F(U х) в точках хи .. ., хт. В силу нечетности F луч — / будет протыкать F (Ω2) в точках — хь ..., - хт, причем-характер протыкания (изнутри, извне) будет таким же. Поэтому y(F, Ux) = 7(F, Ω2). Вращение же γ (F, Ω3) = 1 (теорема 2.8). Из (3.11) теперь следует y(F,B) = 2y(F9Ux)+l.n Казалось бы, теорема 3.15 относится к весьма частному случаю нечетных векторных полей, но она позволяет легко получить результат существенно более общего характера. Теорема 3.16. Пусть поле F невырождено на В и F(x) F(-x) —^- Φ — — (3.12) ||F(x)|| ||F(-x)|| *) Обоснование возможности такого продолжения предоставляется читателю в качестве несложного упражнения. В плоском случае (рис. 11) такая возможность очевидна. Далее удобно использовать индукцию по размерности пространства. 52
при любом χ Ε: В, т.е. в симметричных относительно центра точках векторы поля на- правлены неодинаково. Тогда y(Ff В) нечетно и, следовательноf уравнение F(x) = О разрешимо в В. Действительно, в указанных предположениях поле F гомотопно нечетному полю F (х) — F (—х). Гомотопией может служить #(jc, r) = F(x) -tF(-jc). (3.13) Невырожденность (3.13) обеспечивается условием (3.12). Далее остается сослаться на теорему 3.15. D 3.6. Последовательные итерации и принцип Браудера. Рассмотрим итерационный процесс xk + l=F(xk\ к = 0,1,2,·.. (3.14) Теорема 3.17. Пусть последовательные итерации (3.14) сходятся κ х* равномерно относительно х° из некоторой окрестности точки х*. Тогда ind (I-F,x*) =1.D Теорема 3.17 — непосредственное следствие весьма глубокого по содержанию принципа неподвижной точки Браудера, формулируемого ниже. Τ ео ρ е ма 3.18. Пусть ограниченная область Ω выпукла и_ оператор обладает следующим свойством: существует к0 такое, что Fk(Q,) С SI для всех k>k0, а также Рк{х)Фхдля любого χΕΩ. Тогда F в Ω имеет неподвижную точку, причем у(1 — F, Ω) = 1. D Равенство ind(7- F,x*)= 1 в условиях теоремы 3.17 легко понять с точки зрения теоремы Яноша—Майерса*), гарантирующей существование метрики ρ (эквивалентной исходной), в которой F является сжимающим оператором. Тогда ясно, что F любой замкнутый шар Ω (достаточно малого радиуса) с центром в х* переводит в себя, т.е. выполняются условия теоремы Брауэра, в которых равенство γ(/ - F, Ω ) = 1 было установлено **). Совсем легко понять вывод теоремы 3.17 в дополнительном предположении, что оператор F — гладкий и (3.14) сходится одновременно с линейной аппроксимирующей процедурой xk + l =x* +F^x*)(xk -χ*). (3.15) Сходимость (3.15) означает, что спектр матрицы Fx(x*) лежит внутри единичного круга — поэтому det [/- F^(x*)] >0, что влечет за собой ind(/-F, x*)= 1. Однако теорема 3.17 интересна и полезна именно тем, что позволяет выйти за рамки этого элементарного соображения. Отметим, наконец, полезную практическую рекомендацию, которую можно извлечь из теоремы 3.17. Итерационные процедуры типа (3.14) *) См. § 7. **)Хотя все верно, в рассуждении имеется некоторая натяжка. Равенство у U - F, Ω) = 1 при условии F(£l) с Ω было установлено в предположении, что Ω - шар в нормированном, а не метрическом пространстве. Рис. 11 53
часто используются в качестве вычислительных алгоритмов для решения тех или иных уравнений. Безнадежных попыток доказательства равномерной (по начальным приближениям) сходимости (3.14) иногда позволяет избежать вычисление индекса ind(/- F,x*). Если ind(/ - F, χ*) Φ 1, το (3.14) равномерно не сходится. 3.7. Эквивалентные уравнения. Когда речь идет о решении уравнения F(x) = 0, исходная нумерация компонент оператора F не играет никакой роли и может быть произвольно изменена. Это меняет поле, но не меняет существа задачи. Указанное соображение иногда облегчает процесс исследования. Подобный прием представляет собой частный случай общей идеи перехода от уравнения F(x) = 0 к некоторому эквивалентному G(x) = О, более удобному для изучения. Пусть, например, Р(0) = 0 и Р(х) Φ О для χ ФО. Если при этом y(PF, Ω) =£0, то очевидно, что уравнение F(x) = 0 разрешимо в Ω. Вычисление вращения y(PF, Ω) при удачном подборе отображения Ρ может быть проще, чем вычисление y(F,U) . Однако у(PF, Ω) может оказаться равным нулю, хотя y(F, &)Ф 0. Ситуацию разъясняет следующая теорема. Теорем а 3.19. Пусть векторное^ поле Ρ имеет в R" единственный нуль хо = 0,а поле F невырождено на Ω. Тогда y(PF, Ω) = ίηά(Λ 0) y{F, Ω). D (3.16) Отсюда автоматически вытекает теорема о произведении индексов. Теорема 3.20. Пусть векторное поле Ρ имеет в R" изолированный нуль х0 = 0, а поле F - изолированный нуль х* G R". Тогда indCPF, χ*) = ind(P, 0) ind(Ff χ*). Π (3.17) 3.8. Уравнения с параметром. Ряд практических задач приводит к необходимости изучения уравнений G(x,\) = Q (3.18) со скалярным параметром λ. Непрерывный по совокупности переменных оператор G здесь действует из R" X (- °°, <*>) в Rw, т.е. число (скалярных) уравнений в (3.18) равно п, а число неизвестных- η + 1. Это, конечно, не гарантирует разрешимость (3.18), но в большинстве случаев оказывается, что уравнению (3.18) удовлетворяют целые ветви решений х(Х), т.е. каждому значению λ из некоторого подмножества Л С (- °°, °°) соответствует свое (не обязательно одно) решение*(λ). Для исследования уравнения (3.18) и описания множества Л (тех элементов λ€(— °°, °°), при которых (3.18) разрешимо) могут с успехом использоваться установленные выше теоремы. Приведем два простых утверждения, доказательство которых предоставляем читателю. 1. Пусть y(G( · ,λο),Ω)=£0. Тогда уравнение (3.18) разрешимо в &не только при λ = \0tHou в некоторой окрестности λ0. 2. Пусть все решения χ (К) уравнения (3.18) ограничены по норме*) и при некотором λ0 ind(C(-,Xo)>«0# °· Тогда уравнение (3.18) разрешимо при любом λ G (- ^,00). *) Имеется априорная оценка II χ (λ) II < R < ». 54
Иногда оказывается полезным метод функционализации параметра. Он состоит в следующем. Подбирается функционал λ (χ) и рассматривается оператор F(x) = G(x, λ(χ)). Если y(F, Ω) Φ 0, то можно утверждать, что при некотором λ в области Ω существует решение уравнения (3.18). Довольно часто при изучении уравнений типа (3.18) удается показать существование решений на некоторых поверхностях. Теорема 3.21. Пусть 7[σ(·Λι),Ω]*γ[σ(·,λ2),Ω]. (3.19) Тогда при некотором λ Ε (λ!, λ2) на Ω существует решение уравнения (3.18). В противном случае поля G(x, \\) и G(x, λ2) соединял бы гомотопический мост , Η(χ, τ) = σ[χ,τλΓ+(1-τ)λ2], что невозможно в силу (3.19). D 3.9. Собственные векторы. Уравнение (3.18) часто имеет специальный вид F(x) = Xx. (3.20) В этом случае решение χ уравнения (3.20) называют собственным вектором нелинейного оператора F. Теорема 3.22. Пусть Rn - нечетномерное пространство, ΟΕΩμ поле F невырождено на Ω. Тогда найдется такой χΕΩ, что, векторы χ и F(x) будут коллинеарны, т.е. F(x) = λχ при некотором \Ф0. Если y(F, Ω,)Φ\, то поле F не гомотопно тождественному и, следовательно, при некоторых г Ε (0,1), χ Ε Ω tF(x) + (1 -t)jc = 0. Если же y(F, Ω) = 1, то поле F не гомотопно полю -/(*), и тогда при некоторых τΕ(0,1),*ΕΩ tF(x)-(\-τ)χ = 0.Π Для справедливости вывода теоремы 3.22 существенна нечетная размерность пространства. Пусть теперь η произвольно. Если поля χ и χ - F(x) при любом χ Ε Ω не направлены противоположно, то они гомотопны и их вращения одинаковы. Поэтому, если вращения этих полей различны, найдется вектор х0 Ε Ω такой, что х0 - F(x0) = - μ0χ0 (μ0 > 0), т.е. F(x0) = = (1 + μο)*ο· Учитывая теперь, что γ(/, Ω) = 1 в случае 0 Ε Ω и γ(/, Ω) = 0 в случае 0 φ Ω, приходим к следующим результатам. Теорема 3.23. Пусть 0 ^ Ω и вращение поля χ - F(x) на Ω не равно нулю. Тогда уравнение (3.20) разрешимо на Ω при некотором λ > 1. D Теорема 3.24. Пусть 0 Ε Ω и вращение поля χ - F(x) на Ω не равно 1. Тогда уравнение (3.20) разрешимо на Ω при некотором λ > 1. D Упражнения. 3.1. Пусть 0 е Ω и для любого χ <Ξ Ω выполняется неравенство (Т(х), Ах) > (χ, Αχ), где А - линейное невырожденное преобразование. Тогда оператор Τ имеет неподвижную точку л: * е Ω. 55
3.2. Пусть 0 е Ω и Т(х) Φ λχ при любых λ < 1 и χ е Ω. Тогда оператор Τ имеет неподвижную точку χ*6Ω. 3.3. Если векторное поле F невырождено на Ω и 0 6Ω, то уравнение F(x) = λχ разрешимо на Ω при некоторых λι < 0 и λ2 > 0. 3.4. Если Ω - сфера в Rn с центром в нуле, а отображение F переводит Ω в R с С Rn, причем к < и, то существует точка χ£Ω,β которой F(x) = F(- x). (Указание: рассмотрите нечетное отображение F(x) - F(- χ) ) 3.5. Постройте пример оператора (разумеется непрерывного) Т: R3 -» Л3, все итерации которого Г (Л = 2,3,...) имеют неподвижные точки в некотором шаре, но Т(х) Φ χ для любого χ е R3. 3.6. Пусть B0i BXi Вг - открытые шары, причем Βλ ΓιΒ2 = ф9В1„В2 с В0. Пусть Т: Sj-^Bi (ι = 0,1, 2). Тогда оператор Τ в В0 имеет по крайней мере три неподвижные точки. § 4. Вспомогательные технические приемы и дополнения При решении конкретных задач, связанных с вычислением вращения и доказательством разрешимости уравнений, не всегда удается обойтись непосредственным применением готовых теорем. Здесь нередко требуется проявление изобретательности, которая может опираться на ряд характерных технических приемов. Некоторые из таких приемов описываются ниже. 4.1. Нелинейная гомотопия. При доказательстве гомотопности на Ω векторных полей F0 и Fx часто используется идея введения вспомогательного поля F. Желаемый результат достигается, если удается показать гомотопность сначала F0 и F, а затем F и Fx. На каждом из этих двух шагов может работать простой линейный гомотопический переход, и тогда результирующая гомотопия между F0 и Fx будет кусочно линейной. С этой же целью может использоваться и несколько вспомогательных промежутных полей. Эту идею мы проиллюстрируем на простом примере. Докажем, что y(F, Ω) не меняется при изменении знаков перед четным числом компонент fi(x) оператора F (х). Заметим, что это будет доказано, если мы покажем инвариантность y(F, Ω) при изменении знаков всего у двух компонент, так как четного числа перемен знаков можно добиться последовательным изменением двух знаков. Итак, убедимся в гомотопности полей F(x) = {fx (х)у ... ,fn(x) } и {-/ι(*),-/*(*), /з(*),.·.,/„(*)}. (4.1) Линейная гомотопия здесь заведомо не работает. Введем промежуточное (вспомогательное) поле {-Л(*Ш*),/з(х), · · · ,/„(*)> · (4.2) Покажем, что поля F и (4.2) линейно гомотопны. Если бы соответствующая линейная гомотопия Н(х, г) была вырождена, то было бы необходимо при некотором г € (0, 1) hi(x,r) = rf1(x) ~(1-T)f2(x) = 0, М^т) = (Г-т)/1(х)+т/2(х) = 0. (43) 56
Поскольку же детерминант т2 + (1 - г)2 Φ О, то система (4.3) может иметь лишь нулевое решение /ι(*)=/2(*) = 0. (4.4) Но если χ £ Ω таков, что выполняется (4.4), то из невырожденностиFна Ω следует/Х*) Φ О при некотором/ > 3, т.е. hj(x,r) = //(*) Φ 0. Гомотопность полей (4.1) и (4.2) показывается аналогично. Гомотопический переход от F сразу к полю (4.1) может быть проведен более изящно с помощью гомотопии Н(х, т) с компонентами hx(x, т)=/г(х)со$пт -/2(χ)ήηπτ, h2(xt τ) =/*!(x)sinπτ +/2(x)cosπτ, h3(x, r)=f3(x), ·. . ,hn(x, r) =/„(*). 4.2. Понижение размерности. Для приводимых ниже результатов полезно доопределить вращение в одномерном случае. Любая ограниченная область Ω в R1 представляет собой некоторый интервал (α, β). Если /(а) < 0, /(/3) > >0, то полагают γ(/,Ω)=1. В случае /(<*)>Q,f(fi)<0 - y(f, Ω) = -1. Если же/( а) и /(β) одного знака, то γ(/, Ω) = 0. Пусть дана некоторая система уравнений Ci(nfu) = 0, С2(и,и) = 0, (4.5) где векторы и и значения G\ принадлежат R"1, а векторы υ и значения G2 принадлежат R"2 (rii,n2 > 1). Понятно, что любое уравнение G(x) = 0 в R" (п > 2) может быть представлено в виде (4.5). Очевидно и обратное — любую систему (4.5) можно рассматривать как уравнение G (х) = 0 в R", где «=Wl+w2, x = {u,v), G(x) = {Gl(x),G2(x)} . Пусть нас интересует существование решения (4.5) в некоторой области Ω = Ω] Χ Ω2 С Rw, где Ω ], Ω2 - ограниченные области соответственно в R"1 hR"2. Предположим, что невырожденный гомотопический переход на U переводит поле G в поле F(x)={Fl(u)i F2(v)}9 (4.6) которое обычно называют прямой суммой полей Fi(b R"1) uF2(b R"2) и обозначают F=F\ + F2. Уравнение F(x) = 0 в данном случае имеет вид системы двух несвязанных уравнений F,(n)=*0, F2(u) = 0, (4.7) разрешимость которых естественно изучать отдельно друг от друга. Допустим, мы установили, что γ^,,Ω,^Ο, γ(^2,Ω2)*0. (4.8) Это, конечно, гарантирует разрешимость (4.7) в Ω = Ω! Χ Ω2. Но можно ли из (4.8) сделать вывод о разрешимости в Ω системы (4.5)? Оказывается, можно. 57
Теорема 4.1. Пусть поле Fx невырождено на tlx С R"», а поле F2 - най2 CR"». Тогда y(Fl±F29ili Xna) = r(F1>ii1)7(f2>n2). (4.9) Происхождение формулы (4.9) легко проследить по обычной для нас схеме. Обозначим через Ιχ, \2 проекции луча / С R"»+ п * на R"l, R"2. Пусть луч h протыкает поверхность Fx (Ω,χ) в точках и1,..., ит, а луч /2 протыкает F2(U2) в точках ν1,... , vk. Тогда луч / "протыкает" поверхность F(U) = Fi + F2(Ux ΧΩ2) в точках (uV) (i=l,.. . ,/w; 7 = 1, . . . , fc). Поскольку, очевидно, е(м', υ7*) = €(и*)е(^), то Σ e(w/,i;7) = Z e(u') Σ€(υ7), что и дает (4.9). G Таким образом, (4.8) влечет за собой y(F, Ω) φ О, и вьшод о разрешимости системы (4.5) в указанных выше предположениях очевиден. Теорема 4.1 в совокупности с идеей гомотопического перехода от изучаемого поля G (х) к полю вида (4.6) с разделенными переменными позволяет сводить вычисление вращения поля G к вычислению'вращений полей Fb F2 в пространствах меньшей размерности. 4.3. Слабо связанные системы. Приведем простую конкретную реализацию описанной в предыдущем пункте схемы рассуждений. В случае y(F, Ω,)Φ0 можно гарантировать существование нуля в Ω не только у поля F(x), но и у поля F(x) + Q(x), если только Q (χ) на Ω достаточно мало по норме. Было бы полезно располагать возможностью аналогичного заключения в несколько иной ситуации. Иногда изучаемое векторное уравнение G(x)=0 имеет вид системы двух (или большего числа) слабо связанных уравнений Gl(u,v) = Fl(u) + Ql(u,v) = Oi G2(u,v) = F2(v) + Q2(u,v) = 0. ( e } Слабо связанных в том смысле, что добавки Qx и Q2 достаточно малы по норме по сравнению с нормами главных частей FxnF2. Для определенности положим, что y(Fi, Ωι) Φ 0, y{F2,. Ω2) Φ 0, а добавки β ι, Qi достаточно малы по норме при χ = {и, ν } Ε Ω = Ωι Χ Ω2. В этом случае с точки зрения предыдущего пункта можно гарантировать наличие решения у системы (4.10). К этому заключению приводят два внешне различных рассуждения. Малость по норме добавок на Ω обеспечивает невырожденность гомотопии Н{иу v, r) = {Fi(m) + tQx{u, υ),F2(v) + rQ2(u, υ)} . Далее остается сослаться на теорему 4.1. Можно рассуждать и по-другому, с самого начала отправляясь от теоремы 4.1, которая гарантирует у(К Ω) Φ Φ 0. После этого вьшод о разрешимости системы (4.10) можно представить как обычное следствие инвариантности вращения при малых деформациях поля. 58
§ 5. Гомеоморфизмы, накрытия, неявные функции 5.1. Гомеоморфизмы bR71. Установим предварительно справедливость вспомогательного утверждения. Лемма 5.1. Пусть F: R"->R" — локальный гомеоморфизм. Тогда индексы любых двух точек х\, х% соответственно у векторных полей F(x) -F(xx) и F(x) -F(x2) равны. Доказательство. Поскольку F — локальный гомеоморфизм, и — изолированный нуль поля F(x) — F(u). Выберем открытый шар Ω с центром в и настолько малого радиуса, чтобы из ц w Ε Ω, υ Φ νν вытекало F(u)-F(w)*0. (5.1) Пусть теперь ζ GO,. Векторные поля F(x) —F(и) nF(x) -F(z) на Ω связывает гомотопия Н(х, t)=F(x)-F[tu+(1 -t)z]. (5.2) Невырожденность (5.2) следует из выпуклости Ω (которая обеспечивает ти + (1 - r)z G Ω) и условия (5.1). Отсюда ясно,что ind[F(x)—F(w),w ] — локально постоянная функция аргумента и. Соединим точки χ ι и х2 отрезком /(λ) = λχ! +(1 -λ)χ2, λ€[0,1]. Окончательный вьшод следует из локального постоянства функции χ(λ) = Mnd[F(x)-F(/(X)),/(X)].D Теорема 5.1. Для того чтобы F: Rn -> R" было гомеоморфизмом Rn на R", необходимо и достаточно выполнение двух условий: - а) F является локальным гомеоморфизмом; б) прообраз любого ограниченного множества ограничен. Необходимость условий а), б) очевидна. Установим их достаточность. Вращения полей F(x) -F(0) и F(x) -у (при любому G R") на сферах S достаточно большого радиуса равны, так как существует гомотопический мост Н(х, т) = F(x) - tF(0) - (1 - т)у. (5.3) Радиус сферы S должен быть выбран настолько большим, чтобы прообраз компакта T={x\x = tF(0) + (\ -т)у, те [0, 1]} лежал внутри S. В этом случае (заведомо осуществимом в силу б)) гомотопия (5.3) будет невырождена на S. Учитывая теперь результат леммы 5.1 и утверждение теоремы об алгебраическом числе нулей (теорема 3.12), приходим к выводу, что число решений F (х) — у = 0, как функция у> есть константа, отличная от нуля. Это влечет за собой сюръективность F. Пусть у = 0 соответствуют решения Χι,... ,хт, где т>2. (Заметим, что число решений конечно, так как все они изолированы в силу а) и все лежат в ограниченной области в силу б).) При движении по любому пучу vt (при фиксированном ν G Rn, II ν II = 1) от / = 0 до ΐ = °° из каждой точки xt (i = 1,. .., т) выходит однозначная непрерывная (в силу а)) кривая Xj(t) такая, что F(xi(t)) = vt. В силу постоянства числа решений уравнения F(x) -у-0 кривые, выходящие из 59
раличных точек xit Xj, не могут пересекаться. Отнесем теперь к множеству С,- все точки кривых X[{t) (соответствующих всевозможным ν € R", II υ II = 1), выходящих из точки χ,·. Легко видеть, что множества Q открыты (в силу а)) и заведомо не пересекаются. В то же время и С/ = R". Но это противоречит связности R". Это доказывает инъективность F. Непрерывность F'1 следует из a). D Заметим, что условию б) можно придать другую эквивалентную форму, которая иногда оказывается более удобной. Л е м м а 5.2. Пусть F: R" -> R" непрерывно. Тогда для справедливости б) необходимо и достаточно lim II F(x) ! = «>. (5.4) II χ II -> со Необходи мо с τ ь. Пусть б) справедливо, а (5.4) не выполняется. Тогда найдется последовательностьхк такая, что II хк II -> °°, но F(xk) = ук-+ -+у*. В этом случае прообраз ограниченного множества { ук) V{y*} неограничен. Достаточность. Пусть справедливо (5.4) и существует ограниченное множество Ω, прообраз которого ^_1(Ω) неограничен. Тогда найдется последовательность хк £F~*(0) такая, что II jcfc II ^^ °°. В силу (5.4) II F(Xk) И -* °°- С другой стороны, V к: F(xk) 6Ω.ϋ 5.2. Общие теоремы о гомеоморфизмах. В прикладных задачах изучаемый оператор F бывает определен лишь на некотором подмножестве Rn. В отдельных случаях при этом удается обойтись применением теоремы 5.1. Вот простая иллюстрация. Определим на внутренности неотрицательного ортанта R" отображение /,(*) = {Inχι,.. . ,1пхи} . Теорема 5.2.Пусть локальный гомеоморфизм G: intR" -> int R" удовлетворяет условию II 1С(х) II-*«> при \\L(x) II-*~ (5.5) Тогда G - гомеоморфизм*) int R" на int R". Для доказательства достаточно заметить, что отображение L осуществляет гомеоморфизм между int R" и R", а отображение LGL~l: R" -> R" удовлетворяет предположениям теоремы 5.1. D В более сложных ситуациях теорема 5.1 (равно как и ее очевидные следствия) не всегда оказывается работоспособной. Приведем более общий результат. Теорема 5.3. Пусть F отображает метрическое пространство X в мет- рическое пространство Y, причем Xлинейно связно, α Υ стягиваемо по себе. Тогда, чтобы F было гомеоморфизмом X на Υ, необходимо и достаточно выполнение двух условий:: а) F является локальным гомеоморфизмом; б) прообраз любого компактного подмножества Υ компактен в Χ. Π Мы не приводим доказательства, так как теорема 5.3 - частный случай теоремы 5.4, доказываемой ниже. *) Условия теоремы не только достаточны, но и необходимы, что очевидно. 60
Отображения, удовлетворяющие условию б), называются собственными. Как показывает лемма 5.2, в случае R" условие б) можно заменить эквивалентным требованием ограниченности прообраза любого ограниченного множества. В общем~случае такая замена недопустима. Теорема 5.3 не охватывает ряд ситуаций, которые могут представить интерес (например, гомеоморфизмы сферы на сферу). Более широкий круг приложений имеет следующее утверждение. Теорема 5.4. Теорема 5.3 остается в силе, если условие стягиваемости Υ заменить более слабым: Υ линейно связно и любая непрерывная замкнутая кривая, лежащая в Υ, может быть непрерывно стянута (деформирована) в точку*). Доказательство. Необходимость условий а), б) очевидна. Покажем достаточность. Установим сначала сюръективность F. В силу а) множество F (X) открыто в У. Покажем, .что оно также замкнуто. Пусть ук -* у и \fk: yk e F(X). В силу б) прообраз компактного множества {ук) и{ у) компактен в X. Поэтому у последовательности χ^[Хд. eF"1 (yk) ] существует сходящаяся подпоследовательность х^ -+х. Учитывая непрерывность F, получаем у% = F(xkm) -*F(x), откуда F(x) = у, т.е. у е F (X). Итак, F (X) одновременно открыто и замкнуто в У, а поскольку У связно, то F(X) = Υ. Сюръективность доказана. Следующий этап - доказательство инъективности. В предположении противного найдутся точки xt Φ χ2 такие, что F(xl) =F(x2) =y0. Соединим xt и хг непрерывной кривойР(Г), ΐ е [0, 1], Р(0) =*,, Р(1) = л: 2, и рассмотрим ее образ Q(t) =F(JP(t))9 представляющий собой замкнутую кривую. Пусть Η (Г, λ) (\е [0,1 ]) - непрерывная деформация Q{t) в точку у0, Я(г,0) = <2(», Я(М)=;>0. Поскольку F сюръективно, для любых Г, λ е [0, 1] X [0,1] прообраз Я (Г, λ) не пуст. Кроме того, в силу а), б) из каждой точки Ρ(ΐ) е X (при любом фиксированном t е е [0, 1]) выходит однозначная непрерывная по λ ветвь P(t,\)<=F-1[H(t, λ)], определенная для любого λ£ [0, 1 ]. Если теперь показать, что при любом фиксированном λ, в том числе при λ = 1, Ρ(ί, λ) представляет собой непрерывную кривую, получится требуемое противоречие. Действительно, в этом случае прообраз точки у0 е Υ будет содержать непрерывную кривую P(t, 1), что противоречит а). Покажем непрерывность Ρ (ί, λ) по t в любой наперед заданной точке t0 е [0, 1 ] при любом фиксированном λ е [0, 1 ]. В силу а), б) прообраз каждой точки у & Υ состоит не более чем из конечного числа точек. Поэтому для каждой точки у е У существует такой открытый шар Wy с У, что для каждого χ е F"1 (у) существует окрестность Vх СХ такая, что сужение F на Vх есть гомеоморфизм К^-на Wy. Выберем Δλ, из условия νγ е [0, Δλ, |: #(f 0, у) е Wyy где у = #(Г0, 0). Тогда для Г, достаточно близких к f0, очевидно P(t,A\l)=Fyl [H{tt Δλ,)], χ где Fyx - сужение F на Vx [χ = Ρ(ί0, 0)}. Аналогичным образом можно представить второй шаг Ρ (Г, Δλ1 + Δλ2) и т.д. Поскольку множество Н( [0, i ], [0, 1 ]) компактно (как непрерывный образ компакта [0, 1 ] X [0, 1 ]), то из его покрытия шарами можно выбрать конечное подпокрытие. Поэтому P(t, λ) при любом наперед заданном λ е [0,1) иг, достаточно близких к г 0, можно определить с помощью конечного числа *) Этому условию, например, удовлетворяет сфера в R" (η > 3), которая по себе нестягиваема. 61
указанных выше шагов, т.е. сужение F{t, \) на достаточно малую окрестность ΐ0 есть композиция конечного числа непрерывных операторов. Это доказывает непрерывность Ρ (г, λ) по t и завершает доказательство инъективности. Непрерывность F"1 вытекает из а). D 5.3. Накрытия пространства. Теоремы о гомеоморфизмах одновременно гарантируют разрешимость уравнения F(x) = у при любому Ε Y, единственность решения и непрерывность обратного оператора F"1. Иногда возникает самостоятельный вопрос о разрешимости F(x) = у при любому Ε Υ. В случае положительного ответа говорят, что отображение F: Х-+ Υ накрывает*) пространство Υ. Теорема 5.5. Пусть вращение векторного поля F на сферах достаточно большого радиуса отлично от нуля, т.е. ind(F, °°)Ф0,и пусть выполняется условие (5.4) . Тогда уравнение F(x) = у имеет решение при любом у Ε R", т.е. F накрывает R". Для доказательства достаточно заметить, что в силу (5.4) на сферах достаточно большого радиуса поля^(х) и F(x) —у будут непротивоположно направлены. D Из предыдущего раздела легко сделать вывод о справедливости следующего утверждения. Теорема 5.6. Пусть F - локальный гомеоморфизм и образ F(Rn) замкнут в R". Тогда F накрывает R". D 5.4. Глобальная разрешимость неявных функций. Пусть дано уравнение (относительно х) <&(*J>)=*o, (5·6) где Φ: Χ Χ Υ -+X — непрерывное отображение, ζ0 — некоторый фиксированный элемент из X. Здесь Χ, Υ — метрические пространства**), причем X линейно связно, a Y стягиваемо по себе. Уравнение (5.6) назовем локально разрешимым, если 1) существует хотя бы одна пара х0 Ε X, yQ G Y, удовлетворяющая (5.6); 2) для любой пары х0 Ε X, у0 Ε Υ, удовлетворяющей (5.6), можно указать окрестности V СХ, W С Υ и непрерывное отображение G: W -> V такие, что для любого у Ε W иФ(х,у)Фг0, если χΦΘ(γ). Другими словами, (5.6) на множестве VXW эквивалентно уравнению x = G(y). Уравнение (5.6) назовем глобально'разрешимым^если существует непрерывное отображение G: Υ -+Х такое, что (5.6) на Χ Χ Υ эквивалентно уравнению χ = G (у). ТВ этом случае говорят также, что (5.6) неявно задает функцию G(y). Очевидно, задача о разрешимости (5.6) в указанном смысле является более общей, чем задача о гомеоморфизме, так как последняя может быть сформулирована в виде вопроса о глобальной разрешимости уравнения F(x) —y=0 относительно х. *) Гомеоморфизм осуществляет однолистное накрытие. **) Необязательно конечномерные. 62
Теорема 5.7. Чтобы уравнение (5.6) было глобально разрешимо, необходимо и достаточно выполнение следующих условий: 1°. Уравнение (5.6) локально разрешимо. 2°. Если множество S С Υ компактно, то множество Т={х\Ф(х,у) = 20,уе8) компактно в X. Доказательство. Необходимость условий 1° и 2° очевидна. Перейдем к достаточности. Покажем, что при любом д> е У уравнение (5.6) имеет решение. В силу 1° множество Ω с У тех точек уеУ, для которых (5.6) имеет решение, открыто. Покажем, что оно также замкнуто. Пусть ук -> у* и Vfc: ук е Ω. Для каждого ук возьмем по одному решению (5.6) х^. Последовательность х^ в силу 2° компактна, и без ограничения общности можно считать х^ -+х* (иначе можно перейти к подпоследовательности) . Но тогда Φ(λ·* у*)= ζ0, поскольку Ф(х^ Ук) = *о для всех к и отображение Φ непрерывно. Следовательно, у* е Ω. Итак, Ω одновременно открыто и замкнуто в У, а поскольку Υ связно (так как стягиваемо), то Ω = У, т.е. при любом yG Y уравнение (5.6) имеет хотя бы одно решение. Покажем теперь, что (5.6) при любом у Ε Υ имеет единственное решение χ - = G{y) 6 1 В силу Г и 2° число решений (5.6) при любому е Υ конечно. Кроме того, число решений (5.6), как функция у, есть константа. Действительно, пусть при ух G Υ и у2 е Υ (5.6) имеет различное число решений. Пусть хх, ..., хт - решения (5.6), отвечающие ух. Соединим точки ух и уг непрерывной кривой Ρ (λ), Ρ: [0,1]-Г, P(0)=.ylf Р(1)=У2. Из 1° и 2° следует, что из каждой точки х{ (ι = 1, ..., т) выходит непрерывная кривая Xj(\) такая, что Φ[*ί(λ), Ρ(λ)] =ζ0. Так как число решений (5.6) при уг и у2 по предположению различно, то кривые *ί(λ) должны или ветвиться, или пересекаться. Но это противоречит условию 1°. Фиксируем теперь некоторую точку у0 е У, и пусть ей отвечают решения (5.6) х\> · · - ' хт· Предположим, что т > 2. Поскольку У стягиваемо, существует гомо- топия Н\(у), связывающая тождественное отображение Я0: Υ-^Υ с отображением Я, : Y-*y0. Пусть xlt. .. , хт - множество решений (5.6), отвечающих у β У. Соединим у и у0 кривой Р(\) = Н^(у) и рассмотрим соответствующие кривые χ/ (λ.) (см. выше). Каждая кривая */(λ) имеет два конца x/ = JCf(0) и jc? = ^-(1). Точки х/ и х°. в этом случае назовем эквивалентными. Пусть Cf CX - множество точек, эквивалентных х° (i = 1, . .., т). Очевидно, UQ β X, и все множества С/ открыты и не ι пересекаются. Но это противоречит связности X. Следовательно, т - 1. Непрерывность G: Y-*X вытекает из 1°. □ Если X = Υ = R", то в условии 2° теоремы 5.7 требование компактности S иТ можно заменить равносильным (в данном случае) требованием ограниченности. Упражнения. 5.1. Пусть локальный гомеоморфизм F: Rn -> Rn осуществляет гомеоморфизм Ω на F(a). Тогда F - гомеоморфизм Ω на F(h). 5.2. Пусть гомеоморфизм F: Ω -» F(?2) невырожден на Ω и F(x) = 0 для некоторого дг€ Ωч Тогда | y(F, Ω)| = 1. " 5.3. Постройте пример локального гомеоморфизма F: R -* R , который накрывает Rn, но не является гомеоморфизмом. 5.4. Постройте примеры отображений, которые удовлетворяют условиям теоремы 5.5 или 5.6, но не являются гомеоморфизмами. 63
5.5. Пусть векторное поле F асимптотически линейно и detF'(°°) Φ 0. Тоща F накрьшает R". 5.6. Пусть F - гомеоморфизм Rn на Rw и \\G(x)\\ / \\F(x)\\ -►- 0 при ||х|| -*«>. Тогда отображение F(x) + G(x) накрывает Rn. 5<7. Пусть отображение F: Кп -* Rm (т < п) гладкое, производная F'(x) в любой точке χ е Rn накрьшает Rm, а образ F(R") замкнут в Rm. Тогда F накрьшает Rw. 5.8. Пусть || F (х)|| -* «> при || χ II -* «» и (F (х), G (*)) < 0 для достаточно больших по норме χ £ Rn, где G - некоторый гомеоморфизм Rn на Rn. Тогда F накрьшает R". § 6. Неподвижные точки многозначных отображений 6.1. Общие сведения. Многозначным (точечно-множественным) отображением Τ: Χ -+2Υ (2Υ условно обозначает множество всех подмножеств множества У) называется оператор, сопоставляющий каждому элементу χ Ε Χ некоторое непустое подмножество множества У, т.е. Т(х) СУ для любого χ EX. Везде далее под X подразумевается некоторое подмножество R" с индуцированной из R" метрикой. Если не оговорено противное, считается У = Rn. Рассматриваются лишь ограниченные отображения Т: X -> 2У, которые каждое ограниченное множество А С X переводят в ограниченное множество С=Т(А) = и{Т(х): χ Ε А}. Многозначное отображение Τ: Χ^2Υ называется замкнутым (или полунепрерывным сверху), если график этого отображения z = {(x,y)exxY\xex, ует(х)} (6.1) замкнут в 1X7. Для ограниченных отображений можно дать эквивалентное определение: отображение Τ: Χ^2Υ замкнуто (полунепрерывно сверху), если по любой окрестности U любого множества-образа Т(х) можно указать окрестность V точки χ такую, что T(V) С U. Еще одно равносильное определение замкнутости отображения: если xk ->x, yk Ε Т(хк), ук -*у, το у Ε Τ (χ). Многозначное отображение Τ: Χ -> 2γ назьшается полунепрерывным снизу, если для любых точек хЕХиу Ε Τ (χ) и любой последовательности хк -+х (всед^ Ε X) найдется такая последовательность^, что ук Ε Т(хк) и Для уяснения разницы между полунепрерывными снизу и сверху отображениями полезно рассмотреть несколько примеров. Ограничимся двумя. Отображение т, , ί [0, 1] при х<0, J ι iX) — \ [ [0, 2] при х>0 полунепрерывно сверху, но не снизу. Отображение ί [0, 1] при х<0, | [0, 2] при х>0 полунепрерьгоно снизу, но не сверху. 64
Многозначное отображение, одновременно полунепрерывное сверху и снизу, называется непрерывным по Какутани. Пусть все образы отображения Т: X -> 2У компактны. Если через Yc обозначить множество всех компактных подмножеств множества У, то Τ можно рассматривать как обычное (однозначное) отображение Τ: Χ -* -> Ус· Если при этом Yc метризовано с помощью метрики Хаусдорфа (определение дано ниже), то о непрерывности Т: X^>YC можно говорить как о непрерывности однозначного отображения. В этом случае Τ называется непрерывным по Хаусдорфу, Всякое непрерывное по Хаусдорфу отображение непрерывно и по Какутани. Для ограниченных отображений верна также обратная импликация. Напомним определение метрики Хаусдорфа. Для множеств А и В из метрического пространства Υ уклонение А от В определяется как δ(Α,Β)= sup р(х,В) = sup inf р{х,у). xGA xElA y<=B Хаусдорфовым расстоянием между А и В называется максимальное из уклонений Ъ(А,В), δ (В, А) ри(А,В)=тм{д(А,В), 6(Д,>1)}. Теория многозначных отображений весьма обширна. Далее нас будут интересовать лишь вопросы, связанные с разрешимостью включений О Ε Τ (χ) или χ £ Τ (χ). В случае χ Ε Τ (χ) точку х называют неподвижной точкой отображения Г. 6.2. Редукция задач к многозначным отображениям. Теоремы о неподвижных точках многозначных отображений представляют собой довольно мощный аппарат для решения обширного круга вопросов. Использование этого аппарата часто сопряжено с необходимостью перевода формулировок изучаемых задач на язык многозначных отображений. Дело в том, что в исходных постановках задач многозначные отображения, как правило, вообще отсутствуют. При этом ведущие к цели преобразования могут быть далеко не очевидными. Но в большинстве случаев необходимая редукция носит достаточно естественньй характер. Ниже рассматриваются две классические иллюстрации. Обратимся к известной задаче о существовании у функции φ(χ, у) сед- ловой точки. Она эквивалентна вопросу о справедливости равенства min max φ(χ, у) = max min <p(x,y). (6.2) у Ε Υ x&X xElX yGY Напомним, что эта задача играет важную роль в математическом программировании (существование седловой точки у лагранжиана равносильно существованию решения у задачи нелинейного программирования), теории игр и вообще теории минимаксных задач. Стандартный путь доказательства равенства (6.2) состоит в следующем. Вводятся два многозначных отображения *) U(x) = Arg min <p(x,y), V(y) = Arg max φ(χ, у). yE:Y x&X *) Как обычно, Arg min ψ (χ) обозначает множество тех xejf, при которых дости-. хЕ^Х гается минимум φ (χ). Аналогично определяется Arg max ψ (χ). 5.В.И. Опойцев χ(ΞΧ 65
Теперь из существования неподвижной точки у отображения U(x) X V(y) следует (6.2). Действительно, пусть (y*,x*)eU(x*)X V{y*). Это означает, что min φ(χ*,γ) = φ(χ*',у*) = max φ(χ,γ*). νe Υ χβΧ Отсюда min max φ(χ,γ)< max ip(x,y*) = φ(χ*,)>*) = = min φ(χ*,γ)< max min φ(χ,)>). yE:Y χ&Χ y&Y Но справедливость обратного неравенства очевидна, поэтому (6.2) доказано (конечно, при условии существования неподвижной точки у отображения UX V). Рассмотрим другой пример. Пусть имеется игра N лиц с функциями выигрыша Dj(xi, ..., х^), где Xj G Xt — стратегия /-го игрока. Введем обозначение )]/i(yi,x)=Di(xl,... ,Xi-i,yitXi + i xN)· Решением (положением равновесия) игры по Нэшу назьюается точка х* = = {х*,..'., x*N} такая, что max ф.(уъ χ*) = φ,(χϊ,χ*)> / = 1,...,Ж Введем многозначные отображения Wt{x) = Aig max ψ,-(у,·, χ) и положим W(x) = Wx (χ) Χ ... Χ WN(x). Очевидно, что вопрос о существовании равновесия по Нэшу эквивалентен вопросу о существовании решения у включениях Ε W(x). 6.3. Отображения с выпуклыми образами. Ниже Ω обозначает ограниченную область в R". Рассматриваются многозначные отображения Т, заданные на Ω и имеющие выпуклые образы Т(х) С R" при любом χ £ Ω. Многозначное отображение Τ (χ) называют также многозначным векторным полем, а точку х, в которой О Ε Τ (χ), — нулем многозначного векторного поля. Говоря, что поле Т(х) невырождено на множестве Г, если на Г оно не имеет нулей, т.е. О φ Τ(χ) для любого хЕГ. Изучаемые далее Поля, если не оговорено противное, предполагаются невырожденными на границах Ω рассматриваемых областей. Перейдем к описанию стандартной аппроксимационной конструкции. В силу компактности Ω при любом е>0 в Ω существует έ-сеть L€ = = {xl, ..., χΝ}. В каждом множестве Т(х*) фиксируем произвольную точку у1 Ε Т(х1). Определим далее N весовых функций ν <χί6=Θί€(χ)/Σ 6je{x\ / = ι 66
где Θμ (χ) = max {О, е — || χ - х}||} . Заметим, что Σθ;€(χ) > О для любого χ Ε Ω , поскольку набор точек х7 образует е-сеть. Назовем теперь однозначное отображение -ί(χ)= Σ щ€(х)у* (6.3) / = 1 е-аппроксимацией многозначного отображения Т{х). Пусть отображение Τ (с выпуклыми образами) невырождено на Ω и замкнуто. В этом случае вращением γ(Γ, Ω) многозначного векторного поля Т\х) на Ω назовем вращение однозначного векторного поля (6.3) на Ω при достаточно малых е. Покажем корректность такого определения, т.е. независимость вращения е-аппроксимаций (6.3) от выбора е-сети (если только е достаточно мало) и от выбора точек у1. В силу невырожденности Τ на Ω любое замкнутое выпуклое множество Т(х) не содержит нуля. Поэтому существует некоторая выпуклая окрестность U множества Т(х), также не содержащая нуля. Но так как отображение Τ полунепрерывно сверху, то в U лежат все образы Цу) точек у из некоторой окрестности V исходной точки х. Таким образом, каждой точке л: Ε Ω можно поставить в соответствие шаровую окрестность VX9 обладающую тем свойством, что ее образ T(VX) лежит в выпуклом множестве, не содержащем нуля. Из покрытия компакта Ω открытыми шарами Vx выберем конечное подпокрытие. Пусть такое подпокрытие образует шары Vl9 ..., Vm. Лемма 6.1. Существует такое δ > 0, что шар радиуса δ с центром в любой точке χ Ε Ω целиком лежит в одном из множеств Vl9 ..., Vm. Пусть е{х) обозначает максимальный радиус шара с центром в х, целиком лежащего в одном из множеств Vx,..., Vm. Очевидно, е(х) > е(у) — — II х - У II, €(γ) > е(х) - \\ χ - у \\ для достаточно близких точек х, у. Отсюда \е(х)— е(у)\ < \\х ~у ||, т.е. функция е(х) непрерывна на компакте Ω. Для завершения доказательства достаточно положить δ = = min{e(x): χ Ε Ω}. D Возьмем теперь любую βι -сеть и любую е2-сеть (βι, е2 < δ/2) на Ω . Пусть ft (χ) = Σ ttie (x)y\ t2(x) = Σ оува (*)ζ> (6.4) — соответствующие однозначные аппроксимации. Рассмотрим произвольную точку χ Ε Ω. В суммах (6.4) ненулевые коэффициенты могут быть только при тех у1, ζ7, которые заведомо принадлежат образу δ-окрестности точки χ Но этот образ лежит в одном из образов ^(Кд.), который в свою очередь лежит в некотором выпуклом множестве, не содержащем нуля. Поэтому в любой точке χ Ε Ω все векторы уг, ζ7, коэффициенты при которых в (6.4) отличны от нуля, лежат в выпуклом множестве, не содержащем нуля. Отсюда немедленно вытекает невырожденность и непротивоположная направленность однозначных полей ii(x), t2(x), на Ω, что влечет за собой их гомотопность. Корректность определения вращения многозначного поля доказана. 67
Для вычисления вращений, как и в случае однозначных полей, важно понятие го мотопии. Многозначные векторные поля 7о(х), Τι(χ) называются гомотопными на Ω, если существует замкнутое по совокупности переменных многозначное отображение (с выпуклыми образами) Я(х, г) (χ6Ω, тЕ [0,1]) такое, что при любом тЕ [0,1] поле Н(х,г) невы- рождено на Ω и Н(х, 0) = Г0(х), #(*, 1) = Г, (χ), χ Ε й. Теорема 6.1. Гомотопные многозначные векторные поля имеют одинаковые вращения. Для доказательства достаточно заметить, что у(Т, Ω) не меняется при малых деформациях поля. D Теорема 6.2. Если многозначное векторное поле Τ невырождено на замыкании Ω, то γ(Γ, Ω) = 0. Легко убедиться, что_б-аппроксимации поля Τ при достаточно малых е будут невырождены_на Ω (имеются в виду е-аппроксимации не на границе Ω, а на замыкании Ω ), Далее остается сослаться на теорему 2.6. D Как и в случае однозначных отображений, эта теорема немедленно влечет за собой справедливость следующего фундаментального результата. Теорема 6.3, Пусть у(Т, Ω) Φ 0. Тогда включение 0 Ε Т(х) разрешимо в Ω, т.е. существует точка χ* Ε Ω, в которой 0 Ε Τ(χ*). Π Понятно, что далее можно следовать путем, аналогичным тому, который был описан в §2,3. Надо определить вращения ряда стандартных полей, а затем сводить к ним с помощью гомотопии изучаемые поля, после чего использование теоремы 6.3 будет приводить к различным принципам Неподвижной точки. Но в качестве стандартных можно использовать однозначные поля (являющиеся частным случаем многозначных), вращение ко то рьгх известно. Теорема 6.4. Если при любом χ Ε Ω произвольные векторы у χ Ε Ε Тх(х)у у2 Ε Т2(х) не направлены противоположно, то поля Τι(χ) и Т2(х) гомотопны. Доказательство элементарно. Легко проверить, что *) Я(х1т) = (1-т)Г1(х) + тГа(х) является гомотопическим мостом. D Остановимся на выводе получившей широкое распространение теоремы Какутани. Напомним, что все рассматриваемые в этом разделе многозначные отображения имеют выпуклые образы и предполагаются замкнутыми. Теорема 6.5. Пусть многозначное отображение Т(х) переводит в себя некоторый замкнутый шар В, т.е. Т: В -> 2В. Тогда отображение Τ имеет неподвижную точку х* GB [х * Ε Τ(χ *)]. *) Сумма многозначных отображений определяется так: Щх) = Ul{x) + U2{x)={y\y=a+b, α<ΞUx(χ), Ь еU2(x)}. Если Ut (x), U2 {x) - замкнутые отображения с выпуклыми образами, то отображение C/j (χ) + U2(x) также замкнуто и имеет выпуклые образы. 68
Без ограничения общности центр шара В можно считать расположенным в нуле. Многозначное векторное поле U(x) = χ - Т(х) можно считать невырожденным на В (иначе бы существовала неподвижная точка х*£5). Легко видеть, что любые два вектора χ Ε В, у Ε χ - Т(х) не могут быть противоположно направлены. Но тогда (теорема 6.4) поля Ι(χ) = χ и U(x) гомотопны. Следовательно, y(Ut В) = γ(/, В) = 1. Доказательство завершает ссылка на теорему 6.3. D Обратим внимание, что схема доказательства здесь полностью аналогична схеме доказательства теоремы Брауэра. Такая аналогия имеет место и для ряда последующих теорем. Теорема 6.6. Пусть 0ΕΩ« (χ, у) > 0 для любой пары векторов χ Ε Ε Ω, у Ε Τ (χ). ТЬгоя включение 0 Ε Γ (χ) разрешимо β Ω. D Теорема в J. Пусть О Ε Ω и (χ, 7) *^(Χ λ) ^Λ любой пары векторов χ Ε Ω, ^ Ε Γ(χ). ТЬгод отображение Τ имеет неподвижную точку x*G Ω. D Теорема 6.8. Я^стъ О Ε Ω w d/гя любых jc€iij Ε Γ (χ) суадесгв>>ег индекс i такой, что Х/.У/ > 0. 7Ъгод включение 0 Ε Г (χ) разрешимо в Ω. G Теорема 69. Пусть QESI иу^Хх для любых χ 60j Ε Г (χ) и любого λ > 1. ТЬгод отображение Τ имеет неподвижную точку χ* Ε Ω. D Теорема б.Ю.Дустъ 0 Ε Ω, многозначные поля U(x), V(x) невырождены на Ω, y(Uf й)Ф0 и для любого χ Ε Ω max{||j; ||: yeV(x))<m*x{\\z\\: zEt/(x)}. Тогда включение 0 Ε £/(x) + F(x) разрешимо на Ω. D Аналогию с однозначными отображениями можно было бы продолжить. Так, например, легко доказать аналоги теорем о существовании у многозначных отображений собственных векторов, т.е. о разрешимости включений λχ Ε Г (χ) при некотором λ Ε (— °°, «>). Для многозначных отображений справедлива также теорема об алгебраическом числе неподвижных элементов поля, аналогичная теореме об алгебраическом числе нулей однозначного векторного поля. Под неподвижными элементами в данном случае понимаются связные множества нулей многозначного векторного поля, и речь идет о случае изолированных неподвижных элементов (имеющих непересекающиеся окрестности). В приведенных выше теоремах фигурируют различные предположения относительно пары векторов jc Ε Ω, и у Ε Τ (χ). Эти предположения было бы полезно ослабить, требуя справедливость тех или иных условий не для любого χ Ε Ω и любого у Ε Τ (χ), а для любого χ Ε Ω и некоторого у Ε Ε Τ (χ). В отдельных случаях, такое ослабление предположений действительно возможно. Вот два примера соответствующих утверждений, первое из которых обобщает теорему Какутани. Теорема 6.11. Пусть В - замкнутый шар и для любого χ Ε В некоторый вектор у Ε Τ(χ) принадлежит В, т.е. пересечение любого образа Т(х) (χ Ε В) с В не пусто. Тогда отображение Τ имеет неподвижную точку х* Ε В. Сначала заметим, что теорема Какутани остается справедливой, если многозначное отображение Τ переводит в В не весь шар В, а лишь его границу В (именно это предположение было использовано при доказательстве 69
теоремы 6.5). В данном случае этому условию удовлетворяет отображение В О Т(х). Теперь остается заметить, что неподвижная точка отображения В Π Τ (χ) заведомо является неподвижной точкой отображения Т(х). Π Теорема 6.12. Пусть 0 е Ω и (х, у) > 0 для любого χ € Ω и некоторого у Ε Т(х). Тогда включение 0 € Т(х) разрешимо в Ω. Положим Р(х) = {ζ | (χ, 2) > 0}. Отображение Р(х) Π Т(х) будет удовлетворять предположениям теоремы 6.6. D 6.4. Многозначные отображения с невыпуклыми образами. Понятно, что если предположение о выпуклости образов в теореме Какутани (и вообще в теории вращения многозначных полей) несущественно, то какие-то предположения о структуре образов, безусловно, необходимы. Геометрическая интуиция подсказывает, что по крайней мере надо сохранить предположение о стягиваемости образов. Хотя это и не обязательно, но такое предположение (в некоторых случаях с оговорками) действительно может эффективно заменять предположение о выпуклости образов. Подробное изложение теории вращения многозначных векторных полей с невыпуклыми образами заняло бы слишком много места (краткая характеристика и библиографические указания даны в Комментариях). Здесь мы остановимся лишь на формулировке важного обобщения теоремы Какутани, которое принадлежит Эйленбергу и Монтгомери [69]. Теорема 6.13. Пусть XCRn— стягиваемый локально связный компакт, а Т: X -* 2х - замкнутое многозначное отображение со стягиваемыми образами. Тогда Τ имеет в X неподвижную точку. D Интересно отметить технический прием, использованный Эйленбергом и Монтгомери для доказательства основной теоремы. С одной стороны, он полезен вообще при изучении неподвижных точек многозначных отображений, с другой — указывает на важность определенного типа теорем о неподвижных точках однозначных отображений (точнее, теорем о совпадениях) . Теорема 6.14. Пусть N С R" - стягиваемый локально связный компакт, Μ CR" - компакт, а г : Μ-+Ν и t: M-+N- непрерывные (однозначные) отображения, причем все прообразы t~l(y) (при любом у € N) не пусты и стягиваемы. Тогда rut имеют точку совпадения, т.е. r(x) = t(x) для некоторого χ GM. Π Из этой теоремы предыдущая выводится довольно просто. Пусть Ζ — график отображения Τ: Χ -> 2х. Введем в рассмотрение два однозначных непрерывных отображения г: Ζ^Χ и t: Z-+X, r(x,y)=y, t(x,y)=x. Очевидно, t~l(x) = Т(х). Поэтому все прообразы отображения t стягиваемы. Все предположения теоремы 6.14 выполнены. Следовательно, существует точка (х* ,y*)€zZ, в которой r(x*,y*) = t(x*,y*)y т.е. у* - х*. Но это и означает х* € Т(х*), т.е. отображение Τ имеет неподвижную точку. D 70
Упражнения. Предполагается, что все рассматриваемые ниже многозначные отображения имеют выпуклые образы и являются замкнутыми. _ 6.1. Пусть многозначные отображения Ρ и Q переводят в себя замкнутый шар В и Р(х) п 6W ^ Φ ДЛЯ любого χ G В. Тогда Ρ и Q в В имеют общую неподвижную точку. 6.2. Пусть 0 е Ω и у Φ \х для любых л: е Ω, у G Т(х) и любого λ < 1. Тогда отображение Г имеет неподвижную точку л:*е Ω. 6.3. Пусть вращение многозначного отображения Τ на сферах достаточно большого радиуса отлично от нуля и \\у || -><» для любой последовательности^ ^ Т(х ) при условии, что || χ || -* оо. Тогда отображение Τ накрывает R", т.е. включение у Ε £ Τ (χ) разрешимо при любом у G кЛ § 7. Векторные поля в банаховых пространствах 7.1. Вполне непрерывные поля. Прямолинейная попытка обобщить теорию вращения (§§ 2 — 4) на векторные поля в бесконечномерном банаховом пространстве Ε принципиально не проходит. Причина этой неприятности заключается в том, что всякая сфера Sb бесконечномерном пространстве непрерывной деформацией может быть стянута по себе в точку! Отсюда в свою очередь следует, что все невырожденные поля на S оказываются гомотопными друг другу. Упражнение 7.1. Постройте непрерывную деформацию, которая стягивает по себе в точку единичную сферу S={x | II .ν II = 1} в пространстве С (непрерывных функций). Тем не менее, если от непрерывных векторных полей в Ε перейти к рассмотрению некоторых более узких классов полей, то их гомотопическая классификация становится возможной. Одним из таких классов является класс вполне непрерывных векторных полей, .представляющих собой отображения вида . <b(x)=x-F(x), (7.1) где F: Е-+Е — вполне непрерывный оператор. Теория вращения строится и для других классов полей, но центральную роль играет все же теория вращения вполне непрерывных векторных полей (7.1), которые наиболее широко распространены в приложениях. Если говорить о трудностях восприятия понятий теории вращения, то в основном они концентрируются в рамках конечномерной теории. По этой причине вращение .полей в R" рассмотрено в § 2 - 4 достаточно детально, а случай бесконечномерных пространств в данном параграфе излагается весьма схематично. Для такой расстановки акцентов есть и более веская причина - наличие монографии [25], в которой дано чрезвычайно интересное и обширное изложение теории вращения векторных полей в банаховых пространствах. 7.2. Конечномерные аппроксимации. Если множество значений оператора ^: Ε -> Ε лежит в конечномерном подпространстве Е, го F называют ко- нечномерным оператором. Примером конечномерного оператора служит интегральный оператор m F(x)=f Σ е&Шз,х(5у]<18, a i = ι * значения которого лежат в подпространстве с базисом βλ(ί), ... , em{t). 71
Оказывается, что вполне непрерывный оператор F: Ε -+Е на ограниченном множестве Μ СЕ всегда можно сколь угодно точно аппроксимировать конечномерным оператором F€ таким, что \\F(x)-F€(x)\\<e, xGM. (7.2) Оператор F€ легко задать конструктивно. Пусть Μ СЕ — некоторый компакт, а ζχ,. .., zk — его конечная е-сеть. Оператор Μι 00*1 + ...+Цк(х)гк Р€(х) = где М/ (х) = μι(*)+···+Μ*(*) ( € — \\x-Zj ||, если \ 0, если χ ем, II X - Z; II χ - ζ,- называется проектором Шаудера. Легко видеть, что конечномерный оператор F€ = P€F, где Р€ — проектор Шаудера, построенный по компакту F (М) и его произвольной е-сети, будет удовлетворять неравенству (7.2). 7.3. Гомотопные поля. Заданная на ограниченном множестве Μ С£* вектор-функция Ф(х, t)=x-F(x,t), 0 < г < 1, (7.3) называется деформацией поля Ф0(х) = χ - F0(x) = х - F{x, 0) (7.4) в поле Ф!(х) = х - Fx (χ) = х - F(x, l). (7.5) Деформация Ф(х, т) называется вполне непрерывной, если оператор F(x, г) вполне непрерывен как оператор, действующий из Ε X [0, 1] в Е. Деформация Ф(х, т) называется невырожденной, если Ф(х, г) Φ 0 при любом χ Ε Μ и г £ [0, 1 ]. , Вполне непрерывные векторные поля (7.4), (7.5) называются гомотопными на М, если существует соединяющая их невырожденная вполне непрерывная деформация (7.3). 7.4. Вращение вполне непрерывного поля. Пусть вполне непрерывное векторное поле (7.1) задано и невырождено на границе Ω некоторой ограниченной области Ω СЕ. Пусть F€ обозначает конечномерную аппроксимацию F на Ω, причем F€: Ε -*E0i a FeE — сужение оператора F€ на конечномерное пространство Е0. Вращением γ(Φ, Ω) = γ(/ — F, Ω) вполне непрерывного невырожденного векторного поля (7.1) на Ω называется вращение поля I — F€Eq на Ω0 = Ω Π£Ό при достаточно малом е > 0. Такое определение вращения оказывается корректным в том смысле, что вращения полей / — FeE стабилизируются при достаточно малых е > 0 независимо от выбора пространств Е0 и аппроксимаций F€. Дальнейшее развитие теории вращения вполне непрерывных полей идет по тому же пути, который описан в § 2 — 4. Устанавливается равенство вращений у гомотопных полей, вводятся понятия инпекса особой точки, 72
алгебраической суммы нулей и т.д. По существу все "конечномерные теоремы" остаются справедливыми и в банаховом пространстве. Уточнения требует вычисление индекса линейного оператора. Если В: Ε -*Ε — линейный вполне непрерывный оператор и 1 не является его собственным значением, то Ы(/-Я,0) = (-1У, где β — сумма кратностей вещественных" и больших, чем 1, собственных значений оператора В. Аналог теоремы Брауэра в банаховом пространстве носит название принципа неподвижной точки Шаудера. Вот его точная формулировка. Теорема 7.1. Пусть вполне непрерывный оператор F: Ε ^Ε отображает в себя ограниченное замкнутое выпуклое множество Ω С Е. Тогда оператор F имеет неподвижную точку х*Е Ω.ϋ На переформулировке других теорем мы не останавливаемся, поскольку такая переформулировка в большинстве случаев сводится практически к дословному повторению. § 8. Принципы сжатия 8.1. Общий принцип. До сих пор мы рассматривали исключительно топологические методы. Но это не единственный источник теорем существования. Для этих же целей могут эффективно использоваться метрические свойства пространства, в котором действует изучаемый оператор. Одну из таких возможностей предоставляет следующий фундаментальный факт, известный под названием принципа сжимающих отображений. Теорема 8.1. Пусть оператор F, действующий в полном метрическом пространстве (Χ, ρ), удовлетворяет условию . Vx.yGX: p[F(4^)]<^p(^j), (8.1) где q < 1. Тогда в X существует единственная неподвижная точка оператора F. D Этот принцип широко используется при исследовании дифференциальных, интегральных и других уравнений в функциональных пространствах. Однако для операторов, действующих в R", он применяется реже. Вместе с тем для операторов F: R" -> R" существует ряд'удобных и наглядных признаков, гарантирующих справедливость (8.1), на которых мы и остановимся. Предварительно напомним некоторые элементарные понятия. 8.2. Нормы векторов и матриц. Нормой вектора (точки) xER" называется положительное число, обозначаемое ||х II, такое, что а) ||*|1=0<=>х = 0; б) 11х+Я1<11*11 + 11Л1; в) ||ах || = |а ЩхН, α€(-~οο). Всякая норма порождает метрику р(х, у)=\\х -у \\. В конечномерном пространстве все нормы эквивалентны, т.е. для любых Двух норм || · Ih , || · ||2 можно указать такие константы сх и β, что II* Hi <α|Ι*ΙΙ2, ll*ll2<UII*lli 73
при любом χ € R". Это весьма полезный факт, который в каждом конкретном случае позволяет без излишних предосторожностей выбирать наиболее подходящую (удобную) для решаемой задачи норму *). Наиболее распространены следующие нормы: \\х\\т =тах|*,|, (8.2) 11дс|||= Σ \χ,\, (8.3) / = 1 \\х\\Е=у/ Σ χ]. (8.4) / = 1 Если || л: || — некоторая заданная норма, а М — невырожденная матрица, то || χ || м = ΙΙ^-1*ΙΙ — также норма, и называется она преобразованной нормой вектора. В качестве Μ часто удобно выбирать диагональную матрицу Μ = diag { Μι,. .. , μη), μ,- > 0. В этом случае 1 IUIUm =т*х —I*/1, (8.5) i Mi ||дс|1ш= Σ —\Xi\. (8.6) ι = ι μ/ Нормой матрицы А назовем действительное число \\А || такое, что выполняются условия а)—в), если в них х, у заменить на матрицы А, В. Поскольку матрицы — по существу линейные операторы в R", было бы естественно как-то согласовать нормы векторов и матриц, чтобы иметь возможность оценивать норму образа Ах. С этой целью вводится понятие согласования норм: норма матрицы \\А || называется согласованной с нормой вектора || χ ||, если для любых А и χ \\Ах\\ < || Л || ||х || (8.7) и для любых матриц А, В выполняется неравенство \\АВ\\ < Μ || ||Д||. (8.8) Поскольку (8.7) действительно часто используется в качестве оценочного неравенства, то желателен такой выбор нормы матрицы, чтобы (8.7) давало в определенном смысле наилучшую оценку. Это имеет место, когда норма матрицы подчинена норме вектора. Дадим точное определение. Пусть || А || согласована с || χ \\ и пусть для любой матрицы А найдется вектор χ Φ 0 (зависящий от А) такой, что || Αχ \\ -\\Α\\ \\ χ \\ . Тогда норма IIА || называется подчиненной норме || χ \\. *) Дело в том, что многие прикладные задачи прямо или косвенно связаны с выяснением сходимости тех или иных последовательностей. Часто оказывается, что с технической точки зрения доказывать сходимость по одной норме существенно проще, чем по другой. Если же нормы эквивалентны, то любая последовательность сходится (или не сходится) по обеим нормам одновременно, и тогда понятно, что выбор нормы не влияет на содержание окончательного вывода, но может облегчить процесс решения. 74
Для любой нормы вектора всегда существует подчиненная норма матрицы, которая определяется следующим конструктивным способом: II Ах || \\А\\ = max \\Ax\\ = max . II χ и = ι χφο || χ || Для норм (8.2), (8.3) это соответственно приводит к нормам матриц || Л ||w=max Σ |fl/.|, (8.9) / / = ι Μ II/ = max Σ ·\α«\. (8.10) / ί = ι ' При переходе от \\х\\ к преобразованной норме || χ \\м норма матрицы, подчиненная норме || χ \\Μ, получается так: || А \\м = \\М'1АМ\\. Это легко видеть из очевидного равенства \\Ах\\м = \\М~хАх\\ = \\Μ-χΑΜΜ'ιχ\\. .. Для норм (8.5), (8.6) подчиненными нормами матриц будут 1 η II А \\тМ = max — Σ μ.· | α»\, (8,11) i Μ/ / = 1 МИш=тахМ/ Σ — |fl//|. (8.12) / ί'ΐ Μ/ Мы пока ничего не говорили о выборе нормы матрицы в случае исходной евклидовой нормы вектора (8.4). Подчинена (8.4) так называемая спектральная норма матрицы, равная квадратному корню из спектрального радиуса матрицы А ТА (квадратному корню из максимального модуля собственного числа матрицы АТА). В частном случае симметричной матрицы А эта норма совпадает со спектральным радиусом А. Спектральная норма не совсем удобна с вычислительной точки зрения, поэтому чаще используется норма \\А\\ё=у/Т^, которая согласована с нормой (8.4), но не подчинена ей. 8.3. Достаточные условия. Перейдем к формулировке некоторых достаточных условий, обеспечивающих справедливость неравенства (8.1) при выборе различных норм в R". Мы будем предполагать, что изучаемый оператор F(x) ={/i(x), ... ,fn(x)) непрерывно дифференцируем. Лемма 8.1. Для любых х, у Ε R" имеет место неравенство \\F(x+y)~F(x)\\ < ||F'(z)||||v||, (8.13) где z=x + 6y (O<0<1). 75
Действительно, пользуясь теоремой о среднем, получаем ) \\F(x+y)-F(x)\\ = WfF'(x + Ty)ydT\\< о < f\\F,(x + Ty)\\\\y\\dr = II F'(x + 0jO ΙΝΙ^ΙΙ- ο Следовательно, если || F'(z)\\ < 1 - е (е > 0) для любого ζ G Rw, то оператор F является сжимающим (по метрике р(х, у)= \\х-у\\). Так, например, F будет сжимающим по норме || χ \\т, если для любого xGR" η max Σ / / = ι и по норме и max Σ bXj \\x\\u bftix) Ъх< < 1-е, если для любого χ € R" < 1-е.. (8.14) (8.15) Остановимся также на том случае, когда исходная постановка задачи относится к установлению существования решения уравнения G(x) = 0, где G(x) = igi(x), ..., gn(x))· Будем предполагать, что частные производные bgi/bxj знакопостоянны и ограничены. Без ограничения общности можно считать, что bgf/dxi <0 (в противном случае перед компонентами оператора G можно подходящим образом изменить знаки - это меняет оператор, но задача остается прежней). Перейдем к эквивалентному уравнению χ + aG (χ) = χ- (α > 0). Величину а выберем настолько малой, чтобы V/, х: a\dgi/dxi\ < 1. Выписывая теперь неравенства (8.14), (8.15) для оператора χ + aG(x), приходим к условиям (δ > 0) max i ι- bxi bXj + Σ i*i + Σ 3ft(*) bXj bgjjx) bXj <-δ, <-δ, (8.16) (8.17) кавдое из которых гарантирует существование и единственность решения уравнения G(x) = 0 (в предположении знакопостоянства и ограниченности частных производных bgfjbxj ). Заметим, что в этом случае также существует и единственное решение уравнения G(x) -у при любому £ R" (G — гомоморфизм в R"). 8.4. Эквивалентные метрики и сжатия. Ниже рассматриваются операторы, отображающие в себя полное метрическое пространство {X, р). Метрика ρ порождает в X топологию г (семейство окрестностей). Вообще говоря, множество X можно метризовать с помощью различных метрик. Метрики Ρι и Р2 называются эквивалентными, если любая последовательность, фундаментальная по любой одной из них, фундаментальна и по другой. Метрики рх и р2 называются топологически эквивалентными, если порождаемые *) Предполагается, что норма матрицы согласована с нормой вектора. 76
ими топологии совпадают. Топологическая эквивалентность ρ χ и р2 равносильна, например, следующему требованию: для любых хЕ1ие>0 можно указать такое 8 > 0, что р1(х,у)<Ь=> р2(х,У)<е, Р2(х,У)<Ь *> рг(х,у)<е. Если в (8.18) δ не зависит от х€Х, то метрики рх и р2 будут эквивалентны. Из эквивалентности метрик следует их топологическая эквивалентность. Обратное неверно*), однако справедливо следующее легко проверяемое утверждение: если метрики ρ χ и р2 топологически эквивалентны, а пространства (X, р^ и (X, р2) оба полны, то р\ и р2 эквивалентны. Заметим также, что если метрики pi и р2 эквивалентны и пространство (X, рО полно, то (X, р2) также полно. Оператор F: X -* X назовем р-сжимающим (р-сжатием) с коэффициентом λ, если для любых х, у £ X выполняется неравенство (8.1). Оператор F назовем сжатием, если для любого λ Ε (0, 1) существует такая метрика ρλ, эквивалентная исходной, что F является ρχ-сжатием с коэффициентом λ. Условие (8.1) обеспечивает не только существование единственной неподвижной точки х* у оператораF, но и наличие следующих свойств: А1. Оператор F непрерывен. A2.F* (*)->** при к-+<*> для любого xGI A3. U-равномерная сходимость: существует окрестность U точки χ * такая, что**' Fk(U) = U{Fk(x): χ G £/}-*{**}. (8.19) А4. Устойчивость неподвижной точки: по любой окрестности W точки х* можно указать такую окрестность V точки χ*, что из xGV следует Fk(x)GW при любом к>0. Традиционно в формулировке принципа сжимающих отображений присутствует лишь утверждение А2. Однако свойства А1, A3, А4 существенно дополняют характеристику итерационного процесса xk+i =F(xk\ * = 0,1,2,..., (8.20) и непосредственно не вытекают из А2. В то же время их доказательство в предположениях теоремы 8.1 совершенно элементарно. Пожалуй, следует даже особо подчеркнуть, что в практических задачах, требующих решения вопроса о справедливости А2, как правило, необходимо также установление свойств A3, А4 или хотя бы одного из них. Причины здесь те же, что и в теории устойчивости движения, где недостаточно установить существование равновесия и сходимость к нему любой траектории, а необходимо также удостовериться по крайней мере в устойчивости системы. *) Пусть X = (— «\ «О. Очевидно, метрики рх (х, у) = 1 χ - у |, р2 (х, у) = | arctg χ - - arctg у I топологически эквивалентны, но не эквивалентны, так как существует последовательностьх^ = к, которая фундаментальна по р2, а по βχ - нет. **) Запись (8Л9) означает, что для любой окрестности V точки х* можно указать такое Ν> 0, что для всех к > N справедливо F (£/") с V. 77
8.5. Теоремы Майерса и Яноша. Ф. Майерсу [31] принадлежит следующий важный результат. Теорема 8.2. Пусть оператор F, отображающий в себя полное метрическое пространство (Χ, ρ), имеет единственную неподвижную точку x*GX и выполняются условия А1 — A3! Тогда F - сжатие. D Остановимся на тех обстоятельствах, которые выдвигают теорему 8.2 в данном контексте на одно из центральных мест. Во-первых, обращение принципа сжимающих отображений, так же как и обращение теорем Ляпунова (в теории устойчивости), дает исчерпывающую информацию о границах применимости метода. Теорема 8.2 гарантирует, что попытки найти подходящую метрику, по крайней мере принципиально, не обречены на провал (если процесс (8.20) действительно равномерно сходится). Во-вторых, но это не менее важно, информация о существовании нужной метрики (или функции Ляпунова в теории устойчивости) может быть использована при доказательстве других теорем. Так, например, доказательство известной теоремы о том, что асимптотически устойчивая система дифференциальных уравнений остается асимптотически устойчивой при достаточно малом изменении правых частей, опирается на существование у системы функции Ляпунова. Аналогичный вопрос может быть поставлен и при изучении итерационного процесса (8.20). Действительно, реальное отображение G от исследуемого F может, хотя и незначительно, отличаться. В этой ситуации, вообще говоря, не ясно, влечет ли за собой сходимость и устойчивость процесса xk + l -G{xk) наличие соответствующих свойств у процесса (8.20). Нетрудно предложить различные варианты положительного решения этого вопроса, основанные на двух предположениях: оператор G - р-сщмающий, операторы F и G в определенном смысле близки. Роль теоремы о существовании метрики, по которой исследуемый оператор является р-сжимающим, здесь достаточно очевидна. Значение теоремы 8.2 не исчерпывается приведенными соображениями, но обсуждение других аспектов *) не входит в наши намерения. Доказательство теоремы 8.2 технически довольно сложно. Мы приведем здесь полное доказательство менее общей теоремы Яноша [70], где та же идея реализуется в более простом и доступном для восприятия виде. Теорема 8.3. Пусть (X, р) —компакт, оператор F непрерывен и П Fk(X)={x·}. (8.21) fc=0 Тогда F - сжатие. Доказательство проведем в три этапа. I. Построим метрику р*, эквивалентную р, по которой оператор F — не- растягивающий,т.е.р*^(х),^0))<р*(^,7) для любых х, у G X. Положим P*(xfy) = m2ix{p(Fk(x)iFk(y)): * = 0,1,..J. Аксиомы метрики проверяются без труда. Очевидно также, что p4F(x),F(y)) = max{p(F^)5^(y)): * = 1,2,...> < <max{p{Fk(x),Fk(y)): * =0,1,.. . ) = р*(х,у). *)См. [44]. 78
Покажем, наконец, эквивалентность метрик ρ и р*. Из определения следует р*{х> У) ^ Р(х» У)- Поэтому любая последовательность, фундаментальная по метрике р*, фундаментальна и по р. Обратно, пусть л: —>х, т.е. ρ (χ , χ) -> -> 0. Покажем, что в этом случае хк—> х. Предположим противное, т.е. k р* π к хК —>х. Тогда из последовательности χ можно вьщелить такую подпоследовательность, которую снова обозначим χk, что p*(xk, x) > е > 0. Определим последовательность тк условием p*(xktx) = p(Fmk(xk), FmHx)). Если последовательность тк ограничена, то в ней имеется бесконечно повторяющийся номер т, и тогда на подходящим образом выбранной подпоследовательности имеем p(Fm(xk), Fm(x)) > е > 0, что в силу непре- рывности F (в исходной топологии) противоречит условию χ -+Х. Если же последовательность тк неограничена, то p(F k(xk),F к(χ)) > евступает в противоречие с условием (8.21). Итак, метрики ρ и р* эквивалентны. II. По любому наперед заданному λ Ε (0, 1) построим функционал d\(x,y) такой, что dK(F(x),F(y))<\dx(xty). (8.22) Положим Н0 = X, #! = F (X), .. ., Нк = F к (X),. .. и введем в рассмотрение функции р(х) = т&х{к: xGHk}9 v(x*) = °°9 ^j) = min{^(4 v(y))- Для функционала dK(x,y) = \v^V(xfy) в силу очевидного неравенства v{F(x), F(y)) > ν (χ, у) + 1 справедливо неравенство (8.22). Заметим также, что dK(x, у) удовлетворяет всем аксиомам метрики, за исключением, быть может, неравенства треугольника. III. Сделаем последний шаг. Обозначим через Ω^ множество цепей ωχγ - {* - х°у х1 > ···, хк ~У) (& произвольно) и положим длину цепи равной Ολ(ωχγ) = Σ rf^*'-1,*')· Покажем теперь, что Р\(х> У) = 'Mf{D\(">xyY иху е 0,ху } является искомой метрикой. Убедимся, во-первых, что р,\ — метрика. Очевидно, Р\(х,у) симметрична, и Р\(х,х) = 0 для любого xG X. Наконец, неравенство треугольника вытекает из включения Ω,χζ U Q,zy С 0,ху. Осталось показать положительную определенность ρλ. Пусть χ Φ у и без ограничения общности ν (у) > 79
> ν (χ). Если у = χ*, то Px(xtx*)>y{x)P*(x,Hv(x)+i)>0. В случае у Φ χ* любая цепь ω^ или полностью лежит в множестве Х\ Ην (д;) + χ , или не лежит, откуда Р\(х,У)>\viy)min{p*(x,у),р*(у, ННу)+х)} > 0. Итак, ρχ — метрика. Докажем теперь эквивалентность ρ и Ρχ, для чего достаточно показать эквивалентность р* и ρχ. Из определения вытекает P\(x,y)<dx(x,y)<p*(xfy). Поэтому из дг —*х следует хК >х. Обратно, пусть хК —>х. Предполо- Ρ жим, что хк-/-+х. Тогда в силу компактности (X, р*) можно выбрать такую последовательность, которую опять обозначим xkf что хк > у, у Φ χ. Но тогда хк —>у. Полученное противоречие доказывает эквивалентность метрик р* и ρχ. Наконец, свойство Px(F(x),F(y))<\px(xty) получается с помощью предельного перехода в неравенстве D\(F(cjxy)) < <λΖ)λ(ω^),Γ№ί·(ω^) = {F(x°),...,F(x*)}. D Доказательство теоремы 8.2 представляет собой естественное обобщение приведенной схемы. Переход от метрики ρ к р* проделывается совершенно аналогично. Далее (что является новым элементом в схеме) показывается, что из условий теоремы вытекает существование окретности W точки **, которая, так же как и С/, обладает свойством F (W) -* х*у но, кроме того, F(W) с W. Почти очевидно, что в качестве W можно взять N-1 W= П F~J\U), /яо к где N удовлетворяет условию F (U) с Uдля всех к > N. После этого с помощью окрестности W строится бесконечная в обе стороны последовательность ...,#_,, Я0, #!,..., где Hk=c\Fk(W\ H_k=F~kWQ), k>0. Далее точно так же вводятся функции ν (χ) и ν (χ, y).t с той лишь разницей, что теперь они принимают не только положительные значения, но и отрицательные, после чего схема доказательства в точности совпадает с прежней. Естественно, из-за отсутствия компактности установление эквивалентности метрик проводится более сложно. 8.6. Линейные сжатия. Ограничимся далее рассмотрением линейных операторов в R", т.е. матриц*) А. Если спектральный радиус (наибольший модуль собственного значения) ρ (А) < 1, то в R" обязательно найдется *) С тем же успехом под А далее можно подразумевать линейный оператор, действующий в банаховом пространстве. 80
норма II · II „, в которой \\А ||. =max{M* IU: II jc IU = 1} < 1. (8.23) Известно, что условие р(А) < 1 обеспечиваегсходимость А кх^>О, а также равномерную сходимость и устойчивость нулевой точки. Однако существование нормы (8.23) все же не вытекает из теоремы 8.2, так как последняя гарантирует существование лишь подходящей метрики (а не нормы). Тем не менее соответствующая норма может быть легко указана. Например, в качестве 1Ы1 * можно взять IUIL=max{X-*M*x||: * = 0,1,...>, где р(А) < λ < 1, а || · ]| - произвольная норма в R". Покажем, что норму || · || * всегда можно определить также с помощью подходящего скалярного произведения, т.е. II* ||2, = (Vx,xl где V - некоторая положительно определенная матрица. Для этого достаточно показать, что из ρ (А) < 1 следует существование положительно определенной матрицы V такой, что при χ Φ О (VAx,Ax)<(Vx,x). (8.24) Заметим, что (VAx, Ах) = (А т VA х, х), и введем обозначение (ATVAx, x) -(Vx, x) = (Hfr, x), или, равносильно, ATVA-V=W. (8.25) Левая часть (8.25) представляет собой линейный оператор ^действующий на матрицу V, т.е. AV = ATVA-V. Покажем, что оператор А невырожден. Предположим противное. Тогда ATV0A - V0 - О jipn некотором V0 Φ 0. Выберем х° так, чтобы (V0x°, х°) = а0Ф0,и рассмотрим итерационный процесс xk + l =Axk, * = 0,1,..., (8.26) начинающийся в х°. В силу ATV0A - V0 - 0 мы получим (V0xk, хк) - = а0 Φ 0 при любом к > 0, но это противоречит сходимости (8.26), вытекающей из предположения ρ (А) < 1. Итак, оператор А невырожден. Поэтому уравнение (8.25) при любом W имеет решение. Остается показать, что при отрицательно определенной матрице W решение V уравнения (8.25) — положительно определенная матрица (эта матрица будет удовлетворять неравенству (8.26) при любом χ Φ 0). Предположим противное. Тогда найдется х° Φ 0 такой, что (Vx°, x°) <0. Для последовательности (8.26) в этом случае будем иметь (Vxk,xk)<(Wx°,x°)<0 при любом к > 0, но это противоречит сходимости (8.26). 6. В.И. Опойцев 81
Упражнения. 8.1. Пусть (Χ, ρ). - компакт, оператор F: Х-+Х непрерывен и {**} - единственное непустое инвариантное множество Μ оператора F [F{M)-M]. Тогда F - сжатие. 8.2. Если некоторая итерация Fm непрерывного оператора F есть сжатие, то F - сжатие, 8.3. Пусть F отображает в себя некоторое абстрактное множество Хи любая итерация Fm (w = 1, 2,...) имеет в X единственную неподвижную точку. Тогда по любому λ е (0, 1) можно указать такую метрику ρ в X, что F будет р-сжатием с коэффициентом λ , а (X, р) - полным метрическим пространством. В п. 8.4 мы по существу показали, что pM) = inf|| V'lAV\\, (8.27) V где || 41 - евклидова норма, т.е. спектральный радиус ρ (А) сколь угодно точно приближается евклидовой нормой матрицы в подходящем базисе. В случае произвольной нормы формула (8,27) неверна. Здесь естественно возникает вопрос о том, насколько малой можно сделать заданную норму матрицы переходом к другому базису. 8.4. Имеет место оценка inf|| У1АУ\\т = М\\ ν-ιΑν\\ι<>/Ύρ(Α), (8.28) V V неулучшаемая в том смысле, что найдется матрица А, для которой в (8.28) достигается равенство. 8.5. Если матрица А имеет лишь действительные и мнимые собственные значения, то infll V'lAV\\m = inS\\ V'lAV\\i = p{A). V V 8.6. Пусть непрерывный оператор F: R" -> R" удовлетворяет условию \\FM-Fiy)\\>a)\x-y\\, α>0. Тогда F - гомеоморфизм Rn на R". Комментарии § § 2-4. Как уже отмечалось, вращение векторного поля эквивалентно понятию степени отображения. Теория степени отображения в основном построена Л.Брауэром и завершена Г.Хопфом. Развитие этой теории, как и всей современной топологии, во многом определили фундаментальные топологические исследования А.Пуанкаре. Начало использованию топологических методов для изучения нелинейных уравнений в функциональных пространствах положил Ю.Шаудер. Значительный вклад в развитие и внедрение топологических методов в нелинейный анализ принадлежит М.А.Красносельскому. Современное состояние теории вращения векторных полей и ее приложений отражено в монографии [25], где собран богатейший фактический материал. Следует однако иметь в виду, что эта книга ориентирована в основном на изучение уравнений в бесконечномерных пространствах. К сожалению, практически нет книги, в которой бы обстоятельно (но в то же время просто и доходчиво) излагалась конечномерная теория вращения с приложениями к нелинейному анализу. Непосредственно с понятием вращения (степени отображения) можно ознакомиться по любому курсу алгебраической топологии. Для первого знакомства здесь можно рекомендовать небольшую книгу [55]. Пожалуй наиболее просто степень отображения вводится в дифференциальной топологии (см. [36, 40, 55]). Аксиоматическое построение теорий вращения предлагал Е.Цайдлер [66]. Данные параграфы (а также §§ 1, 5, 6) написаны на основе небольшой книги [45], где (как и здесь) при написании ставилась задача дать интуитивно ясное представление о теории вращения и сделать изложение приемлемым для первого знакомства с топологическими методами. Что касается результатов и способа изложения, то автор не претендует на оригинальность. Известны различные неформальные спо- 82
собы определения вращения векторного поля (степени отображения), в том числе и "метод протыкающего луча". Здесь лишь показано, что этот не вполне строгий "метод" годится не только для определения вращения, но и для доказательства всех основных теорем. Теория вращения в целом ориентирована на изучение разрешимости уравнений вида /, (*ι,.», *п) = 0, ....ЛиОс, Х„) - 0. в случае η - т. Однако случай η > т также широко распространен, например, при изучении уравнений с параметром F (χ, λ ) =0, где размерность λ определяет "избыток" переменных. Нельзя сказать, что эта область представляет собой нетронутую целину, но общей теории здесь нет. Частично проблему освещают некоторые топологические теоремы об отображениях сфер и пространств различных размерностей (см., например, [40, 56J). В монографии [25] дано определение вращения векторного поля в случае η > т и намечены контуры теории (п, т)-вращений. Интересно, что первые же результаты здесь оказываются интуитивно неочевидными. Например, рассмотрение случаев т — 1 и т = 2 показывает, что любой изолированный нуль может исчезать при малых возмущениях отображения. Возникает впечатление, что это является правилом независимо от т. Однако при т > 3 ситуация в корне меняется. § 5. Теорема 5.1 давно известна и неоднократно переоткрывалась. В целом содержание параграфа основано на статьях [26, 47]. Легко проверить, что гладкий гомеоморфизм F в R" имеет знакопостоянный якобиан det[dffldxj ]. В этом случае теорема 5.1 по отношению к утверждению достаточности мало теряет в силе, если требование локальной гомеоморфности F заменить условием detlbfilbxj]>0 (или<0). Предпринимались многочисленные попытки ослабить это условие, допуская вырождение якобиана на некоторых подмножествах R". Следующий пример вроде бы показывает, что нельзя допускать вырождения якобиана даже в одной точке. Пусть f1(x) = x] -x\, f2(x) = 2xlx2, что соответствует преобразованию комплексной плоскости za. Здесь detF'(x) = 0 лишь в начале координат, но отображение не является взаимнооднозначным. На фоне этого примера совершенно удивительным представляется тот факт, что в пространствах большей размерности (п > 3) якобиан может вырождаться даже на подмножествах нулевой размерности, не меняя справедливости вывода о локальной гомеоморфности F (см. [67,68]). Не умаляя оригинальности этого результата, отметим, что его природа все же достаточно очевидна с точки зрения доказательств теорем о гомеоморфизмах, основанных на стягивании контуров (см. доказательство теоремы 5.4). Выкалывание точек в R" не мешает стягиванию контуров при η > 3, чего нельзя сказать о плоскости. § 6. Излагаемые топологические методы берут начало от работ С.Какутани, С.Эйленберга, Д,Монтгомери и др. Эти методы получили в последнее время существенное развитие в работах группы математиков, возглавляемой Ю.Г.Борисовичем. Результаты и обширная библиография имеется в обзоре [7]. Предлагаемая в разделе 6.3 аппроксимационная конструкция для определения вращения многозначного поля выгодно отличается простотой в сравнении с обычными способами определения вращения, опирающимися на симплициальные разбиения и Другие понятия алгебраической топологии. Что касается отображений с невыпуклыми образами, то, несмотря на обилие результатов (см. упомянутый выше обзор), имеется мало практически удобных теорем. В целом в исследованиях по неподвижным точкам многозначных отображений с невыпуклыми образами к настоящему времени наметилось два подхода. Один из них, аппроксимативный, опирается обычно на предположение асферичности образов во - всех размерностях. Второй подход естественно назвать гомологическим. Как правило, в работах этого направления используется предположение об ацикличности образов. 83
И асферичность, и ацикличность близки к требованию стягиваемости образов, что с прикладной точки зрения представляется более или менее приемлемым условием, но получаемые здесь теоремы в значительной степени обесцениваются наложением дополнительных трудно проверяемых ограничений (стягиваемость проекций образов на сферу и др.)· Теорема 6,13 в этом отношении дает пример выгодного исключения. Заметим, наконец, что теоремы о неподвижных точках 6.4 - 6.10 остаются в силе, если предположение замкнутости отображения заменить требованием полунепрерывности снизу. Соответствующий вывод легко может быть сделан на основе следующего важного результата Майкла, Теорема 6,15. Многозначное отображение Τ (с выпуклыми образами), полунепрерывное снизу, имеет непрерывный селектор t(x), т.е. существует однозначная непрерывная функция t: X->Y такая, что t(x) е Т(х) для любого х&Х, q Понятно, что в указанных теоремах соответствующие селекторы будут удовлетворять условиям теорем о неподвижных точках однозначных отображений. Любая же неподвижная точка селектора t(x) автоматически является неподвижной точкой Т(х). § 7, Содержание параграфа может вызвать иллюзию, что переход к бесконечномерным пространствам легок и прост. В части простейших теорем о неподвижных точках это действительно так. Но в теории вращения вполне непрерывных векторных полей имеется масса тонких и глубоких результатов, нетривиальных схем, неожиданных связей и приложений [25]. § 8. Обзор результатов Л.Яноша [70] и Ф.Майерса [31-33], а также более общие результаты, можно найти в [44]. По поводу раздела 7.7 и примыкающих к нему упражнений см. [48]. Для принципа сжимающих отображений известны многочисленные обобщения и родственные результаты. Укажем два из них. 1. Если требование (8.1) заменить менее ограничительным p(F(x)iF(y)) < PU, у), хФу, то, как показывают простые примеры, неподвижная точка может не существовать (если (Х$ р) - не компакт). Однако, если в этом случае хотя бы одна орбита F (дг) 1. _ 0 имеет в (X, р). предельную точку £, то £ - единственная неподвижная точка отображения F (так называемый итерационный тест Эдельштейна). Итеративный тест в Кп с любой орбитой дает окончательный ответ о существовании неподвижной точки (Надлер). 2. Если sup p(F(x),F(rt) 0<a<p(x,y)<fi\<l, р(х,у) то существует единственная неподвижная точка оператора F (принцип обобщенного сжатия М, А,Красносельского). Массу других результатов, подробностей и библиографию содержит обширный обзор [17] (см. также [51]).
ГЛАВА ΠΙ РАВНОВЕСИЕ И НЕПОДВИЖНЫЕ ТОЧКИ Материал предыдущей главы при изучении существования равновесия предоставляет значительную свободу выбора подходящих теорем, на которые можно опираться, и, что более важно, дает общую идеологию. Однако для достижения максимальных удобств необходимы дополнительные усилия. Желательно располагать результатами, непосредственно ориентированными на системные приложения. Это соображение — один из основных мотивов последующего изложения. § 1. Оператор межэлементных связей Довольно часто систему удобно мыслить как совокупность η элементов A i, каждый из которых распоряжается выбором скалярной переменной Xf и стремится к достижению цели, положение которой ft (χ) зависит от действий других элементов, т.е. от состояния системы, характеризуемого вектором х. Другими словами, цель Αχ состоит в обеспечении равенства xi = fi (х) (или включения xt Ξ f{(x), если положение цели ft (x) неоднозначно). Состояние системы х* в этом случае может быть равновесным, если в х* достигаются цели всех элементов одновременно, т.е. х* =F(x*) (или x*GF(x*)), где F(x)={ Λ (*),...,/„(*)}. Оператор F будем называть оператором межэлементных связей. Описанная схема часто возникает естественным образом, например, в системах с игровым взаимодействием (см. раздел 1.6 гл. I). Но она оказывается полезной и в тех случаях, когда элементы и положения целей вводятся фиктивно и служат лишь удобным языком. Остановимся на этом более подробно. Допустим, равновесие системы определяется решением уравнения G(*) = 0, (1.1) где G(g) = {gl(xl...,grt(x)}. Если функции gi(x) заменить функциями hf(x) такими, что hf(x) = О в том и только в том случае, когда gf (χ) — О, то уравнение Η (χ) = 0 будет 85
эквивалентно (1.1) *). Может оказаться, что уравнение Н(х) — О более удобно для исследования, чем (1.1). Возникает естественная задача целенаправленного выбора наиболее удобного оператора Я, эквивалентного G в указанном смысле. Универсального рецепта здесь нет (хотя бы потому, что понятие удобства не поддается формализации), но есть разумные соображения. Единственное, что является общим у эквивалентных операторов, это множества тех х, на которых функции gi(x) обращаются в нуль. Эти множества можно описать функциями /f (χ), определив последние равенствами gi(xi,~.,Xi-i,fi(x),Xi+i,-,xn) = 0' 0-2) Функции fi(x) естественно интерпретировать как компоненты оператора межэлементных связей F (χ), неподвижные точки которого будут решениями уравнения (1.1). Переход от (1.1) к эквивалентному уравнению H(x)=F(x)-x=0 (1.3) в большинстве случаев действительно оказывается удобным и существенно облегчает процесс исследования. Подчеркнем, что переход от (1.1) к (1.3) вовсе не обязан иметь аналитический характер в смысле получения конечного описания оператора F. На практике чаще всего неявное задание оператора F в виде (1.2) служит лишь источником выяснения свойств оператора F, но не его вычисления. Обратим внимание, наконец, что задание оператора F с помощью (1.2) приводит к независимости каждой функции /{(х) от "собственной" переменной X/. В общем случае оператор межэлементных связей этим свойством обладать не обязан. Для иллюстрации рассмотрим вариант рыночной модели, близкий к тому, который уже обсуждался в гл. I. На рынке имеется /2+1 товаров, л:,· (/ = 0, 1, ..., ή) — цена на z-й товар, £i(x0, x) — избыточный спрос на него, х0 обозначает цену так называемого базисного товара, х — {х\, ··., xt1}· Таким образом, функции g'f определены на неотрицательном ортанте (п + 1)-мерного пространства. Мы будем предполагать, что все функции F? непрерывны и ограничены. Кроме того, предположим, что каждая функция g/ строго убывает по "своей" переменной, т.е. при увеличении цены Х{ спрос на /-й товар падает. Функции избыточного спроса считаются положительно однородными нулевой степени, т.е. £ί(λχ0, λχ) = £/(*<>>*) при любом λ>0. (1.4) Система цен {х& х*} называется равновесной, если для всех i — О, 1, ..., η или £i(xS,x*) ~ 0, или х^ = 0, gj(xS, χ*) < 0. Ясно, что любая точка {λχ£ , λχ*} (λ>0) будет при этом (в силу (1.4)) также равновесной, поэтому при изучении равновесия можно фиксировать цену одного из товаров. Для этой цели у нас "подготовлен" базисный товар, и мы будем пола- *) Для непрерывных функций достаточно, например, потребовать, чтобы sign£/(x) = signA,-(x). 86
гатьхо = 1,обозначая £,(1,х) через gj(χ), т.е. В экономических исследованиях обычно предполагается, что функции избыточного спроса удовлетворяют закону Вальраса Σ xigi(x) = 0, (1.5) ι = О который представляет собой формализацию бюджетных ограничений. В силу (1.5) базисный товар при изучении равновесия можно вообще исключить, держа в поле зрения лишь η функций избыточного спроса gi(x) 0 = 1> ·"··» и). Если х* будет равновесием на таком "усеченном" рынке, то в силу (1.5) автоматически ^о (1 >х*) ~ 0. Сделаем, наконец, последнее предположение. Будем считать, что на рынке нет свободных товаров (которые бы надо было "продавать" бесплатно) , т.е. для всех / = 0,1,..., η &(χ0,Χι,...,Χί-ι,0,χί+1,...,χη)>0. (1.6) Из (1.6) следует, что равновесной может быть лишь внутренняя точка неотрицательного ортанта. Из оговоренных условий вытекает, что существует набор непрерывных строго положительных функций fi(Xo>xl> ···» xi-l, xi+l > ···> xn)=fj(xQyx)> которые мы будем называть текущими положениями целей, таких, что gi(Xo,X\, ..., xi-i, fi(xo, χ), Xi+\, ■·., Xn) — 0- Заметим сразу, что из (1.4) и однозначности определения ft вытекает ^(\Ха,\х)-Щ{хо, х) при любом λ>0, т.е. ff являются положительно однородными функциями первой степени. Очевидно, неподвижная точка оператора F(x) с компонентами Л(дО=Л(1,х), ί = ι л. является равновесной. Рассмотрим рынок с валовой заменимостью товаров, который характеризуется тем, что каждая функция избыточного спроса gi(x0',x) не убывает по "чужим" переменным (по переменным Xj (/ Φί)). Дополнительно предположим, что каждая функция #,· (ζ Φ 0) по х0 не только не убывает, но строго возрастает. В этих условиях оператор F(x), очевидно, является монотонным. Дело в том, что из (1.2) следует 0*1 Mi 8fr - Q dXi bxj bXj 87
откуда У/ = _^§ι I^§l> 0 bxj bxjj bX( Изучение модели можно было бы продолжить, но и проделанного достаточно, чтобы понять, как по свойствам функций gf можно судить о свойствах функций //. § 2. Пространства с конусом Множество допустимых состояний системы обычно представляет собой неотрицательный ортант R" в подходящей (часто естественной) системе координат. Например, если состояние системы описывается вектором *-{*ι» ···> хп) Ξ R"> то в экономических приложениях xt обозначает, как правило, цену, количество получаемого или обмениваемого ресурса, объем выпуска, интенсивность технологического процесса, количество рабочей силы и т.д. В системах иной природы х{ может обозначать численность популяции, концентрацию вещества, поток клиентов и т.п. Во всех перечисленных случаях Xf > О, т.е. χ G R^, Неотрицательный ортант представляет собой разновидность общего понятия конуса, которое играет важную роль в нелинейном анализе. 2.1. Конусы и полуупорядоченность. Везде далее Ε обозначает вещественное банахово (полное нормированное) пространство, Θ — нуль пространства Е. Читатель, не желающий выходить за рамки конечномерной теории, может под Ε подразумевать Rw, игнорируя рассмотрение функциональных пространств и считая вполне непрерывные операторы просто непрерывными. Замкнутое выпуклое множество К С Ε называется конусом, если χ € К, χ Φ Θ влечет за собой осх G К при а. > 0 и —х $ К. Простейшими примерами конусов могут служить неотрицательные (или любые другие) ортанты в конечномерных пространствах R", совокупности неотрицательных функций в пространствах С и Lp (ρ > 1) *). Неограниченное число примеров дает следующий метод построения конусов. Пусть F С Ε — ограниченное замкнутое выпуклое множество и θ φ F. Тогда совокупность K(F) элементов χ G Ε, допускающих представление х = αζ (α > О, ζ 6F), является конусом (покажите!). На первый взгляд этот метод представляется достаточно общим, но, как будет видно из дальнейшего, большинство изучаемых конусов (в бесконечномерных пространствах) невозможно построить (определить) таким способом. Любой конус К С Ε позволяет ввести в пространстве Ε полуупорядоченность : χ> у (равносильно у <х), если х— у G К. Например, полуупорядо- *) Как обычно, через С обозначается пространство функций, непрерывных на ограниченном замкнутом множестве конечномерного пространства R , через Lp - пространство функций, суммируемых с р-й степенью на ограниченном подмножестве Ки. Напомним, что в Lp функции, отличающиеся друг от друга на множестве меры нуль, объединяются в один элемент. 88
ценность, вводимая в R" неотрицательным ортантом R", имеет простой смысл: х>у означает х,- > yt (i = 1,..., η). Элементы χ> Θ (т.е. xG К) называются положительными. Множество (и, ν ) —{x\ и <х < υ } называется конусным отрезком. Понятие полуупорядоченности является одним из эффективных инструментов при изучении линейных и нелинейных отображений в банаховых пространствах. Его использование естественно должно опираться на знание свойств отношения >. Эти свойства частично совпадают со свойствами обычного отношения >: 1) х>у, у> х влечет за собой χ — у\ 2) из х>у следует <хх> осу при ос> О и оосК осу при а< 0; 3) х^у, y^z влечет за собой x>z\ 4) из хх 2>У\, Хг>^2 следует хг + х2>У\ +у2.; 5) из хк -+х, ук -+у, Хь^Ук (^ — 1» 2,...) вытекает х^>у. Этим, пожалуй, общность исчерпывается. Набор свойств знака >, конечно, существенно богаче. Например, Хк+\ ^ *к> *к *^?о (к - 1,2,...) влечет за собой существование предела у последовательности хк. Замена знака > на > в общем случае здесь недопустима, и подобных примеров можно привести достаточно много. В то же время понятно, что в каждом конкретном случае специфика используемого конуса может обеспечивать наличие дополнительных полезных свойств у отношения >. Это очевидное соображение служит одним из источников интереса к изучению разновидностей конусов. 2.2. Разновидности конусов. Конус К называется нормальным, если существует такое число N(K), что из θ < χ <у следует И* || < N(K) \\у \\ . В этом случае говорят также, что норма полумонотонна. Минимальное число М(К) называется константой нормальности конуса К. Если N(K) = 1, то конус К называют острым и говорят, что норма монотонна. Нормальность конуса равносильна отсутствию в К элементов, которые "почти противоположно направлены". Более точно: конус К нормален в том и только в том случае, когда существует такое δ > 0, что IIе! + е2 II > δ для любых еи е2 £ К, \\ех || = lk2%ll = *· Естественно, все конусы в Rn нормальны. Конусы К+ неотрицательных функций в C,LP также нормальны. Конус неотрицательных функций в пространстве С ι непрерывно дифференцируемых функций свойством нормальности не обладает. Конус, содержащий внутренние точки, называется телесным. Конус называется воспроизводящим, если каждый элемент χ G Jl: представим в виде x=u-v, u,vGK. (2.1) Оказывается, элементы и, υ в (2.1) всегда можно выбрать так, что II м ||, || и || < а || χ \\, где константа а определяется конусом К и не зависит от х. Это свойство называют несплющенностью воспроизводящего конуса. Всякий телесный конус является воспроизводящим. Конус К+ в С телесен. Конус К + в Lp — воспроизводящий, но не телесный. 89
Множество MCE называется ограниченным по конусу К, если х< z0 для всех χ Ε Μ и некоторого фиксированного ζ0 € Ε. Элемент ζ0 называется верхней границей множества М. Нижняя граница множества определяется аналогично. Если в множестве Ρ верхних границ множества Μ есть наименьший элемент ? (т.е. 7<ζ, ζ £ Ρ), то онназывается точной верхней границей множества Μ и обозначается через sup M Аналогично определяется точная нижняя граница inf М. Конус К называется миниэдралъным, если любые два элемента х,у е Ε имеют точную верхнюю границу sup(x, y)\ сильно миниэдралъным, если верхняя граница есть у любого ограниченного множества. Конус К + в С миниэдрален, К + в Ьр сильно миниэдрален. Сильно ми- ниэдральны неотрицательные ортанты в пространствах R". Конус К называется правильным, если любая неубывающая ограниченная по конусу последовательность хк (л^ < хг < ... < хк < ... < ζ 0) сходится по норме. Конус К называется вполне правильным, если сходится (по норме) каждая неубывающая ограниченная по норме последовательность. Каждый правильный конус нормален. Вполне правильные конусы правильны. Телесный правильный конус вполне правилен. Вполне правильны также правильные конусы в слабо полных пространствах Е. Конус К + в Lp вполне правилен. Говорят, что конус К допускает оштукатуривание {оштукатуриваем), если существует такой больший конус К\ (К С К ι), что каждая точка х0 G К входит в Ал вместе с шаровой окрестностью радиуса ос\\х0 ||, где α > 0 не зависит от х0. Конус К называется локально компактным, если компактно пересечение конуса К с любым шаром. Каждый локально компактный конус допускает оштукатуривание. Отсюда сразу следует, что все конусы в R" оштукатуриваемы. 2.3. Пространство Еи . Пусть фиксирован некоторый ненулевой элемент и0 £ К, Элемент χ £ Ε называется и0-измеримым, если существует такое 7 > 0, что . -уи0 < χ < уи0. Множество w0-измеримых элементов χ € Ε обозначается через Еи . Очевидно, ift,o - линейная структура" в которой можно ввести норму ||*||„0 =ηιίη{γ; -уи0 < χ < уи0) . (2.2) Норма (2.2) называется и0-нормой. Проверку аксиом нормы предоставляем читателю. Если ν0 Ε: Ε — ненулевой и0 -измеримый элемент, то легко видеть, что Еи и Ευ состоят из одних и тех же элементов, а и0-норма и υ0-норма эквивалентны. Пусть пространство С [0, 1] полуупорядочено конусом неотрицательных функций и фиксирован элемент и0 (ί) = 1. Тогда EUq совпадает с С, а и0-норма с исходной нормой пространства С Если же, например, и0 (t) = 90
— /(1 — /), то EUq представляет собой совокупность функций x(t) таких, что |х(01 < 7*0-0, (2.3) причем наименьшее в (2.3) γ является и0-нормой функции χ(ΐ). Если конус К нормален, то 1) пространство EUq полно по и0-норме; 2) сходимость любой последовательности по и0-норме влечет за собой ее сходимость по исходной норме пространства Е\ 3) множество KUq = К Π EUq представляет собой нормальный телесный конус в пространстве EUq. 2.4. Линейные положительные функционалы. Определенный на конусе К функционал / (х) называется положительным, если / (jc) > 0 при любом д-е К. Можно утверждать, что всегда существуют линейные положительные функционалы. Более того, для каждого ненулевого х0 е К можно указать такой положительный линейный непрерывный функционал /(х), что 1(х0) > 0. В случае сепарабелъного пространства Ε всегда существует такой линейный непрерывный функционал /(jc), что / (л) > 0 для всех *е К, χΦΘ. Линейное нормированное пространство Е* линейных непрерывных на Ε функционалов называется сопряженным пространством. Если линейная оболочка конуса К плотна в Ε (например, конус К - воспроизводящий), то совокупность положительных функционалов К* с Е* также является конусом, который называется сопряженным. Положительный линейный функционал / е Е* называют сильно положительным, если 1(χ)>β\\χ\\, хеК, где β > 0. Сильно положительные функционалы / е Е* существуют в том и только в том случае, когда конус К допускает оштукатуривание. Упражнения. 1.1. Покажите, что конусы K(F) оштукатуриваемы. 1.2. Проверьте, что в пространстве матриц множество неотрицательно определенных матриц является конусом. 1.3. Покажите, что в С[0, 1] множество вогнутых функций, обращающихся в нуль на концах отрезка [0,1 ], - конус. § 3. Положительные решения 3.1. Положительные операторы. Тот факт, что пространство. £ полуупорядочено некоторым конусом, может эффективно использоваться при изучении оператора А, действующего в Е, лишь в том случае, когда А обладает теми или иными свойствами, связанными с полуупорядоченностью. Оператор А: Е-+Е называется положительным, если он оставляет инвариантным конус К. Другими словами, оператор А: Ε -*£ положителен, если А (К) С К. Часто несущественно, что оператор А определен на всем пространстве Е, и тогда положительным называют любой оператор А, определенный на конусе К и преобразующий К в себя. Важный подкласс положительных операторов составляют так называемые uo-положителъные операторы, определяемые следующим образом. Пусть фиксирован некоторый ненулевой элемент и0 G К. Обозначим через К(и0) множество тех элементов xGK, для которых можно указать такие 91
α, β > О, что Оператор А> некоторая итерация которого Ак переводит ненулевые элементы конуса К в К(и0), и называется и0-положительным. Если конус К телесен и и0 £ intK, то w0-положительный оператор называют сильно положительным. Цель параграфа состоит в описании и изучении достаточных условий, обеспечивающих существование положительных (а также ненулевых положительных) решений уравнения * = 4(*), (3.1) где А — нелинейный положительный оператор (в частности, оператор межэлементных связей). Общие топологические методы, приспособленные к решению подобного рода задач, изложены в [25]. Эти методы основываются на понятии вращения положительного векторного поля х-А(х). Большинство приложений охватывается рассмотрением двух важных случаев, в одном из которых вращение равно 0, в другом — равно 1. В основном далее мы и ограничиваемся ими, что позволяет дать простое изложение теории, базирующееся лишь на широкоизвестном принципе неподвижной точки Шау- дера. Описываемая далее техника опирается на изучение поведения оператора А на некоторых поверхностях, в частности на пересечениях S (г) сфер Sr= { χ: \\х II = г) с конусом К. В конкретных же задачах для изучения обычно доступно поведение оператора Л в окрестности нуля и на бесконечности. С этой точки зрения рассмотрение поверхностей S (г) при достаточно малых или достаточно больших значениях г > 0 представляется наиболее важным. Это соображение и определяет далее формулировки большинства теорем. 3.2. Индексы положительного оператора в нуле и на бесконечности. Мы ограничимся рассмотрением положительных вполне непрерывных операторов . Два положительных вполне непрерывных оператора А 0 πΑχ называются положительно гомотопными на множестве Г С К, если существует положительный вполне непрерывный (по совокупности переменных) оператор #(*, λ) (Я: Г X [0,1] -► К) такой, что Я(*,0)=4о(*), H(x,l)^Al(xl xST, (3.2) причем #(х, λ) Φ χ при χ € Γ, λ Ε [0,1 ]. Легко видеть, что положительная гомотопность представляет собой отношение эквивалентности. Оператор #(х, λ) будем называть положительным гомотопическим мостом между А0 и Α χ или же положительной гомо- топией от А0 к Аг (а иногда — просто гомотопией от А0 к Αχ, если из текста ясно, что речь идет о положительной гомотопии) .Наконец, свойство Н(х, λ) Φ jc будем называть невырожденностью гомотопии. Пусть оператор А положителен и вполне непрерывен на конусе К. Пусть при достаточно малых значениях г>0 оператора положительно гомотопен на множестве S(r) ={x: х£К, Ы = г) 92
оператору Н0(х) = 0. В этом случае будем говорить, что индекс оператора А в нуле равен 1, и писать ind(A9 0) = 1. Индекс А положим равным нулю (ind(A> 0) =0), если при достаточно малых значениях г>0 оператор А положительно гомотопен на S (г) оператору Hr(x) = rh0, h0eK, IA0I>1. (3.3) Заметим, что все операторы Η β (χ) = βΗ0 (β > г) на S (г) положительно гомотопны друг другу. Индексы оператора А на бесконечности опеределяются аналогично: ind(4, °°) = 1, если при достаточно больших значениях г>0 оператор А положительно гомотопен на S(г) оператору Н0(х) = 0; \ηά(Α, °°) =0, если оператор А при достаточно больших г > 0 положительно гомотопен на S (г) оператору (3.3). Точки 0 и °° будем называть иногда особыми точками положительного оператора А, Знание индексов часто позволяет судить о наличии у оператора А неподвижной точки, т.е. о существовании решения уравнения (3.1). Соответствующие теоремы и различные способы вычисления индексов изложены в следующих разделах. Укажем несколько простых результатов. Теорема 3.1. Пусть при достаточно малых (достаточно больших ) по норме χ Ε К, хФд положительный вполне непрерывный оператор А удовлетворяет условию *) А (х) >х (3.4) Тогда ind(,4,0)=l (ind04,~) = 1). Доказательство тривиально. Положительной гомотопией от А кН0(х) = = 0 может служить, например, Н(х, λ) = \А (х). Свойство ΧΑ (χ) Φ χ (λ Ε Ε [0,1], xES(r)) вытекает из (3.4). D Теорема 3.2. Пусть при достаточно малых (достаточно больших) по норме χ Ε К, хФВ положительный вполне непрерывный оператор А удовлетворяет условию А(х) <х. (3.5) Тогда ind(4,0)=O (ind(,4,«>) =0). Доказательство. Оператор А положительно гомотопен на S(г) оператору Η β (χ) = βΗ0, где β достаточно велико. Положительной гомотопией служит Н(хЛ) = *А(х) + (\ -λ)β/ι0. Свойство невырожденности вытекает из следующего рассуждения. Предположим противное. Тогда для любой последовательности βη -+°° можно указать последовательности хпЕ S (г) и λ„ Ε [0,1] такие, что хп -КА(хп) = (1-К)βηh0. (3.6) Но так как хп Ε S (г) и оператор А вполне непрерывен, без ограничения общности можно считать А (хп) -+ζ (в противном случае можно перейти к сходящейся подпоследовательности). Отсюда вытекает ограниченность *) Черта над знаком > обозначает отрицание (не больше). 93
последовательности хп -ληΑ(χη), а значит, и (1 - λ„) /3„/г0, что в свою очередь позволяет считать (1 — λ„) βη ->γ> 0, λ„->>1. Из (3.6) теперь следует, что последовательность Хп сходится к некоторому х0 Ε S (г), причем х0 -А(х0) = уп0, т.е. A(xq) <Хо. Но это противоречит (3.5).D Заметим, что свойство (3.2), полная непрерывность и положительность использованной в доказательстве гомотопии очевидны. Мы намеренно не задерживали на этом внимания. Подобную договоренность будем сохранять и впредь. Если для элементов xGK, χΦΘ, достаточно малых по норме, выполняется (3.4), говорят, что точка 0 — притягивающая, в случае (3.5) - отталкивающая. Условия (3.4), (3.5) удобны для практической проверки и позволяют эффективно использоваться миноранты и мажоранты изучаемого оператора. В то же время эти условия могут быть существенно ослаблены без изменения выводов теорем. Проведенные доказательства по существу устанавливают справедливость следующих более общих результатов. Теорема 3.3. Пусть при достаточных малых (достаточно больших) по норме xElK, χΦΘ положительный вполне непрерывный оператор А удовлетворяет условию А(х) Φλχ при любом \> 1. Тогда ind(^, θ) = 1 (ind(i4,oo) =!).□ Теорема 3.4. Пусть h0 Ε К и h0 Φ 0. Пусть при достаточно малых (достаточно больших) по норме χθΚ,χΦΘ положительный вполненепре рывный оператор А удовлетворяет условию хФА(х) +μ/*0 при любом μ>0. Тогда ind(,4,0)=O (ind(Л, <*) =()).□ Если оператор А удовлетворяет условиям теоремы 3.4, то иногда говорят, что положительное векторное поле х-А(х) на S(г) выпускает направление h0. 3.3. Существование положительных решений. Последующее изложение опирается на принцип неподвижной точки Шаудера. Теорема 3.5. Пусть оператор А положителен и вполне непрерывен на конусе К и ind(i4, °°) = 1. Тогда А имеет неподвижную точку х*ЕК. Доказательство. Условие ind(4, °°) = 1 гарантирует существование положительной гомотопии #(х, λ) на S(R) (R достаточно велико) от А(х) к Н0(х) = 0. Пусть, для определенности, #(х, 0) = 0, Н(х, 1) = = А (х). Введем в рассмотрение оператор (везде χ G К) (Ά(χ), если Их К Л, Ы lRX I|JC|I\ П И -^ η 0, - если 11x11 > 2Л. Очевидно, оператор А вполне непрерывен и преобразует конус К в свою компактную часть. Но тогда в силу принципа Шаудера Л имеет неподвижную точку х* £ К. Для завершения доказательства остается убедиться в том, что Их* II< R. Возможность \\x*\\>2R очевидным образом отпадает. Если жеД< II** К 2Л, то Я(х0, λ0) =х0(гдеХ0=2- , хь = Ях*/11x11), что противоречит определению гомотопии Я(х, λ). D 94
Вывод теоремы 3.5 о существовании неподвижной точки у оператора А корректен в том смысле, что он остается в силе при малых возмущениях оператора А. Понять и уточнить этот факт позволяет следующее простое рассуждение. Операторы*) А и В положительно гомотопны на Г С К, если векторы х — А(х) и jc — В (χ) при любом х€Г не направлены противоположно. В этом случае положительной гомотопией может служить Н(х, λ) = * λΑ(χ) + (1 — λ) Β (χ). Условие непротивоположной направленности в свою очередь обеспечивается, например, справедливостью неравенств L4(jc) -B(x)\\< \\х-А(х)\\, х€Г. (3.7) Поэтому, если та (А, °°) =1 и при достаточно больших по норме χ Ε К справедливо (3.7), то ind(£, °°) = 1 и по теореме 3.5 оператор В также имеет неподвижную точку. Теорема 3.5 эффективна в приложениях в сочетании с различными* способами вычисления индексов. Здесь мы имеем возможность отметить простой результат, получающийся объединением теорем 3.1 и 3.5. Теорема 3.6. Пусть при достаточно больших по норме χ Ε К положительный вполне непрерывный оператор А удовлетворяет условию (ЗА), Тогда оператор А имеет на К неподвижную точку. D Рассмотрим теперь вопрос о существовании положительных решений уравнения х = А(х)+у. (3.8) Сравнение теорем 3.1, 3.2 показывает, что неравенства (3.4), (3.5) на одной и_той же поверхности S (г) несовместимы. Поэтому, например, из Α (χ) > χ ( χ Ε S (г)) вытекает существование такого x0ES (г), что A (xq) <-ль> т.е. уравнение (3.8) в этом случае имеет положительное решение при некотором положительном у. Использование теоремы 3.4 позволяет в данном случае утверждать большее: при любом у>6, уфв и некотором μ > 0 уравнение х = А(х) + цу имеет решение jc Ε S (г). Естественно, положительную разрешимость уравнения (3.8) при любом у>в можно гарантировать лишь в дополнительных предположениях. Те о рема 3.7. Пусть ind(^, °°) = 1, и lim \\x-A(x)\\ = °°. (3.9) 11x0 -°о Тогда уравнение (3.8) при любом у Ε К имеет положительное решение. Доказательство. В силу (3.9) при достаточно больших по норме хЕК для операторов А и А+у будут выполняться неравенства (3.7). Поэтому при достаточно больших R операторы А и А +у положительно гомотопны на S(R). Следовательно, шс1(Л, °°) = ind(,4 +y, °°) =1. Далее остается сослаться на теорему 3.5. D Если дополнительно известно, что уравнение х = А (х) +у при любом у Ε К не может иметь более одного решения, то в условиях теоремы 3.7 мы имеем возможность гарантировать положительную обратимость оператора I-A. *) Если не оговорено противное, рассматриваемые здесь операторы предполагаются положительными и вполне непрерывными. 95
3.4. Ненулевые положительные решения. Довольно часто в приложениях уравнение (3.1) имеет нулевое решение, которое с содержательной точки зрения тривиально, и вопрос 'заключается в выяснении существования ненулевых (нетривиальных) решений. Естественно, теоремы предыдущего раздела в случае Α(Θ) = 0 не могут гарантировать существование у оператора А второй ненулевой неподвижной точки. Теорема 3.8. Пусть индексы в нуле и на бесконечности положительного вполне непрерывного оператора А определены и ind(i4,0) Φ ind(4,<»). Тогда оператор А имеет на К ненулевую неподвижную точку. Доказательство. Пусть ind(i4, 0) = 0, ind (Л, °°)=1, В силу ind (Ау θ) = 0 существует положительная гомотопия #(х, λ) на S (г) (г > 0 достаточно мало), связывающая А (х) и #(х, 0) =rh0 (llft0 ϊ> 1). Введем в рассмотрение оператор (везде xGK) г г ~ ho, если IIjcIK — , 2 2 | Ixl ( rx 2 11x11 \ г Х(х) « j _ я( — 1 , если - < HxIKr, ] г \ 11x11 г ι 2 А(х), если 11x11 > г. Так как Х(х) = А (х) при достаточно больших по норме χ G К, та(Х; «>) = = ind (4, °°) = 1, и по теореме 3.5 существует неподвижная точка х*е К оператора X. Остается показать, что llx*ll>r. Возможность 11х*1Кг/2 заведомо исключена. Если жеrj2< \\х*\\< г> то#(хь, λ0) = χ<> (где λ0 = 2 \\х*\\/г- — 1, хь =гх*/\\х*\\)9 что противоречит определению гомотопии Я(х, λ). Рассмотрим теперь другой возможный вариант ind (А, 0) = 1, ind (A, °°) = = 0. Он легко сводится к предыдущему с помощью перехода к оператору F(x)= ΙΙχΙ]2Λ(χ/ΙΙχΙΙ2), хек, χΦθ. Так как ind(F, 0) = 0, ind(F, °°) = 1. Действительно, пусть а> 0 достаточно мало. Положим r = a, R = 1/а. Пусть //ι(χ, λ) - положительная гомотопия на S(г) от А (х) к#о(х) = ®,Нг(х, λ) - положительная гомотопия на S (R) от А (х) к#я (х) = Rh0 (Л0 € К, 1А0 I > 1). Тогда llxlPtf^x/llxll2, λ) будет положительной гомотопией на S (К) отF к Н0, а II xll2#2(х/ II xll2, λ)- положительной гомотопией на S (г) от F к Яг. Итак, F имеет ненулевую неподвижную точку XqGK. Тогда х* = хь/Нхо IIа - неподвижная точка оператора Л. D __ Назовем положительный оператор А сжатием конуса, если Л (х) < х для xGK, χΦθ, достаточно малых по норме, и Α (χ) >χ для хЕК, достаточно больших по норме. Если же, наоборот, Α (χ) > χ на элементах χ Ε £, χ =£ 0 малой нормы и Α (χ) < χ на элементах χ £ AT большой нормы — оператор А будем называть растяжением конуса. Из только что доказанной теоремы и теорем 3.1,3.2 вытекает следующий полезный результат. Теорема 3.9. Пусть положительный вполне непрерывный оператор А является сжатием или растяжением конуса К. Тогда А на К имеет по крайней мере одну ненулевую неподвижную точку. D Обратим внимание, что здесь, а также в предыдущей теореме, оператора может быть определен лишь на ненулевых элементах конуса. 96
3.5. Вращение положительного поля. Как уже отмечалось в начале параграфа, возможен более общий подход к изучению особых точек положительных векторных полей I—A. За детальной информацией отсылаем читателя к упоминавшемуся источнику, здесь же остановимся на некоторых принципиальных моментах. Пусть Ω,(Κ) обозначает некоторую ограниченную область в конусе К С Ε (т.е. Ω(λ") открыто в К, но не обязательно в Е). Для любой области Ω(Κ) в конусе К можно указать такую область Ω С /Г, что αηκ = Ω,(Κ), йпк = й(к). (зло) Пусть теперь невырожденное положительное вполне непрерывное векторное поле Ι—Α определено на границе й(К) области Ω(/Γ) С К. Продолжим оператор А с сохранением положительности и полной непрерывности на границу Ω области Ω С Еу удовлетворяющей условиям (ЗЛО), за продолженным оператором сохраним прежнее обозначение А. Вращение γ(7—Аь Ω) назовем вращением положительного поля Ι—Α на й(К) и обозначим его через у[1 — А, £1(К)]. Конечно, такое определение требует обоснования своей корректности (возможность указанного продолжения, независимость от Ω и от продолжения), но это делается достаточно легко. В чем же заключаются преимущества понятия вращения положительного поля по сравнению с обычным понятием вращения? Ведь по первому впечатлению его использование сопряжено с необходимостью выполнения дополнительных операций: продолжения области, затем продолжения оператора, тогда как положительное поле /— А с самого начала можно рассматривать как обычное и ограничиться вычислением его обычного вращения. Но это лишь первое впечатление. 1. Конус может быть не телесным. Кстати, это не экзотика, а широко распространенная ситуация. Телесными не являются, например, конусы неотрицательных функций в пространствах Lp. В этом случае обычное вращение/ — А на границе Ω(ΑΓ) вообще не определено. 2. Продолжения области и оператора нужны лишь при построении общей теории. Конечные же, рабочие теоремы о неподвижных точках здесь опираются на стандартные приемы гомотопических переходов. 3. Использование понятия вращения положительного поля освобождает от необходимости делать гомотопические переходы на границе конуса. 3.6. Индексы производных по конусу. Оператора называется дифференцируемым по конусу К в нуле, если \\Α(χ)-Α(Θ)-Α'(Θ)χ\\ hm = 0, хек, йхП-*о IIjcII где А '(0) — линейный оператор, называемый производной оператора А в нуле по конусу К, Если конус К телесен, а оператор А дифференцируем в нуле по Фреше, то А '(0) совпадает с обычной производной Фреше. Оператор А называется дифференцируемым по конусу К на бесконечности, если \\А(х)-А'(оо)х\\ lim — — =0, λ-e/^ Axil-* оо HjcII 97
где А'(°°) — линейный оператор, называемый производной оператора А на бесконечности по конусу К. Так как индексы ind (Л, 0) и ind (Л, °°) не меняются при малых возмущениях оператора А, можно ожидать, что в естественных предположениях они совпадают с индексами Ίηά(Α'(Θ), 0) и шё(Л'(°°), °°). Детализацией этого соображения мы займемся далее, а пока остановимся на изучении индексов линейного положительного оператора. Теорема ЗЛО. Пусть у линейного положительного оператора В нет в конусе К собственных векторов, отвечающих собственным значениям \>\Логда ind(#, 0) = ind(£,~) = 1. Для доказательства достаточно сослаться на теорему 3.3. Π В частности, из теоремы 3.10 следует ind (2?, 0) = ind(Z?, °°) =1, если спектральный радиус ρ (В) < 1. Теорема 3.11. Пусть у линейного положительного вполне непрерывного оператора В есть в конусе К собственный вектор х0 (lbcoll= 0> отвечающий собственному значению λ0 > 1, и нет собственных векторов (в конусе К), отвечающих собственному значению 1. Тогда ind (2?, 0) = = ind(#, «0 =0. Доказательство. Покажем, что положительное векторное поле х-Вх выпускает направление Xq. Предположим противное, т.е. х — Вх = = μ*ο для некоторых xGS (г) и μ> 0. Тогда ζ =jc+ л:0 будет не- Xq — 1 подвижной точкой оператора В, что противоречит предположению об отсутствии у,В собственных векторов, отвечающих собственному значению 1. Окончательный вывод теперь следует из теоремы 3.4. Π Теоремы 3.10. 3.11 показывают, что индексы линейного положительного вполне непрерывного оператора В всегда определены, если 0 - изолированная в К неподвижная точка оператора В. Подчеркнем, что изолированность 0 требуется лишь в конусе К, а не в пространстве Е. В частности, индекс положительного оператора В может быть определен, даже если оператор /— В (действующий в Е) вырожден. Рассмотрим теперь положительный вполне непрерывный и дифференцируемый по конусу К оператор А. Ниже мы будем предполагать, что операторы Α'(θ) и А'(°°) также положительны и вполне непрерывны. Что касается предположения о положительности Α'(Θ) и Л'(°°), то оно по существу излишне. Положительность А'(°°) автоматически вытекает из положительности А, а положительность Α\θ) вытекает из положительности А и дополнительного предположения Α (0) = 0. В свою очередь условие Α (0) = 0 далее обычно подразумевается, так как случай А (0) Φ θ тривиален (сразу очевидно, что ind (Л, 0) =0). Наконец, полная непрерывность Α'(θ) и А'(°°) следует из полной непрерывности Ау если, например, конус К - воспроизводящий. Теорема 3.12. Пусть положительный вполне непрерывный оператор А (Л(0) =0) дифференцируем в нуле, оператор Α'(β) также вполне непрерывен и не имеет -в конусе К собственных векторов, отвечающих собственному значению 1. Тогда 0 — изолированная неподвижная точка оператора А и ind {А, 0) = ind {А '(0) , 0). Доказательство. Из полной непрерывности А'(0) и отсутствия у оператора Α '(0) в конусе К собственных векторов, отвечающих собствен- 98
ному значению 1, следует sup II χ - А '(0) χ II > га, xGS(r) где а > 0. Из определения же производной Α '(Θ ) имеем \\А (х) - А '(0) xll = = о (11x11). В конечном итоге это обеспечивает справедливость неравенств \\А(х) -Α'(θ) х\\< \\х-А'(в) jell для xGS(r) при достаточно малых г > 0. Эти неравенства имеют вид (3.7) и гарантируют непротивоположную направленность векторов х—А(х) и χ — Α'(θ) χ при достаточно малых по норме xGKy χΦΘ.Π Совершенно аналогично доказывается Теорема 3.13. Пусть положительный вполне непрерывный оператор А дифференцируем на бесконечности, оператор А'(°°) также вполне непрерывен и не имеет в конусе К собственных векторов, отвечающих собственному значению 1. Тогда оператор А не имеет неподвижных точек с достаточно большой нормой и \ηά(Α, «>) = та(Л'(°°), °°). □ В конкретных задачах последние две теоремы естественно должны использоваться совместно с двумя первыми, а также теоремами существования 3.5, 3.8. На формулировках возможных здесь комбинаций мы не останавливаемся. Обратим внимание, что приведенные теоремы свидетельствуют о достаточной широте класса операторов, для которых определены индексы в смысле, оговоренном в разделе 3.2. Конечно, вполне непрерывные дифференцируемые операторы, производные которых не имеют в К собственных векторов, отвечающих собственному значению 1, не исчерпывают этого класса. 3.7. Миноранты и мажоранты. Если Аг (х) < А2(х) для xG К, то говорят, чтоАх - миноранта оператора А 2, а А 2 - мажоранта оператора А1. Если неравенства A х (χ) < <А2 (а) выполняются для χ е Ку достаточно малых по норме, говорят, что А х {А 2) - миноранта (мажоранта) оператора А 2 (А х) в нуле. Аналогично определяются миноранты и мажоранты на бесконечности. Пусть А' - миноранта оператора А в нуле, А* — мажоранта Л на бесконечности. Пусть А ~(х) <х для достаточно малых по норме xG К, χ Φ θ и А+ (л) > χ для достаточно больших по норме χ е К. В этом случае, очевидно, оператор А является сжатием конуса, и по теоремам 3.1, 3.2 можно вычислить его индексы (напомним, что изучаемый оператор А предполагается положительным и вполне непрерывным; наличие соответствующих свойств у А " и А + здесь не обязательно). Таким же образом можно устанавливать, что оператор А - растяжение конуса. Подобные соображения, тривиальные по существу, но часто полезные, не исчерпывают возможностей применения минорант и мажорант. Теорема 3.14. Пусть θ - изолированная в конусе К неподвижная точка положительного вполне непрерывного оператора А и при достаточно малых по норме λΈ К А(х)>Вх, (3.11) где В - линейный положительный оператор, имеющий позитивное*) собственное значение λ0 > 1. Тогда Ш(А, Θ) =0. Обратим внимание, что при условии В = А' (0) мы не только охватываем вырожденный случай (λ0 = 1), но и дополняем утверждение теоремы 3.11, так как полная непрерывность В здесь не предполагается. Заметим также, что не предполагается и непрерывность В. Перейдем к доказательству. *) Положительное собственное значение λ0 называется позитивным, если ему отвечает собственный вектор jc0 e К. 99
Пусть В h0 = XgA0 (А0 ε £, || А0 || > 1). Покажем, что при достаточно малых г > 0 оператор А положительно гомотопен на S(r) оператору Л + βΗ 0, где β достаточно велико. Проверим невырожденность гомотопии Н(х> t) = Α (χ) + ίβη0. Предположим противное. Тогда существуют такие х0е£(г)и*0е [0,1J, что х0=А (χ0) + ί0βη0, причем f0 = 0 заведомо исключается, поскольку неподвижная точка 0 оператора А изолирована. В силу (3.11) х0>Вх0 + ίβη0, (3.12) откуда х0 > tQ βΗ 0(t0 β = μ > 0). Обозначим через μ*максимальное число μ > 0, удовлетворяющее неравенству х0 >μδ0. Из*0 >μ*/ι0 и (3.12) получаем Х0 >Βμ*η0 +μΑ0 = (μ*λ0 + u)h0, что противоречит определению μ*. Итак, при достаточно -больших β оператор А положительно гомотопен на S(г) оператору А + 0йо. Покажем теперь положительную гомотопность А + βη0 и βΗ 0. Гомотопией может служить tΑ (χ) + βΗ0. Ее невырожденность очевидна. В предположении противного найдутся последовательности £„-»«>, х„е S (г), Гл G {0,1·] такие, что x„=tnA (xn)+fnb0. Но это повлечет за собой неограниченность по норме последовательности хп - tnA(xn)9 что невозможно, так как хяб5(г) и оператор А вполне непрерывен, ϋ Если г > 0 считать достаточно большим, то приведенное выше доказательство без каких бы то ни было дополнительных изменений устанавливает справедливость следующего результата. Теорема 3.15. Пусть у положительного вполне непрерывного оператора А нет неподвижных элементов с достаточно большой нормой и есть на бесконечности линейная положительная миноранта В, Пусть оператор В имеет позитивное собственное значение λ0 > 1. Тогда ind (4, ~) = 0. D Приведем без доказательства два результата об использовании мажорант. Теорема 3.16. Пусть Θ — изолированная в конусе К неподвижная точка положительного вполне непрерывного оператора А и при достаточно малых по норме χ е К А (х)<Вх, где В — линейный положительный оператор со спектральным радиусом ρ (В) < 1. Тогда ind (4, 0) = 1. α Теорема 3.17. Пусть у положительного вполне непрерывного оператора А нет неподвижных элементов с достаточно большой нормой и есть на бесконечности линейная положительная мажоранта В, Пусть ρ (В) < 1. Тогда ind (4, ~) = 1. α 3.8. Уравнения с параметром. Изучение нелинейных уравнений х = Т(х, λ) (3.13) с числовым параметром λ — одна из важных задач нелинейного анализа. Многие содержательные задачи приводят к изучению уравнений вида (3.13). Примерами могут служить разнообразные задачи теории упругости, где роль параметра играет нагрузка, задачи о распределении температуры при пропускании через тело электрического тока (параметр - величина тока), задачи об автоколебаниях (параметр — неизвестный период) и т.д. При изменении рараметра λ решения (3.13) могут ветвиться, исчезать, "приходить из бесконечности", менять свойства (например, терять устойчивость). Для изучения этих явлений имеются мощные аналитические и качественные методы, составляющие основу самостоятельных теорий (теория бифуркаций, теория катастроф и др.). Важная группа вопросов, касающихся изучения уравнений вида (3.13), относится к нелокальным проблемам: определение множества всех значений λ, при которых уравне- 100
ние (3.13) разрешимо, структура множества решений в целом и т.п. Эти вопросы весьма сложны, и их эффективное решение оказывается возможным лишь в редких ситуациях. Для описания множества тех значений λ, при которых уравнение (3.13) разрешимо, можно использовать обычные теоремы о неподвижных точках. Например, если при любом λ G Л оператор Т(х, λ) положителен, вполне непрерывен и сжимает конус, то (3.13) разрешимо при всех λ ЕЛ. Понятно, что подобную переформулировку допускает любая теорема существования. Специфика уравнений с параметром проявляется при постановке более тонких вопросов: существование решений на поверхностях, непрерывные ветви решений, монотонная зависимость решений и др. Существование решений на поверхности позволяют устанавливать различные леммы о негрмотопных полях. Лемма 3.1. Пусть оператор Т(х, λ) положителен и вполне непрерывен, а поля χ - Τ (χ, λ) при λ = \г и λ = λ2 невырождены на Ω (К) и 7[1-Т(.Л1)>П(К)]Фу\1-Т(.Л2\П(К)]. (3.14) Тогда при некотором λ G (λι, \2) существует по крайней мере одно решение уравнения (3.13) на Ω (JC). Доказательство совсем просто. В предположении противного операторы Γ(·, λχ) и Г(-, λ2) были бы положительно гомотопны. Гомотопией могла бы служить функция Но тогда получается противоречие с неравенством (3.14) .D Наиболее широко распространены на практике нелинейные уравнения с параметром специального вида Τ (χ) =λχ. (3.15) По аналогии с линейным случаем ненулевые решения (3.15) называют собственными векторами оператора Т, а соответствующие значения λ — собственными значениями. Теорема 3.18. Пусть положительный вполне непрерывный оператор Τ не имеет неподвижных точек на Ω (Κ) (ΘΕΩ) и у[1-Т,П(К))Ф1. Тогда оператор Τ имеет на Ω (К) по крайней мере один собственный вектор, которому отвечает положительное собственное значение. Для доказательства достаточно рассмотреть деформацию Η (χ, τ) = χ - - τ Τ (χ). Очевидно, вращение H(xs 0) на Ω (К) равно 1. Теперь остается сослаться на лемму 3.1. D В приложениях удобен и эффективен следующий принцип М.А. Крао носельского. Теорема 3.19. Пусть положительный вполне непрерывный оператор Τ удовлетворяет условию inf {||Г(*)||: χΕΩ(Κ)}>0. (3.16) Тогда оператор Τ имеет на Ω,(Κ) по крайней мере один собственный вектор, которому отвечает положительное собственное значение. 10t
Для доказательства достаточно заметить, что поля χ - тТ(х) при больших τ в предположении (3.16) имеют нулевое вращение. Рассуждение завершает ссылка на предыдущую теорему. D У пр а жн ен и я. 3.1. Пусть конус К телесен, положительный (вполне непрерывный) оператор F не имеет на границе К неподвижных точек и ind(F, °°) = 1. Покажите, что в этом случае обычное вращение векторного поля / - F на границе множества K(R) = {x: хеК, \\х И <Д} при достаточно большом R равно единице. 3.2. Пользуясь определением вращения положительного поля из раздела 3.5, дайте определения индексов положительного оператора в нуле и на бесконечности и покажите, что они согласуются с гомотопическими определениями, которые использовались выше. § 4. К-системы Предыдущий параграф ориентирован на изучение уравнений вида χ = = А (х). В бесконечномерных пространствах именно такие уравнения чаще всего встречаются. В конечномерном пространстве часто приходится рассматривать уравнения F (х) = 0, где F по своим свойствам аналогично отображениям типа χ - А (х), где А - положительный оператор. Теории таких отображений и посвящен данный параграф. Ниже К обозначает некоторый телесный конус в R". Без ущерба для рассматриваемых далее приложений можно считать К = R+. Отображение F: K-+Rn будем называть К-отображением {Кооператором) , если оно граничные точки К не переводит в int К. Все рассматриваемые отображения предполагаются непрерывными. 4.1. ^-индексы. Два ^-отображения F0 и F\ назовем К-гомотопными на множестве Г С К, если существует непрерывное по совокупности переменных отображение Н(х, т)(#: Г X [О, 1 ] -> R") такое, что #(x,0) = Fo(*), ff(*,l)=fi(*) (4.1) иН(Ху τ) при любом фиксированном т£ [0, 1] является ^отображением, причем Н(х, т)Ф0 при любых χ £ Г, г G [0,1 ]. Пусть ^-отображение F при достаточно малых значениях г > 0 Л'-гомо- топно на множестве S(r): ={*: хек, IIjc II *г> тождественному отображению 1(х)=х. В этом случае будем говорить, что К-индекс оператора F в нуле равен 1, и писать ind*(^0)=l. К -индекс F в нуле положим равным нулю (indjr(F, 0) = 0), если при достаточно малых г> 0 отображение F К -гомотопно на S(r) отображению ' Hr(x) = x-rh0i h0GKt 1А0И>1. (4.2) Заметим, что операторы Ηβ(χ) = χ - βΗ0 (β > г) на S(r) А^-гомотопны друг другу. К-индексы на бесконечности определяются аналогично: inaK(F, °°), = 1» если при достаточно больших г > 0 отображение F ^-гомотопно на S(r) 102
тождественному I(x)\ indK(F, °° ) == О, если при достаточно больших г > О отображение F ^-гомотопно на S(r) отображению (4.2). Отношение АТ-гомотопии разбивает всевозможные ^-отображения на бесконечное число классов эквивалентности. Определение лишь двух значений индекса соответствует выделению всего двух таких классов. Но эти классы наиболее обширны (см. далее) и охватывают большую часть приложений, АГ-индексы можно определить и для произвольных АГ-отобра- жений, например, по схеме определения индекса положительного оператора. 4.2. Теоремы о неподвижных точках. Вопросы существования положительного решения χ С К (или ненулевого положительного решения) у уравнения F(x) = 0 с ^оператором F можно изучать в рамках обычной теории вращения векторных полей, вычисляя вращение поля F(x) на границах подходящих областей Ω САГ. В качестве Ω часто удобно вь!бирать множества вида ЛГ(г) = {лг: χ GK, \\х \\<г} , (4.3) или K(r,R) = {x: хСЛ, г<\\х 1КД}. (4.4) В этом случае, однако, приходится строить гомотопические переходы на всей границе множества (4.3) или (4.4), что связано с излишними неудобствами. Использование АГ-индексов позволяет ограничиться построением А>гомотопических переходов лишь на поверхностях S(r). Это удобство будет проиллюстрировано далее. Пока же остановимся на теоремах существования. Теорема 4.1. Пусть F- К-отображение и ind^F, <») = 1. Тогда уравнение F (х) = 0 имеет по крайней мере одно решение χ * С К. Доказательство опирается на следующее вспомогательное утверждение. Л е м м а 4.1. Если Котображение F на S(r ) совпадает с тождественным, то уравнение F(x) = О разрешимо в К(г). Легко видеть, что в оговоренных условиях обычное вращение векторного поля F на границе AT (г ) равно 1. Особенно легко сделать такой вывод, если опираться на определение вращения с помощью метода "протыкающего луча" (гл. II). D Заметим, теперь, что условие indj^(F, <*>) = 1 гарантирует существование АТ-гомотопии к Н(х, т) на S(r) (при достаточно большом г) от F (х) к [(х) = χ. Пусть, для определенности,Η (jc, 0) ξ / (χ), Η (χ, 1) = F (χ). Введем в рассмотрение оператор (везде χ Ε К) I F(x), если II jc II <r, F(x). '")· н(^-,2--^—)) если r<lljc ll<2r, \ II jc II I(x), если II jc II > 2r. Легко проверить, что оператор F на множестве АГ(2г) удовлетворяет Условиям леммы 4.1. Поэтому уравнение F(x) '= 0 имеет решение jc* G АГ(2г). Для доказательства остается убедиться в том, что II jc* II < г. Но возможность г < II χ * II < 2г легко исключается, так как в этом случае Н(хо ,т0) = 0, где юз
x0 = rx*/ \\x* \\, To = 2 - II χ * ll/r, что противоречит определению ЛГ-гомото- пии Н(х, т). D Теорема 4.2. Яусгь Кмндексы в нуле и на бесконечности Котображе- ния F определены в указанном выше смысле и ind*(F,0)^indtf(F,«>). Тогда уравнение F (х) = О имеет по крайней мере одно ненулевое решение х*е к. Доказательство. В соответствии с данным определением ^-индексов возможны два варианта: indHF, 0) = 0, indK(F, со) = 1, (4.5) indjr(F,0)=l, ind*(F,-)=i. (4.6) Рассмотрим сначала вариант (4.5). В силу indj^F, 0) = 0 существует АГ-гомотопия Н(х, г) на S(r) (при достаточно малом г > 0) от F(x) к Нг (х). Введем в рассмотрение оператор (везде χ ΕΚ) 1 г — (χ-/7ι0), если IIjc IK—, 2 J 2 F(*) = ( rx 2 llxl \ r H[ , 1), если - < II* <r, \llxll r I 2 F(jc), если II χ II > r. Так как F(x) = F(x) при достаточно больших по норме jc Ε К, το \ηάκ(Ρ,°°) = ind#(F,°°) = 1 и по теореме 4.1 существует решение χ* Ε К уравнения F(x) = 0. Остается показать, что Их* II > г. Возможность \\х* IK < г/2 заведомо исключена. Если же r/2< Их* 11<г, то #(хо, т0) = 0, где х0=гх*1 \\х* II, го = 2 II** ИД· - 1, что противоречит определениюЛГ-гомото- пии #(х, т). Рассмотрим вариант (4.6). Он легко сводится к предыдущему с помощью перехода к отображению G(x) = II jc ll2F(x/ II jc II2), χ ΕΚ, χ Φ 0, так как maK(G, 0) = 0, inaK(G, °°) = 1. Действительно, пусть ос > 0 достаточно мало. Положим г = a, R = l/a. Пусть #i(x, r) -£-гомотопия на S(r) от F(x) к J(x),#2(x, r) --ЛГ-гомотопия на .?(#) от F(x) kHr(x) = χ - Rh0. Тогда IIjc II2#i(x/ IIjc II2,г) будет АГ-гомотопией на S(R) от G(x) κ/(χ), a IIjc iPi/^x/ IIjc II2, r) - Af-гомотопией на £(г) от G (jc) к #r(x). Следовательно, уравнение G(x) =0 имеет ненулевое решение х0 ΕΚ. Но тогда х* = = jc0/ lljc0 II2 — ненулевое решение уравнения F(jc) = 0. D Приведенные теоремы эффективны в приложениях в сочетании с различными способами вычисления АГ^ндексов. Остановимся пока на двух простейших результатах. Заметим сначала, что любой внедиагоналъно отрицательный оператор, т.е. оператор F(x) = {/ι(χ),... ,/„(*)} , удовлетворяющий условию: для 104
любого г = 1,.. ., η fi(xi,. · ·, */-ι, 0,xi+!,... ,χη) <0 при χ7· > 0 (/ =£ ζ), заведомо является ^отображением (где К = R+). Лемма 4.2. Я^сгь яри достаточно малых (достаточно больших) по норме χ G R", л: =£ О внедиагонально отрицательное отображение удовлетворяет условию F(x)< 0. (4.7) Тогда indK(F, 0) = 1 (indj^F, «>) = 1). Доказательство совсем просто. А"-гомотопией от F(x) κΙ(χ) может служить линейный переход Н(х, т) = тх + (1 - t)F(x). Π (4.8) Без предположения внедиагональной отрицательности отображения F гомотопия (4.8) может не быть ΛΓ-гомотопией. Аналогичный» же признак нулевого индекса справедлив для ^-отображений общего вида. Л е м ма 4.3. Пусть при достаточно малых (достаточно больших) по норме χ £ R", χ Φ 0 К-отображение F удовлетворяет условию F(x)> 0. * (4.9) Тогда ind^F, 0) = 0 (indj^F, «>) = 0).. Доказательство. Покажем, что F ЛГ-гомотопно на S(r) отображению Ηβ(χ)-χ - 0/ιο, где j3>0 достаточно велико. #-гомотопией может служить Н(х, т) = rF(x) + (1 - т)(х - βΑο). Установим свойство невырожденности Н(х, τ) Φ 0. Оно вытекает из следующего рассуждения. Предположим противное. Тогда для любого сколь угодно малого (сколь угодно большого) г > 0 и для любой последовательности $к -> °° можно · указать последовательности хк G S(r) и Тк е [0, 1 ] такие, что rkF(xk) + (1 - тк)хк = (1 - г*)Мо. (4.10) В силу компактности S(r) X [0,1] можно считать хк -+х°, тк -> г0. Но тогда из (4.10) следует (1 - г*)/?*-► γ > 0, что в силу fik -> °° влечет за собой 7> -* 1. Переходя в (4.10) к пределу, получаем F(x°) = yh0 >0, но это противоречит условию (4.9). Тот факт, что Н(х,г) — ^-отображение при любом фиксированном τ G [0,1 ], устанавливается по аналогичной схеме. Π Из этого доказательства легко усмотреть справедливость более общего результата. Лемма 4.4. Пусть при достаточно малых (достаточно больших) по норме xER^, χ Φ 0 К-отображение F выпускает направление h0 6 RJ, т.е. существует некоторое h0 GR!J, к0Ф0такое, что F(x) Φμίι0, каково бы ни было μ > 0. Тогда ind^F, 0) = 0 (ind^F, «>) = 0). D Различные комбинации приведенных теорем и лемм порождают разнообразные принципы разрешимости уравнения F (х) = 0. Теорема 4.3. Пусть при достаточно больших по норме jcGR" внедиагонально отрицательное отображение F удовлетворяет условию (4.7). Тогда уравнение F(x) =0 имеет по крайней мере одно решение х* е R" .□ 105
Теорема 4.4. Пусть в недиагонально отрицательное отображение /· при достаточно малых по норме лгЕК",лг=^0 удовлетворяет условию (4.7), а-при достаточно больших по норме jt£R+ - условию (4.9). Тогда уравнение F(x) -0имеет по крайней мере одно ненулевое решение χ* Ε gr;.d Теорема 4.5. Пусть внедиагонально отрицательное отображение F при достаточно малых по норме χ Ε R", χ Φ О удовлетворяет условию (4.9), а при достаточно больших по норме χ ER + -условию (4.7). Тогда уравнение F(x) = 0имеет по крайней мере одно, ненулевое решение х* GR".D 4.3. Дополнительные методы вычисления индексов. HHaceF' (0) обозначает производную (матрицу Якоби) оператора F в нуле. Если оператор непрерывно дифференцируем и является ^-отображением (внедиагонально отрицательным), то линейный оператор F' (0) также является ЛГ-отображением (внедиагонально отрицательным). Легко видеть, что К-тщекс ϊηάχ(Ρ, 0) не меняется при достаточно малых возмущениях оператора F (при условии, что возмущенный оператор остается в классе ^-отображений). Поэтому можно ожидать, что в естественных предположениях indj^(F, 0) совпадает с индексом indj^(F'(0), 0). Детализация этого соображения опирается на простые теоремы о АГ-индексах линейных АГ-отображений (АГ-матриц). Теорема 4.6. Пусть у невырожденного линейного внедиагонально отрицательного оператора А нет в R + собственных векторов, отвечающих действительным собственным значениям λ < 0. Тогда ind^(/l, 0) = indj^(/l, °°) = 1. Теорему легко доказывает линейный Af-гомотопический переход вида (4.8). G Теорема 4.7. Пусть у невырожденного линейного Котображения А есть в R + собственный вектор х0, отвечающий собственному значению λ0 < 0. Тогда ШК(А, 0) = ind к (А, °°) = 0. Доказательство просто. Отображение А выпускает направление х0. В предположении противного найдутся такие χ &S(r) и μ > 0, что Ах = μχ0. Но тогда Α ζ = 0, где μ 2-х xQi что противоречит невырожденности А. Далее остается сослаться на λ0 лемму 4.4. D Теоремы 4.6, 4.7 показывают, что АГ-индексы линейного невырожденного ^-отображения всегда определены. Теорема 4.8. Пусть производная F' (0) Котображения F невырождена. Тогда indK(F, 0) = indA:(F'(0),0). Доказательство. Из невырожденности F' (0) следует sup WF'(0)x II >ra χ G S(r) при некотором а > 0. Из определения же производной F' (0) имеем II F(x) - F'(Q)x II = = о( \\х II). В конечном итоге это обеспечивает справедливость неравенств I! F(x) - F'(0) x\\<\\ F'(0) х II (4.11 > для xeS(r) при достаточно малом г > 0. Неравенства (4.11) гарантируют непротивоположную направленность на S(г) полей F(x) hF' (0)x, что позволяет осуществить линейный ^-гомотопический переход Н(х, т) = tF(x) + (1 - r)F'(0)x. D Приведенные теоремы показывают, что гомотопические классы АГ-отображений. отвечающие случаям indK(F, 0) = 1, indj^F, 0) = 0, весьма широки. Имеет место также аналог теоремы 4.8 для АГ-индексана бесконечности, если вместо F'(0) использовать производную F'(°°) оператора Fno R + Ha бесконечности. 106
4.4. Теоремы о накрытиях и разрешимость неравенств. Рассмотрим уравнение F(x)=y (4.12) с ^отображением (внедиагонально отрицательным оператором) F и укажем условия, в которых (4.12) разрешимо в R+ при любому GR". (В этом случае отображение F накрывает конус R" в смысле R" С F(Rn+).) Теорема 4.9. Пусть К-отображение F удовлетворяет условию lim IIF(jc)II = oo (4.13) и ind^F, °°) = 1. Тогда уравнение (4.12) при любом у е R+ имеет по крайней мере одно решение χ £ R+. Доказательство. В силу условия (4.12) при достаточно больших по норме jcGRJ векторы F (х) и F (х) - у не могут быть противоположно направлены. Поэтому гомотопия H(x,T) = F(x)-ry (4.14) невырождена (Н(х, г) Φ 0). Очевидно также, что (4.14) представляет собой К-гомотопию (для этого существенно требование у Ε R+). Следовательно, отображения F (х) и F (х) -у ^-гомотопны на S('r ) при достаточно больших г > 0. Поэтому ind^ (F -у, «>) = ind (F, «>) = 1. Далее остается сослаться на теорему 4.1. □ На самом деле справедлив более обширный результат. Пусть ^-отображение F удовлетворяет условию (4.13) и ^-индекс F на бесконечности или равен 1, или вообще не определен в указанном выше смысле. Тогда уравнение (4.12) при любом у £ R" имеет по крайней мере одно решение хека. Если К-индекс F или равен 1, или вообще не определен в указанном выше смысле, будем писать, что -К-индекс не равен нулю. Теорема АЛО.Пусть для К-отображения F ind^ (F, 0) Φ 0, или \ηάκ (F, °°) Φ 0. Тогда неравенство F(x) >* 0 разрешимо в R". Более того, для любого нулевого j£ R" уравнение F(x) = цу разрешимо в Rn при некотором μ>0. Доказательство вытекает из леммы 4.4. D Рассмотрим в качестве иллюстрирующего примера внедиагонально отрицательный оператор F, удовлетворяющий при достаточно больших по норме χ £ R" условию (4.7). Лемма 4.2 гарантирует ind^F, °°) = 1. Следовательно (теорема 4.10), неравенство F(х) > 0 имеет положительное решение. Если же F дополнительно удовлетворяет условию (4.13), то (теорема 4.9) уравнение (4.12) разрешимо в R" при любому £ R" (другими словами, положительно разрешимо при любом положительном у). В данном контексте легко формулируются также теоремы о разрешимости неравенств, например, на поверхностях S(r). Дело в том, что с самого начала можно было определять не ^-индексы, а ^-вращение совер- 107
шенно аналогичным образом: ^-вращение ук [F, S(r)] ^-отображения F на границе К (г) равно 1, если F на S (г) К- гомотопно 1(х), и равно нулю, если F на S (г) ^-гомотопно Нг (х). Понятно, что после замены АГ-индексов ^-вращениями все приводившиеся теоремы сохраняют силу после внесения в их формулировки очевидных поправок. Например, аналогом теоремы 4.2 является следующее утверждение: пусть γ„ [F, S(r)] Φ ук [F, S (R)]; тогда уравнение F\x) = 0 разрешимо в К (г , Л). Признаки равенства 1 или О ^-вращения остаются те же, что и для ЛГ-индексов. Если, например, для внедиагонально отрицательного отображения на S (г) выполняется условие (4.7), то γ^ [F, S(r) ] = 1; если же выполняется (4.9), то ук [F, S(r)] = = 0. Отсюда легко сделать вывод, что для внедиагонально отрицательного оператора F условия (4.7) и (4.9) на S(r) несовместимы*). Этот факт может быть представлен и в более конструктивной форме. Теорема 4.11. Пусть F — внедиагонально отрицательное отображение. Если на S(r) выполняется условие (4.7), то неравенство F(x) >0 имеет решение χ Ε S(r). Если на S (г) выполняется условие (4.9), то неравенство F (х) < 0 имеет решение χ Ε S (r). D Вернемся снова к вопросу о накрытии конуса ^-отображением. Задачу накрытия можно рассматривать с несколько иной точки зрения, геометрически более наглядной. Суть дела проще всего пояснить в линейном случае. Пусть А — невырожденное линейное А'-отображение (А'-матрица). Очевидно, образ неотрицательного ортанта RJ2 при отображении А, т.е. ЛК+, представляет собой некоторый конус в R". Поскольку граничные точки R+ не переходят внутрь R+ и det А Φ 0, имеются две возможности: или пересечение R+ Г) ARi не содержит внутренних точек Ri, или конус A R+ охватывает R£, т.е. R? С 4R?. (4.15) Легко видеть, что в случае (4.15) матрица А положительно обратима (все элементы матрицы А'1 неотрицательны), поскольку уравнение Ах-у при любом положительном j>(y£R£) имеет положительное решение. Ясно, что альтернатива (4.15) реализуется в том и только в том случае, когда уравнение Ах-у имеет положительное решение хотя бы при одном строго положительном .у>0. Эти рассуждения приводят к следующему результату. Теорема 4.12. Для того чтобы невырожденная матрица А была поло- жительно обратима, необходимо и достаточно выполнение двух условий: а) матрица А является К-матрицей; б) уравнение Ах = у имеет положительное решение хотя бы при одном у>0.П Здесь возникает естественный вопрос. А нельзя ли теорему 4.12 распространить на нелинейные операторы? Непосредственное обобщение, конечно, невозможно. Оно невозможно и при наложении дополнительного (необходимого) требования (4.13) (которое в линейном случае выпол- *) Это утверждение опирается на негомотопность / (х) и Нг (х) на S (г). Отсутствие if-гомотопии от / (х) к Нг (х) нигде ранее не требовалось и не было доказано. Доказательство легко может быть получено предположением противного и получением противоречия с теоремой Брауэра. 108
няется автоматически). Некоторые специальные варианты обобщений, которые здесь можно предложить, довольно явно связаны с теоремой 4.9 и на основе теоремы 4.9 доказываются гораздо легче, чем с использованием описанной геометрической идеи. Вопрос о возможности нетривиального использования указанных соображений в нелинейном случае остается открытым. § 5. Линейные положительные операторы Изучение линейных операторов с точки зрения нелинейного анализа представляет интерес по нескольким причинам. Во-первых, линейные операторы играют важную роль в вопросах дифференцирования. Во-вторых, в нелинейном анализе, в частности, рассматриваются операторы, представляющие собой композицию линейных операторов с нелинейными, операторы, близкие к линейным, асимптотически линейные и т.д. Наконец, линейные операторы часто удобно использовать в качестве минорант и мажорант. Теория линейных положительных операторов весьма обширна, и ее изложение не входит в наши намерения. Ниже сообщаются лишь основные факты этой теории в той ее части, которая непосредственно примыкает к содержанию книги. 5.1. Общие сведения. Простейшим примером линейного положительного оператора может служить оператор, задаваемый неотрицательной матрицей*). Этот пример в определенном смысле исчерпывает разновидности линейных положительных операторов в R", так как можно утверждать следующее. Если линейный оператор А действует в R п и оставляет инвариантным некоторый телесный конус KCRn, то существует базис, в котором А описывается неотрицательной матрицей. Как и в общем случае, для линейных операторов важную роль играет понятие Мо-положительности, а также сильной положительности. Для линейных операторов А: Rm -*Rm, т.е. матрица = [ац], специфическую роль играет понятие неразложимости. Для сильной положительности А необходима и достаточна неразложимость плюс примитивность [tf/y]. Требование неразложимости положительной матрицы [д,у] равносильно существованию у матрицы [α,-y] дорожки невырожденности. Последовательность элементов называется дорожкой невырожденности матрицы [д/у], если все элементы последовательности(5.1)отличны от нуля и среди индексов ζΊ,... ,/ш имеются все числа 1,2,...,т. Обратим внимание, что понятие неразложимости относится лишь к неотрицательным матрицам, тогда как понятие дорожки невырожденности неотрицательность элементов матрицы не предполагает. Элемент χ называется квазивнутренним элементом конуса К, если / (х) > > О для любого ненулевого функционала I GK*. Напомним, что К * обозначает множество линейных положительных на К функционалов. *) Матрицы с неотрицательными элементами называют также положительными или полуположительными. 109
В случае телесного конуса понятия квазивнутреннего и внутреннего элементов совпадают. В Lp конус неотрицательных функций свойством телесности не обладает, но имеет квазивнутренние элементы: неотрицательные функции из Lp, принимающие нулевые значения лишь на множестве нулевой меры. В общем случае линейный положительный оператор А называется неразложимым, если из х> а А х, где хЕК,хФв,ос>0, вытекает, что х - квазивнутренний элемент К. Форма определения неразложимого оператора довольно далека от конкретных реализаций. Тем не менее в каждом конкретном случае необходимая редукция проводится достаточно легко. Линейный оператор А, задаваемый неотрицательной матрицей, неразложим в том и только в том случае, когда матрица^ неразложима (имеет дорожку невырожденности). 5.2. Оценки спектрального радиуса. Существенной характеристикой линейного оператора А является его спектральный радиус р(А), определяемый как наименьший радиус круга, содержащего весь спектр оператора А. Здесь уместно напомнить формулу И.М. Гельфанда р(Л)= lim \/WAn II (5.2) Известно, что линейное уравнение \х = Ах+упри \ λ| >р(А) имеет единственное решение х*= (λ/ -Α)~ιу (где /- тождественный оператор), являющееся пределом последовательных приближений Хлс„+1 = = Ахп + у (п- 0,1,...) при любом х0 £ Е. Сходимость последовательных приближений в данном случае равносильна сходимости к решению ряда Неймана **= Σ \-(n+lU"y. (S3) /ι = 0 Можно утверждать и обратное: если ряд (5.3) сходится при любых у Ε Ε и | λ | >α, то р(А)<а. Точное вычисление спектрального радиуса удается лишь в исключительных случаях. По этой причине важную роль в теории линейных операторов играют теоремы об оценках спектрального радиуса. Особенно удобные и эффективные приемы таких оценок существуют для положительных операторов, которые собственно и представляют для нас основной интерес. Теорема 5.1. Пусть для линейного положительного оператора А и ненулевого элемента х0 Ε К выполняется неравенство Ax0Z>yx0. (5.4) Тогда р(А)^>у. Доказательство. Обозначим через хе решение уравнения (р(А) + + е)х = Ах + у, где е>0,у>х0. Поскольку все элементы Апу положительны, то хе, представимоерядом (5.3), также положительно, а значит, положительно Ах€. Поэтому (р(А) + е)х€>у>х0. (5.5) Кроме, того, (р(А) + е)х€>Ахе. (5.6) 110
Применяя к неравенству (5.5) оператор А (заметим, что линейный положительный оператор монотонен) и пользуясь неравенствами (5.4), (5.6), получаем х€> у(р(А) + е)~2*0. Продолжая этот процесс, приходим к неравенствам хе> уп~1 (р (А) + е) ~пх0 (л =1, 2,...), откуда вытекает ограниченность при каждом фиксированном е>0 последовательности уп~~1 (р(А) + е) ~~". Следовательно, р(А) > у, Π Из доказательства легко видеть, что требование х0 £К можно заменить предположением: -х0 φ К, конус К - воспроизводящий (или -х0 не принадлежит К, но принадлежит линейной оболочке К). Неравенство (5.4) также можно заменить без изменения вывода на А кх0 **укх0 (это очевидно в силу р(Ак) = [р(А)]к). Аналогичная оценка спектрального радиуса но неравенству Ах0<>ухо, Χο^Θ, х0еК, (5.7) в общем случае не имеет места. Простые примеры показывают, что (5.7) не влечет за собой ρ (Α) ^ у. Тем не менее в некоторых достаточно Свободных предположениях удается установить справедливость соответствующей импликации. Пусть, например, К - нормальный воспроизводящий конус, а оператор А х0-ограничен сверху*). Тогда из (5.7) вытекает, что оператор В = „1 А 7 преобразует в себя конусный отрезок ( -х0,х0). Поэтому при любом у € ( -jc0,jc0 > нормы элементов Впу ограничены в совокупности, что влечет за собой сходимость рядов Неймана (5.3) при Ι λ | > γ. Поскольку оператор А лг0-ограничен сверху, то ограниченными по норме будут также элементы Вп у при любом у GE, Следовательно, ряды Неймана (5.3) сходятся при | λ | > у для всеху G Ε, а это дает р(А) < γ. Возможны и другие вариации предположений. Часть из них собрана в следующем утверждении. Теорема 5.2. Пусть линейный положительный оператор А удовлетворяет неравенству (5.7) и пусть выполняется одно из условий: 1) конус К - нормальный и воспроизводящий, оператор А х0-ограничен сверху; 2) оператор А вполне непрерывен, х0 - квазивнутренний элемент К; 3) конус К - нормальный и телесный, х0 - внутренний элемент К; 4) конус К -нормальный и воспроизводящий, оператор А щ-ограничен сверху, х0 - квазивнутренний элемент К. ' Тогда имеет место оценка ρ (Α) <γ. D Часто представляют интерес оценки спектрального радиуса в виде строгих неравенств. Теорема 5..3. Пусть выполняются предположения теоремы 5.2. и ух0 - Ах0 - квазивнутренний элемент конуса К (или же оператор А неразложим и Ах0 Φ ух0). Тогда р(А) < у. D Следующая теорема позволяет использовать описанные выше приемы оценки спектрального радиуса положительного оператора для оценок спектрального радиуса линейного оператора общего вида. *)Положительный оператор F называется jc0-ограниченным сверху (снизу), если для любого ненулевого xS К найдется такое mt что Fm (χ) « ах0 {> <хх0) при некотором α > 0.
Теорема 5.3. Пусть линейный оператор А положителен на нормальном воспроизводящем конусе К и линейный оператор В удовлетворяет условию ~Ах<Вх<Ах, xSK. Тогда р(В)<р(А).П 5.3. Позитивные собственные значения. Пусть уравнение Ах=\х (5.8) с линейным положительным оператором А имеет при некотором вещественном λ = λ0 > 0 ненулевое положительное решение х0 G К. В этом случае λο называют позитивным собственным значением оператора А, ах0 — положительным собственным вектором. Позитивные собственные значения положительны, но положительные собственные значения не обязательно позитивны (к позитивным не относятся те положительные собственные значения, которым соответствуют собственные векторы, не лежащие в К). Теорема 5.4. Пусть линейный щограниченный β пространстве Ε оператор А вполне непрерывен и щ -положителен. Тогда оператор А имеет единственный (с точностью до нормы) положительный собственный вектор x0(Axq =Х0Хб); соответствующее ему позитивное собственное значение λο > 0 — простое и превосходит модуль всякого другого собственного числа оператора А, те. λο = р(А ). D Эта теорема достаточна для большинства приложений. В ней даются положительные ответы на основные вопросы: существование позитивного собственного значения его простота, единственность, и, наконец, совпадение со спектральным радиусом (и даже, более того, отсутствие на окружности радиуса ρ (А) других собственных значений). Предположения теоремы, вообще говоря, довольно жесткие, но они обычно выполняются в конкретных задачах. Эти предположения можно существенно ослабить, если положительные ответы требуются лишь на часть из перечисленных выше вопросов. На этом пути возникает множество вариаций, описание которых здесь едва ли уместно. Приведем лишь несколько основных результатов. Теорема 5.5. Пусть линейный вполне непрерывный оператор А по- ложителен на воспроизводящем конусе К и имеет собственные значения, отличные от нуля. Тогда р(А) является позитивным собственным значением оператора A. D Теорема 5.6. Пусть линейный ^ограниченный в пространстве Ε оператор А и0 положителен и имеет положительный собственный вектор. Тогда соответствующее позитивное собственное значение простое и превосходит модуль любого другого собственного числа оператора A. D Объединение теорем предыдущего раздела об оценках спектрального радиуса с утверждениями данного пункта о совпадении λ0 и р(А) позволяет указать оценки для λ0. Формальное объединение, правда, приводит к "лишним" предположениям. На практике удобно пользоваться следующим утверждением. Теорема 5.7. Пусть линейный положительный оператор А вполне непрерывен и существует элемент и €Е Ε такой, что -и G К, и = υ — 112
—νν(ϋ, wGK) и Аки>уки, γ>0. Тогда оператор А имеет позитивное собственное значение λ0 > у. □ 5.4. Несовместные неравенства. Будем говорить, что элемент jc под действием оператора А идет вперед {строго вперед), если Ах> х(Ах> χ, Ахфх); идет назад (строго назад), если Ах <-х(Ах <>х, АхФх). Уже из теорем раздела 5.2. можно "извлечь" утверждения о невозможности существования в конусе у линейного положительного оператора различных элементов, одни из которых идут, например, вперед, а другие — строго назад (в противном случае получались бы противоречивые оценки спектрального радиуса). Здесь можно было бы указать целую серию теорем. Ограничимся следующим результатом. Теорема 5.8. Пусть линейный щ-положительный оператор А имеет положительный собственный вектор jc0, соответствующий позитивному собственному значению λ0 = 1. Тогда для всех χ Ε К, отличных от νχ0 (ν > 0), элементы χ и Ах несравнимы, т.е. χ - Ах ^К, Αχ - χ φ К ( или равносильно χ >~Αχ9 χ < Αχ). Доказательство. Заметим, во-первых, что элемент х0, очевидно, принадлежит К(и0), и поэтому оператор А х0-положителен. Возьмем произвольное х^К, χΦΘ. Обозначим через а0 и β0 соответственно наибольшее и наименьшее из чисел α и /3, при которых ах0 <*А х0 <> βχ0> где к выбрано из условия А л*е АЧ*0). Допустим, Α χΦνχύ. Тогда элементы Акх- а0х0 и β0χ0 - Акх отличны от нуля и положительны, и поэтому найдутся такие натуральные ρ и q и положительные а, и аа, что Ар(Акх-«0х0)><*1х0, АдУ0х0-Акх)>«2х0. (5.9) к о+к к Если х2> Ах, то А х> А^ χ и в силу первого из неравенств (5.9) А х> (а0 + о^) х0, что противоречит максимальности а0. В случае χ <*Αχ аналогичным образом получается противоречие (при помощи второго неравенства (5.9)) с определением /30. Теперь остается вариант Акх = νχ0. Если Ах> х, то Акх> х, т.е. vxQ - х2> 0. Если бы элемент vx0 — χ был отличен от нуля, то элемент Αη(νχ0 - χ) также был бы отличен от нуля при всех достаточно больших и. Но это невозможно, поскольку A (vxQ - -л) =0. Следовательно, Ах>х возможно лишь при χ-νχύ. Случай Л*<.х рассматривается аналогично, α 5.5. Положительная обратимость. Линейный оператор В: Е-+Е называется положительно обратимым, если обратный оператор В'1 существует и положителен. Нередко возникает необходимость выяснить положительную обратимость оператора / — А, где / — тождественный (единичный), а А — положительный оператор. Для решения этой задачи можно указать довольно простой и весьма эффективный способ. Заметим, во-первых, что положительная обратимость I - А равносильна положительной разрешимости неоднородного уравнения х=Ах+у (5.10) при любом у £ К (плюс, разумеется, разрешимости (5.10) при всех 7 G Е). В достаточно свободных предположениях можно утверждать, что из положительной разрешимости (5.10) хотя бы при одном уЕК(уФ6) вытекает положительная разрешимость (5.10) при любом у Ε К. Это предельно упрощает исходную задачу: достаточно подобрать хотя бы один не- 113
нулевой положительный элементно» при котором решение (5.10) существует и положительно*). Теперь уточним сказанное. Пусть у0 - квазивнутренний элемент конуса К (или же оператор А неразложим и уо>6, УоФВ) и при у =у0 уравнение (5.10) имеет положительное решение х0. Пусть оператор А и элемент х0 удовлетворяют одному из условий 1) - 4) теоремы 5.2. Тогда по теореме 5.3 р(А) < 1 (так как Ах0 = х0 -уо <Хо)· Следовательно, уравнение (5.10) имеет решение при любом у Ε Ε. При у Ε К соответствующие ряды Неймана (5.3) содержат лишь положительные члены, поэтому при любом у Ξ К решение уравнения (5.10) положительно. Сформулируем полученный результат в виде отдельной теоремы. Теорема 5.9.Пусть у0 - квазивнутренний элемент конуса К (илиже оператор А неразложим, у0> Θ, у0 ΦΘ) и при у=уо уравнение (5.10) имеет положительное решение х0, причем оператор А и элемент х0 удовлетворяют одному из условий 1) — 4) теоремы 5.2. Тогда оператор I - А положительно обратим. D Нужно отметить, что условия 1) - 4) теоремы 5.2 в данной ситуации можно ослабить. Например, в случаях 2), 4) фигурирует предположение о том, что ^о - квазивнутренний элемент К. Понятно, что это требование можно опустить (так как оно выполняется автоматически), если у0 — квазивнутренний элемент. § 6. Примеры и задачи 6.1. Равновесие динамической системы. Пусть система дифференциальных уравнений x = F(x) (6.1) описывает динамику некоторого объекта, причем природа переменных такова, что все л:/ заведомо неотрицательны. Будем предполагать,что F(x) удовлетворяет неким условиям, обеспечивающим единственность и нелокальную продолжимость решений (6.1). В этом случае необходимым и достаточным условием того, чтобы никакая траектория (6.1) не могла выйти за пределы неотрицательного ортанта R+, является требование внедиагональ- ной положительности**) F(x): //(*!,... ,*/-!, 0,Х/+1,... ,Хп)>0 (6.2) при любых / = 1,.. ., п, х> 0. Таким образом, любая динамическая система, в которой переменные не могут принимать отрицательные значения, обязательно должна удовлетворять условию (6.2). Поэтому системы рассматриваемого класса характеризуются тем, что описывающие их операторы — F(x) являются ^-отображениями, причем внедиагонально отрицательными. Равновесные положения (6.1) определяются решениями уравнения F(x)=Q. (6.3) *) Конечно, практически более естественно действовать наоборот: искать х0 >в, при котором х0 - Ах0 > θ. **)См. [24]. 114
Теоремы предыдущего параграфа охватывают широкий круг ситуаций, в которых разрешимость (а также ненулевая разрешимость) уравнения (6.3) обеспечивается естественными предположениями. Рассмотрим два примера. 1. Пусть (6.1) описывает динамику в модели сосуществования η биологических видов (х/ —численность популяции /-го вида). В данной'модели естественным выглядит следующее предположение. Если суммарная численность Σχ,- =11^11/ достаточно мала, то численность популяции хотя г бы одного вида возрастает, т.е. 3/: /f(χ) >0. Если же суммарная численность II χ II7 достаточно велика, то численность популяции хотя бы одного вида убывает, т.е. 3/: /г-(х) < 0. Другими словами, для достаточно малых по норме χ G R{?, χ Φ 0 -F(x)>0, (6.4) а для достаточно больших по норме χ G R" -F(x)<0. (6.5) Теорема 4.5 в этом случае гарантирует существование в системе ненулевого (нетривиального) положения равновесиях* Ε R+. Предположение (6.4) может вызывать возражения. Дело в том, что способность вида к размножению и увеличению числа особей проявляется, как принято считать, начиная с некоторой минимальной начальной численности. В этом случае совокупность предположений о системе может выглядеть так. При достаточно малых по норме х£ R + выполняется (6.5), при xGR" по норме порядка некоторого малого/· >0 выполняется условие (6.4) и, наконец, при достаточно больших по норме χ Ε R + справедливо (6.5). На основе таких предположений сделать вывод о существовании равновесия можно, лишь опираясь на понятие АГ-в ращения (понятий ^-индексов уже "не хватает"). Окончательный результат получается более содержательным по сравнению с предыдущим. Ненулевых положений равновесия существует по крайней мере два, одно из равновесий с малой нормой заведомо асимптотически неустойчиво *). 2. Пусть теперь система дифференциальных уравнений (6.1) описывает динамику некоторой химической системы, X/ обозначает концентрацию /-го вещества в реакторе. Если система замкнута, то движение происходит в плоскости ΣΧ;=1 (100%). i Оператор F может быть определен лишь на £(1), но его легко продолжить на весь конус R+, например, так: Их llF(x/ llx II). Очевидно, на 5(1) не существует точки х, в которой F(x)>0, F(x) Ф0 (иначе бы движение вышло за пределы S (1)). По той же самой причине на S (1) не существует точки х,в которой F(x) <0,, F(x) Ф0. Если теперь предположить, что система не имеет положения равновесия (F(x) Ф0), то на 5(1) будут *) Выводы об отсутствии асимптотической устойчивости в рамках теории вращения обычно делаются на основе отличия индекса положения равновесия от единицы (см. раздел 3.6 гл. И). 115
одновременно выполняться условия F(x)<0, F(x)>0, что невозможно (см. раздел 4.4). Следовательно, в замкнутой химической системе всегда существует положение равновесия. 6.2. Рыночное равновесие. Пусть jcj обозначает цену z-го товара, /f (χ) - функцию избыточного спроса на ι-й товар (/ =0, 1,..., ή). Первый товар (с нулевым индексом) — базисный, цену на него не фиксируем. Точка х* определяет положение равновесия на рынке, если для каждого г или fi(x*) =0,илил**=0, fi(x*) < 0. От оператора F перейдем к оператору G по следующему правилу: компоненты gf (x) получаются непрерывным обнулением функций - /,· (х) в тех граничных точках Rj , в которых // (х) <0,Xf = 0. Если точки, в которых /,·(*) <0,Xf = 0, отсутствуют, то просто gj(x) =—fi(x)- Положение равновесия теперь определяется решением уравнения G(x) = 0, причем G — внедиагонально отрицательный оператор. Довольно естественным выглядит следующее предположение а): если набор цен jc G S (1) - неравновесный, то найдутся такие / и/, что/,· (х) > 0, /; (х) < 0. В предположении отсутствия равновесия это равносильно одновременному выполнению противоречивых (см. раздел 4.4) условий G(x)<0, G(x)>0 на 5(1). Следовательно, при условии а) рыночное равновесие всегда существует. Заметим, что этот результат имеет более общий характер, чем классическая теорема о существовании рыночного равновесия, опирающаяся на балансовое соотношение Вальраса Σ х,/,(х) = 0, I так как последнее влечет за собой а) (проверьте!). 6.3. Межотраслевой баланс. Рассмотрим нелинейную модель межотраслевого баланса, описываемую уравнением х-Р(х) = у, (6.6) где оператор внутрисистемных затрат Ρ непрерывен и положителен, χ — вектор плановых выпусков,^ — вектор чистых выпусков. План xG R"rx ¥=0 назовем абсолютно непродуктивным, если внутрисистемные затраты каждого продукта превышают соответствующий плановый выпуск, т.е. Xj -ρ/ (х) < 0 при любом / =!,...,«. Если же каждый плановый выпуск превосходит соответствующие внутрисистемные затраты, т.е. Xj — Pi(x) >0 (ι = 1,..., η), то план х назьюается продуктивным. Теорема 6.1. Пусть в системе невозможен абсолютно непродуктивный план и lim ΙΙχ-Ρ(χ)ΙΙ = °ο. (6.7) II χ II -> оо Тогда в системе реализуем любой (неотрицательный) набор чистых выпусков. 116
Для доказательства достаточно заметить, что невозможность абсолютно непродуктивного плана означает х<>Р(х), что по теореме 3.1 влечет за собой ind (Ρ, °°) = 1. Далее остается сослаться на теорему 3.7. D Существование (некоторого) продуктивного плана в условиях теоремы 6.1 можно гарантировать и без предположения (6.7). Теорема 6.2. Если в дополнение к предположениям теоремы 5.1 выполняется условие detlZ-POc)] Φ О при любом *е int R£ to любой (неотрицательный) набор чистых выпусков реализуется единственным способом. D Доказательство предлагается читателю в качестве самостоятельного упражнения. Здесь удобно воспользоваться результатами § 5 гл. II. 6.4. Равновесие по Нэшу. Пусть имеется игра и лиц с функциями выигрыша Д· (*ι,.. .,хп), гдеXf — стратегия /-го игрока,Л/ Ε Xi9Xi CRmf. Стандартный путь изучения равновесия по Нэшу (см. гл. I) заключается в исследовании неподвижных точек отображения(оператора межэлементных связей) И/(дг)=И/1(х)Х...ХИ/Л^), где Wt(x) = Arg max Di(pcl9., . ;*/_ι,Λ,*ί+ι,.. .,*„). yfGXi Если Xj — выпуклые компакты, a W(χ) — однозначное отображение, то вывод о существовании нэшевского равновесия (о разрешимости уравнения χ = W(x)) позволяет получить теорема Брауэра. Если же W(x) — многозначное отображение (условные максимумы не единственны) — соответствующую гарантию существования дает или теорема Какутани (в случае выпуклых образов W(x)), или теорема Эйленберга—Монтгомери (в случае стягиваемых образов W(x)). Этим, пожалуй, исчерпываются традиционные теоремы существования равновесия по Нэшу. На практике же часто приходится сталкиваться с ситуациями, где игровые взаимодействия протекают на неограниченных множествах, чаще всего на неотрицательных ор- тантах. В последнем случае к удобным результатам приводят теоремы о сжатии и растяжении конуса. Формулировка соответствующих утверждений здесь очевидна. Для иллюстрации возникающих возможностей рассмотрим простой пример. Принцип открытого управления в задаче распределения одномерного ресурса приводит к игре *) η игроков с функциями выигрыша Di(x) = xL· - — хЛy/RI Σ xf , где Xf > О - стратегия /-го игрока (производителя), г ι и R — положительные параметры (г,- — коэффициент эффективности производства, R — общее количество ресурса). *) См. [9,10]. 117
Здесь ясно, что при большой норме вектора χ условный максимум (каждой) функции Df (χ) по Xj находится в точке Xf ^rf. Поэтому, если норма χ достаточно велика, то обязательно найдется игрок, у которого условный максимум Df(x) по собственной стратегии xt будет расположен слева от Xf. Это обеспечивает справедливость условия W(x)>x при достаточно больших по норме х. Вывод о существовании равновесия дает теорема 3.6. 6.5. Бесконечномерные системы. При изучении нелинейных систем с распределенными параметрами довольно часто возникает необходимость исследования интегрального уравнения Урысона л:~(Г) = / k[t, s, x(s)]ds = Ax(t). Ω Интегральный оператор А называется оператором Урысона. Как правило, через Ω обозначается ограниченное замкнутое подмножество конечномерного пространства. Частным, но достаточно важным случаем операторов Урысона являются операторы Гаммерштейна, имеющие вид Ax{t) = f Q(t,s)f[s,x(s)]th. (6.8) Ω Здесь обычно предполагается, что ядро Q(t,s) - измеримая по совокупности переменных функция, a f{tу и) удовлетворяет условиям Каратеодори: f(t,u) при каждом фиксированном и измерима по t е Ω и почти при всех t е Ω непрерывна по и. Оператор Гаммерштейна можно рассматривать как произведение (композицию) А = Qf нелинейного оператора суперпозиции fx(t)=flt,x(t)] и линейного интегрального оператора β*(0 = / Q(t,s)x(s)ds Ω с.ядром Q (r, s). Существом исходной задачи обычно не определяется то функциональное пространство, в котором следует рассматривать соответствующий интегральный оператор. В этих случаях руководствуются соображениями удобства. Функциональное пространство Ε стремятся выбрать так, чтобы интегральный оператор А действовал из Ε в Е, был непрерывен или вполне непрерывен. Конечно, в зависимости от ситуации существуют и другие требования, которые было бы желательно удовлетворить подбором пространства, но требования непрерывности и условие А: Е-+Е в большинстве случаев играют главную роль. К нелинейным уравнениям* =/1 (х) с интегральным оператором Гаммерштейна А приводят многие практические задачи. Например, большинство задач математической физики сводится к изучению дифференциальных уравнений в частных производных второго порядка. В левой части таких уравнений обычно стоит дифференциальный оператор L вида W Ъ*х m Ъх Lx(t) = - Σ afjit) ——- + Σ *,·(/) + a0(t)x, ij-l btfltf ,= 1 df/ где* = {ίχ iw)eficRm. На практике широко распространены эллиптические операторы L, характеризуемые наличием определенных свойств у коэффициентов. Первой краевой задачей (или задачей Дирихле) для дифференциального уравнения с эллиптическим оператором называют задачу об отыскании решения уравнения Lx(t) = y(t), удовлетворяющего нулевому граничному условию χ V)\ ., = 0. 118
Известно, что в естественных предположениях регулярное решение существует и может быть представлено в виде x(t) = Qy(t) = f Q(t,s)y(s)ds, а где ядро Q(t, s) называется функцией Грина первой краевой задачи. Рассмотрим теперь краевую задачу Lx(t)=f{t,x(t)], x(t) Ιί(ΞΓ = 0 с нелинейной функцией /. В указанном выше смысле под ее решением можно понимать решение интегрального уравнения Гаммерштейна *(0= / Q(t,s)f[stx(s)]ds = Ax{t), а где Q{t, s) - функция Грина первой краевой задачи. Функция Грина первой краевой задачи всегда неотрицательна (это вытекает из принципа максимума). Поэтому в случае f(t, и) > О при t е Ω, и > 0 оператор А положителен на конусе неотрицательных функций. Более того, в случае/(Г, и) > 0 при и > 0 оператора щ-положителен, где элемент и0 определяется равенством "о(0 я / Q(t,s)ds. а Широкоизвестным и весьма важным примером эллиптического оператора является оператор -д, где Д - оператор Лапласа: Ъ2х Ъ2х Дх = +. . .+ . Содержательными примерами решений нелинейной краевой задачи -дх =/(г, χ), jc(f) lfer·" 0 могут служить: 1) стационарное распределение температур в изотропном теле с распределенными источниками тепла, мощность которых нелинейно зависит от температуры; 2) потенциал электростатического (гравитационного) поля в области с непрерывно распределенными зарядами (гравитационными массами), плотность распределения которых в свою очередь зависит от потенциала. Рассмотрим уравнение χ -А (х) с интегральным оператором Гаммерштейна А, действующим в пространстве С непрерывных функций, заданных на компакте Ω. Далее предполагается, что ядро Q{t, s) и нелинейная функция f(s, и) непрерывны по совокупности переменных и неотрицательны. В этих предположениях, очевидно, оператора вполне непрерывен и положителен на конусе К неотрицательных функций из С. Остановимся сначала на более простом случае, когда Q(t, s) строго положительно n/(s, и) > 0 при и> 0. Пусть f(s,u) <аи при всех $еаи достаточно малых и > 0, где otp(Q) < 1, p(Q) - спектральный радиус линейного оператора Q. Легко видеть, что тогда та{А, Θ) = 1. Действительно, из /(s, и) < аи вытекает А (х) < &Q(x ) (при достаточно малых по норме χ е λ К х II -max I x (f) I ). По предположению спектральный радиус оператора г ___ oiQ меньше 1, поэтому aQ(x) > х_(в противном случае из теоремы 5.1 следовало бы ар(0 > О и тем более А (х) > х, что дает возможность завершить рассуждение применением теоремы 3.1. Пусть теперь f(s, и) < сш + β при всех s е Ωη при всех и > 0; β > 0, ap(Q) < 1. В этом случае ind (А, °°) = 1, и теорема 3.5 гарантирует существование положительного решения. Действительно, легко видеть, что А (х) < qlQx + ζ 0, где ζ0= β / Q{t,s) ds, Ω, причем ζ ο - внутренний элемент конуса К, так как Q(t, s) > 0. При достаточно больших по норме χ е К будет otQx + ζ0 2> χΨ В противном случае нашелся бы элемент λ'0 е К такой, что ocQx0 + z0 £> х0. Но тогда ο>ζ)τχ0 > тх0 при достаточно больших τ > 0 и теорема 5.1 дает противоречие ap(Q) > 1. Таким образом, снова А (х) > х, но теперь для достаточно больших по норме χ е К. о 119
В приведенных выше рассуждениях желаемое противоречие мы получали с помощью теоремы 5.1 об оценке снизу спектрального радиуса линейного оператора. Аналогичными рассуждениями, опирающимися на теорему 5.2 об оценке спектрального радиуса сверху, легко устанавливается справедливость следующих результатов: Пусть f(s, и) > уи при всех jefiw достаточно малых и > О, причем yp(Q) > 1. Тогда ind(/l, Θ) =0.D Пусть f(s, и) > у и - £ при всех s е Ωμ при всех и > О, причем £ > 0, yp(Q) > 1. Тогда ind04, «) =0.0 Комбинируя приведенные выше утверждения и используя теорему 3.8, можно получить две различные по характеру теоремы (соответствующие ситуациям сжатия и растяжения конуса), которые гарантируют существование нулевого решения уравнения χ = А (х). Их формулировку предоставляем читателю. Отказ от предположения о строгой положительности Q (t, s) усложняет задачу, особенно в том случае, когда необходимо установить равенство индекса нулю. И лишь в случае f(s, и) < <хи, ар(0 < 1 «► ind (Л, θ) « 1 прежняя схема рассуждений работает без изменений. Итак, пусть Q(t, s) > 0. Предположим, что линейный оператор Q* = / Q(s,t) X ω Χ χ (s) ds имеет собственный вектор h 0 е К, II h 0 И = 1, которому отвечает собственное значение λ0 > 0, и Л0 (Г) > к max Q(s, t), ί£Ω, κ> 0. (6.9) ί6Ω Пусть f(s, и) > у и - £ при всех и > 0 и s е Ω, причем у\0 > 1, £ > 0. Покажем, 4ToindC4,«>) =0. Установим положительную гомотопность на бесконечности операторов А и yQ. Положительной гомотопией может служить Н(х, т) = τ А (х) + (1 - г) yQx. В доказательстве нуждается свойство невырожденности. Пусть χ = Я (х, г), т.е. *(0 = / <2С J) { rf [s, *(*)] + (1 - т)7*« } Λ. (6.10) Ω Умножая (6.10) на h 0 (0 и интегрируя по Ω, а также используя неравенство f{syu) > уи - £, получаем / x(t) h0 (t)Λ > τλ0 / χ(ί) Α0 (ΟΛ - £λ0 mes Ω, Ω Ω откуда £λ0 mes Ω / *(f) h0(t)dt< . Ω 7λ0 - 1 С другой стороны, обозначая г/ [s, x(s) ] + (1 - τ) 7*($) через ζ (s) и используя (6.9), имеем / x(t)h0(t)dt = J / Q(t)s)z(s)h0(t)dsdt = X0 / z(*)A0(i)cfr > Ω Ω Ω Ω >λ0κ f z(s) max £(ί, j)& > λ0 к II / 0(ί,s) z{s)ds II = λαχ II χ II. Ω ίθΩ Ω Таким образом, получаем оценку £ηιβ8Ω И χ || < . κ iy\ - 1) Следовательно, при достаточно больших по норме ХЕ: К гомотопия Н{х, т) невырождена, и А гомотопен у Q. 120
Остается доказать равенство ind (yQ, °°) = 0. Оно вытекает из того, что положительное векторное поле yQx выпускает направление h 0. В предположении противного нашлись бы элемент χ е К и константа μ > 0 такие, что xV)-У / β(*,ί)*(ϊ)Λ = μΜ'). Ω Но тогда легко приходим к противоречию: μ / hi (t)dt = (1 - у\0) / xit)h(t)dt < 0. Ω Ω Этим доказательство завершается. Комментарии и задачи По рассматриваемым в главе математическим вопросам дополнительную информацию можно получить в книгах [23,50]. § 2. Начало развитию теории полуупорядоченных пространств положил Л.В. Канторович (Матем. сб., 44, № 2, 1937). Серьезный вклад в теорию внес Г. Биркгоф [4]. История вопроса кратко изложена в предисловии к монографии [14]. Наиболее продуктивная аксиоматика с точки зрения нелинейного анализа была разработана и изучена М.Г. Крейном (см. [28]). Многие важные и широко используемые в настоящее время понятия конусов были введены в [23]. § 3. Понятие вращения положительного векторного поля [25] по существу является частным случаем двух понятий: относительного вращения и полного индекса Лере, - которые независимо вводились Н.В. Марченко, Ю.Г. Борисовичем и другими авторами. Техника вычисления вращения положительного поля развита в работах М.А. Красносельского, П.П. Забрейко, Э. Мухамадиева, Ю.В. Покорного, Т. Сабирова и др. Чаще всего в практических задачах используются теоремы М.А. Красносельского о сжатии и растяжении конуса. Любопытно, что первоначальное доказательство "о растяжении" было довольно длинным и технически сложным. Впоследствии П.П. Забрейко изобрел "процедуру выворачивания конуса наизнанку", которая буквально в две строчки позволяет сводить теорему о растяжении к теореме о сжатии. Здесь эта процедура используется при доказательстве теоремы 3.8. Избранная схема изложения (см. [53, 54]) несмотря на ограниченную степень общности, оказывается достаточной для большинства приложений и имеет преимущества в простоте и наглядности. Полезной задачей для самостоятельной работы может быть построение теории вращения многозначных положительных полей. Нельзя сказать, что такая работа выглядит многообещающе, но она выходит за рамки простого упражнения и отвечает потребностям практики. Общие прикидки создают впечатление, что подобная работа может развиваться по стандартным схемам, минуя затруднения, но это, конечно, не исключает возможность удачи в смысле обнаружения нетривиальных препятствий. Рассчитывать на успех можно лишь в том случае, если исследование будет опираться на просмотр большого количества примеров и прикладных задач, что поможет выбрать правильную ориентацию определений и результатов. § 4. По АГ-отображениям пока имеется единственная работа [46], результаты которой здесь полностью воспроизведены. В рассматриваемой области есть "нетронутое" поле деятельности. Во-первых, возможность построения теории вращения ^-отображений отмечалась, но такая работа никем пока детально не была проведена. Во-вторых, по-видимому, есть возможности для поиска более эффективных способов вычисления АГ-индексов. В частности, было бы полезно ослабить (фигурирующее во многих теоремах) требование в не диагональной отрицательности отображения. Это касается обобщений. Богатые возможности имеются видимо и в специализации. Например, было бы интересно изучить АГ-отображенгя F, производная которых F' (х) при любом χ также является ^-отображением. Кстати, подобные исследования в частном случае 121
внедиагонально убывающих отображений проводились по разным поводам (см., например, [51]). § 5. Линейные положительные операторы изучались на протяжении длительного времени многими авторами. Громадное количество наименований насчитывает библиография по теории положительных матриц. Работ по линейным положительным операторам существенно меньше - и они в основном разбросаны по журналам. По затронутым в параграфе вопросам можно обратиться к статьям [28, 63-65] см. также [14,48]). § 6. Более детальную информацию по поводу бесконечномерных задач, сводящихся к изучению нелинейных интегральных уравнений с положительными операторами, можно получить в книгах [23, 50]. Эллиптический оператор L характеризуется положительной определенностью матрицы [я,·/ (f) ]. Более точно условиями: а0 (г) > 0 и при любых £ t,.. .,£т и г € Ω Σ *//(')£/$/> «Σ £?, κ>0. ι, i i В данном контексте источник интереса к краевым задачам с эллиптическим оператором определяется тем фактом, что эллиптичность L обеспечивает положительность L'1. Эллиптический оператор сохраняет "конусные" свойства и при более общих граничных условиях вида θ* (О tt(Ox(0 + p(f) =0, te Г, bv где ν обозначает нормаль к границе (см. [50]).
ГЛАВА IV ГЕТЕРОТОННЫЕ СИСТЕМЫ Первое знакомство с реальными системами обычно порождает впечатление чрезвычайной сложности их внутреннего устройства. В то же время исторический опыт развития науки показывает, что в конечном итоге всегда обнаруживаются простые закономерности, свойства и точки опоры, которые за внешней сложностью позволяют разглядеть ясную и прозрачную картину. Одним из таких свойств, которое часто помогает резко упростить анализ поведения системы, является монотонность (однотипность межэлементных взаимодействий). Системы, обладающие свойством монотонности, далее называются гомогенными (однородными) и рассматриваются в § 1. Это однако довольно узкий класс систем. При обсуждении конкретных примеров в главе I неоднократно возникало более сложное свойство обобщенной монотонности (присущее многим реальным системам), которое и является далее основным предметом изучения. § 1. Гомогенные системы Определения многих разновидностей операторов, действующих в полуупорядоченном пространстве, так или иначе связаны со свойством монотонности. Если из х, у Ε МС Ε (х>у) следует Т(х) > Т(у), говорят, что оператор Τ монотонен на множестве М. В случае, когда отсутствие упоминания о множестве Μ не может вызвать недоразумений, оператор Τ называют просто монотонным. Оператор Т, обладающий свойством: χ > у влечет за собой Т(х) < Τ(у), будем называть антимонотонным. Иногда монотонный и антимонотонный операторы называют соответственно изотопным и антитонным. Наконец, Τ называют оператором монотонного типа, если Т(х) > > Т(у) влечет за собой х>у. Систему будем называть гомогенной, если ее оператор межэлементных связей F (х) — монотонный. Приведем несколько примеров гомогенных систем. Обратимся для этого к примерам из гл. I. Рыночная модель будет гомогенной системой в случае валовой заменимости товаров, рассматривавшаяся модель массового обслуживания - в случае, когда каждая группа Kj состоит из единственного элемента, модель межотраслевого баланса - практически в самых общих предположениях, поскольку оператор, затрат Р(х), как правило, считается монотонным (затраты растут с ростом выпусков). В игровой интерпретации, когда каждая стратегия х( имеет характер усилия /-го игрока, гомогенность означает, что каждому игроку для поддержания оптимума своего выигрыша приходится отвечать увеличением 123
собственного усилия на увеличение усилий остальных игроков. С интуитивной точки зрения такое положение вещей представляется вполне естественным. Упражнение 1.1. Покажите, что игра с функциями выигрышей Di{x) = Xi\ri-\xi где все г ι > О, R > 0, является гомогенной системой. Если оператор межэлементных связей антимонотонный, систему будем называть отрицательно гомогенной. Рыночная модель будет отрицательно гомогенной системой в случае валовой дополнительности товаров, модель сосуществования биологических видов — в случае отсутствия в системе отношений типа "хищник—жертва". Изучение отрицательно гомогенных систем будет отложено до следующего параграфа. Пока же отметим, что как гомогенные, так и отрицательно гомогенные системы характеризуются качественной однотипностью (одинаковостью) межэлементных взаимодействий. Рассматриваемые далее вопросы относятся к изучению положений равновесия, определяемых неподвижными точками оператора F, 1,1. Принцип Биркгофа-Тарского. Если для монотонного оператора F выполняются условия v<w, F(v)>v, F(w)<-w, то легко видеть, что оператор F оставляет инвариантным конусный отрезок (υ, w > . Действительно, в этом случае υ <χ< wвлечет за собой и < F(v) < F(x) < F(w) < w. Теорема 1.1. Пусть конус К сильно миниэдрален. Тогда любой монотонный оператор F (не обязательно непрерывный), оставляющий инвариантным конусный отрезок (v, w > , имеет на (υ,\ν) по крайней мере одну неподвижную точку. Доказательство. Обозначим через Ω множество тех элементов χ G < υ, w. >, которые "идут вперед", т.е. F(x) > χ. Очевидно, Ω не пусто, так как заведомо F(v) > υ. Покажем теперь, что ζ - sup Ω является неподвижной точкой оператора F. Для любого χ £ Ω имеем F(ζ) >F (χ) >χ9 т.е. F(ζ) - одна из верхних границ Ω. Поэтому F(z)>z , что влечет за собой ζ G Ω. С другой стороны, F(F(z))>F(z), что дает F(z) £ Ω, но тогда F(z) <z. Два противоположных неравенства дают F (ζ) =ζ. Π Это один из уникальных результатов, гарантирующих существование неподвижной ч точки у разрывного оператора. Теорема 1.1 многократно обобщалась и модернизировалась. Наиболее общий принцип, полученный на этом пути, излагается в следующем разделе. 124
1.2. Общий принцип. Монотонный оператор F называется предельно монотонно компактным на ограниченном множестве Μ С Е, если сходится каждая последовательность элементов x0^F(x1)<F2(x2)<^<Fn(xn)<...i (1.1) где все хп £ Λ/. Теорема 1.2. Пусть предельно монотонно компактный оператор F отображает в себя ограниченное замкнутое множество МС Ε (F (Μ) С Μ) и F(xq) > Xq для некоторой точки х0 Ξ Μ. Тогда F на Μ имеет по крайней мере одну неподвижную точку. Доказательство. Пусть, как и прежде, Ω обозначает множество тех элементов χ Ε Μ , которые "идут вперед", т.е. F(x) >x. Множество Ω не пусто в силу F(xQ)>x0. Теорема будет доказана, если мы установим существование на Пхотя бы одного максимального элемента, т.е. такого элемента jc* £ Ω, что х>х* для любого jc Ξ Ω,«, jc Φ jc*. (Обратите внимание, что в случае сильно мини- эдрального конуса понятие максимального элемента отличается от понятия ζ = sup Ω.) Действительно, если такой элемент jc* Ε Ω существует, то F (jc* ) Ε Ω в силу F (F (jc* ) ) > F (x* ), но тогда из максимальности jc* вытекает F (χ*) =χ*. Покажем, что максимальный элемент jc* Ε Ω существует. Пусть хп — произвольная монотонно возрастающая последовательность, все элементы которой хп Ε Ω. Последовательности хп сопоставим последовательность Fn(xn)> которая удовлетворяет цепочке неравенств (1.1), сходится, Fn(xn) ~*z > и мажорирует {*„} в силу Fn(xn) > хп. Наконец, ζ е Ω, что вытекает из предельного перехода в неравенстве F(z) > F"*1 (jc„). Перечисленные свойства обеспечивают таким образом существование верхней грани в Ω у любой монотонно возрастающей последовательности хп Ε Ω. Для завершения доказательства остается сослаться на лемму Цорна *). Π Несмотря на то, что свойство предельной монотонной компактности выглядит несколько неуклюже, оно достаточно удобно, легко проверяется и охватывает широкие классы нелинейных операторов. Упражнение 1.2. Проверьте, что оператор F предельно монотонно компактен в любой из следующих ситуаций: 1) Пространство (в котором действует F) конечномерно. 2) Конус К вполне правилен, оператор F ограничен на Μ по норме. 3) Конус К правилен, оператор F преобразует ограниченное множество Μ в себя, 4) Оператор F (или некоторая его степень) компактен. Упражнение 1.3. Укажите пример монотонного оператора, действующего в R", который отображает в себя ограниченное замкнутое выпуклое множество Μ и не имеет в Μ неподвижных точек. Следующие два упражнения относятся к вопросу о разрешимости уравнения F{x) = G{x) (1.2) с монотонным (вообще говоря, разрывным) оператором F и произвольным непрерывным оператором G (В предыдущих теоремах по существу G(x) == χ.) В скаляр- *) Лемма Цорна утверждает следующее. Если всякая цепь в частично упорядоченном множестве Ω имеет верхнюю грань, то в Ω существует хотя бы один максимальный элемент. Легко проверить, что всякая цепь имеет верхнюю грань в Ω, если верхнюю грань в Ω имеет любая монотонно возрастающая последовательность. 125
ном случае геометрически очевидно, что уравнение (1.2) имеет решение на <υ, w > = =[υ, w J, если F(u)^G(u), F(w)<G(w). (1.3) В общем случае требуются дополнительные предположения. Упражнение 1.4. Пусть выполняются неравенства (1.3) и для любого ζ е <υ, w.) такого, что F(ζ) « G(z), существует такой элемент у е <и, w.>, >».< ζ, что F(z) = G(j>). Тогда уравнение (1.2) имеет по крайней мере одно решение х*е <υ, νν·>. Упражнение 1.5. Пусть конус К вполне правилен, выполняются неравенства (1.3) и из υ<ζχ <ζ2 «w, GivXGiz^^u <G(z2)<G(w) следует существование элемента у Ε. (ζ 19 ζ2> такого, что G(y) =//. Тогда уравнение (1.2) имеет по крайней мере одно решение. 1.3. Итерационные процессы. В этом разделе везде предполагается, что монотонный оператор F имеет инвариантный конусный отрезок (υ, w >. Рассмотрим последовательные итерации *я+1 =F(Xn), « = 0,1,... (1.4) Если х0 = у , то F (х0) >х0 в силу инвариантности (и, w >. Применяя к последнему неравенству монотонный оператор F, получим F№o))>F(x0), т.е. х2 > Χι. Продолжая этот процесс индуктивно, приходим к цепочке неравенств x0<F(x0)<F2(x0)<...<Fn(x0)<... (1.5) Если последовательность (1.5) сходится и оператор F непрерывен, то в (1.4) можно перейти к пределу и сделать таким образом вывод о существовании неподвижной точки ν * и о сходамости к ней последовательных приближений (1.4). Вывод о сходимости (1.5) может базироваться на разных предположениях. Например, если конус К правилен, то Fn(xv) автоматически сходится, поскольку последовательность Fn(x0) ограничена по конусу (Fn(x0) < w). Если конус анормален, то для сходимости (1.5) достаточна полная непрерывность оператора F. Те же рассуждения можно провести для процесса (1.4), начинающегося в точке х0 - w. Разница будет лишь в том, что последовательность Fn(x0) получится монотонно убывающей и будет сходиться к, вообще говоря, другой неподвижной точке w* оператора F. При этом очевидно, что для любой неподвижной точки х* £ <u,w> оператора F справедливы неравенства v*<x*<w*. (1.6) Если же заранее известно, что неподвижная точка х* £ < υ, w > единственна, то обе последовательности Fn(v) и Fn(w) будут сходиться к одному и тому же пределу х*. Отсюда можно сделать вывод о сходимости процедуры (1.4) к х* из любой начальной точки x0G(o, w ). Действительно, из ν < х0 < w 126
и монотонности F вытекает F(v) < F(x0) < w, что при индуктивном продолжении дает Fn(u) < Fn(x) < Fn(w) при любом η = О, 1, ... Но так как крайние последовательности сходятся к одному и тому же пределу х*9 то и Fn(x0) -*x*. Суммируем сказанное в отдельном утверждении. Теорема 1.3. Пусть монотонный оператор F имеет инвариантный конусный отрезок < υ, νν. > и выполняется одно из двух условий: 1) конус К правилен, оператор F непрерывен; 2) конус К нормален, оператор F вполне непрерывен. Тогда последовательные итерации (1.4) сходятся к ν *при χ0=υ и к w* при Хо = w. Точки υ* и w* являются неподвижными точками оператора F, причем, если х* G < υ, w > - любая другая неподвижная точка F, то выполняются неравенства (1.6). Если же заранее известно, что неподвижная точка х* Ε < υ, w > единственна, то (1.4) сходится к х* из любой начальной точки х0 Ε(υ, νν >. Π При использовании (1.4) в качестве вычислительного алгоритма даже в случае единственной неподвижной точки х* полезно параллельно вычислять как Fn(v), так и F"(w),-4to в силу монотонной сходимости дает одновременно оценки решения снизу и сверху. 1.4. Пример. Рассмотрим модель межотраслевого баланса с монотонным оператором затрат Ρ (χ) (считаем, что полуупорядоченность введена с помощью R"), удовлетворяющим естественному предположению Р(0) = 0. Теорема 1.4. Пусть реализуем некоторый набор чистых выпусков у0 > 0. Тогда любой набор чистых выпусков у G (0}>у0> также реализуем. (Другими словами, если набор у > 0 можно реализовать с избытком, то его можно реализовать точно,) . Для доказательства достаточно заметить, что монотонный оператор Р(х) + у отображает в себя конусный отрезок < 0, х° >, где л:0 -Р {х°) +у°, и сослаться на теорему 1.1. Q Если бы оператор Ρ (χ) был непрерывен, можно было бы обойтись без принципа Биркгофа-Тарского, сославшись на теорему Брауэра. Наличие разрывов у Ρ (χ) может быть связано с изменением способов производства (при изменении х). § 2. Гетеротонные системы В главе I при рассмотрении конкретных примеров неоднократно отмечалось, что операторы F(x) межэлементных связей (или другие операторы, так или иначе описывающие устройство системы) часто обладают свойством обобщенной монотонности: каждая компонента fi(x) по каждой в отдельности координате Xj или возрастает, или убывает. При построении теории таких операторов (систем) оказывается, что без потерь в результатах можно сразу начинать с более общего класса операторов — гетеротонных. Оператор 71, действующий в банаховом пространстве Ε полуупорядочен- Ном конусом К, называется гетеротонным, если он допускает диагональное 127
представление Т(х) — Т(х, х), причем сопутствующий оператор Гопреде- л лен на Ε Χ Ε и Τ(υ, w) монотонно возрастает по υ и убывает по νν. Могут рассматриваться также операторы, гетеротонные на некотором множестве Μ СЕ. В этом случае подразумевается, что участвующие в определении гете- ротонного оператора элементы х, v, w принадлежат Μ. Аналогичное замечание уместно также по отношению к определениям монотонного и антимонотонного операторов. Легко понять, что выбор сопутствующего оператора Τ (υ, w) всегда неоднозначен, и при решении конкретных задач из этой свободы выбора можно извлекать определенные выгоды. Тем не менее, когда речь идет о гетеротонном операторе Т, всегда подразумевается, что сопутствующий ему оператор Гуже конкретно указан (фиксирован). Монотонный и антимонотонный операторы являются частными случаями гетеротонного. Для монотонного оператора Τ в качестве сопутствующего можно указать Τ(υ, w) = Τ(υ), для антимонотонного - Τ(υ, w) =ξ T(w). Именно эти операторы в монотонном и антимонотонном случаях подразумеваются под сопутствующими (конечно, если не оговорено противное). Теорема 2.1. Сумма и композиция (произведение) гетеротонных операторов являются гетеротонными операторами. Доказательство тривиально. Пусть Тх и Т2 — гетеротонные операторы, которым сопутствуют соответственно Тх и t2. Тогда для суммы Тх + Т2 сопутствующим оператором будет Τχ (υ, νν) + Т2 (ν, w)9 для композиции ТХТ2 - Τχ[Τ2(υ,\»\ Τ2(\ν,υ)]. Π Конусный отрезок < υ 0, νν0 > назовем сильно инвариантным для гетеротонного оператора Г, если Τ(υ0, \ν0)>υ0, T(w0, υ0)<\ν0. Очевидно, из сильной инвариантности (υ 0, νν0 > следует его обычная инвариантность для Т. Действительно, пусть χ Ε (υ0, w0>; тогда v0 «ΤΧυ0, w0)« T(x, x) = T(x)< f(w0, υ0)<\ν0. В последующем изложении существенную роль играет следующее условие: а) система уравнений f(v,w) = v, T(w, u) = w (2.1) на множестве 3RC Ε не имеет решений таких, что υ Φ w. Отметим, наконец, что введение в множестве пар элементов (υ, νν) нормы || (υ, w) || E x E = || υ || + || w || делает Ε Χ Ε банаховым пространством и позволяет говорить о непрерывности и полной непрерывности отображения Т: ЕХЕ-+Ё. Теорема 2.2. Пусть конусный отрезок (v0, w0) является сильно инвариантным для гетеротонного оператора Тина (υ0,\ν0) выполнено условие а). Пусть, кроме того, выполнено хотя бы одно из следующих условий: 128
1) Конус К правилен, оператор Τ непрерывен. 2) Конус К нормален, оператор Τ вполне непрерывен. 3) Конус К сильно миниэдрален. Тогда у оператора Τ существует неподвижная точка χ* £ <u0.»wo)· Доказательство. Рассмотрим оператор Τ: ΕΧΕ ->£ X Ε, который паре элементов (υ, w) сопоставляет пару (Г(υ, w), T(\v, υ). Легко видеть, что из непрерывности (полной непрерывности) оператора Τ следует непрерывность (полная непрерывность) оператора Т. Введем далее полуупорядоченность в Ε Χ Ε по правилу: (v\w') > > (ν, w), если υ ' > υ, \ν' « w. Можно считать, что полуупорядоченность, определяемая знаком >, вводится при помощи конуса А> {(у, νν): υ(=Κ, -w G К}. При этом очевидно, что правильность, нормальность, сильная миниэдраль- ность конуса К влекут за собой наличие соответствующих свойств у контура К. Завершается доказательство теперь весьма просто. Очевидно, из (υ ', w') > (υ, w) следует Τ(υ ', w') > Τ(υ, w), т.е. оператор Г является монотонным. Кроме того, Г оставляет инвариантным конусный отрезок <(и0, w0), (wo, у0) >=№ w): (y0,w0) ■< (ν, w) < (w0, v0)). Теперь из теорем о существовании неподвижной точки у монотонного оператора следует, что в наших предположениях Τ имеет неподвижную точку (v*tw*), которая, очевидно, является решением системы уравнений (2.1). В силу условия a) v* = w*. Следовательно, оператор Г имеет неподвижную точку х* = υ * = w *. Π Список условий 1) — 3) может быть продолжен. В него можно включить практически любое условие, которое обеспечивает существование неподвижной точки у монотонного оператора, имеющего инвариантный конусный отрезок. Если выполняется условие 2), требование справедливости а) в теореме излишне. Сильная инвариантность (υ0, w0> влечет за собой обычную инвариантность (υо, н'ю> для Т, поэтому в случае 2) существование неподвижной точки у Τ следует из принципа Шаудера. Перейдем к изучению сходимости итерационных процессов вида jc„+1 = = Т(хп), где Τ - гетеротонный оператор. Здесь оказывается удобно рассматривать вспомогательный итерационный процесс u„ + i = rfo|t н'й), η·#ι + ι = f(w„, υ„), (2.2) начинающийся в точке (и0,н'0). Лемма 2.1. Пусть конусный отрезок < υ 0, w0 > является сильно инвариантным для гетеротонного оператора Τ и выполнено хотя бы одно из следующих условий: 1) Конус К правилен. 2) Конус К нормален, оператор t вполне непрерывен. Тогда итерационный процесс (2.2) сходится, т.е. ν„-*υ *, wn -> и» *, причем ν0 «... «ι>„ «... «u* «w* «... «νν„ «... «н'0. 129
Кроме того, если у0 G < υ 0, w0 >; z0€(vOtw0) и Уп + 1=Т(Уп.гп)> ζη + ι =Т(2п,Уп)> (2.3) то при любом η > 0 имеют место неравенства Vn<yn<wn, vn<zn<wn. Для доказательства достаточно переформулировать предположения и выводы леммы в терминах отображения Τ и полуупорядоченности > (см. доказательство теоремы 2.2), после чего воспользоваться теоремой о сходимости последовательных итераций для монотонного оператора к "наименьшему" и "наибольшему" решениям, π Полагая в (2.3) у0 = z0 = jc Ε <ι>0, w0>, приходим к следующему результату. Следствие. Пусть выполнены предположения леммы 2.1. Тогда 1) для любого x£<i>0, w0> и любого п> О ϋ„<Γ"(*)«4;„, (2.4) 2) если Г «а < ν о, w0> гшеег неподвижную точку х*, то ν * < jc* < w *. Теорема 2.3. Дусгь выполнены предположения леммы 2.1. Кроме того у пусть оператор Τ непрерывен и на (v0, w0> справедливо условие а). 7Ъгдя ^ Τ на (νо, w0> существует и единственна неподвижная точка х*, к которой сходятся последовательные итерации Тп(х) независимо от χΕ <ι>0, νν0>. Л Доказательство. Из непрерывности Τ вытекает, что пара (υ *, w *) является неподвижной точкой оператора Τ (другими словами, решением системы уравнений (2.1)). В этом случае предположение о спра- vBeOTHBOcra а) исключает возможность ν * Φ νν *. Тогда χ* = υ * = \ν * является неподвижной точкой оператора Τ и из υη -*х*, wn -»х* и (2.4) следует Тп(х) -+х*. В свою очередь сходимость Тп{х) -»х* для любого х€ < v0, w0 > исключает возможность существования неподвижной точки, отличной от х*, поэтому χ * единственна. D Рассмотрим несколько примеров гетеротонных операторов. Оператор F называется гетерогенным, если каждая его компонента /,(хь ..., хт) по каждой в отдельности переменной х;- или монотонно возрастает (не убывает) , или монотонно убывает (не возрастает). Любой гетерогенный опера- тор является гетеротонным. Действительно, для получения сопутствующего оператора достаточно под знаком каждой функции ft переменные xj, по которым // возрастает, заменить на υ j, а переменные xk, по которым /,· убывает, заменить на wk. Для удобства формальной записи с каждой компонентой ft (x) свяжем подмножество индексов G^: GiCN = {i: /=l,...,w} такое, что / £ G/, если //(χ) монотонно возрастает (не обязательно строго) по Xj. В силу сказанного выше любая компонента // (х) монотонно убывает по X/, если / £ Ht = N\ G,·. Свяжем далее с каждой функцией fi(x) пару матриц i>/ = [pjk] и Qi = / - Р{9 где / - единичная матрица, pj. = 1,если / EG.,остальные р). = 0. 130
Теперь сопутствующий оператор F можно записать так: F(v> w)={/i(u, w), ...,/mO, w)}, где fi(v, w) =fi(PiV + Qjw), i = 1,..., m. Введенные обозначения нужны не столько для записи сопутствующего оператора, сколько для удобства работы с последним. С самого начала важно уяснить, что за этими обозначениями стоит совсем простая идея. Пусть, например, оператор F указанного выше типа действует в R4 и его первая компонента /i (хи х2, х$> *а) монотонно возрастает по Χι и х3 и убывает по х2 их4. Тогда первой компонентой сопутствующего оператора будет/ι (у, w.) =/ιΟι, νν2,ϋ3, w4). В общем случае выбор сопутствующего оператора для гетеротонного требует определенной изобретательности. Укажем один довольно общий прием, суть которого легче всего пояснить на простом примере. Рассмотрим определенный на int R + оператор F с компонентами юрсТ1 Ιχ\ +χ2' ιοίχΓ AM-arctg*! +V— , /2(*)=VT7^+V —· (2.5) Здесь нельзя сказать, что функции /ь/2 обобщенно монотонны. Тем не менее идея построения сопутствующего оператора может быть оставлена прежней. Каждое конкретное Xj (из тех Xj, которые неоднократно повторяются в записи функций /f (/ = 1,2)) заменяем на υ β или w;· в зависимости от того, возрастает или убывает функция // по этому конкретному аргументу (но не вообще по Χβ ). Такое построение приводит к сопутствующему оператору г с компонентами л ιο/δΓ Л /ϋι +iV io/ΊΓΓ Λ(ϋς w^arctguj + V — , /2(u,w)=VtT +V — , (2-6) Использованный выше способ построения сопутствующего оператора оказывается работоспособным во многих практических случаях. Его возможности расширяют некоторые специальные приемы, которые позволяют приводить изучаемый оператор к виду, удобному для применения описанного метода (в тех случаях, когда исходный вид оператора не допускает его непосредственного использования). Укажем один из таких приемов, сущность которого проявляется уже в одномерном случае. Пусть пространство R = (-00,00) полуупорядочено конусом [0, °°) и на сегменте [0, π] задана функция f(x) = sin*. Введем в рассмотрение две функции φ ι (χ) и φ 2 (х). Функция φχ (χ) на [0, π/2] совпадает с f(x), а на [я/2, π] тождественно равна единице. Функция φ2 (χ) = 1 на [0, π/2] и совпадает с f{x) на [π/2, π]. Очевидно, f(x) p min^ (χ), φ2 (χ)}. Теперь тот же прием приводит к сопутствующей функции л f(v, w) = minify), φ2(\ν)}. 131
Заметим, что в одномерном случае любая функция с ограниченной вариацией гетеротонна, так как представима в виде суммы монотонно возрастающей и монотонно убывающей функций. Упражнение 2.1. Проанализируйте возможности одновременного использования нескольких сопутствующих операторов. Например, Тх (х, х) = Т2(х, х) =* f(x, x). Рассмотрите итерационные процессы вида 1>л+1 = ТЛ*>п> w„), wn+1 * T2(wn> υη). Упражнение 2.2. ГетеротонныЙ оператор по существу определяется так. Т(х) ξ Т(х, х), и оператор- Τ(υ9 w) монотонно возрастает по υ по конусу 1С, по w по конусу -К. Рассмотрите возможность замены в такой формулировке определения конуса -К неким другим. § 3, Единственность равновесия 3.1. Псевдовогнутые операторы. Многие разновидности операторов, действующих в пространстве с конусом, связаны с характером роста (изменения) значения оператора по отношению к тем или иным классам приращений аргумента. Наиболее важные (по широте приложений) типы операторов здесь определяются ростом значений оператора вдоль лучей, лежащих в конусе К. Положительный оператор Т: К -+ К называется вогнутым, если он w0-положителен■*) и для любых χ G К(и0) и г G (0,1) Т(тх) > тТ(х), Т(тх)ФтТ(х). (3.1) Вогнутый оператор Г называется изогнутым, если выполняется более жесткое по сравнению с (3.1) требование: для любых χ € К(и0) и г G (0,1) найдется такое η(χ9 τ) > 0, что Τ(τχ)>[1+η{χ>τ)]τΤ{χ). (3.2) Сразу нужно заметить, что введенное понятие вогнутости в корне отличается от соответствующего понятия выпуклого анализа и в этом отношении избранная терминология, возможно, не совсем удачна. Однако к настоящему времени она довольно прочно утвердилась, и едва ли целесообразно ее менять. В качестве оправдания можно отметить, что в одномерном случае положительная строго вогнутая в обычном смысле функция Мо-вогнута. Обратное, конечно, неверно. Наиболее богатым набором интересных свойств обладают монотонные Мо-вогнутые операторы. В частности, монотонные операторы в дополнительном предположении и0-вогнутости приводят к наиболее полезным для приложений выводам. Близкое по духу к вогнутости, но отличное по существу и почти столь же "работоспособное" понятие можно ввести для гетеротон- ных операторов. Положительный гетеротонный оператор Τ называется псевдовогнутым, если Т(х,у) Ε К(и0) для любых ненулевых х, у € К и для любых * ) См. § 3 предыдущей главы. 132
υ, weK(u0) и те (0,1) Τ\τυ,γ\ν) > τΓ(ϋ, w) (3.3) ив (3.3) невозможно равенство. Псевдовогнутый оператор Τ называется и0-псевдовогнутым, если для любых υ, w EK(u0) и г Ε (0, 1) можно указать такое η (υ, и>, т ) > 0, что Т\ти, jw)> [1 + η(ν, νν, τ)]τΤ(ν, w). (3.4) Замечание, Если для монотонного оператора Г используется сопутствующий Τ (υ, w) = T(v)9 то определение псевдовогнутого (м0-псевдо- вогнутого) оператора переходит в определение вогнутого (м0-вогнутого) оператора. При изучении псевдовогнутых операторов весьма эффективным является систематическое использовадое метрики Биркгофа p(xfy) = min{ct: е~ах<у<е"х}> х,у€К(и0). (3.5) Аксиомы метрики здесь проверяются без труда. Любой конусный отрезок, содержащийся в К(и0)9 является полным пространством по метрике (3.5). Из сходимости по метрике (3.5) вытекает сходимость по м0-нор- ме *) и тем более по исходной норме пространства Е. Топологии, порождаемые на К(и0) метрикой ρ и и0-нормой, совпадают. Теорема 3.1. Любой псевдовогнутый оператор Τ непрерывен на К(и0) по и0-норме. Доказательство. Утверждение теоремы вытекает из топологической эквивалентности метрики ρ и и0-нормы на К(и0) и того факта, что Τ является нерастягивающим на К(и0) по метрике р. Последний устанавливается весьма просто. Используя очевидные неравенства χ <?ер(х§ у)у, у < ер^х* у} χ и псевдовогнутость Т9 получаем Т(х) = Т(х, х)> Т{е-р(х> у)у, ер{х> у^у)>е'р^ у)Т(у). Аналогично, ГО0в Т(У>У)> Т{е~р{х' у)х> ер{х' у)х)>е~р<<х> у)Т(х). Следовательно, р[Дх), Τ (у)] <р(х,у). Π В тех случаях, когда и0 -норма совпадает с исходной нормой пространства Ε или по крайней мере эквивалентна ей, псевдовогнутый оператор Τ будет непрерывным по исходной норме. Это имеет место, например, в случае пространства С[0, 1], полуупорядоченного конусом неотрицательных функций, и выбора в качестве и0 элемента и0 (г) = 1. Иногда более удобным оказывается несколько иное определение ы0-псев« Довогнутого оператора: псевдовогнутый оператор Г называется и0-псевдовогнутым, если для любых u, w e К(ио) и любого сегмента [а, Ъ\ С (0, 1) существует η (υ, w, ar b) > 0 такое, что для любого τ 6 [a, b] имеет место *) См. § 2 предыдущей главы. 133
неравенство I > [ 1 + τ?(υ, w, a, b)]TT(v, w). (3.4) 7\TV,j:wj. Аналогичная ситуация имеет место и в частном случае монотонных и 0-вогнутых операторов, где, по мере надобности, обычно используется то или иное определение. При этом следует отметить, что первое (исходное) определение представляется менее ограничительным (оно немедленно вытекает из второго) и более удобным с точки зрения практической проверки. Второе же определение делает эффективными некоторые способы доказательства, которые при непосредственном использовании первого просто не работают. Тем не менее, как показывает следующая теорема, дилеммы выбора определения здесь не существует. Т-еорема 3.2. Оба определения и0-псевдовогнутого оператора эквивалентны. То, что оператор, и0 -псевдовогнутый в смысле второго определения, м0-псевдо- вогнут в смысле первого, очевидно. Обратная импликация немедленно следует из приводимого ниже вспомогательного утверждения. Лемма 3.1. При любых фиксированных υ, w.e К(и9) функция η (v, w, τ) >0, удовлетворяющая неравенству (3.4) >.может быть выбрана непрерывной по т. Справедливость леммы 3.1 будет установлена далее. Лемма 3.2. Пусть оператор Τ псевдовогнут. Тогда для любых х9у е К(и0) и любого τ G (0, 1) выполняется неравенство Т[тх,ту)<*±Т{х,уХ . (3.6) Неравенство (3.6) получается из (3.2) с помощью замены τ υ = х9 1/тн> - уш О Лемма 3.3. Пусть оператор Τ псевдовогнут и min(a, β). G (0, 1). Тогда для любых υ, w.G K{uQ) имеют место неравенства Γ\αυ. 1 wj > ηύη(α,β)Τ(ν, w), 1 min(a,0) -T(v,w). Доказательство. Рассмотрим два взаимоисключающих случая: 1) α <0, тогда Τ\αυ, — wj>^<*u, — wjb>aT(v, w) = τηίη(θί,β)Τ(υ, w); 2) a > β, тогда TUxv, -~w\> Τ\βν, -:\ν)>βΤ(υ, w) = min(a,0)74u, w). Справедливость второго неравенства устанавливается аналогично (на основе использования леммы 3.2). D В дальнейшем нам потребуются также аналоги лемм 3.2, 3.3 для м0-псевдовогнутых операторов. Их формулировка и доказательство очевидны и поэтому не приводятся. В теореме 3.1 была доказана непрерывность Г на К(и0) по и0-норме. Установим более общий результат. Для этого введем в множестве пар элементов (и, w.) e 134
еАГ(ы0) XK(uQ) метрику f>[(v, w), (ι/, w')] -max{p(u, ι/), p(w, w')}. Заметим, что топология, порождаемая метрикой ?, совпадает с топологией, порождаемой в множестве К(м0) X К(и0) нормой || (и, vv)||*o=max{||u|lWo, II wll^}. Л Теперь можно говорить о непрерывности сопутствующего оператора Т: К(и0) X ХК(и0) -+К(и0) по м0-норме. Теорема 3.3. Если оператор Τ псевдовогнут, то сопутствующий ему оператор Т: К (и0) ХК (и0) -*К (м0) непрерывен по и0-норме. Доказательство. Рассмотрим две пары элементов (υ, w), (υ, w') из К (м0) ХК (м0). Используя определенные метрики р, псевдовогнутость Г и лемму 3.3, получаем T(v, w) > Τ{β-ρ{υ>υ,)υ\ ер (w> w'> w') > > exp { - max [ρ (υ, υ'), Ρ (w, w')]} 7V> w') = <Г?1 <»> "'>'(»' W>J Γ(υ', w'). Аналогично, f(v.', w')>... >e-?'(u''w')'(u'w)]f (u,w). Следовательно, ρ [Γ(υ», ГОЛ w')] < ρ[υ\ w'), (υ, w>)]. Π Доказательство леммы 3.1 теперь довольно просто. Определим значение функции η в точке (υ, w, г) равным максимальному числу, удовлетворяющему неравенству (3.3). Опираясь на теорему 3.3, нетрудно видеть, что так определенная функция η будет непрерывной по т. Более того, построенная указанным образом функция будет непрерывной не только по τ, но и по совокупности переменных (и даже равномерно непрерывной по совокупности переменных на любом ограниченном замкнутом множестве). D 3.2. Теоремы единственности. Если не входить в детали, то можно сказать, что основное достоинство псевдовогнутых операторов — единственность неподвижной точки и сходимость к ней последовательных приближений. К сожалению, этот факт нельзя отразить одной теоремой, так как возникающие вариации предположений и выводов довольно широки. Лемма 3.4. Для и^-псевдовогнутого оператора Τ условие,?) (§2) на К (и0 ) выполняется автоматически. Доказательство. Предположим противное. Пусть имеется решение системы уравнений (2.1) (v,w)такое, что и, w6 Κ(μο)9υ Ψ w.Тогда и» Щ w)>t(e-p (v' w) w, ep (v' w)v) >(1 +f?) e~p ("' w) t(w, u) = = [l+i?(w,u, е-^.">)]е-р0л w) w, w = . .. >[1 + τ? (υ, w, e'p(v'w))] e"p(*w)u, что противоречит определению метрики р. Лемма доказана. D Совершенно аналогично доказывается Лемма 3.5. и0-псевдовогнутый оператор не может иметь на К (ы0) более одной неподвижной точки. О Объединение лемм 3.4, 3.5 с утверждениями § 2 приводит к ряду новых результатов. 135
Теорема 3.4. Пусть и0-псевдовогнутый оператор Τ имеет сильно инвариантный конусный отрезок <и0> w0> CK(u0) и выполнено хотя бы одно из условий 1) — 3) теоремы 2.2. Тогда оператор Τ имеет единственную неподвижную точку x*GK(u0).O Теорема 3.5 Пусть и0-псевдовогнутый оператор Τ непрерывен, имеет сильно инвариантный конусный отрезок (υ0, w0> CK(u0) и выполнено хотя бы одно из условий 1), 2) леммы 2.1. Тогда оператор Τ имеет единственную неподвижную точку х* Ε К(и0), к которой сходятся последовательные итерации Тп (х) при любом χΕΚ,χΦΘ*). Доказательство. Утверждение теоремы было бы очевидно, если бы утверждалась сходимость Тп(х) -»■ х*для χ £ <υ0, w0>. Однако в случае существования у псевдовогнутого оператора Τ ненулевой неподвижной точки х* всегда можно указать сильно инвариантный конусный отрезок < 3*, w >, который содержит любую наперед заданную точку χ Ε К (м0 ). Действительно, пусть задан некоторый элемент* € К (и0). Выберем г € (0,1) 1 ~ 1 из условия тх *< χ < — χ * и положим υ = тх *, w=—jc * Сильная инвариант- т τ ность конусного отрезка легко проверяется: т/гх*, — х*\>тТ(х*,х*) = тх*, л/1 \ 1 1 т{-х*,тх*)<— Т(х*,х*) = — **. \т ' τ г Для завершения доказательства остается заметить, что в силу (3.1) первая итерация Τ (χ) переводит любую точку χΕΚ,χΦΘ в К (и0). D Приведенное выше замечание о существовании у псевдовогнутого оператора, имеющего ненулевую неподвижную точку, "сколь угодно большого" сильно инвариантного конусного отрезка подсказывает очевидный вариант переформулировки теоремы 3.5, который на основе использования нового способа доказательства может быть также значительно усилен. Теорема 3.6. Пусть и0-псевдовогнутый оператор Τ имеет ненулевую неподвижную точку x*GK. Тогда для любого χ Ε Κ, χ Φ θ последовательные итерации Тп(х) сходятся кх*по и0-норме. Доказательство. Поскольку заведомо χ * е К (м0), без ограничения общ- « 1 ности, в Τ (χ) можно считать χ е К (и0). Выберем tG (0,1) так, чтобы τ χ *< χ < —χ * τ Как уже отмечалось (см. доказательство теоремы 3.5), конусный отрезок \ является сильно инвариантным для Г. <:*Vy *) Можно рассматривать операторы Г, определенные лишь на элементах jc е К (и0). Теорема 3.5 в этом случае (а также аналогичные результаты; см. далее) остается справедливой, если утверждается сходимость Тп(х) -+х *лишь для χ е К (и0). 136
Положим υ0 = τ χ *, νν0 - — χ *и рассмотрим итерационную процедуру τ Л Л »п + 1 = Τ (υη, w„), wn + ι я Г (w„, υ„). Очевидно (см. § 2), , ϋ0 < ... < υη < ... < χ* < ... < wn < ... < w0 tjc*=u0<...<u„<...<x*<...<w„<...<w0 -—χ*. (3.7) Обозначим через ап максимальное число, для которого выполняется неравенство 1 otn х* < υη через βη - максимальное число, для которого wn< — χ*. В силу (3.7) fin 0<τ = α0 <...<α„<...<1, О<т = 0о <... < 0„ < .. . < 1, откуда следует существование пределов lim ап = a, lim 0„ = /3. Теорема будет доказана, если показать, что а = β = 1. Предположим противное, т.е. £ = min(a, β) < 1. В силу существования пределов α, β и монотонности возрастания последовательностей <*л, βη ДДЯ любого к (0 < к < О найдется такое Ν, что для всех η > TV будет О <к< minted,0„)<£<1. , (3.8) Учитывая определение чисел α„, βη и неравенство (3.8), а также используя второе определение и0-псевдовогнутого оператора (эквивалентное исходному (теорема 3.2) ) и очевидный аналог леммы 3.3 для случая «0 -псевдовогнутого оператора, получаем (η>Ν) J 1 \ ι>«+1 = Γ(υ„, νν„)>Γ(α„Λ:*, — χ* )>[1 + η (χ*, χ*, κ, £)] min (α„, βη)χ*, (3.9) \ Аж / λ/1 \ 1 ** ww + i=r(w„, ι>„Χ7Ί — χ*, α„χ* < . (3.10) \βη Ι 1+η (**,**,*, £) min(a„, 0„) Сравнивая (3.9), (3.10) с определением чисел аи, βη, приходим к неравенству min (α„ + ь βη + ι) > [ 1 + η (χ*, χ*, κ, |)1 min (α„, 0„), откуда (fc > 0) тш(алг+ъ^+^)>[1+т?(х*,д:*,к,^)] к, что противоречит предположению % < 1. α Подчеркнем, что теорема остается справедливой даже без предположения о нормальности конуса К. Если конус К нормален, то к выводам теоремы 3.6 можно присовокупить сходимость Тп(х) ->х*по исходной норме пространства Е. Псевдовогнутый оператор Τ назовем к-псевдовогнутым, если для любых υ, w Ε К (ы0) и любого τ € (0,1) имеет место неравенство tTU'7w) ι>τΤ(υ,νν), /с<Е(0, 1). (3.11) Теорема 3.8. Если оператор Τ к-псевдовогнут, то он имеет единствен- НУЮ неподвижную точку x*G К(и0), к которой сходятся по и0-норме последовательные итерации Тп(х) при любом χ Ε Ку χ Φ 0. Легко проверить, что к-псевдовогнутый оператор оказывается сжимающим по метрике Биркгофа. D 137
3.3. Признаки псевдовогнутости. Условия п^евдовогнутости операторов того или иного конкретного вида будут рассматриваться далее. Приведем пока два признака псевдовогнутости общего характера. Теорема 3.9. Пусть операторы Τλ и Т2 псевдовогнуты (и0-псевдовог- нуты, равномерно псевдовогнуты). Тогда операторы <χΤλ (α> 0), Тг + T2t Т1Т2 также псевдовогнуты (и0-псевдовогнуты, равномерно псевдовогнуты). D Доказательство элементарно. Безусловно, имеется в виду, что в определении псевдовогнутых операторов, о сумме и композиции которых идет речь, фигурирует один и тот же элемент и0. Отметим также справедливость утверждения: если оператор Тг является w0-псевдовогнутым, а Т2 - псевдовогнутым, то операторы 7\ + Т2, ТХТ2 и Т2ТХ и о -псевдовогнуты. Теорема ЗЛО.Пусть прилюбых и, w GK (ι>, νν φ Θ) существуют про- изводные Фреше Τ^(υ, w) и T„(v, w) и Φ(ν,η) = Τ(ν,η)-Τυ(ν,η)ν + Τή(ν,η)χν>θ. (3.12) Тогда оператор Τ псевдовогнут. Доказательство. Предположим противное, т.е. найдутся ненулевые точки v0,w0 ЕК и такое т0 £ (0,1), что ζ0=τ{τ0υ0, — w0 )-τ0Τ(ν0,\ν0)φκ. то Тогда существует линейный разделяющий функционал 1(х) такой, что 1(х)>0 при xGK и /(z0)<0. Введем в рассмотрение функцию ω(τ) = / — τίτυο,—wo J-r(uo,w0)jf rG(0,l]. iTb, ЧТО Легко проверить, что / άω(τ) dr (3.13) Из (3.12), определения функционала / (х) и (3.13) следует ^ω(τ)/^τ<0, 1 поэтому ω(τ0) > ω(1) = 0. С другой стороны, ω(τ0) = — ^ί^ο) < 0. Полу- 7*0 ченное противоречие завершает доказательство. Π 3.4. Отображения в Кп. В конечномерном пространстве обычно в качестве конуса выделяется неотрицательный ортант R+. В этом случае оператор ^W = {/i(*),..· >/„(*)>, действующий в R", положителен, если все его компоненты/,· (х) при χ £ £ R" неотрицательны; и 0*-положителен (и0 €= bit R+), если дополнительно все компоненты /,· (х) при Jt £ R+, χ φ 0 строго положительны; монотонен (антимонотонен), если каждая компонента f{ (хь ..., хп) по каждой переменной Xj монотонно возрастает (убывает). 138
Монотонный на R+ оператор F будет и0 -вогнут, если он, разумеется, Wo-положителен и при любых χ Ε int R", τ € (0,1), / = 1,..., η выполняются неравенства //(«)> т/,(х). (3.14) 'Обратим внимание, что в данном случае нет необходимости упоминать о функции η(χ, τ) > 0, фигурирующей в определении и0 -вогнутого оператора. Ее существование автоматически вытекает из покомпонентных строгих неравенств (3.14) при условии и0-положительности и монотонности оператора F. Если в Rn выделен не R+, а некоторый другой телесный конус К, то в определении монотонного щ-вогнутого оператора F также можно обойтись без явного использования функции t?(jc, τ), заменяя неравенства (3.14) условием F(tx)>tF(x), (3.15) где а > Ъ обозначает ситуацию а - Ь Ε int К, Аналогичные замечания можно сделать также по поводу действующих в R" гетеротонных и0-псевдовогнутых операторов. Если известно, что неравенство (3.4) выполняется лишь для υ = νν, оператор Τ называется и0 -псевдовогнутым на диагонали. Упражнение 3.1. Покажите, что для монотонных, анта монотонных и гетерогенных операторов понятая м0-псевдовогнутости и и0 -псевдовогнутости на диагонали совпадают. Упражнение 3.2. Покажите, что для м0-псевдовогнутости гладкого гетерогенного оператора F достаточно выполнения условия /f(x)- Σ |^L>0 (3.16) / = 1 I oXf \ при любых χ e int к"., / = 1, .... л и необходимо выполнение ослабленного условия (3.16), получающегося заменой знака > на > . В случае монотонного и анта монотонно го операторов условия псевдовогнутости могут интерпретироваться как ограничения на скорость роста функций /,· (х). Подобная интерпретация возможна и в общем случае. Например, для гетерогенного оператора качественные рассуждения в пользу неравенств fi(PiTX + Qi-x\ >Tfj{x) могут быть примерно такими: если в // (х) те координаты яу , по которым /,· возрастает, уменьшить в два раза, а остальные увеличить в два раза, то /,· (дс), безусловно, Уменьшится, но не более чем в два раза. Упражнение 3.3. Проверьте, что оператор (2.5) и0 -псевдовогнут. § 4. Прикладные задачи 4.1. Рыночная модель. Обратимся к рыночной модели в том виде, в котором она описана в § 1 гл." III. Теорема 4.1. Рынок с валовой заменимостью товаров имеет единственное положение равновесия. Доказательство. В указанных предположениях F(int R") С cint R^. Для любых г€ (0, 1), xGintR^ и / = 1,. ..,и fi(rx) =/7(1, тх) >/7(т, тх) = rfi(x). 139
Следовательно, монотонный оператор F (х) является вогнутым. Невозможность существования у него двух различных неподвижных точек вытекает из результатов предыдущего параграфа. D Рассмотрим теперь рынок с валовой дополнительностью товаров. Все функции £,· (jc0, x) по "чужим" переменным не возрастают, причем при i Φ О строго убьюают по х0. Теорема 4.2. Рынок с валовой дополнительностью товаров имеет единственное положение равновесия. Доказательство. Очевидно, оператор F(x) является антимонотонным, и F(int R?) С int R*l. Для любых те (0,1), xeintR? и /=1,.. . ,и Следовательно, F(x) псевдовогнут. D Чтобы доказать единственность равновесия© общем случае смешанного рынка, нам потребуются дополнительные предположения. Поясним сначала, что мы понимаем под смешанным рынком. Смешанным мы называем такой д)ынок, на котором каждая функция избыточного спроса по каждой в отдельности цене или убывает, или не возрастает (оператор F(x) в этом случае является гетерогенным). Другими словами, товары на смешанном рынке могут находиться в одном из двух возможных отношений: валовой заменимости или валовой дополнительности. Координаты вектора х, по которым gi (xo, х) возрастает, будем называть ^-переменными, по которым убывает, — β-переменными. Содержательно наше предположение будет заключаться в том, что каждая функция gt (х0, х) (/' = 1,..., п) по х0 растет гораздо быстрее, чем убывает по β-переменным. Более точно Условие R. Если *0 увеличить в о: раз (а > 1), а β-переменные функции ^. в а2 раз, то избыточный спрос g( строго возрастет. Теорема 4.3. Если справедливо R, то смешанный рынок имеет единственное положение равновесия. Доказательство вытекает из гетерогенности F(x) и справедливости для любых τΞ(0,1), x€int R", ί= 1,.. . ,л неравенств /,(р,т* +Qi -χ) = /Д Ι,Ρ,τχ + Q-x )>£(τ, τ*) = ifg(x)9 которое влечет за собой псевдовогнутость F(x). G 4.2. Сотрудничество научных организаций и предприятий. Рассмотрим систему взаимосвязанных предприятий и организаций, выделяющих ограниченные ресурсы на совместные разработки. Система состоит из двух типов элементов: организаций О, (ι = 1,..., п) и предприятий П;· Q = 1, ..., т). Каждая организация 0,- располагает ресурсом Rf9 который распределяет на сотрудничество с группой предприятий М/С{1,...,т}, Yij далее обозначает ресурс, выделяемый О,- на сотрудничество с П7. Аналогично, qtj — ресурс, выделяемый П7 на сотрудничество с О,-. 140
Сотрудничество Οχ и Π;· характеризуется функцией дохода (усеченной функцией Кобба - Дугласа) ЧцЪц* Яц) =Уцг%<1%, 0 <а < 1/3, О <β< 1/3. Целевой функцией О,- служит целевая функция П;·: Ограничения в системе: / i Если вьщеляемые ресурсы являются варьируемыми стратегиями, то равновесие по Нэшу в такой системе определяется решением системы уравнений |* -χ,-ο. ^-*-<*. *"> 8"» (4.1) Xrif=Rh Xqgf**Qj, / = l,...,/i; / = l,...,m, где λ ι, μ;· - множители Лагранжа. В рассматриваемом случае решением (4.1) служит решение системы уравнений R, //(1"а) г.·.· = — " Уц т ! */(!-«> * Т/А α r?./(,-«'· (4.2) (7,у= — —-ϋ , ι'=1,Λ..,л; / = l,...,nt. 7/; 1 «/(!.-« ^ *> Легко видеть, что в правой части (4.2) стоит гетеротонный к-псевдовогнутый оператор. Сопутствующим будет оператор с компонентами Λ, νβΚΐ-α) у9 _ 1 О/О-«) £у »V., * 7* * 7'/ т — у a/(1~fl) 141
Очевидно, ^(™'4w)=tW(1~^/(u,,v)' Поэтому оператор F(r,q) = {fq(qUv(r)} является к-псевдовогнутым, где. к = max{2/3/(1-α), 2а/(1-0)>, причем к Ε (0,1), если 0 < α, β < 1/3. Таким образом, система (4.2) на внутренности неотрицательного ортанта в Rw+m имеет единственное решение. Заметим, что все остается по-прежнему, если α и β зависят от /,/ , но остаются в тех же пределах. 4.3. Сбалансированный рост. В главе I, где рассматривалась задача сбалансированного роста итерационного процесса xk + l = F(xk), уже отмечалось, что основные вопросы здесь сводятся к исследованию собственных векторов оператора F, т.е. к изучению уравнения Xjc=F(x). (4.3) В экономических приложениях обычно принимаются следующие предположения: χ £ R", оператора непрерывен, положителен, монотонен и положительно однороден первой степени, т.е. F(px) = pF(x) (μ >0). Для простоты мы дополнительно предположим усиленную монотонность оператора/7: если х>у>0, хФу> то F(x)>F(y). Теорема АЛ. В указанных предположениях оператор F имеет единственный строго положительный собственный вектор χ * которому отвечает строго положительное собственное значение λ*. Существование, положительного собственного вектора, которому отвечает положительное собственное значение, вытекает из теоремы 3.19 (гл. III) Г Строгая положительность этого вектора обеспечивается усиленной монотонностью, которая в данном случае влечет за собой F(x) > О, если Jt>0, хФО. Перейдем к доказательству единственности. Введем на внутренности R+ функционал р(х, у) = In min {β/α: ах <y <βχ}, (4.4) который представляет собой метрику (проверьте!) на множестве лучей, лежащих в int R". Если χ и у не лежат на одном луче, то из ах < у < βχ следует aF(x) = F(ax) < F(y) < F(fix) = βF(x), откуда p[F(pc)9F(y)]<p{x9y)9 что и обеспечивает единственность. Π 142
Приведенный результат можно уточнять различным образом, варьируя предположения и выводы (см., например, [37]). Упражнение 4.1. Покажите, что без предположения усиленной монотонности оператор F имеет лишь конечное множество положительных собственных значений (но не обязательно конечное множество собственных векторов). Упражнение 4.2. Попытайтесь подходящим образом о преде лить (изобрести) понятие неразложимости нелинейного оператора F и заменить им предположение усиленной монотонности в теореме 4.4. Один из элементов приведенного выше доказательства заслуживает более подробного обсуждения. Метрика (4.4) оказывается удобной во многих других ситуациях [16], где приходится работать с однородными операторами (в частности, линейными). Эта метрика совпадает с метрикой Хаусдорфа, построенной по метрике Биркгофа (3.5). В рассмотренном выше частном случае легко проверить, что p(jc,.y) = lnmax Например, тот факт, что матрица А со строго положительными элементами сжимает лучи в int R", можно показать так: и = Αχ, υ = Ay, Σ aikxkXaflyl ЩЦ к I max —' = max = ι,/ ViUj i,f X'aikykXajiXi к I v хкУ1 Σ aikan ykxl *.' У к Χι , *кУ\ = max —; < max . Ц Laikaflykxl к, ι укхх к, I Поэтому р(Ах, Ау)<р(х, у). 4.4. Фильтр Калмана*). Рассмотрим динамический объект с дискретным временем Хк+1 =А*к + Cte+i, yk+i =Hxk+nk> (4.5) где хк - л-мерный вектор состояния системы, ук - m-мерный вектор наблюдений, %к - последовательность независимых случайных /-мерных векторов с нулевым математическим ожиданием и не зависящей от к матрицей ковариации Q, г\к - последовательность независимых случайных ш-мерных векторов с нулевым математическим ожиданием и единичной матрицей ковариации, А, С, Η - постоянные матрицы, размеры которых соответственно равны η Χ η, л Χ /, m X л. Фильтром Калмана для системы (4.5) называют рекуррентное правило получения оптимальной в среднеквадратичном линейной оценки хк вектора хк по наблюдениям у0, ух,.., yki задаваемое парой следующих уравнений: **+1 =А*к +Гк+1нТ(Ук-НАхк), (4.6) Гк+1 = АТкАТ + В - (АГкАТ + В)НТ[1 + Н{АТкАТ + В)НТухН(АГкАТ + В), гг (4.7) где B = CQCT. Для реализации фильтра принципиальным является вопрос о стабилизации последовательности матриц Гк, т.е. о сходимости последовательности Г^ при произвольных начальных условиях Г0. *) Содержание раздела базируется на статье [21]. 143
Формальное описание задачи не может быть удовлетворительным для читателя, который встречается с фильтром Калмана впервые. Но в данном случае вопросы фильтрации играют второстепенную роль (вернее, не играют никакой роли). Читатель может рассматривать дальнейший текст как анализ достаточно сложного итерационного процесса (4.7), не интересуясь происхождением последнего. Полуупорядочим пространство Ε симметрических матриц пХп конусом К неотрицательно определенных матриц. Перепишем процесс (4.7) э виде Очевидно, оператор /, действующий из Ε в Е, может быть представлен в виде суперпозиции двух операторов /(Г) = <^1(Г)], где *(Г) = Г - ГНТ(1 + НГНТГ1 ЯГ, (4.9) L(r)*ArAT+B. (4.10) Теорема 4.5. Операторы φ и L положительны и монотонны. Доказательство. Положительность и монотонность L очевидны (в силу Be К), что касается оператора <р, то достаточно установить его монотонность (так как <р(0) = 0). Простые преобразования дают φ(Ρ + €Α)-φ(Ρ)=Ρ+€Α-(Ρ+€Α)ΗΤ(Ι + ΗΡΗΤ)-1Η(Ρ+€Α)-Ρ + + ΡΗΤ(Ϊ+ΗΡΗΤΥ1ΗΡ = €Α-€ΑΗΤ(Ι + ΗΡΗΤ+€ΗΑΗΤ)-1ΗΡ- - еРНТ{1 + НРНТ + еНАНТГ1 НА + РНТ{1 + НРНТуl HP - - РНТ{1 + НРНТ + еНАНТГ 1НР + о (е). При достаточно малых е имеем (Г+НРНТ+еНАНТГ1 =(/ + ΗΡΗΤ)'ι[Ι+ €НаНТ(1+ HPHTyl f * = = Ц+НРНТУ1 [1+ еНАНТ{1 + ΗΡΗΤ)~ι ] + о(е). Поэтому φ(Ρ + еА) - φ(Ρ) τ ~ ; ΨΚ } -+U-DP)TA{I-DP) € при е->0, где D=HT(I+HPHTy1H Отсюда следует, что производная φ по конусу К всюду принадлежит конусу К, а это влечет за собой монотонность γ?. D Из монотонности φ и L вытекает монотонность оператора /=y?L. Поэтому можно утверждать, что для существования решения уравнения Г=/(Г) (4.11) необходимо и достаточно существование элемента S е К такого, что f{S)<S. (4.12) В этом случае очевидно, что оператор / будет иметь инвариантный конусный отрезок <0, S). Интерес к разрешимости уравнения (4.11) в данном контексте вполне понятен, так как только решения уравнения (4.11) могут быть пределом сходящегося процесса (4.8). Заметим, что условие (4.12) выполняется в достаточно общей ситуации. Если, например, уравнение £ (Г) = Г имеет решение 50, то f(SQ) < 50. Или пусть матрица т Я квадратна и невырождена; тогда условие (4.12) будет выполняться для 5=(НН у1. Установим справедливость двух вспомогательных утверждений. Лемма 4.1. Для любого Ре К найдется такое число aG(0,l), что φ(Ρ) Ζ> аР. Доказательство. Используя матричное тождество I-BTV+BBT)'lB = Q + BTB)-l9 144
легко получить φ(Ρ)=Ρ- ΡΗΤ(Ι + НРНТУ l HP = s/ΡΙΙ - JPHT{I + Η y/FJ?HTr l Η y/F]y/P = =>/?i/+ y/FHTHy/PylJF. Отсюда имеем φ(Ρ)-αΡ= >/?[(/+ у/?ННТу/РГ1 -~aI]y/F Так как (/+ у/РНН у/?)'1 - внутренний элемент конуса К, то матрица в квадратных скобках положительно определена при достаточно малых а > 0. D Лемма 4.2. Для любых Ρ и В из К и любого те (0, 1) найдется такое положительное а0 G (0,1), что φ(τΡ + аВ)> τφ(Ρ) + аВ/2 при всех а < а0. Доказательство. Введем следующие обозначения: φ(τΡ + αΒ)-τφ(Ρ)-αΒ/2 S — ...... t τ DT * (//τ + HPHT) -\ D = (I + HPHTyl, W = Я/т. Для α€ (0,1) легко проверить, что 5 > a W/2 - (Р + a W) HTDTH(P + a W) + PHTDHP = = α и>/4 - α WHTDTHP - aPHTDTHW + + [α Κ>/4 - α2 WHTDTHW] + [PHTDHP -PHTDTHP]. При достаточно малом α > 0 матрица аК>/4 _ aWHTDrHW = as/WJ4(I - 4ay/WHTDTHW) y/W принадлежит конусу ΑΓ. Обозначая через /? положительно определенную матрицу r^d~II2dd\12 -/, имеем PHTDHP - PHTDTHP = РЯгф - Ят) ЯР = ΡΗτϋ\β RD^2 HP. Матричное тождество (aR~ll2Dll2HW-Rll2D^/2HF)T(aR ~~II2d\I2HW -RiI2d]!2HP) - - аг WHTDXJ2 R-χd]!2HW = = PHTDl12RDl/2HP - aWHTDTHP - *PHTDrHW показывает, что для неотрицательной определенности S достаточно, чтобы неотрицательно определенной была матрица a W/4 - <*2 WHDl12 R mD]l2 HW = =x*V¥74(/-a*JWhtd)!2r-*dWHsfW) y/W. Последнее, очевидно, выполняется при достаточно малых <*0. D Теорема 4.6. Пусть существует решение Г* уравнения (4.11), Β Φ 0 и выполняется условие keiLN(0)CkQiAN (4.13) при некотором N>0. Тогда решение Г*единственно и к нему сходятся последовательные итерации (4.8) независимо от начального приближения Г0 е К. Доказательство. Лемма 4.1 гарантирует, что для любого S е К найдется « > 0, при котором f{S) = <pL(S)>aL(S). (4.14) 145
Применяя к (4.14) N раз оператор / и используя монотонность /, φ, L и лемму 4.1, получим оценку LN(S) > fN(S) > <*LN(S) >LN(0 ), α > 0. (4.15) В силу (4.13) найдется такое β > 0, что LN(S)*LN(0)+ANS(AT)N <fiLN{0). (4.16) Положим U0 =LN(0). Неравенства (4.15), (4.16) влекут за собой fN(S)<=K(U0). (4.17) Используя теперь лемму 4.2, для любых 5е^ите (0, 1) получим f(rS) = «pZ, (tS) = φ[τΙ (S) + (1 - τ) В) > > φ [rL (S) + α(1 -t)B)>t<pL(S) + γ (1 - τ) Β> rf(S) + a,L (0), где <*! ё(0,т), ее (0,1). Применяя к обеим частям этого неравенства оператор / и снова используя лемму 4.2, получаем P(tS)> <pL[Tf(S) + α,Z,(0)] = «p[rL/(5) + a.L^O) + (1 - г + at ) 5] > >^[г/,/(5) + а1^2(0)] >^[rZ./(5') + aa1L2(0)] > > τφΙί(Ξ) + γ Ζ,2(0) > r/2(S) + α2Ζ,2(0), где aG (0, 1) и л2 G (0, г). Повторяя эту операцию W раз, имеем fN(rS) > rfN (S) + ctNLN(0), ayv G (0, r), что в совокупности с (4.17) дает fN(TS)>rfN(S)+ 25L/"(S)«t<1 +n)fN{S), где η = θίΝ/βτ. Таким образом, оператор .г* является U0-вогнутым. Выводы теоремы вытекают из общих результатов о монотонных и0 -вогнутых операторах. D 4.5. Нелинейная эллиптическая задача. Рассмотрим краевую задачу (см. раздел 6.5 гл. IID Lx=f{ttx), *(Ο|ίίΞΓ = 0 (4·18) с эллиптическим оператором L второго порядка, эквивалентную решению интегрального уравнения x(t) = f G(t,s)f[stx(s)]dSi Ω где G - функция Грина первой краевой задачи. Пусть функция f(tу и) в (4.18) непрерывна по совокупности переменных (Г е Ω, не (-оо, оо)). Тогда оператор Tx(t) = f G(t,s)f[s,x(s)] ds, (4.19) Ω отображая в себя пространство С, вполне непрерывен. Если f(t, и) > 0 при и> 0, то в силу G(f, s) > 0 оператор (4.19) оставляет инвариантным конус К неотрицательных функций в пространстве С. Пусть существует неотрицательная функция f(t> ύ, w), монотонно возрастающая Л по υ и монотонно убывающая по wh такая, что f(t, м, и) =/(Г, и). Очевидно, оператор 146
(4.19) в этом случае будет гетеротонным, а оператор f[v(t),w(t)] =/ Git,s)f[s, v(s),w(s)] ds (4.20) Ω Λ - сопутствующим ему. Если функция/(£, v,w) непрерывна по совокупности переменных, то оператор (4.20) действует η3(?[ΩΧΩ]β(?[Ω]η вполне непрерывен. Заметим, что в данном случае можно указать множество Ωχ ненулевой меры такое, что / G(t;s)ds>€0 >0, refij. Ωχ Далее, χ(ί) обозначает характеристическую функцию множества Пг. Теорема 4.7. Пусть существует пара чисел υ, w таких, что 0 < υ < w и fit, v, w) > ay, f{t, w, υ) < 0w, iG Ω, (4.21) где <*>€?, ^< UGU"1 (4.22) (Η GII - норма линейного оператора G в пространстве С). Тогда краевая задача (4.18) имеет в С по крайней мере одно решение x*it). При этом T[vx(0,w)<x*(t)< tlw.Oxit)]. (4.23) Доказательство. Учитывая (4.21), (4.22), получаем T[vxiO, w] =/ Git, s)f[s, vxis), w] ds > Ω > olS Git, s) vxis)ds > ct€0vxit) > υχ(0· Ω Аналогично, f[w, ух(01< QwfGit,s.)ds<Q II Gil w < w. Ω Поэтому (если Т рассматривать как оператор, действующий в пространстве суммируемых функций) следует признать, что конусный отрезок < υ0, w0 >, где υ0 it) = υχ(ί), w0(O =νν» является сильно инвариантным для Т. Отсюда в свою очередь вытекает (см. предыдущий раздел), что конусный отрезок < υι, wi >, где υ1(0=Πυχ(0,νν], Wl(0 = Г[и\ υχ(ί)], также сильно инвариантен (а значит, инвариантен и в обычном смысле) для Г. Теперь остается заметить, что υι, wx £ С и оператор Г отображает в себя ограниченное, замкнутое и выпуклое множество < υχ, ννχ > с С. В этих условиях существование решения х*(0» удовлетворяющего неравенствам (4.23) (т.е. χ*€=<υ1, ινχ», вытекает из принципа Шаудера. □ Теорема 4.8. Пусть выполнены предположения теоремы АЛ и для любых чисел v, w, и таких, что 0 <υ <w, 0 < и< w, при всех ϊΕΩ имеет место неравенство fis, v + u,w -u)< fis, v,w) + u II G\rl. (4.24) Тогда решение х*(0 краевой задачи (4.18) единственно и может быть получено методом последовательных приближений хп+1 О и / G& *>Я*. хп (*)] Л, (4.25) Ω где x0(t) g<u0,w0 >. Доказательство. Для доказательства достаточно показать, что хотя бы в одной точке ί06Ω f GitQ,s)f[s> vis) + uis)iwis)-uis)]ds<fGit0,s)f{s, uis\wis)] ds+ иЦ0), Ω Ω (4.26) 147
где функции и it) и wit) -υ (О неотрицательны и не равны тождественно нулю и υ, w, v + u, w - u^(v1, w1). (4.27) Пусть u(t) принимает максимальное значение в точке t0. Из (4.27) следует t0 Ε. Ω. Теперь, учитывая (4.24), легко приходим к (4.26). Действительно, / G{t0, s)f[s, vis) + u(s), wis) -u(s)] ds < Ώ <fG(t0, s)f[st υ(ί), wis)] ds + u(t0) И GVl f G{t0, s) ds < Ω Ω <fG(t0,s)f[s,v(s\w(s))ds + u(t0).D Ω Линейный оператор / G it, s) χ is) ds обозначим через G. Положим Ω u0(t) = fG(tts)ds. (4.28) Ω Лемма 4.3. Линейный оператор G и0ограничен (элемент и0 определяется формулой (4.28), т.е. для любого хёК, χΦΘ можно указать положительные а(х)> β (χ) такие, что а(х) u0(t) <fG(t, s)x(s) ds < β(χ) u0(t). D Ω Теорема 4.9. Пусть выполнены предположения теоремы АЛ и для любых положительных чисел υ, w при любом τ е (0,1) выполняется неравенство 1 fit, τν, — w) > rfit, ν, w), t G Ω. (4.29) τ Тогда существует единственное ненулевое решение краевой задачи (4.18) лс*е К и последовательные итерации (4.25) сходятся к x*(t) no и^норме при любом x0(t) e Ξ К(и0\. Если, помимо этого, функция fit, ν, w) положительна, то последовательные итерации (4.25) сходятся к х*it) по и^-норме при любом x0(t) e К. Доказательство. Пусть функции v(t), wit) принадлежат множеству К (н0). Тогда найдутся точки ΐ е Ω, в которых обе функции υ it), wit) одновременно поло- жительны.^ Из (4.29) следует, что в этих точках t е Ω положительной будет также функция/[f, v(t), w(t) ]. Отсюда в силу леммы 4.3 . ot(v, w) u0 (t)<fG (ΐ, s) f[s, vis), w(s)]ds<Q (u, w) u0 (f), (4.30) Ω где α, β > 0. Λ Если же функция fit, ν, w) положительна, то (4.30) справедливо не только для v(t)t wit) е£(м0), но и для любых v(t)t wit) eК. Это соображение и приводит к поправке в утверждении теоремы о начальном приближении xQ(t). Пусть по-прежнему v(t), wit) еАЧ"р)-Из (4.29) и (4.30) следует л 1 л fG(t,s){f[siTv(s)t — w(s)] -rf[s,v(s)tw(s)]}ds> Ω г >α1(υ, w)M0(i), αι >0, откуда / Git, s)f[s, τυ(s), — wis)] ds > r(l + ^-] / Gitt s)f[s, vis), wis)] Ω τ \ βτ}η ds. Таким образом, оператор Т и0 -псевдовогнут. Предположения теоремы 4.7 обеспечивают существование .у Τ сильно инвариантного конусного отрезка. Далее остается сослаться на результаты § 3. Π 148
Комментарии § 1. Принцип Биркгофа - Тарского многократно обобщался и модернизировался (И.А. Бахтин, К. Самадов, В.Я. Стеценко и др.)- Наиболее общий и достаточно удобный результат (теорема 1.2) получен в [27]. Две теоремы из этой статьи сформулированы здесь в виде упражнений 1.4, 1.5. Для экономических приложений существенный интерес представляют обобщения результатов § 1 на случай многозначных монотонных операторов. Недавно соответствующие обобщения теорем 1.1., 1.2 получил З.Г. Нишнианидзе, определив монотонность следующим образом. Многозначный оператор F называется монотонным, если х>у влечет за собой F(x) > F(y)t где полуупорядоченность множеств определяется так: А > В, если для любого ие А найдется такоеие5, что и> и, и,наоборот, для любого υ е Z? найдется такое и€ А, что и> υ. В зависимости от целей определение монотонного многозначного оператора можно варьировать. Остается невыясненным ряд вопросов, связанных со сходимостью игерационных процессов. § § 2, 3. Теория гетеротонных и псевдовогнутых операторов построена в [41-43]. Ее более подробное изложение можно найти в книге [ 50 ]. Выделение класса псевдовогнутых операторов (в частном случае монотонных вогнутых) базируется на ограничениях скоростей роста операторов вдоль лучей, лежащих в конусе. Такой путь удобен, но не единствен. Можно вводить ограничения скорости роста по фиксированному направлению, по более узкому или более широкому конусу, по любому направлению и т.д. Ниже рассматриваются некоторые из таких возможностей для простейшего случая монотонного оператора Т. Обобщения для гетеротонных операторов и точные формулировки результатов предоставляем читателю. Монотонный оператор Τ назовем слабомонотонным, если для любого ненулевого Т(х + у)<Т(х) +у. (К.1) Если слабомонотонный оператор Τ оставляет инвариантным некоторый конусный отрезок <ι>0, н>0> и находится в условиях, обеспечивающих существование неподвижной точки, то неподвижная точка у Τ единственна. Дело в том, что в случае неединственности монотонный оператор имеет сравнимые неподвижные точки х\Ъ> х*, но тогда в силу (К.1) легко получается противоречие: Г(**) = Т[х* +·(** - х*)] < T(xf)+x* - χ* =**. Примером слабомонотонного оператора может служить оператор суперпозиции Т(х) =/[Г,х(Г)]в случае 0 </^г,м) < 1. Если интересоваться лишь единственностью неподвижной точки, то (К.1) с тем же успехом можно заменить на Т{х + у)>Т{х)+у. (К,2) Условие (К.2) существенно более свободно. Рассмотрим, например, оператор T[x(t)] =fk[t,s,x(s)] ds Ω и покажем, что при условии bkjt, s, и) 1 θ и mesi2 он удовлетворяет условию (К.2). Пусть у (О достигает максимума в точке t0 e Ω (мы не уточняем деталей, поскольку нас здесь не интересует точная формулировка результатов). Условие (К.2). вытекает из следующей цепочки неравенств: fk[t0.s.x{s)+y{s)] ds<f k[t0,s,x(s)+y(t0)]ds< Ω Ω <fklt0,s.x(s)] ds + f l¥±L ds=fk[t0.stx(s))ds+y(t0).n Ω Ω mes" Ω 149
Если наложить ограничение, более жесткое чем (К.1), например, Т(х+у)<Т(х) + ау, aG(0,l); (K.3) то это дает основу для теорем существования. Пусть, например, конус К правилен, непрерывный оператор Τ положителен, монотонен и удовлетворяет условию (К.З). Тогда Τ имеет единственную неподвижную точку jc*g К. Для доказательства рассмотрим итерационный процесс х^ j = Т(хп), начинающийся в точке х0 = θ . Очевидно, д < хх <х2 <.. . < хп <... Рассмотрим последовательность уп - хп — χη_ι > θ. Из *и+1 = Г<*«> ш Τ(χη-1 +Уп-0 < Τ(χη-0 + «*я-1 вытекает уп+1 < <*Уп-1> что дает °ДенкУ *л<: O'l+J'a)· 1 — α Но в указанных выше предположениях из ограниченности хп следует существование неподвижной точки х*е К. Остается заметить, что любая точка υ =х* + у (у > Θ) "идет назад". Действительно, Т(х* + у) <·Τ(χ*) +ау<х* + у.П В целом изучение слабомонотонных операторов выглядит малоперспективным из-за жесткости предположений. Существенно более широкий круг прикладных задач попадает в поле зрения, если ограничение скорости роста предполагается вдоль единственного фиксированного направления. Фиксируем ненулевой элемент и0 е К. Пусть монотонный оператор Τ отображает Ε вЯ^и удовлетворяет условию Т(х + уи0)<Т(х) + (1-е)уи0, 7>0, е > 0. Тогда Τ не может иметь двух различных неподвижных точек x*t x*. Действительно, пусть а — минимальное число в неравенстве х* - х* < аи0. Тогда ** = Π*ί) < Т(х*+аи0) <Т(х*) + (1 - е) сш0 =** + (1 - е) аи0, что противоречит определению a. D Если говорить о нерешенных задачах в теории гетеротонных операторов, то их довольно много. Некоторые постановки можно извлечь из книги [50], однако эти постановки касаются в основном роста теории вширь: приложения к новым типам уравнений, устранение стесняющих предположений и т.д. Более интересны вопросы, связанные с углублением основных идей. В теории гетеротонных операторов центральной идеей является расщепление оператора, его диагональное представление Т(х) - = Т(х, х). Что собой представляет диагональное расщепление? Ответы возможны различные, но наиболее богатую пищу для размышлений дает следующая точка зрения. В случае Т(х) = Т(х> х) исходный оператор Τ можно мыслить как оператор Τ (υ, νν) (большего числа переменных) при дополнительном наложении связи υ = w = χ. При этом переход от Г к сопутствующему оператору Г можно рассматривать как "временное" освобождение в изучаемом операторе Τ от имеющихся (неявных) уравнений связи. В данном случае речь идет о простейшей внутренней взаимосвязи переменных υ = νν= χ, но что мешает искать более сложные и, может быть, более интересные связи, освобождение от которых даст еще больший выигрыш в простоте исследования? При этом вовсе не обязательно замыкаться на ситуациях, где имеется полуупорядоченность. Например, было бы интересно проверить, что может дать "расщепление" в теории операторов, монотонных по Минти - Браудеру (см. [12]). Уместно напомнить, что классический метод множителей Лагранжа также можно рассматривать как своеобразную реализацию идеи освобождения от уравнений связи. 150
ГЛАВА V РЕАКЦИЯ СИСТЕМ НА ВНЕШНИЕ ВОЗДЕЙСТВИЯ Занимаясь вопросами существования и единственности равновесия, мы стоим по существу на созерцательных позициях, пытаясь понять, как функционирует изучаемая система. Безусловно, эта задача служит не только для удовлетворения любопытства, но конечной целью все же, как правило, является некая нормативная задача, заключающаяся в выяснении возможностей управления системой (возможностей ее перевода в более благоприятное состояние, на более выгодный режим работы и т.д.). При изучении сложных систем разрешимым считается тот случай, когда есть возможность ответить на вопрос: как качественно влияют внешние воздействия (управления) на состояние системы? Подобный круг вопросов в математической экономике получил название задач сравнительной статики и традиционно связывался с изучением моделей рынка и межотраслевого баланса. На самом деле формулировка и решение задач сравнительной статики не зависят от конкретного подтекста: идет ли речь об экономике или о технике, выясняется ли характер реакций системы на управления или же на стихийные воздействия. Формальные постановки задач сравнительной статики уже упоминались в гл. I. Дополним их одним содержательным примером из области медицины. Пусть имеется набор η лекарств (через Х{ будем обозначать количество /-го лекарства) и набор η физиологических показателей состояния организма (/-й показатель будем характеризовать величиной yf). Пусть /-е лекарство предназначено для изменения (лечения) /-го показателя. В идеальном случае V/: у\ = //(*/) процедура лечения была бы весьма простой. Однако каждое лекарство, как правило, обладает побочным влиянием, и мы имеем V/: Ух =/ΚΧι,·..,*„). Понятно, что процедура лечения в этом случае должна быть комплексной, и не всегда ясно, можно ли обойтись заданным набором лекарств, чтобы улучшить состояние хотя бы одного показателя, не ухудшая остальных. Ведь применяя Χι для улучшения у\у мы можем пагубно повлиять на у2> и тогда придется применять х2, что приведет к ухудшению у χ и 7з> а после увеличения дозы хх и применения х3 может снова потребоваться увеличение дозы х2 для компенсации побочных влияний на параметр у2 · Итак, задача здесь состоит в выяснении возможности улучшения одного или нескольких показателей с помощью заданного набора лекарств. Други- 151
ми словами, все сводится к разрешимости неравенств вида F(x) > О, χ ·> 0, что представляет собой математическую формулировку первоочередного вопроса, который возникает в большинстве задач сравнительной статики. § 1. Линейные неравенства 1.1. Теоремы об альтернативах. Рассмотрим задачу о разрешимости системы линейных неравенств Ах > О, (1.1) где Γ«11<*12 · · · d\n I 021^22 · · · #2/ι L^mi^m2 · · · Ятя причем с > О здесь означает, что все с/ > 0, т.е. с G int R+. Матрицу (1.2) можно рассматривать как набор т вектор-строк я (/) = = {Я/1, . . . , ain}. Расположим все векторы а^ в Rn. Неравенство (1.1) теперь означает положительность всех скалярных произведений (a(i)fx) = Σα^χι > 0. (1.3) ί Очевидно, подходящий вектор χ Ε Rn будет существовать лишь в том и только в том случае, когда все векторы а ^ расположены по одну сторону некоторой (п — 1)-мерной плоскости. Ясно, что критерием подобного расположения векторов а ^ в R" может служить отсутствие неотрицательных коэффициентов у χ таких, что Ъухаць = 0, у = {уи...,ут\ * 0, 0-4) т.е. уА = 0, у>0, уФО. Проведенные рассуждения приводят к следующему результату. Теорема 1.1. Либо неравенство (1.1) разрешимо, либо уравнение у А =0 имеет ненулевое положительное решение. G Это одна из так называемых теорем об альтернативах, многообразие которых определяется разнообразием исходных формулировок задач. Прежде чем рассматривать другие теоремы, вернемся к доказательству теоремы 1.1. Многие читатели могут не согласиться, что проведенные выше рассуждения обладают статусом доказательства. Но здесь все зависит от того, с чем мы готовы согласиться, что считаем известным. Исходные позиции, игнорирующие геометрию η измерений, более надежны, но менее удобны. Использованные выше рассуждения обладают геометрической наглядностью и позволяют "видеть" результаты, освобождая от необходимости запоминания теорем. По этой причине мы обсудим их еще раз с несколько иной точки зрения. (1.2) 152
Рассмотрим множество Μ (А) векторов ζ вида ζ = Σ^βμ) ζ при всевозможных наборах положительных коэффициентов у ={yi, . . . • · · > Ут}- Очевидно, множество Μ (А) замкнуто, выпукло и вместе с любым ненулевым вектором ζ G Μ (А) содержит луч olz (ol> 0), проходящий через ζ. Для того чтобы Μ {А) было конусом, не хватает одного требования: отсутствия в М(А) противоположно направленных векторов*). Если такие векторы отсутствуют, то Μ (А) будет конусом и (1.1) будет разрешимо. Посмотрим теперь, что означает наличие в Μ (А) противоположно направленных векторов. Пусть ζ1 = Σγ}αιο, ζ2 = Σγ2α{0 и ζ1 =-ζ2.Тогда ζι+ζ2 = 1Ы+^(0 = 0, (1.5) т.е. для у-у1 +у2>0 (Ф0) выполняется (1.4). Часто разрешимость (1.1) требуется в дополнительном предположении χ > 0. Но эта задача сводится к неравенству Вх > 0, где матрица •■[Я получается присоединением к А единичной матрицы / размера η Χ η — в результате чего мы попадаем в прежнюю ситуацию, только с новой матрицей. Если речь идет о разрешимости неравенства Ах > Ь, (1.6) то опять-таки (1.6) можно свести к задаче вида (1.1) с матрицей г ац .. . а1п -Ъх ~| I ат\ · · атп -Ьт I L0 0 1 J и снова применить теорему 1.1. Теорема 1.2. Либо неравенство Ах %> 0 разрешимо, либо уравнение у А = 0 имеет строго положительное решение у > 0. Для доказательства достаточно заметить, что Ах > 0 разрешимо, если Μ (А) помещается в некотором полупространстве. В противном случае Μ (А) совпадает со всем пространством R", и тогда для любого ζ1 = = Zj>ytf(/), где все у] > 0, существует противоположный вектор ζ2 = = Ъу\а (/), что влечет за собой (1.5), причем у - у1 + у2 > 0. Таким образом, существует^ > 0, при котором;М = 0. D *) Напомним, что наше определение конуса (гл. III, § 2) включает это требование. Встречаются и другие определения конуса. 153
По существу теоремы 1.1, 1.2 в совокупности со стандартными приемами перехода к новым матрицам (неравенствам) охватывают все многообразие ситуаций в области линейных неравенств (конечно, имеются в виду лишь результаты альтернативного характера). Безусловно, это не исключает целесообразности формулировки результатов специального назначения. Ряд таких результатов приводится далее в виде упражнений. Упражнения. 1.1. Система линейных неравенств уА > 0 и система линейных уравнений Ах = О с условием неотрицательности χ > О всегда имеют пару решений у, χ такую, что у А + χ > 0 (теорема Таккера). 1.2· Чтобы уравнение Ах = Ь имело неотрицательное решение χ -> 0, необходимо и достаточно, чтобы уА > О влекло за собой (>·, Ъ) > 0 (лемма Минковского - Фар- каша). 1.3. Либо система Ах - b имеет решение χ >0, либо разрешима система неравенств уА >0, (у, Ъ) < 0 (переформулировкапредыдущего утверждения). 1.4. Если матрица А - кососимметрическая (Ат = -Л), то система неравенств Ах>0>х&0 имеет такое решение, что Ах + χ > О (Таккер). 1.5. Либо неравенство Ах <· b имеет решение χ > 0, либо неравенства у А Ъ> О, {у, Ь) < 0 имеют неотрицательное решение у > 0. 1.6. Либо существует решение неравенства Ах > Ь, либо уравнения^ = 0, (у, Ь) = =1 имеют неотрицательное решение у> 0. 1.7. Системы неравенств у А Ъ> 0, у > 0 и -Ах > 0, χ -> 0 всегда имеют такие решения, что χ + уА > 0, у - Ах > 0 (Таккер). 1.2. Р-матрицы. Ниже рассматриваются лишь квадратные матрицы η Χη. Пусть [Ax]f обозначает /-ю компоненту вектора Лх. Будем говорить, что матрица А обращает знак вектора х, если Xf[.4x] ,·<(), /= 1, .. ., и. Матрицу Л, которая не обращает зн^к ни одного ненулевого вектора jc £ R", назовем Р-матрицей. Теорема 1.3. Если А является ^-матрицей, то система неравенств Ах>0,х>0разрешима. D Теорема I Л. Матрица А является ^-матрицей в том и только в том случае, когда все ее главные миноры положительны. D Первоначально Р-матрицы определялись через положительность главных миноров. Теорема 1.4 позволяет перейти к эквивалентному определению, данному выше. Целесообразность такого перехода прояснится в следующем параграфе. Центральная в данном контексте теорема 1.3 —' элементарное следствие более общих результатов § 2. 1.3. Алгоритмический критерий. Предположим, что неравенство (1.1) разрешимо их*— одно из его решений. Рассмотрим итерационную про-, цедуру xk+i = xb+aV)f если (хк,аа))<0. (1.7) Говоря более точно, процедура (1.7) работает следующим образом. На к-м шаге проверяются скалярные произведения (хк, Д(/))· Если все они оказываются положительными — процедура останавливается — хк будет одним из решений (1.1). В противном случае один (любой) из векторов а,..., удовлетворяющих неравенству (хк, Д(/>). < 0, прибавляется к хк и все повторяется сначала. 154
Теорема 1.5. Если система неравенств (1.1) разрешима, то процедура (1.7) сходится за конечное число шагов, т.е. за конечное число шагов дает одно из решений (1.1). Очевидно, где α = (χ°,χ*), 0 = πύη(β(/),χ*)>Ο. I Используя теперь неравенство Коши — Шварца (х*+1,х*)2<(х*+1)2(х*)2, получаем (хк+1)2 > Чг^ > х" ""' , (1.8) (**)2 (**)2 (х*+\х*)2 (α + β*)2 — ^ Jfc+l'\2 откуда следует, что (х ) растет по меньшей мере как квадратичная функция от числа шагов. С другой стороны, (χ*+1 )2 = (χ* + α(0)2 = (**)2 + 4) + 2(xfc, β(0) И, В СИЛУ (Χ*,β(,·))<0, (**+1)2-(**)2«2(/)> что после суммирования дает (xk+1f < (χ0)2 +α(2Ιι) + ... +4fc) < (*°)2 +Ш, (1.9) где M = maxfl2J). I Неравенство (1.9) означает, что (х*+1)2 растет не быстрее, чем линейная функция от числа шагов. Противоречивые оценки (1.8), (1.9) неизбежно приводят к выводу о сходимости (1.7) за конечное число шагов. D Сравнение (1.8), (1.9) дает оценку числа шагов, за которое алгоритм сходится. При х° - 0 эта оценка имеет вид Мх*)2 к < . § 2. Теория Р-систем 2.1. Основная теорема. Назовем переменные X/ действиями, а у ι = = fj(x) — результатами (г = 1,. . . , п). Пусть χ = 0 соответствуют "нулевые результаты", т.е.//(0) = 0 (/' = 1,... , и), а при любом х;- > О ;у, =/;·(0,...,0, х;, Ο,.,.,Ο) > О, т.е. при отсутствии помех каждое положительное действие X/ приводит к положительному результату у;. Понятно, что при наличии перекрестных взаимосвязей совместные положительные (стереотипные) действия могут приводить в совокупности 155
к отрицательным результатам. Мы выделим класс Р-систем, в которых любой набор неотрицательных действий χ Φ О дает хотя бы один положительный результат. Далее будет установлено, что в Р-системе всегда существует согласованный набор действий, при котором все результаты положительны. На самом деле последующие результаты имеют чисто математический характер. Описанная же модель "действия — результаты" несет вспомогательную нагрузку, давая иногда удобную интерпретацию. Перейдем к точным формулировкам. Непрерывный оператор F(x) = {/i(x), . . . ,/„(*)}, действующий из R+ в R" и удовлетворяющий условию F(0) = 0, назовем ?-отображетем, если для любого χ > 0 (χ Φ 0) существует номер / такой, что х///(х) > 0. Теорема 2.1. Пусть F является ^-отображением. Тогда существует вектор х> 0 такой, что//(х) >0для всех г = 1,... ,п. Доказательство. Предположим, указанный вектор χ > 0 не существует. Тогда F является К-отображением (гл. III, § 4). Легко видеть, что F К-гомотопно на 5 (г) (при любом г > 0) внедиагонально отрицательному отображению χ ®F(x) ={*i/i(x),. .. ,xnfn(x)} · К-гомотопией может служить отображение Я(х, г) с компонентами hi(x, τ) = /,(*) (1 - τ + τχϊ). Из определения Рютображений следует χ ® F(x) < 0 на S(r), что влечет за собой ind* (F, 0) = ind^(F, °°) = 1. Но тогда теорема 4Л0 (гл. III) приводит к противоречию с исходным предположением. D Приведем еще одно доказательство теоремы 2.1. Положим ΊΧχ) = iy: У Ξ5(1), (у, F(x)) = min (ζ, F(x))> . Легко видеть, что Г (χ) — точечно-множественное отображение симплекса 5(1) в себя, имеющее выпуклые образцы и замкнутый в 5(1) X 5(1) график. Из теоремы Какутани вытекает существование неподвижной точки х* G Т(х*). Другими словами, существует точка х* € 5(1), в которой (х*, F(x*)) = min (ζ, F(x*)) = min /f (χ·). (2.1) z65(l) ι Если min ff(x*) > 0, то все //(х*) > 0, и теорема доказана. В противном случае min/К*') =/,(**)< 0 i легко получается противоречие. Действительно, их того, что F есть Р-ото- бражение, вытекает, что в неравенствах *;//θχ·)<*?Λ(κ·) (2.2) 156
при некотором / будет строгое неравенство. Поэтому после суммирования неравенств (2.2) по всем i получается противоречие с (2.1): i 2.2. Избыточность переменных. Иногда Р-отображение F устроено так, что можно добиться строго положительных результатов, не используя всех действий. Другими словами, существует такой вектор χ > О, причем некоторые Xj = 0, что F(x) > 0. Содержательно это отвечает ситуации избыточности набора действий (результатов). Более интересна ситуация, когда известно, что набор переменных заведомо неизбыточен. В этом случае оператор F будет К-отображением (гл. III, §4). Теорема 2.2. Пусть ^-отображение F является К-отображением. Тогда для любого ненулевого у € R? можно указать вектор χ Ε R+ (с любой наперед заданной нормой) такой, что F(x) = \у при некотором λ>0. Для доказательства достаточно повторить основное доказательство теоремы 2.1, отбросив первые две фазы и заменив последнюю простой ссылкой на теорему 4.10 (гл. Ill). D Теорема 2.3. Пусть ^-отображение F является К-отображением и выполняется условие Jim ИЯ*)||=оо Тогда уравнение F(x) -у при любом у Ε R+ имеет положительное решение χ £ R^. Доказательство вытекает из теоремы 4.9 (гл. Ill). D 2.3. Универсальные Р-отображения. Переменные Xj по-прежнему будем называть действиями, а у ι = /,·(*) — результатами, но теперь будем считать, что Xj могут принимать не только положительные значения, но и отрицательные, причем для любого Xj Φ Ο sign/;- (0,..., 0,*,·, 0,..., 0) = signx/, т.е. "при отсутствии помех" каждое положительное действие Xj дает положительный результату, отрицательное — отрицательный. Пусть F(0) = 0, и надо некоторые yj увеличить, а другие уменьшить. Здесь естественно задаться следующим вопросом. Можно ли такого изменения вектора у добиться "стереотипными" -действиями, т.е. увеличивая Xj, если yj надо увеличить, и уменьшая Xj, если yj надо уменьшить. Положительный ответ на этот вопрос можно дать, если оператор F (х) ={ /j (χ),... ,/„(*)} является универсальным Р-отображением. Непрерывный оператор F: Rn -> R" (F(0) = 0) назовем универсальным ^-отображением, если для любого χ Φ 0 существует номер / такой, что Xjf.(x) > 0 (т.е. хотя бы один результат является "ожидаемым"). Τ е о ρ е м-а 2.4. Пусть F является универсальным ^-отображением и R*l _ обозначает некоторый (произвольный) ортант. Тогда существует вектор jc£R£_ такой, что /*(jc) £ int R+_ (т.е. все результаты являются "ожидаемыми", все действия - "стереотипными"). 157
Для доказательства надо перейти к другой системе координат, изменив перед некоторыми Xj знаки так, чтобы в новой системе координат множество R+ _ стало неотрицательным ортантом. Очевидно, сужение F на R+ _ в новой системе координат является Р-отображением и остается применить теорему 2.1. D Непрерывный оператор F: Rn '-> R" назовем универсальным Р-отображением по приращению, если для любого χ £ R" и любого Αχ Φ О (Ах е R") существует номер / такой, что [ή(χ+Αχ)-ή(χ)]Αχ;>0. (2.3)' Если же (2.3) выполняется лишь для Ах, достаточно малых по норме, оператор F будем называть локальным универсальным Р-отображением по приращению. Проверка наличия у системы (оператора) "Р-свойства" в локальном масштабе представляется более доступной и, как показывает следующая теорема, ею можно ограничиться. Теорема 2.5. Любое локальное универсальное ^-отображение по приращению является универсальным Р-отображением по приращению. Доказательство. Заметим сначала, что теорема 2.1 сохраняет силу, если-в определении Р-отображения требовать справедливость условия 3; г Xjfj (χ) > 0 лишь для jc G R+ (χ Φ 0), достаточно малых по норме. В этом случае можно утверждать существование лишь достаточно малого по норме вектора χ £ R+ такого, что // (х) > 0 для всех / = 1,..., п. Итак, предположим, что утверждение теоремы 2.5 неверно. Тогда найдется пара точек а Ф Ь таких, что V* [Λ(β)-Λ(*)](α/-6,)<0. Без ограничения общности можно считать, что а > Ь и даже V /: α ι > bj (иначе в последующих рассуждениях можно было бы перейти к "усеченному" оператору FmF(Pmx), где Рт - матрица, у которой т (произвольных) диагональных элементов равны 1, а все остальные элементы нулевые; очевидно, любой оператор PmF(Pmx) также является Р-отображением) . Обозначим через Τ множество тех χ € (ауЬ >, для которых F(x) <> < F(a). Поскольку F непрерывен — Τ компактно, а так как F - локальное универсальное Р-отображение — точка а является изолированной точкой множества 7*. Следовательно, компактным является также Т\{а). На компактном множестве функция φ (χ) = Σ | Χ/ | достигает минимума в некоторой точке х* ^.Т\{а). € другой стороны, по упомянутой выше модификации теоремы 2.1 существует достаточно малый по норме вектор Ах < 0 такой, что V/: //(х* + Ах) < //(**). Следовательно, х* + Αχ Ε е Г\ {а}, но тогда φ (χ* +Αχ)<φ (χ*) . D 2.4. Взаимная однозначность. Важная роль теоремы 2.5 определяется следующим соображением. Гладкое отображение F будет локальным универсальным Р-отображением, если [bfi/dxj ] в любой точке χ является Р-матрицей. Таким образом, теорема 2.5 позволяет изучать универсальные Р-отображения в терминах якобиевых матриц. В данном контексте очевиден следующий полезный результат. 158
Теорема 2.6. Если якобиева матрица гладкого отображения F: Rn -> R" всюду в Rn является f-матрицей, то отображение F взаимно однозначно. Ώ 2.5. Системы с отрицательным побочным влиянием. Рассмотрим систему "действия — результаты", описываемую внедаагонально отрицательным отображением F: R+ -* Кп. На содержательном уровне это соответствует отрицательному влиянию каждого действия на "чужие" результаты. Подобного рода системы довольно широко распространены на практике. Например, если X/ имеет характер усилия, направленного на привлечение к некому z-му элементу (потребителю) дополнительного ресурса в количестве yh то обычно х/ > О дает .у/ > 0 и.У/ < 0 (/ Φ i). Такие системы весьма просты и удобны для исследования. Все что здесь в рассматриваемом контексте надо сделать — это убедиться в отсутствии абсолютно непродуктивного набора действий. Более точно, надо убедиться в отсутствии такого ненулевого вектора χ > О, что FQc) < 0. Если такой вектор отсутствует, то F заведомо является Р-отображением, причем набор действий неизбыточен (проверьте!), что дает возможность непосредственного использования теорем 2.1—2.3. Например, в модели межотраслевого баланса отображение χ -Р(х) внедаагонально отрицательно. Поэтому отсутствие абсолютно непродуктивного плана здесь является решающим условием, которое дает возможность применять теоремы раздела 2.1. Правда, соответствующие результаты были уже получены ранее другими методами (см. раздел 6.3 гл. III). 2.6. Системы с ограниченным межэлементным взаимодействием.Максимально просты для изучения системы, в которых внутренних взаимосвязей (побочных влияний) вообще нет, т.е. все j>/ = /,·(*/). В таких системах все частные производные bff/bXj при / Φ f равны нулю. Понятно, что появление малых побочных влияний до определенного предела не должно мешать успешному анализу системы. К счастью, подходящее понятие малости здесь оказывается не таким уж малым и достаточно емким. Если абсолютную величину частных производных bfjIbXj (i Φ /) принимать за количественную меру внутренних взаимодействий в системе, то ясно, что эту меру надо сопоставлять с величиной частных производных bfj/dXi. Другими словами, ограниченность (малость) взаимодействий должна быть не абсолютной, а относительной (по сравнению с влиянием собственных действий, мерой чего и являются Θ/,/Θλ:,·). Универсальными Р-отображениями по приращению являются гладкие отображения, удовлетворяющие, например, одному из следующих условий: bXf а//(х) дХ{ Σ Σ bfi(x) dXj 1 э//(*) 1 bX( J > 0, ι = 1,...,η, > 0, /=!,...,«, (2.4) (2.5) (F'(x)y,y)>0, Vx.yGR". (2.6) 159
Сделанное утаерэвдение становится очевидным, если выписать аналоги условий (2.4) —(2.6) в конечных приращениях*). Соответствующими аналогами являются следующие условия (ниже используется обозначение Δ//(*) -//(* + &х) -fi(x) и предполагается Αχ Φ 0): Δ/*(χ) Δχ* >0 (| Δχ* | =max | Δχ,1), (2.4)Δ i Σ Δf{(x) Sign Αχ(>0, (2.5)Δ ί= ι где Sign χ отличается от обычной функции sign χ только при χ = 0, принимая χ = 0 все значения из [-1,1 ]: Ϊ Aft(x) Ах{>0. (2.6)Δ ι= 1 Существование индекса ί, при котором Afi(x)Axi > 0, в перечисленных ситуациях очевидно. Таким образом, любое из условий (2.4)Δ — (2.6)Δ (равно как и (2.4) — (2.6)) является достаточным для того, чтобы F было универсальным Р-отображением по приращению (со всеми вытекающими последствиями). Рассмотрим иллюстрационный пример**). Пусть η потребителей тока параллельно подсоединены к источнику эд.с. Вольт-амперная характеристика z-го потребителя имеет вид // = <Pi(UfXi), где // - ток, U — напряжение, xt - проводимость. Источник эд.с. также будем считать нелинейным: £/= £/(/), где / = Σ7/. Функции </?/(£/, х,·) предполагаются монотонно возрастающими, U(I) монотонно убьшает. Законы Кирхгофа приводят к следующей системе нелинейных уравнений: /, = ft[tf (/),*,], /=Σ//, (2.7) i которая в указанных предположениях***) всегда имеет (проверьте!) однозначное решение Покажем, что набор функций (2.8) удовлетворяет условию (2.5)Δ. Возьмем Δχ Φ 0 и разобьем множество индексов {1,..., η } на три подмножества К>,К=, К< так, что Δχ, > 0 при ί G К>9 Δχ/ = 0 при ι G К=, наконец, Δχ, < 0 при ι £ К<. Возможны три случая: Δ/ > 0, Δ/ = 0, А1 < 0. Рассмотрим ситуацию Δ/ > 0. В силу убывания /, = *Pi[U(I), χ,] по / и воз- *) Можно поступить и по-другому: проверить, что в любой из ситуаций (2.4) - (2.6) F'{x) является Р-матрицей. **)См. [34]. ***) Разумеется, все характеристики предполагаются непрерывными. 160
растания по х( имеем Δ/,· < 0 для всех i G K< U К=. Таким образом, Δ/=ΣΔ//= Σ Д/,- Σ ΙΔ/,ΙΧ), ί /6ic>' /eλ:< υ κ= что влечет за собой (2.5)Δ. Случаи Δ/ = О, Δ/ < О разбираются аналогично. Упражнения. 2.1. Покажите, что теорема Брауэра является следствием теоремы 2.1. 2.2. Если универсальное Р-отображение по приращению F удовлетворяет условию „ Ит || F{x) || = оо, II χ II -+ °° то существует обратное отображение F-1: Rw -> Rw, которое также является универсальным Р-отображением по приращению. 2.3. Является ли композиция универсальных Р-отображений универсальным Р-отображением? 2.4. Пусть отображение F - гладкое. Покажите, что для справедливости условий (2.4) - (2.6) достаточно (соответственно) (2.4) - (2.6) и необходимо выполнение ослабленных условий (2.4) - (2.6) (с заменой знака > на >). § 3. Смещение равновесия 3.1. Законы Хикса и принцип Ле-Шателье - Самуэльсона. Основным объектом в исследованиях экономистов по задачам сравнительной статики была модель рынка с валовой заменимостью товаров. Нам удобно будет рассматривать эту модель в том виде, в каком она была описана в гл. III, IV, где мы установили, что при валовой заменимости товаров оператор F(x) является монотонным и вогнутым. В дальнейшем будут использоваться только эти свойства оператора F(x), и поэтому все результаты могут быть перенесены на любую другую систему, оператор межэлементных связей которой монотонен и вогнут. Правда, при этом неявно будет присутствовать предположение о существовании равновесия, что в случае рыночной модели обеспечивается некими другими условиями. Лемма 3.1. Пусть монотонный вогнутый оператор F(x) имеет неподвижную точку ** Ε int RJ! и F (jc°) > x°. Тогда x*> jc° . Установим сначала справедливость следующего утверждения. Если на инвариантном конусном отрезке <и°, νν°> непрерывный монотонный оператор F(x) имеет единственную неподвижную точку х* и F(x°) > >x°,TnexOe<u°, w°>,tojc*>x°. Рассмотрим последовательность xk = F(xk~l)\ начинающуюся в точке х°. В силу F(x°) >х° и монотонности F х° <.х* <·. ..<**<... W\ Монотонная ограниченная последовательность имеет предел, который в силу непрерывности f\ является неподвижной точкой F. Но поскольку неподвижная точка у F единственна, то хк -+ х* и л:0 < х*. Чтобы перейти к общему утверждению, достаточно заметить, что у вогнутого оператора F, имеющего неподвижную точку х*, всегда существует "сколь угодно большой" инвариантный конусный отрезок, включающий любую наперед заданную точку jc° Ε int R+. Таким конусным отрезком является (ϋ°, νν°> = (тх*, —ху при достаточно малом τ Ε (0, 1). D 161
Перейдем теперь к изложению законов сравнительной статики для рыночной модели с валовой заменимостью товаров. Теорема 3.1. Пусть х* - равновесный набор цен на рынке, а х*- равновесный набор цен после увеличения спроса, скажем, на первый товар. Тогда х* > х*, причем х* > х*. Последняя часть утверждения представляет собой первый закон Хикса, а первая — второй (см., например, [37]). Доказательство элементарно. Пусть опедатор F(x) описывает рынок после увеличения спроса^ тогда, очевидно, F(x) > F(x) при любом χ € int R+. Следовательно, F(x*)> > F(x*) = χ* и по^лемме 3.1. х*> χ*. Из доказательства леммы 3.1 легко видеть также, что х* > х*, так как именно f\ (x) >f\ (χ). D .Теорема 3.2. (третий закон Хикса). В условиях теоремы 3.1 возрастание равновесной цены первого товара в процентном отношении больше, чем любой другой. Допустим противное, например, х^/хп >χΐ/χ** (/ ф "). В этом случае хп х* >— jc% х„* причем по теореме 3.1 х^,1х„ ε (0,1). Но тогда Хп = /„(*·) > fn (~ *') > 4т fn (**) = К- \ хп I хп что противоречиво. G Теорема 3.3 (принцип Ле-Шателье - Самуэльсона). Пусть при увеличении спроса на некоторые товары положение равновесия рынка переходит из х* в Зс*. Пусть при таком же увеличении спроса часть цен поддерживаются на прежнем уровне (искусственно или за счет приспособления предложения) и рынок переходит в положение равновесия Зс*. Тогда Зс*«3г*. Доказательство. Пусть, для определенности, на прежнем уровне поддерживаются цены товаров с номерами / = m + 1, . . . , η (ηι< η). Введем в рассмотрение оператор Fx*. R™-►R? с компонентами //**(*) = fi(xl> · · · > xm> xm+l> · · · > χΐι)> / = 1, . . . ,/Я. Очевидно, Fx* является монотонным, а также вогнутым, так как для ^(0,1) Ъ(тхх,..., тхт, х*т + 1,... ,Хп) > Jirxx,..., гхт, тх*т+1,..., гх*) > >Tfi(xl> · · · » хт>хт+1> · · · » хп)> Легко видеть, что вектор, состоящий из первых компонент вектора Зс*, является неподвижной точкой оператора Fx*, а вектор, состоящий^из первых компонент вектора Зс"*, - неподвижной точкой оператора Fx*. Поскольку Fx*(χ) >Fx*(x), то по лемме 3.1 Зс <3с *. Π С тем же успехом приведенные теоремы могут быть применены для нелинейной модели межотраслевого баланса, если только оператор Ρ (χ) = = {Ρι(χ) > · · · >Vn(x)} является монотонным и вогнутым. Надо будет лишь в формулировках заменить увеличение спросов увеличением чистых вы- 162
пусков и несколько изменить трактовку. Перечислим соответствующие утверждения. 1. Если мы хотим увеличить чистые выпуски, то все производственные планы придется увеличивать (не уменьшать) . 2. Если мы хотим увеличить чистый выпуск уц, то в процентном отношении в наибольшей степени придется увеличить х1о. 3. Если мы хотим увеличить чистые выпуски, то, поддерживая часть производственных планов на прежнем уровне (за счет внешних закупок), результата можно достичь меньшим увеличением остальных планов, чем в случае, когда внутрисистемное потребление не компенсируется извне. 3.2. Реакция гетеротонных систем. Действие только что рассмотренных законов . сравнительной статики, вообще говоря, не распространяется на общий случай смешанных рынков. Тем не менее и в общем случае можно сделать некоторые содержательные утверждения о характере зависимости положения равновесия от изменения спроса. Правда, мы больше не будем считать, что речь обязательно идет о рынке, а будем рассматривать некую абстрактную систему с оператором межэлементных связей F (χ), который предполагается гетеротонным и псевдовогнутым. Мы ограничимся также конечномерным вариантом постановки задачи. Если раньше компоненты оператора F(x) могли произвольно "увеличиваться" или "уменьшаться", то теперь мы будем считать, что функции fi(x) меняются "пропорционально", т.е. в "измененной" системе оператор' межэлементных связей F(x) имеет компоненты //(*) = А<///(х) (Μ/ > 0). Если ввести обозначения λ ι = Ι/μ,·, Л = diag (λι, . . . , λ„), то наша задача будет состоять в изучении уравнения F(x) = Лх, (3.1) точнее, в выяснении характера зависимости решения (3.1) от Л. В частном случае V/: λ/ = λ, уравнение (3.1) переходит в F(x) = λχ, (3.2) и новое положение равновесия в системе будет собственным вектором оператора F(x), отвечающим собственному числу λ> 0. Очевидно, оператор Л"*1/*1 также является псевдовогнутым, и поэтому (3.1) на int R+ не может иметь более одного решения при любом Л (λ/ > 0). Если (3.1) имеет решение при некотором Л, то в силу псевдовогнутости F оно имеет решение и при любом Л + ΔΛ, если только ΔΛ достаточно мало по норме. Следовательно, в том случае, когда исходная система имеет положение равновесия, т.е. существует неподвижная точка У оператора F, мы всегда имеем возможность слабо "шевелить" систему, не нарушая условий существования равновесия. Последующие результаты о характере смещения положения равновесия, однако, не зависят от предположения о малости "шевелений" (о малости приращений ΔΛ), если только считать, что "деформированная" система также имеет положение равновесия. Поэтому возможны две интерпретации приводимых далее Утверждений. Можно предполагать, что равновесие существует^ лишь у исходной системы, но тогда надо считать, что Δ Λ достаточно малы по норме. Если же предполагать существование решения (3.1) при любом ^(λ,- > 0), то на ΔΛΗβτ необходимости вводить ограничения. ~~ 163
Будем писать Λχ ■< Л2, если V/: λ/! < λ/2 и 3/: λ/ι < λ/2. Через х(Л) обозначается решение уравнения (3.1). Заметим, что зависимость х(А) непрерывна. Теорема 3.4. Пусть Αι <A2uXi = x(A1)ix2 = л:(Л2). Тогда хх<х2. Доказательство. Предположим противное, т.е. jci <х2. Выберем максимальное о: > 0, при котором χ χ >ах2. Пусть λ,· <λ7· ; тогда , -/ 1 \ *Л =Xflfj(xi>xi)>XjJj[0iX2,—X2)> Но это противоречит способу выбора a. D Для удобства изложения Х{ будем называть усилием /-го элемента, а при переходе от оператора F (х) к оператору F (х) с компонентами /,·(*) = (1+е,Ш*) будем говорить, что i-я цель растет, если е,- > 0 (и убывает, если е^ < 0). Теорема 3.4 утверждает следующее. Если все или часть целей возрастают, то хотя бы одно равновесное усиление увеличивается. В дальнейшем нам потребуется более детальная информация. Нас будет интересовать более определенный ответ на вопрос, какое именно равновесное усилие возрастает. Попутно мы получим аналог третьего закона Хикса. Теорема3.5. Пусть возрастает лишь j-я цель, т.е. е;- > 0, е^ = 0 (ζ Φ f). Тогда j-e равновесное усилие строго возрастает, причем в процентном отношении оно изменяется больше, чем любое другое. Доказательство. Без ограничения общности можно считать, что положение равновесия исходной системы находится в точке χ * = {1,..., 1} (этого всегда можно добиться растяжением и сжатием осей координат (переходом к другим масштабам), что не нарушает свойств гетеротонности и псевдовогнутости системы). Пусть х— новое положение равновесия. Введем обозначения a = min х{у j3 = max jc,·. I I В силу теоремы 3.4 возможны два варианта: 1) α > 1, β > 1; 2) α < 1, β > 1. Ограничимся анализом второго случая (первый рассматривается совсем просто). Пусть, для определенности, Χι = α, χη=β и (3.3) (3.4) противоречиво (3.4). γ = minOcj, 1/х„), £ = тах(1/хь л^). Очевидно, 1 =/«(!)> fniyx, -*J>7U, l=/i(l)</i(^,J?)<^i. Если γ = 1/хЛ, το противоречиво (3.3); если ξ = l/χχ 164
Пусть тогда Ц- = а. Если по-прежнему γ = min(*y, l/x„) = l/xniто противоречивым остается (3.3). Остается возможность max(S„, Ijxj) = 3/^—но тогда снова получается противоречие: =//0)<//h- *w<|- г^ ^= т~ · (3·5) Итак, Xj = 0. Выкладка (3.5) исключает также случай £у = β < α. D Незначительным изменением хода рассуждений можно установить справедливость рледующего более общего факта. Теорема 3.6. Пусть возрастают цели лишь для некоторой подгруппы индексов GC/ = {l,...,w}, т.е. е,- > 0 при /6Gwe,- = 0 при i φ G. Тогда найдется равновесное усилие с номером / Ε G, которое строго возрастает, причем в процентном отношении больше, чем любое другое с номером i^G,u не меньше, чем любое другое с номером iE G. □ Здесь возникает любопытный вопрос. Нельзя ли на основе полученного результата утверждать, что всегда можно так подобрать пропорции роста целей, чтобы все равновесные усилия в результате возросли (или уменьшились?) Положительный ответ на этот вопрос дают результаты предыдущего параграфа, так как теорема 3.6 показывает, что зависимость равновесия от внешних воздействий описывается Р-отображением. Отметим один частный случай, в котором такие пропорции можно указать непосредственно. Теорема 3.7. Пусть оператор межэлементных связей F(x) является антимонотонными псевдовогнутым Пусть F(xi)-Xi, (1 + e)F(x2) = х2, где е > 0. Тогда х% >х\. Таким образом, если все цели возрастают в одинаковое число раз, то равновесные усилия в данной системе не убывают. Перейдем к доказательству. Выберем максимальное а, при котором х2 > осх 1# В предположении противного а< 1. Выберем максимальное j3, при котором л: ι >βχ2. В случае а < β (τ 4 х2 = (1 + e)F(x2) >(1 + б)Л — χ А > (1 + е)осх1, что противоречит способу выбора а. Пусть теперь β < а < 1. С одной стороны, Х2 =0 +e)F(*2)>(l +e)Fljx1)>(l +β)βχΐ9 откуда ос > (1 + е)/3, с другой - *i=F(*i)>f(- х2)> -^х2, \ос I 1+6 откуда β > α/(1 + е), т.е. α < (1 + е)|3. Полученное противоречие приводит к выводу а > 1. Π 3.3. Контрпримеры. Математические вопросы, рассмотренные в параграфе, обычно воспринимаются как вполне закономерные. Удивительно 165
другое. Когда речь заходит о содержательных задачах той же природы, то аналогичные вопросы о характере смещения равновесия считаются бессмысленными, поскольку "и так все очевидно". Например, если в модели сосуществования биологических видов некий вид начинает эксплуатироваться (отстрел, отлов, истребление), то считается очевидным, что его стационарная численность в равновесии уменьшится. Если же происходит обратное (а это действительно нередко происходит), то ситуацию классифицируют как таинственную аномалию. На самом же деле с точки зрения чисто математического анализа наличие подобных аномалий едва ли не более естественно, чем их отсутствие. Рассмотрим модель сосуществования биологических видов более детально. Пустьх/ -численность/-го вида,/}(х) - его стационарная численность при фиксированных численностях других видов *). Равновесие, таким образом, определяется условием *,· = /}(х) (/ = 1,..., п). Если ι-й вид мы начинаем эксплуатировать в количестве е,-, то новое равновесие определится условием Xf =/Н*)' - б/ (или же условием jc/ = (1 - δ>) f({x), если фиксируется доля (процент) эксплуатации δ,·). Естественным обычно представляется тот случай, когда равновесные численности "отстреливаемых" видов уменьшаются. Приведем два простых примера противоположного характера. На рисунках 12, 13 пунктирными линиями изображены графики функций */=//(*) —*/· В ситуации, изображенной на рис. 12, отстрел обоих видов приводит к увеличению равновесной численности второго вида (Зс2*>Х2*). На рис. 13 изображена другая ситуация, когда отстрел одного лишь первого вида приводит к увеличению его равновесной численности (Зс* > **). Требование геометрической наглядности здесь вынуждает ограничиться двумерными системами. Если число видов больше двух - картинки рисовать труднее, но возможности конструирования "аномалий" богаче. *) В данном случае //(ас) представляют собой компоненты оператора межэлементных связей. 166
Вместе с тем необходимо признать, что рассмотрение конкретных примеров создает впечатление, что некие принципиальные особенности задач сравнительной статики не улавливаются приведенными выше теоремами*). Например, в некоторых ситуациях для отсутствия "аномалий" достаточно потребовать единственности или устойчивости равновесия. Возможно, что такого рода требования и в общем случае могут взять на себя определенную смысловую нагрузку. § 4. Теоремы о пересечениях Один из возможных общих подходов к вопросу о разрешимости неравенств вида F(x) > 0 (где размерности χ и у = F (х) не обязательно совпадают) заключается в следующем. Обозначим через £,· множество тех элементов х9 для которых // (*)~> 0. Тогда разрешимость F (х) > 0 эквивалентна η условию Π 8(Φφ. Далее вопрос может решаться на основе известных i = 1 теорем о непустоте пересечения. Теорема 4.1. Пусть X - произвольное множество в R", А (х) - точечно-множественное отображение (из X в R") с компактными образами. Пусть для всякого конечного подмножества {х1,...,хк } С X выпуклая оболочка точекх1,.. . ,хк содержится в объединении U А(х1). Тогда Π А(х)Фф. Этот результат известен как лемма Кнастера -Куратовско го -Мазурке- вича (см., например, [40]). Приведем поучительное доказательство X. Бре- зиса. В силу компактности образов достаточно доказать, что не пусто пересечение любого конечного множества образов. Предположим противное, т.е. Π Α(χ') = φ (4.1) ζ = ι для некоторого множества точек х1,... ,хк. В силу (4.1) U Yi = Rny /= χ где Yi обозначает дополнение к А (х1). Пусть{р,·} - разбиение единицы в R", согласованное с покрытием {Г/}, т.е. такое, что **) к Σ pf(*)=l, suppp/СГ/. /= ι к Рассмотрим отображение φ(χ) = Σ p/(x)*f, которое, очевидно, отобра- жает в себя выпуклую оболочку со {х1,... ,хк } и по теореме Брауэра *) Это вполне закономерно, поскольку к результатам мы шли не столько от потребностей задач, сколько от имеющегося аппарата. ■**) supp ρ обозначает носитель функции р, т.е. множество тех х, для которых Р(*)>0. 1*7
имеет неподвижную точку х*. При этом ρ,·(χ*) > 0 для /, принадлежащих некоторому подмножеству индексов Μ С {1,... , к }, и р,-(х*) = 0 для i$M. Но тогда х*= Σ pax*)χ*есоΙχι:ϊGM)С U А(х*). /ем /ем Следовательно, χ* Ε A(xJ) для некоторого / Ε Μ, т.е. jc* ^ У), а значит, рД**) = 0. Противоречие. D Теорема 4.2. Теорема 4.1 сохраняет силу, если условие компактности образов заменить требованием их открытости и ограниченности. Доказательство очевидно. D Продемонстрируем теперь некоторые возможности. Рассмотрим Р-отоб- ражение F на симплексе S = {х: х> 0, IIχ II = 1} . В качестве X возьмем η вершин симплекса S: *' = {0,...,0,1,0,...,0}. (4.2) Ка#сдрй точке (4.2) сопоставим множество А(х*) = {х: fi(x)>0,xeS). (4.3) Из определения Р-отображений и теоремы 4.2 сразу вытекает, что все множества (4.3) имеют непустое пересечение, т.е. неравенство F (х) > 0 разрешимо на £. Таким образом, теорема 2.1 оказывается элементарным следствием теоремы 4.2. При этом, кстати, ясно, что требование непрерывности Р-отоб- ражения F можно ослабить. Важно лишь, чтобы все множества (4.3) были открыты. В качестве самостоятельного упражнения читатель может сформулировать и доказать аналоги теоремы 2.1 для случая различных размерностей векторов действий и результатов. Другой тип утверждений о пересечениях дает классическая теорема Хелли Теорема 4.3. Пусть В - семейство из не менее чем η + 1выпуклых множеств в Rw, причем В конечно или каждое множество из В компактно. Тогда, если каждые η + 1 множеств из В имеют непустое пересечение, то пересечение всех множеств из В не пусто. D Доказательство, большое количество приложений и масса родственных результатов имеются в [15]. Приложения к разрешимости неравенств можно проиллюстрировать следующим примером. Пусть Xf — интенсивность/-го технологического процесса, а,у — количество 1-го продукта, производимого (ау > 0) или потребляемого (я// < 0) при единичной интенсивности /-го технологического процесса. Суммарное производство (или потребление) z-ro продукта определяется суммой η / = 1 Система в целом описывается уравнением у=Ах (А= [aif])> вектор у имеет размерность m>w. Здесь естественно возникает вопрос о продуктивности модели. Можно ли так подобрать интенсивность технологических процессов, чтобы резуль- 168
тирующее производство всех видов продуктов было строго положительным? Другими словами, существует ли положительное решение неравенства Αχ>ΟΊ Теорема Хелли позволяет дать следующий ответ. Если можно обеспечить строго положительное производство любых η видов продуктов, то можно обеспечить и строго положительное производство всех видов продуктов. Для доказательства достаточно рассмотреть на (п — 1) -мерном симплексе S - {χ: χ >0, \\х II = 1} семейство множеств η Bi={x: Σ aifXf>0}, i = l,...,m. D 1=1 Легко видеть, что линейность модели здесь несущественна. Вместо Σац Xj можно взять любые выпуклые функции // (х). Функции fi(x) могут / даже не быть выпуклыми, для возможности применения теоремы Хелли достаточно, чтобы выпуклыми были множества тех*, на которых/)· (х) > 0. Упражнение 4.1. Пусть семейство В состоит из тысячи 100-мерных прямоугольных параллелепипедов с ребрами, параллельными осям координат. Покажите, что все множества из В имеют общую точку, если общую точку имеют любые два из них. Комментарии и задачи § 1. Теоремы об альтернативах уже давно стали классическими результатами, которые излагаются в любом курсе линейного программирования. По поводу Р-матриц и других родственных понятий см. [38]. Теорема 1.5 - один из важных результатов, на которых основаны линейные алгоритмы распознавания образов (см., например, [39]). § 2. Теория Р-систем, обобщающая теорию Р-матриц (см. [38]) была построена в работах [41,46,47] . Первый важный результат (здесь теорема 2.1) был указан С. Карамардианом [18]. Теорема Карамардиана послужила основой для выделения в самостоятельный объект изучения натуральных систем [35], которые по определению близки к Р-системам. Системы, удовлетворяющие условиям типа (2.4)—(2.6), многократно изучались в литературе по разным поводам (см., например, [34, 41]). В рамках теории Р-отображений можно указать ряд перспективных задач для самостоятельных исследований. 1. Теоремы § 2 утверждают существование подходящего набора действий, но не дают рецепта для его поиска. Разработка алгоритмов решения неравенств вида F(x)>0, x>0, хФО представляет обширное поле деятельности. Рассмотрим одну из возможных здесь итерационных схем. На к-м шаге вычисляется (или наблюдается) векторный результат у* - F{xk), определяется индекс / , для которого у имеет наименьшее (отрицательное) значение, и переход к вектору χ осуществляется по правилу ** + 1-x*+i* хк+.1=хк, г Фи где ξ. > 0 - некоторый шаг, величина которого выбирается неким специальным образом. На содержательном уровне подобную итерационную процедуру естественно интерпретировать как алгоритм "затыкания дыр'* (на каждом шаге подтягивается наихудший результат). Такие алгоритмы несколько лет назад пропагандировал А.В. Мали- шевский, но публикаций на эту тему нет. Автор проверял, что в частном случае, когда 169
F представляет собой Р-матрицу и все %у = 1, алгоритм сходится. Для нелинейных к Р-отображений шаги £. нужно дополнительно регулировать. 2. Определенный интерес представляет задача перераспределения ответственности в системе. Дело в том, что "закрепление*' действия х,-за результатом у ι может быть неудачным, и возникает вопрос: как найти более подходящие соответствия?Задача допускает множество вариаций. Один из конкретных вопросов: при каких условиях перенумерацией действий отображение F можно сделать Р-отображением? 3. Теорема 2.1 указывает достаточные условия разрешимости неравенства F {х) > 0. В подобных ситуациях всегда естественными выглядят попытки обобщения соответствующего результата. При этом не нужно забывать, что достоинства теоремы 2.1 заключаются не столько в ее общности, сколько в ее удобстве. Поэтому обобщать здесь можно, лишь сохраняя чувство меры. Некоторые результаты в этом направлении указаны в [46]. Было бы интересно обобщить теорию Р-отображений на случай круглых (неграненных) конусов. 4. На практике нередко встречаются системы типа "действия - результаты", в которых размерности векторов результатов и действий различны. Разработка теории таких систем была бы не только практически полезна, но и представляла бы интерес с чисто топологической точки зрения. Желающим взяться за эту задачу полезно ознакомится с теорией (л, т) -вращений [25]. Упоминавшаяся в § 4 возможность использования для подобных целей теоремы 4.2 имеет тривиальный характер. 5. Естественным образом теория Р-отображений обобщается на бесконечномерные задачи, хотя многие вопросы здесь до конца неясны. Остановимся сначала на примере обобщения в пространстве непрерывных функций С (Ω) на компакте Ω с Rn. Пусть оператор F действует в (7(Ω) и вполне непрерывен, пространство С (Ω) полу упорядочено конусом К неотрицательных функций. Отображение χ - F (χ) назовем Р-отображением, если для любого ненулевого χ G К найдется такое t е Ω, что χ (t)y {t) > 0, где y(t) = x(t)-F[x(t)]. Покажем, что неравенство χ - F(x) > 0 в этом случае положительно разрешимо. Введем вспомогательный оператор ( x(t) для t G Ω, где x(f) > 0, ( 0 для остальных t е Ω. Для ненулевых х^К будет PF(x)>x. (K.1) Действительно, в предположеении противного PF (χ) > χ для некоторого ненулевого χ > 0 будет PF(x) > 0 для тех ί.Ξ Ω, для которых χ (t) > 0,т.е. для этихГ е Ω: ΡF{x) = F(x), и условие 31 е Ω: χ (t)y (ΐ) > 0 не может выполняться (противоречие) Из (К.1) в свою очередь вытекает y(I-PF,S)=l9 где S - любая поверхность вида 5 = {х: Ох 11=Д>0, х<=К}. Следовательно, поле χ - PF (x) не может выпускать положительных направлений. Поэтому для любого у0 е К и некоторого μ > 0 уравнение x-PF{x)= μγ0 разрешимо на S. Но тогда x-F(x)>x-PF<x) = μyϋ. Если взять у0 > 0, то χ - F(x) > 0. О Понятно, что аналогичный результат можно сформулировать и доказать для пространств типа Lp, но общая форма соответствующего результата остается не вполне ясной. Важную проблему представляет поиск конкретных прикладных задач. 170
Г Л А В А VI СИСТЕМЫ С ПАРАМЕТРОМ Системы (уравнения) с параметром уже неоднократно рассматривались в предыдущих главах. Здесь собран дополнительный материал, который по большей части имеет фрагментарный характер, но затрагивает глубокие математические вопросы и соприкасается с нетривиальными и важными теориями (катастроф, бифуркаций). По этой причине цель главы заключается не столько в том, чтобы дать какие-то готовые рецепты, сколько в том, чтобы привлечь внимание и возбудить интерес к весьма привлекательным многообещающим областям исследований. § 1. Градиентные системы 1Л. ■ Вращение, индексы. Пусть имеется скалярная гладкая функция (потенциал) φ (χ) векторного аргумента χ Ε R". Потенциал φ (χ) определяет векторное поле F(x) = gradv?(x). (1Л) Во многих практически важных случаях вращение поля (1.1) удается изучать непосредственно в терминах потенциала φ(χ). При этом в процессе исследования часто удобно переходить к изучению полей χ ~ Ut (χ), где Ut — оператор сдвига по траекториям векторного дифференциального уравнения --^=-grad ¥>(*)· (1-2) at Ниже предполагается, что решения (1.2) однозначно определяются начальными условиями и определены для всех t > О (продолжимы на полуось [0f-)). Лемма 1.1. Пусть градиентное поле (1.1) невырождено на границе ограниченной области Ω. Тогда при любом t>0вращения полей F(x) = = grad \р(х)и χ - Ut(x) на Ω совпадают, т.е. y{F,a)=y{i-ut9&). (1.з) Доказательство. При движении (1.2) значение потенциала φ не возрастает, а при прохождении траектории через Ω - строго убывает. Поэтому траектория, начавшаяся в точке χ (0)£ Ω, не может снова вернуться в точку л: (0). Следовательно, при ΐ>0 все полях - Ut(x) невырождены 171
на Ω, а значит, гомотопны друг другу (поскольку Ut(x) непрерывно по совокупности переменных). Действительно, пусть 0 < t0<ti. Поля χ - Uto (χ) их - Uti (x) связьшает гомотопия H(x,r)=Uto + T(ti_tJx). Таким образом, для установления равенства (1.3) достаточно убедиться в справедливости (1.3) хотя бы при одном t > 0. Но при достаточно малых / > 0 очевидно, что поля -grad φ (χ) и χ - Ut(x) гомотопны на Ω, так как не противоположно направлены. D Градиентное поле в формулировке леммы 1.1 можно заменить на произвольное, но тогда дополнительно надо потребовать, чтобы каждая траектория уравнения χ = — F(x) не возвращалась в исходную точку х(0) Ε Ω (что в случае градиентного поля обеспечивается автоматически). Лемма 1.1 приводит к интересной и часто плодотворной идее нелинейного гомотопического перехода. Гомотопность полей F0 и Fi на Ω можно пытаться доказывать по следующей схеме. Вводятся в рассмотрение дифференциальные уравнения χ = — F0 (χ) и χ = - Fx (x). Далее рассматриваются соответствующие операторы сдвига U^nU) и устанавливается гомотопность полей χ - U%x) их - U\{x) на Ω, например, при достаточно больших t >0. Перейдем теперь к определению индексов особых точек градиентного поля. Пусть х* — изолированный нуль поля (1.1) ив точке х* функция φ(χ) принимает локально минимальное значение. В этом случае решения (1.2) ^ начинающиеся в некоторой окрестности W точки х*, равномерно сходятся к х*, т.е. Utx-+x* при f-*°° равномерно по χ Ε W. Но тогда для любого г > 0 имеет место равномерная сходимость U*(x) = Uk7(x)-»x· при *->«>, т.е. оператор ^удовлетворяет условиям теоремы 3.17 (гл. II). Поэтому ind(/ - UT, х*)- 1 и лемма 1.1 приводит к равенству ind(gradvK*),**) = l. (1.4) Близкий по характеру результат получается для вращения градиентного поля на сферах достаточно большого радиуса. Теорема 1.1. Пусть градиентное поле (1.1), невырожденное при достаточно больших по норме χ, удовлетворяет условию lim φ(χ) = <*>. (1.5) II χ Ι) -*· ~ Тогда ind (grad φ(χ), «>) = 1. Для доказательства воспользуемся переходом к полю χ — Ut (x) (лемма 1.1) и покажем, что вращение последнего на сферах большого радиуса равно 1 при достаточно больших t > 0. Обозначим через Ω (R) множество тех элементов jc, для которых φ(χ) <α, где а = max { φ(χ) : II χ II < R } . Заметим, что из (1.5) вытекает ограниченность Ω(Λ) при любом фиксированном R. 172
Цусть при II χ II >Rq поле (1.1) невырождено. Выберем/?! так, чтобы шар> \\ χ \\<Ri содержал Ω(#0). Движение (1.2), начинающееся на сфере II χ II = Ri, не может выйти за пределы Ω(#ι) и при достаточно больших ί > 0 попадает и остается в Ω(^0), так как норма градиента на Ω(Rι) \ Ω(/?ο) ограничена снизу некоторой положительной величиной. Поэтому при достаточно больших t > 0 оператор Ut отображает шар II* \\<Rl в себя, откуда у (I-Ut,S) = 1,где5 = {* : \\х II =Rj . D Таким образом, градиентные поля с растущими потенциалами, удовлетворяющими условию (L5), могут использоваться в качестве стандартных для сравнения с изучаемыми полями. 1.2. Локальные и глобальные минимумы. Свойства градиентных систем во многом определяются наличием и характером критических точек потенциала φ. Особую роль играют критические точки, имеющие характер локального минимума. Дело в том, что критические точки обычно определяют равновесие системы, которое *в случае локального минимума оказывается асимптотически устойчивым*). Широко известно следующее, достаточное условие. Если в критической точке х* матрица [Э2 φΙ bxt bxj ] положительно определена, то х* — точка локального минимума. За пределами этого результата начинаются серьезные трудности. Распространен миф, что характер (тип) критической точки определяется минимальным невырожденным отрезком ряда Тейлора (первой ненулевой струей), но это не так. Полное (причем нетривиальное) решение этого вопроса дается в теории катастроф. В задачах, связанных с определением типа критической точки, встречается много интуитивно неожиданных моментов, йот простейшая ловушка. Имеется гладкая функция двух переменных φ(χ, у) с нулевой критической точкой. Сужение φ на любую прямую, проходящую через нуль, дает функцию, принимающую в нуле локально минимальное значение. Является ли нуль точкой локального минимума φ(χ, у)1 Интуиция, воспитанная на простых примерах, дает положительный ответ. Правильный ответ — отрицательный. Пусть, например, Ф,у) = (у-2х2)(у-х2). (1.6) На любой прямой у = ах (0 < Ι α I < °°) функция Ф(х) = {Р(х> <*х) = (ах - 2*2) (αχ - х2) = а2х2 - За*3 + 2х4 принимает в нуле локально минимальное значение, поскольку ф"(0) = = 2а2 > 0. Рассмотрение прямых д: = 0, у = 0 приводит к тому же заключению. Тем не менее нуль не является точкой локального минимума функции (1.6), поскольку в сколь угодно малой окрестности нуля φ(χ, у) принимает не только положительные, но и отрицательные значения. На рис. 14 область, на которой φ(χ, у) принимает отрицательные значения, обозначена штриховкой. Существенный интерес часто представляет глобализация задачи. В одномерном случае локальный минимум при отсутствии других критических точек является одновременно глобальным минимумом. В общем (многомерном) случае это не так (постройте пример!). *) Например, если динамика системы описывается уравнением типа (1.2). 173
Теорема 1.2. Пусть χ* - точка локального минимума функции φ(χ) (χ G Rn)f причем grad φ (χ) Φ 0 при χ Φ χ* и выполнено одно из условий lirn φ(χ)=°ο, (υ) Я X II -+ео llgradv?(jc)ll>e0>0 при Их \\>г0 > 0. (1.8) Гогдд в χ*достигается глобальный минимум функции φ(χ).Π Упражнение 1.1. Покажите, что (1.8) влечет за собой справедливость (1.7). 1.3. Деформации градиентных систем. Пусть Φ обозначает класс гладких функционалов φ (χ) с единственной в шаре II χ IK 1 нулевой критической точкой. Функционалы φ0 (χ) и ^(х) назовем гомотопными в Ф, если существует непрерывная деформация φ (χ, λ) Ε Φ при любом λ G [0,1 ] такая, что φ (χ, 0) = φ0 (χ), φ(χ, 1) = φ~ϊ(χ). Теорема 1.3. Если φ0 (χ) и φχ (χ) гомотопны в Φ и нуль - точка локального минимума ψο(χ), то нуль - точка локального минимума ¥>ι(*). Доказательство. Обозначим через Л множество тех λ £ [0,1], при которых нуль - точка локального минимума φ(χ, λ). Очевидно, Л открыто в [0, 1]. Теорема будет доказана, если установить замкнутость Л (это повлечет за собой Л Ε [0, 1]). Пусть при некотором λο £ [0, 1] функция φ(χ, λο) имеет в точке χ = 0 локальный минимум. Обозначим через Ω0 связную компоненту лебегова множества Ω= { χ : φ(χ\ λ0) < max φ(χ, λο), Их IK 1} , Их I<1 содержащую* точку χ = 0. Пусть ρ — радиус максимального шара с центром в χ = 0, который содержится в Ω0. Покажем, что ρ допускает оценку снизу, не зависящую от λο. Положим a = min {II grad </>(*> λ) II: 1/2 < Их II < 1,λΕ[0,1]} , j3 = max{llgradv?(x, λ) II: Их II < 1, λ G [0,1]} . Пусть χ ο (t)~ — решение задачи Коши χ = - grad φ(χ, λ0), x(0) = Xo> гдех0 ^ Ω0 и llx0H = i. Поскольку II х0(0 И -* 0 при г -+°°9 то при некотором ΐ0 будет ИхоОо) И = 1/2. Пусть г о — первый момент времени, при котором Н*о(/о) II = 1/2. Очевидно, h > 1/(20). (1.9) 174
Рассмотрим теперь функцию μ (г) = φ [хо*(0> λο]. Легко видеть, что da — =-(gradv? Ы*)М)2 < -а2. (1.10) at а2 Теперь в силу (1.9), (1.10) *о , ^ФоДо)^^^), λ0] - f p(s)ds>a2t0 > о 2β С другой стороны, с < ρβ. Поэтому р>а2/ (20*). (1.11) Пусть теперь λ^ -► λ* Xk G Λ. В силу (1.11) точка χ = 0 будет точкой глобального минимума функций φ(χ, Хк) в шаре II χ II < α2/(2β2). Следовательно, χ = 0 — точка глобального минимума в этом шаре и предельной функции ψ (χ, λ*), т.е. λ*€ Λ, что означает замкнутость Λ. D Укажем полезное обобщение теоремы 1.3. Обозначим через Φ(Ω) класс гладких функционалов φ : R" -► R с единственной (не обязательной фиксированной) на замыкании области Ω критической точкой χ* (φ}, причем в случае χ*(φ) £ Ω критическая точка должна быть невырожденной*). Функционалы *Ро(х) и φ%(χ) назовем подвижно гомотопными βΦ(Ω) , если существует непрерывная деформация φ(χ, λ) € Φ (Ω) при любом λ е [0, 1] такая, что φ (χ, 0) = ^0(х), φ(χ> 1) - ^iW. Таким образом, ситуация обобщается в следующих направлениях: 1) Вместо шара допускается рассмотрение произвольной области Ω. 2) При деформации критическая^точка может двигаться, но, как и прежде, должна быть единственной в Ω при любом λ £ [0, 1]. 3) В процессе деформации допускается выход критической точки на границу Ω, но при выходе на границу критическая точка должна становиться невырожденной. Теорема 1 А. Пусть *Ро(х) и φχ(χ) подвижно гомотопны в Φ(Ω) и φ0(χ) имеет_локальный минимум в Ω. Тогда φχ(χ) также имеет локальный минимум в Ω. D Продемонстрируем возможности теоремы 1.4 на классическом примере. Докажем, что среднее арифметическое больше среднего геометрического: а0 + ...+αΛ^ > уа0...ап_г . (1.12) η Перепишем неравенство (1.12) в виде 4 + . ·. +*„2_ι -Ч*о . · -xn-i)lln > °> О·13) где а\ - х? . Зафиксируем хо > 0 и рассмотрим деформацию φ(χ, λ) = χ2, t. ·. +^_! - Xw(x0 ... хп)21п , д2<р *) Невырожденной должна быть матрица вторых производных bxjbXj 175
где χ = { Χιι,..., χη_ j} , на множестве Ω={χ:χ>0, Нх1КД}, Λ достаточно велико. Легко проверить, что система уравнений SjJL.iL-x^-'-^l. L χ.· J Э v =21 χζ·-λ v "~"^ | = 0, /=1,...,и-1, θ χ,- имеет в Ω при любом λ Ε [0f 1] единственное решение χ,- = λη/2 χ0, которое лишь при λ = 0 лежит на границе Ω. Очевидно, φ(χ, 0) имеет невырожденный минимум. Поэтому φ(χ, 1) достигает минимума в точке х, в которой все Xf = х0. Π Другой пример. Пусть решается задача ¥?(x)-»min, ψ(χ) = 0. (1.14) Известно, что в гладком случае решения (1.14) надо искать среди критических точек лагранжиана Ц*, λ) = ¥>(*)-λ Ψ(*)· (1.15) Допустим, критическая точка (1.15) единственна. Является ли она решением (1.14)? Обычно в техническом отношении это довольно трудный вопрос. Приходится выписывать достаточные условия второго порядка, но и они могут не дать ответа в вырожденном случае. Приведенные выше теоремы дают другую возможность. Если критическая точка L (χ, λ) по χ единственна при любом λ и при некотором λ (например, при λ = 0) является точкой минимума L(x, λ), то решение системы уравнений λ =0, /а1г..,и, Эх/ Эх,- ψ(χ) = 0 является локальным решением задачи (1.14). Уточнить детали и возвести это соображение в ранг строгого утверждения предоставляется читателю. Заметим, что теоремы 1.3, 1.4 остаются справедливыми при деформациях функционалов с векторным параметром λ. Поэтому аналогинным образом можно рассматривать задачи типа (1.14) с несколькими рграниче- ниями. Последний пример. Пусть динамика некоторой системы описывается системой дифференциальных уравнений χ = - grad φ(χ, λ), (1.16) зависящей от параметра λ (не обязательно скалярного). Если при любом λ (1.16) имеет единственное положение равновесия и при λ = 0 это положение равновесия асимптотически устойчиво, то оно асимптотически устойчиво при любом λ. Уточнения опять-таки предоставляются читателю. 1.4. Седловые точки. По известной лемме Морса в некоторой окрестности V невырожденной критической точки функции ψ всегда молено ука- 176
зать такую локальную систему координат х1,. .. , хП9 что *) φ = χ\ + ...+*? -х,2+1 -...-x2, (1.17) на К Функция вида (1.17) называется морсовским l-седлом (при/ = 0имеем максимум, при 1 = п — минимум). Указанный результат дает по существу полную классификацию невырожденных критических точек. Для вырожденных критических точек такой классификации нет. Простой пример изолированной вырожденной критической точки — обезьянье седло, которое описывается функцией двух переменных φ(χ,γ)=χ3 -Зху2 К определенной терминологической путанице приводит другое важное понятие седловой точки, являющейся решением следующей задачи (см. раздел 6.2 гл. II): min max φ{χ,γ)= max min φ{χ,у). (1.18) yG Υ χ<ΞΧ χ<ΞΧ γ<Ξ Υ По поводу этой задачи отметим важный результат. Теорема 1.5. Пусть X сКп, У CR - выпуклые компакты, функция φ(χ, у) непрерывна, множества Arg min φ(χ, у), Arg max φ(χ, у) (1.19) у€У χ<ΞΧ стягиваемы (например, выпуклы) при любых (х, у) е X X У. Тогда φ(χ, у) имеет седловую точку, в которой обеспечивается равенство (1.18). Доказательство получается объединением технического приема, описанного в разделе 6.2 (гл. II), с утверждением теоремы 6.13 (гл. II). D Упражнение 1.2. Пусть X = Υ = Rw, функция φ(χ, у) непрерывна, множества (1.19) выпуклы при любых х, у G R" и (х, Arg min^x, у)) <х2, (у, Arg max φ(χ, у)) < y<ERn χ<ΞΚη <у2 на границе некоторой области Ω, содержащей 0. Тогда φ(χ, у) на Ω имеет седловую точку в смысле (1.18). 1.5. Принцип Ле-Шателье — Самуэльсона. Рассмотрим задачу на условный экстремум φ(χ, λ) -> min, x GXK, (1.20) зависящую от векторного параметра λ G Λ. Предположим, что при любом λ € Λ множество Х\ не пусто и задача (1.20) имеет решение. Множество решений (1.20) при любом λ Ε Λ обозначим через Ω(λ). Пусть λ!,λ2 £Λ и Χι ΞΩ(λι), Хг Ε Ω (λ2). Очевидно, φ(χι , λι ) < φ(χ2 , λ, ), φ(χ2, λ2 ) < φ(χχ, λ2 ), откуда ψ(Χι, λ! ) - φ(χϊ, λ2 ) < φ(χ2 , λι ) - φ(χ2, λ2 ). (1.21) *) Обратим внимание, что здесь речь идет о приведении к диагональному виду 4 путем выбора подходящей локальной системы координат не квадратичной формы, а произвольной (в достаточно широком смысле) функции! 177
В частном случае Л С R'1, XK=XCRn, *(*,λ) = Ψ(*) + (λ.χ) (1.22) неравенство (1.21) приводит к следующему результату: (*ι -*2, λ! -λ2)<0, (1.23) который принято назьшать принципом Ле-Шателье - Самуэльсона для экстремальной задачи. Рассмотрим одну из возможных экономических интерпретаций. Пусть фирма закупает набор ресурсов χ ={л:ь ..., хп) по ценам λ ={ λχ,..., λ„) и от переработки х получает доход /(*). Максимизация прибыли f(x) - - (λ, χ) эквивалентна задаче минимизации функции (1.22), где ф(х) = = —f(x). Из неравенства (1.23) в этом случае вытекает, что при увеличении цены на некоторый вид ресурса объем закупки этого ресурса убьюает. Такая интерпретация показывает, что принцип Jle-Шателье - Самуэльсона для экстремальной задачи ближе по духу к первому закону Хикса, чем к утверждению теоремы 3.3 (гл. V). Более подробно вопросы, связанные с влиянием внешних условий (параметров) на решение оптимизационных задач, будут обсуждаться в следующей главе. Пока же обратим внимание, что в достаточно свободных предположениях неравенство (1.23) будет строгим (разумеется, если λχ Φ λ2). Тогда можно утверждать, например, что система "цены — закупаемые ресурсы" является Р-системой (и даже универсальной Р-системой). § 2. Динамические характеристики равновесия 2.1. Устойчивость. Рассмотрим автономную систему дифференциальных уравнений dx — '*■(*), (2.1) at имеющую изолированное положение равновесия х* = 0. Через Ut обозначим оператор сдвига по траекториям (2.1) : χ(ΐ) = Utx(0). Важной локальной характеристикой равновесия является его устойчивость. Равновесие х* называется устойчивым (по Ляпунову), если по любой окрестности V точки х* можно указать окрестность W такую, что движение, начинающееся в W, не выходит за пределы К, т.е. xew=*utxev, t>o. Равновесие χ* назьюается асимптотически устойчивым, если оно устойчиво и все траектории, начинающиеся в некоторой окрестности х*, сходятся к х*. Упражнение 2.1. Постройте на плоскости пример динамической системы с единственным положением равновесия, которое не является устойчивым, но к нему сходятся все траектории. Устойчивость равновесия определяется "статическим устройством" оператора F в малой окрестности jc*. Необходимым условием асимптотичес- 178
кой устойчивости χ* является равенство ind(-F,x*) = l, достаточным - гурвицевость *) матрицы [Э///Эд:7· ] в точке х*. Теория устойчивости слишком обширна, чтобы здесь можно было говорить о ней сколько-нибудь подробно. Ниже рассматриваются некоторые фрагменты, естественным образом примыкающие к содержанию книги. 2.2. Деформационные критерии устойчивости. Обозначим через Φ класс динамических систем вида (2.1), которые в некотором шаре || χ \\ <г имеют единственное положение равновесия х* = 0. В случае принадлежности системы классу Φ будем писать F £ Φ. Системы dx dx dt dt из Ф назовем гомотопными, если существует дифференциальное уравнение dx — =Η(χ,λ) (2.2) с непрерывной по совокупности переменных правой частью Н(х, λ) (χ Ε R" λ Ε [0,1]) такой, что Я€ Φ при любом фиксированном XG [0,1] и Н(рс, 0) = F0 (χ), Щх, 1) = Fx (χ), || * || < г. С помощью гомотопического перехода Н(х, λ) правую часть F(x) часто можно деформировать в существенно более простое (с точки зрения изучения) отображение G(x). Поэтому естественно задаться вопросом об общности характеристик гомотопных систем дифференциальньгх уравнений. Интересные результаты в этом направлении получили Н.А. Бобылев и М.А. Красносельский, показав, что даже такие "близкие" системы, как система с устойчивым равновесием и система с асимптотически устойчивым равновесием, могут быть не гомотопны. В то же время очевидно, что системы, весьма "далекие" друг от друга по динамическим характеристикам, могут быть гомотопными, например, χ =хих = -хв четномерном пространстве. Тем не менее, можно ожидать, что при некоторых сужениях класса рассматриваемых динамических систем определенные динамические свойства будут сохраняться при деформациях. Далее изучаются условия, в которых гомотопический переход сохраняет свойство асимптотической устойчивости равновесия. В предыдущем параграфе была установлена инвариантность свойства асимптотической устойчивости к деформациям градиентных систем. Пусть S обозначает класс всех внедиагонально монотонных в окрестности нуля отображений, т.е. отображений F, удовлетворяющих условию -^ >0, гФ]9 II χ II < г. (2.3) Эху *) Матрица называется гурвицевой, если весь ее спектр лежит в левой открытой полуплоскости. 179
Теорема 2.1. Если гомотопия Н(х, λ) внедиагонально монотонна при любом λ Ε [0, 1], то свойство асимптотической устойчивости равновесия сохраняется при деформации. Доказательство. Пусть Rn полуупорядочено неотрицательным ортантом R". Внедиагональная монотонность правой части дифференциального уравнения влечет за собой обычную монотонность оператора сдвига по траекториям этого дифференциального уравнения. Отсюда в свою очередь легко следует, что необходимым и достаточным условием асимптск тической устойчивости нулевого равновесия дифференциального уравнения с правой частью из S является следующее условие А: существуют точка у Ε int R+, идущая под действием оператора сдвига назад, и точка ζ Ε Ε int R", идущая под действием оператора сдвига рперед. Достаточность очевидна, необходимость вытекает из принципа Браудера и рассуждений, аналогичных тем, которые будут использованы ниже. Таким образом, для доказательства теоремы достаточно установить инвариантность условия А по отношению к деформациям в классе S. Отметим сначала, что деформации в классе S сохраняют К-индекс, причем для асимптотически устойчивого равновесия системы Jc = F(x) ind*(-F,0) = l. (2.4) Из (2.4) следует, что отображение — F(x) не может "выпускать направление", т.е. для любого hGRn+ можно указать такую точку χ Ε R", что -F(x)-ph (μ>0). Если взять hEint R", то из (2.3) вытекает, что точка х, в которой F(x) = —μ/г, также принадлежит внутренности неотрицательного ортанта. Но ЯХИ-μΛ, /zEintR?, означает, что точка χ Ε int R^ под действием оператора сдвига идет назад. Наличие точки χ Ε int R^_, идущей под действием оператора сдвига вперед, устанавливается аналогично. D Как уже отмечалось, для асимптотической устойчивости нулевого равновесия дифференциального уравнения с правой частью из класса S необходима и достаточна справедливость условия А. Последнее в свою очередь равносильно одновременному выполнению требования (2.4) в R" и R" . Но (2.4) в R" (R") означает, что существует невырожденная гомотопия H(xfX)ES, определенная на R" (Rl). Таким образом, георему 2.1 можно усилить, предполагая, что гомотопия Н(х, λ) ΕS определена лишь на R+ и R". Более того, в этом случае становится очевидно, что теорема 2.1 верна в обратном направлении, т.е. ее предположения имеют характер необходимых и достаточных условий. Теорема2.1 допускает обобщение еще в одном направлении. Ее доказательство можно переделать, полностью переходя на язык операторов сдвига по траекториям изучаемых дифференциальных уравнений. При этом существенной оказывается лишь монотонность операторов сдвига, причем R+ можно заменить произвольным телесным конусом К. Проведем некоторые приготовления для формулировки результата, отражающего указанные обобщения. Пусть К обозначает некоторый телесный конус в Rn. Через S (К) обозначим множество систем (2.1) (ото- 180
бражений F(x)) таких, что оператор сдвига по траекториям (2.1) монотонен (по конусу К) *). Две системы из S(K) назовем S-гомотопными (в окрестности нуля), если существует связывающая их деформация Η (χ, λ), определенная и не вырожденная на пересечении некоторой окрестности нуля с множеством { — К UK}\ {0}и удовлетворяющая следующему требованию: оператор сдвига по траекториям (2.2) при любом λ € [0, 1] определен и монотонен (по К) на {- К U К). Теорема 2.2. Пусть система (2.1) из S(K) имеет асимптотически устойчивое положение равновесия х* = О.Для того чтобы положение равновесия х* = 0 системы χ = G(x) из S (К) было асимптотически устойчивым, необходимо и достаточно, чтобы эта система была S-гомотопна системе (2.1). D При изучении гетеротонных систем каждой системе (2.1) стандартным образом сопоставляется сопутствующая система дифференциальных уравнений dv л dw л — = F(v,w)9 — = F(w,v). (2.5) dt dt При этом из асимптотической устойчивости нулевого равновесия системы (2.5) вытекает асимптотическая устойчивость нулевого равновесия системы (2.1) (но не наоборот). В то же время по определению гетеротонных систем система (2.5) принадлежит некоторому классу S (К) в пространстве R2w. Это дает возможность при изучении асимптотической устойчивости гетеротонных систем использовать теоремы 2.1, 2.2. Формулировка соответствующих результатов здесь очевидна. Как в § 1, так и здесь выделены классы отображений, деформации в которых сохраняют свойство асимптотической устойчивости. Естественный интерес представляло бы выделение более широких классов, обладающих таким свойством. Этот вопрос легко решается в полном объеме для линейных систем. Теорема 2.3. Пусть С+ обозначает множество матриц, квадраты которых не имеют отрицательных собственных значений. Пусть матрица А гурвицева. Тогда для гурвицевости матрицы В необходимо и достаточно существование в С* невырожденной деформации от А к В. Дело в том, что при деформациях непрерывных систем спектр матрицы меняется непрерывно, а поскольку в С+ матрицы не могут иметь чисто мнимых собственных значений, то невырожденная деформация в С+ не может перевести собственные значения матрицы из левой полуплоскости в правую (и наоборот). Необходимость доказывается немного сложнее. D 2.3. Системы сравнения. Изучение нелинейных задач часто пытаются свести к исследованию более простых задач. При этом упрощения обычно связываются с понижением размерности. Несколько необычный в этом отношении пример дают гетеротонные системы, где переход к вспомогательным задачам типа (2.5) сопровождается увеличением размерности. Ниже рассматривается другой метод такого же характера, который задачу из R* *) Для гладких отображений F(x) это равносильно требованию, чтобы оператор F'(x) был К-отображением. 181
переводит в пространство матриц. Этот метод (матричных систем сравнения) был предложен в [57] и удивителен тем, что позволяет использовать "конусные соображения" в задачах, которые на первый взгляд никакими свойствами положительности или монотонности не обладают. Рассмотрим систему дифференциальных уравнений i=At,x), (2.6) где χ £ R" — вектор-столбец, а правая часть удовлетворяет неким условиям, обеспечивающим существование, единственность и нелокальную продолжимость решений (2.6), причем/(f, 0) = 0, т.е. χ = 0 является положением равновесия системы. Далее нас будет интересовать вопрос об асимптотической устойчивости *) нулевого положения равновесия системы (2.6), который мы будем изучать, исследуя вспомогательное дифференциальное уравнение в пространстве матриц. Пусть пространство Ε симметрических матриц η Χ η полуупорядочено конусом К неотрицательно определенных матриц. Очевидно, int A' — множество положительно определенных матриц. Если матрица U невырождена, то из Н€К, Η £ int А' вытекает соответственно UHUTSK, UHUTGintK. (2.7) Полагая в (2.7) U = H~l, получаем HemtK^H"1 GintA. (2.8) Фиксируем произвольную матрицу U0 £ int К и положим ||/nice«inf<7: -yUo<H<yU0}. (2.9) Очевидно, (2.9)-обычная U0 -норма. Норму в Кп определим так: IUH = (хтЩ1х)Ч2. (2.10) В дальнейшем важную роль будет играть оператор Н(х) = хх ту отображающий Rn на границу конуса К. Покажем, что \\Н{х)\\и9= ||*Ц*. (2,11) Так как Н(х) € К для любого χ € Rn, то в данном случае \\H(x)\\Uq =inf{7: xxT<yU0}=7o. Нам надо показать, что γ0 -хтЩ1х, т.е. (xTUolx)U0 -xxTeK (2.12) и, при любом е>0, (xTUolx-e)U0 -ххт4к. (2.13) В силу неравенства Б^уняковского - Шварца для любого с £ R" имеем cT[(xTUolx)U0 -ххт]с = (сти0с)(хтЩ1х)-(стх)2 = = (стс)(х тх)-(стх)2, где ст = cTUl12, χ τ = xtUq112. Это обеспечивает справедливость (2.12). *) Для неавтономной системы асимптотическая устойчивость определяется аналогично предыдущему (с очевидными видоизменениями). 182
Положим теперь с1 = xjUq. Для е>0 имеем cT[(xTUolx - e)U0 - ххт] с = - exTUolx <0, что гарантирует справедливость (2.13). D Рассмотрим теперь в пространстве Ε дифференциальное уравнение S = F{t,S), (2.14) правая часть которого, как и в (2.6), удовлетворяет неким условиям, обеспечивающим существование, единственность и нелокальную продолжимость решений (2.14). Матричное дифференциальное уравнение (2.14) назовем системой сравнения для уравнения (2.6), если в числе своих решений оно содержит решения S(t), связанные с решениями*(г) уравнения (2.6) соотношениями Н[х(р)] =5(0), H[x(f)\<S(f), f >0. (2.15) Из (2.15) и (2.11) следует ll*(0ll2<IIS(0lliv Поэтому устойчивость, асимптотическая устойчивость нулевого решения (2.6) вытекают из аналогичных свойств системы сравнения (2.14). Будем говорить, что уравнение (2.14) принадлежит классу Μ (F Ε Μ), если для его любого решения S (t) и функции P(t), удовлетворяющей дифференциальному неравенству P<F(t,P), из P(0)«S(0) следует P(t)<S(t) при Г >0. Из определения следует, что в случае F ЕМ оператор сдвига по траекториям (2.14) монотонен, т.е. для любых двух решений Sx{t) и S2(t) из Sl(Q)<S2(0) следует Si(t)<S2(t) при t >0, Прежде чем двигаться дальше, остановимся на простом примере, иллюстрирующем суть подхода. Рассмотрим автономную линейную систему х = Ах, (2.16) где матрица А не обязательно симметрическая. Диференцируя Н(х) вдоль траекторий (2.16), получаем — (ххт) = ххтАт +Аххт dt Таким образом, Н = НАТ+АН (2.17) можно взять в качестве системы сравнения для уравнения (2.16). Решениями (2.17) служат функции H(t) = eAtH(0)eATt Из Н1(0)>Н2(0) следует eArHl(0)eATt--eAtH2(0)eATt^eAt[H1(0)-H2(0)]eATt>0f что означает монотонность оператора сдвига по траекториям (2.17). 183
Для того чтобы нулевое положение равновесия системы с монотонным ператором сдвига было асимптотически устойчиво, достаточно, чтобы нашлась точка Χ Ε int К> которая под действием оператора сдвига идет назад, и точка Υ Ε — int К, идущая вперед. В данном случае наличие таких точек гарантирует разрешимость в int К уравнения H0AT+AH0=-G0 (2.18) при G0 Ε int К. Если матрица А гурвицева (все сооственные значения имеют отрицательные действительные части), то интеграл Я0= feAtG0eATtdt о сходится и является решением уравнения (2.18) (проверьте!). Таким образом, переход к системе сравнения и использование конусных соображений позволяют для произвольной линейной системы установить необходимые и достаточные условия асимптотической устойчивости. Это указывает на перспективность подхода и дает надежду на получение иных результатов. Вернемся к нелинейной системе (2.6). Продифференцируем Η(х) вдоль траекторий (2.6): H = xfT(t,x)+f(t,x)xT. Если имеют место неравенства H = xfT(tt x)+f(tt x)xT<F(tt H) и F E Mt то ясно, что S = F(t, S) можно использовать в качестве системы сравнения. Эффективность предлагаемого подхода во многом зависит от наличия критериев, гарантирующих принадлежность используемых систем сравнения классу М. Другими словами, необходим набор удобных теорем о дифференциальных неравенствах для матричных дифференциальных уравнений в пространстве, полуупорядоченном конусом К неотрицательно определенных матриц. Эта проблема детально не изучалась, и здесь можно ожидать появления интересных результатов. Простыми примерами, в которых соответствующие теоремы о дифференциальных неравенствах легко устанавливаются, могут служить матричное дифференциальное уравнение Ляпунова S = SAT(t)+A(t)S (2.19) и матричное дифференциальное уравнение Риккати S = SA T(t) + A(t)S + SD(t) S, (2.20) где A(t) и D(t) — ограниченные непрерывные матрицы лХл. Поскольку первое уравнение — частный случай второго, оба случая охватываются следующим результатом. Теорема 2.4. Пусть S(t) является решением (2.20) a P(t) удовлетворяет дифференциальному неравенству P<PAT(t)+A(t)P + PD(t)P. (2.21) 184
Тогда из P(0)<S(0) вытекает P(t)<S(t) при t>0. Доказательство. Запишем (2.21) в виде P = PAT(t)+A(t)P + PD(t)P-G(t), G(t)eK. Для Q(t) = S(t)-P(t) имеем Q = QBT(t)+B(t)Q + G(t)y (2.22) где β(0)ек, B(t)=A+PD + QD/2. Решением (2.22) является Q{t) = U(t, 0) β(0) UT(t, 0) + -fU(t, s)G(s) UT(tf s)ds, о где U(tj s) — оператор сдвига по траекториям дифференциального уравнения X = B(t)X. Теперь Q(t) G К при t > 0 вытекает из <?(0) Е^и свойства (2.7).D 2.4. Равновесие гетеротонных систем. Рассмотрим неавтономную систему dx — =F(t,x) (2.23) и, как обычно, будем предполагать, что правая часть (2.23) удовлетворяет неким условиям, обеспечивающим существование решения, его единственность и нелокальную продолжимость. Изучение подобного рода условий представляет собой самостоятельную достаточно интересную и весьма важную задачу, обсуждение которой не входит в наши намерения *). Пусть x(t, s, x0) обозначает решение дифференциального уравнения (2.23). Оператор U(t, s), определяемый равенством U(tf s)x0 = x(t, s,x0), (2.24) называется оператором сдвига по траекториям дифференциального уравнения (2.23). В естественных предположениях функция (2.24) непрерьюна по совокупности всех переменных t, s и *ο· В случае автономной системы дифференциальных уравнений dx/dt = F(x) оператор сдвига U(t, s) по существу является лишь функцией разности аргументов г = t — s и для его обозначения используется более компактная запись £/т. Многие задачи, связанные с изучением свойств дифференциального уравнения (2.23), удобно рассматривать в терминах оператора сдвига по траекториям (2.23). В связи с этим возникает необходимость установления различных связей между свойствами правых частей дифференциального уравнения и свойствами соответствующего оператора сдвига. Приведем несколько результатов из этой области. Будем говорить, что правые части дифференциального уравнения (2.23) обладают свойством внедиагональной положительности, если при любом / fi(t, хх,.... Xi-i,0,Xi + i,.... xm)> 09 Xj > 0, / = 1,..., i - 1, ι + 1,.. ., m. *) Заинтересованный читатель может обратиться к [24]. 185
Лемма 2.1. Пусть правые части дифференциального уравнения (2.23) обладают свойством внедиагональной положительности. Тогда оператор сдвига U(t, s) (t > s) по траекториям (2.23) положителен *). Доказательство. Рассмотрим вспомогательную систему dxi —- =/i(f,*b...,*m) + e, с/Г (2.26) dxm at где е > 0. При движении но траекториям (2.26) изображающая точка не может покинуть неотрицательный ортант R™, так как в каждой граничной точке R™ строго возрастают те координаты, которые равны нулю. При е -►О интегральные кривые системы (2.26) переходят в интегральные кривые системы (2.23). Окончательное утверждение леммы вытекает из замкнутости конуса R™. Π Лемма 2.2. Пусть правые части дифференциального уравнения (2.23) обладают свойством внедиагональной положительности, а также следую- щим свойством внедиагональной монотонности: при любом фиксированном i из неравенств 0<х,<у}> / = 1,...,/-1, / + 1,...,т, *;>0 вытекают неравенства fi(t,Xi, . . . ,*/_!, **,*/ + !,. . . , *m)< < ft(t,yi,. ·. ,yt_v xl yi+i,.. · .ym). (2.27) Тогда оператор сдвига U(t> s) (t > s) no траекториям (2.23) положителен и монотонен. Доказательство. Положительность U(t> s) гарантирует лемма 2.1. Перейдем к доказательству монотонности. Пусть x(t)=.U{t,s)x0, y(t) = U(tfs)yQ, причем 0 < jc0 <^ο· Нам необходимо показать, что x(t) < y(t) (t > s). Введем в рассмотрение вектор-функцию z{t) = y(t) — Jt(f), которая, очевидно, является решением системы дифференциальных уравнений "Г" =Μ*'χΛ*) + *ι(?)> - - - ,Xm{t) + *m(t)] -/ifc*i(0,....*m(0b at (2.28) dzm — =/«fc*i(0 + *i(0,....*«(0 + *m(Ol- - dt -fmlt,Xx(f),...,Xm{t)]. *) Подразумевается, что пространство Rm, как обычно, полу упорядочено неотрицательным ортантом R™ 186
В силу свойства внедиагональной монотонности правых частей (2.23) система уравнений (2.28) удовлетворяет условиям леммы 2.1. Поэтому z(t) > О при t>s, т.е. x(t)<y(t). Π Технический прием, связанный с рассмотрением вспомогательных систем дифференциальных уравнений типа (2.28) и последующим применением леммы 2.1, часто оказьюается эффективными в более сложных ситуациях. Лемма 2.3. Пусть правая часть дифференциального уравнения (2.23) при любом t представляет собой гетеротонный оператор. Тогда оператор сдвига U(t, s) (t>s) no траекториям (2.23) также является гетеротонным. Доказательство. Пусть F {t, υ, νν) - сопутствующий оператор по отношению к оператору F(t, χ), стоящему в правой части (2.23). Рассмотрим систему дифференциальных уравнений dv л dw л — = F(tt υ, w), — = F(tt wt и). (2.29) dt dt Пусть U(t9s) обозначает оператор сдвига по траекториям (2.29): U(tt s) [v(s\ w(s)] = [v(t), w(t)], a U(tt s) - его "половину": U(tts)[v(s)9w(s)}=v{t). Покажем, что U{t, s) является сопутствующим по отношению к оператору сдвига U(t, s). Возьмем два любых решения системы (2.29) [v(t)y w(t)] и [v(t)> w(t)]> удовлетворяющие условию v(s) > u(s), w(s) < w(s). Очевидно, лемма будет доказана, если показать, что и(/) > v(t), w(t) < w(t) при t > s. Вектор-функции р (Г) -v(t) -v\t), q(t) sw(i) -w(f) удовлетворяют системе дифференциальных уравнений ^ »%w(0 + P(0,w(0-4r(0] -F[ffu(f),w(f)L dt ^ =F[t,w(f)9v(tyi -Ht.n(t)-q(t),v(t)+p(t)], at которая в свою очередь удовлетворяет условиям леммы 2.1. Поэтому при t > s выполняются неравенства p(t) >0,q (t) > 0, в справедливости которых нам, собственно, и надо было убедиться. D Легко видеть, что требование гетеротонности оператора F в лемме 2.3 может быть ослаблено без изменения окончательного вывода. Та же схема доказательства остается работоспособной в предположении лишь внедиагональной гетеротонности оператора F: каждая компонента // (Г, х) опера- тора F допускает диагональное представление // (tt х) = // (г/ х, х) такое, что // по всем переменным Xj (J Φ ι) первого векторного аргумента я возрастает, а по второму векторному аргументу χ (т.е. по всем его координатам xj) убьюает. В этом случае лишь вместо системы (2.29) надо рассматривать систему dv A dw Λ — »F(f, υ, w), — = F(t, w,v). (2.30) at at 187
Сделанное замечание существенно для большинства приложений. Поэтому мы выделим его в самостоятельное утверждение. Лемма 2.4. Пусть правая часть дифференциального уравнения (2.23) при любом t представляет собой внедиагонально гетеротонный оператор. Тогда оператор сдвига U(t, s) (ΐ > s) no траекториям (2.23) - гетеротонный. Π Ограничимся далее рассмотрением автономных систем. Мы уже знаем, что гетеротонный оператор обладает полезными свойствами лишь в некоторых предположениях. Отметим с этой целью два очевидных результата. Лемма 2.5. Пусть выполняются неравенства F(v°fw°)>0> F(w°yv°)<0. (2.31) Тогда конусный отрезок <t>°, w°> сильно инвариантен для Ut (при любом f >0).П Лемма 2.6. Единственность решения системы уравнений (2.1) (из Λ гл. IV) для оператора Ut следует из единственности решения системы л* £ F(u, w) = 0, F(w, υ) = 0. D Легко видеть, что в случае, когда все /,-(t>, w) возрастают по щ (т.е. F является гетеротонным, a F — сопутствующим для него), никакой нетривиальный (невырождающийся в точку) конусный отрезок <i>°, w°) не может удовлетворять условиям (2.31). Этот факт необходимо учитывать при построении оператора F. Поясним сказанное на простом примере. Пусть G(x) = F(x)-x> где F(x) — гетеротонный оператор. Кстати, оператор G в этом случае также является гетеротонным с сопутствующим А .А G(v, w) - F(v, w)-w. Λ* Λ Понятно, что можно положить G(v, w) = G(vy w), но это будет плохо по указанной выше причине. Существенно лучше G(v, w)=F(v, w) — v. Теорема 2.5. В предположениях леммы 2.5 и леммы 2.6 система дифференциальных уравнений (2.1) имеет единственное положение равновесия χ* Ε (t>°, w° ), которое асимптотически устойчиво πα(υ°, w°). До к а з а т ел ь с τ в о. Существование и единственность х* Ε < t>°, н> ° > очевидны. Учитывая полугрупповое свойство оператора сдвига UtUs = Ut+Sy получаем (см. гл. IV) при k ■+ °° и любом фиксированном s > О (χ Ε <ι>°, νν°>), откуда Utx -* -*** при t -+°° и любом я:Е<и0, w°). Помимо сходимости всех траекторий к х* необходимо установить устойчивость х* по Ляпунову. Возьмем любое s > О и рассмотрим итерационный процесс ιΛ+1 = Us(vk, wk\ wk+l ~ Us(wk9 vk). 188
Очевидно, {vk, wk) -*{л:*}, причем каждый конусный отрезок <t?*, wk) сильно инвариантен для Ut (t > 0). Пусть теперь задана произвольная (открытая) окрестность V точки х*. Выберем N из условия <ι>^, wN) CV. Тогда траектория (2.1), начинающаяся в множестве < υΝ, wN), не выходит за пределы V. Выберем теперь некоторую окрестность W C< vN> wN) точки χ*. Из xE:W следует Utx G V при любом t > 0. D Скажем, что оператор F внедиагонально псевдовогнут, если для любых г Ε (0,1), v,wG int R1 выполняется неравенство Vt;>7w) > tF(v, w) . Лемма 2.7. Zfc/ш оператор F внедиагонально псевдовогнут, то оператор сдвига Ut псевдовогнут. Нам необходимо установить справедливость неравенства А / 1 \ Ut ( ту, — w I > rUt(v, w). Другими словами, если [u(f), w(f) ] - решение (2.30), проходящее через точку (υ, νν), а [ίΓ(ί), Ίν(ί)] - решение (2.30), проходящее через точку ίτυ, — w), то ίΓ(Ο>τυ(0. (2.32) Для малого Δ > 0 имеем υ(Δ) = F(u, w) Δ + ι> + ο (Δ), Α/ 1 \ Λ υ(Δ) = FΙ τυ, — w J Δ + τ υ + ο (Δ) > r [F(u, w) Δ + υ] + ο (Δ). Следовательно, при достаточно малом Δ > 0 (2.32) справедливо для всех 0 <t < Δ, т.е. при достаточно малых t оператор Ut псевдовогнут. Для завершения доказательства остается заметить, что Ut при любом t > 0 может быть представлен в виде композиции псевдовогнутых операторов Us (s < Δ): ut = uks = uks. Композиция же псевдовогнутых операторов является псевдовогнутым оператором. D Сопоставляя приведенные выше результаты, легко приходим к следующему выводу. Теорема 2.6. Пусть система (2.1) имеет положение равновесия jc*E Ε int R+ и оператор F внедиагонально псевдовогнут. Тогда положение равновесия х* единственно и асимптотически устойчиво на int R". D § 3. Структурная устойчивость Хорошо известно, что математическое описание любой реальной системы, любого физического явления всегда является неточным в результате неизбежных ошибок при определении параметров, пренебрежения малозначащими факторами и т.п. При этом естественно, что математическое описание (математическая модель) может представлять практический интерес лишь при наличии определенной нечувствительности к малым его измене- 189
ниям, возмущениям. В противном случае нет никаких гарантий, что выводы, получаемые на основе математической модели, соответствуют поведению и свойствам изучаемого реального объекта. Подобная нечувствительность математических моделей к малымвозму- щениям получила название структурной устойчивости. Понятие структурной устойчивости широко распространено и встречается в различных областях, имея в каждой из них свое значение. Каждый раз дня строгой формулировки определения структурной устойчивости необходимо ответить на два вопроса: а) какие возмущения считаются допустимыми; б) какие свойства модели и насколько должны быть нечувствительны к этим возмущениям! Исторически первое понятие структурной устойчивости было введено в теории дифференциальных уравнений (А.А. Андронов, Л.С. Понтрягин, 1937), где по первому пункту а) допускаются малые возмущения правых частей дифференциальных уравнений в пространстве С1, а по пункту б) требуется топологическая эквивалентность решений, или, проще говоря, малая зависимость фазового портрета системы от возмущений (точное определение дано ниже). Иногда термин "структурная устойчивость" употребляют в более широком смысле, имея в виду только сохранение при малых воз* мущениях того или иного свойства системы (устойчивость равновесия, существование периодического решения и т.д.). Явно структурной устойчивости большое внимание уделяется в теории динамических систем и теории катастроф. Вместе с тем нужно отметить, что многие научные дисциплины с давних пор занимались по существу вопросами структурной устойчивости, не употребляя самого термина. 3.1. Структурная устойчивость динамических систем. Пусть динамическая система описывается системой дифференциальных уравнений */βΛ(*ι,·· ·,Χη), ι' = 1,...,λ, (3.1) а возмущенная система - системой дифференциальных уравнений , й=Ж*ь...,*«) + $/(*!,...,*,,), / = 1,...,л. (3.2) Динамическая система (3.1) называется структурно устойчивой (грубой) , если по любому β > 0 можно указать такое δ > 0, что при любом ее малом возмущении if, удовлетворяющем условию η \ η | э& 11 / = ι I / = ι I oxj J) существует гомеоморфизм фазового пространства, который сдвигает точки не более чем на β и переводит траектории невозмущенной системы (3.1) в траектории возмущенной системы (3.2). Формально определение предполагает заданной некоторую метрику на фазовом многообразии, но обычно о структурной устойчивости говорят, когда траектории входят в некоторую компактную область Μ с гладкой границей, не касаясь последней, причем возмущения и гомеоморфизм рассматривают только на М. Ввиду компактности выбор метрики не играет роли 190
Требование структурной устойчивости для систем на плоскости (размерность фазового пространства η = 2) существенно упрощает возможные структуры разбиения фазового пространства так, что все они становятся обозримыми и каждая из них определяется конечным числом особых фазовых траекторий. Для структурной устойчивости системы на плоскости необходимым и достаточным оказывается выполнение следующих условий: 1) имеется конечное число положений равновесия, которые все являются простыми и среди которых нет центра; 2) отсутствуют сепаратрисы, соединяющие два седла; 3) имеется конечное число замкнутых траекторий, каждая из которых представляет собой предельный цикл, устойчивый или неустойчивый одновременно с обеих сторон. При малой размерности фазового пространства (л = 1, 2) структурно устойчивые системы образуют открытое всюду плотное множество в пространстве всех динамических систем, снабженном С1-топологией. Этот принципиальный результат позволяет рассматривать системы с более сложным и более чувствительным к малым возмущениям поведением траекторий как исключительные. Как показал Смейл [60, 61] при больших размерностях (п > 2) фазового пространства этот факт не имеет места. На фоне принципиальной важности понятия структурной устойчивости результат Смейла может означать одно из двух: или математическое исследование динамических систем третьего порядка и выше практически не имеет смысла, или используемое определение структурной устойчивости является чересчур жестким. Успешное изучение динамических систем большой размерности говорит в пользу второй альтернативы. По этой причине усилия многих исследователей были направлены ла модернизацию определения структурной устойчивости. На этом пути Смейл предложил, сохраняя по существу определение структурной устойчивости, сузить класс рассматриваемых систем до так называемых систем Морса — Смейла. Последние определяются на компактном (обычно замкнутом) дифференцируемом н-мёрном многообразии Μ и характеризуются следующими свойствами: 1) Система имеет конечное число положений равновесия и замкнутых (периодических) траекторий. 2) Каждая из упомянутых в 1) траекторий обладает свойством локальной структурной устойчивости (компактное инвариантное множество Ρ гладкой динамической системы считается локально структурно устойчивым, если сохраняются все топологические свойства системы в некоторой окрестности Ρ при любых достаточно малых в С1 возмущениях системы). 3) Инвариантные многообразия траекторий из упомянутых в 1) пересекаются трансверсально. 4) Все остальные траектории при t -*± °° стремятся к траекториям 1). 5) Если Μ имеет край, то обычно требуют, чтобы вектор фазовой скорости был всюду трансверсален к краю. Системы Морса — Смейла оказываются структурно устойчивыми в смысле данного выше определения. Нужно отметить, что работы по структурной устойчивости в основном относятся к изучению структурной устойчивости диффеоморфизмов. В этом случае изучаемые вопросы приобретают наиболее простую и удоб- 191
ную форму, освобождаясь от второстепенных деталей. В то же время результаты по структурной устойчивости диффеоморфизмов легко переводятся на язык дифференциальных уравнений, а также на язык каскадов, т.е. динамических систем с дискретным временем вида xk+1 = F(xk). 3.2. Структурная устойчивость в теории катастроф. В теории динамических систем изучаются векторные дифференциальные уравнения со скалярным параметром λ вида *=Λ*,λ), x^R", (3.3) поведение которых при изменении λ может испытывать качественные скачки, связанные с появлением или исчезновением точек равновесия, периодических решений, с потерей устойчивости к т.п. Критические значения параметра λ, в окрестности которых происходят качественные изменения фазового портрета системы, называются бифуркационными. Очевидно, с точки зрения предыдущего раздела система (3.3) при бифуркационных значениях параметра λ не является структурно устойчивой. Однако ясно, что вопросы структурной устойчивости здесь играют такую же важную роль, только они должны быть иначе поставлены. Если мы хотим быть уверенными, что математическая модель (3.3) дает правильное представление о поведении реальной возмущенной системы *^/(*,λ) + ξ(2,λ), то необходимо убедиться, что модель нечувствительна к малым возмущениям ξ(χ, λ), т.е. при малых возмущениях с моделью происходят те же самые бифуркационные изменения. Сказанное лишний раз подчеркивает то важное обстоятельство, что постановка вопросов структурной устойчивости каждый раз должна правильно учитывать специфику решаемых проблем. По сравнению с рассмотренной системой (3.3) основной объект исследования в теории катастроф шире в одном отношении и уже в другом. Шире — потому что изучаются системы с многомерными параметрами, уже- потому что основной математический багаж теории катастроф относится пока к изучению градиентных систем. При рассмотрении последних важная роль отводится исследованию критических точек (положений равновесия) потенциала φ(χ), являющихся решением уравнения αχ ι οχη > Неприятности, возникающие при малых возмущениях потенциала, легко прослеживаются на простейших одномерных примерах. При малом возмущении ех потенциала φ(χ) = х3 критическая точка χ = 0 вообще пропадает при е > О, а для отрицательных е появляются две критические точки в окрестности χ = 0. Аналогичным образом х4 в результате возмущения х4 + + ех2 дает при е < 0 два минимума и один максимум. Это примеры негативного характера. Пример другого рода (пример структурно устойчивой критической точки) дает φ(χ) = χ2. Оказьюается, что малое возмущение может лишь незначительно сместить критическую точку, но она остается 192
единственной и сохраняет свой тип (минимума). Такого сорта функции φ называются структурно устойчивыми. Для точного определения предварительно вводится следующее понятие эквивалентности. Гладкие функции φ, ф: R" ->R назьюаются эквивалентными вблизи точки **, если существуют такой локальный диффеоморфизм у: Rn -* R" в окрестности х* и такая постоянная у, что вблизи х* Функцию φ(χ) называют структурно устойчивой в окрестности критической точки дс*, если для любых гладких £(*), достаточно малых в С1, функции φ(χ) и φ(χ) + £(*) эквивалентны вблизи дс*. Легко проверяется, что необходимым и достаточным условием структурной устойчивости является невырожденность матрицы *2о 1 (3.4) ί—1· L bxj bxj J Все сказанное является лишь отправным пунктом теории катастроф, которая в основном интересуется критическими точками семейств функций φ(χ, λ) с многомерным параметром λ. Соответствующее понятие эквивалентности семейств здесь выглядят более сложно. Семейства φ, ψ: Rn X Rr -> R назьюаются эквивалентными, если найдутся такие а) диффеоморфизмы μ: Rr -► Rr, б) гладкое отображение у: Rn X КГ-*КЛ, которое при любом фиксированном X€Rr является диффеоморфизмом, в) гладкое отображение у: Rr -* R, что Ψ(*,λ) = <^(*,λ), μ(λ)]+γ(λ). Определение структурной устойчивости теперь аналогично предыдущему. Если φ: R"XRr->R эквивалентно в указанном выше смысле любому семейству φ + ξ: Rn + Rr -► &, где ξ мало в С1, то семейство φ(χ, λ) называется структурно устойчивым. Как эквивалентность, так и структурная устойчивость здесь могут определяться также локально (в окрестности критических точек). Для структурно устойчивого семейства матрица (3.4) может вырождаться при отдельных значениях параметра λ £ Rr, что, собственно, и обеспечивает возможность бифуркаций, или катастроф, но характер "катастрофического поведения" оказывается нечувствительным к малым возмущениям семейства. Важность структурной устойчивости для теории катастроф трудно переоценить. Если в других научных дисциплинах вопросы структурной устойчивости часто изучались задним числом, то в теории катастроф понятие структурной устойчивости было отправным пунктом, который позволил с самого начала сузить класс рассматриваемых параметрических семейств и дать их удивительную и неожиданную классификацию. 3.3. Структурная устойчивость задач статики. Структурная устойчивость в широком смысле слова, как нечувствительность математических моделей к малым возмущениям, играет принципиальную роль в любой научной 193
дисциплине. В предыдущих разделах рассмотрены области, в которых понятие структурной устойчивости занимает подобающее ему место и служит источником обширных исследований. Подобное благополучие не везде имеет место. Есть ряд типичных ситуаций, которые часто приводят к недоразумениям из-за пренебрежения вопросами структурной устойчивости или отсутствия их точной постановки. Что касается системостатики, то ситуацию здесь можно признать удовлетворительной, если говорить о простейших постановках вопросов. Например, если равновесие системы определяется решением уравнения F(x) = = 0 и вьюод о существовании равновесия делается на основе отличия от нуля вращения y(F, Ω), то факт существования равновесия оказьюается не зависящим от малых возмущений оператора F. Причина подобной структурной устойчивости заключается в том, что вращение векторного поля не зависит от малых возмущений рассматриваемых отображений (см. гл. II). В качестве упражнения полезно просмотреть с точки зрения "нечувствительности" теоремы существования и единственности равновесия для гетеро- тонных и Других систем. Трудности обнаруживаются при более широком взгляде. Отличие модели от реальной системы всегда обусловлено не только приближенным заданием параметров, но и пренебрежением малозначащими факторами. При введении таких факторов в модельное описание модель приобретает новые степени свободы — размерность задачи увеличивается. Поэтому, решая вопрос о пригодности модели, мы должны были бы, строго говоря, убедиться в независимости интересующих нас свойств модели от повышения размерности. Эта проблема является общей для всех научных дисциплин. Тем не менее обычно она или игнорируется, илр обходится стороной с малоубедительными оправданиями. Вот что по аналогичному поводу написано в известной монографии [1] : "Но не быть "наивными" мы не можем, ибо в противном случае мы должны были бы проверить, не нарушают ли устойчивости данного состояния всевозможные малые паразитные параметры, повышающие порядок уравнения. Однако мы никогда не сможем довести эту проверку до конца, ибо число таких паразитных параметров во всякой системе очень велико ... Поэтому правильность ответа на вопрос об устойчивости того или иного состояния в реальной системе, как и всякого другого результата теоретического рассмотрения (связанного с неизбежной идеализацией свойств этой системы), может быть проверена только опытным путем". Такая позиция достаточно разумна и рациональна, но не безукоризненна. Она была бы верной на 100%, если бы упрощенные модели давали правильные ответы где-нибудь в районе 50% случаев. Но простые модели дают порядка 99% правильных ответов! Значит, существуют скрытые причины, порождающие этот феномен. Обнаружение этих причин — деликатная задача структурной устойчивости, которая ждет своих первооткрывателей. 3.4. Парадокс Циглера. Рассмотрим систему дифференциальных уравнений Уфх +ϊρ2 + Ь(2ф1-ф2) + (2-Р)<р1 +(Ρ-\)φ2 = о, φι + 'Фг + Ь(ф2 - φ{) + φ2 - φχ =0, (3·5) 194
описывающую движение двух шарнирно соединенных стержней при наличии вязкого трения. За подробностями (несущественными для нашего рассмотрения) читатель может обратиться к интересной книге [52]. Дря упрощения, массы, длины и коэффициент упругости мы положили равными единице, оставив два параметра: Ъ — коэффициент вязкого трения, Ρ — сила. Допустим, нас интересует, при каких нагрузках Ρ равновесие системы (3.5) устойчиво, если Ь = О (т.е. вязкое трение отсутствует). Система Рис. 15 (3.5) линейна, и ее исследование не вызывает затруднений. Есть, правда, два пути. Можно сразу положить Ь = 0, и тогда получится, что равновесие устойчиво лишь при условии 0</></>кр~2,1. (3.6) Более трудоемкий путь. Определяем критическую нагрузку как функцию параметра Ъ и затем переходам к пределу Ъ -* 0 - в результате получится ЛсР*1,5. (3.7). Различие между (3.6) и (3.7) и составляет парадокс Циглера. Таким образом, разные способы решения задачи (каждый из которых представляется вполне обоснованным) приводят к разным ответам. На самом деле с общематематической точки зрения ничего удивительного здесь нет, поскольку устойчивость равновесия по Ляпунову не является структурно устойчивым (грубым) свойством*). Поэтому множество "допустимых" Ρ не обязано "плавно" зависеть от Ь, что и служит источником расхождения. На вопрос о том, какова же реальная критическая нагрузка, дает правильный ответ (3.7). При 1,5 < Ρ < 2,1 устойчива модель (3.5), но не реальная система, — наличие сколь угодно малого трения (Ь > 0) превращает систему в неустойчивую. Ситуацию поясняет рис. 15, на котором область устойчивости обозначена штриховкой. Во всей этой истории удивительно другое. Долгое время в механике было принято считать, что трение — благо с точки зрения устойчивости. Задачу надо решить при Ъ = 0, а уж наличие неучтенного трения может разве что раздвинуть полученные границы устойчивости. Оказалось, что для неконсервативных систем это, вообще говоря, не так. Появление вязкого трения может превращать устойчивую систему в неустойчивую. 3.5. Некорректные задачи. Многие задачи из различных областей сводятся к решению уравнения вида Α(χ)=ζ. (3.8) с некоторым линейным или нелинейным оператором /4, действующим в тех или иных пространствах. Задача (3.8) называется корректной по Адамару, если χ однозначно определяется по ζ и непрерывно зависит от ζ, *) Грубым свойством является лишь асимптотическая устойчивость. 195
т.е. малым возмущениям ζ соответствуют малые изменения решения х. По существу это разновидность требования структурной устойчивости*). Долгое время общепринятой была точка зрения, в соответствии с которой всякая математическая задача, соответствующая какой-либо физической или технической задаче, должна быть корректной. В самом деле, какую физическую интерпретацию может иметь решение, если сколь угодно малым изменениям исходных данных могут соответствовать большие изменения решения? Однако такая точка зрения, верная до существу, столкнулась на практике с принципиальными трудностями. Некорректными в указанном выше смысле оказываются широкие классы задач: решение интегральных уравнений 1-го рода; дифференцирование функций, известных приближенно; некоторые задачи теории оптимального управления; широкие классы так называемых обратных задач, возникающих в физике, технике и других областях; в частности, задачи обработки результатов физических экспериментов. Все это породило громадный поток исследований по некорректным задачам и привело в результате к разработке многочисленных методов регуляризации некорректных задач. Тема слишком обширна, чтобы здесь можно было о ней подробно говорить. Нужно лишь отметить, что методы регуляризации некорректных задач идут не по пути отказа от требования корректности, а по пути переосмысливания задач, углубления их постановок и приведения их к структурно устойчивому виду. § 4. Прикладные аспекты теории катастроф Поначалу в проекте данной книги планировалась отдельная глава по теории катастроф. Однако за последние годы в этой области появилось несколько хороших книг, которые удовлетворяют широкий спектр запросов. Особо выделим обширную монографию [58], которая написана с большим вдохновением и может служить прекрасным введением в предмет. Существенно большую (математическую) информацию при значительно меньшем объеме дает монография [2]. Так что по указанным источникам, а также с помощью имеющейся там библиографии, заинтересованный читатель может в значительной мере удовлетворить математическую любознательность. Здесь хотелось бы остановиться лишь на одном вопросе, связанном с приложениями. Но прежде — несколько слов о существе предмета. Основной задачей в теории катастроф служит изучение критических точек многопараметрической функции φ: Rn X Rr -*R. Другими словами, изучение параметрического уравнения *'*) grad^(x, λ) = 0, xGR", λ<ΞΚΛ (4.1) *) Здесь было бы естественно добавить требование слабой чувствительности реше- шения к возмущениям оператора Л. **) Вообще говоря, теория катастроф занимается и более сложными задачами. Например, изучением критических точек функций ψ: Rw X Rr -* Rm. Но в этой части теория имеет менее завершенный характер. 196
В простейших ситуациях решением (4.1) служит некоторая функция χ (λ). Но это скорее исключение, чем правило (см. разрешимость неявнях функций в гл. II). В более общем случае решения (4.1) будут расположены на некоторых сложных поверхностях в пространстве Rn X R (и даже на несвязных кусках поверхностей). Причем эти поверхности могут вовсе не быть графиками каких бы то ни было функций χ (λ). На рис. 16 дан пример такой поверхности для случая двупарамет- рического функционала (так называемая катастрофа сборки). Можно ли эту поверхность считать графиком некоторой многозначной функции χ(λ) ? Вообще говоря, можно, но на самом деле здесь имеется нечто большее. Например, если система в начальный момент находится в точке А и параметр λ2 плавно увеличивается, то состояние системы меняется вдоль А СВ, в точке С происходит скачок (катастрофа). При возвращении λ2 в исходное положение состояние системы будет меняться по другому пути (нечто вроде петли гистерезиса). В то же время при специальной регулировке (управляющих) параметров λ^ λ2 возможен плавный переход из А в В (путь ADB на рис. 16). Наконец, заштрихованная часть поверхности соответствует нереализуемым (неустойчивым, метастабильным) состояниям системы. Конечно, сказанное несколько выходит за рамки идеологии, непосредственно заложенной в уравнение (4.1) (откуда вдруг берется нереализуемость?) , но легко обосновывается некоторым расширением представлений. Например, система может стремиться к локальному минимуму функционала ν?, а заштрихованная часть поверхности соответствует локальным максимумам. Скачок же происходит лишь в точке С (а не раньше), потому что система при плавном изменении параметров отслеживает движение того локального минимума, В- котором она находится. В точке С этот локальный минимум исчезает, и уж тогда приходится искать новый. Между прочим, здесь нет никакой необходимости предполагать "разумность" системы. Это может быть чисто физический или технический объект, устойчивые состояния которого соответствуют локальным минимумам потенциальной энергии. Если читатель вспомнит термодинамику, то очень похожие ситуации и рассуждения возникают при изучении уравнения Ван- дер-Ваальса. Изображенная на рис. 16 поверхность имеет характерную особенность в районе точки S. По первому впечатлению различных типов особенностей может быть довольно много. Однако теория катастроф показывает, что в типичных (структурно устойчивых) случаях при наличии лишь двух параметров могут встречаться лишь два типа особенностей: катастрофа сборки (рис. 16) и катастрофа складки (легко догадаться по смыслу, как 197
она выглядит). При трех (и более) параметрах различных видов катастроф несколько больше, но и там дается их полная классификация. Конечно, это лишь генеральная линия теории катастроф. Как и во всякой теории, здесь есть масса других (важных и сопутствующих) результатов*). Всего сказанного ни в какой мере недостаточно, чтобы даже частично передать красоту и глубину теории катастроф, но достаточно для небольшого разговора о приложениях. Сразу оговоримся, что мы не собираемся обсуждать серьезные приложения, которые имеются в оптике, термодинамике, теории упругости и т.д. Но теория катастроф имеет массу " несерьезных" приложений в биологии, экономике, социологии. Большинство из них строится примерно по такой схеме. Будем, например, шахматиста характеризовать тремя параметрами: χ - достижения, \х - увлеченность, λ2 - техника игры. Первое, что здесь приходит в голову, попытаться охарактеризовать функциональную зависимость х(Хь λ2). Однако теория катастроф показывает, что не всегда интересующий нас параметр является функцией "всего остального". То же самое в данной ситуации подтверждают практические наблюдения. Поэтому для описания интересующей нас связи можно попытаться подобрать подходящую поверхность в пространстве (χ, λχ, λ2). Теория катастроф делает эту задачу предельно простой. Надо рассмотреть лишь-две возможности: сборку и складку и подобрать подходящее расположение одной из этих поверхностей в пространстве. Поверхность на рис. 16 как раз улавливает некоторые существенные качественные моменты. При низкой увлеченности рост техники дает непрерывный рост достижений. При большой увлеченности рост техники дает более медленный рост достижений, но затем достижения увеличиваются скачком. Наконец, та же поверхность объясняет тот удивительный факт, что есть шахматисты (в окрестности точек В и С), которые равны по технике и увлеченности, но существенно отличаются достижениями. Далее можно ставить разные задачи. Например, по какой траектории целесообразно совершенствовать данного шахматиста, учитывая его индивидуальные особенности, начальное положение и потенциальные возможности. Допустим, если шахматист находится в районе точки А, а природные данные не позволяют ему в разумное время достичь техники уровня точек В и С, то для прогресса необходимо умерить увлеченность и двигаться в обход вдоль ADB. Аналогичным образом читатель может рассмотреть различные типы систем: "спрос - цена - реклама", "результаты труда - дисциплина — квалификация" и т.п. Много подобного рода анализов рассеяно по литературе. Причем, несмотря на всю их "наивность", они часто звучат откровением для специалистов-прикладников. Возможно, что и в приведенном выше примере кое-кто из. шахматных тренеров найдет удобное модельное подтверждение своих практических наблюдений. Спрашивается, как же нужно расценивать подобного сорта "приложения"? Удобнее всего — просто игнорировать их, считая чисто спекулятивными. Такая позиция по крайней мере имеет больше формальных оснований. Опыт развития точных наук показывает, что модели должны поз- *) Например, мы ничего не говорили о том, что размерность вектора χ по существу не играет никакой роли. 198
Рис.17 волять проводить вычисления и расчеты и, главное, должны строиться на основе измеряемых параметров. Правда, первый пункт (наличие цифровых результатов) в настоящее время стал уже необязательным. Важность и полезность чисто качественных результатов уже давно осознана во многих облатях. Но вот по второму пункту (хотя бы принципиальная из- меряемость параметров) модели типа "достижения - увлеченность - техника" выглядят совсем малоубедительными. Тем не менее в этих моделях есть рациональное зерно, и было бы жалко его потерять,игнорируя все оптом. Главный рациональный момент состоит здесь в том, что они дают удобный язык для описания явлений, чуждых методам традиционной математики. А язык во многом определяет окончательные результаты. Ведь когда мы приступаем к исследованию, мы часто идем не столько от потребностей содержательной задачи, сколько от имеющегося у нас инструмента (языка). Возьмем простой пример. Пусть.при анализе некоторой экономической системы возникает необходимость рассмотреть зависимость между спросом и ценой на некоторый товар*). Не задумываясь (а вернее, опираясь на традиционный опыт), мы пишем: у - спрос, χ — цена, функция^ =/(*) описывает их зависимость. Но давайте на время забудем о математике и обратимся к реальной экономике. Безусловно, при изменении цены спрос испытывает скачки, причем существо дела заключается не в разрывности функции f(x). Психологическая инер^ ция (привыкание) приводит к тому, что местоположение скачков зависит от направления изменения цены. Правдоподобно выглядит зависимость, изображенная на рис. 17, и эта зависимость не описывается никакой функциональной связью (йаже многозначной) между х и у. Получается петля гистерезиса, наличие нереализуемого в обычных условиях участка АВ — дань предшествующему рассмотрению. Несмотря на содержательную очевидность сказанного, никто (насколько известно автору) даже не пытался рассматривать модели, в которых вместо функций спроса ^фигурировали бы "поверхности связи" с дополнительным указанием правил скачков. И причиной тому служит исходная ориентация на стандартный язык функциональных связей, а не сложность таких моделей, как могло бы показаться. По крайней мере первые качественные результаты для таких моделей получить легче, чем шлифовать старую математическую экономику. А первые результаты, как правило, и являются наиболее ценными. Без преувеличения можно сказать, -что в любой теории *) Для простоты допустим, что товар "изолирован" от остального рынка и спрос на него зависит лишь от собственной цены. 199
20% результатов, которые к тому же являются простейшими, содержат 80% полезных истин. Ситуация с функциями спроса в экономике вовсе не является исключением. Наличие скачков "с инерцией" для экономики скорее правило, чем исключение. Возьмем хотя бы нелинейный баланс. Часто отмечают, что оператор внутрисистемных затрат (см. гл. I) имеет разрывы, связанные с изменениями (скачками) технологий. Но ведь изменение технологии — хлопотное дело, поэтому ее меняют с запаздыванием, когда проясняется перспектива. Но тогда мы опять-таки попадаем в прежнюю ситуацию, требующую привлечения нового математического аппарата и отказа от языка обычных функциональных связей. Вот что по аналогичному поводу пишут Постон и Стюарт [58]: "Физики вообще хотят, чтобы все, что они рассматривают, было функцией от всего остального... Правда, они, конечно, идут впереди вычислительных социологов, многие из которых, составляя свои программы для ЭВМ, исходят из того, что все есть линейная функция от всего остального". Итогом сказанного может служить простой и полезный вывод. Теория катастроф дает повод и основания для замены языка функциональных связей более адекватным аппаратом. Математические результаты теории при этом сами по себе могут оставаться за кадром. Главное, что они дают идеологическую базу, на которой новый аппарат приобретает рациональные черты. Что здесь имеется в виду? Хотя бы понимание того, что такое типичные ситуации, их классификация и т.д. Это в свою очередь позволяет изучать не произвольные связи, а ограниченное число их типов. Комментарии и задачи § 1. Дополнительную информацию по вращению градиентных полей можно получить в [25]. В теории устойчивости хорошо известен следующий результат. Если система χ = = F (χ) имеет нулевое состояние равновесия и (grad¥>(*), Fix)) < 0, χ Φ 0, χ е Rn, где функция Ляпунова φ(χ) удовлетворяет условию (1.7) и в нуле имеет локальный минимум, то нулевое равновесие системы x = F(x) устойчиво в целом. Отсюда автоматически вытекает теорема 1.2, если предполагается (1.7). На справедливость (1.7) в случае (1.8) указано в [5]. Важный результат Н.А. Бобылева [6] (здесь теорема 1.3) дает повод задуматься над рядом естественных- вопросов. Любой ли тип критических точек инвариантен к невырожденным деформациям функционала? Конечно, этот вопрос требует уточнений, поскольку нет полной классификации типов критических точек. Начать можно хотя бы с морсовских седел. Может ли невырожденная деформация "упираться концами" в функционалы, имеющие морсов ские седла разных типов? В конечном итоге изучение этих вопросов может дать полную гомотопическую классификацию градиентных полей, аналогичную гомотопической классификации непрерывных полей, которую дает теория вращения. Успешную (но не на 100%) попытку в этом направлении недавно предпринял Э. Мухамадиев. § 2. Теорема 2.1 установлена автором совместно с Т.А. Хуродзе. Изложение матричных систем сравнения существенно опирается на статью [57]. По-видимому, разумна следующая задача. Сконструировать для градиентной системы χ = -grad φ (χ) матричную систему сравнения, для которой был бы справедлив результат типа теоремы 2.4. Тогда сохранение асимптотической устойчивости равновесия при деформации градиентной системы можно было бы доказать "конусными" методами. Дело в том, что теорема 2.4 по существу утверждает монотонность оператора 200
сдвига и дает тем самым возможность последующего применения результатов типа теоремы 2.2. Конечно, идея здесь заключается не только в том, чтобы дать новое доказательство известному результату. Просто новые методы иногда удобнее изобретать на фоне старых задач. § 3. Много полезных соображений о грубых системах имеется в монографии [1]. Многостороннее обсуждение структурной устойчивости см. в [58]. В задачах о грубости систем при увеличении размерности сложности заключаются не в доказательстве теорем, а в правильной постановке вопросов, для поиска которых лучше всего начинать с конкретных содержательных моделей (электрические цепи, задачи теории упругости), где уже есть развитая интуиция. § 4. Родоначальником теории катастроф считается французский математик Ре- не Том, разработавший основы математического аппарата для анализа скачкообразных процессов (необычных для классической математики и обычных для природных явлений). Список элементарных катастроф ("семь катастроф Тома'*) был независимо получен В.И. Арнольдом, который развил его в широкую классификацию. Более подробные исторические справки есть в источниках, которые упоминались в основном тексте.
Г Л А В А VII ТЕРМОДИНАМИКА СЛОЖНЫХ СИСТЕМ Поначалу в намерения автора входил небольшой обзор ряда работ по термодинамическим и статистическим методам в "нефизической области". Число таких работ на сегодняшний день весьма ограниченно. По мере знакомства с со держанием, этих работ выяснилось, что писать надо бы не главу, а книгу. И не потому, что материала много — много открытых вопросов. В то же время ясно, что открытые вопросы хороши для программы исследований, а не для книги. Поэтому содержание главы следует первоначальным намерениям, но с определенными поправками. В первую очередь хотелось бы обратить внимание читателя на перспективы и потенциальные возможности. К сожалению, это довольно трудно сделать в явном виде и тем более указать конкретные задачи, так что пришлось ограничиться расстановкой акцентов и выбором ракурса текста. В отличие от предыдущих глав, предпочтение чаще отдается физическому уровню строгости изложения, что на первых порах всегда оправданно. § 1. Равновесие в системах обмена 1.1, Описание модели. Рассмотрим систему, состоящую из т ячеек, между которыми может происходить обмен и перераспределение ресурсов. Пусть хк обозначает количество /-го вида ресурса в к-й ячейке. Через А/ (/ = 1, ...,«) обозначим общее количество /-го ресурса в системе. Поскольку речь идет не о потреблении ресурсов, а об их перераспределении, предполагаются выполненными законы сохранения т Σ **=*,, /=1,...,#!. (1.1) /r = l Далее предполагается также, что все хк> О, Xi >0. Каждой ячейке поставим в соответствие функцию 5* =5* (Ж?,...,**)-»*(**), (1.2) характеризующую "полезность" набора ресурсов ** = {*?,...,*£}. Величину sk будем называть эффектом к-й ячейки, a sk(хк) — структурной функцией. Состояние системы назовем равновесным, если суммарный эффект системы S =Zsfc максимален, т.е. не может быть увеличен перераспре- к 202
делением ресурсов. Таким образом, равновесное распределение ресурсов jc1, ..., хт является решением следующей экстремальной задачи: т т Σ **(**)-► max, Σ хк=Х, хк>0. (1.3) /г = 1 fc = l Вопросы динамики модели остаются "за кадром". Для дальнейшего несущественно, достигается ли равновесие в процессе централизованного распределения ресурсов, или же в процессе взаимовыгодных обменов, или же в результате каких-то специальных перераспределений. В этом месте скептически настроенный читатель может заметить, что для дальнейшего тогда несущественно и то обстоятельство, что речь идет о равновесии системы, — просто рассматривается оптимизационная задача (1.3). Но это не совсем так. Конечно, последующие результаты имеют прямое отношение к изучению решений оптимизационных задач, но последние на самом деле часто описывают равновесные состояния динамических систем. Кроме того, ориентация результатов такова, что позволяет говорить о нетрадиционных моментах для задач оптимизации (о равновесии с внешней средой, о выделении структурных функций подсистем и т.д.). 1.2. Интерпретация и уточнения. Отметим сначала, что одна из стандартных термодинамических задач совпадает в точности с (1.3). Пусть Ек, Vk и sk(Ek, Vk) — соответственно энергия, объем и энтропия к-го тела. Пусть т тел находятся во взаимном механическом и тепловом контакте и составляют замкнутую систему постоянного объема. Тогда равновесные значения энергий Ε и объемов Vk для каждого тела определяются из условия максимума суммарной энтропии при заданных значениях общей энергии Ε и общего объема V: т т т Σ sk (Ek, Vk) -> max, Σ Ек=Е, Σ Vk = V. k-l fc=l fc=l С точностью до обозначений это и есть задача (1.3). В экономике, или математической экономике (что будет точнее), задачи вида (1.3) также широко распространены. В качестве структурных функций подсистем здесь выступают обычно целевые или критериальные функции (функции полезности, доход, прибыль и т.д.). Правда, в экономике распределение ресурсов большей частью происходит на фоне его потребления или переработки. Однако и в этом случае равенства (1.1) могут интерпретироваться как законы сохранения, поскольку, например, в каждом плановом периоде распределяются одни и те же количества ресурсов Xt. Уточним теперь предположения относительно структурных функций sk(xk). Везде далее функции sk (хк) считаются достаточно гладкими, монотонно возрастающими и строго вогнутыми. Эти стандартные предположения естественны для большинства приложений и для дальнейшего являются существенными. Остальные предположения в основном предназначены для удобства исследования и позволяют избежать нагромождения второстепенных деталей. Считается, что при всех ι = 1, ..., η равномерно по ν^ ■*■ ν ν «Μ > · · · '» Λ^_ J , Χ;+ j , . . . , Лп 203
в любой ограниченной области выполнены условия ^ к η bS* к —- ->«> при х? ->0, —г ->0 при х?->°°. bxf bxf Перечисленные требования в совокупности обеспечивают существование, единственность и строгую положительность решений всех рассматриваемых далее оптимизационных задач (соответствующие гарантии дают результаты гл. II). Примером структурной функции, удовлетворяющей указанным выше предположениям, может служить 8к(х) = хр...хр, 0<α1+...+απ<1, α*>0,-ί«1,...,#ι. 1.3. Укрупненное описание. В рассматриваемой задаче (1.3) метод множителей Лагранжа легко приводит к следующим условиям равновесия: bsk —^ =λ/, /=1,...,и; fc = l,...,m. (1.4) OXj Благодаря принятым выше допущениям условия (1.4) оказываются не только необходимыми, но и достаточными. Величину λ^= bsk/bxkбудем называть значимостью /-го ресурса для fc-й подсистемы. Согласно (1.4) в положении равновесия значимости одноименных ресурсов во всех подсистемах выравниваются: λ^(χ*)=λ/. Легко видеть, что для функции S(Xu:..,Xn)= max Σ **(**), Σ^ = Ι, (1.5) я1,...,*"2 к к выполняются соотношения ^- «λ,, dS^b,dXt. (1.6) ОЛ( i Функцию S (Χι , ..., Хп) естественно интерпретировать как структурную функцию системы в целом (составной системы). Из (1.6) видно, что величины λ/ для составной системы "продолжают" играть роль зна- чимостей ресурсов. Тривиальная в математическом отношении акция (1.5) по существу имеет глубокое содержание, являя собой переход к укрупненному описанию системы. Дело в том, что для изучения равновесных свойств составной системы оказьюается достаточным знание структурной функции S. Детальная информация о ячейках без ущерба может быть "забыта". Например, если изучается распределение ресурсов между двумя составными системами, то равновесное распределение ресурсов между ними определяется их (укрупненными) структурными функциями. Действительно, пусть $4*) = max Σ slk(xkX Σ**=Χ, 52(Г) = тах Σ s2k(yk\ Σγίζ = Υ. vk к к 204
Сделанное выше утверждение вытекает из очевидного соотношения ты Σ [slk(xk) + s2k(yk)] = max [Sl(X)+S2(Y)]. xk yk к Χ,Υ X+Y = Z Таким образом, в равновесии нет никакой разницы между составными и простыми системами. Каждая равновесная система (как и ее любая ячейка или подсистема) может быть охрактеризована своей структурной функцией, знания которой достаточно для ответа на любой вопрос, касающийся равновесия. Упражнение 1.1. Если структурные функции ячеек удовлетворяют требованиям, указанным в предыдущем разделе, то структурная функция составной системы удовлетворяет тем же требованиям. Упражнение 1.2. Если из равновесной системы изымается некоторая подсистема вместе с содержащимися в ней ресурсами, то оставшаяся подсистема будет равновесной. Упражнение 1.3. Равновесные системы с одинаковыми значимостями ресурсов при объединении образуют равновесную систему. 1.4. Термодинамические потенциалы. Пусть некоторая подсистема со структурной функцией S(x) является составной частью равновесной системы, в которой значимости ресурсов равны λι, ..., λη. Количества ресурсов *ι(λ), ..., χ„(λ), которые содержатся в подсистеме, могут быть определены из соотношений bS/dx^Xj. Введем в рассмотрение "термодинамический потенциал" Π (λ!,.. ., λ„) = max [S(x) - Σ \ xf] = S [χ(Χ)] - Σ \ χ,(λ). (1.7) Поскольку эп /as \ъх, эх,- / Va*/ '/ax,- v то в силу условий типа (1.6) — =-** dII = -Z*fdV (1.8) а λ/ ι Переход от функции S (χ) и переменных *ь ..., хп к функции Π (λ) и переменным Хх, ..., λη называется преобразованием Лежандра. В результате именно такого преобразования в обычной термодинамике "возникают" термодинамические потенциалы (свободная энергия Гельмгольца, термодинамический потенциал Гиббса). В силу (1.8) знание термодинамического потенциала Π (λ) позволяет вычислять равновесные количества ресурсов простым дифференцированием. Для этого, правда, необходимо знать установившиеся в равновесии значимости ресурсов. Если же для определения последних приходится решать исходную задачу (1.3), то переход к потенциалу Π(λ) не дает никакого выигрыша. Однако во многих ситуациях равновесные значимости ресурсов ясны из априорных соображений. Например, значимости ресурсов могут определяться "окружающей средой". Роль окружающей среды для "малой" системы может играть ,,бoльшaя,, система, с которой имеется контакт: Последнее соображение становится особенно наглядным в эко- 205
номической интерпретации, где значимости ресурсов λ/ естественно являются ценами. Подключение малых фирм к большому рынку, понятно, не может изменить установившихся цен*). Упражнение 1.4. Определите подходящим образом понятие "малости" и покажите, что подсоединение малой системы к достаточно большой существенно не меняет равновесных значимостей ресурсов в большой системе. Легко вообразить ситуацию, когда подключение одной системы к другой не меняет значимостей лишь некоторых ресурсов. В этом случае целесообразно проводить преобразование Лежандра лишь по части переменных, переходя к термодинамическим потенциалам г Пг (λι,..., V, xr+i,..., χη) - max [S(x) - Σ λ, xt], (1.9) jcj ,..., xr i = 1 для которых, очевидно, ЭПГ ЭПГ —-=-*/, 1=1,..., г; -—=λ;, / = г+1,...,и. (1.10) ЭХ,- bXj 1.5. Базисный ресурс. Отношение λ*/λ* назовем /-м обменным отношением /-го ресурса для к-и ячейки. Очевидно, обменное отношение задает пропорцию обмена достаточно малыми количествами ресурсов, при котором эффект (значение sk) не меняет. Вместо значимостей ресурсов часто удобно рассматривать набор обменных отношений некоторого базисного ресурса (пусть это будет первый вид ресурса)**). По существу это соответствует переходу к новым единицам измерения значимостей, в которых λ,- bS IbS Pi=— = —- /— , / = 2,...,л. λχ dXf / όΧχ Вместо Xi при этом удобно использовать величину 1 / bS V1 которая в термодинамике соответствует температуре. Условия равновесия системы в новых переменных приобретают вид тк(хк) = т, pf(**) = P;, ί=2,..., л. Вместо (1.9) здесь удобно использовать термодинамические потенциалы Пг Пг(г,р2>. ·· ,Pr,Xr+i, · · · ,*ιι)= — = г = max [TS(xt,.. ., xn) - Σ p.χ.], Pi = 1, xl,...txr /=1 *) Для физика более убедительным будет равнозначный аргумент другого содержания. Добавление малых порций газа не может изменить (существенно) давление. **)В экономике базисным ресурсом, обычно являются деньги, в термодинамике - энергия. 206
для которых — =5; — = -*,, / = 2,...,г; —- =р-, /=г + 1,...,л. Эг Эр,- Э^ ' Обратим внимание, что переменные, характеризующие равновесие, распадаются на два класса. К первому относятся экстенсивные переменные, значения которых в равновесии системы равны сумме значений для составляющих подсистем. Это количества ресурсов, эффект (в термодинамике — объемы, энергии, энтропия). Ко второму классу относятся интенсивные переменные, принимающие в равновесии равные значения для всех подсистем. Это значимости ресурсов и обменные отношения (в экономике - цены, в термодинамике — давления, температуры). 1.6. Реакция на внешние воздействия. Тот факт, что в равновесии системы суммарный эффект принимает не просто стационарное, а максимальное значение, обеспечивает наличие дополнительных свойств. Рассмотрим составную систему со структурной функцией S (χ), находящуюся в равновесии с некоторым окружением (с большой системой), значимости ресурсов в котором равны λι,..., λ„. Поскольку в равновесии достигается локальный максимум суммарного эффекта, то матрица [b2S/dXjbXj] неположительно определена, а в случае строгой выпуклости структурных функций (что далее и предполагается) отрицательно определена, т.е. (όχΦΟ) b2S d2S=X dXidx.KO. (l.ll) Если в окружении происходят какие-либо изменения, то меняются равновесные количества ресурсов хх,... >хп и равновесные значимости \ь .. . ..., λ„, связанные между собой соотношениями dS ΘΠ Из (1.12) следует d2S ά\=Σ dx} , / bx'ibxj что в совокупности с (1.11) дает c*2S=Z d\dxt<Q. (ЫЗ) ι Легко видеть, что d2U = —d2S > О, т.е. потенциал Π в равновесии достигает минимума. Неравенства типа (1.13) легко выписываются для потенциалов Пг. Все эти неравенства позволяют судить о характере изменения равновесия при изменили окружающей среды. Из (1.13) видно, что система "значимости — минус ресурсы'* является универсальной Р-системой. Наибольшей наглядностью обладают выводы в том случае, когда в окружении меняется лишь одна равновесная величина. Комбинаций здесь может 207
быть довольно много. Остановимся на одной из них. Легко показать, что * f \j , . . . , \i-\y λ/+1,...,λ„ (1.14) Неравенства типа (1.14) принято интерпретировать как компенсационные свойства систем (компенсация внешних воздействий), которые широко декларируются термодинамическим принципом Ле-Шателье. В частности, (1Л4) означает следующее. Есйи в равновесии происходит изменение содержания в системе лишь /-го ресурса, то изменение его значимости определяется правой частью (1.14). Если же системе при изменении количества 1-го ресурса предоставляется возможность обмена с окружением другими ресурсами, то изменение ι-й значимости определяется левой частью (1.14) и оказывается меньше, чем в первом случае. Это и означает, что произошла частичная компенсация эффекта от изменения /«го ресурса в результате обмена с окружением другими ресурсами. Принципу Ле-Шателье часто приписывают таинственные свойства. Дело в том, что он часто позволяет "угадать" качественную реакцию системы при отсутствии ее модельного описания. Каждый раз, однако, последующий внимательный анализ показывает, что существо дела заключается в простых неравенствах, вытекающих из оптамизационнрй природы задачи. Компенсационные свойства экономических моделей часто называют принципом Ле-Шателье — Самуэльсона. 1.7. Равновесие Парето. Понятие равновесия во многом зависит от того, какие динамические процессы в системе являются допустимыми. Переход системы в равновесие типа (1.3) в общем случае должен допускать такие динамические процессы, при которых эффект отдельных ячеек уменьшается, а растет лишь, скажем, суммарный эффект. Как правило, такие процессы должны быть управляемы "сверху". Если же действия каждой ячейки самостоятельны и направлены на достижение индивидуальных интересов, то равновесие в смысле (1.3) может оказаться недостижимым. В этом случае "равновесным" будет любое состояние* системы, по сравнению с которым-нет более выгодного одновременно для всех·. Более точно, распределение ресурса χ назовем равновесным (оптимальным) по Парето, если не существует такого распределения у, что sk(yk)>sk{xk\ k~\ т, (1.15) и хотя бы одно из неравенств (1.15) строгое*). Используя для обозначения максимума по Парето символ Par max, условие равновесия можно записать так: m {s1(xi)>...9sm(xm)}^?^m3Xy Σ xk=X9 xk>0. (1.16) Очевидно, равновесие в смысле (1.3) является также равновесием в смысле (1.16), но не наоборот. *) Если все неравенства (1.15) строгие - равновесие называется оптимальным по Слейтеру. 208 < ЭХ; ., *i_i,*f+i,...,*/t
Реализация парето-равновесных состояний характерна не только для экономических систем, но и для термодинамических. Например, если между телами существует механический, но отсутствует тепловой контакт, то в соответствии со вторым законом термодинамики переходные процессы должны сопровождаться ростом энтропии каждого тела. Поэтому в случае тепловой изоляции равновесное состояние термодинамической системы определяется не из условия максимума суммарной энтропии, а из условия максимума по Парето "вектора энтропии". Легко показать, что в указанных выше предположениях точка χ * является оптимальной по Парето в том и только в том случае, когда существует такой набор неотрицательных чисел ах,..., ат, что х* служит решением экстремальной задачи т т Σ α* **(**)-► max, Σχ*=Χ, хк>0. (1.17) Метод множителей Лагранжа для задачи (1.17) дает следующие условия равновесия: dsk а* Z~k = Λ» 1-1,...,и; Л=1,...,/и. (1.18) Эх* где pi — множитель Лагранжа при ограничении Σ χ* = Xt. Эквивалентная (1.18) запись к λ*(**)β —ρ, Λ-Ι,...,/я. (1.19) Oik показывает, что в равновесии по Парето векторы значимостей ресурсов всех подсистем коллинеарны. Условия (1.19) приобретают особенно удобную для интерпретации форму при переходе к базисным обменным отношениям (формулировка представляется читателю в качестве упражнения) . 1.9. Важное замечание. Из всего предыдущего текста, наверное, ясно, что задача (1.3) служила здесь скорее отправным пунктом рассуждений, а не самостоятельным объектом изучения *). Дело заключается не в том, чтобы выписать условия равновесия и с их помощью произвести соответствующие вычисления, а в том, чтобы эти условия помогли понять, как будет реагировать система на изменение внешних условий, как будут взаимодействовать подсистемы при объединении и т.д. Короче говоря, несмотря на изначальную чисто статическую постановку, решение задачи оказывается направленным на изучение динамики "квазистатических" процессов. Квазистатика здесь понимается в том самом смысле, который общепринят для термодинамики: динамика настолько медленная, что в каждый момент времени систему можно рассматривать приближенно как равновесную. Упражнение 1.5. Обдумайте и "доведите до формул** следующую задачу. Пусть в системе запрещен обмен между подсистемами, обмен возможен лишь с окру- *) Недаром говорят, что смысл теоремы становится ясен лишь после знакомства с ее доказательством. 209
жением (системой-посредником), причем лишь такой обмен, при котором суммарный эффект системы возрастает. Справшивается, как нужно (и можно ли) менять значимости ресурсов в окружении и управлять обменом» чтобы интегрально извлечь из системы максимальное количество базисного ресурса? Второй вопрос: как из неравновесного состояния путем управляемого обмена перевести систему в равновесие и при этом опять-таки извлечь из системы максимальное количество базисного ресурса? 1.10. Существование структурной функции. Описанная выше модель обмена проигрывает классической термодинамике в глубине, поскольку существование структурных функций элементарных ячеек постулируется с самого начала. В термодинамике же энтропия "возникает" лишь в процессе исследования. Конечно, было бы неразумно создавать искусственные трудности, если целевые функции ячеек действительно изначально заданы. Однако в экономике есть немало систем, в которых наличие структурных функций имеет скрытый характер и они могут быть выявлены лишь на этапе изучения. Вот простейшая постановка задачи такого типа. Пусть некоторая система обладает набором ресурсов х = {xiy .. .ухп}и осуществляется с окружением некоторый "локальный" обмен dx = { dxx,... ... ,dxn} . Соглашение о знаках: dx( > 0, если система получает, и dxt < 0, если отдает. Естественно, что любая система, наделенная хотя бы малой толикой активности или пассивной целесообразности, допускает лишь выгодные для себя обмены. Результирующую выгодность можно определять по-разному. Для локальных обменов приемлемым (правдоподобным) выглядит следующий способ. Каждый ι'-й ресурс имеет свой коэффициент λ/ > 0 "выгодности", и обмен dx считается допустимым, если Σ XfdXf > 0. i Другими словами, обмен dx допустим, если сумма взвешенных приобретений больше (не меньше) суммы взвешенных потерь. Коэффициенты λζ· в общем случае могут зависеть от х, поэтому окончательная форма локально выгодного обмена такова: Σ \i(x)dxt> 0. (1.20) Можно ли такой системе приписать структурную функцию? Да, можно, если коэффициенты λ/ (χ) "справляются" со своей ролью хотя бы в минимальной степени. Например, не позволяют с помощью серии локальных обменов (1.20) перевести систему в состояние с меньшим содержанием всех видов ресурсов (это соответствует термодинамическому принципу адиабатической недостижимости). В этом случае можно гарантировать существование у дифференциальной формы Σ λ,·(χ) dxt интегрирующего множителя*) ί μ (χ) > 0 (дайте строгое доказательство!), т.е. μ(χ)Σ \i(x)dXi = dS. (1.21) Функцию S(x), определяемую (1.21), естественно принять за структурную функцию системы, поскольку главная роль структурной функции — служить критерием выгодности обмена. Функция же S (х) легко справляется с этой ролью: вместо (1.20) теперь достаточно написать dS > 0. Величины *) В термодинамике для 6Q = du + PdV интегрирующим множителем оказывается 1/7\ В результате получается дифференциал энтропии dS = δ Q/ Г. 210
μ (χ) Xf (χ) получают при этом интерпретацию значимостей ресурсов, так как dS — ^μ(χ)λί(χχ /=l,...,w. Эх, § 2. Статистические методы 2.1. Независимость. В экономике и других прикладных областях довольно широко распространены системы, которые приходится описывать макропараметрами (укрупненными характеристиками). Как правило, эти макропараметры представляют собой совокупный результат взаимодействия большой массы случайных факторов. В простейшем и наиболее широко распространенном случае макропараметр χ имеет аддитивную природу: лг х= Σ xh (2.1) где Χι — независимые случайные величины, a TV достаточно велико. Оказывается, что в этой ситуации параметр (2.1) с большой степенью точности можно считать постоянным и равным своему математическому ожиданию N х~= Σ "χ/ , (2.2) /=ι независимо от того, что величины X/ могут довольно сильно флуктуировать. Причины такого "удобства" заключаются в независимости: Δχ,Δχ,-Axi&Xj = О, Δχ,- - χ,- - χ]. (2.3) Черта сверху используется для обозначения среднего значения. Из (23) сразу вытекает, что среднеквадратичная флуктуация величины χ равна ЛГ (Δχ)*=(Σ Δχ,·)2= Σ Δχ? ι /= 1 и растет, таким образом, пропорционально N. Поэтому относительная флуктуация обратно пропорциональна y/N*, т.е. ν/δχ^ Ι (2.4) χ y/ΊΓ ' При достаточно больших N (2.4) оправдывает использование средних значений типа (2.2) в качестве детерминированных параметров. Характер убывания относительной флуктуации (2.4) сохраняется в том случае, когда вместо (2.1) рассматриваются параметры 1 " х=— Σ χ,, (2.5) Ν /«ι 211
В случае (2.5) при ограниченных средних*,· к нулю стремится (с ростом N) и абсолютная флуктуация 1 ■/. Ах2 · ,—, . Приведенное элементарное соображение частично оправдывает использование в экономике таких параметров, как выпуск (слагаемый из индивидуальных выпусков), спрос (слагаемый из индивидуальных спросов) и т.д. 2.2. Плотность распределения и группы преобразований. Максимум информации о случайных величинах и случайных векторах дают плотности распределения. Однако применение статистических методов в типичных ситуациях сталкивается на первых порах с отсутствием эробще какой бы то ни было информации. Конечно, это лишь первое впечатление. Внимательный анализ обычно позволяет высказать некие правдоподобные соображения общего характера: независимость плюс инвариантность по отношению к той или иной группе преобразований. В большинстве случаев этого оказывается достаточно для восстановления плотностей *). Например, пусть речь идет о наборе случайных величин *={*!,...,*„} (2.6) с неизвестными плотностями распределения р;(х/). Относительно (2.6) предполагается известной лишь справедливость двух условий: 1) величины щ независимы; 2) плотность распределения ρ (χ) вектора χ инвариантна по отношению к любому повороту вектора χ (не зависит от направления). Оказывается, что эти два условия позволяют указать с точностью до параметров все плотности распределения. Действительно, из первого условия следует ρ(χ) = Ρί(χ)...ρη(χ), (2.7) из второго — Ρ (х) = Ρ ( χ/*?+·..+*£), (2.8) другими словами, постоянство ?(*}= Pi (Х1)--Рп(хп) = const (2.9) на любой поверхности х\ + . ..+xl -const. (2.10) Логарифмируя (2.9): 1ηρι(*ι)+ ... + lnp„(x„)= const (2.11) и выписывая дифференциалы (2.10), (2.11), получаем 2xidxi +... + 2xndxn = 0, (2.12) ——— £/*!+...+ ——— dxn = 0. (2.13) Pi(*i) Pn(xn) *) Так же, как в механике, инвариантности оказывается достаточно для немедленного указания интегралов движения (законов сохранения) по теореме Нётер. 212
Умножая (2.12) на λ и складывая с (2.13), имеем \llM +2Ju1+...jM^+2^k = 0. (2.14) L Pi(*i) J \.Pn(xn) J Очевидно, из и дифференциалов dxx,... ,dxn (n— 1) независимы^ кроме того, есть свободный параметр λ. Условие (2.14) будет автоматически выполнено, если при некотором λ ^^- +2λχ,· = 0, i=l,...,«. (2.15) Pifri) Интегрирование дифференциальных уравнений (2.15) дает Для определения констант достаточно выписать условие нормировки J kie-XxUXi=\ (2.16) и задать второй момент 7 xfkie-XxUXl = a*. (2.17) Решая систему уравнений (2.16), (2.17), получаем*) 1 :ончательно ρ(χ) = (2πσ η 2)-τ е /λ 1 7Γ yJlltO2 x\ + ... +xfi y/2na*' (2.18) Таким образом, исходные вроде бы весьма общие предположения 1), 2) привели к однозначному определению совместной плотности распределения (2.18). Примерно так Максвелл установил плотность распределения молекул газа по скоростям, за что впоследствии неоднократно подвергался бесполезной критике. Бесполезной по той простой причине, что критика, основанная на вопросах, почему скорости vx, vy, v2 независимы и почему плотность не зависит от направления скорости, направлена на решение совсем другой проблемы. Как вообще можно объяснить удивительную эффективность статистических (вероятностных) методов В применении к детерминированным системам? Ведь скорости молекул не являются случайными, а однозначно определяются уравнениями механики. Существование истинно случайных событий в природе выглядит вообще весьма проблематичным. Почему, скажем, бросание монеты имеет случайный характер? Ведь по начальным данным (импульс, момент, высота падения и прочее) *) Заведомо ясно, что ог не может зависеть от ι, иначе это будет вступать в про- тиворечение с исходными предположениями. 213
легко рассчитать, какой стороной монета упадает. Значит, корни случайности надо искать в устройстве бросающего автомата. Но такой путь ведет к бесконечной цепочке вопросов. Тем не менее практика показывает, что статистические методы успешно работают. Конечно, этот феномен требует своего объяснения *), но отсутствие объяснения не является запретом для использования. Если не вдаваться в природу случайности исходных величин, то метод вывода совместной плотности распределения (2.18) вполне законен и строг (после несущественного уточнения математических деталей). Упражнения. Определите плотность распределения вектора х, если справедливо условие 1), а условие 2) заменяется следующим: 2.1. Плотность ρ (χ) не зависит от поворота вектора χ -т вокруг точки т. 2.2. Плотность р(х) постоянна на поверхностях хх + ... +хп = const. 2.3. Случайные величины Xj положительны, и плотность р(х) постоянна на поверхностях *ι · · · хп ~ const. 23. Энтропия. Важную роль при изучении сложных систем играет понятие неопределенности, которое нередко помогает решать неприступные с первого взгляда задачи. Рассмотрим простой пример. Пуогь в городе имеется η районов, Р{ — число жителей ι-го района, Wj — число работающих в ;-м районе, наконец, χίβ· - число живущих в ι-м районе и работающих в /-м. Очевидно, Σ *, = />,. Σ*»8»}· (2.19) Пусть все величины Р{, Wj известны, и нам надо оценить величины дг,у, т.е. пассажиропотоки. Поскольку неизвестных имеется и2, а в системе (2.19) всего 2п уравнений, задача представляется неразрешимой. Тем не менее соображения о "неопределенности" расселения позволяют однозначно указать значения макропараметров х/;·, и практика обычно подтверждает высокую точность этих оценок. К этой задаче мы еще вернемся, а пока остановимся на рассмотрении свойств энтропии, которая служит количественной мерой неопределенности. Неопределенность исхода футбольного матча между разными по классу командами весьма мала. Неопределенность же результата встречи равных по силе команд довольно велика, более того, она максимальна. Существуют и более сложные ситуации со множеством характеристик и параметров, которым интуитивно присуща некоторая неопределенность. В простейшей канонической ситуации рассматривается система X, которая может принимать «состояний Χι,... ,х„ с вероятностями pl9. ·.. ,р„. В этом случае величина неопределенности состояния системы задается функцией Я=- Σ ρ,ΐηρ,, (2.20) *) Некоторые вопросы обоснования рассматриваются в § 4. 214
называемой энтропией. Основание логарифмов в (2.20), вообще говоря, произвольно, выбор основания определяет единицу измерения энтропии. Простые примеры показывают, что в качественном отношении функция (2.20) соответствует интуитивному восприятию неопределенности. Скажем, в случае равновероятных исходов (рг = .. . =р„ = 1/и) энтропия принимает максимальное значение 11 11 Я = In ... In — = In л. η η η η Однако не вполне ясным пока остается происхождение конкретного вида энтропии (2.20). Этот вопрос мы на некоторое время отложим и попытаемся изучить следствия из (2.20). Пусть имеются две системы 1и Гс возможными состояниями Χι,... • · ■ > хп> У ι > · · · > Уп- Состояния объединенной системы (Χ, Υ) представляют собой всевозможные комбинации пар (*/,.у/)· В соответствии с (2.20) энтропия системы (Χ, Υ) будет равна Η(Χ%Υ) = -Σ Ри]прц> U где ρ if = p(Xi,yj)- вероятность состояния (χ/, д>;·). Если системы независимы, т.е, р(х,·,^/) =р(*/) p(yj)> то легко проверить, что Н(Х, Г) = Я(Х)+Я(Г). (2.21) В общем случае зависимых систем pipqуу}) = р(*/) p(y//*f)> гдерО//х/) ~ условная вероятность, и тогда Д(Х, Y) = Н(Х) + H(Y/X\ (2.22) где Η(Υ/Χ) = Σ pfyJVKXIxd (2.23) ι - полная условная энтропия, а Ж№/) = -Ър(у^хд\*р{у}Ыд (2.24) / - условная энтропия системы Упри условии, что X находится в состоянии X/. Свойство (2.22) называется аддитивностью энтропии. Для независимых системЯ(Г/Х) = Я (Г), и (2.22) переходит в (2.21). Упражнение 2.4. Докажите неравенство Η(Υ/Χ) < Η (Υ). Вернемся теперь к вопросу об однозначности определения энтропии. К формуле (2.20) приводят различные естественные предположения о свойствах меры неопределенности (энтропии), например: а) энтропия является непрерывной функцией вероятностей; б) β случае равновероятных состояний энтропия является монотонно возрастающей функцией числа состояний; в) энтропия обладает свойством аддитивности. Рассмотрим N независимых систем Χι,..., ΧΝ, каждая из которых имеет η равновероятных состояний. Число состояний объединенной систе- 215
мы (Χι,..., Χ„), очевидно, равно ηΝ. В силу б) Η(Χ,)=Αη), H(XU..., Xn)=f(nN ), а из в) следует Η(Χ1,...,Χη) = ΣΗ(Χί) = Νί(η). i Таким образом, f(nN) = Nf(n). (2.25) Функциональное уравнение (2.25) имеет единственное решение*) f(n) =cln л. Теперь определим энтропию для неравновероятных состояний сведением к предыдущему случаю. Пусть система X имеет л состояний дс/ с рациональными вероятностями pt -т^к. При этом, очевидно, т^ + .. . + тп = к. Рассмотрим вспомогательную систему Y, которая имеет т( равновероятных состояний (с вероятностями #,· = 1/т,·), если X находится в состоянии Xf. Объединенная система (Χ, Υ) будет иметь т1+ .. . + тп = к различных равновероятных состояний, поскольку вероятность любого состояния mt 1 1 равна ptfj - — = —. В результате получаем к mi к Н(Х, Υ) = с In Аг, H(Y/Xi) = с In mu Η(Υ/Χ)=Σ PiH(YlXi) = cX — Inm,. ι / к Далее, по свойству аддитивности Н(Х) = Н{ХЛ)-Н{У1Х) = с)пк-сЪ — In m^ i к Σ — In*- Σ — ЪтА^-сХр^р^ Константу с без ограничения общности можно положить равной единице, поскольку этого всегда можно добиться переходом к другому основанию логарифмов. Итак, формула (2.20) установлена, но лишь для рациональных вероятностей #. Ее справедливрсть для любых щ вытекает из a). D Предельным переходом можно определить также энтропию для тех ситуаций, когда некий случайный вектор χ может принимать любые значения из некоторой области ЛСЛ" с плотностью распределения р(х). В этом случае ) #=-/ p(x)\np(x)dx. (2.26) Понятие неопределенности тесно соприкасается с понятием информации. Пусть энтропия исхода опыта А равна Η (А). Если опыт В содержит какие-либо сведения относительно Ау то после проведения В неопределен- *) Несложное обоснование можно дать даже в рамках школьной математики. **)Вместо (2.26) используются также более общие определения энтропии, учитывающие наличие своей меры на Ω (см., например, Стратонович Р.Л. Теория информации. -М: Сов. радио, 1975). 216
ность А будет уже равна условной энтропии Η (А/В ). Итак, опыт В уменьшает неопределенность А с величины Η (А) до Я (А/В ), поэтому вполне естественно считать разность 1(А,В) = Н(А)-Н(А/В) количеством информации, содержащимся в опыте В относительно опыта А. 2.4. Принцип максимальной неопределенности. Использование понятия энтропии позволяет решать два принципиально разных типа задач. Если плотности распределения известны, то энтропия дает одличественную меру неопределенностям и позволяет их вычислять и сравнивать между собой. Этот аспект играет важную роль в теории информации. Существенно более интересны .и глубоки задачи другого типа, в которых энтропия помогает определить неизвестные плотности распределения, обосновать агрегирование и ввести макропараметры, дающие укрупненное описание системы. Этот аспект использования энтропии играет важную роль в статистической физике, теории информации и постепенно начинает проникать в задачи анализа сложных систем самой разнообразной природы. Решение задач второго типа опирается на принцип максимума энтропии, который звучит так. В заданных внешних условиях (ограничениях) параметры системы имеют такие плотности распределения, при которых достигается максимум энтропии (неопределенности). Этот принцип вовсе не является угаданной "тайной природы", а имеет вполне разумное обоснование, на котором мы остановимся немного позже. Для уточнения действительного смысла принципа максимума энторопии и освоения правил его применения полезно рассмотреть хотя бы один пример. Найдем плотность распределения р(х) вектора *ERW, если задано единственное макроограничение: фиксировано среднее значение χ2, т.е. Г x2p(x)dx = rw2. (2.27) R Максимизируя энтропию: - f p(x)]np(x)dx-+ max (2.28) Rn ρ (χ) при ограничении (2.27) и дополнительном требовании нормировки Snp(x)dx=\, (2.29) перейдем к лагранжиану 1[ρ(χΧ\μ] =-/ [ρ(χ)]ηρ(χ)+λρ(χ)+μχ2ρ(χ)]άχ. (2.30) к. Варьируя в (2.30) плотность р(х), получим необходимое условие для решения задачи (2.27) - (2.29): Г [1ηρ(χ) + 1+λ+μ*2]δρ(χ)</χ = 0. R В силу произвольности δρ(χ) имеем 1ηρ(χ) + 1 +λ + μχ2 =0, 217
откуда Параметры к и μ'определяются из условий (2.27), (2.29). В результате снова получается распределение (2.18). Проведенные выкладки могли бы отвечать решению уже упоминавшейся задачи поиска распределения по скоростям молекул газа. Условие (2.27) при этом отвечало бы заданию энергии газа (кинетической энергии молекул). Если говорить более точно, то (2.27) допускает нарушение закона сохранения энергии, предполагая его выполняющимся лишь в среднем *). Тем не менее такое допущение легко оправдывается соображениями о независимости (раздел 2.1), которые гарантируют очень малую флуктуацию суммарной энергии ~ 1/\/Νΐ где Ν- число молекул. Получающееся таким образом распределение молекул по скоростям типа (2.18) отвечает максимуму энтропии при заданной средней энергии. Попытаемся теперь понять природу этого результата, а заодно и природу общего принципа максимальной неопределенности. Для этого решим ту же задачу о распределении молекул по скоростям совершенно другим способом. Разобьем фазовое пространство (пространство скоростей) на "очень маленькие" ячейки равного объема, в дискретные моменты времени будем измерять скорости всех молекул и соответствующий "замер" отмечать точкой в фазовом пространстве. Плотность распределения этих точек по ячейкам и будет искомым распределением (если допустить, что таковое существует и число "замеров" достаточно велико). Поскольку такая программа практически неосуществима, остается возможность разобраться в ситуации теоретически, делая те или иные разумные предположения**). Очевидно, все точки будут расположены на сфере S = {x: χ] + ...+'xlN**2Elm) , (2.31) соответствующей заданной энергии Еу где N — число молекул, 3Ν — число степеней свободы. Никаких оснований нет ожидать, что сфера (2.31) будет заполнена точками неравномерно. Таким образом, равновероятное распределение скоростей на сфере (2.31) и есть искомое распределение. Сделаем теперь криминальное на первой взгляд предположение (потом убедимся в его безобидности), что энергия в процессе наблюдений не остается постоянной, а равна Ε лишь в среднем (это предположение было бы заведомо приемлемым, если бы речь шла о фазовом пространстве одной молекулы). В этом случае точки будут располагаться на сферах типа (231), но уже разных радиусов. Однако опять-таки нет никаких оснований ожидать, что каждая такая сфера будет заполнена точками неравномерно, поскольку все направления (скоростей) равноправны. Как записать такое распределение? Оно уже получено в разделе 2.2. Это распределение типа (2.18), которое было получено как раз на основе всего двух предположений: постоянства плотности на сферах плюс задания среднего значения х2 (здесь энергии). Почему допущенное выше "криминальное" предположе- *) В статистической физике это соответствует рассмотрению канонического ансамбля (в отличие от микроканонического). **)Практически реализуема несколько иная программа (использующая доплер- эффект), которая подтверждает теоретические выводы. 218
ние таковым не является? Дело в том, что равномерная плотность, сосредоточенная на сфере (231), и плотность (2.18) практически совпадают. Распределение (2.18) дает приблизительно равномерное заполнение точками ячеек, находящихся внутри сферы (2.31), и резкое убывание плотности заполнения за пределами (2.31). С другой стороны, количество ячеек, находящихся вблизи сферы радиуса R9 растет пропорционально β3Ν-ι поэтому подавляющее число плотно заполненных ячеек находится вблизи именно сферы (2.31) и случайное наблюдение вектора х, распределенного по (2.18), будет давать точку вблизи (2.31). Одинаковость обеих этих плотностей выражается также в том, что при переходе к распределению одной молекулы по скоростям обе плотности дают один и тот же результат (конечно, если N достаточно велико, но для газа это само собой разумеется). Итак, к чему же мы пришли? Мы вывели распределение по скоростям на основе, если можно так выразиться, принципа равноправного (равновероятного) заполнения мелких ячеек фазового пространства с дополнительным соблюдением макроскопических ограничений и заодно убедились, что распределение получается то же самое, которое следует из принципа максимума энтропии. Так, на самом деле принцип максимума энтропии и есть эквивалентная (более удобная) форма принципа равноправного заполнения ячеек пространства состояний с соблюдением имеющихся ограничений. § 3. Макропараметры и агрегирование 3.1. Термодинамические потенциалы. Статистическое описание системы на основе максимизации энтропии при заданных ограничениях по существу позволяет перейти к изучению системы на макроуровне. При этом множители Лагранжа по сути дела играют роль макропараметров (укрупненных показателей), и параллельно возникают укрупненные функциональные характеристики системы, которые по аналогии естественно называть термодинамическими потенциалами. Проследим все это на следующей задаче: -Σ р(х)Ыр(х)-+ max, χ ρ(χ) Σ г(х)р(х)=Л, Σ ρ(*)=1. (3.1) X X Вместо сумм в (3.1) с равным успехом можно написать интегралы, если речь идет о непрерывных распределениях. Переходя к лагранжиану Ζ = -Σ [ρ(χ)]ηρ(χ) + λρ(χ)+μΓ(χ)ρ(χ)] χ и варьируя ρ (χ), в конечном итоге получаем ρ(χ)^β-1-λ-μ^χ\ что при учете условия нормировки дает рф = е-<"(*)/Σ е-*г{х) (32) Второе ограничение мы специально пока не учитываем, оставляя параметр μ свободным. 219
Легко видеть, что вместо (3.1) можно было бы решать другую задачу: Σ r(x)p(x)-+ min , χ р(х) -Σρ(χ)\ηρ(χ)=Η, Σρ(χ) = Ι, (3.3) χ χ но ответ с точностью до параметра был бы тот же самый (3.2). При определенном соотношении R и Я ответы совпали бы полностью. Такая "взаимозаменяемость'* задач широко используется в статистической физике, позволяя переходить, скажем, от максимизации энтропии к эквивалентной задаче минимизации энергии (которая на самом деле строго постоянна). Несмотря на физическую абсурдность второй задачи, ее рассмотрение математически оправдано и часто более удобно. Подобная "взаимозаменяемость" широко используется также в математическом программировании, где каждая задача, как Правило, рассматривается в паре со своей двойственной. Однако статистическая физика идет в этом направлении несколько дальше. Разница заключается в конечных целях. В программировании упор делается на поиск решения, в физике — на установление зависимостей между макропараметрами (постановка оптимизационных задач служит лишь средством). Например, распределение (3.2) позволяет установить зависимость R из (3.1) и Я из (3.3) от параметра μ, или от "температуры" Τ = Ι/μ. После исключения из этих зависимостей параметра Τ получается зависимость R от Я. Помимо этого, в статистической физике разработана удобная техника, опирающаяся на введение серии вспомогательных функционалов, значения которых также могут служить макропараметрами. Посмотрим, как эта техника работает на задаче (3.1). Сначала вводится статистическая сумма Z = Z<?-r(*)/r (3.4) и свободная энергия F(r) = -rinZ, (3.5) с помощью которой распределение (3.2) записывается в виде (распределение Гиббса) F - г(х) р{х) = е т . (3.6) Вычисляя энтропию # = -Σ ^-К*)е~ = F-R χ Τ Τ ' получаем зависимость F = R-TK (3.7) Дифференцируя (3.5) по температуре, имеем |р * -InZ - ΓΖ-1 Ц- = -lnZ - T~lR, 220
что после учета (3.4), (3.7) дает Н = -§. (3-8) Формулы (3.7), (3.8) дают в совокупности формулу для определения "энергии" R: R=F-TJ?r. (3.9) Дифференциал R = F + ТН, dR=dF + HdT+TdH, в силу (3.8) оказывается равным dR-T dH. Поэтому . w-T- (зло) Из (3.10) следует, что "энергия" R при возрастании энтропии Я возрастает, если Т> 0, и убывает, если Г< 0. Подобное манипулирование параметрами и соотношениями может продолжаться довольно далеко, но оно не является чисто математическим упражнением. Оно было бы бесполезным, если бы речь действительно шла о решении конкретной задачи (3.1). Однако задачи типа (3.1) служат лишь отправным пунктом. На самом деле "на прицеле" всегда держится возможность изучения равновесия взаимодействующих систем при изменении условий взаимодействия, при изменении влияния окружающей среды и т.д. Иными словами, конечной целью служат примерно те задачи, которые обсуждались в § 1. В качестве упражнения (точнее, серьезной задачи) полезно рассмотреть системы обмена ресурсами, в которых существование структурных функций не предполагается, а индивидуальные обмены имеют случайный характер и удовлетворяют неким условиям средней выгоды. В качестве упражнения (но уже не серьезной задачи) полезно рассмотреть задачи типа (3.1) с большим числом ограничений, с ограничениями, зависящими от параметра, и т.п. Это упражнение может превратиться в полезное исследование, если за математическими выкладками будут стоять интересные содержательные проблемы. 3.2. Агрегирование пассажиропотоков. Вернемся к задаче о потоках пассажиров, которая в качестве "аванса** упоминалась в предыдущем параграфе. Напомним ее содержание. В городе имеется η районов, Р( — число жителей /-го района, Wj — число работающих в /-м районе, Xij — число живущих в /-м районе и работающих в /-м, т.е. поток пассажиров из /-го района в /-й. Потоки Х/у естественно удовлетворяют 2п уравнениям связи (З.П) (3.12) i Σ*ί/ = Κ>,·, /-ι,. /=ι,. ··,«, ,.,η. 22\
Задача заключается в оценке величин χη и обосновании этой оценки. Поскольку при большом населении города число различных матриц X = ixij ]> удовлетворяющих соотношениям (3.11), (3.12), очень велико и все эти варианты могут быть в принципе реализованы, то задача может иметь осмысленный характер лишь при наличии у нее специфических свойств, которые и предстоит выяснить. Например, решение задачи можно было бы считать приемлемым в следующем (пока гипотетическом) случае. Нашлась бы матрица X *, в малой окрестности которой было бы сосредоточено 99% всех других вариантов, и лишь 1% вариантов расселения соответствовал бы матрицам X, значительно отличающимся от X*. Тогда 99 человек из 100, видимо, согласились бы, что X * — разумное решение, и на него спокойно можно опираться, скажем, при планировании распределения· транспортных средств по маршрутам. В противном случае пришлось бы признать, что исходной информации недостаточно для решения задачи. Попытаемся теперь рассмотреть ситуацию с точки зрения принципа максимальной неопределенности. В этом месте читателю стоит отложить книгу в сторону и поразмыслить над задачей самостоятельно, что может содействовать приобретению полезных навыков. Дело в том, что в задачах подобного рода сложна не математика, а подготовительный анализ. Необходимо выбрать пространство состояний, сконструировать подходящую вероятностную модель, договориться о том, какие события равновероятны и т.п. Чтобы продемонстрировать возможные ошибки, начнем с "неправильной" постановки. Будем считать χη случайными величинами с неизвестными пока плотностями распределения ρί;· (х^ ). Поставим задачу максимизации неопределенности "Я Рц(хц)Ь1Рц(хц) -* тах> а ограничения (3.11), (3.12) заменим средними Σ XifPif(xij) = Pi, Σ XijPij (χ ^ = Wj. i i Нет никакой необходимости решать эту задачу, ибо заранее ясно, что ничего хорошего не получится. Плотность распределения матриц X будет равномерной на пересечении поверхностей (3.11), (3.12). Это как раз наихудший для нас исход. Все варианты распределения пассажиропотоков равновероятны, и нет никакого центра "сгущения" X*. Порочность рассмотренного подхода заключается в том, что мы максимизировали энтропию макропараметров jcf-y, а это по существу равносильно исходному предположению об ик равновероятности в рамках ограничений. Максимизировать энтропию надо в пространстве микросостояний системы. Возникающие при этом агрегированные показатели (макропараметры), конечно, будут случайными величинами, но их энтропия будет уже не максимальной, а, наоборот, очень малой. При N -► оо (в данной задаче -/V - число жителей города) энтропия макропараметров станет минимальной, т.е. макропараметры приобретут статус детерминированных величин. Рассмотрим теперь "правильную" постановку задачи. Каждого жителя охарактеризуем плотностью распределения по всевозможным п2 состоя- 222
ниям, pij пусть при этом обозначает вероятность жить в /-м районе и работать в у-м. Далее, пусть Ω обозначает множество всех N жителей ωΕ Ω. Плотности разных жителей будем считать независимыми. Неизвестные плотности Pij (ω) найдем из решения экстремальной задачи —Σ ру(ь))\пру(<л)) -► max, (3.13) ί» /. ω Σρ„(ώ)=Ρι, (3.14) /.ω Σρν(ω)=}ν,. (3.15) i, ω Поскольку i ί условия нормировки плотностей здесь добавлять излишне, они учитываются автоматически. Используя метод множителей Лагранжа, легко приходим к решению ρ,/(ω) = β-Ι-λ/-μ/. (3.16) Учет ограничений (3.14), (3.15) позволяет однозначно определить все параметры λ,·, щ , после чего легко вычисляются все агрегаты **=ΣΡί/(ω). (3.17) ω Пусть xfj обозначает случайную величину, которая с вероятностью Pij (ω) принимает значение 1 и с вероятностью 1 - рц (ω) — значение 0. К случайной аддитивной величине ω применимы соображения о независимости из § 2, и закон убывания флуктуации пропорционально l/y/N дает основания рассматривать ее математическое ожидание (3.17) как детерминированную величину. Независимость p(j (ω) от ω, вытекающая из (3.16), наталкивает на мысль переписать задачу (3.13) - (3.15) в эквивалентной форме с помощью переменных *// = ΣΡί/(ω) = Λ^/,. ω Легко проверить, что то же самое решение (3.17) дает задача - Σ Xfj In Xij -»max, Σ xif =Ph Σ x(j = W;. (3.18) i,i i i Аккуратное преобразование дает, правда, максимизацию —Σ χ η ΪΩΧη +\ΛΠη7Ϋ -► max, но понятно, что слагаемое N In N не играет роли. 223
Метод множителей Лагранжа для (3.18) дает ».. = β-1~λ,~μ/ поэтому все *// можно представить в виде произведения xif· = x^yj. Подстановка в ограничения дает систему уравнений J i решая которую, окончательно получаем xir^T- (3.19) Обратим внимание на довольно странный факт. Оказывается, в рассматриваемой задаче макропараметры хц с самого начала можно было рассматривать как плотности распределения (с точностью до условия нормировки) и просто максимизировать "энтропию** (ЗЛ8). Случайность это или закономерность? Можно ли так поступать в любом другом случае? Отрицательное решение последнего вопроса предоставляется читателю. Задача (3.18), кстати, легко возникает в рамках другого *) подхода. Для фиксированных значений х,у число способов расселения жителей, очевидно, равно s(x) yv* Π xi}! Ui Решением исходной задачи естественно считать матрицу X, для которой S(X) принимает максимальное значение при ограничениях (3.11), (3.12). Но максимизация S(X) равносильна максимизации логарифма S(X)94to после учета формулы Стерлинга lnk\~ kink дает ]nS(x)**N\nN- Σ XijlnXij -> max. «»/ В результате снова получаем задачу (3.18). Здесь полезно подчеркнуть отличия. Оба способа решения по пути опираются на приближения. Первый способ жесткие ограничения (3.11), (ЗЛ2) заменяет требованием их выполнения лишь в среднем (3.14), (3.15) (каноническое распределение). Второй — не затрагивает ограничений (микроканоническое распределение), но при записи критерия опирается на приближенную формулу Стирлинга. 3.3. Термодинамические параметры. Занимаясь агрегатами лс,·,·, мы едва не забыли о термодинамических параметрах. Настоящими термодинамическими параметрами в рассмотренной задаче являются множители Лагранжа λ,·, μ7·, или их функции VF' ' у/ТГ' *) По форме, но не по содержанию. 224
Величину Xf естественно интерпретировать как жилой потенциал /-го района, yj — как промышленный потенциал /-го района. Эти потенциалы в рамках рассмотренной модели полностью определяют "макроскопические" характеристики города. Знания этих потенциалов достаточно для ответа на любой "макровопрос", например, х{1 - x^j. Наличие функциональных зависимостей между макропараметрами важно тем, что теперь нет необходимости каждый раз при изменении условий решать задачу заново. А раз так, то гораздо более легко оказывается решать задачи о взаимодействии города с окружением, о взаимодействии между контактирующими городами и т.п. Рассмотрение таких задач по схеме, изложенной в § 1, могло бы дать читателю богатую пищу для размышлений (не столько о потоках пассажиров, сколько о существе термодинамического подхода). 3.4. Теория и практика. Могут ли реальные пассажиропотоки в реальном городе существенно отличаться от тех, которые задаются формулой (3.19)? Если говорить о случайных флуктуациях расселения, то слишком маловероятно. Но на самом деле могут и отличаются. Однако "виноваты" в этом не статистические методы, а совсем другие обстоятельства. Беда заключается в том, что, помимо (3.11), (3.12), в реальных задачах имеются другие макроограничения, которые не всегда легко учесть. Физика в этом отношении находится в существенно более выгодном положении. Там известно, что есть законы сохранения энергии, количества и момента количества движения и других интегралов движения нет. Поэтому результаты там более надежны. В социально-экономических же задачах, понимание которых далеко от совершенства, всегда имеется возможность упустить что-нибудь существенное. Какие дополнительные ограничения в задаче о пассажиропотоках могут быть? Первое, что бросается здесь в глаза, это целенаправленный обмен жилплощадью, ориентированный на сокращение времени поездок на работу. Если ttj — время поездки из /-го района в /-й, то можно сказать, что обмен направлен на уменьшение суммарного времени ZtiiXif = T. (3.20) ι, i В принципе Xij можно было бы определять из решения задачи Σ tijXij -> min, Σхи =Pif Σχί} = Wh (3.21) и i i i но это утопия. Такое решение хуже того, что мы уже имеем. Причины лежат на поверхности. Во-первых, система обмена далека от совершенства: чересчур инерционна и опирается в основном на парные обмены. Во-вторых, люди предпочитают жить семьями, а члены семьи - работать в разных организациях. Наконец, жизнь не сводится к поездкам на работу! Тем не менее фактор целенаправленных обменов, видимо, оказывает макроскопическое влияние на систему. Его влияние можно отразить введением в задачу условия (3.20) в качестве ограничения. Значение среднего времени T/N поездки на работу можно получить, опросив сотню человек из миллионного населения. Решением совокупной задачи (3.18), (3.20) будет *ί/ = *-1-λ'-μ>-,"ίΛ (3.21) 225
Определение параметров технически здесь сложнее, но тоже может быть представлено в конечной форме. Вместо (3.21) можно записать xtj = = х(у1 Гц , где гij по существу известны: Гц = e"vti]' . Далее потенциалы Χι выразятся аналогично предыдущему, но только через компоненты вектора R~lP, где R = [а·// ], Ρ = (Ρχ, ..., Ρη). Та же участь постигнет потенциалы yj. Иными словами, прежние термодинамические параметры останутся, но добавятся новые "коэффициенты связи" г η. Заметим, что (3.20) можно добавлять не в ограничения, а просто вычесть из энтропии. В результате (3.18) превратится в задачу максимизации взвешенной энтропии -Σ χη In ζ-1- -► max, Σ χη =Pit Σ χη = Wh 1li j i где 7 ij = 1 η tif-. Решение будет то же самое (3.21). Интересно было бы рассмотреть модель, в которой люди совершают поездки не только на работу. Это неплохое упражнение, только, занимаясь им, надо стремиться к минимуму предположений (к максимально простым гипотезам) и ни в коем случае не начинать с энтропии типа (3.18), а сразу браться за изобретение вероятностной схемы микропроцессов. Рассмотренную модель полезно также переосмыслить и додумать в рамках задач иной природы: многопродуктовые потоки в экономике, информационные потоки в системах связи, миграция биологических видов. Исходные вопросы также можно переориентировать. Искать, например, не потоки в заданных условиях, а условия для необходимого изменения потоков в желаемом направлении. 3.5. Структурные функции неравновесных систем. Вернемся к модели, описанной в § 1, и рассмотрим ее простейший вариант, когда распределяется всего один вид ресурса и имеется т ячеек. В результате будем иметь ту же исходную задачу (1.3): т т Σ sk(xk)-+max, Σ хк = X, хк>0, (3.22) к=1 к-1 только хк здесь не векторы, а скаляры. Важно подчеркнуть, что структурная функция (1.5) объединенной системы определена лишь в равновесии и для неравновесных состояний теряет смысл. Продемонстрируем это на совсем простои примере, когда есть всего две ячейки со структурными функциями sl (х1) = rx \fx^t s2 (x2) =r2 yfx^. Суммарный эффект S = rlsfxr + r2yJX-x1' зависит, вообще говоря, не только от Хъ но и от распределения. При оптимальном распределении г2 г2 X ' т~ Л у X — Г ~" Л 226
суммарный эффект оказывается функцией только от X: S(X) = y/r\ +г1'\ПГ. (3.23) Формула (3.23) как раз задает структурную функцию объединенной системы. Можно ли нечто подобное (3.23) сконструировать для неравновесных систем, в которых царит определенный беспорядок? Пусть, например, ресурс в системе распределяется случайно с неизвестной плотностью распределения. Если бы плотность была известной, то, усреднив суммарный эффект, можно было бы получить его среднее значение S(X) как функцию от X. Для системы из двух ячеек "структурная" функция S(X) малополезна, ибо наблюдения покажут (особенно при равномерных плотностях), что флуктуации чересчур велики и средний прогноз эффекта S(X) практически ничего не дает *). Однако, если число ячеек в системе достаточно велико, а плотности Piipci) независимы, связь S от X будет практически детерминированной. Но откуда взять плотности #·(*/)? Здесь опять-таки может помочь принцип равноправия всех возможностей при заданных ограничениях, другими словами, принцип максимальной неопределенности. Однако задача со —Σ / Pi(Xi)\npi(xi)dXi -► max, i — °° (3.24) Σ / x(Pi (Xi )dXi = X, f Pi (Xi )dXi = 1 | OO OO для этой цели слишком наивна. Решение (3.24) дает плотность, близкую к равномерной, на поверхности Σχ{ = X. Конечно, в результате получится ϊ структурная функция S (X), но она будет далека от настоящей. В реальных экономических системах, несмотря на беспорядки (накладки, неувязки и т.п.), оптимума нет, но есть стремление к нему. Отразить такое "стремление" на макроуровне можно разными способами, но внимательный анализ показывает, что годится только один. В реальных системах поддерживается некий средний, уровень значимости ресурса. Интегрально это можно записать так: Σ / $<?с{Ур&Л(1х{ = \. (3.25) ί = 1 — oo Добавляя ограничение (3.25) к задаче (3.24), получаем в конечном итоге плотности Μ*,·) = *-Τ_μ*'-1'ί'(*'')· (3.26) Параметры в (3.26), как обычно, получаются на основе учета ограничений. Плотности (3.26) позволяют ввести структурную функцию &(Х) неравно- *) По той же причине среднегодовая температура не годится в качестве прогноза на каждый следующий день. 227
весной (в прежнем смысле) объединенной системы. Здесь кончается статистика и начинается термодинамика. Далее, например, практически без изменений может применяться технология из § 1. Принципиальный момент в рассмотренной модели — возникновение оптимизации на фоне видимого беспорядка. Оптимизация в экономике вообще очень часто подвергается сомнению. Вот что по этому поводу пишет Дж.М.Кейнс: " ... человеческие решения, влияющие на будущее, — в личных, политических или экономических делах, — не могут зависеть от строгого математического расчета ... Колесо заставляет крутиться наша внутренняя потребность в деятельности^ причем наше собственное рациональное чувство определяет, как умеет, лучшую из возможностей, рассчитывает там, где может, но очень часто опирается в своих действиях на каприз, пристрастие или случай" *). Однако случайный характер индивидуальных актов выбора не исключает оптимизационных тенденций на макроуровне. Например, система со структурной функцией S (X) при взаимодействии с окружающей средой будет как бы "стремиться" к оптимизации S (X), хотя никто конкретно в системе об оптимизации может не думать и даже не подозревать о существовании S (X). 3.6. Парадокс Гиббса и другие трудности. Начнем с "других трудностей". Исходные задачи, к которым применяется принцип максимизации· энтропии, как правило, не являются по своей природе вероятностными. Поэтому начинать всегда приходится с изобретения вспомогательной вероятностной модели. Это и есть первая и основная трудность. Как выбрать пространство состояний, какие события считать равновероятными (равноправными), нет ли в пространстве разных событий, которые на самом деле идентичны? Эти и многие другие сопутствующие вопросы обычно весьма сложны и нетривиальны. Самая большая опасность заключается в поверхностном к ним отношении, которое в большинстве случаев преобладает. Считается, что эти вопросы трудны для школьников, а не для квалифицированных специалистов, и что еще хуже, исследование часто начинают с.некой середины, опираясь на поверхностные аналогии ^.Доказательством того, что здесь все не так просто и трудности имеют отнюдь не школьный характер, служат ошибки и неприятности, время от времени возникающие в самой статистической физике. Одна из крупных неприятностей подобного рода — парадокс Гиббса, решением которого, кроме самого Гиббса, занимались такие выдающиеся ученые, как А.Эйнштейн, Э.Шредингер, М.Планк, Г.Лоренц, В.Нернст и многие другие. Тем не менее по сей день общепринятого решения нет. Конечно, в современных учебниках по термодинамике дается решение парадокса — но каждый учебник дает свое объяснение. Парадокс Гиббса заключается в следующем. Термодинамика для энтропии идеального газа дает следующую формулу: S = c(T)N\nV + Ns0, (3.27) *) К е й н с Дж.М. "Общая теория занятости, процента и денег". - М.: ИЛ, 1949. **)Автору не хочется указывать источники, но "термодинамических ляпсусов" в литературе довольно много. Вероятно, читатель сможет найти их и в данной главе. 228
где N - число молекул, V — объем, с (Г) — коэффициент, зависящий от температуры Г. Из (3.27) следует, что при смешении двух газов (находящихся в двух различных объемах Vx и V2 при одинаковой температуре) суммарная энтропия возрастает на величину, пропорциональную Vx + V2 Vx + V2 Nx In ~ + N2 In \ > 0. (3.28) Если два газа различны, то этот результат подтверждается опытом. Однако вывод неравенства (3.28) никак не опирается на предположения о сортах смешиваемых газов. Поэтому при смешении одинаковых газов мы тоже должны ожидать возрастания суммарной энтропии. Но для термодинамики это катастрофа, потому что тогда энтропия газа не более чем мистификация. Энтропия оказывается функцией истории газа, а не его термодинамического состояния. Хуже того, любое состояние газа можно считать полученным в результате устранения ряда перегородок, и тогда энтропия будет больше любого наперед заданного числа. Сам Дж.В. Гиббс разрешил противоречие волевым путем, постулировав, что из (3.27) надо вычесть ΙηΛΠ &Ν\ηΝ. Тогда энтропия смешения действительно оказывается положительной лишь для различных газов и парадокс снимается. Но за введением добавки \nN\ по существу стоит необходимость при подсчете числа состояний газа отождествлять состояния, получающиеся перестановками молекул, что интуитивно выглядит противоестественным. В рамках квантовой механики этому находится правдоподобное объяснение, но очень сомнительно, что энтропия идеального газа имеет сугубо квантовую природу. Здесь едва ли уместно входить в детали, тем более что о парадоксе Гиббса имеется обширная литература. Единственное, на что хотелось бы обратить внимание, это то, что отголоски парадокса Гиббса можно обнаружить и за пределами физики. § 4. Проблема обоснования 4.1. Парадоксы обратимости и возврата. Проблема обоснования статистических методов не является сугубо физической, однако при ее обсуждении удобнее всего обращаться к примеру физики, где задача предстает во всей полноте и в то же время может быть достаточно ясно сформулирована. В общем виде^ суть проблемы заключается в указании причин, которые обеспечивают эффективность статистического описания детерминированных процессов. Пример идеального газа (трехмерного бильярда) позволяет вести разговор на более конкретной основе. Помимо статистического описания здесь имеется еще реальное статистическое поведение системы, которое доступно приборному контролю, и по этой причине является опытным фактом, а не только гипотезой. Краеугольный вопрос — противоречие между обратимым характером механического движения молекул и необратимым характером протекания статистических макропроцессов. Иногда за фасадом этого вопроса мыслят себе примерно такую картину. Есть обратимые во времени уравне- 229
ния механики, например уравнения Гамильтона dqt ЪН dpi ЪН —- = , —- = , (4.1) dt dpi dt bqi в силу которых некие средние характеристики S системы удовлетворяют уравнению S = φ&. (4.2) При увеличении количества уравнений (4.1) уравнение (4.2) становится необратимым во времени — количество переходит в качество. Такое положение дел было бы действительно мистикой. Но ничего подобного в статистической физике не происходит. Никакие уравнения типа (4.2) не рассматриваются, а если и рассматриваются, то это вспомогательные уравнения, а не уравнения в силу (4.1). Если отвлечься от деталей, то статистическая физика лишь утверждает, что в равновесии (в стационарных внешних условиях) энтропия системы максимальна. Как отсюда возникает однонаправленность макропроцессов? Очень просто. Если внешние условия меняются то энтропия "стремится" к новому максимуму при переходе к новому равновесию. Это и определяет течение времени "в одну сторону", хотя, если вдуматься, то природа однонаправленности реального физического времени находится в совсем другой области *). Таким образом, все сводится к вопросу о том, вступает ли в противоречие принцип максимума энтропии с обратимостью во времени уравнений (4.1). Если вопрос понимать буквально, то ответ будет положительный: да, вступает, потому что существуют траектории (4.1), на которых энтропия не максимальна и даже вообще не определена. Однако возможно, что на основной массе траекторий энтропия системы во времени ведет себя примерно так, как изображено на рис. 18. Большую часть времени она постоянна и максимальна, но имеются редкие "провалы", расстояния между которыми измеряются миллиардами лет. В этом случае есть все основания признать ситуацию свободной от противоречий. При этом надо заметить, что на траекториях (4.1) в обратном времени энтропия почти все время также максимальна. Что нужно для того, чтобы энтропия системы вела себя так, как показано на рис. 18? Для этого необходимо, чтобы почти все траектории (4.1) "беспорядочно метались" по поверхностям интегралов движения, равномерно их покрывая. Установление этого свойства — чисто математическая задача, на решение которой направлены обширные исследования по эргодичности и размешиваемости систем вида (4.1). В этом направлении достигнуты значительные успехи**), и при обсуждении принципиальных вопросов обоснования статистических методов факт "беспорядочного метания траекторий" можно принимать как данный. *) Если вдуматься еще глубже, то природа реального времени становится вообще неясной. **) См. книгу: Корнфельд И.П., Синай Я.Т., Фомин СВ. Эргодичес- кая теория. — М.: Наука, 1980. 230
В этом случае, правда, тревожные симптомы несоответствия вроде бы исчезают и возникает довольно прозрачная картина перехода от микроописания системы к макроописанию. В стационарных условиях энтропия максимальна; если систему насильственно поместить в исходное положение, соответствующее точке В на рис. 18, то энтропия затем быстро возрастает, в точки же типа А систему "загнать" макровоздействием невозможно*), такие состояния могут возникать самопроизвольно, но это слишком маловероятно. Однако внимательный анализ показывает, что на Hi ν Рис.18 фоне качественного благополучия остаются некоторые количественные несоответствия, что приводит к необходимости изменить точку зрения, но об этом — в следующем разделе. Помимо рассмотренного выше парадокса обратимости, против статистического описания систем (4.1) выдвигается обычно еще одно возражение (парадокс возврата). По теореме Лиувилля при движении (4.1) сохраняется фазовый объем. В этих условиях известная теорема Пуанкаре утверждает, что система (4.1) с течением времени подойдет сколь угодно близко к любому наперед заданному состоянию, в частности, через определенное время (цикл Пуанкаре) вернется к исходному положению. Однако в рамках качественной картины парадокс возврата существенного значения не имеет, поскольку цикл Пуанкаре оказывается значительно большим возраста Вселенной. 4.2. Размешивание и движение областей. Долгое время считалось, что обоснование статистической физики сводится к доказательству эргодичности. Потом выяснилось, что эргодичность не объясняет всех количественных закономерностей**). Например, статистическая физика определяет вероятность возникновения менее равновесного состояния А2 из состояния Α χ равной (флуктуационная формула) e(s*-sOrk = m{A2)im(Ai)) (4.з) где т{А) — мера множества А *) Здесь не место вникать в детальное обсуждение макроскопических опытов и воздействий, которые по своей природе не в состоянии фиксировать микроскопическое положение системы и фиксируют лишь некоторую область неопределенности. * *) И тогда стали говорить, что эргодичность вообще ничего не объясняет. 231
Объяснение (4.3) в рамках рассмотрения индивидуальных траекторий (4.1) оказывается невозможным. Приходится рассматривать движение в фазовом пространстве не траекторий, а областей, и если любая начальная область при движении (4.1) равномерно размазывается по поверхностям интегралов движения, то все оказывается в порядке. При наличии такого "размазывания" говорят, что система является размешивающейся. Необходимость размешивания была обоснована Н.С. Крыловым [29]. Размеши- ваемость - более сильное требование, чем эргодичность. Так или иначе, но теперь общепринято мнение, что обоснование статистических методов равносильно установлению размешиваемое™. В известной степени это действительно так. Опыт показывает, что там, где есть размешивание, проявляются статистические закономерности. Однако подобная точка зрения доставляет определенные неудобства, переводя задачу на формальную "неосязаемую" основу. Почему, имея движение точки в фазовом пространстве, надо описывать систему движением областей? По этому поводу Н.С. Крылов пишет: "Такой принцип, относясь к области, к которой не применим ни аппарат квантовой механики, ни аппарат классической механики, конечно не может быть доказан иначе, чем правильностью вытекающих из него следствий". Далее мы попытаемся все же предложить другую точку зрения, основанную на идее скольжения реальной траектории по ансамблю траекторий. 4.3. Скольжение по ансамблю. Понятия замкнутости, изолированности системы, безусловно, являются идеализациями. Реальную систему пронизывают громадные потоки нейтрино, движение частиц на далеких звездах посредством гравитации кардинальным образом меняет поведение молекул в любой "изолированной" системе. Малое возмущение φ0 в направлении движения молекулы возрастает по экспоненциальному закону Ψί ~ ^о (Vro)i/r» где λ — длина свободного пробега, г0 — радиус молекулы, г — время свободного пробега. После нескольких столкновений φΐ становится больше 4 яг, делая невозможным предсказание на основе динамических уравнений, не учитывающих внешние возмущения. Э. Борель подсчитал, например, что перемещение массы 1 г на 1 см на какой-нибудь звезде, удаленной от Земли на несколько световых лет, произведет у Земли изменение гравитационного поля порядка 10~100, что в свою очередь не позволит предсказать направление движения молекул на Земле на времена свыше 10~6 с. Принципиальная невозможность заэкранироваться хотя бы от внешних гравитационных возмущений послужила источником целого ряда работ, которые искали корни статистических закономерностей вне изучаемых систем. Критика этого направления поиска дана Н.С. Крыловым. Дж.В. Гиббс и другие авторы включают в гамильтониан зависимость от положений внешних тел, но этим лишь придается общность рассуждениям. Как бы доказывается, что наличие внешних факторов "не мешает" обнаруживать системе статистические закономерности. Другими словами, несмотря на то, что изолированные и реальные системы имеют громадные различия в детальном поведении, со статистической точки зрения они считаются идентичными, т.е. корни статистического поведения предполагаются скрытыми внутри самой системы. Ниже излагается точка зрения, которая также признает, что характерные черты статистического поведения опреде- 232
ляет динамика самой системы, но возмущающие факторы как бы лучше позволяют системе реализовать скрытые возможности. Рассмотрим гамильтонову систему (4.1). Точка фазового пространства Р = {р, q) в момент времени t переходит в Pt> что можно записать так: Pt- UtPt где Ut - оператор сдвига по траекториям (4.1). Область М0 с течением времени переходит в MQt - UtM0> Фиксируем теперь некоторую область Μ Если при t -* °° мера множества точек области Moti попадающих в М, стремится стать пропорциональной мере области М, то система называется размешивающейся. Будем рассматривать системы, размешивание которых происходит на поверхности Ω заданной энергии // = И = const. Зададим меру произвольного множества do I do mW= / „ Jrril/f в llgrad/^|| / Ь ||gradtf|| Таким образом, т^)- 1. Для избранного мероопределения движение размешивающегося типа определится условием lim / f(Pt)g(P)dm = f f(P)dm fg(P)dm (4.4) для любых функций / и g из L2. Перейдем теперь непосредственно к механической интерпретации размешивания областей в фазовом пространстве. Движение "возмущенной" системы описывается уравнениями dqt ЪН Э(Я + 6Я) dpi_ ЪН Э(Я+6Я) dt bpi dpi ' dt bqi oqt где ЪН — гамильтониан возмущающего воздействия. Известно, что решения системы (4.1) Ч{ = Я ι ft ql Ph Pi = Pi ft Qt > P,9)> (4·6> являющиеся функциями начальных значений qf и pf, представляют собой свободное унивалентное каноническое преобразование, которое переводит систему (4.1) в dqf/dt = Of dp°ldt=Q, а гамильтонову систему (4.5) в dqf ЪЗН dp? ЪдН dt dp? ' dt dq? (4.7) Следовательно, решение (4.5) можно представить в форме (4.6), где qf и рр определяются из (4.7). Если гамильтониан внешнего воздействия ЬН является случайной функцией, то (4.7) определяет некоторую начальную область М0 с плотностью распределения точек Ро(Р). В эквивалентной форме ситуацию можно описать следующим образом. Имеется ансамбль систем с плотностью распределения Ро(Р) при t = 0. Эволюция каждой системы подчинена уравнениям (4.1). Истинное же движение происходит так, что фазовая точка изучаемой системы с течением времени совпадает с положением то одной, то другой системы ансамбля. Получается как бы скользящий режим движения. В каждый момент времени одна из 233
систем ансамбля определяет положение реальной системы, и в то же время ни одна траектория ансамбля не дает представления об истинном движении. Несмотря на то, что реальной системе соответствует в фазовом пространстве лишь траектория точки, мы здесь естественным образом пришли к необходимости изучения ансамблей, т.е. к движению областей. Следует подчеркнуть, что макроскопическое поведение системы не зависит от плотности р0 (Р), иначе р0 (Р) пришлось бы вводить как закон природы, а значит, переносить трудность из одного места в другое. Нечувствительность системы к виду Ро(Р) легко показать. Пусть m(ttA) есть мера множества точек Pt (при начальном распределении Ро (Р)), попадающих в фиксированную область А в момент tt a 0(4)— характеристическая функция А. В пределе, опираясь на существование размешивания (4.4), получим hmm(t,A) = Ит /e(Pt)pQ(P)dm = f в{Р)ат f p0(P)dm =m(A), (4.8) f-oo Г-ЮО ^ Ω Ω т.е. наличие размешивания в исходной формулировке не зависит от Ро(Р)· Грубо говоря, это является следствием того, что каждая малая область, на которой р0(Р)^ const, равномерно размешивается по Ω, что в совокупности дает интегральный эффект (4.8). Докажем "грубую эргодичность". Обозначим через r(t, А) суммарное время пребывания точек Pt в А до момента t Тогда суммарное относительное время пребывания точек Pt в А в пределе будет равно т(г, А) 1>(р0)= lim . f-+<» t Очевидно, ф0)= / ( Hm - f e(UtP)p0(P)dt)dm = Ω Ι '-*°° t ο J It = lim -J7 e{Pt)pQ(P)dm dt = m(A). D Исходя теперь из произвольного начального закона распределения, мы вправе стать на чисто информационную точку зрения. Исследуя множество всевозможных внешних воздействий, мы приходим к тому, что множество Н, приводящих к противоречию с опытными фактами, имеет меру нуль. Фиктивное движение начальной точки Р, определяемое системой (4.7), представляет собой в каждом конкретном случае выборку из ЛГ0. Для нас безразлично, случайна она или псевдослучайна. Единственным предположением оппозиции может быть допущение, что природа "играет против нас", реализуя нежелательные выборки нулевой меры. Чтобы убедиться в нелепости такого предположения, достаточно заметить, что внешнее воздействие практически независимо от поведения любой отдельной системы. Произвольный вид Ро(Р) делает само понятие начального распределения до некоторой степени относительным. Достаточно лишь изменить порядок рассуждений. Для любого движения (4.7) начальной точки Ρ можно подобрать соответствующую плотность Ро(Р), для которой истинное движение Ρ будет достаточно хорошей выборкой. 234
Статистика изучает движение ансамбля и поведению реальной системы сопоставляет в ансамбле движение одной из систем. А поскольку систем в ансамбле, эволюция которых не согласуется с предсказаниями макроскопической термодинамики, оказывается очень мало, статистическая физика приписывает малую вероятность обнаружить в природе систему, движущуюся в противоречии с термодинамическими законами. Точка зрения, изложенная выше, отвергает такую возможность. Всякая система, даже специальным образом "приготовленная" в начальный момент, под влиянием внешних воздействий сходит с "предначертанного"-пути микроскопического развития, следуя законам макроскопической термодинамики. Все количественные соотношения статистической физики, включая флуктуационную формулу, остаются неизменными, но меняется их трактовка, которая заодно ликвидирует парадоксы обратимости и возврата. 4.4. Круговая модель М. Каца. Рассмотрим простую модель, обнаруживающую трудности статистической физики в элементарной форме. На окружности отмечено η равноотстоящих точек, т из которых составляют множество Q. В каждой точке помещен белый (б) или черный (ч) шар. В единицу времени каждый шар переходит против часовой стрелки в соседнюю точку, причем, если шар выходит из точки, принадлежащей Q, он меняет свой цвет. Обозначим через N6(t) и N4(t) число белых и черных шаров в момент Г,через N6(Q, t) и N4(Q, ΐ) - число белых и черных шаров в момент t в точках, принадлежащих β Динамика модели, очевидно, подчинена законам сохранения л*('+1)=Лб(0-Лв(ао+ А'ч(& О, N4(t+l) = N4(t)-N4(Q, t)+N6(Q,t). Теперь предположим, как это делается в статистической физике при совмещении динамической и вероятностной интерпретаций, что <ЛГбСй 0> = MW6(0>, W4(& 0> > =М<^Ч(Г)>, (4.10) где μ = т/п < 1/2. Тогда легко получить <A%(f+l)-A^(r+l)) = (l-2μ)Wб(0-^ч(0>) откуда следует <N6(t) -N4(t)) = (1 - 2μ)' <ЛГб(0) -N4(0)\ Итак, математическое ожидание разности числа белых и черных шаров экспоненциально убывает с течением времени (временная необратимость). С другой стороны, исходная модель обратима во времени (сдвиг Q на один шаг против часовой стрелки и дальнейшее движение шаров по часовой). Кроме того, модель возвращается в исходное состояние через t = 2n (цикл Пуанкаре). Возникшее противоречие в основе своей сходно с трудностями статистической физики. Простота модели сразу позволяет указать на неправомочность предположения (4.10). Тем не менее задача состоит не в замене условий (4.10) другими, а в разумном их обосновании, поскольку окончательный результат соответствует поведению реальных термодинамических систем. М. Кац [19, 20] рассматривает путь, эквивалентный по своей логической структу- 235
ре методам статистической физики. За счет отказа от точных сведений о множестве Q (о микроструктуре) производится усреднение по всевозможным Q, чем ликвидируется временная обратимость. Затем вводится ограничение t < η, уничтожающее парадокс возврата в исходное состояние. Таким образом, временная необратимость оказывается следствием априорных вероятностных предположений. Следуя основной идее предыдущего раздела, попытаемся внести в динамику модели внешнее случайное воздействие. Введем случайную функцию (-1 с вероятностью р, +1 с вероятностью 1 — р. Пронумеруем последовательно точки на окружности и сопоставим белому цвету число +1, черному — 1. Введем также функцию ί —1, если kEQ, \ +1, если k$Q Пусть теперь Kk(t) обозначает цвет шара в точке к в момент t В таких обозначениях динамика модели запишется в форме Kk(0 = X(0^-iK^1(i-l). (4.11) С вероятностью ρ шар может случайно изменить цвет, что отражается наличием χ(ί) в (4.11). Очевидно, к*(О=^^(0)х(1)..,.х(О8*-1...6^г. Легко понять, что сумма Σκ^ (ΐ) дает разность между числом белых и чер- к ных шаров в момент f. Считая для простоты, что в начальном положении все шары были белыми (^(0)=1), нетрудно найти математическое ожидание удельной разности /N6(t)~N4(tf\ /l \ 1 — —) =(- Σκ*(θ) = - (χΟ).^χ(0>ΣδΛ_1...δ^ί = \ П / \П к / П к = - (xiO^ik.!...^. (4.12) П к 1 Величина — Σ δ^_ ι ... Sk_t = c(t) является ограниченной функцией вре- п к мени |с(Г)| < 1, а <χ(0>= 1 - 2р, поэтому (4.12) можно записать в виде /N6(t)-N4(t)\ ч " С К п К } =c(f) (1 -2p)f. Итак, удельная разность числа белых и черных шаров экспоненциально стремится к нулю. Полученный результат является, однако, совершенно тривиальным, поскольку найденная причина статистического поведения коренится пока исключительно в наличии внешнего случайного фактора. 236
Перейдем к оценке функции с (ί). Рассматривая совокупность всех множеств Q, имеющих ровно т элементов, мы обратим δ^ в случайные величины. При условии Σ δ^ = η - 2m можно найти, что (t < п) к <<?(ί)>~(1-2μ/. Итак, при t < η мы приходим к результату (*w;*w)~o-»»/o-»/-.-»r. («ад где время релаксации 1 1η(1-2μ)(1-2ρ) (4.14) Содержание последних формул весьма любопытно для обсуждения. Наличие в (4.13) множителя (1-2μ/ тесно связано с предположением t<nn осреднением по всевозможным множествамQ.С другой стороны, эти условия можно свести к неким локальным типа (4.10). Наличие же второго сомножителя, т.е. случайного фактора, обеспечивает в каждый последующий момент времени "все лучшие" локальные условия, снимая тем самым ограничение t < η и необходимость осреднения по всем Q. Несмотря на то, что истинное вероятностное поведение системы обусловлено присутствием возмущающего воздействия χ(ί), время релаксации (4.14) при малых значениях ρ определяется главным образом структурой самой модели. Имея дело с оценкой среднего (4.13), мы вправе спросить, как часто истинные события будут развиваться вблизи их математического ожидания. Ответ на этот вопрос дает вычисление дисперсии N*(t)-N4(f) /N6(t)~N4(t) .1(ι_2μ)2'(1-2ρ)2', η которое вселяет оптимизм, утверждая, что истинное движение весьма близко к ожидаемому. Интересно отметить иную возможность введения случайности в описываемую модель. Существует чисто формальный прием устранения технических трудностей при вычислении средних значений, который состоит в переходе от микроканонического распределения к каноническому (с переменным числом частиц). Сложность вычисления <с(/)> заключалась в наличии жесткого ограничения Σ δ д. = η - 2m. При переходе к каноническому к распределению это ограничение заменяется более слабым (Σδ^ > = η - 2m. к В этом случае процедура решения резко упрощается: {δι . ..δ,> = <δ! >...«,) =(1-2μ)'. 237
§ 5. Агрегирование линейных систем *) 5.1. Общие соображения. При изучении экономики часто модельное описание системы ведется с помощью макропеременных и макрозависимостей. Чтобы уточнить, о чем идет речь, рассмотрим несколько примеров. 1. Пусть V - национальный доход, К - объем капиталовложений, L - объем трудовых ресурсов. Выписывается некая функциональная зависимость V = f(K, L), например V =AKaL l~"a. Вообще говоря, существование функциональной зависимости между V, К и L неочевидно. Результат V зависит не только от К и L, но и от того, как конкретно капитал и трудовые ресурсы распределяются. 2. Рассматриваются зависимости типа W - /(D), где D - затраты на научные разработки, W - экономический эффект. На самом деле W зависит не только от Д но и от того, по каким каналам и как D будет распределяться в экономической системе, не говоря о внешних по отношению к модели факторам. 3. Линейная модель межотраслевого баланса χ - Ах + у оперирует с объемами выпусков jt/, которые являются суммами выпусков χ. по к, где к - номер предприятия, / - номер вида продукции. Безусловно, коэфф'ициенты матрицы затрат А не постоянны, а зависят от того, как плановые суммарные выпуски распределяются между предприятиями. 4. Производственная функция предприятия у = f(x1,..., хп) также весьма условна. Объем выпуска у зависит не только от объемов */ используемых ресурсов, но и от графиков поставок, качества решения организационных производственных задач и многих других факторов. Список подобных примеров можно было бы неограниченно, продолжить. Практически любая экономическая модель оперирует с некими агрегатами, игнорируя их внутреннюю структуру. Перечисленные примеры дают интуитивное представление о природе возникающих трудностей. Вот наиболее конкретный пример, где эти трудности осязаемы и наглядны. Пусть, переработав набор продуктов χ = {xlt ..-., χη }, система может произвести набор продуктов у = Ах, гдеЛ - положительная квадратная матрица. Пусть ρ - {plf... ···» Рп ) - вектор цен, и нас интересует взаимосвязь агрегатов Υ = (ρ, у), X - {ρ, χ). Если ρ является собственным вектором транспонированной матрицы А , то Υ = = λΛΓ, где λ - соответствующее собственное значение. Действительно, Υ = (ρ, Αχ) = (А ТР, х) = λ(Ρ, х) = λ*. В противном случае, если ρ не является собственным вектором Ат, однозначной зависимости Υ от X нет - Υ зависит не только от X, но и от всего вектора х. Последний пример наталкивает на мысль работать со специально подобранными агрегатами. Однако для экономики это утопия. В нелинейных моделях существование "настоящих" агрегатов - редкое исключение. Дай в линейных экономических моделях приходится работать не с теми ценами, которые обеспечивают агрегируемость, а с теми, которые есть * *). Поэтому более естественно сконцентрировать внимание на тех условиях, которые позволяют работать с любыми априори заданными агрегатами, хотя бы приближенно. Разумно ожидать, что это окажется возможным для систем достаточно большой размерности. 5.2. Простейшее агрегирование. Вернемся к уже упоминавшейся линейной модели, несколько расширив предположения. Имеются л-мерные векторы х, р, /-мерныевекторы у, q и прямоугольная матрица А = [ау] размером /Хм, задающая связь между унх: ' у=Ах. (5.1) *) Речь идет о некоторых результатах, полученных совместно с Г. Адиловым. **) Совершенствование системы цен - весьма важный вопрос, но не следует забывать, что он не может решить всех проблем. Денежный механизм многофункционален по назначению, поэтому идеальной системы цен не существует. Система цен, обеспечивающая агрегируемость одной подсистемы, как правило, не обеспечивает агрегируемость другой подсистемы. 238
Нас интересует установление зависимости между агрегатами η ι Χ = φ, χ) = Σ PiXit Υ=ΰ,γ)=Σ q}yj. (5.2) ί=ι /=ι Матрица А и все векторы предполагаются положительными. При желании здесь можно подразумевать, например, следующую ситуацию: pi и.<?/ — внутренние и внешние (валютные) цены, х/ и у} - закупаемые и производимые объемы продукции. Связь между агрегатами (5.2) (если она существует) - это описание экономической эффективности валютных затрат, независимо от конкретного распределения последних. В силу (5.1) 1 P/Xi Ч1У1 = Σ QiQij Χ. i Pj x Поэтому Υ = λ(χ)Χ, где λ(χ)=Σ — . (5.3) hi Pf X Далее используются обозначения bij = qt ; bj = Zj bij ; zj = . Pj - * X Если все bj - μ, т.е. не зависят от/ , то агрегирование идеальное, λ (χ) = μ. Для этого нужно, чтобы векторы цен ρ и q удовлетворяли условию согласования Aτq = μp. (5.4) Согласование цен (5.4) всегда возможно, причем многими способами. Если / = η и дополнительно ρ = q, то в предположении неразложимости матрицы А существует единственный (с точностью до скалярного множителя) вектор цен, обеспечивающий идеальную агрегируемость модели. В противном случае коэффициент λ(χ) (5.3) будет зависеть от χ, меняясь в пределах от b до В, где Ь - min bj, В = max bj. i J Тем не менее и в этом случае модель можно признать удовлетворительно агрегируемой, если для подавляющего множества векторов χ коэффициент \(х) приближенно равен константе λ лишь на множествах пренебрежимо малой меры может сильно отличаться от λ. Для установления такого рода результатов наиболее удобен вероятностный подход. Будем считать Zj независимыми случайными величинами *) с математическими ожиданиями ту и дисперсиями σ2, причем ζj могут принимать только положительные значения и Zmy = 1. Очевидно, / \[п) =<λ[ζ] > = Xbjmfi (5.5) / где угловые скобки обозначают математическое ожидание. В силу независимости случайных величин < (ζ,· - m,·) (zj - mj) > = 0 при i Φ / ο\[η] = = \[λ(ζ)-λ]2 >= Σ 6,-6/<<?f-m/)(z/- m/)> = ΣΖ>2;σ2. < πΒ2 σ2, где σ2 = max σ2/ Мз U J ' i (5* 5).следует неравенство λ[η] > nbm, где m = min τηχ. Поэтому * σχ[η] ν[η] Βσ -iLJL <_i-Lf „[„j» . (5.6) Мл] \Л? bm Таким образом, если при η -»■«> коэффициент ι> [л] остается ограниченным, то λ(χ) при достаточно больших η будет случайной со сколь угодно малой относительной дисперсией, т.е. практически для всех ζ будет λ (ζ) « const. ) Конечно, более естественно начинать с независимых случайных величин xj, но для систем достаточно большой размерности это практически несущественно. 239
Уточнить этот результат можно следующим образом. Если под утверждением "λ(ζ)= const практически для всех ζ " мы хотим подразумевать малость равномерной меры множества тех ζ, для которых λ (ζ) существенно отличается от λ (я), то надо взять независимые случайные величины ζ,·, равномерно распределенные, например, ι[°· τ1·" на I 0, — , и положить Л / й / /7/ KD*'} Для ограниченности 1>[л ] теперь достаточно потребовать, чтобы последовательности матриц Ап и векторов рп, qn были таковы, что отношение В[п ]/Ь[п] равномерно по η ограничено сверху. 5.3. Численные эксперименты. Оценка (5.6) коэффициента υ [η] заведомо чересчур груба. Более тонкие оценки могут быть получены на основе более детального анализа. Об этом будет сказано далее. Остановимся на описании численных экспериментов. Матрица А = [аф размером η Χ η задавалась датчиком случайных чисел. Каждое ац - независимая реализация случайной величины, равномерно распределенной на отрезке [0, 1]. Цены задавались с помощью независимых реализаций случайной величины, равномерно распределенной на [а, 1], где а > 0. Далее приводятся результаты экспериментов с а = 0,2. Везде далее λ* обозначает ведущее собственное значение исследуемой матрицы. Для каждой матрицы несколько тысяч раз считался коэффициент \(х) для разных векторов х, опять же генерировавшихся тем же датчиком случайных чисел. Для размерности η - 50 все значения λ(χ) оказались в пределах λ*(1 ± 0,097), а 90% из них - в пределах λ *(1 ± 0,048). Для η = 20 аналогичные пределы оказались равными λ*(1 ± 0,29), λ*(1 ± ОД). В случае η = 10 эти пределы были соответственно равны λ*(1 ± 0,32), λ*(1 ±0,13). При проведении экспериментов ставились также цели, связанные с решением ряда вопросов, которые в статье практически не затрагиваются, но тесно примыкают к рассматриваемой тематике. Например, с помощью одной итерации х1 = Ах° случайного вектора х° "вычислялся" собственный вектор χ * матрицы А. После нормировки результаты обычно лежали в диапазоне (п - 50) тах(д:1./л:*.)= 1 ± 0,09. Ι ι ι ' Близкие результаты были получены в экспериментах по решению систем линейных уравнений за одну итерацию. 5.4. Связь с ведущим собственным значением. Значение λ [л] определяется формулой (5.5). Однако на практике в (5.5) вместо вектора т можно подставить любую реализацию случайного векторах. Конечно, относительно любдй отдельной реализации ничего нельзя сказать гарантированно. Однако при достаточно большой размерности η будет миллион шансов против одного, что первая же случайная реализация χ даст практически точное значение \[п\ С этой точки зрения представляется, что формулы (5.5) и (5.7), как правило, будут давать одно и то же значение А[и], поскольку вектор т можно рассматривать как случайную реализацию. По этому пути Можно пойти еще дальше. Если А - квадратная матрица и ρ = qy то в (5.5) в качестве "случайной реализации" можно подставить собственный вектор χ * матрицы А; тогда будем иметь λ[/ι]= λ* где λ* - ведущее собственное значение матрицы Л. Конечно, логика здесь уже страдает. Интуитивно ясно, чтобы λ [л] не зависело от реализации т, вектор т нужно задавать независимо, "не глядя" на матрицу. Собственный же вектор χ * существенно связан со структурой матрицы А. Тем не менее в определенных предположениях λ[η] действительно будет приближенно равно λ*. Без дополнительных предположений это не так. Приведем соответствующий контрпример. Рассмотрим сначала линейный интегральный оператор 1 Кх = π2 fk(t, s)x(s)ds (5.8) О 240
с ядром, являющимся функцией Грина двухточечной краевой задачи, . ί(1 - s), если t < s, s(l - f), если ί > л Интегральный аналог формулы (5.7) дает 1 1 М°°] ~ *2 Π kit, s) dt ds = 0,82, 00 тогда как ведущее собственное значение оператора (5.8) здесь λ* = ρ (Κ) - 1. Относительная разница составляет 18 %. Чтобы получить отсюда аналогичный пример для конечномерного случая, надо квадрат [е , 1 - е ] X [е , 1 - е ], где е > 0 достаточно мало, накрыть равномерной решеткой с шагом Δ > 0 и рассмотреть матрицу А с элементами ац - ή2 к (Г/, sy) Δ, где ί/, Sy - координаты узлов решетки. При Δ -»· 0 размерность матрицы А будет стремиться к бесконечности, относительная разница же между λ[η ] и λ* примерно равна 18%. Причина этого заключается в наличии сильной "корреляции" между суммами элементов строк и столбцов с одинаковыми номерами. Если в той же самой матрице перестановкой строк нарушить "регулярность" (хорошо перетасовать строки), снова будет \[п ] = λ* (λ[/ι] останется прежним, но λ*уменьшится). Ориентировочным критерием здесь может служить значение параметра Я{А) = Ъ(а{-а)(а*-о), / где j Σ β/ = Σακί, α* = Σ<7|£, β = — Σα^ - — Σα' . к к η i n i При R 04) > 0 будет наблюдаться тенденция \[п\ < λ* при R(A)<0 - λ [л] > λ*. Более точная формулировка соответствующего критерия (равно как и другие результаты, связанные с возможностью решения системы линейных уравнений за одну итерацию) должна базироваться на несколько иной основе. До сих пор мы. считали случайным лишь состояние системы х. Вообщей говоря, матрицу А также можно рассматривать как случайную реализацию. На этом пути появляется возможность делать утверждения примерно такого типа: "при увеличении размерности мера множества матриц, не удовлетворяющих заданному свойству, стремится к нулю". 5.5. Другие задачи. Рассматривавшаяся до сих пор задача часто является одним из стандартных звеньев более сложных задач, связанных с макроскопическим описанием линейных систем. Ниже приводятся некоторые из таких задач. При этом их описание следует рассматривать не как изложение готовых результатов, а скорее как указание на возможные области приложений и возможные пути более глубоких исследований. 1. Пусть xjf обозначает объем выпуска 1-го продукта к-м предприятием, Х( - - у* к к " ^xi* aif обозначает количество 1-го продукта, затрачиваемое к-м предприятием на выпуск единицы /-го продукта. Наконец, У/ -суммарный чистый выпуск /-го продукта. Межпродуктовый баланс экономики в этом случае описывается системой уравнений Для возможности использования здесь линейной леонтьевской модели необходимо, чтобы коэффициенты практически не зависели от распределения плановых заданий Xj по предприятиям. Задача по существу находится в рамках предыдущего рассмотрения. .241
2. Если связь у - Ах характеризуется неположительной матрицей А, то для перехода на макроописание в агрегатах можно предварительно использовать представление А в виде разности двух положительных матрица =В - С, получая тем самым макроописание в виде Υ - XX, где λ = λ (Β) - λ (С). Конечно, речь идет об этапе теоретического исследования. Имея дело с конкретной задачей, о возможности агрегирования можно судить по небольшой серии численных экспериментов. Один из ориентировочных критериев успешного агрегирования здесь - хаотичное расположение знаков плюс и минус перед элементами матрицы Л. 3. Серия разнообразных задач возникает в связи с рассмотрением сразу нескольких агрегатов как по х, так и по у. Возможные здесь варианты (использование блочной структуры матриц, различных проекций векторов х, у и т.д.) довольно прозрачны, но требуют для своего описания много места. 4. Приведем пример динамической задачи в русле моделей растущей экономики. Пусть хк ={ χί, ..., χ } обозначает имеющийся в системе набор продуктов в к-м периоде, ρ -вектор цен. В следующем периоде система производит набор продуктов yk+l = = Ахку из которого изымается некоторая часть на сумму, пропорциональную стоимости произведенных продуктов. Таким образом, имеется итерационный процесс хк + 1=Ахк -ик, где случайный вектор ик изымаемых продуктов удовлетворяет ограничению (р, ик) = oi(p, Axk), или, в другом варианте, < (р, ик))- а{р, Ахк). Если нас интересует динамика агрегатов X = (р, хк), и матрицам! такова, что \[п] практически равно λ* то X - λ*(1 - α) Χ в довольно свободных предположениях. Если же \[п\ существенно отличается от λ* то макроописание системы становится затруднительным. Трудности описания возникают из-за появления корреляции между компонентами векторов хк. То же самое имеет место и в первом случае, но там регулярная составляющая хк обеспечивает рост агрегатов с тем же самым коэффициентом λ*. 5.6. Несколько замечании. 1. Пытаясь привлечь внимание к существу идеи, мы ограничились рассмотрением самых простых результатов для самой простой задачи. С точки зрения агитации это имеет свои преимущества и недостатки. За кадром остались многие тонкие вопросы, о природе которых читатели могут судить по тому, что уже вскользь упоминалось в тексте. 2. Обратим внимание еще раз, что использование вероятностного языка вовсе не говорит о том, что предлагаемый подход ориентирован на изучение стохастических систем. Все зависит от точки зрения. Просто вероятностный язык удобен для указания отношения мер "плохих** и "хороших** множеств. 3. Сущность рассмотренного подхода заключается в установлении возможности идеального агрегирования в пределе, при η -* ». Именно это давно делается в термодинамике. Но, в отличие от термодинамики, предполагаемые объекты приложения здесь имеют сравнительную малую размерность. Поэтому ключевым моментом успешной работы в этом направлении должно быть получение точных оценок. 4. Проведение параллелей с термодинамикой обращает внимание на одно существенное отличие. В термодинамике агрегаты определяются интегралами макроскопического движения. Здесь же речь идет о возможности макроописания практически при любом выборе агрегатов. Если е/ - энергия /-й молекулы, то хорошим агрегатом будет не только 2е,-, но и Σλ,-e/ при не очень сильном разбросе весов λ,·. Только, в отличие от суммарной энергии, последний агрегат не будет иметь физического смысла. Комментарии § 1. По существу параграф представляет собой сжатое изложение первых двух частей работы [59]. Близкие вопросы с несколько большим уклоном·в экономику рассматриваются в [30]. Нельзя-сказать, что описанная модель имеет большое практическое значение для экономики, но она имеет важное эталонное значение для развития 242
общесистемных представлений. По крайней мере на этой модели становится прозрачной термодинамическая идеология за пределами "своего поля'4. Конечно, возможности подобной идеологии не ограничиваются моделями обмена и линейными ограничениями. Очень интересна третья часть работы [59], где задача о максимальном извлечении из системы базисного ресурса (упоминавшаяся в упражнении 1.5) глубоко переосмыслена и доведена практически до полной аналогии с классической задачей термодинамики о максимальной работе, которую может произвести тепловая машина. § 2, 3. Общая идеология статистической физики в наше время стала уже настолько привычной, что здесь нет необходимости ссылаться на какие-либо первоисточники. Статистические методы неуклонно завоевывают новые территории. Методы, близкие к физическим, эффективно работают в теории информации. Статистический дух пронизывает теорию массового обслуживания, но там своя специфика. Разведка производится и в нетрадиционных областях, но здесь работ пока мало (см. [13] и имеющуюся там библиографию). Модель пассажиропотоков заимствована из книги [13], где ее обсуждение не всегда корректно. Многие пробелы восполнены в обстоятельном дополнении к книге, написанном Ш.С. Имельбаевым и Б.Л. Шмульяном, которые в данной области ведут самостоятельные исследования. Но вот исходные позиции авторов этого дополнения не вполне убедительны. Например, выписывается ''энтропия" vii Η = Σχ^ΐη— (Κ.1) U *ij и вводится гипотеза, что ее максимизация будет давать "то, что нужно", На самом деле никакие гипотезы здесь не нужны. Если начинать не с "середины", а с вероятностной модели микропроцессов, то условия применимости проявляются сами собой. Конечно, можно организовать дискуссию о том, что при совпадении конечных результатов нет разницы, с чего начинать. Однако в любой научной дисциплине понимание важнее конкретных результатов, и это особенно важно для поисковых исследований. Максимизация (К-1) может восприниматься неопытным и даже опытным читателем как обманный трюк. Тогда как понимание природы принципа максимальной неопределенности все ставит на свои места. В физике этот принцип стал уже настолько привычным,, что о его сущности стали даже забывать. Между тем многие его свойства до сих пор остаются изученными лишь на уровне качественных утверждений. Пренебрежение строгими оценками (остроты пика и т.п.) вполне оправдано для систем с числом элементов порядка 1023, но в экономике количество элементарных ячеек всегда оценивается отнюдь не числом Авогадро, и здесь строгие оценки были бы весьма полезны. § 4. Для более глубокого знакомства с проблемами обоснования статистической физики можно рекомендовать фундаментальную работу [29]. Очень интересные фрагменты на эту тему есть в [ 19, 20]. Идея скольжения по ансамблю была предложена в [49] для гамильтоновых систем. На самом деле гамильтонов формализм здесь не обязателен. В общем (негамильто- новом) случае надо лишь потребовать, чтобы в системе не было состояний, очень сильно различающихся по восприимчивости к внешним воздействиям.
ОБОЗНАЧЕНИЯ 1. Как исключение, используются кванторы общности V (следует читать: для всех) и существования 3 (следует читать: существует). Как правило, предпочтение отдается обычному русскому языку. 2. Теоретико-множественные обозначения обычны: U — объединение, Π — пересечение, \ — разность, φ — пустое множество, € - принадлежность, С-включение. 3. Для замыкания области Ω используется обозначение Ω, реже*) сШ, Ω обозначает границу Ω,ίηΐ А - внутренность множества А. 4. Наравне с тах<р(х) используется эквивалентное обозначение *е χ max{</?(*): χ £ Χ} — это оказывается особенно удобным при "длинных" описаниях условия χ € X. Такой же прием распространяется на sup и inf. 5. RM обозначает «-мерное евклидово пространство, R + — неотрицательный ортант в R". Векторы χ = {xit.. ., χη) £ R" жирным шрифтом не выделяются. При этом *,· может обозначать не только z-ю координату, но и некоторый г-й вектор, что всегда ясно из контекста. В большинстве подобных ситуаций для обозначения векторов используются по возможности верхние индексы. Для обозначения скалярного произведения векторов χ и у используется запись (х, у), однако (х, у) может обозначать и просто пару элементов χ и у, что определяется контекстом. 6. Особое внимание обратим на широко используемые обозначения, связанные с полуупорядоченностью. К обозначает конус, χ *>у,означает χ - у Ε К. В большинстве случаев в качестве К выбирается неотрицательный ортант R?; при этом χ >· у представляет собой "короткую" запись системы неравенств xt > у\ (/ = 1,..., п). Для обозначения ситуации χ - у G intK используется запись χ > у. В случае К - R+ векторное неравенство х> у представляет собой совокупность строгих неравенств xt >yt (ι = 1,..., η). Через (υ, w) обозначается множество элементов χ, удовлетворяющих неравенствам t><x< w, т.е. <υ, w) ={х: ϋ< *<; νν}. 7. В последней главе наряду с чертой сверху используются также угловые скобки для обозначения математического ожидания: (х) — математическое ожидание величины х. *) Полная стандартизация обозначений не всегда удобна: Ω проще, но cl Ω пред- п почтительнее, если Ω имеет сложное описание, например, Ω = U Αι η Β. /=1 244
СПИСОК ЛИТЕРАТУРЫ 1. Андронов Α Α., Витт АЛ., Хайкин С.Э. Теория колебаний. - М.: Физматгиз, 1959. 2. Арнольд В.И, Варченко А.Н., Гусейн-Заде СМ. Особенности дифференцируемых отображений. Классификация критических точек, каустик и волновых фронтов. - М.: Наука, 1982. 3. Бинг (Bing R.H.) The elusive fixed point property, Amer. Math. Monthly, 1969, 76, №2,p. 119-132. 4. Биркгоф Г. Теория структур. - Μ.: ИЛ, 1952. 5. Бобылев Н.А. О функциях Ляпунова и задачах на глобальный экстремум. - Автом. и телемех., 1979, № 11, с. 5-9. 6. Бобылев НА. Об одном приеме исследования устойчивости градиентных систем. - Автом. и телемех., 1980, № 8, с. 33-35. 7. Борисович Ю.Г., Гельман Б.Д., Мышкис А.Д., Обуховский В.В. Топологические методы в теории неподвижных точек многозначных отображений. - УМН, 1980, 35, вып. 1, с. 59-126. 8. Бурков В.Н. Основы математической теории активных систем..- М.: Наука, 1977. 9. Бурков В.Н., Опойцев В.И. Метаигровой подход к управлению иерархическими системами. - Автом. и телемех., 1974, № 1, с. 103-114. 10. Бурков В.Н., Опойцев В.И. Распределение ресурсов в активной системе. В кн.: Активные системы. М.: ИПУ, 1973. 11. Бурков В.Н., Хранович ИЛ. Об эквивалентном сопротивлении цепи. - Электричество, 1980, вып. 3, с. 69-70. 12. Вайнберг М.М. Вариационный метод и метод монотонных операторов в теории нелинейных уравнений. - М.: Наука, 1972. 13. Вильсон А.Дж. Энтропийные методы моделирования сложных систем. - М.: Наука, 1978. 14. Вулих Б.З. Введение в теорию полуупорядоченных пространств. - М.: Физматгиз, 1961. 15. Данцер Л., Грюнбаум Б., Каи В. Теорема Хелли и ее применения. - М.: Мир, 1968. 16. Забрейко П.П., Красносельский М.А., Покорный Ю.В. Об одном классе линейных положительных операторов. - Функ. анализ и его прилож., 1971,5, вып. 5, с. 9-17. 17. Иванов А А. Неподвижные точки отображений метрических пространств. - Записки научных семинаров ЛОМИ, исследования по топологии И, 66, 1976, с. 5-102. 18. Карамардиан (Karamardian S.) Existence of solution of certain systems of non-linear inequalities. - Nirnerische Mathematic, 1968,12, №4, p. 327-334. 19. Кац Μ. Вероятность и смежные вопросы в физике. - М.: Мир, 1965. 20. Кац М. Несколько вероятностных задач физики и математики. - М.: Наука, 1967. 21. Клейбанов СБ., Привальский В.Б., Тиме ИВ. Стабилизация коэффициентов в дискретном фильтре Калмана. - Автом. и телемех., 1974, № 3, с. 76-82. 22. Красносельский МА. Топологические методы в теории нелинейных интегральных уравнений. - М.: Гостехиздат, 1956. 23. Красносельский Μ А. Положительные решения операторных уравнений. - М.: Физматгиз, 1962. 24. Красносельский Μ А. Оператор сдвига по траектории дифференциальных уравнений. - М.: Наука, 1966. 245
25. Красносельский М.А., Забрейко П.П. Геометрические методы нелинейного анализа. - М. : Наука, 1975. 26. Красносельский М.А., Опойцев В.И. Теорема о глобальном гомеоморфизме. Теория функций, функц. анализ и их прилож., 1978, вып. 30, с. 83-85. 27. Красносельский МЛ., Соболев А.В. О неподвижных точках разрывных операторов. - Сиб. матем. журн., 1973,14, № 3, с. 674-677. 28. Крейн М.Г., Рутман МЛ. Об операторах, оставляющих инвариантным конус в пространстве Банаха. - УМН, 1948, 3, вып. 1, с. 3-95. 29. Крылов Я.С Работы по обследованию статистической физики. - М.: Изд-во АН СССР, 1950. 30. Лихнерович (Lichnerowicz Μ) Un model d'echange economique (Economie et thermody- namique), Annates de Tlnstitut Henri Poincare, nouvelle serie, 1970,6, № 2, Section B, p. 159-200. Рус. пер.: Модель экономического обмена (экономика и термодинамика). - в кн., Математическая экономика, М., Мир, 1974. 31. Майерс (Meyers Ph. R.) Some extensions of Banach's contraction theorem. - J. Res. Nat. Bur. Stand. (U.S.), 1965,69В, №3, pp. 179-184. 32. Майерс (Meyers Ph. R.) A converse to Banach's contraction theorem. - J. Res. Nat. Bur. Stand. (U.S.), 1967,71B,№ 1-2, pp. 73-76. 33. Майерс (Meyers Ph. R.) Contractifiable semigroups. - J. Res. Nat. Stand., 1970, 74B, N94, p. 315-322. 34. Малишевский А.В. Модели совместного функционирования многих целенаправленных элементов I, II, - Автом. и телемех., 1972, №№ 11, 12, с. 92-110, 108-128. 35. Малишевский А.В. Натуральные системы. - Автом и телемех., 1973, № И, с. 42-57. 36. МилнорД., Уоллес А. Дифференциальная топология. - М.: Мир,-1972. 37. МоришимаМ. Равновесие, устойчивость, рост. - М.: Наука, 1972. 38. Никайдо X. Выпуклые структуры и математическая экономика. - М.: Мир, 1972. 39. Иильсон Н. Обучающиеся машины. - М.: Мир, 1967. 40. Ниренберг Л. Лекции по нелинейному функциональному анализу. - М.: Мир, 1977. 41. Опойцев В.И. Равновесие и устойчивость в моделях коллективного поведения. - М.: Наука, 1977. 42. Опойцев В.И. Обобщение теории монотонных и вогнутых операторов. - Тр. Моск. матем. об-ва, 1978, 36, с. 237-273. 43. Опойцев В.И. Гетерогенные и комбинированно-вогнутые операторы.- Сиб. матем. журн., 1975,16, № 4, с. 781-792. 44. Опойцев В.И. Обращение принципа сжимающих отображений. - Успехи матем. наук, 1976, 31, вып. 4, с. 169-198. 45. Опойцев В.И. Конечномерная теория вращения векторных полей. - М.: ИПУ, 1978. 46. Опойцев В.И. Теоремы существования в задачах системостатики. - Автом. и телемех. 1979, № 3, с. 85-95. 47. Опойцев В.И. Топологические методы в теории сложных систем. - Автом. и телемех., 1976, № 3,с. 142-160. 48. Опойцев В.И. Теория положительных матриц. - В кн.: Исследование и оптимизация многосвязных систем. М., Наука, 1979. 49. Опойцев В.И. Макроописание систем размешивающегося типа. - В кн.: Современные проблемы управления. М., Наука, 1974. 50. Опойцев В.И, Хуродзе ΤΛ. Нелинейные операторы в пространствах с конусом. - Тбилиси: Изд-во ТГУ, 1984. 51. Ортега Дж., Рейнболдт В. Итеративные методы решения нелинейных систем уравнений со многими неизвестными. - М.: Мир, 1975. 52. Пановко Я.Г., Губанова ИИ. Устойчивость и колебания упругих систем. - М.: Наука, 1979. 53. Покорный Ю.В. Об относительных индексах положительных операторов. - Тр. матем. ф-та ВГУ, 1971, вып. 4, с. 79-89. 54. Покорный Ю.В. О неподвижных точках положительных операторов. - Тр. матем. ф-та ВГУ, 1973, вып. 10, с. 112-116. 55. Понтрягин Л.С. Основы комбинаторной топологии. - М.: Наука, 1976. 246
56. Понтрягин Л.С. Гладкие многообразия и их применения в теории гомотопий. - М.: Наука, 1984. 57. Постников КС, Сабаев Е.Ф. Матричные системы сравнения и их приложения к задачам автоматического регулирования. - Автом. и телемех., 1980, с. 24-34. 58. Постом Т., Стюарт И. Теория катастроф и ее приложения. - М.: Мир, 1980. 59. Розоноэр Л.И. Обмен и распределение ресурсов (обобщенный термодинамический подход), 1-Ш. - Автом. и телемех., 1973, № 5, с. 115-132; № 6, с. 65-79; № 8, с. 82-103. 60. Смейл (Smale S.) Structurally stable are not dense. - Am. J. Math., 1966,88, p. 491- 496. 61. Смейл (Smale S.) Differential)le dynamical systems. - Bull. Am. Math. Soc, 1967, 73, p. 747-817. 62. Стеценко ВЯ. О неподвижных точках нелинейных отображений. - Сиб. матем. журн., 1969,10, № 3, с. 642-652. 63. Стеценко В.Я. Критерии неразложимости линейных операторов. - УМН, 1966, 21, вып. 5, с. 265-267. 64. Стеценко ВЯ. Об оценке спектра некоторых классов линейных операторов. - ДАН СССР, 1964,157, № 5, с. 1054-1057. 65. Стеценко ВЯ. Об одном способе оценки спектра линейного оператора. - УМН, 1964,19, вып. 2, с. 199-200. 66. Цайдлер Е. (Zoidler Ε.) Existenz, Eindentigkeit, Eigenschaften und Anwendungern des Abbildungagzades in R", Theory of nonlinear operators. - Proc. Summer-School, Akademie-Verlag, Berlin: 1974, p. 259-311. 67. Черч (Church P.T.) Differentiable open maps on л-manyfolds. - Trans. Amer. Math. Soc. 1963,109, p. 87-100. бЪ.Чуа, Лэм (Leon O. Chua, Ying-Fai Lam) Global homeomorphism of vector-valied functions. - J. of Math. Analysis and AppL 1972,39, p. 600-624. 69. Эйленберг, Монтгомери (Eilenberg S., Montgomery D.). Fixed point theorems for multi-vulued transformations. - Amer. J. Math. 1946,68, № 2, p. 214-222. 70. Янош (Janos L.) A converse of Banach's contraction theorem. - Proc. Amer. Math. Soc.,1967,№2,p.287-289.
Валерий Иванович Опойцев НЕЛИНЕЙНАЯ СИСТЕМОСТАТИКА Серия: "Экономико-математическая библиотека" выпуск 31 Редактор НА. Бобылев Художественный редактор Т.Н. Кольченко Технические редакторы О.Б. Черняк, СВ. Геворкян Корректоры Т.В. Обод, Ε А. Янышева Набор осуществлен в издательстве на наборно-печатающих автоматах ИБ№ 12742 Сдано в набор 05.08.85. Подписано к печати 06.12.85. Т-21666. Формат 60 X 90 1/16. Бумага ТИП № 2. Гарнитура Пресс-Роман. Печать офсетная. Усл. печ. л. 15,5 Усл. кр.-отт. 15,5. Уч.-изд. л. 18,0. Тираж 2840 экз. Тип.. зак. 852 . Цена 3 руб. Ордена Трудового Красного Знамени издательство "Наука" Главная редакция физико-математической литературы 117071 Москва В-71, Ленинский проспект, 15 4-я типография издательства "Наука" 630077 г. Новосибирск-77, ул. Станиславского, 25
кономико- МАТЕМАТИЧЕСКАЯ БИБЛИОТЕКА В.И.ОПОЙЦЕВ НЕЛ НЕЙНА С ЕМОСТАТ КА