/
Text
M. INTRILIGATOR
MATHEMATICAL
OPTIMIZATION
AND
ECONOMIC THEORY
PRENTICE-HALL, N.Y., 1971
М. ИНТРИЛИГАТОР
математические
методы
оптимизации
и экономическая
теория
Перевод с английского
под редакцией
и с предисловием
А. А. КОНЮСА
Издательство «Прогресс»
Москва 1975
Переводчики:
Г. И. Жукова (главы 2, 7—10)
и Ф. Я. Келъман (главы 1, 3—6, 11 — 16 и приложения).
Книга представляет собой руководство по
теории математического программирования и ее
экономическому применению. В ней последова-
тельно излагаются постановка общей задачи мате-
матического программирования, классические
методы оптимизации, линейное и нелинейное про-
граммирование, теория игр и т. д.
Рассматриваются проблемы, связанные с при-
ложением математического аппарата стати-
ческой оптимизации в теории потребления,
теории производства и т. д.
Книга будет полезна всем тем, кто занимает-
ся вопросами применения экономико-математи-
ческих методов в народном хозяйстве.
Редакция литературы по зкономике
© Перевод на русский язык «Прогресс», 1975
10803-178
006 (01)-75 2
Предисловие
1. О МАТЕМАТИЧЕСКОМ СОДЕРЖАНИИ КНИГИ
М. ИН ТРИЛИГА ТОРА1
Многие практические задачи хозяйственной деятель-
ности и ряд важных вопросов экономической теории
связаны с задачами определения наилучшего, оптималь-
ного варианта решения. Таковы, например, задачи выбора
оптимальной производственной программы предприятия,
транспортные задачи рационального распределения грузо-
потоков или целый комплекс проблем, связанных с опти-
мальным планированием народного хозяйства. Для реше-
ния задач такого рода в математической науке созданы
и интенсивно разрабатываются в настоящее время новые
математические методы, объединяемые под общим назва-
нием методов математического программирования.
Со времени открытия Ньютоном и Лейбницем
дифференциального и интегрального исчисления аппарат
прикладной математики создавался в основном под влия-
нием запросов естественных наук (в первую очередь
физики) и техники. Однако для конкретного численного
решения типичных задач, возникающих в экономике,
этот аппарат оказывается недостаточным. Например, мно-
гие хозяйственные проблемы, представленные в математи-
ческой форме, состоят в отыскании экстремума, т. е.
максимума или минимума, линейной функции нескольких
переменных при наличии линейных ограничений. Класси-
ческий математический анализ не содержит алгоритмов
для решения задач этого типа. Независимое друг от
друга создание советским математиком Л. В. Канторови-
чем и Д. Данцигом в США специальных методов решения
этих задач—линейного программирования—явилось нача-
1 Данный раздел предисловия написан Ф. Я. Кельманом.
5
лом широких исследований и в области решения многих
других видов экстремальных задач. Экономические про-
блемы оказали существенное влияние и на разработку
такой математической дисциплины, как теория игр.
В настоящее время существует огромное количество
работ, посвященных различным сторонам теории мате-
матического программирования: прикладным аспектам,
методам численного решения и таким элементам, которые
по традиции относятся к области «чистой математики».
Сейчас создается широко разветвленная теория оптимиза-
ции. Изучение методов математического программирова-
ния, особенно линейного программирования, становится
необходимым для практической работы экономиста. Это
отражается и в расширении математической подготовки
студентов экономических вузов. Без понимания основных
идей и результатов применения теории математического
программирования невозможно разобраться в существе
большинства важных экономико-математических моделей
и основанных на них практических предложений.
Само название книги М. Интрилигатора «Математиче-
ские методы оптимизации и экономическая теория» как бы
разделяет ее на две части. В первой отражается стрем-
ление автора дать читателю развернутое, четкое и логиче-
ски связанное представление о современном состоянии
теории решения экстремальных задач. Вторая часть
названия показывает, что автор ориентируется в основном
на читателя, работающего в сфере экономики или готовя-
щегося к такой работе. Требования к читателю, в общем,
не выходят за пределы стандартной вузовской программы
по математическому анализу и линейной алгебре. Ряд
сведений может быть почерпнут либо непосредственно
при чтении книги, либо из имеющихся в ней специальных
математических приложений. Книга может служить
в качестве учебного пособия по методам оптимизации
и по математическим моделям экономики для студентов
и аспирантов широкого круга специальностей. Как работа
обзорного характера она будет полезной и для специали-
стов, занимающихся исследованием операций.
Данная книга не дает исчерпывающего изложения
современного состояния какой-либо отдельной математи-
ческой дисциплины, например линейного программирова-
ния, теории игр или вариационного исчисления. Ее цель—
показать в систематизированной форме основные направ-
С
ления математической теории оптимизации в их взаимо-
связи. Эта цель определяет и отбор материала, и способ
его изложения.
Автор начинает с постановки в гл. 2 общей задачи
математического программирования, излагает известные
классические методы отыскания экстремумов дифференци-
руемых функций, а затем в гл. 4 переходит к нелинейному
программированию. Линейное программирование рассма-
тривается как частный случай общей задачи нелинейного
программирования, и основные теоремы линейного про-
граммирования доказываются с помощью теоремы Куна —
Таккера, приведенной в главе о нелинейном программиро-
вании. Усвоение материала облегчается последовательным
применением множителей Лагранжа и их содержательной
интерпретацией. Книга содержит много иллюстративного
материала в виде различных рисунков и таблиц. Напри-
мер, в таблице на рис. 5.3 в наглядной форме показана
связь между двойственными задачами линейного програм-
мирования. В изложении теории игр, данном в гл. 6,
используется принцип аналогии с задачами линейного
программирования. Так, один из центральных результа-
тов теории игр — теорема о минимаксе — доказывается
с помощью теоремы двойственности.
Теория оптимизации, рассмотренная в части II книги,
является непосредственной математической базой для
постановки и исследования ряда практических и теорети-
ческих вопросов экономической науки. В части III изла-
гаются именно такие вопросы экономической теории,
которые допускают постановку оптимизационных задач.
Ценность этого раздела книги состоит прежде всего в опи-
сании того, как формальный математический аппарат
может применяться для анализа экономических процессов.
Экономические приложения теории оптимизации автор на-
зывает задачами рационального ведения хозяйства (econo-
mizing). Такая терминология помогает связать воедино
достаточно разнородные вопросы, включенные в книгу.
Особенностью книги М. Интрилигатора является то,
что это, по-видимому, первое руководство по экономико-
математическим проблемам, в котором наряду с методами
математического, программирования излагается также
и математическая теория оптимального управления. Эти
вопросы излагаются в части IV, названной «Динамиче-
ская оптимизация». Придерживаясь хотя и принятой,
?
но довольно условной классификации задач оптимизации
на статические и динамические, автор относит последние
к задачам управления. Если терминология ряда математи-
ческих дисциплин, таких, как, например, математический
анализ или линейное программирование, сейчас знакома
широкому кругу экономистов, то смысл, в котором в на-
стоящей книге употребляются понятия «управление» или
«задача управления», нуждается в некоторых пояснениях.
В течение примерно двух последних десятилетий сфор-
мировалась новая прикладная математическая дисципли-
на, известная под названием теории оптимального управ-
ления, или математической теории оптимальных процес-
сов. Развитие этой дисциплины было вызвано потребно-
стями одной из важнейших областей технических наук —
теории автоматического регулирования. В самой общей
постановке проблема регулирования (управления) авто-
матическими устройствами сводится к выбору значений
во времени некоторых величин, называемых управляю-
щими параметрами, подчиненных ряду ограничений, при
которых достигается экстремум некоторого функционала.
Этот функционал в математической форме характеризует
цель управления. Определение экстремума такого функ-
ционала в математической теории оптимального управле-
ния и называют задачей управления.
Математический аппарат современной теории опти-
мального управления включает методы вариационного
исчисления, метод принципа максимума и методы динами-
ческого программирования.
Классические методы вариационного исчисления, раз-
рабатывавшиеся с XVIII столетия, не всегда применимы
к задачам теории автоматического управления. Для
решения этих задач и были созданы новые методы —
принцип максимума и динамическое программирование х.
(За разработку принципа максимума группа советских
математиков во главе с академиком Л. С. Понтрягиным
была удостоена Ленинской премии 1962 г.)
Динамическое программирование уже нашло немало
интересных приложений и при решении практических
экономических задач, например при создании моделей
1Л. С. Понтрягин, В. Г. Болтянский,
Р. В. Гамкрелидзе, Е. Ф. Мищенко, Математическая
теория оптимальных процессов, М., «Наука», 1969; Р. Веллман,
Динамическое программирование, перев. с англ., М., ИЛ, 1960.
8
календарного планирования производства. Что касается
вариационного исчисления и принципа максимума, то
знакомство с этими разделами теории оптимизации будет
полезным для экономиста-теоретика и с познавательной
точки зрения, и в свете их возможных приложений
к вопросам оптимального планирования и управления
в народном хозяйстве.
В западной экономической литературе последних лет
имеются примеры применения этих математических мето-
дов к исследованию проблем экономического роста (см.,
например, библиографию к гл. 16 данной книги). На рус-
ский язык переведены монографии, в которых затраги-
ваются указанные вопросы г. Использование принципа
максимума для анализа модели оптимального экономиче-
ского роста проведено М. Интрилигатором весьма обстоя-
тельно. Отметим здесь, что проблема экономического
роста в той форме, как она изложена в книге М. Ин-
трилигатора, недостаточно освещена в советской и пере-
водной экономико-математической литературе. Автор
рассматривает оптимальный экономический рост в так
называемой «неоклассической» модели роста, в которой
предусматривается взаимозамещаемость труда и капитала.
Эта модель предложена американским экономистом
Р. Солоу в 1956 г. В экономико-математической лите-
ратуре на русском языке значительно подробнее представ-
лены модели экономического роста, восходящие к модели
расширяющейся экономики Д. фон Неймана и к динами-
ческой модели «затраты—выпуск» В. Леонтьева.
Книга М. Интрилигатора имеет ряд общих черт с пере-
веденной на русский язык книгой К. Ланкастера «Мате-
матическая экономика». В книге Ланкастера также рас-
сматриваются вопросы теории оптимизации и ее приложе-
ния к моделям экономики, а математический уровень
изложения в обеих книгах примерно одинаков. В то же
время книга Интрилигатора отличается иной последова-
тельностью изложения разделов теории математического
программирования и в нее включен материал, который
в работе Ланкастера либо совершенно не рассматривается,
либо затронут лишь вскользь. Это^теория игр, методы
решения задач управления (вариационное' исчисление,
1 См., например, Я. Тинбэрхэн, X. Бос, Математи-
ческие модели экономического роста, М., «Прогресс», 1967; Л. Сто
леру, Равновесие и экономический рост, М., «Статистика», 1974
9
динамическое программирование и принцип максимума)
и такие разделы экономической теории, как теория
экономического благосостояния, исследование проблем
экономического роста с учетом замещаемости капитала
и труда, а также проблема кривых безразличия в потре-
блении. В целом эти две книги хорошо дополняют друг
Друга.
К недостаткам математической части книги Интрили-
гатора относится несколько поверхностное описание алго-
ритмов решения задач математического программирова-
ния. Хотя автор стремился к математически строгой
трактовке рассматриваемых проблем, однако этот принцип
не всегда выдерживается для того, чтобы сделать изложе-
ние более понятным для читателя. Часто автор ограничи-
вается формулировкой теоремы и ее разъяснением или
дает упрощенную схему доказательства.
2. ОБЩАЯ ХАРАКТЕРИСТИКА ЭКОНОМИЧЕСКИХ
РАЗДЕЛОВ КНИГИ
Экономическим проблемам в книге М. Интрилигатора
уделено меньше места, чем математическим. Тем не менее
в ней дано полное изложение в математической форме
современной политической экономии в том виде, как
она преподается в высших учебных заведениях капитали-
стических стран. Нет ничего удивительного, что эта поли-
тическая экономия имеет явно апологетическую направ-
ленность. Иначе быть не может. Обоснование неизбеж-
ности такой апологетики известный американский эконо-
мист Мартин Бронфенбреннер видит в старом латинском
изречении «cnius regio, eius religio», т. e. «какая страна,
такая и религия» х. Действительно, в капиталистической
стране вряд ли потребуют от студентов знания основ
марксизма-ленинизма, например того известного положе-
ния, что «историческую тенденцию капиталистического
накопления» Маркс характеризует в следующих знамени-
тых словах: «...Централизация средств производства
и обобществление труда достигают такого пункта, когда
они становятся несовместимыми с их капиталистической
оболочкой. Она взрывается. Бьет час капиталистической
частной собственности. Экспроприаторов экспроприируют»
1 М. Bronfenbrenner, Notes on Marxian Economics in
the United States, The American Review,LI V, №6, December 1964.
10
(«Капитала, I) А Эту тему в учебниках политйческс#
экономии капиталистических стран, естественно, не об-
суждают. i
Обобществление средств производства неизбежно. Тео-
рия, которая этой проблеме не уделяет должного вни-
мания, не может быть полноценной. Такой единой немарк-
систской экономической теории и не существует. «Эконо-
мическая теория», представленная в книге М. Интрилига-
тора, состоит по крайней мере из двух различных построе-
ний: во-первых, из работ Вальраса — Эрроу — Дебре и,
во-вторых, из теоретических взглядов Джона фон Ней-
мана. Они между собой никак не связаны, и ни одно из
них не исчерпывает предмета экономики. При этом первое
построение, наиболее модное и в книге М. Интрилигатора
принимаемое за основное, явно несовершенно, так как
оно не отражает внутреннюю логику развития капитали-
стического производства.
Капиталистическая апологетика в математической эко-
номии проявляется в нежелании анализировать весь
горизонт экономической действительности и делать соот-
ветствующие выводы из достигнутых математическим
путем результатов.
Возникшая с целью отрицания трудовой теории стои-
мости математическая экономия в первую очередь сосре-
доточила внимание на так называемой микроэкономике,
т. е. на теории потребительского бюджета («домашнего
хозяйства») и теории предприятия («фирмы»), В учении
о народном хозяйстве эти темы являются вспомогатель-
ными и ими ни Адам Смит и Рикардо, ни Маркс не зани-
мались. «Классиками» для буржуазных экономистов стали
Швейцарец Леон Вальрас (1834 —1910) и американец
Джон Бейтс Кларк (1847—1938). Упоминают также Мар-
шалла и Смита, но последнего — по недоразумению.
Вальрас”— один из первых авторов теории «предель-
ной полезности». Апологетика этой теории заключается
в”иллюзорном представлении о том, что цены товаров
определяются предельными полезностями,' т. е. «полез-
ностью» товаров в сочетании с их «редкостью» (ограничен-
ным количеством). Это верно лишь по отношению’к таким
«товарам»,'как уникальные произведения искусства, пога-
шенные почтовые марки и т. п. (они служат средством
1 В. И. Ленин, Поли. собр. соч.,т. 26, стр. 67.
11
накопления). Цены же товаров, производимых и потреб-
ляемых (входящих в бюджет рабочей семьи), зависят от
условий производства. И именно эти цены определяют
собой предельные полезности. Например, при высокой
цене молока его покупают только детям (высокая пре-
дельная полезность); при низкой цене молока готовится
молочная лапша для всей семьи, причем иногда находится
такой член семьи, который склонен отдавать свою лапшу
собаке (низкая предельная полезность молока).
Вальраса считают также основателем статической моде-
ли «экономического равновесия», связанной своими кор-
нями с теорией предельной полезности, так как природные
ресурсы предполагаются ограниченными.
Другой основоположник математической экономии,
Дж. Б. Кларк, показал себя апологетом капиталистиче-
ского строя непосредственно и в явной форме. Во введе-
нии к своему главному труду он прямо заявил:
«Над обществом тяготеет обвинение в том, что оно
«эксплуатирует труд». «Рабочих, как говорят, регулярно
грабят, лишая их того, что они производят». ...Если бы
зто обвинение было доказано, всякий здравомыслящий
человек стал бы социалистом, и его стремление переделать
систему производства было бы мерилом и выражением его
чувства справедливости. Если мы намерены, однако, про-
верить зто обвинение, мы должны вступить в сферу про-
изводства. Мы должны разложить продукт общественного
производства на его составные части — для того, чтобы
увидеть, способен ли естественный эффект конкуренции
дать каждому производителю ту долю богатства, которую
именно он производит» \
- В своей попытке оправдать капиталистическую систему
Кларк разработал теорию «предельной производительно-
сти», изложенную у М. Интрилигатора в главе «Теория
фирмы». В дальнейшем будет показано, что достигнуть
своей цели ему не удалось.
В результате сочетания теорий Вальраса и Кларка
возник «неоклассический подход» в современной мате-
матической экономии, так подробно изложенный в книге
М. Интрилигатора 1 2.
1 Д ж. Б. Кларк, Распределение богатства, перев. с англ.,
М„ ОГИЗ, 1934, стр. 41.
2 Эбергардт Фельс называет неоклассические представления
«эклектическими* t (Е. М. Fell s.’JGeeellschaftlicn notwendige
12
3. МИКРОЭКОНОМИКА: ПОТРЕБИТЕЛЬСКИЙ
БЮДЖЕТ И ПРОИЗВОДСТВЕННЫЕ ФУНКЦИИ
Математический аппарат, разработанный применитель-
но к проблемам микроэкономики, получил в настоящее
время всеобщее признание. Без таких концепций мате-
матической экономии, как производственные функции,
предельные значения, экстремумы — максимальные и ми-
нимальные значения — и другие, невозможно успешно
построить экономико-математические модели, имеющие
своим назначением служить вспомогательным орудием
народнохозяйственного планирования.
Но решение некоторых отдельных вопросов примене-
ния математических методов в микроэкономике нуждается
в существенной корректировке с экономической точки
зрения. Это относится, в частности, к теории личного
потребления. Основное понятие в ней —«функция полез-
ности»— конструируется в книге М. Интрилигатора на
основе нескольких математических аксиом. В дальнейшем
эта функция получила различные экономические толко-
вания. Наиболее важная область ее применения относится
к совокупностям товаров, входящим в потребительский
бюджет. И здесь целесообразно вместо «полезность» при-
нять более определенный термин «уровень потребления».
Это будет сравнительная характеристика с точки зрения
потребителя удовлетворения его потребностей в резуль-
тате фактического потребления той или иной совокупности
товаров, составляющих его бюджет.
В такой постановке вопроса о «функции полезности»
вызывает решительные возражения аксиома «ненасыще-
ния» (стр. 203), играющая у М. Интрилигатора немало-
важную роль в «экономике благосостояния» (стр. 353).
«Ненасыщение» означает не что иное, как включение
в расходную часть потребительского бюджета накопления
(сбережения) в товарной или денежной форме. Но нет
достаточных оснований для того, чтобы сбережения, пред-
назначаемые для обеспечения желательного уровня жизни
в будущем, рассматривать наравне с расходами на про-
дукты питания, развлечения и т. п., производимыми для
поддержания уровня потребления в данном, текущем
периоде.
Arbeit, Jahrbiicher far Nationalokonomie und Statistik, Vol. 184,
September 1970).
13
Дж. фон Нейман и О. Моргенштерн, чьи попытки
измерения полезности рассматриваются М. Интрилигато-
ром в разделе 7.6, полностью отдавали себе в этом отчет:
«... В рамках наших непосредственных целей было бы
излишним усложнением запутываться в задачах пред-
почтения между событиями в различные периоды буду-
щего. Известно, что это дает интересные, хотя до сих пор
и чрезвычайно темные, связи с теорией сбережений и про-
цента» х.
Реальной экономической величиной, которую следует
рассматривать в потребительском бюджете в данном про-
межутке времени, является общий расход семьи, опреде-
ляемый как количество фактически потребленных товаров
и услуг, умноженных на их цены. Расходы на товары
длительного пользования должны включаться в бюджет
потребителя по ценам их проката (на жилище — по квар-
тирной плате), причем именно эти цены, как отмечал
Энгельс, следует сопоставлять со стоимостямиа.
Применение математического анализа в теории личного
потребления имеет в условиях социалистического хозяй-
ства практическое значение, так как он может служить
основой для успешного прогнозирования платежеспо-
собного спроса населения.
Но непосредственное оперирование неизвестными и,
возможно, непознаваемыми «функциями полезности» не
дает приемлемых результатов. При конструировании
«функций полезности» высказываются обычно такие соо-
бражения, которые имеют всегда в той или иной степени
произвольный характер.
Между тем точные результаты получаются при анализе
особого состояния бюджета потребителя, когда, несмотря
на изменения структуры потребляемых товаров (вслед-
ствие изменения соотношений между ценами), остается
неизменным его общий «уровень потребления». Матема-
тически это состояние для случая двух товаров характе-
ризуется уравнением кривой безразличия U (х1г х2) =
= const, приведенным на стр. 209.
Эффективность применения концепции постоянного
уровня потребления в теории личного потребления обу-
1 Д ж. фон Нейман и О. Моргенштерн, Теория
игр и экономическое поведение, перев. с англ., М.,«Наука», 1969,
стр. 45.
2 к. Маркс и Ф. Энгельс, Соч., т. 18, стр. 266.
14
словливается тем, что эта концепция является существен-
ным элементом экономических расчетов. В разных странах
вычисляются специальные индексы цен, позволяющие
судить о том, сохраняется ли у лиц, живущих на заработ-
ную плату, постоянным их уровень потребления.
При вычислении индексов цен сопоставляются два
периода времени одинаковой продолжительности: «базис-
ный период» (закрепленный во времени) и «текущий
период» (изменяющийся с течением времени). Какой из
этих периодов предшествует другому — значения не имеет.
В индексных расчетах пользуются специальными едини-
цами измерения. За единицу счета каждого товара при-
нимается то его количество, которое можно приобрести
в базисном периоде на одну денежную единицу. В таком
случае величины plt р2, . . ., рпъ гл. 7 книги М. Интрили-
гатора являются отношениями цен в текущем периоде
к ценам в базисном периоде, причем каждая из] цен
в базисном периоде в этом «индексном» измерении будет
равна единице. Очевидно, что величины Xi, х2, . . ., хп
будут количествами потребленных товаров в текущем
периоде в обычных единицах счета, умноженными на
обычные цены базисного периода.
Рассматривается заданная гиперповерхность безраз-
личия
U (xt> х2, . . ., хп) — const.
В «косвенном» выражении (см. задачу 7-Р) ее уравне-
ние имеет вид
U* (Pt, Рг, . • рп, I) = const.
Если обозначить через I общий расход потребителя
в базисном периоде, обеспечивающий заданный постоян-
ный уровень потребления при ценах Pi = Рг — • • •
• • • == Рп = 1» т0 последнему равенству можно будет
придать следующий вид:
U* (1, 1, . . ., 1, 7) = const.
Отсюда путем соответствующего выбора значения кон-
станты можно получить
U (xi, Хг, . . Хп) = 7, где Т = const.
15
Уравнения (7.3.13) М. Интрилигатора позволяют уста-
новить следующее равенство:
2dU т
В рассматриваемой проблеме естественно предпола-
гать, что при постоянном уровне потребления и при
постоянном общем расходе («доходе») потребителя множи-
тель, Лагранжа у, определяемый равенством (7.3.18),
должен быть также постоянным. Поэтому, полагая у — 1,
= (£7= const)
Это уравнение действительно также при всяких значе-
ниях I и у, удовлетворяющих равенству I‘y = I. Его
однородность первой степени означает просто, что при
выбранных «индексных» единицах измерения товаров зна-
чения количеств потребленных товаров х^ х2, . . ., xnt
так же как и значения общего расхода потребителя
в базисном периоде I, зависят от единицы измерения
денег.
Полученное дифференциальное уравнение представляет
собой условие совершенной формы гиперповерхности
постоянного уровня потребления. Какая-либо функция,
¥ (х17 х2, . . хп), которая не удовлетворяет этому усло-
вию, не может быть принята в качестве «функции полезно-
сти». Действительно, если при Y (хь х2, . . xn) = const
и в то же время при общем расходе I — const множитель
Лагранжа у при покупке различных наборов товаров
по соответствующим ценам не будет одинаковым, то
различные точки на гиперповерхности постоянного уровня
потребления не будут «безразличны» для потребителя.
Отсюда нетрудно заключить, что приводимые М. Ин-
трилигатором в табл. 7.1 «примеры функций полезности»,
хотя они и соответствуют перечисленным им математиче-
ским аксиомам, экономически несостоятельны, так как
они не удовлетворяют приведенному условию 1.
Если исследованием личного потребления советские
экономисты-математики стали усиленно заниматься лишь
в самое последнее время, то по другому разделу микро-
1 См. сб. «Экономико-математические методы в зарубежной
статистике», М., «Статистика», 1974, стр. 186—208.
16
экономики — производственным функциям — у нас имеет-
ся уже обширная литература.
В книге М. Интрилигатора производственные функции
рассматриваются в гл. 8 «Теория фирмы». Как всегда, во
всех работах по математической экономике производ-
ственные функции сначала трактуются с позиций техно-
логии, т. е. с перечисления видов производственного обо-
рудования, сырья, материалов и рабочей силы (по квали-
фикации), которые необходимы для выпуска данного вида
продукции. Однако при таком дробном подходе возникает
сомнение в правильности принимаемого предположения
о дифференцируемости производственных функций. Поэто-
му целесообразно оперировать лишь такими производ-
ственными функциями, в которых аргументами служат
крупные экономические агрегаты: труд, капитал, земля
(природные ресурсы). В литературе уже отмечалась недо-
статочная обоснованность технологического подхода
•к производственным функциям: «Технологи не принимают
на себя ответственности за производственную функцию...
Они рассматривают производственную функцию в каче-
стве концепции экономистов, и, как показывает история,
почти все производственные функции, которые были до
настоящего времени получены, являются делом экономи-
стов, а не инженеров» *.
Термина «производственная функция» в работах клас-
сиков марксизма-ленинизма нет. Но необходимо сказать,
что это понятие именно в экономическом смысле содержит-
ся в трудовой теории стоимости. В гл. VIII третьего тома
«Капитала» Маркс пишет: «Требуется определенная масса
рабочей силы, представленная определенным числом рабо-
чих, чтобы произвести определенную массу продукта,
например, в течение одного дня, и, следовательно,— что
уже при этом само собой разумеется,— привести в движе-
ние, потребить1 2* производительно определенную массу
средств производства, машин, сырья и т. д.» г.
Если массу рабочей силы обозначить через массу
средств производства через х2 и массу продукта через q,
то при помощи простейшей формулы производственной
функции Кобба — Дугласа это высказывание Маркса
1R. Dorfman, Р. Samuelson, R. Solow, Linear
Programming and Economic Analysis, McGraw Hill, 1958, p. 181.
2 К. Маркой Ф. Энгельс, Соч., т. 25, ч. 1, стр. 157.
2-0270
17
представляется Я Ьиде, приведёйной й табл. 8.1 йнйгй
М. Интрилигатора:
q =
где b0, blt b2 — постоянные, a bi + b2 — 1.
Далее Маркс развивает свою мысль:
«Определенное число рабочих приходится на опреде-
ленное количество средств производства, следовательно,
определенное количество живого труда приходится на
определенное количество труда, уже овеществленного
в средствах производства...
Это отношение образует техническое строение капи-
тала...» 1
Деление обеих частей производственной функции Коб-
ба — Дугласа на дает
В правой части этого равенства находится выражение,
зависящее от технического строения капитала, предусмо-
тренного Марксом, а в левой части — производительность
труда.
Важное познавательное значение производственных
функций заключается в том, что они позволяют устанав-
ливать оптимальные соотношения между факторами про-
изводства при данных соотношениях между «ценами»
этих факторов. «Ценами» в этой задаче М. Интрилигатор
правильно называет «оплаты» факторов: заработную пла-
ту, арендную плату за основные фонды, арендную плату
за землю. Эти величины в совокупности образуют аванси-
рованный капитал; вместе с тем они входят в цену товара.
Предполагая, что предприниматель стремится макси-
мизировать прибыль, М. Интрилигатор приходит к урав-
нениям (8.2.11), которые означают, в частности, что зара-
ботная плата равняется предельному продукту, созда-
ваемому рабочей силой.
Именно в этих уравнениях (8.2.11) создатель теории
предельной производительности Дж. Б. Кларк видит
следующее оправдание капиталистического способа про-
изводства: заработная плата не зависит от желаний рабо-
чих и предпринимателей, участвующих в производстве,
а определяется исключительно технологическими свой-
ствами производственных функций.
1 К. Маркс и Ф. Энгельс, Соч. т. 25., ч. I, стр. 157—158.
'18
Между тем известно, что Ё капиталистическом обще-
ство заработная плата рабочего и продолжительность
рабочего дня устанавливаются в результате непрестанной
классовой экономической борьбы. Это хорошо знает
и М. Интрилигатор. В его «нормативных правилах» для
профессионального союза рекомендуется: «Угрожайте про-
ведением забастовок; время от времени бастуйте, чтобы
сделать угрозу реальной» (табл. 1.3).
Нежелание разобраться в этом противоречии между
математической теорией и экономической практикой вооб-
ще характерно для буржуазной математической экономии.
Оно связано с нарочитым пренебрежением к столь важному
экономическому показателю, как продолжительность
рабочего дня. Это более ста лет тому назад констатировал
Маркс в письме к Энгельсу: «Пока определение стоимости
рабочим временем, как даже у самого Рикардо, остается
«неопределенным», оно не пугает этих людей. Но как
только указана точная связь с рабочим днем и его изме-
нениями, дело выступает перед ними в новом, весьма
неприятном свете» х.
Сущность противоречия между производственными
функциями и экономической действительностью заклю-
чается в следующем. В производственных функциях
затраты рабочей силы должны быть выражены в часах
труда. Соответственно оплата рабочей силы будет харак-
теризоваться часовой заработной платой.
В соответствии с концепцией предельного продукта
рабочей силы в производственных функциях его величина
зависит от размеров применяемой рабочей силы. При
прочих равных условиях предельный продукт тем больше,
чем меньше рабочей силы применяется в производстве.,
А размеры предложения рабочей силы (в часах) зависят?
от продолжительности рабочего дня. Поэтому продолжи-,
тельность рабочего дня и ставка дневной заработной платы,
и являются постоянно предметом спора между предприни-
мателями и рабочими. При анализе производственных
функций это необходимо постоянно иметь в виду.
4. «ОБЩЕЕ РАВНОВЕСИЕ» ПО ВАЛЬРАСУ
В книге М. Интрилигатора, помимо естественного для
буржуазного ученого отказа от углубленного анализа
1 К. Маркс и Ф. Энгельс, Соч., т. 32, стр. 8.
2* 19
Производственных функций, имеется еще два раздела,
посвященных «равновесию», по Вальрасу — Дебре и по
фон Нейману, где автор также уклоняется от окончатель-
ного решения поставленной проблемы. Ошибка или
прекращение дальнейших попыток экономико-математиче-
ского исследования у буржуазных экономистов-математи-
ков всегда связаны с игнорированием основного экономи-
ческого закона капиталистической системы хозяйства —
нормы прибавочной стоимости. Поэтому необходимо в раз-
вернутом виде показать экономическое содержание этого
закона и его математическое выражение.
Простое и точное истолкование нормы прибавочной
стоимости т' получаем в следующей ее форме:
ш' = — — 1,
(О
где у,— продолжительность рабочего года (дня) в часах
и со — число часов труда в товарах, на которые рас-
ходуется вся полученная рабочим годовая (дневная) зара-
ботная плата. Труд различной квалификации предпола-
гается редуцированным (приравненным) к простому труду.
Редукция труда и определение полных затрат труда со
осуществляются при помощи таблицы затрат — выпуска
В. Леонтьева (межотраслевого баланса) х.
Исключительно важное значение нормы прибавочной
стоимости т' в политической экономии состоит в том, что
она одинакова во всех отраслях производства при пред-
положении свободного перехода рабочих из одной отрасли
в другую и при одинаковой структуре потребностей рабо-
чих в разных отраслях.
Вместе с тем т' совпадает с нормой прибавочной стои-
мости в ценностном выражении. Именно та же самая вели-
чина т' получится после подстановки в числитель суммы
цен всех произведенных в стране товаров личного потреб-
ления, а в знаменателе — суммы всей заработной платы,
выплаченной в производстве этих товаров и соответствую-
щих средств производства.
Пусть количество товаров (набор товаров), потреблен-
ных одной рабочей семьей в год, составляет х^, ж2, . . ., хп,
а цены этих товаров равны pit р2, . . ., рп. Денежная
стоимость одного набора составит, следовательно, ^iPjXj.
1 А. А. К о н ю с, Редукция труда методом межотраслевого
баланса, Экономика и математические методы, 1971, № 6.
20
Пусть денежная стоимость, или сумма цен всех произве-
денных наборов товаров, будет равна Г, а сумма всей выпла-
ченной заработной платы, или денежная стоимость това-
ров, потребленных рабочими на всех стадиях производ-
ства, составит Ф. Количество произведенных наборов
Г
будет, следовательно, равно -------, а число занятых
рабочих на всех стадиях производства будет равно
Ф т.
------. Количество труда, заключенное во всех произ-
веденных наборах предметов потребления рабочих, должно
р
быть равно, с одной стороны, —--- -со (количество набо-
2j Pixi
ров, умноженное на число часов труда, заключенное
в одном наборе), а с другой стороны, — -у (число
2] W
рабочих, умноженное на число часов труда, отработанных
одним рабочим). Так как эти два выражения между собой
равны, то отсюда следует^
<0 Ф *
Это значит, что формула нормы прибавочной стоимости т'
не только справедлива в отношении затрат труда, но
также справедлива в ценностном выражении для совокуп-
ности отраслей, производящих предметы потребления
рабочих и соответствующих средств производства.
Приведенное доказательство основано на соображе-
ниях, высказанных в начале этого века русским экономи-
стом-математиком В. К. Дмитриевым по поводу теории
Д. Рикардо *. Разность Г — Ф, равная прибавочной
стоимости, представляет собой денежную стоимость това-
ров, потребляемых рабочими, занятыми на предприятиях,
вырабатывающих средства производства в процессе рас-
ширенного воспроизводства, и на предприятиях, выраба-
тывающих предметы потребления капиталистов, и вообще
в непроизводственной сфере.
Говорить о равенстве нормы прибавочной стоимости
В каждой отдельной отрасли производства в ценностном
♦ р. К. Дмитриев, Экономические очерки, М., 1904.
21
выражении можно только относительно остраслей, свя-
занных между собой как по признаку производства, так
и по признаку потребления. Например, во взаимосвязан-
ном процессе получения зерна и соломы невозможно
указать в отдельности, сколько труда затрачено на зерно
и сколько — на солому. Только в отношении суммы цен
зерна и соломы можно ставить вопрос о ее соответствии
количеству затраченного труда. G другой стороны, соот-
ношение цен товаров, удовлетворяющих одну и ту же
потребность, устанавливается в соответствии с их потре-
бительными свойствами. Лишь общая стоимость товаров,
удовлетворяющих одну и ту же потребность, может сопо-
ставляться с суммой их цен. Примером здесь могут слу-
жить цены на уголь и нефть. Эти товары удовлетворяют
одну и ту же потребность в топливе (если отвлечься от
других сфер их применения). Теплотворная способность
тонны нефти в два раза выше теплотворной способности
тонны угля, а количество труда, заключенного в тонне
нефти, в два раза меньше количества труда, заключенного
в тонне угля. Для того чтобы нефть не оказалась дефи-
цитным товаром, цены угля и нефти устанавливаются
в соответствии с их теплотворной способностью. В данном
случае цены устанавливаются применительно к издержкам
производства угля. Сумма же цен продуктов топливной
промышленности соответствует их общей стоимости, при-
чем нефть продается выше ее индивидуальной стоимости,
а уголь — ниже его индивидуальной стоимости.
В свете трудовой теории стоимости народнохозяй-
ственные явления находят исчерпывающее объяснение,
тогда как формальными методами математической эконо-
мии им дается лишь поверхностное описание.
Последнее в особенности относится к «теории равно-
весия» Вальраса — Эрроу — Дебре, являющейся стерж-
нем всей «экономической теории» М. Интрилигатора.
Основной работой, на которую опирается М. Интрилига-
тор в гл. 9 «Общее равновесие» и гл. 10 «Экономика
благосостояния», является книга Жерара Дебре «Теория
ценности. Аксиоматический анализ экономического равно-
весия». «Ценностью» Дебре, пренебрегая традиционным
различием цены и ценности (стоимости), называет скаляр-
ный вектор количеств товаров и цен, т. е. просто сумму
цен. М. Интрилигатор дал весьма обстоятельное матема-
тическое изложение этой теории г. По существу же, рас-
сматривается равновесие, представляющее собой расши-
ренную модель того механизма, какой наблюдается,
например, на рынке, только перечень заданных факторов
здесь значительно расширен: рассматриваются не только
функции полезности и запасы товаров, но и производ-
ственные функции, природные ресурсы и т. д. Однако все
построение представляет собой лишь поверхностное описа-
ние^ не глубокий анализ экономических закономерностей.
На это обратили внимание, в частности, авторы руковод-
ства по линейному программированию и экономическому
анализу: «Спрашивается, зачем нужна вся эта суета
с существованием решения в вальрасовских уравнениях
равновесия? Разве не ясно, что реальный экономический
мир существует в действительности, функционирует» 2.
Ответ авторов на поставленный ими вопрос сводится к тому,
что анализ данной модели помогает развитию науки.
Если подойти к материалу, изложенному в гл. 9 и 10
книги М. Интрилигатора, с марксистской точки зрения,
в нем можно будет найти утверждения, естественные
выводы из которых автор либо не замечает, либо иска-
жает. Например, так называемая «оптимальность по
Парето» является основой концепции «экономики благо-
состояния» и подробно комментируется М. Интрилигато-
ром в гл. 10. Из нее нетрудно вывести утверждение о том,
что при прочих равных условиях нельзя увеличить доход
предпринимателей без того, чтобы заработная плата рабо-
чих не уменьшилась.
Дальнейшему анализу в этом направлении помогает
заключительная диаграмма на рис. 10.8 гл. 10 (несомнен-
ным достоинством книги М. Интрилигатора являются
многочисленные диаграммы, где автор демонстрирует про-
стейшие, даже гипотетические, случаи экономических
взаимозависимостей). На этой диаграмме изображена сдел-
ка между «производителем» и «потребителем», как дели-
катно называет контрагентов автор. В действительности
же дело идет о предпринимателе и о рабочем. «Производи-
тель» владеет товаром 2 «пища»; «потребитель» владеет
товаром 1, о котором М. Интрилигатор говорит: «Напри-
1 См. К. К. В а л ь т у х, Теорема Эрроу — Дебре о конку-
рентном равновесии и проблемы экономической теории, «Проблемы
народнохозяйственного оптимума», Новосибирск, «Наука», 1973.
? R. Porfтар а. о,, op. cit., р. 250.
Я
мер, рабочая сила». Здесь только и может быть рабочая
сила, потому что этот товар (в часах работы) отклады-
вается по отрицательному направлению оси абсцисс,
означающему «неудовольствие».
На диаграмме проведена граница «множества производ-
ственных возможностей» и три «кривых безразличия»,
характеризующих в данном случае не постоянный «уро-
вень потребления», а, скорее, «постоянный уровень жиз-
ни», так как потребитель сопоставляет здесь объем своего
потребления с количеством затрачиваемого им труда,
т. е. с продолжительностью рабочего дня. Мы будем
отмечать эти кривые безразличия порядковыми номера-
ми 1, 2, 3 снизу.
В толковании своей диаграммы М. Интрилигатор про-
являет элементарное, даже не совсем понятное заблужде-
ние. Он говорит, что предприниматель, «двигаясь» по
границе множества производственных возможностей,
достигает максимального уровня прибыли в точке у*.
Но так как эта точка совпадает на диаграмме с точкой
потребления рабочего с* на второй кривой безразличия,
то прибыль здесь, следовательно, равна нулю. Диаграмма,
составленная М. Интрилигатором, характеризует своего
рода «робинзонаду», или натуральное хозяйство на данном
участке земли. Производитель и потребитель совмещены
в одном лице, и «теорема о разделяющей гиперплоскости»
позволяет установить для точки с* (=у*), какое беско-
нечно малое удлинение продолжительности рабочего дня
вызовет приращение производства и потребления пищи.
Для того случая, который, по-видимому, хотел и дол-
жен был изобразить М. Интрилигатор — предпринима-
тель и рабочий являются двумя разными лицами,— диа-
грамма на рис. 10.8 должна быть истолкована следующим
образом.
Кривая безразличия (№ 2), проходящая через точку
с* (=у*), для предпринимателя неприемлема, и он пре-
кратил бы производство, так как он должен был бы все
произведенные продукты питания отдать рабочему. К сча-
стью, автор предусмотрел кривую безразличия с более
низким уровнем жизни — первую снизу. Ориентируясь
на эту кривую безразличия (№ 1 снизу), т. е. полагая,
что рабочий будет вынужден с ней согласиться, предпри-
ниматель выбирает на границе производственных возмож-
ностей такую точку, расстояние от которой до кривой
24
безразличия № 1 по оси ординат (на которой отклады-
ваются производимые и потребляемые продукты питания),
будет максимальным. Возможно, что эта точка совпадает
с у*. Соответствующий отрезок представит собой «при-
быль» предпринимателя, а точнее — созданный в данном
производстве прибавочный продукт (собственно говоря,
земельную ренту). Соответственно необходимый продукт
(заработная плата рабочего в натуре) будет равен рас-
стоянию между найденной точкой на кривой безразли-
чия № 1 и осью абсцисс.
Отношение отрезка над кривой безразличия № 1 до
границы производственных возможностей к отрезку под
кривой безразличия до оси абсцисс представит норму
прибавочной стоимости т', как она показана в приведен-
ной выше формуле в трудовом и ценностном выражении.
Дело в том, что прибавочный и необходимый продукты
в данном случае выражены в одной и той же натуральной
единице измерения с одной и той же ценой и с одними
и теми же затратами труда на единицу продукции.
Судя по примечанию к рис. 10.8, автора больше интере-
совала математическая сторона дела, а не экономическая.
В связи с этим уместно вспомнить слова, принадлежащие,
как утверждают, выдающемуся немецкому физику Мак-
су Планку, о том, что «он начинал свою деятельность как
экономист, но затем оставил эту профессию, потому что
она слишком трудна» х.
Главный порок теории Вальраса — Эрроу — Дебре,
составляющей основу «экономической теории» М. Интри-
лигатора, заключается в отказе от так называемой гипоте-
зы Адама Смита о тенденции (при совершенной конку-
ренции) процента на вложенный в производство капитал
к выравниванию в разных отраслях народного хозяйства.
В разделе 10.4 «Оптимальность и фактор време-
ни» (стр. 349) автор вводит понятие нормы процента
на капитал, систематически различающийся по отдельным
товарам. Экономисту трудно согласиться с таким пред-
ставлением о «теории» капиталистического хозяйства.
Начало этому модному, но далеко не всеми буржуазны-
ми экономистами разделяемому направлению положил
Альфред Маршалл. Его в особенности поддерживают
1П. Самуэльсон, Экономика, перер. с англ., М., «Про-
гресс», 1964, стр. 27,
%
«неоклассики», которых усиленно «пропагандирует»
М. Интрилигатор. Так, видный «неоклассик» Джоан Ро-
бинсон, критикуя Маркса, утверждала: «...Средняя норма
прибыли — это не норма равновесия или цена предложе-
ния капитала. Это просто средняя доля всего того излиш-
ка, который в какой-либо момент капиталистическая
система успевает произвести» *. Впрочем, она, по-види-
мому, не особенно твердо в этом убеждена, так как в другой
своей работе Робинсон без всяких оговорок прибегает
к гипотезе Смита:
«Конкуренция преобладает в том смысле, что во всех
отраслях производства на всех стадиях производства
цена капитала одинакова» 1 2.
П. Самуэльсон дает следующую мотивировку отказа
от единой нормы прибыли в одном из примечаний своего
главного труда:
«...Никакого единственного реального процента на
капитал не предполагается для капиталистического или
социалистического государства. Равенство было бы необ-
ходимо только в крайне необычном случае, когда относи-
тельные цены всех товаров остаются во времени одина-
ковыми» 3.
। Конечно, при изменениях потребности в отдельных
товарах и техники производства в отдельных отраслях
соответствующая норма прибыли должна смещаться.
Но в теоретическом анализе обязательно должна учиты-
ваться господствующая тенденция. Она должна прояв-
ляться даже в том примере возникновения и развития
капиталистического предприятия, который разбирает
П. Самуэльсон в своей работе:
«Вы решили открыть предприятие по производству
зубной пасты. Вы могли получить хорошее образование
в области химии... Допустим, предприятие процветает...
По всей вероятности, пришла пора поискать компаньо-
на... Предположим, что Ваш шурин в обмен на вложенные
им 25 тыс. долл, получил часть собственности в деле» 4.
1 J о a n Robinson, An Essay on Marxian Economics, Lon-
don, 1957.
2 J о a n Robinson, A Neoclassical Theorem, The Review
of Economics Studies, Vol. XXIX (3), 1962.
3P. A. Samuelson, Foundations of Economic Analysis,
Atheneum, N. Y., 1970.
4 П. Самуэльсон, Экономика, перев. с ан^л., М., «Про-
гресс», 1964, стр. 94—96,
2в
Положение обрисовано очень ясно. Но надо предпола-
гать, что шурин такого предпринимателя наверняка пред-
варительно сравнивал прибыльность различных пред-
приятий своих родственников (да и не только их). А этим
и обусловливается тенденция нормы прибыли к вырав-
ниванию в различных отраслях народного хозяйства.
Тщательное статистическое исследование данного
вопроса провел индийский экономист Минхас. Он нашел,
что в значительном числе случаев расхождения между нор-
мами прибыли в отдельных отраслях следует относить за
счет высокой степени монополизации производства в них х.
Категорическое суждение Маркса о единой норме
прибыли общеизвестно: «...Не подлежит никакому сомне-
нию, что в действительности, если оставить в стороне
несущественные случайные и взаимно уничтожающиеся
различия, в разных отраслях промышленности не суще-
ствует различия между средними нормами прибыли, да
и не может существовать его без разрушения всей
системы капиталистического производства» 1 2.
К этому можно добавить лишь восторженный отзыв
американского экономиста-математика В. Леонтьева об
авторитете Маркса в такого рода вопросах: «Значение
Маркса для новейшей экономической теории в том,
что он представляет неиссякаемый источник непосред-
ственного наблюдения... Если вы, прежде чем пытаться
что-либо объяснить, пожелаете узнать, что же представ-
ляет собой в действительности прибыль, заработная плата
и капиталистическое предприятие, то в трех томах «Капи-
тала» вы получите более реалистическую и относящуюся
к делу информацию, чем, возможно, вы надеетесь найти
в десятке последовательных выпусков американских цен-
зов и дюжине руководств по современной экономике»3.
5. МОДЕЛЬ СБАЛАНСИРОВАННОГО РОСТА
ДЖ. ФОН НЕЙМАНА
Если в модели «экономического равновесия» Вальра-
са — Эрроу — Дебре о равенстве процента на капитал
в разных отраслях производства даже не упоминается,
1 В. S. М i n h a s, An International Comparism of Factor Costs
and Factor Use, N. Y., 1962.
2K. Маркс и Ф. Энгельс, Соч., т. 25, ч. 1, стр. 167.
3 W. Leontief, Essays in Economics, N. Y., Oxford Universi-
ty Press, 1963.
27
то в модели «общего равновесия» Джона фон Неймана это
равенство кладется во главу угла.
Модель фон Неймана (которого П. Самуэльсон назвал
«гигантом современной математики» *) получила в лите-
ратуре высшую оценку. Ее называют «знаменитой» 1 2,
утверждают, что она «сильно влияет на экономическую
теорию вплоть до настоящего времени и что полностью
все ее разветвления до сих пор еще не выявлены» 3.
Действительно, модель фон Неймана представляет
интересное явление в развитии математической экономии.
М. Интрилигатор сосредоточивает свое внимание исключи-
тельно на ее чисто математической стороне. Необходимо
поэтому показать достаточно полно экономическое содер-
жание модели фон Неймана.
Модель фон Неймана сильно схематизирует экономиче-
скую действительность. Модель относится к замкнутому
динамическому типу, техника производства предпола-
гается неизменяющейся.
Время в модели подразделяется на равные промежутки;
выпуски продукции в каждом данном промежутке служат
затратами в следующем промежутке. Товары с «длитель-
ным периодом изнашивания», по выражению Энгель-
са 4,— средства труда — показываются в выпуске про-
дукции каждого периода в количествах, уменьшенных
в соответствии с коэффициентами их выбытия. Так как
структура народного хозяйства в каждом последователь-
ном периоде времени одна и та же, промежутки времени
(производственные циклы), если иметь в виду обычное
сельскохозяйственное производство, не могут быть меньше
одного года.
В модели нет непроизводственного потребления, кроме
потребления рабочих, но рабочая сила не показывается.
Для организации производства какого-либо товара надо
располагать, помимо средств производства в определен-
ном составе, еще и соответствующим количеством «пай-
ков», т. е. наборов предметов потребления рабочих. Число
1 Р. A. Samuelson, Maximum Principles in Analytical Eco-
nomics, The American Economic Review, vol. LXII, № 3, June 1972.
2 R. Dorfman a.o., op. cit., p. 181.
3 T. C. Koopmans, Economic Growth at a Maximal Rate,
The Quarterly Journal of Economics, vol. LXXVIII, August 1964,
p'. 355.
4 К. Маркс ц ф. Энгельс, Соч., т. 18, стр. £66.
%
рабочих, занйтых На производстве, должно быть равйб
имеющемуся у предпринимателя числу «пайков». При-
родные ресурсы (земля, полезные ископаемые), так же
как и ресурсы рабочей силы, предполагаются неограни-
ченными.
В каждом производстве (производственном процессе)
в модели фон Неймана обязательно имеются «связанные
продукты». В выпуске каждого производственного про-
цесса, кроме товара, который изготовляется (он может
быть и не одним, например зерно и солома), обязательно
фигурируют не полностью сношенные средства труда.
Модель «затраты — выпуск» Леонтьева (межотраслевой
баланс), в которой каждое производство (производствен-
ный процесс) выпускает только один продукт, можно рас-
сматривать как частный случай модели фон Неймана.
В модели заданными величинами, являются нормы
затрат и нормы выпуска товаров в каждом производственном
процессе, возможно, в нескольких вариантах. Эти нормы
определяются в расчете на условно устанавливаемые
единицы «интенсивности» процессов, т. е. на условные
объемы производства. Нормы предусматриваются в модели
соответственно в виде двух матриц: матрица норм затрат
и матрица норм выпуска. В строках матриц указываются,
например, производственные процессы, а в столбцах —
товары. В модели «затраты — выпуск» Леонтьева имеется
только одна матрица затрат на единицу выпуска продук-
ции.
Объемы выпусков товаров и затрат на них представляют
собой произведения норм выпусков и норм затрат на
интенсивности процессов. Неизвестными (искомыми) вели-
чинами в модели являются интенсивности процессов,
а следовательно, и объемы выпусков и затрат; соотноше-
ния между интенсивностями процессов одинаковы во всех
периодах времени. Неизвестными являются также цены
товаров, одинаковые во всех промежутках времени.
Предпринимательский доход в модели не предусма-
тривается. Норма прибыли совпадает с процентом на
капитал. Для определения процента на капитал вычис-
ляется в каждом производственном процессе сумма про-
изведений цен товаров на их выпуски и сумма произведе-
ний цен затрачиваемых товаров на объемы их затрат.
Процент на капитал представляет собой отношение первой
суммы ко второй минус единица.
29
Предполагается существование совершенной конку-
ренции. Это значит, что, во-первых, процент на капитал
одинаков во всех производственных процессах; процесс
не осуществляется, если процент на капитал в нем оказы-
вается ниже среднего по народному хозяйству, т. е. интен-
сивность такого процесса равна нулю; во-вторых, если
товар производится в данное время в размере, превышаю-
щем потребность в нем в следующем периоде, он становится
даровым благом, и цена такого товара равна нулю (таким
товаром может оказаться, например, солома при произ-
водстве зерна). Абсолютные значения интенсивностей и цен
в модели не определяются. Определяются только соотноше-
ния между интенсивностями и соотношения между ценами.
Главный вывод из модели фон Неймана следующий:
темп роста объема производства товаров, одинаковый
для всех товаров во все периоды («технико-экономи-
ческий» рост народного хозяйства), совпадает с «экономи-
ческим» ростом, т. е. с ростом денежной стоимости всех
выпускаемых товаров и, следовательно, с процентом на
капитал. При соответствующих значениях норм затрат
и норм выпуска народное хозяйство в модели фон Нейма-
на может находиться в состоянии неограниченного
роста.
Такой вывод из модели следовало ожидать. Однако
строгое доказательство его довольно сложно. Оно основано
на теории игр, зачатки которой были заложены в рабо-
тах французского математика Эмиля Бореля в начале
XX в.
Теория игр рассматривает конфликтные ситуации.
Наличие игры в данной проблеме толкуется следующим
образом. Чтобы организовать производственный процесс,
предпринимателям необходим капитал, т. е. сумма про-
изведений затрат товаров на их цены. Имея в виду получе-
ние прибыли, предприниматели заинтересованы, с одной
стороны, в низком проценте на занимаемый ими капитал,
с другой — в расширении роста производства. Математи-
чески условия задачи сформулированы так, что из всех
возможных вариантов технологических процессов и соот-
ношений цен устанавливаются такие, при которых «техно-
логический» рост народного хозяйства (расширение про-
изводства) совпадает с «экономическим» ростом (процен-
том на капитал); предпринимательская прибыль отсут-
ствует.
30
В лйтературе отМейабтСй, йто айаЛиЭ ЭКойОМийеСкоГО
Содержания модели фон Неймана позволяет установить
ее родство схемам расширенного воспроизводства Маркса.
Первым, кто сделал попытку сопоставить модель фон
Неймана и схему воспроизводства Маркса, был японский
экономист Моришима, президент Эконометрического обще-
ства в 1965 г. Он ввел в модель фон Неймана ряд допол-
нительных условий, в том числе потребление капиталистов
и предположение о снашивании основного капитала
в течение одного промежутка времени (последнее, впрочем,
следует считать существенным отклонением от действи-
тельности). Это свое построение Моришима назвал «мо-
делью Маркса — фон Неймана» х.
В таком же направлении комментировал модель фон
Неймана на Международной научной конференции по
разработке межотраслевых балансов в Москве в июне
1967 г. сотрудник Венгерской Академии наук Броди.
По мнению Броди, «эта модель Неймана, хотя и долгое
время забытая, означала по двум причинам поворотный
пункт в истории математической экономии».
Во-первых, по словам Броди, она является первой
моделью, открывшей путь экономическому применению
более современных средств математики. Нейман в этом
случае нашел математический формальный язык, адекват-
ный экономическим проблемам. Этот формальный язык,
система линейных неравенств, особенно после последую-
щего появления вычислительных машин, оказался решаю-
щим с точки зрения дальнейшего развития.
Во-вторых, как отмечает Броди, модель имеет важную
теоретическую особенность: Нейман в отличие от Вальраса
в центр модели вместо рынка поставил производственные
связи, выводя из них рыночные отношения. «Для меня
неясно,— пишет Броди,— насколько сознательна была
такая «уступка» марксистской экономии со стороны Ней-
мана. Он сам, описывая свои предположения, скупо
говорит об этом лишь следующее: «Вполне очевидно,
теоретической модели какого типа соответствуют выше-
изложенные предположения». Мне кажется, однако, что
если бы он сознавал влияние Маркса, то не удивился бы
замечательной «дуальной симметрии» своей модели в отно-
1 М. Моришима, Равновесие, устойчивость, рост, перев.
с англ., М., «Наука», 1972, стр. 174 и сл.
31
Шёнии Денежных и технических пёременНых — ведь поло-
жение о том, что стоимостные отношения лишь отражаю1?
отношения общественного разделения труда, было развито
Марксом в первом томе его главного произведения. Поэто-
му мне представляется, что влияние трудовой теории
стоимости ни в коем случае не является сознательным,
и, таким образом, лишь благодаря своеобразной способно-
сти Неймана к абстрактному мышлению его модель стала
точкой соприкосновения двух экономических школ, допу-
ская и даже вынуждая двойственную интерпретацию» Ч
Внимательное изучение модели роста народного хозяй-
ства фон Неймана позволяет прийти к более категориче-
ским выводам, нежели те, которые были сделаны Мори-
шимой и Броди, и сделать заключение о тождественности,
по существу, предпосылок, лежащих в основе схем вос-
производства Маркса, с одной стороны, и модели фон
Неймана — с другой.
Прежде всего у фон Неймана, как и у Маркса, в товар-
ном обороте нет уникальных произведений искусства,
погашенных почтовых марок и т. п., т. е. таких «товаров»,
определением цен которых так гордится теория предель-
ной полезности перед трудовой теорией стоимости. Одина-
кова у них предпосылка совершенной конкуренции,
выражающаяся в выравнивании нормы прибыли во всех
производствах и в утверждении, что все товары свободно
производятся с приложением труда и капитала. Как
у фон Неймана, так и на первой стадии анализа у Маркса
нет земельной ренты. У фон Неймана, так же как у Маркса,
В схемах производства нет непосредственно затрат труда,
а показываются лишь предметы потребления, служащие
для найма рабочих.
Наконец, прогресс техники одинаково не предусма-
тривается как у фон Неймана, так и в схеме расширенного
воспроизводства Маркса. На последнее указал Ленин
в своей работе «По поводу так называемого вопроса
о рынках»: «Из вышеприведенной схемы Маркса никакого
вывода о преобладании 1-го подразделения над Н-ым
сделать нельзя: оба развиваются там параллельно. Но эта
схема не принимает во внимание именно технического
1 Андраш Броди, О линейных моделях в планировании,
перев. с венг., Сборник «Межотраслевой баланс и планирование
в странах —членах СЭВ», М., «Экономика», 1969.
32
прогресса. Кай это доказано Марксом в I томе «Капитала»,
технический прогресс выражается в том, что отношение
переменного капитала к постоянному (у) постепенно
уменьшается, между тем как в схеме это отношение при-
нято за неизменное» г.
Даже условие о неограниченных ресурсах рабочей силы
у фон Неймана соответствует резервной армии безработ-
ных у Маркса.
Одинаковые предпосылки должны приводить к одина-
ковым выводам. В модели фон Неймана производятся
только предметы потребления рабочих и средства произ-
водства, требующиеся для производства предметов потреб-
ления, в условиях, исключающих возникновение ренты.
В модели однозначно определяется норма прибыли,
совпадающая с процентом на капитал. В этом выводе нет
ничего нового: его получил еще Рикардо.
Как бы предчувствуя, что эта проблема еще будет
обсуждаться в дальнейшем, Рикардо категорически заявил:
«...Во всех странах и во все времена прибыль зависит от
количества труда, требующегося для снабжения рабочих
предметами первой необходимости на той земле и с тем
капиталом, которые не приносят никакой ренты» а. Этот
вывод в начале нашего века был математически подтверж-
ден известным русским экономистом и математиком Дми-
триевым 3. Вывод Дмитриева воспроизводит в одной из
своих работ В. И. Борткевич.
Фон Нейману как математику сочинения Рикардо,
возможно, были неизвестны, но его многочисленным ком-
ментаторам-экономистам не упомянуть о них просто
непростительно.
Главный и справедливый упрек, который следует
сделать буржуазным экономистам-математикам,— это
игнорирование ими качественного отличия труда от дру-
гих видов производственных затрат. Необходимо, следо-
вательно, выяснить, как именно количественно должно
отразиться в модели фон Неймана это качественное отли-
чие затрат труда от затрат других средств производства.
1 В. И. Ленин, Поли. собр. сот., т. 1, стр. 78.
2 Д а в и д Рикардо, Начала политической экономии,
М., 1955, стр. 110.
3 В. К. Дмитриев, Экономические очерки, М.» 1904.
3-0270
33
Основой модели фон Неймана являются заданное
нормы затрат предметов потребления рабочих и средств
производства на единицу интенсивности производствен-
ного процесса. Комментаторы фон Неймана отмечали, что
нормы затрат предметов потребления определяются уров-
нем потребления рабочих г. Уровень потребления соот-
ветствует «прожиточному минимуму», необходимому для
воспроизводства рабочей силы. Прожиточный минимум
входит, таким образом, в общие технические условия,
в которых модель действует и влияет на норму прибыли.
Однако до сих пор не привлекал внимания другой
фактор норм затрат предметов потребления на единицу
выпускаемой продукции — продолжительность рабочего
дня. Такой фактор может рассматриваться технологически
заданным только в отношении рабочего скота или рабов.
Но не обращать внимания на продолжительность рабочего
дня наемного рабочего — значит отвлекаться от самого
существенного элемента политической экономии капита-
лизма.
Продолжительность рабочего дня в современном капи-
талистическом обществе определяется не технологиче-
скими условиями, а классовой борьбой. Если же пред-
ставить себе рабочих совершенно разобщенными, то про-
должительность их рабочего дня окажется зависимой
от степени настоятельности их потребностей. Таким обра-
зом, при одном и том же уровне технологических знаний,
как это принимается в модели фон Неймана, продолжи-
тельность рабочего дня может быть различной.
Нетрудно видеть, что нормы затрат предметов потреб-
ления на единицу интенсивности производственного про-
цесса в модели фон Неймана при одной и той же технике
производства и при одном и том же прожиточном мини-
муме обратно пропорциональны продолжительности рабо-
чего дня. Другими словами, число часов труда, требую-
щееся на обработку данной детали, технологически опре-
делено, а сколько для этого потребуется рабочей силы
и, следовательно, предметов потребления, необходимых
для ее воспроизводства, зависит от продолжительности
рабочего дня. В модели фон Неймана нормами затрат
предметов потребления рабочих на единицу выработки
1 Р. G. Champernowne, A Note of J. V. Neumann’s
Article on Model of Economic Equilibrium, Review of Economic Studies,
1945-1946, vol. XII, № 33.
34
(как и другими нормами затрат и выпуска) определяется
в конечном счете процент на капитал.
Обратимся теперь к формуле нормы прибавочной стои-
мости Маркса т', приведенной на стр. 20. В этой форму-
ле знаменатель определяется техникой производства
и прожиточным минимумом, т. е. нормами затрат средств
производства и труда в часах на предметы потребления
для рабочих и соответствующие средства производства на
всех стадиях их производства. При постоянном знаме-
нателе, как это и есть в модели фон Неймана, норма при-
бавочной стоимости плюс единица пропорцио-
нальна продолжительности рабочего дня.
Отсюда следует, что в модели роста народного хозяй-
ства фон Неймана процент на капитал определяется нор-
мой прибавочной стоимости.
Имеются основания полагать, что в оптимально орга-
низованном народном хозяйстве затраты труда на отдель-
ные группы потребительских товаров, удовлетворяющие
обособленные потребности и не связанные между собой
в производстве, должны быть пропорциональны ценам Ч
Оптимальность здесь понимается в том смысле, что потре-
бители (рабочие, как в модели фон Неймана) при данном
объеме заработной платы и при данном числе часов труда
в товарах, составляющих заработную плату (знаменатель
в формуле т'), всегда так выбирают товары, сообразуясь
с их ценами, чтобы наилучшим образом удовлетворить
свои потребности. Если любую организацию народного
хозяйства формально удовлетворяют цены производства,
то при оптимальной его организации цены по указанным
группам товаров оказываются уже пропорциональными
стоимостям. Соответственно оптимальному состоянию
народного хозяйства должно быть организовано произ-
водство. Это значит, как установил Маркс, что при равной
годовой норме прибыли и равном периоде оборота аванси-
рованного капитала органическое строение капитала в раз-
ных производствах должно быть одинаковым.
В модели фон Неймана органическое строение аванси-
рованного капитала можно выяснить на основании матри-
цы норм затрат. Эта матрица задается произвольно, она
1 А. А. К о н ю с, Трудовая теория стоимости и оптимальное
планирование, Сб. «Оптимальное планирование и совершенствова-
ние управления народным хозяйством», М., «Наука», 1969.
3* 35
йе отвечает бйтйМалЬноМу состоянию народного хозяйства
в смысле наилучшего удовлетворения потребностей обще-
ства (в модели фон Неймана — рабочих) при известных
ценах и заработной плате. Как указывают комментаторы
фон Неймана, в его модели можно предусмотреть различ-
ные варианты наборов товаров для потребления рабочих:
«Фактически может быть более чем один способ как про-
изводить рабочую силу, так и другие товары» х. Коммен-
таторы, однако, упускают из вида, что рабочих нельзя
принудительно кормить, как скот или рабов. Предметы
потребления продаются по известным ценам, и рабочий
волен на свою заработную плату покупать те товары,
какие он пожелает. Модель фон Неймана определяет
на основании матрицы норм затрат и матрицы норм выпу-
ска соотношения между количествами товаров, входящих
в состав рациона рабочего, и соотношения между ценами
этих товаров. А рабочие при этих соотношениях цен
могут выбрать иные соотношения количеств потребляемых
товаров. И тогда модель фон Неймана не будет «работать».
Из сказанного следует, что в модели фон Неймана
нельзя произвольно задавать матрицы затрат и выпуска
продукции. Если эти матрицы будут состайлены так,
что органическое строение авансированного капитала
в производствах разных групп товаров (образованных,
как указано выше) при одинаковом периоде его оборота
-будут одинаковыми, то цены будут пропорциональны
«Затратам труда и размеры производства товаров личного
^йотребления совпадут с платежеспособным спросом на
'Них со стороны рабочих.
В литературе неоднократно высказывались разного
рода предложения ввести в модель общего равновесия
фон Неймана свободное, не рационированное потребление
рабочих и тем самым сблизить ее с моделью Вальраса —
Эрроу — Дебре. Однако эти предложения успеха не
имели.
Настойчивое желание изгнать из математического ана-
лиза капиталистического хозяйства представление о еди-
ном проценте на вложенный капитал в разных отраслях
производства — представление, связанное с построениями
Смита, Рикардо и Маркса,— привело М. Интрилигатора,
вслед за рядом других математиков, к попытке выхоло-
1 R. Dorfman а.о., op. cit., р. 382.
86
стить главное содержание модели фон Неймана. Эта
попытка выразилась в неестественном предположении, что
вместо одинакового роста капитала в разных отраслях
все цены в динамике снижаются в одинаковом соотноше-
нии (стр. 313). Сам фон Нейман в статье о своей мо-
дели такого оборота дела не предусматривал.
Подводя итоги критике математических моделей бур-
жуазной политической экономии, В. В. Новожилов заме-
тил: «Модель Вальраса в новейшей ее формулировке
и модель Дж. фон Неймана — стройные теоретические
системы, результат немалого труда крупных экономистов
и математиков. И тем не менее при их построении упущены
наиболее очевидные истины» х.
Упущение наиболее очевидных истин связано, как
было показано, с апологетикой капиталистического хозяй-
ства. Это особенно проявилось в модели Вальраса —
Эрроу — Дебре, что и обесценивает ее экономическое
значение. Вместе с тем надо признать, что математики-
экономисты капиталистических стран разработали эффек-
тивный, разветвленный и искусно оформленный математи-
ческий инструментарий анализа некоторых экономических
явлений. Овладение им и использование его на основе
принципов марксистско-ленинской экономической тео-
рии — задача современного этапа в развитии экономико-
математических методов, являющихся полезным вспомо-
гательным орудием при планировании социалистического
хозяйства.
Математически подготовленный и марксистски образо-
ванный читатель найдет в книге М. Интрилигатора мате-
риал, пригодный для использования в различных областях
экономики.
А. Конюс
1В. В. Новожилов, Математические модели народного
хозяйства в буржуазной политической экономии и их критика.
«Труды научного совещания о применении математических методов
в экономических исследованиях», т. II, «Математический анализ
расширенного воспроизводства», М., изд-во АН СССР, 1962.
От автора
Задачи оптимизации в современном мире возникают
повсюду: в естественных и гуманитарных науках, в тех-
нике и в хозяйственной деятельности. Благодаря этому
последние достижения теории оптимизации, особенно
в математическом программировании и в теории управле-
ния, находят многие важные области применения и обеща-
ют стать еще более широко используемыми в будущем.
Настоящая книга задумана как достаточно полное
введение в методы статической и динамической оптими-
зации и их приложения к экономической теории и явля-
ется одновременно обзором опубликованных материалов
по указанным вопросам. Она отличается от других книг
подобного рода тем, что в нее включены и теория матема-
тического программирования и теория управления. Хотя
по каждой из охваченных здесь тем существуют отдельные
книги, тем не менее представляется, что такая книга,
в’которой все эти вопросы рассматриваются совместно,
была бы полезной в том отношении, что’в ней можно
показать важные взаимосвязи между отдельными дисци-
- плинами и логику их развития. Поскольку каждая из глав
сама по себе могла бы стать целой книгой, необходимо
было произвести тщательный отбор материала. Основное
внимание здесь уделено тому, чтобы как можно яснее
представить рассматриваемую задачу и указать наилуч-
ший'метод ее решения, с тем чтобы позволить читателю
использовать эти приемы при решении задач. Хотя раз-
меры книги не позволили включить в нее некоторые
строгие доказательства, детальные уточнения и обобще-
ния, а также ряд частных случаев, все же они косвенным
образом учтены в примечаниях, задачах, приложениях
и в библиографии. Некоторые задачи представляют собой
38
упражнения для овладения техническими приемами,
но большая их часть — это учебные и исследовательские
задачи, подсказывающие новые идеи и представляющие
собой в какой-то мере «вызов» читателю. В конце книги
приведена библиография; наиболее важные литератур-
ные источники указаны в первом примечании к каж-
дой из глав.
Книга может быть использована как учебное пособие
по математической экономике и математической оптими-
зации. Она может применяться и как дополнение к курсу
экономической теории и исследования операций. Книга
может'представить интерес и для уже работающих эконо-
мистов, инженеров и специалистов, работающих в области
исследований операций.
Уровень математического изложения настолько элемен-
тарен, насколько это возможно: знание основных сведений
из математического анализа и матричной алгебры является
достаточным. Для удобства читателя весь необходимый
математический материал представлен в приложениях.
Экономические приложения теории оптимизации опре-
деляются’тем, что с ее помощью можно решать экономи-
ческие задачи распределения ресурсов, которые в настоя-
щей книге названы задачами рационального ведения
хозяйства (economizing problems).
Часть I книги состоит из одной вводной главы, в кото-
рой рассматривается взаимосвязь между задачами рацио-
нального ведения хозяйства и экономической теорией.
Часть II и часть III посвящены статическим задачай,
относящимся к некоторому моменту времени. В части II
представлены методы статической оптимизации (програм-
мирования). Сюда входят методы решения классических
задач математического программирования, нелинейное
программирование, линейное программирование и теория
игр. В части III представлены приложения методов стати-
ческой оптимизации к экономическим задачам распреде-
ления ресурсов, включая теорию потребления, теорию
фирмы, общее равновесие и теорию экономического бла-
госостояния.
Часть IV и часть V книги посвящены динамическим
задачам, относящимся к некоторому интервалу времени.
В части V представлены методы динамической оптимиза-
ции (управления), включая вариационное исчисление,
динамическое программирование, принцип максимума
39
И дифференциальные игры. Часть V содержит приложения
этих методов к экономической задаче распределения
ресурсов во времени, а именно к задаче оптимального
экономического роста.
В данной книге существенную роль играет разделение
задач оптимизации на статические и динамические. Можно
разделить эти задачи и по-другому, например на задачи
без ограничений или только с ограничениями типа равен-
ств, таких, как
&Г1 + 2х2 — 5,
и, на задачи с ограничениями типа неравенств, таких, как
’ 8^ + 2х2 5.
Различаются также задачи, в которых принятие решения
зависит от одного лица, и задачи с двумя и более лицами,
принимающими решения. Классификация методов мате-
матической оптимизации по указанным признакам, при-
нятая в книге, дана в таблице. Как показано в таблице,
сначала рассматриваются задачи статической оптимизации
с одним лицом, принимающим решения, и с ограниче-
ниями типа равенств, затем задачи с одним лицом, прини-
мающим решения, и ограничениями типа неравенств,
и, наконец, статические задачи с несколькими лицами,
принимающими решения. В аналогичном порядке рас-
сматриваются и динамические задачи: сначала задачи
с ограничениями типа равенств, затем с ограничениями
типа неравенств и, наконец, задачи с несколькими лицами,
принимающими решения. Эти последние задачи — дина-
мические задачи с ограничениями типа неравенств и с не-
сколькими лицами, принимающими решения,— являются
на самом деле наиболее общими задачами. Действительно,
статические задачи можно считать частными случаями
динамических задач, задачи с ограничениями типа
равенств — частными случаями задач с ограничениями
типа неравенств, а задачи с одним лицом, принимающим
решения, можно считать частными случаями задач с не-
сколькими лицами, принимающими решения. Стохасти-
ческие задачи в этой книге не затрагиваются — рассматри-
ваются только детерминированные задачи.
Для меня было исключительной удачей получить
полезные комментарии и предложения по всем частям
рукописи от многих лиц, в том числе от Кеннета Эрроу,
40
Таблица
Задачи математической оптимизации и план книги
Время Свойства X. ограничений; число лиц, прини- мающих решения Статические задачи математического программирования (гл. 2 и часть II) Динамические задачи управления (гл. 11 и часть IV)
Ограничения отсутствуют или имеются ограничения равенства; одно лицо, при- нимающее решения Классическая за- дача математиче- ского программи- рования (гл. 3) Вариационное ис- числение (гл. 12)
Ограничения — неравенст- ва; одно лицо, прини- мающее решения Нелинейное про- граммирование (гл. 4) и линейное программирование (гл. 5) Динамическое программирова- ние (гл. 13) и прин- цип максимума (гл. 14)
Два или более лиц, при- нимающих решения Теория игр (гл. 6) Дифференциаль- ные игры (гл. 15)
Роберта Ауманна, Стюарта Дрейфуса, Артура Дже-
фриона, Губерта Халкипа, И.-С. Хо, Питера Калмапа,
Роберта Кьюэппа, Мордекая Курца, Хэйп Леланд, Алана
Манна, Джона Мак-Дональда, Мичио Моришима, Чарльза
Плотта, Ларри Руффа, Карла Шелла и прежде всего
от Дональда Бэра.
ЧАСТЬ I
Введение
Глава 1
Рациональное ведение
хозяйства и экономика
1.1. ПРОБЛЕМА РАЦИОНАЛЬНОГО ВЕДЕНИЙ
ХОЗЯЙСТВА
Основной задачей экономики является рациональное
ведение хозяйства, рациональная деятельность (economi-
zing), т. е. распределение ограниченных ресурсов для
достижения поставленных целей. Вследствие ограничен-
ности ресурсов приходится выбирать тот или иной вариант
их использования. При разумном выборе можно достичь
определенных целей, не превышая пределов, обусловлен-
ных ограниченностью ресурсов. К задачам, связанным
с рациональным ведением хозяйства, рассматриваемым
в последующих главах книги, относится, например,
распределение дохода на цели потребления и на сбереже-
ния, распределение общей суммы расходов на потребление
между различными видами товаров и услуг. В каждом
из этих примеров соответствующие ресурсы — доход или
суммы, расходуемые на потребление,— не беспредельны;
напротив, они ограничены, и в обоих случаях приходится
выбирать один из возможных вариантов распределения.
Проблема рационального ведения хозяйства может
рассматриваться с точки зрения применения к экономике
метода математической оптимизации. Задачу математи-
ческой оптимизации можно сформулировать как опреде-
ление таких значений некоторых переменных величин,
удовлетворяющих ряду ограничений, при которых дости-
гается максимум определенной функции.
В качестве переменных в задачах рационального
ведения хозяйства выступают те «инструменты», с помощью
которых осуществляется конкретное распределение. Конку-
рирующие цели, поставленные в задаче, объединяются
в целевую функцию — функцию, максимум которой тре-
буется найти, а ограничения, отражающие недостаток
ресурсов, определяют множество инструментальных вели-
чин, удовлетворяющих всем условиям. Это множество
называют допустимым множеством (opportunity set). Итак,
45
математически задача рационального ведения хозяйства
является задачей отбора из множества возможных вариан-
тов таких значений инструментальных величин, при кото-
рых целевая функция достигает максимума.
1.2. ОСНОВНЫЕ ЭКОНОМИЧЕСКИЕ ОРГАНИЗАЦИИ
(ИНСТИТУТЫ) ,
Экономика в целом представляет собой совокупность
определенных институтов, каждый из которых решает
стоящую перед ним проблему рационального ведения
хозяйства. Во всякой реальной экономике существует
масса подобных организаций, однако объектом изучения
экономической науки является лишь несколько наиболее
типичных и представленных в идеализированном виде
институтов. В число таких институтов входят:
Потребители (домашние хозяйства): отдельные лица
или группы лиц с общим доходом, расходуемым на потреб-
ление (как правило, это семьи).
Фирмы: предприятия (единоличная собственность, това-
рищества, акционерные общества), производящие товары
или услуги для продажи другим фирмам или конечным
потребителям.
Профессиональные союзы: группы людей, работающих
по найму, организованные для того, чтобы заключать
с предпринимателями коллективные договоры для выпол-
нения определенных задач.
Правительственные организации: политические учреж-
дения, часто обладающие важными экономическими функ-
циями.
1.3. ЭКОНОМИЧЕСКАЯ НАУКА
Экономику можно рассматривать как науку о приме-
нении методов рациональной деятельности хозяйственных
институтов. Таким образом, экономическая наука рассмат-
ривает распределение ограниченных ресурсов на различные
цели в домашнем хозяйстве, в фирме и в ряде других
институтов. Некоторые экономисты ограничивают эконо-
мическую науку исключительно изучением процессов
рационального ведения хозяйства. Такое определение ока-
зывается одновременно и слишком общим, и слишком
узким. Чрезмерная общность такого определения состоит
46
й том, что ойо охватывает многие явления, которые
по традиции в экономике не исследуются, в том числе
некоторые формальные задачи из области математики, как,
например, задачи, рассматриваемые в частях II и IV
настоящей книги. С другой стороны, при таком опреде-
лении экономической науки из ее сферы исключаются
институты, традиционно рассматривавшиеся экономистами
в так называемой описательной, или «институциональной»,
экономике. Данное здесь определение объединяет фор-
мальную математическую задачу оптимизации экономиче-
ской деятельности с институциональным описанием основ-
ных экономических организаций.
В табл. 1-4 представлен процесс рациональной эконо-
мической деятельности потребителя, фирмы, профессио-
нального союза и федерального правительства США,
описанный в терминах целевой функции, средств (инстру-
ментальных величин) и ограничений. Принципы, на основе
которых производится выбор инструментальных величин,
Таблица 1-1
Потребитель как институт рационального ведения хозяйства
1 Классическая экономиче- ская теория Неоклассический и другие методы экономической теории
Целевая функция Функция полезности по- требителя, зависящая от уровней потребления всех товаров и услуг Полезность зависит и от будущего, и от те- кущего потребления, от досуга и т. д.
Средства (ин- струменты) Уровни потребления всех товаров и услуг Сбережения Выбор профессии
Ограничения Финансовые ограниче- ния: общие расходы на товары и услуги не могут превышать сумму дохо- да; цены на товары и ус- луги и объем дохода заданы Заданы кривые предло- жения, а не цены (мо- нопсония)
Нормативные правила Распределяйте доход между товарами и услу- гами так, чтобы отноше- ние предельной полезно- сти к цене было одним и тем же для всех видов товаров и услуг Сберегайте в зависимо- сти от текущего дохода и ожидаемого будущего дохода, а также потреб- ления в настоящем и в будущем в зависимости от будущих цен
47
£лблицл 1-2
Фирма как Институт рациональной экономической деятельности
Классическая экономи- ческая теория Неоклассический и другие методы экономической теории
Целевая функция Функция прибыли фир- мы (валовой доход минус издержки), зависящая от выпуска продукции и от затрат факторов Для тех предприятий, уп- равляющие которых не яв- ляются владельцами, це- левой функцией может быть объем продаж
Средства (инстру- менты) Уровни выпуска продук- ции и затрат факторов Уровень рекламной дея- тельности Товаро-материальные запасы
Ограниче- ния Технологическое ограни- чение: выпуск продукции зависит от затрат факто- ров (производственная функция) Задана кривая спроса, а пе цены на выпускаемую про- дукцию (монополия) Заданы кривые предложе- ния, а не цены на затраты факторов (монопсония) Прибыль не может сни- зиться ниже определен- ного уровня » Действия других фирм (олигополия)
Норматив- ные пра- вила Приравнивайте предель- ные доходы от продук- тов к ценам соответст- вующих факторов по всем видам затрат Используйте для конку- ренции пе только цены, но и другие способы, напри- мер рекламу. Используй- те товаро-материальные за- пасы так, чтобы обеспе- чить стабильность произ- водства, несмотря на ко- лебания уровня продаж
обеспечивающих максимальное значение целевой функции
при заданных ограничениях, назовем нормативными пра-
вилами. Соответствующие принципы для потребителя
и фирмы, разработанные экономической теорией, изложены
в гл. 7 и 8 нашей книги. Профсоюзы и федеральное прави-
тельство США руководствуются чисто эмпирическими
и, по-видимому, удачными принципами, найденными
в ходе непрерывного отсеивания правил, оказавшихся
непригодными на практике.
48
Таблица 1-3
Профессиональный союз как институт рациональной
экономической деятельности
Целевая функция Зависит от занятости и от ставок заработной платы членов профсоюза
Средства (ин- струменты) Заключение коллективного договора с предпри- нимателем. Прием новых членов, забастовка, бойкот с
Ограничения Предложение труда и спрос на труд как на фактор производства. Сопротивление предпри- нимателя при ведении переговоров. Правовые ограничения
Нормативные правила При заключении коллективных договоров предъявляйте повышенные первоначальные требования. Угрожайте проведением забастовок; время от времени бастуйте, чтобы сделать угрозу реальной
Таблица 1-4
Федеральное правительство США как институт рациональной
экономической деятельности
Целевая функция Правительственные «функции социального бла- госостояния», зависящие от занятости, произ- водства, покупательной способности населения, экономического роста, циклических процессов, несправедливого распределения доходов
Средства (ин- струменты) Политика в области финансов, налогов, государ- ственного долга, установления цеп и экономи- ческого регулирования
Ограничения Спрос и предложение в экономике США; платеж- ный баланс; правовые ограничения
Нормативные правила Автоматические стабилизаторы, с помощью ко- торых автоматически компенсируются нежела- тельные изменения в экономике (например, стра- хование по безработице) Крупные программы или учреждения (например, программа социального обеспечения, Управление по делам ветеранов войны)
4-0270
49
ЧАСТЬ II
Статическая
оптимизация
4*
Глава 2
Задача математического
программирования
Статическая задача рационального ведения хозяй-
ства (рациональной деятельности) связана с распреде-
лением ограниченных ресурсов на различные цели в опре-
деленный момент времени. В математической форме
задача состоит в нахождении значений переменных, макси-
мизирующих заданную функцию и удовлетворяющих
системе ограничений. В такой форме задача статической
оптимизации часто называется задачей математического
программирования.
2.1. ФОРМАЛЬНАЯ ПОСТАНОВКА ЗАДАЧИ]
При формальной постановке задачи математического
программирования основными являются понятия «инстру-
ментальных» переменных, допустимого множества и целе-
вой функции.
Задача заключается в нахождении значений п пере-
менных Xi, х2, . . хп, которые называются здесь «инстру-
ментами» *. Записанные в виде вектора-столбца
(Xi \
у* I = (xi, х2, хпу,
%n /
(2.1.1)
1 Термин «инструменты» заимствован из книги Я. Тинбергена
«Теория экономической политики»; он отмечал, что орган, регулирую-
щий народное хозяйство, может пользоваться различными сред-
ствами — «инструментами» (процентной ставкой, тарифами и т.п.) —
для достижения определенных целей (сокращение безработицы,
выравнивание платежного баланса и т. п.). — Прим. ред.
53
они составляют вектор инструментальных переменных
в n-мерном евклидовом пространстве Еп х.
Если вектор инструментальных переменных х удов»
летворяет ограничениям задачи, он называется допусти-
мым, а множество всех допустимых векторов образует
множество возможностей X. Допустимое множество явля-
ется подмножеством Еп. Так как задача заключается
в выборе вектора инструментальных переменных из допу-
стимого множества, то в любой нетривиальной задаче оно
является непустым (т. е. система ограничений совместна)
и содержит по крайней мере две различные точки.
Целевая функция — это краткое математическое изло-
жение цели данной задачи. Обычно она представляет
собой действительную непрерывно дифференцируемую
функцию вектора инструментальных переменных
F = F (х) = F . ., xn). (2.1.2)
Общая задача математического программирования
состоит в выборе вектора инструментальных переменных
из множества возможностей, максимизирующего значение
целевой функции:
max F (х) при условии, что х £ X, (2.1.3)
X
где X — подмножество n-мерного евклидова пространства.
Учитывая, что максимизация F (х) эквивалентна мак-
симизации а + bF (х), ?£> 0, или минимизации а + bF (х),
Ъ < 0, можно сделать вывод, что введение дополнитель-
ного слагаемого или положительного множителя в целе-
вую функцию не изменяет задачи, в то время как отри-
цательный множитель может быть использован для преоб-
разования задачи максимизации в задачу минимизации,
и наоборот (например, с помощью умножения F (х)
на —1).
Выделяются три основных вида общей задачи матема-
тического программирования: классическая задача мате-
матического программирования, задача нелинейного про-
граммирования и задача линейного программирования.
1 Определение понятий «вектор-столбец», «транспонирование»,
«n-мерное евклидово пространство» и т. д. дано в приложении.
54
В классической задаче математического программирй4
рання все ограничения представляют собой равенства
gi (х) = (х, х2,
ёг (х) * gt (хь х2,
(2.1.4)
gm (х) — gm (®i, ®2>
Функции gi (х), g2 (х), . . . , gm (х) — известные непре-
рывно дифференцируемые функции, называемые функция-
ми ограничений; параметры bi, Ъ2, . . ., Ът — заданные
действительные числа, называемые константами ограни-
чений. В векторной форме система ограничений записы-
вается в виде
g(x)=b, (2.1.5)
где g (х) и b тп-мерные векторы-столбцы
(gi(^i, хг, хп)\ fbl\
gz (®1, х2, ..хп) I , bs_ I Ь2 I (2.1.6)
gm(Xi, X2, . / \Ът/
Задача классического программирования заключается
в максимизации целевой функции при заданных ограни-
чениях
max F (х) при условии, что g (х) = Ь (2.1.7)
X
В нелинейном программировании система ограничений
состоит из условий двух типов:.
условий неотрицательности ни,
Xi > О, х2 > 0, i хп 0,
(2.1.8)
и ограничений в виде неравейфГВ
gi (х) = gi (Xi,
gz (х) = g2 fa,
gm (x) gm
(2.1.9)
Запишем ограничения в векторной форме
х>0, g(x)<b.
(2.1.10)
85
В этой записи предполагается, что функции ограниче-
ний gi (х), gz (х), ... gm (х) непрерывно дифференцируе-
мые, константы ограничений Ь4, bz, . . ., bm, как и рань-
ше, заданные действительные числа, а 0 — вектор-столбец,
состоящий из нулей.
Задача нелинейного программирования заключается
в нахождении неотрицательных значений переменных,
удовлетворяющих условиям (2.1.9) и максимизирующих
заданную функцию
max F (х) при условии, что g (х)<Ь, х 0. (2.1.11)
X
В линейном программировании целевая
является линейной формой
F (х) = + czxz + . . . + спхп — сх,
Где с — заданный вектор-строка констант
с = (ci, с2, . . ., сп),
и имеются ограничения двух типов:
ограничения в виде неравенств
^11^1 Ч~ ®12^2 “Ь . . . Ч~ UinXn bi \
^21^1 4~ &22^2 4~ • • • 4“ 1
+ am2xz + . . . 4- аmA Ьт /
ц условия неотрицательности
Xi > 0, xz 0, . . хп > 0.
В векторной форме ограничения имеют вид
Ах Ь, х 0,
где А — заданная матрица размерности т X п
/ ДцСЦг • • • ®1п
д___ I #21^22 • ' • &2n
функция
(2.1.12)
(2.1.13)
(2.1.14)
(2.1.15)
(2.1.16)
(2.1.17)
Таким образом, задача линейного программирования за-
ключается в нахождении неотрицательных значений пере-
менных, удовлетворяющих ограничениям (2.1.14) и мак-
симизирующих заданную линейную форму
56
max F (x) =*= ex при условии, что Ax Ь , x 0.
X
(2.1.18)
Следовательно, задача линейного программирования
1Вляется частным случаем задачи нелинейного програм-
мирования, в которой целевая функция и функции огра-
мнений линейны.
2.2. ТИПЫ МАКСИМУМОВ, ТЕОРЕМА
ВЕЙЕРШТРАССА И ТЕОРЕМА
О ДОСТАТОЧНЫХ УСЛОВИЯХ
ГЛОБАЛЬНОГО МАКСИМУМА
В общей задаче математического программирования
вектор инструментальных переменных х* является точкой
глобального} максимума (или решением), если он при-
надлежит допустимому множеству и целевая функция
принимает на этом векторе значение не меньшее, чем
в любой другой допустимой точке
х* 6 X и F (х*) F (х) для всех х 6 X. (2.2.1)
Будем считать глобальный максимум строгим (сильным),
если значение целевой функции при х = х* строго больше
любою другого значения функции на допустимом мно-
жестве, т. е.
F (х*) > F (х) для всех xf X, х у=х*. (2.2.2)
Очевидно, что строгий глобальный максимум всегда един-
ственен, так как если мы предположим противное и допу-
стим, что х* и х** являются различными точками силь-
ного глобального максимума, то из этого будет следовать,
что F (х*) > F (х**) и F (х**) > F (х*), а эти неравен-
ства одновременно выполняться не могут. ?
Фундаментальная теорема математического программ
Мирования — теорема Вейерштрасса — формулирует ус?
ловия существования глобального максимума.
Теорема Вейерштрасса. Пусть допустимое множество
X является компактным (т. е. ограниченным и замкну?
тым) и непустым. Тогда непрерывная целевая функция
F (х), определенная на этом множестве, достигает глобаль-
ного максимума на внутренней или граничной точке мно-
жества X1 *.
Доказательство этого утверждения следует из того
факта, что образ непрерывной функции, определенной
на компактном множестве, тоже является компактным.
Тогда мы имеем множество действительных чисел, удовле-
творяющих условию
F (X) = {z С Е | z = F (х) для х 6 X}, (2.2.3)
которое является компактным. Всякое компактное мно-
жество действительных чисел имеет верхнюю грань.
Таким образом, если F* является верхней гранью F (X),
то существует х* С X, удовлетворяющее условию F (х*) =
= F*, а так как F (х) < F (х*) для всех х £ X, то точка
X* является глобальным максимумом.
Геометрическая иллюстрация теоремы Вейерштрасса
в одномерном случае приведена на рис. 2.1. В этом слу-
чае вектор инструментальных переменных сводится к дей-
ствительному числу х. Допустимое множество представляет
собой интервал на горизонтальной оси х, а множество
значений функции F (X) — на вертикальной оси (вклю-
чая граничные точки интервалов). В рассмотренных слу-
чаях внутреннее решение х* является точкой глобального,
но не строгого, а граничное решение х*** является точкой
строгого глобального максимума.
Примером одномерной задачи, не имеющей решения,
может служить задача максимизации функции F (х) = хг
при условии х>0. Здесь решения нет, так как целевая
функция возрастает с увеличением х, а верхнего предела
по переменной х нет (допустимое множество не ограни-
чено). Еще одна задача того же типа — максимизация
функции F(x)==iOx при условии 0-<х<1. Здесь нет
решения, так как целевая функция возрастает с увеличе-
нием х, а верхняя грань в точке х = 1 не достигается
(допустимое множество не замкнуто). Однако надо отме-
тить, что условия теоремы Вейерштрасса являются доста-
точными, но не необходимыми. Например, задача макси-
мизации функции F (х) = х3 при условии 0 < х^1
1 Допущения на F (х) в теореме Вейерштрасса могут быть ослаб-
лены и заменены условием, что F (х) ограничена сверху на X. -
58
Целевая л
F(x)
Рис. 2.1. Внутреннее и граничное решения в одномерном случае.
Инструмен-
тальная
переменная
(или х<1) имеет решение в точке х — 1, ХЬтя допусти-
мое множество не является компактным.
Вектор инструментальных переменных х* есть точка
локального максимума, если он принадлежит допусти-
мому множеству и на нем достигается значение целевой
функции, большее или равное значениям функции в Неко-
торой малой окрестности этого вектора
х* £ X и F (х*) F (х) для всех
х 6 X Nt (х*),
(2.2.4)
5»
где х* есть е-окрестность вектора х*,э?в данном
случае множество точек х, удовлетворяющих-Ирсловию
---------
]x-x*l = ys ^-4)2<е
3—1
для сколь угодно малого положительного числа е.
Локальный максимум вх* является строгим, если зна-
чение целевой функции в точке х* является наибольшим
значением, достигаемым целевой функцией£в некоторой
малой окрестности
F (х*) > F (х) для всех х С X П Ne (х*), х х*. (2.2.5)
Очевидно, глобальный максимум является локальным;
обратное утверждение неверно, так как могут существо-
вать другие локальные максимумы, на которых целевая
функция принимает большие значения. Например, на
рис. 2.1 в случае внутреннего решения точки х* и х**
являются точками локального максимума, а точка х** —
строго локального, но не глобального максимума.
Второй основной теоремой математического програм-
мирования является «локально-глобальная» теорема, даю-
щая достаточные условия, при которых локальный мак-
симум является глобальным.
Теорема (достаточные условия глобального максимума).
Пусть допустимое множество не пусто и является компакт-
ным и выпуклым, а непрерывная функция F (х) вогнута
на X. Тогда 1) локальный максимум’является глобальным,
2) множество точек, на котором достигается максимум,
выпукло \ Если предположить, что функция F (х) —
строго вогнута, то решение единственно, т. е. существует
единственный глобальный максимум. Иллюстрация этого
случая приведена на рис. 2.2. Так как допустимое множе-
ство выпукло, то любая точка, лежащая между двумя
допустимыми точками, также является допустимой, а из
того факта, что целевая функция строго вогнута, следует,
что хорда, соединяющая две точки кривой, лежит ниже
кривой. Таким образом, точки из допустимого множества,
лежащие справа от строгого локального максимума
х* (например, х2), не могут быть глобальными максиму-
1 Допущения на F (х) в теореме о достаточных условиях гло-
бального максимума могут быть ослаблены и заменены требованием
квазивогнутости функции на X.
60
Рис. 2.2. По теореме о достаточных условиях глобального мак-
симума, строгий локальный максимум в точке х*
является строгим глобальным максимумом, так как X
выпукло, a F (х) строго вогнута.
мами, потому что, соединив точки х* и я2, как показано
на рис. 2.2, мы увидим, что между ними существуют
допустимые точки (например, х1), для которых F (х1} >
> F (х2). Аналогичные условия выполняются для допу-
стимых точек, лежащих слева от х*. Поэтому строгий
локальный максимум в точке х* является единственным
строгим глобальным максимумом.
2.3. ГЕОМЕТРИЧЕСКИЙ КОММЕНТАРИЙ
В одномерном случае, п = 1, задаче математического
программирования можно дать наглядную геометриче-
скую иллюстрацию. Допустимое множество и целевая
функция изображаются на плоскости, как показано на
рис. 2.1 и 2.2. При л = 2 мы непосредственно определяем
только допустимое множество, откладывая инструмен-
тальные переменные по осям х^ и а целевую функцию
F (х) определяем через линии уровня и направление ско-
рейшего роста.
61
Поверхностью (линией) уровня целевой функции назы-
вается множество точек евклидова пространства, для
которых значения функции одинаковы, т. е.
{х С Еп | F (х) = const}, (2.3.1)
причем различные константы порождают различные линии
уровня. Изменяя константы в (2.3.1), получим множество
линий уровня, которое называется картой линий уровня.
Хорошо известные примеры линий уровня — уровни
одинаковых высот на топографической карте и линии
одинакового барометрического давления на карте погоды.
Направление, вдоль которого скорость увеличения
целевой функции (в (2.3.1) — постоянной) максимальна,
называется (тред почтительным направлением, или
направлением наискорейшего роста. Оно задается векто-
ром, который составлен из первых частных производных
целевой функции
(х) = (^ (х), (х), ..., ~ (х)) . (2.3.2)
дх ' ' \ dxj ' п дх2 ' ' дхп ' ' / ' '
Вектор частных производных, называемый вектором-гра-
Р и с. 2.3. Классическое программирование: ^решение в точке
касания.
62
Рис. 2.4. Нелинейное программирование: Граничное й внутрен-
нее решения.
диентом, определяет направление скорейшего возраста-
ния функции 1 F (х).
Геометрически в задаче математического программи-
рования мы ищем такую точку или набор точек из допу-
стимого множества, на которой достигается самая верх-
няя линия уровня, расположенная дальше остальных
в направлении скорейшего роста. Этот способ исполь-
зуется при иллюстрации многих задач статической
оптимизации в двумерном случае.
На рис. 2.3 показано решение задачи математического
программирования (2.1.7), в которой константы линии
1 Заметим, что производная скаляра F по вектору-столбцу х
9F
составляет вектор-строку .
Это допущение используется во всей
книге (см. приложение Б, раздел Б.9).
63
уровня Ck (к = 1, 2, 3, . . .) возрастают в направлении
скорейшего роста, а кривая А А' образует допустимое
множество. В случае если целевая функция и функции
ограничений нелинейны, то при соответствующих пред-
положениях о выпуклости задача классического програм-
мирования имеет единственное решение в точке касания
Т, в которой наклон линии уровня равен наклону кривой
допустимых значений переменных.
В задаче нелинейного программирования (2.1.11) могут
существовать два типа решений, как показано на рис. 2.4.
Решение может находиться как на границе (В), так и во
внутренней точке (Г).
Наконец, рис. 2.5 иллюстрирует два возможных реше-
ния задачи линейного программирования. Линейная
Рис. 2.5. Линейное программирование: решение в вершине V
и на ограничивающем отрезке. I — Решение на грани
BF.
64
целевая функция порождает прямые линии уровня Ch, а
линейные ограничения в виде неравенств и условия
неотрицательности образуют допустимое множество, огра-
ниченное отрезками прямых (на рис. 2.5 допустимое
множество заштриховано). Так как целевая функция
9F
линейна, то = с и направление, в котором целевая
функция возрастает с максимальной скоростью, везде
одинаково. Поэтому в данном случае не может быть внут-
реннего решения; оно может находиться либо в вершине
V, либо решением является весь отрезок (BF), ограни-
чивающий допустимое множество.
Глава 3
Классическая задача
математического
программирования
Классическая задача математического программирова-
ния — это задача выбора таких значений некоторых пере-
менных, подчиненных системе ограничений в форме равен-
ств, при которых достигается максимум или минимум
данной функции \ В обозначениях раздела 2.2 классиче-
ская задача на максимум состоит в следующем: требуется
найти
max F (х)
при условии, что g (х) — Ь, (3.0.1)
или в развернутом виде
найти
max F (xit х2, . . ., хп)
Xj, Х2, .... ХП
при условии, что
gi (*i. х2, . . ., хп) = bi
gz (®i, х2, . . ., хп) = Ь2 (3.0.2)
gm (Х{, Х2, . . ., Хп) = Ьт.
Переменные xlt х2, . . хп — составляющие «-мер-
ного вектора-столбца х — представляют собой средства,
инструментальные величины. Функция F (•) — это целе-
вая функция, а функции ограничений gt (•), g2 (•),
1 Основные сведения о задачах классического математического
программирования изложены в [1, 2, 3]. См. также библиографию
к гл. 12 этой книги. Указанные там источники представляют интерес,
поскольку большинство современных математиков рассматривают
классическое математическое программирование лишь как введение
к вариационному исчислению.
66
. . ., gm (••) суть Составляющие m-мерного вектора столбца
g (•). Вектор-столбец Ь содержит константы ограничений
bi, ^2> • • •, Ьт.
Предположим, что число переменных п и число огра-
ничений т суть конечные числа и что п > т. Разность
п — т называется числом степеней свободы задачи. Пред-
положим также, что заданы т + 1 непрерывно дифферен-
цируемых и не содержащих случайных элементов функций
F (•), gi (•), ёг (•), • • •. gm (•)• Вектор Ь состоит из
фиксированных действительных чисел. Вектор х —любой
вектор с вещественными компонентами, удовлетворяющий
т ограничениям из (3.0.1). ' Р
Геометрически каждое из равенств, входящих в си-
стему ограничений
g, (^1, х2, . . •, хп) = bt, i = 1, 2, . . m, (3.0.3)
определяет множество точек в n-мерном евклидовом про-
странстве т, а пересечение всех т множеств представляет
собой допустимое множество
X = {х е Еп | g (х) = Ь). (3.0.4)
Так же как в гл. 2, определим поверхности (линии) уровня
целевой функции и направление скорейшего роста (урав-
нения (2.3.1) и (2.3.2)). Геометрическое истолкование
задачи состоит в том, что в допустимом множестве отыски-
вается точка (или множество точек), где достигается по-
верхность наибольшего уровня целевой функции (т. е.
поверхность, наиболее удаленная в направлении скорей-
шего роста). Так как целевая функция непрерывна, а допу-
стимое множество замкнуто, то, согласно теореме Вейер-
штрасса (раздел 2.2), решение существует в том случае,
если допустимое множество будет непустым и orj аничен-
ным.
3.1. ЗАДАЧИ ОПТИМИЗАЦИИ
ПРИ ОТСУТСТВИИ ОГРАНИЧЕНИЙ
Особый класс задач составляют задачи оптимизации
при отсутствии ограничений (т = 0). В случае когда
т = 0, а функция зависит от скалярного аргумента
(п = 1), задача состоит в отыскании вещественного числа
х, максимизирующего F (х). Если в такой задаче внутрен-
5* 67
ПИЙ ЛОкаЛЬнйй максимум достигается в х*, то эТо Значит,
что для всех точек х* + Ло:, близких к я*,
F (я*) > F (я* + Ля), (3.1.1)
Где Ая — Произвольное малое приращение аргумента.
Пусть функция F (х) имеет непрерывные и конечные
Производные первого и второго порядков. Тогда в окрест-
ности точки х* можно разложить функцию, стоящую
в правой части неравенства (3.1.1), по формуле Тейлора
(с остаточным членом)
F (х* + Ьх) = F(я*) + (я*) Ля + g (х* + еДя) (Ля)\
(3.1.2)
где
О<0<1.
Подставив это разложение функции в (3.1.1), придем
к основному неравенству
(я*) Дх +1- (я* + 0Ля) (Ля)2<0, (3.1.3)
которое должно выполняться для любого произвольно
малого приращения Ля. Если Ля больше нуля, то, разде-
лив обе части основного неравенства на Ля и переходя
к пределу при Ля, стремящемся к 0, получим, что
(33.4)
Но аналогичное рассуждение при отрицательных Да: при-
водит к неравенству
^(я*)>0. (3.1.5)
Таким образом, из основного неравенства получаем
в качестве необходимого условия первого порядка, что
первая производная в точке локального максимума обра-
щается в нуль
<(»•)-о- (3.1.6)
Если условия первого порядка выполнены, то из
основного неравенства следует, что
-5-(я* + 0Ля)<О, (3.1.7)
«8
так как (Да:)2 всегда больше 0. Поскольку (8Л.7) выпол-
няется для всех Дгг, а вторая производная по предположе-
нию непрерывна, приходим к необходимому условию вто-
рого порядка
(3.1.8)
т. е. в точке локального максимума производная второго
порядка отрицательна или равна нулю.
Итак, условия (3.1.6) и (3.1.8) представляют собой
соответственно условия первого и второго порядков, необ-
ходимые для существования локального максимума
в х*.
Достаточные условия наличия в х* строгого локаль-
ного максимума состоят в том, что первая производная
в этой точке обращается в нуль, а вторая производная
строго меньше нуля. Иначе говоря, если выполнены
условия v , -
-т-(ж*)=°
ах ' '
tPF .
(3.1.9)
то ж’ есть точка строго локального максимума
F (х*) >F (х* + Ах). (3.1.10)
Достаточность этих условий можно доказать с помо-
щью основного неравенства либо более простым способом,
используя теорему о среднем значении. По теореме о сред-
нем значении
F (х* + Ах) = F (х*) + ~(x* + QAx)Ax, (3.1.11)
ах
где 0< 0 С 1. Функция F (х) непрерывно дифференци-
руема, а ее первая производная равна нулю и строго
убывает при х*. Следовательно, если Ах > 0, то
^(х* +0Д;г)<О,
тогда как если Ах С 0, то
^-(х* +0Да;)>О.
В любом случае
{х* 4-0Д;г) Да; < О,
(3.1.12)
(3.1.13)
№
Рис. 3.1. Максимизация при отсутствии ограничений для случая
одной независимой переменной.
так что из (3.1.11) следует
! F (х*) > F (х* + Дх). (3.1.15)
На рис. 3.1 ход решения представлен в геометриче-
ской форме. Угловой коэффициент касательной к кривой
F (х) в точке х* равен нулю, причем величина углового
коэффициента убывает, так что точка х* удовлетворяет
условиям (3.1.9) и, следовательно, является точкой стро-
гого локального максимума. Эти условия выполнены
и в х****, которая также является точкой строгого
локального максимума. В точках х** и х*** выполняется
условие первого порядка — угловой коэффициент каса-
тельной равен нулю, но условие второго порядка цр
70
выполнено, так как угловой коэффициент касательной
в х** возрастает, а в х*** остается постоянным. Точка
х** есть точка строгого локального минимума, а точка
х***, в которой первая и вторая производные обращаются
в нуль, представляет собой один из случаев точки пере-
гиба. Из примера с точкой х*** ясно, что хотя условие
первого порядка (3.1.6) и условие второго порядка (3.1.8)
и являются необходимыми, однако выполнения одних
только этих условий еще недостаточно для существова-
ния максимума. Другим примером этого может служить
F (х) = х3 при х = 0.
Задачу оптимизации при отсутствии ограничений для
функции векторного аргумента т — 0, п > 1 можно иссле-
довать способом, подобным изложенному выше. Форму-
лировка задачи:
найти
max F (х) = F (xlt х2, . . ., хп). (3.1.16)
х
Допустим, что локальный максимум существует в х*:
F (х*) > F (х* + h Дх). (3.1.17)
Это означает, что
F И, х*, . . х%)
F (х* + h Дхь Х2 Д- h Джг, . . ., Хп + h Axn),’ (3.1.18)
где h — произвольное малое положительное число, Дж7- —
произвольное изменение Xj (j — 1, 2, . . ., п), а Дх =
= (Дач, Дж2, . . ., Ьхп)'
определяет некоторое направление в Еп. Функцию в пра-
вой части (3.1.17) можно рассматривать как функцию h.
Разложение по формуле Тейлора в окрестности точки
h = 0 дает
F (х* + Их) = F (ж*) + h -g- (х*) Дх +
+ 4-& (Дх)' S (х* + 0АДх> <Дх)’ <зл-19)
Где О<0<1. Вектор -g- в (3.1.19) есть градиент
с ^F Т,
рункции, а матрица ---------матрица lecce:
dF f dF , . dF . . dF .
-г—X = I -x— (x), -г— (X), . . ,, -г-(X) I
<?X \ dxi v ' dx% ' 0 dxn ' ’ I
&
Л2 р
^(Х) =
(FF . 322? . . 322?
dxl ™ dxi дх2 W • • • dXi дХп W
02F . . dzF . . dzF ,
дх2 дх^ 'X' dx2 'X? * ’ ' dx2 dxn '?
. (3.1.20)
ff^F . . dzF . . dW . .
л---5— (х) S—я— (х) • • • ТТ (х)
дхп dxi ' ' дхп дх2 ' ' дх% ' '
Выпишем (3.1.19) в развернутом виде
F (х* + hAxi, x* + hДа:2, ..., х* + ЪЛхп) в
= Г(х|, х$, ..., x$) + h 2 (4, x%, ..., жЙ) &xj +
i=i 1
n n
+ ~2 2 2 dXi дхь X2 + , %n +
2=1 ft=l
+ 0ЛАжп) (3.1.21)
Сопоставляя выражения (3.1.17) и (3.1.19), придем к ос-
новному неравенству
h (х*) Ах + 4 (Ах)' S <х* + 0Л Дх> (Дх) <°» (ЗЛ-22)
которое должно выполняться для всех направлений Ах
и для всех малых положительных чисел h. Чтобы вывести
из основного неравенства необходимое условие первого
порядка, разделим обе части (3.1.22) на h и перейдем к пре-
делу при h, стремящемся к 0. В результате получаем, что
в точке локального максимума градиент функции равен
нулевому вектору
-g-(x*)=-0. (3.1.23)
Точка, в которой все частные производные первого
порядка равны нулю, называется стационарной. Следо-
вательно, по доказанному точка локального максимума
всегда является стационарной. В качестве еще одного
следствия из основного неравенства получаем необходи-
мое условие второго порядка, а именно, что в точке локаль-
ного максимума матрица Гессе отрицательно определена
или отрицательно полуопределена:
(Дх)'^(х*)(Дх)С0 (3.1.24)
для всех Дх.
Для того чтобы строгий локальный максимум дости-
гался в х*, достаточно, чтобы точка х* была стационарной
точкой, в которой матрица Гессе отрицательно определена.
Иначе говоря, если выполнены условия
£(х*)=0 (3.1.25)
(Дх)'-Ц(х*)(Дх)<0,
то х* является точкой строгого локального максимума
F (х*) > F (х* + Дх). (3.1.26)
Условия первого порядка для существования локаль-
рого максимума функции двух переменных при отсутст-
вии ограничений, т. е. когда требуется найти
шах/1^, х2), (3.1.27)
XI, «2
состоят в том, чтобы точка х* = (#?, xf)' была стационар-
ной точкой
<-«-«• (3.1.28)
Необходимые условия второго порядка в данном случае
заключаются в том, что матрица Гессе отрицательно опре-
делена или отрицательно полуопределена, а это эквива-
лентно выполнению следующих условий, налагаемых на
главные миноры матрицы:
-g(x*)^0 (3.1.29)
dxl (Х
d2F /
-т—л— (х )
дх% дх{ v '
дХ1дх2 ' >
d2F ,
(3.1.30)
В завершение анализа данного случая укажем, что
если в стационарной точке
(3.1.31)
73
F{xf,x2)
Рис. 3.2. Максимум, минимум и седловая точка в задаче опти-
мизации функции Двух переменных при отсутствии
ограничений. В нижней части рисунка изображены
линии уровня и направления наискорейшего роста.
и если выполнено (3.1.30), то х* будет точкой локального
минимума, если же (3.1.30) не выполнено, то х* — седло-
вая точка. Эти три варианта проиллюстрированы на
рис. 3.2. В верхней части диаграммы непосредственно
изображены все три типа стационарных точек, а в нижней
части показаны линии уровня и направления скорейшего
роста. Отметим, что в изображенной на рис. 3.2 седло-
вой точке достигается минимум по переменной и мак-
симум по переменной х2.
3.2. МЕТОД МНОЖИТЕЛЕЙ ЛАГРАНЖА
Одним из наиболее эффективных методов решения
классических задач программирования является метод
множителей Лагранжа [4, 5, 6]. Этому методу в настоя-
щей книге придается особое значение, поскольку он будет
неоднократно использоваться в качестве основного под-
хода к решению почти всех видов задач оптимизации;
кроме того, с его помощью можно получить ценную инфор-
мацию о том, в какой стецеци оптимальное значение целе-
74
вой функции чувствительно к изменениям констант огра-
ничений. Последнее обстоятельство позволяет придавать
множителям Лагранжа важный экономический смысл
в задачах рациональной экономической деятельности.
Для первоначального ознакомления с указанным ме-
тодом рассмотрим задачу на максимум с одной степенью
свободы, в которой п = 2, тп = 1:
найти
maxF(xi, х2) (3.2.1)
XI, Х2
при условии, что g(x\, x2) — b.
Допустим, что в х* = (а:?, х*)' существует локальное
решение задачи и что в этой точке одна из частных произ-
водных функции ограничений не равна нулю. Пусть пере-
менные занумерованы так, что
(3.2.2)
Тогда выражение для полного дифференциала
можно в окрестности х* записать в виде
Решая это уравнение, представим х2 как функцию &i‘.
x2 = h(xt), где ^-=-^-4 (3.2.5)
Теперь исходную задачу можно представить как зада-
чу оптимизации функции одной переменной при отсут-
ствии ограничений; найти ,
max Я (а^) = F (xj, h (®i))« (3-2.6)
Согласно результатам предыдущего раздела, условие
первого порядка для существования локального макси-
мума функции состоит в том, что
dH 9F , dF dh a су гу.
75
Используя выражение (3.2.5), получим
(дР/дхг\ dg _Q
dxi dxl \dg/dx2 / дх1
Очевидно, что также справедливо
9F _ fdF/dx2\ gg _Q
дх2 \ dg/dx2 / дх2
Введем новую переменную у
dFJdxi
У dgjdx2
(3.2.8)
(3.2.9)
(3.2.10)
Из условия существования локального максимума
необходимо следует, что
/—1,2 (3.2.11)
или, исключая из этих выражений переменную у,
dF/dxf _ dg/dxj zq О 4 О\
9F/dx2 dg/dx2 ' (O.Z.1Z)
Геометрическая интерпретация решения дана на
рис. 3.3. Полный дифференциал функции при перемеще-
нии вдоль линии постоянного уровня F (х1г х2) = const,
т. е.
dF=.%-dxl+-%-dX2 = Q. (3.2.13)
V JU
2
Из последнего выражения вытекает следующее свойство
углового коэффициента касательной к кривой ограниче-
ний:
йх2 I dF/dxi
, ЛИНИЯ = — ,
dxi |уровня dF/dx%
Однако, согласно (3.2.4), оказывается, что
dx2 I
кривая
dx\ (ограничений
(3.2.14)
(3.2.15)
dg/dxj
dg/dx2
Следовательно, из условия первого порядка для макси-
мума (3.2.12) вытекает, что решение достигается в точке
касания линии уровня и кривой ограничений, иначе гово-
ря, там, где угловые коэффициенты касательных к этим
кривым равны
dx2 | dx2 I
. линия =- кривая
|уровня dxi (ограничений •
(3.2Д6)
76
Решение задачи
F при отсутствии
м ограничений
Поверхность, задаваемая
целевой функцией
F(xt,x2)
Допустимое
множество
Решение забани
при наличии
ограничений
Направление
наискорейшего
роста
Линия уровня
Проекция допусти-
мого множества
на поверхность,
задаваемую целевой
функцией
Рис. 3.3. Максимизация функции двух переменных при одном
ограничении.
Отметим теперь одно весьма существенное обстоятель-
ство, а именно: необходимые условия (3.2.11) и исходное
ограничение можно было бы получить как условия ста-
ционарности некоторой точки функции
L (xi, х2, у) — F (zj, хг) + у (Ь — g (zi, ar2)). (3.2.17)
Эти условия состоят в том, что
-Й-=;Ё—(З-2-18)
U£j Uxj
^ = b-g(Xi, x2) = 0. (3.2.19)
Переменную у называют множителем Лагранжа, а функ-
цию L (•••) — функцией Лагранжа (лагранжианом).
77
Аналогичный подход можно применить к классиче-
ской задаче математического программирования в общей
форме: найти
maxF(x) (3.2.20)
X
при условии, что g(x) = b.
Предположим, что задача имеет локальное решение
в х* и что функции ограничений удовлетворяют условию
Якоби, т. е. в точке х* ранг р матрицы Якоби — матрицы
частных производных функций ограничений — совпа-
дает с числом строк матрицы
-|^-(х*)-^-(х*) ...^-(х*)
дх± ' ' дх% ' ' дхп ' '
(х*)-^- (х*) (X*)
дх! ' ' дх> ' ' дхп ' •
дц ' ' дх% ' ' дхп ' '
=т. (3.2.21)
Отметим, что в приведенной выше задаче с одной степенью
свободы матрица Якоби есть вектор-строка. Ранг этой
матрицы равен единице тогда и только тогда, когда хотя
бы одна из частных производных функций ограничений
не обращается в нуль. При необходимости можно пере-
нумеровать переменные таким образом, чтобы определи-
тель матрицы, составленной из последних столбцов матри-
цы Якоби, не был бы равен нулю и чтобы вектор инстру-
ментальных переменных можно было представить в виде
х = (х1, х2)', где вектор х1 состоит из п — т переменных,
а вектор х2 — из т переменных. Поскольку условие
Якоби выполнено, то по теореме о неявной функции
в окрестности х* можно разрешить систему ограничений,
представив х2 в виде функции х1
х2 = h (х1), (3.2.22)
где h — вектор-столбец, состоящий из т функций. Теперь
задачу (3.2.20) можно свести к задаче оптимизации при
отсутствии ограничений
щах Н (х1) = F (х1, h (х1)). (3.2.23)
Х1
78
Согласно результатам предыдущего параграфа, необхо-
димое условие для существования локального максимума
состоит в том, что
= + = (3.2.24)
dx1 dx1 dx2 дхУ ' '
дН - „
где представляет собой вектор-строку, состоящую
dh
из п — т элементов, а — матрицу размерности
т X (в — т). Так как ограничения можно записать
в виде тождества
g(x\ h(xi)) = b, (3.2.25
то после дифференцирования получим
dg dg dh „ dxi ** dx2 dxi (3.2.26)
Матрица ^размерности m X m невырожденная, так
как выполняется условие Якоби. Следовательно,
dh / dg \-1 / dg \ dx1 \ dx2 / \ dx1 / (3.2.27)
и условия (3.2.24) можно записать следующим образом:
' dF ( dF \ ( д%\~1 ( to ' dxl \dx2/\dx2/ U-X1/ (3.2.28)
Очевидно также, что
—_ ==о dx2 \ dx2 / \ dx2 / \ dx2 / (3.2.29)
Полагая теперь
у= ('di2') ( di^") =(У‘’ У2» --чУт)» (3.2.30)
можно представить необходимые условия и (3.2.29) в форме (3.2.28)
dx У dx (3.2.31)
Эти необходимые условия наряду с исходными ограни-
чениями можно получить, дифференцируя по х и по у
функцию
F (х) + у (Ь - g (х)). (3.2.32)
Перечислим, из каких основных этапов состоит реше-
ние по методу Лагранжа классической задачи математи-
79
ческого программирования, то есть следующей задачи:
найти max F (х) при условии, что g (х) = Ь. - (3.2.33)
X
На первом этапе вводится вектор-строка из т новых
переменных
У = (У1> У г, • • Ут), (3.2.34)
называемых множителями Лагранжа. На втором этапе
определяется функция Лагранжа как сумма целевой
функции и скалярного произведения вектора множителей
Лагранжа и вектора разности между постоянными огра-
ничениями и функциями ограничений
L (х, у) = F (х) + у (Ь - g (х)), (3.2.35)
или в развернутом виде
2S (#1, • • •» У19 Уъч • • •> Ут) = F (®1» #2? • • ^п) “Ь
+ 2j Vi (bt — gt (®1, ®2, . . xn)). (3.2.36)
Последним этапом является отыскание точки (х*, у*),
в которой все частные производные первого порядка
функции Лагранжа обращаются в нуль:
dL . * dF . л да , *. п
dL (3.2.37)
4у(х*> У*) = Ь —g(x*) = 0.
Первые п из полученных соотношений, совпадающие
с условиями (3.2.31), показывают, что градиент целевой
функции должен равняться вектору множителей Лагран-
жа, умноженному на матрицу Якоби для функций огра-
ничений, т. е.
£(х*) = У*>(х*), (3-2.38)
или в развернутом виде
т
*2, ...,хХ)=2 *2, ...,Х*),
] = 1, 2, ...,«. (3.2.39)
Остальные т условий представляют собой просто систему
ограничений
g (х*) « Ь. (3.2.40)
80
Решая совместно т + п уравнений (3.2.37), получим
значения т + п неизвестных: инструментальных пере-
менных х* = (х*, Х2, . . Хп)' и множителей Лагранжа
У* = (у*, У?, • • ч Ут)- Если выполнены некоторые до-
статочные условия, указанные ниже, то значения пере-
менных х* дают локальное решение классической задачи
математического программирования. Этот вывод доста-
точно очевиден, если учесть тот факт, что х* удовлетворяет
ограничениям 1 и максимизирует функцию Лагранжа,
которая в точке (х*, у*) просто совпадет со значением целе-
вой функции,
L (х*, у*) = F (х*). (3.2.41)
Дадим геометрическую интерпретацию т + п условий
первого порядка
g W = Ь
(3.2.42)
Для этого заметим, что если определить i-ю кривую огра-
ничений как
{х,ё^Ч^(х) = 1>,}, . (3.2.43)
то вектор градиента i-й функции ограничений
dgi __ / dgt Jg£ Jgt_\ И 2 441
Эх “ 1 ’ дх2 ’ • • •’ дхп ) ’ ’
являющийся не чем иным, как г-й строкой матрицы Якоби,
будет ортогональным (направленным по нормали) к этой
кривой, так как
dgi (х) = -~ (x)dx = 0, i=l, 2^'i..., т. (3.2.4^)
Таким образом, условия (3.2.42) показывают, что х* лежит
в допустимом множестве X и что направление скорейшего
роста в х* (вектор градиента целевой функции) представ-
ляет собой линейную комбинацию (взвешенную сумму)
нормалей к кривым ограничений (градиентов к кривым
ограничений), взвешивающими коэффициентами в кото-
рой являются множители Лагранжа у*.
1 Строгое доказательство приводится в- гЙ. 4.*'
в—0270
81
Необходимые условия
что матрица Гессе
второго дорядка достоят в том,
s>JS 1
d2L
дх?
d2L d2L • • d2L ’
дх[ dxi дх2 ‘ ' * dxi дхп
d2L дгЬ dzL
dx2 dxi dxl ’ ‘ " dx> dxn
d2L , ’’1 d2L
дхп дх^ ' dx^
(3.2.46)
составленная из вторых частных производных лагран-
жиана по инструментальным переменным, должна быть
отрицательно определенной или отрицательно полуопре-
деленной в точке локального максимума (х*, у*) при том
условии, что »
dg = -g-(x*)dx = O. (3.2.47)
Если при указанных условиях матрица Гессе является
отрицательно определенной, то условия первого порядка
(3.2.42) являются достаточными для существования ло-
кального максимума [7]. Условие, что матрица Гессе
(3.2.46) является отрицательно определенной при огра-
ничениях (3.2.47), может быть представлено в формр
п — т условий, налагаемых на знаки некоторых миноров
матрицы размерности (т + п) X (т + п)
dg' d2L
ди, ^х2
0 0 . «а 0 dgl дх^ dgm‘ 0g\ dx2 • dgm Sgj dgm UK rd
0 0... 0 dxi • • • dxn fH
dgl fh d*L d^L
dxi дх^ dxl dxi dx2 dxt dxn
• 3 I
dgi ' dgm a2L d^L d2L 1(1
дхп ’ дхп dxn dii dvCji dx^ dxn H*
(3.2.48)
полученной в результате окаймления матрицы Гессе
матрицами Якоби для функций ограничений. Условия
локального максимума в такой форме заключаются в том,
82
что последний п — т главных миноров этой окаймлен-
ной матрицы Гессе имеют чередующиеся знаки, причем
знак первого из них совпадает со знаком (—l)m+1.
3.3. ИНТЕРПРЕТАЦИЯ МНОЖИТЕЛЕЙ ЛАГРАНЖА
Решение системы уравнений (3.2.42), выражающих
условия первого порядка, содержит, кроме вектора локаль-
ного оптимума х*, еще и вектор множителей Лагранжа
у*. Если выполнено условие Якоби, то существует един-
ственный вектор у*, соответствующий локальному реше-
нию х*. Знание значений множителей Лагранжа не
является излишним; напротив, с их помощью можно полу-
чить ценную информацию о задаче. Широкое практиче-
ское использование метода множителей Лагранжа во
многом объясняется именно последним обстоятельством.
Множители Лагранжа, соответствующие решению задачи,
измеряют чувствительность оптимального значения целе-
вой функции F* = F (х*) к изменениям констант огра-
ничений Ь:
Л dF*
У =-7Г’
(3.3.1)
т. e.
»,н .
т.
* dF* . . „
Уг ~ dbt ’ 1 — 2
Для доказательства соотношений (3.3.1)
сначала показать, что если величины bt рассматриваются
как переменные, то переменные X; и (J = 1, . . ., и;
i = 1, . . ., т) можно представить в виде функций &(.
Рассмотрим с этой целью условия первого порядка
(3.2.42), которые можно записать в виде системы т + п
уравнений с 2тп + п неизвестными (Ь, у, х), если считать
bi (i = 1, 2, . . ., т) переменными величинами
Ф1 (Ь, у, х) = b — g (х) = О,
Ф2 (Ь, у, х) (х) - у-Ц (х) = 0.
Запишем матрицу Якоби этой системы уравнений в сле-
дующем виде:
(3.3.2)
необходимо
(3.3.3)
I О
d2L
дх2
О
(3.3.4)
6* S3
где I — единичная матрица порядка т. Ранг матрицы
Якоби равен тп, если выполнены достаточные условия,
налагаемые на окаймленную матрицу Гессе (3.2.48).
Следовательно, по теореме о неявной функции, решая
систему уравнений, составленную из т + п условий
первого порядка, можно представить инструментальные
переменные и множители Лагранжа в виде функций от
постоянных ограничений b
Рассмотрим теперь функцию Лагранжа как функцию,
зависящую от постоянных ограничений:
L (Ь) = F (х (Ь)) + у (Ь) [Ь - g (х (b))t (3,3.6)
Дифференцирование по Ь дает
Первые два члена этого выражения в точке (х*, у*) обра-
щаются в нуль из-за условий первого порядка (3.2.37/,
так что равно вектору множителей Лагранжа. Однако
значение функции Лагранжа в точке (х*, у*) суть опти-
мальное значение целевой функции (3.2.41). Следова-
тельно,
= (3-3-8)
что и утверждалось ранее. Таким образом, помимо того,
что метод множителей Лагранжа дает решение классиче-
ской задачи максимизации, он позволяет также проана-
лизировать, насколько оптимальное значение целевой
функции чувствительно к изменениям констант ограни-
чений. Например, если какой-то множитель Лагранжа
равен нулю, то малые изменения соответствующей кон-
станты ограничений не окажут никакого влияния на опти-
мальное значение целевой функции. Особенно важна
интерпретация множителей Лагранжа в задачах рацио-
нальной экономической деятельности. В экономических
задачах распределения ресурсов целевая функция имеет
размерность стоимости, т. е. цены, умноженной на объем
84
продукции (таковы, например, прибыль, выручка, издерж-
ки), а с помощью ограничений устанавливается опреде-
ленное значение некоторого количества (например, затрат).
Поскольку в таких задачах с помощью множителя Лаг-
ранжа измеряют чувствительность величины, имеющей
размерность стоимости к изменениям некоторого количе-
ства, то он имеет размерность цены. По этой причине мно-
житель Лагранжа часто называют теневой ценой (данного
вида затрат).
ЗАДАЧИ
3-А. Показать на чертеже допустимое множество для
классической задачи максимизации с двумя переменными
и одним ограничением, где в качестве ограничения берутся
следующие соотношения:
1. = 10
2. 2xi + 4х2 = 8 '
3. х, + 4^2 = 36 но
4. х\ + Зх< = 1 'Д
5. (Xi - I)2 + (х2 — 6)2 = О
6. sin (я, + х2) = 0
7. In х2 = 0
8. — xi = 0.
3-Б. Докажите, что:
1. Следующие две задачи имеют одинаковое решение:
а) найти max F (х)
X
при условии, чтр g (х) =; Ь;
б) найти min —F (х)
X
при условии, что g (х) = Ь.
2. Докажите: если F (х) — строго вогнутая функция,
то стационарная точка представляет собой точку строгого
локального максимума.
3-В. Решите следующие задачи графически, исполь-
зуя линии уровня, направления скорейшего роста и допу-
стимые множества:
1. Найти шах xi + х2
при условии, что х* + х2 = 1.
86
2. Найти max exp (—(xl + 2x^
при условии, что 2$t + Зх2 4.
3. .Найти max sin xt cos x2 <>
при условии, что> л!1 — ar2
3-Г. Пусть в задаче оптимизации функции скалярного
аргумента при отсутствии ограничений (п = 1, т = 0)
первые к производных функции F (х) тождественно равны
нулю в х*. Используя разложения по формуле Тейлора,
получить условия для локального максимума. Распро-
странить полученный результат на векторный случай
(п > 1).
З-Д. Используя результаты решения предыдущей за-
дачи, рассмотрите следующие примеры:
1. Имеет ли функция F (х) = 1 — ехр (—х2) максимум
или минимум при х = 0?
2. Найдите максимум функции F (х^, ж2) = (#i — а\х^} х
X (Xi — а%х£), где и а2 — постоянные, причем a, =£а%.
3-Е. Определите достаточные условия второго порядка
для задачи на максимум с одной степенью свободы (задача
(3.2.1)) (п = 2, т = 1) с помощью окаймленной матрицы
Гессе. Покажите, что те же условия можно получить
исходя из того, что '
cPH/dx} < 0, где Н (xt) = F (ац, h (#i)), как и в (3.2.6).
3-Ж. Рассмотрите классическую задачу программи-
рования с квадратической целевой функцией и линейными
огр аничениями,
т. е. следующую задачу: найти
max сх + 4-x'Dx
X Z
при условии, что Ах = Ь,
где с — фиксированный вектор-строка, D — фиксирован-
ная матрица размерности пХ п, отрицательно определен-
ная (и, следовательно, невырожденная), А — заданная
матрица размерности т X п.
1. Построить функцию Лагранжа и найти условий
первого порядка.
8в
2. Найти оптимальный вектор х* как функцию
А, Ь, с и D. Проверить, что х* — допустимое решение
и что при любом другом допустимом векторе целевая
функция принимает меньшее значение, т. е. что х* —
точка глобального максимума.
3. Определить параметры чувствительности
дх*
и и проверить, что с изменением этих параметров
х* меняется линейно.
3-3. Рассмотрите задачу отыскания максимума квад-
ратичной формы при условий,’ что сумма квадратов пере-
менных равна 1,
т. е. найти
max F (х) = х'Ах
X
при условии, что х'х = 1,
где А — симметрическая матрица. Покажите, что если
х* есть решение задачи, то F (х*) равно наибольшему
характеристическому корню матрицы А. Проиллюстри-
руйте этот результат геометрически при п = 2. При каких
условиях F (х*) = О?
3-И. Рассмотрите задачу: найти
min х% +
XI, Х2
при условии, что (ж, — I)3 — х\ = 0.
1. Решить задачу геометрически.
2. Показать, что метод множителей Лагранжа
в данном случае неприменим. Почему?
3-К. Если воспользоваться методом ограниченной ва-
риации, то можно получить необходимые условия для
существования решения классических задач математиче-
ского программирования, используя следующие т + 1
соотношений:
dF = -^dx = O
дх
dg = -J-(x)dx = 0,
которые должны одновременно выполняться в точке реше-
ния. Запишем эти уравнения в виде матричногб урав-
нения
87
rfx = 0
(dF
Ox
dg
dx
Система из этих m + 1 уравнений относительно п неиз-
вестных имеет нетривиальное решение лишь в том случае,
если
= tn,
(dF / \
1*^
dg t \
dx
где р — ранг матрицы.
1. Показать, что с помощью указанного метода
можно получить п — т необходимых условий.
2. Для случая п = 3, т = 1 показать, что необ»
ходимые условия, соответствующие данному методу,
эквивалентны необходимым условиям, соответствую-'
щим методу множителей Лагранжа.
- !3-Л. Рассмотрим задачу: найти
max F (xt, х2, х^
при условии, что g (xlf х2, х3) = Ь.
Необходимыми условиями для существования максимума
в данном случае являются
-^(хьхг, ж3) = у-^-(х1, х2, х3), / = 1,2,3.
g(xt, Х2, Х3) = Й.
Предположим, что в задачу добавлено еще одно ограни-ц
чение,
dF/dti dgldxt . .
имеющее вид= И#=1.
Каковы будут новые необходимые условия?
3-М. Рассмотрим следующую задачу:
max F х2) = / (xt, х2) — wtXi — w2x2.
Предположим, что матрица Гессе, составленная из част-
ных производных второго порядка — д2//дх2, является
отрицательно определенной и что w, и ie2 — это фиксиро-
ванные положительные параметры.
К
1. Каковы в данном случае необходимые условия
первого порядка для максимума?
2. Показать, что можно представить в виде функ-
ции Wi и w2 и что (dxjdw{) < 0.
3. Пусть к задаче добавлено линейное ограничение
х2 — Ь, где b — фиксированный ненулевой параметр.
Найти новое состояние равновесия и показать, что
/ \ I
\ dwt ) I без дополнительного ограничения
\ oW1 / [ с дополнительным ограничением
Этот результат является иллюстрацией принципа Ле
Шателье [4L
3-Н. Примером классической задачи математического
программирования является задача об определении опти-
мального размера партии товара в теории управления
запасами. Имеющийся у фирмы запас некоторого одно-
родного товара I (t) уменьшается с постоянной скоростью
dl/dt, т. е. в каждую единицу времени используется одно
и то же количество товара. Фирма производит заказы на
некоторое количество этого товара х, которое поставляется
ей немедленно всякий раз, когда уровень запасов стано-
вится равным нулю. Ежегодная потребность в товаре рав-
на Л, и фирма производит заказы на поставку ей новых
партий товара п раз в течение года, так что
А = пх.
При хранении товара фирма несет убытки, связанные
с расходами на хранение товара и оформление заказов.
Средняя величина запаса товара равна -и-, а расходы на
и
хранение одной единицы товара равны Сл, так что общие
расходы на хранение составляют Ch^r . Как сказано
и,
выше, фирма производит заказы на поставку новых пар-
тий товара п раз в течение года. Расходы на оформление
одного отдельного заказа равны Со, поэтому общие рас-
ходы на оформление заказов равны Cfin. Хаким образом,
общие расходы составляют
С = 4- Сога.
а
80
1. Показать графически, как меняется во времени
уровень запасов. Доказать, что средний уровень
запасов равен х/2.
2. Минимизировать общие расходы на хранение
товара С, выбирая х и п при условии, что А = пх.
(Указание: воспользоваться методом множителей Лаг-
ранжа.) Найдите оптимальную величину поставки
(оптимальное значение х) как функцию параметров
Со, Ch и А. Объясните, какой смысл имеет множитель
Лагранжа в данной задаче.
3. Третий вид расходов фирмы составляют штраф-
ные платежи за невыполненные ею заказы. Этот вид
расходов ранее не упоминался, поскольку предпола-
галось, что у фирмы всегда имеется нужный запас
товаров. Предположим теперь, что фирма производит
заказы даже не при нулевом уровне запасов, а только
тогда, когда уровень не выполненных ею заказов дос-
тигает определенного значения U, и что в этот
момент она производит все необходимые поставки
своим заказчикам. Стоимость одного невыполнен-
ного заказа равна Ср. Найти оптимальные уровни
х и U.
3-0. Метод наименьших квадратов, применяющийся
в теории регрессий, состоит в следующем: по имею-
щимся данным (xt, yt) (i = 1, . . ., п) строится такая
кривая у = а + Ьх, на которой достигается минимум
суммы квадратов отклонений
n ib)
&\(в, Ь)<= s (yt — (a + bri))zpu
t=l
т. е. минимизируется функция, зависящая от двух пара-
метров: а («отрезок на оси ординат») и b («наклон»),
1. Определить необходимые условия минимизации
функции S (а, Ь). (Уравнения, дающие эти условия,
называются нормальными уравнениями.) Показать, что'
выполнены достаточные условия.
2. Распространите результаты на тот случай, когда'
подбираемая функция является квадратической, т. е.
когда
у = а4-6ж-|-ех1.
90'
3. Распространите полученные результаты на слу-
чай множественной регрессии, т. е. когда подбираемая
>ункция имеет вид. s ;юнй‘)
у = mxi -J- л2а^ + ... + nkXk = лх,
де у — зависимая переменная; л — вектор-строка коэф-
фициентов наклона (свободный член можно получить,
голагая хк = 1), ах есть А-мерный вектор-столбец неза-
1исимых переменных. В этом случае сумма квадратов
1тклонений равна
лй) = 5(л) = 3(у»-лхг)2 = (¥-лХ)(¥-лХ)',
г=1
'ЯН
'Де У; -*• результат наблюдения значения зависимой пере-
менной в г-й точке выборки (2 = 1, . . n); Y — п-мер-
мый вектор-строка наблюденных значений зависимой
переменной в каждой из точек выборки
С; — вектор наблюденных значений независимых пере-
менных в i-й точке выборки, а X — матрица размерности
t X п, составленная из результатов наблюдений k неза-
зисимых переменных в п точках выборки
(Хц • • . #1п\
(предполагается, что р (X) = k <Z ri).
Глава 4
Нелинейное программирование
Задача нелинейного программирования — это задача
выбора таких неотрицательных значений некоторых пере-
менных, подчиненных системе ограничений в форме нера-
венств, при которых достигается максимум или минимум
данной функции х. В обозначениях, принятых в разделе
2.2, задача нелинейного программирования на максимум
состоит в следующем: требуется найти
щах F (х)
1 (4.0.1)
при условии, что g (х) с Ь, X > 0,
или в развернутом виде найти
max F (xt, xz, . . хп)
XI. Х2, . . хп
при условии, ЧТО ' , \
gi (xit ^2, . . Хп) С bt
gz Хг, • хп) <
(4.0.2)
gm (#1> X2f
Хп)
Xi 0, х2 0, . . ., хп 0.
1 Основные сведения по нелинейному программированию изло-
жены в [1,2, 3,4, 5]. В большинстве книг нелинейное програм-
мирование рассматривается вслед за линейным программирова-
нием. В нашей книге принят обратный порядок изложения: линей-
ному программированию посвящена гл. 5, следующая за главой
о нелинейном программировании, поскольку нелинейное програм-
мирование тесно связано с классическими задачами математического
программирования, рассмотренными в гл. 3, тогда как линейное
программирование примыкает к теории игр (гл. 6). Задачи линейного
программирования, характеризующиеся тем, что в них как целевая
функция, так и функции ограничений линейны, рассматриваются
как частный вид задач нелинейного программирования.
92
Величины xlt х2, . . хп — составляющие «-мерного
вектора-столбца х — представляют собой инструменталь-
ные переменные. Функция F (•) — это целевая функция,
а функции ограничений gi (•), g2 (•), . . gm (•) суть
составляющие тп-мерного вектора-столбца g (•). Вектор Ь
содержит константы ограничений bt, b2, . . Ьт. Пред-
положим, что т и п — конечные числа; заданы т + 1
непрерывно дифференцируемых и не содержащих слу-
чайных элементов функций F (•), gi(-), g2 (•), . . .,
• • •, gm (')l вектор Ь состоит из заданных вещественных
чисел; х — это любой вектор с вещественными компонен-
тами, удовлетворяющий т + п ограничениям из (4.0.1)1.
Сделаем несколько замечаний относительно задачи
нелинейного программирования. Во-первых, отметим, что
в отличие от задачи классического программирования
величины т и п не связаны никакими ограничениями.
Во-вторых, выбор знаков неравенств ^совершенно усло-
вен. Например, умножая неравенство — 2х2 ^7 на
—1, можно превратить его в —+ 2х2 < — 7, изме-
нив тем самым знак неравенства на противоположный.
В-третьих, отметим, что ограничение в форме равенства,
например х3 + 8т7 — 12, можно заменить парой ограни-
чений неравенств х3 + 8т7 12 и —х3 — 8х7 — 12.
В-четвертых, условие неотрицательности всех инстру-
ментальных переменных xi, х2, . . ., хп не является обя-
зательным. Если на значения некоторой переменной,
например ха, ограничения не налагаются (то есть она
может принимать отрицательные, положительные и нуле-
вые значения), то эту переменную"можно заменить двумя
переменными: x't 0 и х"Л 0, полагая х9 — x't — х",
так что новая формулировка задачи не будет включать
переменную хд. Таким образом, классическую задачу
математического программирования (3.0.1) можно рас-
сматривать как частную задачу нелинейного программи-
рования, в которой условие неотрицательности перемен-
ных отсутствует, а ограничения неравенства заменены
ограничениями в форме равенств.
1 Задачи, в которых число переменных или число ограниче-
ний бесконечно, называются задачами бесконечномерного нели-
нейного программирования [6]. Задачи, в которых b, F (•) или g( •)
включают случайные элементы, относятся к классу задач стоха-
стического нелинейного программирования 17, 8J.
U3
Геометрически каждое из п условий неотрицательности
я, О, j = 1, 2, . . ., п (4.0.3)
определяет полупространство неотрицательных значений
независимых переменных, а пересечение всех таких полу-
пространств представляет собой подмножество п-мерного
евклидова пространства, называемое неотрицательным
ортантом. Например, в Е1 2 неотрицательный ортант —
это неотрицательный квадрант, т. е. первый квадрану
плюс соответствующие полуоси. Каждое из т ограниче-
ний-неравенств
gi (xi, х2, . . хп) b(, i = l, 2, . . ., т (4.0.4)
также определяет множество точек в n-мерном евклидовом
пространстве, а пересечение этих т множеств с неотрица-
тельным ортантом составляет допустимое множество
X = {х G | g (х) < Ь, х > 0}. (4.0.5)
Поверхности (линии) постоянного уровня и направления
скорейшего роста, дающие геометрическое представление
о целевой функции, рассмотрены в гл. 2. Геометрически
задача нелинейного программирования состоит в отыс-
кании точки или множества точек из допустимого множе-
ства, где достигается поверхность наибольшего уровня.
Так как по предположению целевая функция непрерывна
и допустимое множество замкнуто, то, согласно теореме
Вейерштрасса (раздел 2.2), решение (глобальный макси-
мум) задачи существует, если допустимое множество
не пустое и ограниченное. Решение может принадлежать
либо границе, либо внутренней части допустимого мно-
жества, как это показано на рис. 2.4.
Важную роль в задачах нелинейного программирования
играют условия выпуклости. Задачей выпуклого програм-
мирования часто называют задачу, в которой функции
ограничений выпуклые, а целевая функция вогнутая.
В этом случае, согласно теореме из раздела 2.2, локальный
максимум целевой функции, находящийся внутри допу-
стимого множества или на его границе, является гло-
бальным максимумом, а множество точек, на которых
достигается глобальный максимум, выпукло. Если допол-
нительно предполагается, что целевая функция строго
вогнута, то задача имеет единственное решение *.
1 В более общем случае квазивыпуклого программирования,
когда функции ограничений квазивыпуклы, а целевая функция ква-
зивогнута, локальный максимум является глобальным максимумом,
94
-4.4. ЗАДАЧА НЕЛИНЕЙНОГО
ПРОГРАММИРОВАНИЯ ПРИ
ОГРАНИЧЕНИЯХ НЕОТРИЦАТЕЛЬНОСТИ
Если на переменные налагаются только условия не-
отрицательности (т = 0), то основная задача (4.0.1) сво-
дится к выбору неотрицательных значений инструмен-
тальных переменных, максимизирующих функцию, т. е.
к задаче вида: найти я( oi
max F (х)
’ Г (4.1.1)
при условии, ЧТО X 0. J
Одним из подходов к решению этой задачи является
разложение в ряд Тейлора, использованное в парагра-
фе 3.1 для решения классической задачи математического
программирования при отсутствии ограничений. Пред-
положим, что в х* существует локальный максимум задачи
(4.1.1). Тогда в точках, близких к х*
F (х*) > F (х* + h Ах), (4.1.2)
где Ах определяет направление в Еп, ah — любой произ-
вольное малое положительное число. Пусть F (х) —
дважды непрерывно дифференцируемая функция, тогда
функцию в правой части (4.1.2) можно разложить по фор-
муле Тейлора в окрестности х* Ь),
F (х*-|-АДх) = F (х*) + h — (х*) Дх +
4-^-А2 (Дх)' ~(х* + 0АДх) Дх, (4.1.3)
где 0 <0 < 1. к п
Сопоставляя последние два неравенства, гфЙходим
к основному неравенству
A "S' (х*> Лх + ihZ (Ах)' S’ (х* + °ААх) (МСО, (4.1.4)
являющемуся необходимым условием существования ло-
кального максимума в х*. Если х* > 0, т. е. х* — внут-
и множество всех точек максимума (как локальных, так и глобаль-
ных максимумов) выпуклое. Если предположить, кроме того, что
целевая функция строго квазивогнутая, то решение задачи является
единственным. См. [9].
95
ренняя точка, то основное неравенство выполняется для
всех направлений Ах. Полому, как и в классических
задачах математического программирования, условием
первого порядка является обращение в нуль первых
производных. Допустим теперь, что одна из инструмен-
тальных переменных принимает граничное значение
х* = 0. Пусть приращения всех остальных переменных
равны 0. Тогда, поскольку при х* = 0, единственным
допустимым направлением является такое, при котором
Аху 0, то из основного неравенства следует, что ‘
4^(х*)Д^0. (4.1.5)
Следовательно, условие первого порядка* состоит в том, что
(х*)^0, если х| = 0. (4.|.6)
Итак, в точке внутреннего максимума (х* >• 0) производ-
ная по Xj обращается в 0, а если максимум достигается
на границе (х* = 0), то первая производная меньше или
равна 0. Но так как либо производная равна 0 (во внут-
ренней точке), либо соответствующая переменная при-
нимает нулевое значение (в граничной точке), то их произ-
ведение в точке максимума всегда равно 0
-^(х*м = о. (4.1.?)
Сумма этих произведений также равна 0
(4.1.8)
3=1
Условие обращения в нуль суммы указанных произведе-
ний на самом деле требует, чтобы каждое слагаемое рав-
нялось нулю (т. е. соотношение (4.1.7) должно выполнять-
ся для всех /). Это следует из того, что все переменные
неотрицательны, а частные производные первого порядка
не превышают нуля. Таким образом, локальный макси-
мум в х* определяется с помощью 2п + 1 условий первого
порядка
-~(х*)^0
дх ' '
-g.(x*)x* = 0 (4.1.-в)
х*>0.
96
Внутреннеефешение
(внутренний максимум).
Угловой коэффициент
касательной равен нулю
F
Граничное решение
(максимум на границе).
Угловой коэффициент
касательной меньше нуля
F
Граничное решение
(максимум на границе).
Угловой коэффициент
касательной равен нулю
f д,<ц 4.1. Три возможных решения задачи максимизации функции
одной неотрицательной переменной.
Из этих условий следует приведенный выше результат:
й точке максимума частная производная либо равна
нулю, если соответствующая переменная положительна,
Либо меньше или равна нулю, если соответствующая пере-
менная обращается в нуль
(х*) = 0, если х* > 0 'j
дХр > 2, ..., п. (4.1.10)
— (х*) С(), если а£ = 0 J
7-0270
97
Йа рис. 4.1 проиллюстрированы все возможные реше-
ния задачи в одномерном случае: внутреннее решение-
максимум достигается во внутренней точке, где угловой
коэффициент касательной равен нулю; граничное реше-
ние, при котором угловой коэффициент касательной мень-
ше нуля, и граничное решение, при котором угловой
коэффициент касательной равен нулю.
4.2. УСЛОВИЯ КУНА - ТАККЕРА
Используя результаты предыдущего параграфа, можно
проанализировать общую задачу нелинейного программи-
рования:
найти
max F (х)
при условии, что
g (х) Ь, х 0. (4.2.1)
Для того чтобы преобразовать ограничения-неравенства
в ограничения в форме равенств, введем вектор, состоя-
щий из т вспомогательных («свободных») переменных
8 = b - g (х) = (sit s2, . . sm)'. (4.2.2)
Теперь задача состоит в отыскании
max F (х)
X, S
при условии, ЧТО
g (х) + 8 = Ь, х > О, s > О, (4.2.3)
причем неотрицательность вспомогательных переменных
обеспечивает выполнение ограничений-неравенств. Если
бы выражения (4.2.3) не включали т + п ограничений-
неравенств, то наша задача являлась бы классической
задачей математического программирования. Функция
Лагранжа такой задачи имела бы вид
L' = F (х) + у (Ь - g (х) - s), ‘ (4.2.4)
где у = (у15 у2, . . ., Ут) — вектор множителей Лагранжа
(как и в предыдущей главе).
Необходимые условия первого порядка состояли бы
в том, что все первые частные производные функции L'
98
fio х, у и s Должны обращаться в нуль. Йо так кай х й S
неотрицательны, то соответствующие условия на значе-
ния первых производных по этим т + п переменным заме-
няются на условия, которые можно получить по форму-
лам (4.1.9) предыдущего параграфа. В соответствии с этим
условия первого порядка для существования локаль-
ного максимума задачи (4.2.3) состоят в следующем:
х^О
-^- = b-g(x)-s = 0
(4.2.5)
dL’ л
ds J
s^O,
где все переменные, функции и производные вычисляются
при х*, у* из*. Заменяя вектор вспомогательных перемен-
ных s на Ь — g (х), приходим к условиям Куна — Танкера
/ dF с
Ьг-у-
dF dg
dx У dx
(4.2.6)
У (b - g (х)) = О
Те же условия можно получить, если определить .
функцию Лагранжа для исходной задачи (4.2.1) как
сумму целевой функции и скалярного произведения век-
торов множителей Лагранжа и разности между констан-
тами ограничений
L = L (х, у) = F (х) + У (Ь - g (х)), (4.2.7)
7» 99
или в развернутом виде . ।
L fo, х2, . . хп; у1г у2, . Р., ym) = F (хь хг, . . хп) +
т
+ 3 У1 (bt — gi (xt, хг, . . xn)). (4.2.8)
г=1
Условия Куна — Таккера записываются теперь следую-
щим образом:
-й- <х*’ У)=йг <х*)-у -й- (х*)<°
# (X*. У*)х* - (# <х*) - У* -й <х*>)х* - 0
х*^0
—(х*, у*) = Ь —g (х*)^0 (4.2.9).
у*4у- (х*> у*) = У* (Ь “ 8 (х*))=0
у*^>0.
Эти условия являются необходимыми и достаточными для
существования (строгого) локального максимума, если це-
левая функция (строго) вогнутая, а функции ограничений
выпуклые, и если, кроме того, выполнено некоторое условие
регулярности, налагаемое на ограничения, которое будет
введено в следующем параграфе. Условия Куна — Таккера
можно записать в развернутом виде как 2т + 2п + 2
соотношений;
#- = #—3^4^ СО, j = i, 2, .... п (4.2.10)
дх> дх, ° дхп ’ 1 ’ ’ ’ ' '
‘ i=l
n пт
«-г-н)
/=1 j=l i=l
/=1, 2, .... п (4.2.12)
^ = b(~gi(’)^O, i = i,2,...,m (4.2.13)
= 2 yi(bi-giH) = O (4.2.14)
i=l i=l
yt^O, i — i, 2, m, (4.2.15)
100
где все переменные, функции и производные вычис-
ляются в (х*, у*).
Для того чтобы понять важный смысл этих условий,
отметим прежде всего, что соотношения (4.2.12) и (4.2.13)
выражают соответственно ограничения неотрицательности
и ограничения-неравенства исходной задачи нелинейного
программирования. Отметим, что вследствие неравенств
(4.2.10) и (4.2.12) каждое из слагаемых суммы (4.2.11)
должно равняться нулю, так что
т
либо (1^)=°’ н®60 ^=0 (4-2Л6)
4=1
(либо эти равенства выполняются одновременно)
j = l, 2, .... п.
Иначе говоря, либо каждое из соотношений между произ-
водными выполняется как равенство, либо переменная
равна нулю, либо обе эти возможности осуществляются
одновременно. Таким образом,
m
н°
(JJL-l
7П
— У Vi 4^- = если х? >
dxj ^-1 ° dxj r j
i—1
7П
ж*^0, но x* — 0, если — У Vi < 0
* oxj dxj
/ = 1.2,
п.
(4.2.17)
Каждое из слагаемых суммы (4.2.14) также равно нулю
благодаря неравенствам (4.2.13) и (4.2.15), так что
либо Уг — 0, либо gt (х*) = bt (или же эти неравенст-
ва выполняются одновременно), i = 1, 2, . . ., т. (4.2.18)
Иначе говоря, либо множитель Лагранжа равен нулю,
либо соответствующее ограничение-неравенство выпол-
няется как равенство, либо и то и другое выполняется
одновременно. Итак,
КН
<г, но gi (x*) = b(, если jr*> 0 )
р*>0, но y* = 0, если gt (x*) < &t p » “ 4, 2, ..., m.
(4.2.19)
Условия (4.2.17) и (4.2.19), представляющие собой иной
способ формулирования условий Куна — Таккера, назы-
вают условиями дополняющей нежесткости. Совершенно
ЯСНО, ЧТО jz
L (х*, у*) = F (х*) + уцЬ — g (х*)) = F (х*), (4.2.20)
т. е. значение функции Лагранжа в точке решения совпа-
дает с оптимальным значением целевой функции, так как,
согласно (4.2.14), у* (b — g (х*)) = 0.
Дадим геометрическую интерпретацию условий Куна-
Таккера. Будем рассматривать эти условия в форме (4.2.5).
Если ввести второй вектор дополнительных переменных
Г=У-Й-1Г=(Г1’Г2’(4-2-21)
то (4.2.5) преобразуются к виду
гх = 0
г = 0, х < 0
Ь — g (х) — s = 0 (4.2.22)
уз = 0
s > 0, у > 0,
где все переменные, функции и производные вычисляются
при х = х*, у = у*, г = г*, s = s*. Неотрицательность
вспомогательных переменных обеспечивает выполнение
соответствующих ограничений-неравенств. Первые п
соотношений можно записать в форме
# (х*) = У* # (х*) + г* (-1), (4.2.23)
где I — единичная матрица. Геометрический смысл
(4.2.23) состоит в том, что в искомой точке градиент
dF
целевой функции должен быть линейной комби-
нацией градиентов ограничивающих гиперповерхностей.
Градиентами ограничений неравенств являются строки
матрицы Якоби ||, градиентами ограничений неотри-
цательности — строки матрицы (— I), а коэффициентами
линейной комбинации — неотрицательные множители
Лагранжа у* и вспомогательные переменные г*. Таким
образом, если решение лежит на границе, то направление
скорейшего роста представляет собой линейную комби-
нацию векторов-нормалей к поверхности, взятых с неотри-
цательными коэффициентами.
Рассмотрим теперь характерный пример задачи нели-
нейного программирования: найти ?
max F (xt, х2) = — 8х3 — 1 Oz^ +12xtх2 — 50xi + 80х2
Xf, Х2
при условии, что
21 + 22 < 1
8х3 + х32 2
21 > О, х2 + 0.
(4.2.24)
Поскольку здесь целевая функция строго вогнутая, а функ-
ции ограничений выпуклые, то система неравенств, входя-
щих в условия Куна — Таккера, имеет единственное реше-
ние в точке глобального максимума. Функция Лагранжа
для этой задачи имеет вид
L (xj, х2, yi, у2) = —8х3 — 10х2 + 12xiX2 — 50л?! +
+ 80х2 + Pi (1 — 21 — х2) + у2 (2 — 8х2 — xzh (4.2.25)
а условия Куна — Таккера —
= — 16^1 + 12x2 — 50 — yi— 16p22i^0
~ — 20х2 + 12xi + 80 — pi — 2у2х2 ^0
2t + х2 = (— 16X1 + 12х2 — 50 — Р1 — 16р2Х1) Х1 +
+ (— 20х2 + 12xi + 80 — pi •— 2р2х2) х2 = 0
21^0
х225&0
-£-2-8x:-xi>0
yi~^ + y2~^ = yi (l-2i-x2) + y2(2-8x3-x|) = 0
У1>0
у2>о.
(4.2.26)
юз
Рис. 4.2. Геометрическое решение задачи нелинейного про-
граммирования.
Хотя эти условия полностью характеризуют решение,
тем не менее они малопригодны для практического отыс-
кания решений задачи. Рассмотрим несколько различ-
ных допустимых точек. Точка начала координат (0, 0)
не удовлетворяет условиям Куна — Танкера, так как
в этой точке iji = 0, у2 — 0, а ^ = 80. Точка (4-, о)
также не удовлетворяет условиям, так как здесь yi = 0,
а = 86. Однако точка (0, 1) является решением задачи.
В этой точке
х* = (0, 1)'
у* = (60, 0)
-^(х*. Г) = (-98,0)
У*)==(°> 1)'
F(x*) = 70
^(х*) = (-38, 60).
(4.2.27)
На рис. 4.2. решение представлено в геометрической
форме. Отметим, что в точке максимума направление ОКО’-
Н|
рейшего роста лежит между нормалями (векторы норма-
лей направлены прочь от допустимого множества). Отме-
тим, кроме того, что второе ограничение в данном случае
оказалось излишним.
4.3. ТЕОРЕМА КУНА - ТАККЕРА
Подход Куна — Таккера к общей задаче нелинейного
программирования: найти
maxF(x)
X
при условии, что g(x)^b, х^О, (4.3.1)
Изложенный в предыдущем параграфе, состоит в том,
что вводится вектор-строка множителей Лагранжа у =
= (i/i, у2, . . ., i/m), число которых равно числу ограни-
чений-неравенств и определяется функциями Лагранжа
L(x,y) = F(x) + y(b-g(x)). (4.3.2)
5 этом случае условия Куна —Таккера записываются как
-^(х*,у*)<0 2£(х*,у*)>0
гаг ат (4.3.3)
^(х*,у*)х* = 0 у*^(х*,у*) = 0
х* 0 у* 0.
Из сопоставления этих неравенств с условиями существо-
вания максимума (4.1.9) видно, что (х*, у*) является сед-
ловой точкой функции Лагранжа, т. е. точкой, максими-
зирующей функцию по совокупности всех неотрицатель-
ных переменных х и минимизирующей ее по совокупности
всех неотрицательных множителей Лагранжа у
L (х, у*) L (х*, У*) С L (х*, у)
при всех х 0, у 0. (4.3.4)
Задача отыскания неотрицательных векторов (х*, у*),
удовлетворяющих (4.3.4) называется задачей о седловой
точке х.
1 Тот факт, что (х*, у*) представляет собой седловую точку фун-
кции 4 (х, у) и что два набора условий (4.3,3) симметричны, есте-
405
По теореме Куна — Танкера х является решением зада-
чи нелинейного программирования, если (х*, у*) является
решением задачи о седловой точке, и при некоторых усло-
виях х* является решением задачи нелинейного програм-
мирования лишь в том случае, когда существует такой
вектор у, что (х*, у*) является решением задачи о седло-
вой точке.
В первой части теоремы утверждается, что если (х*,
у*) представляет собой седловую точку, как в (4.3.4),
то х* суть решение задачи нелинейного программирова-
ния. Пусть (х*, у*) — седловая точка, тогда х* максими-
зирует функцию Лагранжа (относительно всех х 0),
а у* минимизирует ее
F (х) + у* (b — g (х)) F (х*) + у* (b — g (х*)) (4.3.5)
F (х*) + у* (b — g (х*))^ F (х*)>у (b — g (х*)). (4.3.6)
Запишем Последнее неравенство в следующем виде:
(У - У*) (b - g (X*)) >0, у >0. (4.3.7)
Поскольку компоненты могут быть сколько угодно боль-
шими, то х* должно удовлетворять ограничениям-нера-
венствам
g (х*) с Ь. (4.3.8)
С другой стороны, если положить в (4.3.7) у = 0, то
У* (Ь — g (х*)) = 0, (4.3.9)
так как у* 0, и Ь — g (х*) 0. Используя (4.3.9),
неравенство (4.3.5) можно записать как
F (х*) > F (х) + у* (b - g (х)), х > 0. (4.3.10)
Если х — допустимый вектор, то
F (х*) > F (х), (4.3.11)
так как у* неотрицателен. Следовательно, вектор х* мак-
симизирует F (•) в классе допустимых значений х, являясь
ственным образом приводит к двойственным задачам: max L (х, у)
X
при условии, что 0, х > 0; min L (х, у) нрн условии, что
"У у
0, у > 0. Этот подход оказался исключительно плодотвор-
ным в теории линейного программирования (см. гл. 5), однако в тео-
рии нелинейного программирования он не столь удачен. О двойст-
венности в нелинейном программировании см. [10).
Ю6
тем самым решением задачи нелинейного программирова-
ния. Следует заметить, что при доказательстве первой
части (достаточности) теоремы Куна — Таккера не потре-
бовалось никаких специальных предложений относитель-
но функций F (•) и g (•).
Доказательство второй части (необходимости) теоремы
Куна — Таккера существенно опирается на некоторые
предположения о функциях F (•) и g (•). Эта часть теоре-
мы справедлива, если F (•) — вогнутая функция, функ-
ции g (•) — выпуклые и если выполнено специальное усло-
вие регулярности ограничений, состоящее в том, что
в некоторой точке допустимого множества все ограниче-
ния-неравенства выполняются как строгие неравенства,
т. е. если существует такой вектор х°, что х° 0 и
g (х°) < Ь *. Пусть при этих предположениях х* является
решением задачи нелинейного программирования, т. е.
х* О, g (х*) Ь и F (х*) F (х)
при всех х таких, что
х > о, g (х) <ь.
(4.3.12)
Определим два множества в (т+1)-мерном пространстве
где а0 и Ьо — скаляры, а а и Ь тп-мерные векторы-строки.
На рис. 4.3 представлен соответствующий пример для
т = п = 1. Здесь заштрихованная часть оси х — это
допустимое множество; х* — точка решения. Множество
А — это часть плоскости, которая ограничена точками
с координатами по оси Ох, равными b — g (х), а по оси Оу,
равными F (х). Множество В — это внутренняя часть
квадранта, вершина которого имеет координату по оси
Ох, равную 0, а по оси Оу, равную F (х*). Так как F (•) —
вогнутая функция, а £(•) — выпуклая, то множество А
1 Обсуждение указанного здесь условия регулярности ограниче-
ний и других возможных условий регулярности представлено в [11].
Доказательство необходимости, приведенное в настоящей книге,
в котором не требуется, чтобы целевая функция или функции огра-
ничений были дифференцируемыми, принадлежит Удзаве [12].
1Q7
Рис. 4.3. Множества А а В для задачи нелинейного програм-
мирования при т = п = I.
здесь, как и в более общем случае, выпукло. Множество
В, как внутренняя часть ортанта, также выпукло.
Поскольку х* является решением задачи нелинейного
программирования, то эти два множества не имеют общих
точек. Следовательно, по теореме о существовании разде-
ляющей гиперплоскости для непересекающихся выпуклых
множеств существует ненулевой вектор-строка (у0, у),
где у о — скаляр, а у m-мерный вектор, такой, что для
всех
( аа°) из Л и ( J ) из В
(г/о, у) (а1<(Уо. у) (ь
(4.3.14)
Так как вектор (уо, у) неотрицателен по самому определе-
нию множества В и так как точка (F (х*), 0)' лежит ца
границе В, то для всех х 0
108
y0F (x) + у (b — g (x)) C y0F (x*). (4.3.15)
Покажем, что y0 > 0. Так как, согласно условию регуляр-
ности ограничений в некоторой точке допустимого мно-
жества, все ограничения-неравенства выполняются как
строгие неравенства, то из (4.3.15) следует, что
у (Ь — g (х))^0 при всех х 0. Если уа = 0, то из
(4.3.15) следует, что у (Ь — g (х))^0 при любом х 0.
Но так как у — неотрицательный вектор, то последнее
противоречит предположению о том, что существует
х° 0, такой, что g (х°) < Ь.
Поскольку у0> 0, то обе части неравенства (4.3.15)
можно разделить на у0, так что при любом х 0
Е(х) + у* (b - g (х)) sC F (х*), (4.3.16)
Где у* = у > 0. В частности, если х = х*, то
у* (Ь - g (х)) 0, (4.3.17)
а так как g (х*) Ь и у* 0, то
у* (Ь - g (х)) = 0. (4.3.18)
Следовательно, если функция Лагранжа определяется как
L (х, у) = F (х) + у (b - g (х)), (4.3.19)
то из (4.3.16), (4.3.18) и неотрицательности у следует, что
(х*, у*) представляет собой седловую точку для L (х, у)
при х 0, у 0. Таким образом доказана вторая часть
теоремы х. Итак, при указанных условиях х* будет реше-
нием задачи нелинейного программирования (4.3.1)
1 Отметим, что теорема остается верной и в том случае, когда
условие регулярности ограничений не выполнено, если при этом
вводится множитель Лагранжа у0, соответствующий целевой функ-
ции, так что функция Лагранжа имеет вид:
Г = y0F (х) + у (b — g (х)).
Такой подход предложен в работе Джона [13]. Если условие регу-
лярности ограничений выполнено, то в точке решения у0 > 0,
так что можно разделить L на у0. В результате получим функцию L,
то есть у0 можно принять равным единице.
Условие регулярности ограничений можно рассмотреть, исполь-
зуя те же геометрические представления, что и при интерпретации
выражения (4.2.23). Если указанное условие регулярности ограни-
чений не выполнено, то решением задачи может быть точка, являю-
щаяся вершиной острого выступа, нормали в которой направлены
109
Тогда, й тОЛЬКо ТоГДа, КОГДа оуТДОСтВуёт йектор у*, такой,
что (х*, у*) является решением задачи о седловой точке
(4.3.4).
Рассмотрим теперь задачу о седловой точке при допол-
нительном предположении о дифференцируемости функ-
ций F (х) и g (х), которое не использовалось при доказа-
тельстве. Первая часть задачи о седловой точке заклю-
чается в отыскании максимума по неотрицательным пере-
менным х. Применяя (4.1.9), получаем следующие усло-
вия:
2£-(х*,у*)х* = 0, (4.3.20)
х* 0.
Для решения второй части задачи о седловой точке—мини-
мизации £(х*, у) по неотрицательным множителям Лаг-
ранжа у требуется выполнение условий
>(х*.У*)>0
ят (4.3.21)
У*)=°> У*до-
полученные соотношения представляют собой условия
Куна — Таккера (4.3.3).
4.4. ИНТЕРПРЕТАЦИЯ МНОЖИТЕЛЕЙ
ЛАГРАНЖА
Как и в предыдущей главе, множители Лагранжа
можно истолковывать как характеристики изменений
оптимального значения целевой функции при изменениях
констант ограничений
в противоположные стороны. Условия первого порядка
dL
дх**
dF 5g л g.
5х—У сбудут иметь нетривиальное решение относи-
тельно множителей Лагранжа. При этом те множители Лагранжа,
которые соответствуют ограничениям-неравенствам, определяющим
выступ, принимают положительные значения; все другие, вклю-
чая у0, равны нулю, а условия первого порядка выполняются как
равенства.
110
- 3 db
(4.4.1)
Для доказательства следует сначала показать, что х*
и у* можно представить в виде функций от констант-огра-
ничений, а затем продифференцировать функцию Лагран-
жа по этим константам аналогично тому, как это было
сделано в разделе 3.3.
Условия Куна — Таккера можно было бы записать
в виде равенств, если бы было известно, какие именно
ограничения выполняются как равенства, а какие как
неравенства, а также и то, какие именно переменные равны
нулю и какие положительны. Допустим, что эти соотно-
шения и переменные перенумерованы так, что в точке
оптимума первые mi из них выполняются как равенства,
а остальные т — mi как неравенства (Q^mi^m)
и что первые щ переменных положительны, а остальные
п — П[ равны нулю (O^nt^n). Векторы можно расчле-
нить следующим образом:
/g1(x)\ /Ь1\ /хЧ
g(x)= \g2(x)/’ ь= W’ У = (У1У2)’ х= (х2/
(4.4.2)
где g1 (х), Ь1 и у1 состоят из первых элементов векторов
g (х), Ь и у соответственно, ах1 — из первых тц элементов
х. Тогда условия Куна — Таккера можно записать как
dL 9F . . . ЗЛ . , л
5хГ= Зхг(х)~У 'а5г(х)==®
х2 = 0
^-Ь>-вЧх)-0
у2 = 0.
(4.4.3)
Очевидно, что (4.4.1) выполняется для последних т — mi,
множителей Лагранжа, равных нулю; следовательно,
у*=-^- = 0, i = mi + l, mi-I-2, ...,m. (4.4.4)
Последние т — mt ограничений выполняются как нера-
венства, так что малые изменения соответствующих
констант ограничений не могли бы изменить оптималь-
ного значения целевой функции. Что касается первых mi
множителей Лагранжа, то заметим, что задача приведена
Ш
к форме классической задачи математического програм-
мирования: найти
maxF(x1, 0)
х1 (4.4.5)
при условии, что g1(x1, 0)==Ь1.
На том же основании, что в разделе 3.3, оказывается
возможным представить х1 и у1 как функции от Ь1 и про-
дифференцировать функцию Лагранжа по Ь1. В резуль-
тате получим, что
= * = 1’2’ (4Л6)
В задаче (4.2.24), где у* = (60,0), при малом увеличении
константы первого ограничения до 1 + A6t оптимальное
значение возросло бы до 70 + 60 Afrj, тогда как малое
увеличение константы второго ограничения никак не
повлияло бы на оптимальное значение целевой функции,
поскольку это ограничение оказалось нежестким.
4.5. АЛГОРИТМЫ РЕШЕНИЯ
Хотя условия Куна — Таккера дают полную характе-
ристику решения, однако они не содержат конструктив-
ного метода отыскания решения. Например, условия
(4.2.26) описывают свойства решения задачи (4.2.24),
но не указывают, как найти это решение. Под алгорит-
мом решения понимают конструктивный метод, с помо-
щью которого можно найти численное решение. В настоя-
щей книге приведены схематические описания лишь не-
скольких из большого числа существующих алгоритмов
решения задач нелинейного программирования \ Алго-
ритмы решения обычно позволяют определить, как изме-
няются во времени инструментальные переменные, то
есть эти переменные отыскиваются в виде функций вре-
мени
X (/) = (Xi (f), х2 (t), ...,хп (t))'. (4.5.1)
Эти функции часто определяют с помощью дифферен-
циальных уравнений, дающих выражение для скорости
изменения переменных х (i)
1 Более полно алгоритмы решения рассматриваются в [14—17].
112
dxl W *2 W f *11(0)'
*W—\—dT~f ~dF-’1"’’ ~dt~ I ~
“CMOtMO* •••» ^n{t))’. (4.5.2)
Если значение вектора инструментальных переменных
в начальный момент
х (0) - {х, (0), х2 (0), . . ., хп (О))' (4.5.3)
является фиксированным, то решение дифференциаль-
ного уравнения сводится к решению задачи нелинейного
программирования
limx(/) = x*. (4.5.4)
Можно дать классификацию этих алгоритмов, основы-
ваясь на свойствах начальной точки х (0). Если началь-
ная точка не является допустимой, то дифференциальные
уравнения смещают ее в пределы допустимого множества,
а затем приводят к решению задачи. Этот подход к реше-
нию назовем выбором начальной точки без учета ограни-
чений. При другом подходе — выборе начальной точки
с учетом ограничений — начальная точка должна при-
надлежать допустимому множеству, а дифференциаль-
ные уравнения перемещают точку по линиям уровня, все
увеличивая значение функции и постепенно приводя
к решению.
Многие алгоритмы решения задач нелинейного про-
граммирования представляют собой градиентные методы.
Эти методы основаны на том, что градиент, т. е. вектор
. . / dF . . dF / . dF / \\ //к к\
состоящий из частных производных первого порядка
целевой функции, направлен в каждой точке в сторону
наибольшего роста целевой функции. Поэтому переме-
щение в направлении градиента приводит к наиболь-
шему увеличению целевой функции. Решая градиентным
методом задачу оптимизации при отсутствии ограниче-
ний, мы меняем каждую переменную в любой точке
в соответствии с величиной ее частной производной в этой
точке
^(0 = -^-(х(0)» (-4-5.6)
8-0270
113
Если предположить, что F (•) выпуклая функция, то
с помощью этого метода можно достичь точки максимума.
Для задачи оптимизации при наличии ограничений
необходимо модифицировать градиентный метод. При-
мером такого модифицированного градиентного метода
является градиентный проективный метод.
При этом методе решения выбор начальной точки осу-
ществляется с учетом ограничений, так что эта точка
должна быть допустимой. Перемещение точки происхо-
дит в направлении градиента, за исключением тех слу-
чаев, когда движение в этом направлении может вывести
за пределы допустимого множества. В последнем случае
точка смещается в направлении проекции градиента на
плоскость, касательную к границе. Перемещение по ука-
занному принципу не выводит точку из допустимого мно-
жества и постоянно увеличивает значение целевой функ-
ции, Если целевая функция вогнутая, а допустимое мно-
жество выпуклое, то указанное перемещение точки в кон-
це концов приводит к решению.
Другим примером градиентного метода в нелинейном
программировании является дифференциальный градиент-
ный метод, основанный на условиях Куна — Таккера для
функции Лагранжа. Выбор начальной точки в этом методе
осуществляется без учета ограничений. Дифференциаль-
ные уравнения для переменных х (t) и для множителей
Лагранжа у (/), рассматриваемых как функции времени,
имеют следующий вид
*7 (0 =
/"1, а,...
VI
Ш (0 = *
О, если Xj — Q (0, у (0) <0 )
т I
(х(0, у (0) = -g- (X (0) - У У1 (X (0) I
4=1 )
(в противном случае)
, п. (4.5.7)
0, если yt=O и (х(0, у(0)<О
—^-(х(0,у(0=-[Ь(-^(х(0)]
(в противном случае)
i = l, 2, ..., т.
Данный способ решения является градиентным методом,
так как скорость изменения каждой из переменных равна
114
соответствующей частной производной первого порядка
целевой функции, измененной на некоторую величину
Для учета наложенных ограничений. Условия неотрица-
тельности оказываются учтенными за счет того, что про-
цесс перемещения, начинающийся в точке с неотрицатель-
ными значениями переменных, не может вывести за пре-
делы неотрицательного ортанта. Условия, накладываемые
ограничениями-неравенствами, учтены в результате вы-
читания из частных производных первого порядка для
целевой функции линейных комбинаций элементов соот-
ветствующего столбца матрицы Якоби, построенной по
функциям ограничений. Взвешивающими коэффициентами
в этой линейной комбинации являются множители Лаг-
ранжа.
Множители Лагранжа также не могут стать отрица-
тельными числами, поскольку их начальные значения
неотрицательны и каждый отдельный множитель возра-
стает, если соответствующее ограничение не выполнено.
Результатом этих свойств множителей Лагранжа является
то, что они не позволяют вектору инструментальных
переменных выйти из допустимого множества. Данный
процесс сводится к решению, начиная с любой начальной
точки (х (0), у (0)) с неотрицательными координатами, если
целевая функция строго вогнута, а функции ограничений
строго выпуклы.
ЗАДАЧИ
4-А. Решите следующие задачи нелинейного програм-
мирования. Дайте геометрическую иллюстрацию реше-
ния.
Д. Найти
max 6xt — 2х, + 2x^2 — 2х|
«1. Х2
при условии, что
2. Найти
3xt + 4хг 6
— Xi + 4xJ 2
Xi 0, х2 0.
max 3xix2 — х|
XI. Х2
8* 415
При условии, ЧтО
2x1 "Ь 5х2 20
Xi — 2х2 = 5
Xi 0, х2 0.
3. Найти
max xi + 2х2
>1. ха
при условии, что
3xJ + х2 1
Xi — 8х2 —1
11 0, х2 0.
4-Б. Задача нелинейного программирования:
найти
шах рх\ + дх4х2
XI. «2
при условии, что
х* + гх* 1
Xi 0, х2 > 0
зависит от трех параметров: р, q, г.
1. Найти решение геометрически, если р = 0, q = г —
= 1.
2. Получить условия Куна — Таккера.
3. При каких значениях параметров решение суще-
ствует?
4-В. Одной из важных задач нелинейного программи-
рования является задача о распределении ограниченного
ресурса, суммарная величина которого равна Ъ, между п
различными целями:
найти
max Ft (xi) + Р2 (х2) + . . . + Fn (хп)
XI. »2. . . . . ХП
при условии, ЧТО
Х1 + х2 + . . . + хп < b
Xi 0, х2 0, . . хп 0.
41S
Получить условия дополняющей нежесткости и дать их
интерпретацию.
4-Г. Задача квадратического программирования:
найти
max F (х) — сх 4- v x'Dx
х z
при условии, что
Ах С Ь, х 0.
Здесь целевая функция является квадратической, а огра-
ничения — линейными. D — отрицательно определенная
матрица [18]. Определить условия Куна — Таккера.
4-Д. Покажите, что если ограничения имеют форму
равенств g (х) = Ь, то условия Куна — Таккера сводятся
к условиям оптимизации для классической задачи матема-
тического программирования.
4-Е. Как изменятся условия Куна — Таккера в сле-
дующих случаях:
1. Отсутствуют ограничения неотрицательности.
2. Не накладывается никаких ограничений, кроме
ограничений неотрицательности.
М 3. Переменные неотрицательны и ограничены
сверху.
4-Ж. Рассмотрите следующую задачу нелинейного
программирования: найти max х при условии, что ж2^0.
X
1. Решите эту задачу геометрически.
2. Покажите, что функция Лагранжа не имеет сед-
ловых точек. Какое из условий Куна — Таккера не
выполняется?
4-3. В задачах квазивыпуклого программирования
функция F (х) квазивогнута, а все функции gt (х) квази-
выпуклы [9].
1. Изобразите на схеме, подобной схеме на рис. 4.3,
задачу квазивыпуклого программирования, которая
не была бы задачей вогнутого программирования.
2. Докажите, что в квазивыпуклом программиро-
вании локальный максимум является глобальным
максимумом.
3. Докажите, что в квазивыпуклом программиро-
вании локальный максимум всегда единственный, если
F (х) строго квазивогнута.
117
4-И. Общую задачу нелинейного программирования
(4.0.1) можно представить в виде классической задачи
математического программирования, если ввести вспомо-
гательные переменные и вместо условий неотрицательно-
сти положить все переменные равными квадратам некото-
рых новых переменных.
Преобразовав задачу указанным способом, решим ее
методами гл. 3. Сопоставьте результаты с условиями
Куна — Таккера.
4-К. Предположим, что в общей задаче нелинейного
программирования (4.0.1) х — допустимый вектор, так
что g (х)^Ь, х 0. Ясно, что если в окрестности точки
существуют другие допустимые точки с большим значе-
нием целевой функции, то х не может быть локальным
максимумом. Если dx > 0 и dg = (dg/dx) (х) dx < 0, то
х + dx — это допустимая точка, принадлежащая окрест-
ности х. Следовательно, если существует направление
dx, удовлетворяющее этим условиям, такое, что dF —
= (dF/dx) (х) dx > 0, то х не может быть локальным мак-
симумом. Таким образом, для существования локального
максимума в х необходимо, чтобы система неравенств
-^-(х)\
£ I dx > 0, где dx > 0,
-Д-(х) /
дх ' '/
не имела решения. Покажите, что если выполнены условия
регулярности ограничений, то из этих неравенств можно
вывести условия Куна — Таккера. При доказательстве
используются свойства однородных систем линейных
неравенств, указанные в разделе Б.6 Приложения Б.
4-Л. Рассмотрим общую задачу нелинейного програм-
мирования (4.0.1) с дополнительным ограничением, со-
стоящим в том, что целевая функция не превосходит неко-
торого значения: F(x)^.a. Определить условия Куна —
Таккера в этой задаче; дать интерпретацию множителя Ла-
гранжа, соответствующего дополнительному ограничению.
4-М. Пусть в задаче метода наименьших квадратов
(см. задачу 3-0 из гл. 3) некоторые коэффициенты должны
быть неотрицательными. Сформулируйте задачу нели-
нейного программирования и найдите условия Куна —
Таккера для этого случая.
118
4.Н. На квадратном участке земли строится N домов.
Расположить дома так, чтобы минимальное расстояние
между центрами любых двух из них было наибольшим.
4-0. Показать графически, что градиентный проек-
тивный метод не позволяет найти глобальный максимум,
если целевая функция не вогнута или допустимое множе-
ство не выпукло.
4-П. Показать, что если при решении по дифферен-
циальному градиентному методу достигнута точка, удов-
летворяющая условиям Куна — Таккера, то из дифферен-
циальных уравнений следует, что переменные больше
не изменяются = 0 при любом J; уг=0 при лю-
бом г).
4-Р. В задаче векторной максимизации рассматри-
вается несколько целевых функций (х), F2 (х), . . .
. . ., Fq (х). Вектор называется эффективным, если он
является допустимым и если не существует других допу-
стимых векторов х**, таких, что
Fh (х**) > Fh (х*) при всех & \ ь = 4 о а
(х**) > Fh (х*) при некотором к ) ’ ’ ’ ’
Иными словами, никакой другой вектор не может увели-
чивать значений некоторых целевых функций, не умень-
шая при этом значений хотя бы одной из оставшихся целе-
вых функций !.
1. Пусть в задаче имеются две целевые функции
и пусть х* является решением следующей задачи ска-
лярной оптимизации;
райти
max а^\ (х) -f- a 2F2 (х)
X )
при условии, ЧТО X £ X,
где и а2 — положительные параметры (можно счи-
тать, что + а2 = 1). Доказать, что в этом случае
вектор х* эффективный. Дайте геометрическую иллю-
страцию на плоскости (х), F2 (х).
2. Покажите, что множество всех решений указан.-
ной задачи скалярной максимизации при некоторых
1 [1, 19, 20] Понятие эффективности является центральным
понятием в современной теории экономики благосостояния, в кото-
рой оно обычно называется «оптимальность по Парето». См» гл. 10
данной ^книги.
119
положительных значениях параметров не включает
в общем случае всех эффективных точек. Верно ли
это, если fi (х) и F2 (х) вогнутые, а X выпуклое?
Рассмотрите случай, когда at (или а2) может обращаться
в нуль.
4-С. В качестве примера задачи векторной максими-
зации рассмотрим задачу о выборе портфеля ценных бумаг
[2И. Задача состоит в определении набора х — (xt,
х2, . . ., хп)', где х}— доля активов инвестора, вложенных
в ценные бумаги, имеющие номер j;
7 = 1, 2, ..., п; х^О; 2 Х} = 1.
7=1
Цели вкладчика капитала Можно определить с помощью
терминов «доход» и «риск». Доход измеряется как линей-
ная форма от среднего дохода по каждому виду бумаг
М (х) = ц (х) = 3 UjXj,
7=1
‘где р. — вектор средних доходов от каждого вида ценных
бумаг. Риск измеряется как квадратичная форма
V (х) = X' 2х = S 3 OjkXjXk,
7=1 k=i
Где 3 — заданная квадратная матрица дисперсий и кова-
риаций доходов размерности п х п. Эта матрица счи-
тается положительно определенной. Данный набор цен-
ных бумаг считается эффективным, если не существует
наборов с большим доходом и с меньшим риском, с боль-
шим доходом при том же риске или с меньшим риском при
том же уровне дохода.
1. Покажите, что в задаче максимизации дохода:
найти
max М (х)
X
при условии, что F(x)^V, х 0, 1х=1,
где V — максимальный риск, можно указать эффек-
тивный набор ценных бумаг и что множество реше-
ний этой задачи при всех V 0 содержит все эффек-
ft
тивные наборы. Каковы в этой задаче условия Куна —
Таккера?
2t Покажите, что задача найти
min V (х)
X
при условии, что М (х) М, X 0, 1х = 1,
где М — минимальный доход, имеет решение, являю-
щееся эффективным набором бумаг. Каковы здесь
условия Куна — Таккера?
3. Имеются два вида ценных бумаг: один со сред-
ним доходом в 20% и дисперсией, равной 5, другой —
со средним доходом в 50% и дисперсией, равной 15,
ковариация их составляет 5. На (М (х), V (х)) плоско-
сти найти геометрическое место точек, соответствующих
эффективным наборам. Покажите, как влияет на реше-
ние изменение ковариации. Для этого найдите геоме-
трические места точек решения, полагая ковариацию
равной —8, —2, 0, 3 и оставляя неизменными все
остальные параметры.
Глава 5
Линейное программирование
Задача линейного программирования — это задача вы-
бора таких неотрицательных значений некоторых пере-
менных, подчиненных системе ограничений в форме линей-
ных неравенств, при которых достигается максимум или
минимум данной линейной функции Ч
В обозначениях раздела 2.1 задача линейного про-
граммирования на максимум состоит в следующем:
требуется найти
max F (х) = сх (5.0.1)
при условии, что Ах Ь, х 0,
или в развернутом виде найти
max F (xi, х2, ..., хп) = + с2х2 + ... + спхп
«1. х2,..., Хп
при условии, ЧТО
а11х1 4" в12®2 4" • • • 4" Я1ПХП
a2lXi 4* а22?2 4* • • • 4* b2
(5.0.2)
^mi^i 4" ®m2®2 4" • • • 4"
Xi 0, > 0, . . xn 0.
Эта задача является частным случаем задачи нелинейного
программирования (4.0.1), в которой целевая функция
и функции ограничений нелинейны.
Величины х1} х2, . . ., хп — составляющие п-мерного
вектора-столбца х — представляют собой инструменталь-
1 Основная литература по линейному программированию:
Гейл [1], Хедли [2], Данциг [3], Гасс [4], Симонар [5].
122
ные переменные. Используемые в этой задаче константы
состоят из постоянных коэффициентов йц, а12, . .
а21> а22, • • ч а2п? • • •> amlt am2i • • •> атт ВХОДЯ-
ЩИХ в матрицу А размерности т х п, т констант огра-
ничений Ь}, Ь2, . . Ьт, являющихся компонентами
вектора-столбца Ь, и из п постоянных коэффициентов
целевой функции с1г с2, . . сп, являющихся компонен-
тами вектора-строки с. Предположим, что тип — конеч-
ные числа, матрица А и векторы Ь и с состоят из фикси-
рованных вещественных чисел, ах — любой веществен-
ный вектор, удовлетворяющий т + п ограничениям 1 * * * * * * *
из (5.0.1).
Как и в предыдущей главе, каждое из п ограничений
неотрицательности
xs 0, 7 = 1, 2, . . ., п (5.0.3)
определяет некоторое замкнутое полупространство, а
пересечение всех таких полупространств представляет
собой неотрицательный ортант n-мерного евклидова про-
странства^”. Каждое из т ограничений-неравенств
3 atjxj^bi, i~ 1, 2, ..., m (5.0.4)
5=1
также определяет замкнутое полупространство в Еп, а
именно множество точек, либо принадлежащих гипер-
плоскости
(х'е^”| 3 ai}x} = bt], (5.0.5)
5=1
либо расположенных по одну сторону от этой гиперплос-
кости. Например, в Е9 такое множество составляют все
точки, лежащие ниже некоторой плоскости или при-
надлежащие этой плоскости. В общем случае пересечение
1 Задача, в которой число переменных пли число ограничений
бесконечно, называется задачей бесконечномерного линейного про-
граммирования (см. работу Даффина [6]).
Если А, Ь или с содержат случайные элементы, то задача отно-
сится к числу задач стохастического линейного программирования,
рассмотренных в работах Чарнса и Купера [7], Маданского [8, 9]
и Данцига [3].
Если одна или несколько независимых переменных могут при-)
нимать только целочисленные значения, то приходим к задаче цело-
численного линейного программирования. См. работы Данцига (10,3]^
Балийского [11] и Симонара [5].
123
замкнутых полупространств из Еп представляет собой
выпуклое многогранное множество, или выпуклый много-
гранник, если это множество ограничено. Таким образом,
допустимое множество, то есть множество всех инстру-
ментальных векторов, удовлетворяющих т + п огра-
ничениям неотрицательности и ограничениям-неравен-
ствам из (5.0.2),
X = {х 6 Еп | Ах < Ь, х > 0} (5.0.6)
представляет собой замкнутое выпуклое многогранное
множество, расположенное в неотрицательном ортанте
n-мерного евклидова пространства. На рис. 2.5 и
5.1 представлены примеры допустимых множеств в
и в Е3.
Рис. 5.1. Допустимое множество задачи линейного программи-
рования при п = 3, т = 4.
Граничные гиперплоскости называются гранями, а
точки, в которых пересекаются п или больше граней,
называются вершинами. Каждая грань состоит из всех
таких точек, в которых одно из неравенств или ограни-
чений неотрицательности выполняется как равенство,
а каждая вершина представляет собой точку, в которой п
или более ограничений-неравенств выполняются как
равенства. Многогранник на рис. 5.1 имеет 7 граней
И 9 вершин. В восьми иа этих вершин пересекаются по
три грани, а в одной — четыре грани. Вершины связа-
ны ребрами, в каждом из которых пересекаются по две
грани.
Поверхность уровня целевой функции
{х £ Еп | сх = const} (5.0.7)
представляет собой гиперплоскость в Еп. Если придавать
константе в (5.0.7) различные значения, то получим семей-
ство параллельных гиперплоскостей. Примером такого
семейства являются параллельные прямые на рис. 2.5.
Направление наискорейшего роста задается градиентом
^ = с, (5.0.8)
т. е. вектором-строкой из Еп, ортогональным к поверх-
ности уровня. С геометрической точки зрения задача
линейного программирования состоит в отыскании точки
(или множества точек) в Еп, принадлежащей допустимому
Выпуклому многогранному множеству, в которой дости-
гается поверхность наибольшего уровня. Из геометри-
ческих представлений ясно, что если решение существует,
то оно не может быть внутренней точкой, а должно при-
надлежать границе допустимого множества. Следовательно,
решением может являться точка, принадлежащая одной
или нескольким граням, или, что эквивалентно, реше-
нием является одна вершина или несколько вершин и все
точки, лежащие между этими вершинами, т. е. все выпук-
лые линейные комбинации этих вершин. Решение дости-
гается в той точке (в тех точках), где поверхность уровня
представляет собой опорную гиперплоскость данного
выпуклого многогранного допустимого множества. На
рис. 2.5 даны иллюстрации двух случаев: когда решение
достигается в одной вершине и является единственным
и когда решение достигается в двух вершинах (на всей
грани), т. е. когда решение неединственно. В последнем
случае угол наклона параллельных линий уровня рав-
няется углу наклона наивысшей граничной гиперпло-
скости — в данном случае прямой в Е2. Решение
достигается в двух вершинах и во всех точках прямоф
соединяющей эти вершины. В трехмерном пространстве
решением может быть точка вершины (пересечение трех
425
или больше граней), отрезок прямой (пересечение двух
граней) или часть некоторой плоскости (грань). Хотя
решение может быть неединственным, максимальное зна-
чение целевой функции единственно. Так как допустимое
множество выпукло, а целевая функция линейна, то
по теореме о достаточных условиях существования мак-
симума из раздела 2.2 локальный максимум является
глобальным. Следовательно, если в вершине допустимого
множества целевая функция принимает значение боль-
шее (большее или равное), чем во всех соседних вершинах,
то данная вершина является решением задачи. На этом
важном свойстве основан алгоритм симплекс-метода, кото-
рый будет рассматриваться ниже. Кроме того, если п > т,
то решение непременно достигается в такой вершине
допустимого множества, в которой по меньшей мере
п — т переменных равны нулю. Иначе говоря, хотя бы
одна из точек решения имеет по крайней мере столько
ненулевых координат, сколько ограничений-неравенств
входит в формулировку задачи.
Так как целевая функция непрерывна, а допустимое
множество замкнуто, то по теореме Вейерштрасса (см.
раздел 2.2) решение существует в том случае, если допу-
стимое множество непусто и ограничено. Следовательно,
возможны два случая, когда задача линейного програм-
мирования не может иметь решения. Первый: ограниче-
ния являются несовместными, так что допустимое мно-
жество пусто. Например, ограничение х&^.— 6 противо-
речит неотрицательности и, следовательно, не существует
точки, удовлетворяющей этим двум ограничениям. Другой
пример: неравенства Xi + 2х2 ^6 и —Xi — х2^— 8 не
имеют общих точек в неотрицательном ортанте.
Вторым случаем, когда задача не может иметь реше-
ния, является неограниченность допустимого множества.
В этом случае целевая функция может неограниченно
возрастать. Примером может служить задача максимиза-
ции функции Xi + х2 при условии, что —Xi — x2^Z— 8,
Xi О, х2 0. На рис. 5.2 приведены еще два примера
задач линейного программирования, не имеющих реше-
ния. Здесь точки допустимого множества отмечены штри-
ховкой.
Если допустимое множество непусто и ограничено, то
решение существует и достигается в граничной точке.
Решение существует и в более общем случае, когда допу-
126
Пустое
Эопустимое
множество
х2
Неограниченное
Зопустимое
множество
Направление
наискорейшего
Линии уровня
Рис. 5.2. Два случая, при которых задача линейного программи-
рования не имеет решения.
стимое множество непусто, а целевая функция ограни-
чена.
Итак, задача линейного программирования либо имеет
единственное решение (в вершине), либо бесконечное
множество решений, либо не имеет решений (если допу-
стимое множество пусто или не ограничено) х.
5.1. ДВОЙСТВЕННЫЕ ЗАДАЧИ ЛИНЕЙНОГО
ПРОГРАММИРОВАНИЯ
В теории линейного программирования чрезвычайно
важную роль играет то обстоятельство, что каждой задаче
линейного программирования соответствует некоторая
двойственная задача. Если исходная задача линейного
1 Отметим, что такие же три возможности существуют и при ре-
шении уравнения с одним неизвестным ах = Ь. Если а #= О,
то существует единственное решение; если а = Ь = 0, то реви-
ний бесконечно много; если а = 0,но Ъ #= 0, то задача не имеет ре-
шений.
127
программирования, называемая прямой задачей, является
задачей на максимум типа (4.0.1):
найти
max F=cx (5.1.1)
X
при условии, что Ах = Ь, х 0,
то двойственная задача представляет собой задачу на мини-
мум: найти
minG = yb (5.1.2)
у
при условии, что уА с, у 0.
Здесь у есть вектор-строка
У = (У1, Уг, • • •, Ут)- (5.1.3)
Запишем двойственную задачу линейного программиро-
вания в развернутом виде: найти
min G(yt, yz, ..., ут) = biyt ф- Ьгу2 + .. • + Ътут
Vl, V2, ... Ут
при условии, ЧТО
011У1 + «21У2 + . . . + ат1ут Ci
Я12У1 + йггУг + • • • + ^тгУт с2
: : ' (5.1.4)
«1пУ1 + «2пУ2 + • • • + йтпУт сп
У1>0, Уг > о, . . ., ут > 0.
Сопоставим задачи (5.0.2) и (5.1.4). Общим для этих задач
является то, что в каждой из них отыскивается экстремум
линейной функции при условии, что переменные неотри-
цательны и удовлетворяют системе линейных неравенств.
В обеих задачах используются одни и те же параметры,
а именно матрица А, вектор-столбец Ь и вектор-строка с.
Число ограничений-неравенств в этих задачах равно
т + п; каждая из задач имеет геометрическую интерпре-
тацию.
С другой стороны, в прямой задаче определяются зна-
чения п переменных — компонент вектора-столбца х,
а в двойственной задаче — т переменных, являющихся
компонентами вектора-строки у; в исходной задаче опре-
деляется максимум, а в двойственной — минимум; знаки
неравенств в этих задачах различны; константы ограни-
128
Х| х2
а11 а12 ’ * * а1п fy
а21 а22' ' ’ а2п Ь2
i . . .
amf am2‘ * amn
Cf C2 • • • cn 0
<0
= F (найти
максимум
>0 = G (найти минимум^
Рис. 5.3. Таблица для двойственных задач линейного програм-
мирования.
пений одной из задач являются коэффициентами целевой
функции другой. Если применить к двойственной задаче
те же преобразования, какие были сделаны для прямой
задачи, то мы вновь придем к исходной задаче, то есть
задача, двойственная к двойственной задаче, представляет
собой исходную задачу. Следовательно, ни одна из этих
задач не может считаться основной, так как если поставле-
на одна из задач, то другая может быть сформулирована
как двойственная и каждая из них является двойственной
по отношению к другой.
На рис. 5.3 двойственные задачи линейного програм-
мирования представлены в виде таблицы. Прочитаем эту
таблицу слева направо, умножая элементы, стоящие
внутри клетки, на соответствующие переменные из верхней
строки и складывая эти произведения. В результате полу-
чим задачу максимизации. Читая сверху вниз и умножая
элементы, стоящие внутри клетки, на соответствующие
переменные из левого столбца и складывая эти произве-
дения, приходим к задаче минимизации. Нулевой элемент
в нижнем правом углу таблицы можно в принципе заме-
нить любой другой константой, вычитаемой из обей*
целевых функций.
В—0270
129
5.2. МЕТОД МНОЖИТЕЛЕЙ ЛАГРАНЖА; ТЕОРЕМА
ДВОЙСТВЕННОСТИ И ТЕОРЕМА О
ДОПОЛНЯЮЩЕЙ НЕЖЕСТКОСТИ
Метод множителей Лагранжа позволяет проанализи-
ровать основные свойства двойственных задач, поскольку
двойственные переменные можно считать множителями
Лагранжа для прямой задачи. Рассмотрим задачу
максимизации: найти
maxF = cx при условии, что Axj^b, х 0, (5.2.1)
X
как прямую задачу линейного программирования. Пусть
функция Лагранжа определена следующим образом:
L (х, у) = сх + у (Ь — Ах) = сх + yb — уАх. (5.2.2)
Тогда, согласно теореме Куна — Таккера из предыдущей
главы, х * будет решение задачи (5.2.1), если существует
вектор-строка у * такой, что в (х *, у *) выполняются
условия Куна — Таккера, имеющие вид
4г^с-уАС0
•^х=(с-уА)х=0
х>0 (5.2.3)
4^ = Ь-Ах>0
ду
у4г = у(ь~Ах)=0
у>0.
Пусть теперь в качестве прямой задачи рассматри-
вается задача минимизации: найти
minG = yb (5.2.4)
у
при условии, что уА с, у 0.
Определим функцию Лагранжа как
L (у, х) == yb + (с — уА) х = yb + сх — уАх. (5.2.5)
Тогда из теоремы Куна — Таккера следует, что у * будет
решением, если существует вектор-столбец х *, такой,
130
что в (х *, у *) выполняются условия Куна —- Танкера,
имеющие вид
~ = Ь —Ах>0
у4гвУ<Ь-Ах)=в0
у>0 (5.2.6)
4г = (с-УА)С0
1Гх = (с — уА)х = 0
х 0.
Таким образом, функции Лагранжа и условия Куна — Та-
нкера цобеих задачах в точности одни и те же. На приведен-
ных выше условиях базируются основные теоремы ли-
нейного программирования.
Первой основной теоремой является теорема сущест-
вования: для того чтобы задача линейного программирова-
ния имела решение, необходимо и достаточно, чтобы
допустимые множества как прямой, так и двойственной
задач были непусты.
Для доказательства того, что в обеих задачах сущест-
вуют допустимые векторы, рассмотрим ограничения-нера-
венства в двойственных задачах
Ах < Ь
уА > с.
(5.2.7)
(5.2.8)
Так как вектор у неотрицателен, то
уАх < yb = G (у),
и так как вектор х неотрицателен, то
F (х) = сх уАх.
(5.2.9)
(5.2.10)
Следовательно, если х и у есть допустимые векторы, то
F(x)<G(y), (5.2.11)
т. е. значения целевой функции в задаче максимизации
не превосходят значений целевой функции в двойствен-
ной задаче минимизации.
Предположим, что в каждой из этих задач существуют
допустимые векторы х° и у0. Допустимое множество
9* 131
Прямой задачи содержит вектор х° и, следовательно,
непусто. Целевая функция в прямой задаче ограничена,
так как для любого допустимого вектора х
F (x)<G (у0).
(5.2.12)
Следовательно, прямая задача имеет решение. Так как
при любом допустимом векторе у
F(x°)<G(y), (5.2.13)
то целевая функция в двойственной задаче ограничена
снизу. А так как допустимое множество в этой задаче
содержит вектор, то и двойственная задача имеет реше-
ние.
Покажем теперь, что если решение задачи линейного
программирования существует, то допустимые множества
как прямой, так и двойственной задач непусты.
Пусть х * является решением задачи максимизации.
Тогда очевидно, что прямая задача имеет хотя бы один
допустимый вектор, а именно вектор х *. Известно, что
целевая функция вогнута, а функции ограничений выпук-
лы (линейная функция является одновременно и выпук-
лой и вогнутой) и что выполняются условия регулярности
ограничений. Поэтому если х * является решением задачи
максимизации, то, согласно теореме Куна — Таккера
(см. раздел 4.3), существует вектор у *, удовлетворяющий
условиям (5.2.3). Следовательно,
у*А > с, у* > 0, (5.2.14)
так что у* есть допустимый вектор. Теорема доказана.
Итак, решение существует тогда, и только тогда,
когда каждая из двойственных задач имеет допустимые
векторы. Если допустимое множество одной из задач
пусто, то тогда либо допустимое множество двойственной
задачи пусто, либо ее целевая функция не ограничена.
Вообще любые две двойственные задачи либо имеют
допустимые векторы и, следовательно, по теореме существо-
вания обладают решениями, либо лишь одна из двойствен-
ных задач имеет допустимый вектор, причем ее целевая
функция не ограничена, либо ни одна из двойственных
задач не имеет допустимых векторов. Эти три случая
представлены на рис. 5.4.
Вторая основная теорема линейного программирова-
ния — это теорема двойственности: некоторый допусти-
132
Рис. 5.4/ Альтернативные варианты, возникающие при решении
/ задач линейного программирования.
I — Существуют допустимые векторы и для прямой
и для двойственной задачи.
II — Допустимый вектор существует в прямой задаче;
двойственная задача не обладает допустимым
вектором.
III — Ни прямая, ни двойственная задача не имеют
допустимых векторов.
IV — Существует решение прямой задачи.
V — Целевая функция прямой задачи неограничеиа.
VI — Допустимое множество прямой задачи пусто.
VII — Единственное решение.
VIII — Не единственное решение.
IX — Нет решений.
мый вектор тогда, и только тогда, является решением
задачи линейного программирования, когда существует
такой допустимый вектор двойственной задачи, что значения
целевых функций обеих задач на этих векторах равны.
Докажем сначала, что если х * — решение задачи
максимизации, то существует у * — допустимый вектор
двойственной задачи, такой, что значения целевых функ-
ций на этих векторах равны. Рассмотрим условия Куна —
Таккера (5.2.3). Если вектор у * удовлетворяет этим усло-
виям, то, согласно (5.2.14),
у*А с,
У1
(5.2.15)
> о,
т. е. этот вектор будет допустимым. Кроме того, из
(с — у*А) х* = О
у* (Ь — Ах*) = О
(5.2.16}
133
следует, что
F (х*) =* сх* = у*Ах* = y*b = G (у*), (5.2.17)
т. е. значения целевых функций совпадают, Для того
чтобы доказать эту часть теоремы в случае, когда прямой
задачей является задача минимизации, достаточно про-
вести аналогичные рассуждения, используя условия (5.2.6).
Покажем теперь, что если существуют такие допусти-
мые векторы х * и у *, в которых значения целевых функ-
ций совпадают, т. е.
F (х*) = сх* = y*b = G (у*), (5.2.18)
то эти векторы являются решениями соответствующих
двойственных задач. Так как х и у — допустимые векторы,
то из (5.2.11) следует, что
F(x)<G(y), (5.2.19)
а поскольку у* — допустимый вектор, то
F (х) < G (у*). (5.2.20)
Следовательно, при всех допустимых х
F(x)<F(x*) (5.2.21)
(см. 5.2.18), а это означает, что х* представляет собой
решение задачи максимизации.
Аналогично при всех допустимых у
[G(y*)CG(y). (5.2.22)
Теорема доказана. Итак, допустимый вектор х * является
решением задачи максимизации тогда, и только тогда,
когда существует такой допустимый вектор у* для двойст-
венной задачи, при котором выполняется равенство
(5.2.18). В частности,
fF (x)<F (х*) = G (y*)<G (у). (5.2.23)
Поскольку F не превосходит G, то, решая задачу макси-
мизации функции F относительно х и задачу минимизации
функции G относительно у, мы повышаем уровень зна-
чений F и снижаем уровень значений G до тех пор, пока
они не станут равными в точке решения.
134
Третьей основной теоремой линейного программирова-
ния является теорема о дополняющей нежесткости х: для
того чтобы допустимые векторы х *, у * являлись реше-
ниями двойственных задач, необходимо и достаточно,
чтобы они удовлетворяли условиям дополняющей не-
жесткости, т. е.
(с — у*А) х* = О
у* (Ь — Ах*) = 0.
(5.2.24)
Необходимость следует непосредственно из условий
Куна — Таккера. Достаточность следует из теоремы двой-
ственности. Действительно, предположим, что х *, у * —
допустимые векторы. Тогда из условий дополняющей
нежесткости вытекает, что
F (х*) = сх* = у*Ах* = y*b = G (у*). (5.2.25)
Следовательно, х * и у * являются искомыми решениями.
Выпишем условия дополняющей нежесткости в развер-
нутом виде. Они приводят к равенствам:
(су — 3 ацУ*) х* = 0, / = 1, 2, ...,п
<=1 „ (5-2.26)
yf(bi— 2 aijXj) =0, i= 1, 2, ..., m.
j=i
Сопоставив эти выражения с ограничениями в прямой
и в двойственной задачах, получим:
ТП
xf = O, если
i=l
т т
3 ацуГ^С], но S dtjyt=c}, если х?>0
i=l i=»l
., п
у?^0, но у* = 0, если 2 ацх$ <bt
7=1
п п
S atjxj^bi, но У atjX* = bi, если у* >0
j=i j=i
>7 = 1,2,
*г=1,2,.. .,т.
(5.2.27)
1 В советской литературе по линейному программированию
указанную теорему обычно называют второй теоремой двойствен-
ности. — Прим, пере в.
135
Следовательно, если в оптимальной точке некоторое огра-
ничение выполняется как строгое неравенство, то соответ-
ствующая двойственная переменная равна нулю, а если
в этой точке некоторая переменная принимает положи-
тельное значение, то соответствующее ограничение-нера-
венство в двойственной задаче выполняется как равен-
ство. Из решения двойственной задачи видно, какие
переменные прямой задачи обращаются в оптимальной
точке в нуль и какие из ограничений-неравенств в этой
точке выполняются как равенства.
Используя вспомогательные переменные, можно, как
и в предыдущей главе, дать геометрическую интерпрета-
цию решений двойственных задач. По теореме о допол-
няющей нежесткости векторы х * и у * являются решения-
ми двойственных задач максимизации и минимизации
тогда, и только тогда, когда
Ах* Ь, х* 0, у* (Ь — Ах*) = О
у*А с, у* 0, (с — у*А) х* =я 0. (5-2.28)
Введем в задаче максимизации вектор-столбец вспомо-
гательных переменных s = (slt s2, ..., sm)’,' а в задаче
минимизации — вектор-строку г =(rlt г2, ..., гп). Теперь
условия (5.2.28) можно преобразовать к виду
Ах* + s* = Ь, х* 0, s* 0, y*s* = О
у*А = с + г*, у* 0, г* 0, г*х* = 0. (5-2.29)
Здесь неотрицательность вспомогательных переменных
обеспечивает выполнение ограничений-неравенств в обеих
задачах, а обращение в нуль суммы произведений вспомо-
гательных переменных и двойственных переменных обеспе-
чивает выполнение условий дополняющей нежесткости.
Рассмотрим теперь геометрическую интерпретацию усло-
вий (5.2.29). Условия, что вектору * является допустимым
в задаче минимизации, можно представить в виде
с = у* А + г* (—1), у* 0, г* 0, (5.2.30)
где I — единичная матрица.
Эти условия показывают, что вектор с представляет
собой линейную комбинацию строк матрицы коэффициен-
тов и единичной матрицы, умноженной на — 1. Однако
вектор с является градиентом целевой функции в задаче
136
«2 У2
NN NN
Задача максимизации Задача минимизации
С (линия уровня)
Р (направление наискорейшего роста)
N (нормаль)
Рис. 5.5. Геометрическое изображение двойственных задач при
т = п = 2.
максимизации, и, следовательно, он определяет направле-
ние наискорейшего роста функции. Строки матрицы коэф-
фициентов и строки единичной матрицы, умноженной на
— 1, представляют собой соответственно векторы градиен-
тов функций, входящих в ограничения-неравенства и в
ограничения неотрицательности. Таким образом, строки
этих матриц определяют координаты векторов, нормаль-
ных к граничным поверхностям допустимого мно-
жества. Запишем условия того, что вектор х* является
допустимым в задаче максимизации, в следующем виде:
—b = (—А) х* + (-1) в*, х* > 0, s* > 0. (5.2.31)
Отсюда видно, что направление наискорейшего роста
в задаче минимизации (т. е. направление градиента функ-
ции Сг(у), взятого со знаком минус) представляет собой
неотрицательную линейную комбинацию нормалей, на-
правленных прочь от допустимого множества. Последние
Представляют собой столбцы матрицы коэффициентов
И столбцы единичной матрицы, взятые со знаком минус.
Рыражения (5.2.30) и (5.2.31) показывают, что в опти-
мальной точке каждой из задач направление наискорей-
пего роста должно находиться между нормалями, направ-
тенными прочь от допустимого множества. На рис. 5.5
•тот вывод проиллюстрирован на примере двойственных
137
задач, в которых т = п = 2. В каждой из этих задач
направление наискорейшего роста Р расположено между
нормалями, направленными прочь от допустимого мно-
жества.
Укажем, каков геометрический смысл остальных
условий из (5.2.29), т. е. условий дополняющей нежесткости
y*s* = о, г*х* = 0. (5.2.32)
Взвешивающий коэффициент нормали к некоторому огра-
ничению-неравенству (или ограничению неотрицательно-
сти) в линейных комбинациях (5.2.30) или (5.2.31) равен
нулю, если взвешивающий коэффициент нормали к соот-
ветствующему ограничению неотрицательности' (ограниче-
нию-неравенству) двойственной задачи положителен, т. е.
у* — 0, если s* >• 0; х? — 0, если г? >• 0
# ’ Л (5.2.33)
г* = 0, если х* >• 0; sj = 0, если у, >• 0,
где
i = 1, 2, . . ., т; j ~ 1, 2, . . ., п.
5.3. ИНТЕРПРЕТАЦИЯ ДВОЙСТВЕННЫХ
ПЕРЕМЕННЫХ И АНАЛИЗ
ЧУВСТВИТЕЛЬНОСТИ
Так как переменные в двойственной задаче являются
множителями Лагранжа, то, как и в разделе 4.4, их можно
считать показателями чувствительности оптимального
значения целевой функции к изменениям констант огра-
ничений. Такая интерпретация двойственных перемен-
ных непосредственно следует из результатов предыду-
щего параграфа.
Предположим, что в точке оптимума задачи максими-
зации (5.1.1) m-i ограничений-неравенств выполняются
как равенства, а остальные т — тщ ограничений выпол-
няются как строгие неравенства, в то время как в двой-
ственной задаче минимизации ограничений-неравенств
выполняются как равенства, а остальные п — пх — как
строгие неравенства. В этом случае ограничения-неравен-
ства всегда можно перенумеровать заново таким обра-
зом, чтобы первые mi ограничений в задаче максимизации
и первые щ ограничений в задаче минимизации выполня-
138
лись как равенства, при этом переменные в двойственной
задаче также должны быть перенумерованы соответствую-
щим образом. После этого матрицу коэффициентов и векто-
торы параметров можно расчленить следующим образом:
с = (сх с2)
/А11 А12\ /Ы\
А = I gi Ааа , Ь== I 2 , (5.3.1)
\А21 А22/ \Ь2/ ' ’
где с1 содержит щ элементов, Ь1 — тп^ элементов, а матрица
А11 состоит из тщщ элементов. Аналогично этому можно
расчленить и векторы переменных
/хП
х=\х2/г У = (УгУ2)’ (5-3-2)
где хВ * 1 содержит элементов, а у1 содержит mi элементов.
Согласно сделанным предположениям, в оптимальных
точках х * и у * двойственных задач выполняются следую-
щие соотношения:
Аихх* + А12х2* = Ь1
А21х1# + А22х2* < Ь2
у1*Аи + у2*А21 = с1 (5.3.3)
у1*Д12 _|_ у2*Д22 с».
В то же время, согласно свойствам исходных и вспомога-
тельных переменных, полученным в предыдущем разделе
(дополняющая нежесткость),
х1* '^г 0, х2* = О
у1* 0, у2* = 0. (5.3.4)
Следовательно, равенства (5.3.3) можно записать в виде
Auxx* = Ь1
у1*Ац = с1.
(5.3.5)
Если матрица А11 является невырожденной квадратной
матрицей, то каждая из двойственных задач будет иметь
единственное решение (в вершине допустимого множества).
Эти решения можно записать в явном виде, используя
+ щ параметров, входящих в А11, Ь1 и с1
х1* = (А11)-1 Ь1, х2* = 0
у1* = с1 (А11)-1, у2* = 0.
(5.3.6)
139
Соответствующие оптимальные значения целевых функций
совпадают по теореме двойственности и могут быть пред-
ставлены в виде функций от тех же щ пара-
метров
F (х*) = сххх* = с1 (А11)"1 Ь1 = у1*!)1 = G (у*). (5.3.7)
Проанализируем теперь, как изменения этих пара-
метров влияют на решения (5.3.6) и на значение F * = F (х *): оптимальное
^==с1(Ан)-1 = у1.; ^ = 0. (5.3.8)
Следовательно,
„ dF* (5.3.9)
Точно так же в двойственной задаче
^=(АП)-1ЬХ = Х1. ^_о. (5.3.10)
Следовательно,
. dG* дс (5.3.11)
Таким образом, чувствительность оптимального значе-
ния целевой функции к изменениям некоторой константы
ограничений измеряется значением, которое принимает
в оптимальной точке соответствующая переменная двой-
ственной задачи. Такая трактовка двойственных пере-
менных тождественна их интерпретации в более общем
случае задачи нелинейного программирования, данной
в разделе 4.4. Как уже отмечалось в разделе 3.3, в неко-
торых экономических задачах распределения ресурсов
двойственные переменные естественно рассматривать как
«вмененные цены», поскольку они выражают изменение
некоторого экономического показателя, имеющего денеж-
ную оценку (например, прибыли, выручки или затрат),
вызванное изменением некоторой хозяйственной вели-
чины, измеряемой в натуральных единицах. Такие цены
называют теневыми ценами г.
Если некоторая двойственная переменная равна нулю,
то оптимальное значение целевой функции не зависит от
соответствующей константы ограничений. Этот вывод доста-
1 В советской литературе теневые цены называют также услов-
ными оценками, или объективно обусловленными оценками. —
Прим, перев.
140
точно очевиден, так как если ограничение является не-
жестким, то малые изменения константы ограничения
не отразятся на решении задачи. Действительно, из
(5.3.6) следует, что
дх1*___
дЬ2 "
дх2*
О, = 0
’ дЬ2
ду1*
де2
= 0,
^ = 0
де2
(5.3.12)
Если в задачах распределения ресурсов некоторое огра-
ничение является нежестким, то это обычно означает,
что спрос строго меньше предложения, в результате
чего теневые цены (условные оценки) равны нулю. В этом
случае решение не зависит от общего объема возможного
предложения данного товара, так как имеющееся коли-
чество этого товара превышает ту потребность в нем,
которая соответствует его использованию в оптимальной
точке.
Если ограничение является жестким, то характерис-
тики чувствительности решения к изменениям констант
ограничений можно также получить, дифференцируя
(5.3.6):
^ = (А“Г
(5.3.13)
Следовательно, соответствующие элементы этих матриц
равны. Величины
(5.3.14)
являются характеристиками чувствительности оптималь-
ных значений целевых функций к изменениям констант
ограничений.
В заключение исследуем влияние изменений матрицы
коэффициентов. Очевидно, что элементы матрицы А,
не входящие в число элементов подматрицы А11, не влияют
на решение или на оптимальное значение. Дифференци-
141
руя (5.3.7), можно установить, какое влияние на опти-
мальное значение оказывает изменение элементов А11
S=-(A11)-1bV(AU)-1 = g.
Здесь матрица А представляет собой матрицу
ности mi X т±. Используя (5.3.6), получаем
д1<* и 1* 3G*
~ У ~ 5А« '
Следовательно,
dF* dG* < л ч п х
-g—, * = 1,2, 7 = 1,2, .
(5.3.17)
(5.3.15)
размер-
(5.3.16)
5.4. СИМПЛЕКС-МЕТОД
Задачи линейного программирования, в которых число
переменных или число ограничений-неравенств равно
двум или трем, можно решать графически.
Для того чтобы решить графическим способом задачу
линейного программирования в случае, когда число
переменных п равно двум или трем, следует изобразить
на схеме линии уровня, направления наискорейшего роста
и допустимое множество. Затем по чертежу определяется
точка (или точки), где линия (поверхность) наибольшего
уровня касается допустимого множества. Если число
ограничений-неравенств т равно двум или трем, то сна-
чала решаем графически двойственную задачу. Затем,
зная уже оптимальное значение целевой функции и зная,
какие ограничения-неравенства выполняются как равен-
ства, можно найти решение прямой задачи.
Симплексный алгоритм представляет собой алгебраи-
ческий метод, позволяющий найти решение задач линей-
ного программирования с помощью итеративной про-
цедуры х. По терминологии раздела 4.5 этот метод отно-
1 См. библиографию в прим, на стр. 122. Симплекс-метод впер-
вые был сформулирован в работе Данцига [12]. На этом методе или
на его модификациях основаны существующие в настоящее время
программы для электронно-вычислительных машин, позволяющие
решать задачи линейного программирования с числом ограничений
до нескольких тысяч. Само понятие «симплекс-метод» возникло в ре-
зультате ранних исследований, когда рассматривалась задача опти-
п
мизации на симплексе, то есть на множестве такого вида: 1,
xj > О, /=1,2,.. ., п.
142
сится к алгоритмам, в которых выбор начальной точки
осуществляется с учетом ограничений. В качестве первого
приближения можно брать любую вершину допустимого
множества (предполагается, что допустимое множество
непусто). Затем следует взять любую соседнюю вершину
по такому направлению, в котором целевая функция
возрастает, а затем новую вершину и т. д. Процесс закан-
чивается после того, как найдена такая вершина, что
при перемещении в любую соседнюю вершину целевая
функция не возрастает. Найденная вершина является
точкой глобального оптимума. Если перемещение в лю-
бую соседнюю вершину уменьшает целевую функцию, то
найденное решение единственно. Если же смещение в не-
которую другую вершину не уменьшает целевую функцию,
то решение не единственно и все такие вершины (а также
все точки, лежащие между ними) являются решениями.
Так как число вершин допустимого множества конечно,
то симплекс-метод либо приведет к решению задачи, либо
через конечное число шагов покажет, что целевая функция
не ограничена х.
Для того чтобы понять, как решать задачи с помощью
симплекс-метода, лучше всего разобрать какой-нибудь
простой пример. Рассмотрим следующую задачу линей-
ного программирования: найти
max F — 3rEf 2хг
при условии, что
2Ж1 4- ж2<6]
Xi 4- 2аг2<8
О, х2 0.
(5.4.1)
Эта задача, конечно, чрезвычайно простая, и ее можно
решить графическим способом, однако она весьма удобна
в качестве иллюстрации самого принципа, на котором
основан данный алгоритм.
Первым шагом при решении задачи с помощью симп-
лекс-метода является введение вспомогательных перемен-
1 Обычно при решении с помощью симплекс-метода не нужно
исследовать каждую вершину допустимого множества. Число таких
вершин даже в задачах небольшой размерности может быть чрезвы-
чайно велико.
143
вых с целью превратить неравенства в равенства. Вводя
две новые неотрицательные переменные st и s2, преобра-
зуем ограничения к виду
2xi + х2 4* = 6
xt + 2х2 + s2 = 8 (5.4.2)
Xi О, ж2 0, st 0, з2 0. |
На втором шаге определим допустимое базисное реше-
ние, т. е. некоторую вершину допустимого 'множества.
Для простоты в качестве такой вершины часто берут
начало координат, если оно принадлежит допустимому
множеству Ч Так как в данной задаче точка начала коор-
динат в Е2 принадлежит допустимому множеству, то при-
мем ее за допустимое базисное решение. В этой точке
Xi — 0, х2 = 0, Si = 6, з2 = 8; F = 0. (5.4.3)
Третий шаг. Запишем систему ограничений и целе-
вую функцию задачи относительно тех переменных, кото-
рые равны нулю в точке решения. Указанные перемен-
ные называются небазисными переменными. Так как в
нашем допустимом базисном решении небазисными пере-
менными являются xi и х2, то ограничения и целевая
функция имеют вид
$1 === 6 —* 2^1 — х2
sz — 8 — Xi — 2х2 (5.4.4)
F = 3ж1 + 2х2.
Четвертый шаг — переход к некоторой соседней вер-
шине. Для каждой из небазисных переменных в отдель-
ности определим, насколько можно увеличить эту пере-
менную (при соблюдении ограничений) и насколько при
этом возрастет целевая функция. Уравнения (5.4.4)
показывают, что небазисные переменные могут возрастать,
пока $1 и з2 остаются неотрицательными.
1 Если начало координат не является допустимой точкой, то
допустимое базисное решение можно получить с помощью метода
искусственных переменных: в каждой из левых частей ограничений
равенств вводится новая (искусственная) переменная и затем мини-
мизируется сумма этих искусственных переменных. Если минимум
этой суммы равен нулю, то соответствующая точка является допу-
стимым базисным решением.
144
Так как первое ограничение выполняется, пока xt
не превосходит 3, а второе — пока Хх не превосходит 8,
то максимально возможное увеличение Хх, удовлетворяю-
щее обоим ограничениям, равно 3. Целевая функция при
этом возрастает на 9. Максимально возможное увеличе-
ние х2 равно 4, при этом целевая функция возрастает на 8.
При перемещении в направлении наибольшего роста целе-
вой функции Хх увеличивается на 3, при этом sr становится
равной нулю, a s2 равно 5. Следовательно, небазисной
переменной вместо х{ становится (Можно было бы пере-
двинуться и в точку, где х2 = 4, s2 = 0, так как при этом
целевая функция также возрастает. При выборе направле-
ния перемещения вовсе не обязательно брать направле-
ние наибольшего роста целевой функции — достаточно
выбрать любое направление роста.) Получено новое
допустимое базисное решение
хх = 3, х2 = 0, sx = 0, s2 = 5; F — 9, (5.4.5)
где х2 и «1 — небазисные переменные.
Преобразование, сделанное на этом этапе, называется
ведущим преобразованием. Оно является основным преоб-
разованием при вычислениях по симплекс-методу. С по-
мощью этого преобразования определяются новые базис-
ные переменные, а целевая функция становится при этом
линейной функцией небазисных переменных.
Воспользуемся при дальнейшем изложении системой
обозначений, приведенной на рис. 5.3. Любое ведущее
преобразование, осуществляемое относительно некото-
рого ненулевого элемента а!7, состоит из двух шагов.
Первый шаг состоит в нормировании всех элементов веду-
щей строки г, для чего все элементы строки делятся на
ведущий элемент atj. Второй шаг: из всех строк вычи-
тается ведущая строка, умноженная на подходящие мно-
жители, с тем чтобы сделать нулевыми все элементы
ведущего столбца /, кроме самого ведущего элемента.
Таким образом, осуществление ведущего преобразования
относительно atj дает тот же результат, что и решение
i-ro уравнения относительно Xj с последующим использо-
ванием этого уравнения для исключения переменной х}
из всех остальных уравнений.
Запишем исходную таблицу рассматриваемого примера
(см. рис. 5.6). Возьмем в качестве ведущего элемента тот
элемент, который отмечен кружком. Осуществив ведущее
10-0270
145
Преобразование бтносителЬно бтого элемейТа, получим
таблицу на рис. 5.7, в последнем столбце которой стоят
значения базисных переменных. (Мы пока что не будем
обращать внимания на то обстоятельство, что элемент,
стоящий на пересечении второй строки и второго столбца,
обведен кружком.) В общем случае ведущий элемент
должен быть таким ненулевым элементом ai} (в данцом
случае а,ц = 2), которому в последней строке соответ-
ствует положительный элемент с, (здесь Cj = 3),«и, кроме
(2)1 1 0 12 0 1 6 8
3 2 0 0 0
Рис. 5.6.
0 — т-|см —|см I _]сч(га|^) V- О 3 5
О СО] СМ I —|<М О т | см I
Рис. 5.7.
того, элемент а1} должен быть таким, чтобы в последней
столбце преобразованной таблицы не было неотрицатель-
ных чисел (указанные числа равны 3 и 5).
Следующий этап решения нашего примера состоит
в том, что повторяется третий шаг симплекс-метода: огра-
ничения и целевая функция выражаются через небазис-
ные переменные
1 1
Ж1 = 3 — -2-^2— \ ®i
s2 = 8—^3 —ух2 —yst) — 2^ = 5 —(5.4.6)
F = 3 (З—ухг—+2х2 = 94-у^2—4S1‘
Отметим, что коэффициенты этих уравнений совпадают
с элементами соответствующих строк преобразованной
таблицы, приведенной выше.
Повторим теперь четвертый шаг симплекс-метода. При
этом х2 может возрасти не более чем на -5- (так как при
О
дальнейшем увеличении х2 переменная s2 становится
и Ю
отрицательной), что соответствует увеличению г на -g-
146
о — — О 1 ин сф> 1 СО|ГО 4 10 3
0 0-14 19 6
Рис. 5.8.
(рост значений другой небазисной переменной приводит
лишь к уменьшению целевой функции). Следовательно,
новое допустимое базисное решение таково:
Х1 = 4, = Si = 0, s2 = 0; F = (5.4.7)
и О и '
Здесь новыми небазисными переменными являются и s2.
Ведущее преобразование относительно отмеченного круж-
ком элемента предшествующей таблицы приводит к полу-
чению таблицы, изображенной на рис. 5.8.
Эта таблица позволяет построить уравнения, к которым
нужно вновь применить действия, предусмотренные
третьим шагом симплекс-метода. В результате приходим
к уравнениям
4 2,1
*2 = y+4s‘ + 4S2 (5.4.8)
р 32 4 1
F~ 3 3 s* jrS2,
Отсюда видно, что последнее допустимое базисное решение
является на самом деле решением задачи, так как коэф-
фициенты при всех переменных в целевой функции отри-
цательные и, следовательно, при увеличении любой неба-
зисной переменной целевая функция может только умень-
шиться. Этот вывод ясен и из рассмотрения последней
таблицы, так как все коэффициенты целевой функции
в ней либо отрицательны, либо равны нулю. Эта таблица
является оптимальной, так как все элементы ее послед-
ней строки неположительны, а все элементы последнего
столбца неотрицательны. Элементы последнего столбца
являются решением прямой задачи. Следовательно,
10* МТ
в результате применЁниф Лимплеце-метода получено следу-
ющее решение:
* 4
— з ,
Г 3 •
, 10
= т
(5.4.9)
Коэффициенты при вспомогательных переменных
в последнем выражении для целевой функции, являю-
щиеся ненулевыми элементами последней строки таблицы,
представляют собой оптимальные значения двойственных
переменных, взятые с обратным знаком. Действительно,
с помощью этих величин измеряют скорость, с которой
может происходить рост целевой функции в том случае,
если бы St и s2 стали отрицательными, т. е. если бы
увеличились коэффициенты bi и Ь2. Таким образом, реше-
ние двойственной задачи найти
min С = 6yi 4-8у2
VI, 1/2
при условии, что
2у1 + у2 > 3
У! + 2у2 > 2 (5.4.10)
У1 >0, у2^ 0,
Т2
Ji
10
Допустимое
, множество
Направление
наискорейшего роста
Третий и окончательное
базисное решение
0 5 10
Начальное Зопусти- Второе допустимое
мое базисное реше- базисное решение (3,0)
ние (0,0) 1
Рис. 5.9. Иллюстрация симплекс-метода.
Р и’с. 5.10. Основные этапы решения задачи с помощью симплекс—
метода.
имеет следующий вид:
G*=^.
о
Оптимальные значения двойственных
(5.4.11)
переменных
измеряют чувствительность оптимального значения целе-
149
вой функции F* к изменениям констант ограничений. Так,
например, если бы константа в первом ограничении пря-
мой задачи изменилась с 6 до 8, то оптимальное значение
целевой функции увеличилось бы на
AF* = pTA&=|(8-6) = | (5.4.12)
и новое оптимальное значение стало бы равным
32 , 8 40 /с ,
з + з=-з- <5-4-13)
На рис. 5.9 дана иллюстрация к решению с помощью
симплекс-метода: показано, как происходит перемещение
от вершины к вершине при поиске решения. Основные
этапы решения с помощью симплекс-метода приведены
в диаграмме на рис. 5.10.
ЗАДАЧИ
5-А. Рассмотрите задачу линейного программирова-
ния, зависящую от двух параметров р и q: найти
maxF (хи x2) = xi—z2
K1.K2
при условии, что
—Xi — х2^-—р, qxi + 10, Xi 0, х2 0.
1. Сформулируйте двойственную задачу.
2. При каких значениях р и q существует един-
ственное решение? При каких pviq решение не единственно?
3. При каких р и q допустимое множество пусто?
При каких р и q допустимое множество не ограничено?
5-Б. На рис. 5.11 представлено 4 логически возмож-
ных вида задач линейного программирования.
Допустимое множество прямой заЗачи
Непустое Пустое
Допустимое множество Звойстбеиной заЗачи Непустое ®
Пустое ®
Рис. 5.11.
Приведите примеры задач каждого из этих четырех
видов.
5-В. Рассмотрите задачу: найти
max F = xt + 2а*
«1, «2
при условии, что
4“
—2xi 4” х2^£.4
Xi О, х2 0.
1. Решите эту задачу и двойственную к ней; проил-
люстрируйте решение графически.
2. Первое ограничение заменено неравенством
Xi + х2 С И.
Решите прямую задачу и дайте графическую иллюстра-
цию решения. Покажите, как связаны изменения опти-
мального значения F * и оптимальное значение двойст-
венной переменной.
3. Вместо исходной целевой функции введена
функция
F = + 2х2.
Решите прямую задачу и дайте графическую иллюстра-
цию решения. Покажите, как связаны изменения в F ♦
и величина х*.
4. Второе ограничение заменено неравенством
Xi + 2х2^10.
Решите прямую задачу и дайте графическую ил-
люстрацию решения. Покажите, как связаны измене-
ния вГ*сх*!ИС оптимальным значением второй
двойственной переменной.
5-Г. Дана задача линейного программирования: найти
min G — Qyi 4- 20уг 4* Зуз -р 20у4
VI, V2, УЗ, Vi
при условии, что
3yi -р 6у2 — Уз + 2у4 4
—4у! 4- 2у2 4- Уз 4- 5у4 > 2
0, у2 > 0, уз > 0, у4 > 0,
t5t
Найти решение этой задачи, решив сначала двойственную
задачу.
5-Д. Покажите, что если векторы х *, у * являются
решением системы линейных неравенств
Axs^b, х О
уА с, у О
yb^cx,
то они будут соответственно решениями прямой и двой-
ственной задач. >
5-Е. В симметрической задаче линейного программи-
рования найти
шах Ь'х
при условии, что Ах^Ъ, х О,
где А — симметрическая матрица (т = и); доказать,
если существует такой неотрицательный вектор х *, что
Ах * = Ь, то х * является решением задачи.
5-Ж. Система линейных неравенств
(У'\
х I >0
1 /
имеет кососимметрическую матрицу. Докажите теорему
двойственности, используя свойства систем линейных
однородных неравенств.
5-3. Докажите, что в общем случае выполняются
следующие соотношения:
i-i, 2, ..., т
]’ = !, 2, ..., п.
Здесь знаки «+» и «—» служат для обозначения соответ-
ственно правых и левых производных. См. [13].
5-И. Пусть х* и у* — решения двойственных задач
линейного программирования с параметрами А, Ь, с,
а х* + Ах* и у* + Ау* — решения двойственных задач
с параметрами А + АА, Ь + АЬ и с + Ас. Используя
линейные неравенства задачи 5-Е, доказать, что
—Ac Ax* + (у* 4- Ay*) AA Ax* + Ay*A Ax* 0.
—Ду* Ab + Ду AA (x* + Ax*) 4* Ay*A Ax* 0.
На основе этих соотношений покажите, что если матрица
АА и вектор АЬ становятся нулевыми, то ДсАх* 0, и что
если АА и Ас становятся нулевыми, то Ау*АЬ<0.
5-К. Покажите, что оптимальное значение целевой
функции в задаче линейного программирования на мак-
симум F* является субаддитивной функцией вектора
коэффициентов целевой функции с и супераддитивной
функцией вектора констант ограничений Ь, т. е.
F* (с1 + с2) < F* (с1) + F* (с2)
F* (Ь1 + Ь2) > F* (Ь1) 4- F* (Ь2),
где с1 и с2 есть n-мерные векторы-строки, а Ь1 В Ь2 суть
тп-мерные векторы-столбцы.
5-Л. Доказать с помощью метода ограниченной вариа-
ции, изложенного в задаче 3-К, что в задаче линейного
программирования решение достигается в экстремальной
точке (вершине) допустимого множества.
5-М. Задачу линейного программирования (5.0.1)
можно преобразовать в классическую задачу математи-
ческого программирования. Для этого нужно превратить
ограничения-неравенства в ограничения-равенства, ис-
пользуя вспомогательные переменные, и заменить неотри-
цательные переменные квадратами некоторых других
переменных. Сделав такое преобразование, решите задачу,
используя метод множителей Лагранжа. Какие выводы
теории линейного программирования могут быть получе-
ны таким способом? См. [14].
5-Н. Ниже указаны параметры двойственных задач
линейного программирования. Решите эти задачи симп-
лекс-методом и дайте графическую иллюстрацию решения
прямой задачи.
/-1 г-5\ /-10\
А=\ 1 1/’ Ь==( 2/’ с = <° -5)'
/ 1. 2\ / 10 \
2. А= 1—1-11, Ь=| —11, с = (11ф
\ 0 1/ \ 4/
3. А =
2 1
-1 О
, с=(3 4).
2
5-0. С помощью симплекс-метода решить задачи с ука-
занными ниже параметрами:
5-П. При решении задачи линейного программирова-
ния симплекс-методом часто предполагают, что задача
является невырожденной. Это означает, что если огра-
ничения-неравенства с помощью вспомогательных пере-
менных преобразованы в равенства
Ах 4-s= Ь
или если задача приведена к канонической форме,
— . - - /х\
Ах —Ь, где A = (AI), х= I I ,
то любые т векторов расширенной матрицы АЬ линейно
независимы. Иначе говоря, при всех А;
р (А/ • Ь) = т,
где А; — это матрица А, из которой вычеркнут /-й столбец.
Постройте пример вырожденной задачи, поясните его
с помощью чертежа. Покажите, какие трудности возни-
кают при применении симплекс-метода к такой задаче Ч
5-Р. Покажите, что симплекс-метод относится к числу
градиентных методов. Направление градиента в данном
1 Подробнее о случаях вырождения см. в указанной выше ЛИ”
тературе по линейному программированию.
154
случае совпадает с предельным положением вектора,
приложенного к некоторой произвольной точке, которую
будем считать началом координат, и проходящего через
точку плоской поверхности
А = Xi + х2 + . . . + хп, где х} > 0, j = 1, . . п
при А -> О (см. [3]). (В противоположность этому случаю
направление обычного градиента определяется как пре-
дельное положение вектора, приложенного к данной точ-
ке и проходящего через точку гиперсферы
А2 = х\ + . + хгп
при А -> 0.)
5-С. Примером задачи линейного программирования
может служить задача о диете Ч В этой задаче требуется
минимизировать стоимость набора продуктов питания
при условии, что этот набор включает все необходимые
питательные вещества. Предположим, что имеется т про-
дуктов питания. Пусть у, обозначает приобретаемое коли-
чество г-го продукта, a bt — цену единицы веса этого про-
дукта (г = 1, 2, ..т). Тогда функция
т
G=3 yi&i = yb,
4=1
где у = (уь у2, • • •, Ут) — неотрицательный вектор, пред-
ставляет собой общую стоимость рациона питания, кото-
рую требуется минимизировать. Будем считать, что име-
ется п питательных веществ, таких, как белки, углеводы,
жиры, различные витамины и т. д., причем Cj — это
необходимое количество /-го питательного вещества,
a ai} — количество этого вещества в единице веса i-ro
продукта. В таком случае условие о том, что составлен-
ный рацион питания удовлетворителен, выражается в фор-
ме системы неравенств
m
S yiaif>ch 2,
i=l
1 См. [15,3]. Решение задачи о диете, полученное Штиглером
на основе цен 1939 г., предусматривало использование только
9 компонентов: пшеничной муки, капусты, говяжьей печенки, ара-
хисового масла, свиного сала, шпината, кукурузы, сухого молока
и картофеля (не слишком привлекательная диета!). Общая стоимость
продуктов в год составила 39,67 долл.
15$
или в матричных обозначениях < в следующей форме:
уА > с.
Таким образом, задача о диете состоит в следующем:
найти
min G = yb
у
при условии, что уА с, у 0.
1. Сформулируйте двойственную задачу. Какой
смысл можно придать такой задаче?
2. Пусть имеется лишь два вида продуктов пита-
ния: мясо и яйца, причем цена мяса — два доллара
за фунт, цена яиц — 10 центов за штуку. Будем рас-
сматривать только два вида питательных веществ:
минеральные соли и витамины. Допустим, что в фунте
мяса содержится 1000 единиц минеральных солей и
300 единиц витаминов, а в одном яйце — 100 единиц
минеральных солей и 2 единицы витаминов. Для питания
необходимо не менее 60 000 единиц минеральных солей
и 1500 единиц витаминов в месяц. Сколько мяса и яиц
нужно приобрести за месяц, чтобы их общая стоимость
была минимальной?
3. Как изменится решение задачи в п. 2, если
дополнительно потребовать, чтобы потребляемое коли-
чество витаминов и минеральных солей не превышало
количества этих веществ, необходимых для питания?
5-Т. Методы линейного программирования можно
использовать для решения некоторых задач приближе-
ния функций по критерию минимизации максимального
отклонения (критерий минимакса г). Пусть задача состоит
в определении значений коэффициентов линейной функ-
ции
‘У = ^iZi + ю2г2 + . . . + шп2п
по критерию минимакса, исходя из того, что известны
результаты т наблюдений (yt, z41, z21, ..., znl), (у2, z42,
z22? • • ч • • ч (l/m, z2m, z2m, ..., znm). Представьте
данную задачу в форме задачи линейного программиро-
вания.
1 См. [16, 17]. Отметим, что критерий минимакса представляет
собой альтернативу критерию метода наименьших квадратов, ука-
занному в задаче 3-0.
156
5-У. Задача о коммивояжере состоит в следующем:
коммивояжер, отправляясь из некоторого города, посе-
щает п — 1 других городов, после чего возвращается в тот
город, откуда он начинал свой путь. Найти маршрут,
при котором коммивояжер проезжает наименьшее расстоя-
ние [18].
1. Решить задачу при п = 4.
2. Сформулировать эту задачу как задачу (цело-
численного) линейного программирования.
5-Ф. В транспортной задаче требуется минимизировать
стоимость перевозок товаров из одних пунктов в другие
[1, 2, 3, 5]. Имеется т пунктов отправления и п пунктов
назначения. Пусть — количество грузов, перевози-
мых из пункта отправления i в пункт назначения j (j =
— 1, 2, . . ., тп; 7 = 1, 2, . . ., п). Допустим, что стои-
мость перевозки единицы груза из пункта i в пункт / равна
Сц, тогда
т п
G = 3 3 Cijqtj
1=1 J=1
представляет собой общую стоимость перевозок, которую
требуется минимизировать, выбирая тп неотрицатель-
ных значений переменных qtj. Объем груза, имеющегося
в г-м пункте отправления, равняется at, а количество
товаров, которые нужно доставить в пункт назначения у,
равно Tj. Таким образом, общее количество грузов, отправ-
ляемых из пункта i, не превосходит а,, т. е.
п
3 * = 1» 2, ..., т,
7=1
а общее количество грузов, доставляемых в пункт j, дол-
жно быть не меньше чем г;, т. е.
т
j=l, 2, ...,га.
7=1
При этом общая потребность в товарах не может быть
больше, чем запасы их в пунктах отправления, т. е.
п т
3 а,-
7=1 1=1
1. Сформулируйте транспортную задачу в форме
стандартной задачи линейного программирования
на минимум.
<57
2. Постройте двойственную задачу. Какой смысл
можно придать этой задаче?
5-Х. Задача о максимальном потоке в сети. Рассмотрим
некоторую сеть, состоящую из п точек Pj, 7 = 1, 2, ..., п,
называемых узлами, связанных между собой с помощью
отрезков, называемых ребрами. Некоторый товар, имею-
щийся в узле Р1у должен поступить через сеть в узел Рп,
где имеется потребность в этом товаре. Пропускной спо-
собностью ребра называется число а/, — максимальное
количество единиц товара, которое может проходить
между узлами Рг и Pj (а^^О, I, j = 1, . . ., п). Задача
состоит в том, чтобы выбрать значения потоков в сети
таким образом, чтобы поток в Рп был максимальным х.
1. Решить задачу при п = 4.
2. Сформулировать эту задачу как задачу линей-
ного программирования.
3. Постройте двойственную задачу; укажите ее
интерпретацию.
х См. работу Форда и Фалкерсона [19], а также литературу,
указанную в задаче 5-Ф. Задачу о потоках в сетях можно рас-
сматривать как обобщение транспортной задачи, которую в свою
очередь можно трактовать как обобщенный вариант распределитель-
ной задачи.
Глава 6
Теория игр
В предшествующих главах мы изучали такие задачи
принятия решений, когда выбор решения осуществляется
одним лицом. В задаче рационального ведения хозяйства
решение выбирается при предположении о том, что извест-
ны целевая функция, инструментальные переменные и ог-
раничения. В данной главе рассматриваются. задачи
принятия решений с несколькими участниками. _В зада-
чах такого типа оптимальное значение целевой функции
для каждого из участников зависит и от решений, при-
нимаемых всеми остальными участниками. Предметом
теории игр являются такие ситуации, в которых важ-
ную роль играют конфликты и совместные действия х.
Математическая дисциплина, исследующая ситуации,
в которых принятие решения зависит от нескольких участ-
ников, называется «теорией игр», потому что вполне ана-
логичные с математической точки зрения положения возни-
кают в общеизвестных «салонных» играх (например,
в таких, как покер, бридж, шахматы, игра в крестики
и нолики и другие). Область приложения теории игр выхо-
дит, конечно, далеко за рамки таких игр и включает,
например, математику, экономику, политику, военную
стратегию. Однако в терминологии теории игр много заим-
ствований из терминологии общеизвестных игр.
Так, лица, принимающие решения, называются игро-
ками, а целевая функция — платежной функцией. Под
игроками могут подразумеваться отдельные лица или
группы лиц (как, например, партнеры по игре в бридж),
фирмы, страны и т. д. Выигрыш каждого игрока опре-
деляется платежной функцией. Таким образом, игра пред-
х Основная литература По теории игр: [1, 2, 3].
159
ставляет собой совокупность известных всем игрокам
правил, которые определяют, что может делать игрок
и каковы последствия и выигрыши в результате каждого
отдельного их действия.
Ход — это момент игры, когда игроки должны произ-
вести выбор одного из возможных вариантов. Партией
игры называется некоторая определенная совокупность
ходов и выборов. Существенной чертой любой игры
является то, что выигрыш каждого игрока зависит обычно
не только от сделанного им самим выбора, но и от выбора
других игроков х.
Каждый игрок должен учитывать эту зависимость
от остальных игроков при выборе стратегии. Стратегия —
это набор правил, формулируемых до игры, которые
определяют выбор варианта в любой из могущих возникнуть
ситуаций. Так как понятие стратегии является в теории
игр центральным, то эту дисциплину нередко называют
«стратегическими играми».
6.1. КЛАССИФИКАЦИЯ И ОПИСАНИЕ ИГР
Различные виды игр можно классифицировать, основы-
вываясь на том или ином принципе: по числу игроков
или по числу стратегий, по свойствам платежной функ-
ции или по характеру предварительных переговоров
между игроками до игры.
В зависимости от числа игроков различают игры с дву-
мя, тремя и более участниками. Весь материал, изложен-
ный в предшествующих главах, можно рассматривать
как теорию игр с одним игроком. При наличии двух игро-
ков могут возникать и конфликтные ситуации, и необхо-
димость в координированных действиях (кооперация).
Когда число игроков не меньше трех, могут создаваться
коалиции — группы из двух или более игроков, имеющих
общую цель и координирующих свои стратегии.
Согласно другому принципу классификации — по коли-
честву стратегий — различают конечные и бесконечные
х Выигрыши измеряются полезностью в том смысле, как это
изложено в гл. 7. Если выигрыши зависят от исходов случайных
событий с известными вероятностями (от «случайных ходов»), то
они являются математическими ожиданиями полезностей, т. е.
взвешенными суммами полезностей, где весами являются вероят-
ности.
160
игры. В этой главе рассматриваются лишь конечные
игры, т. е. такие, в которых каждый из игроков распола-
гает конечным числом возможных стратегий.
Мы будем рассматривать главным образом такие при-
меры, в которых число стратегий равно двум или трем,
однако эта же математическая теория пригодна и для игр
со сколь угодно большим числом стратегий х. Игры,
в которых один или несколько игроков располагают
бесконечным числом стратегий, называют бесконечными
играми 1 2.
Третий способ классификации игр — по свойствам
платежной функции. Одним из важных типов платежных
функций является платежная функция в игре с нулевой
суммой, когда общая сумма выигрышей игроков равна
нулю3. В игре двух участников с нулевой суммой выигрыш
одного из партнеров равен проигрышу другого, т. е.
налицо прямой конфликт между игроками. Прямой
противоположностью играм такого типа являются игры
двух участников с постоянной разностью, в которых
игроки и выигрывают, и проигрывают одновременно, так
что им выгодно действовать сообща. В общей игре с нену-
левой суммой имеют место, как правило, и конфликты,
и согласованные действия игроков.
В зависимости от характера предварительной догово-
ренности между игроками различают кооперативные
и некооперативные игры. Игра называется кооператива,
ной, если до начала игры игроки образуют коалиции и
принимают взаимообязывающие соглашения о своих
стратегиях. Игра, в которой игроки не могут координи-
ровать свои стратегии подобным образом, называется
некооперативно й.
1 Число стратегий в «салонных» играх хотя и достигает обычно
астрономической величины, но остается конечным.
2 Теория бесконечных игр рассматривается в сборниках статей
под ред. Дрешера, Таккера и Вульфа [4], под ред. Дрешера, Шепли
и Таккера [5] и в работе Карлина [6]. Примером бесконечной игры
может служить игра на единичном квадрате, где стратегией каждого
из игроков может быть любое число от 0 до 1. Другой пример —
игра, в которой каждый из игроков выбирает в качестве своей стра-
тегии некоторую траекторию из множества альтернативных траек-
торий. Игры такого типа называются дифференциальными играми',
они содержат бесконечное число ходов и, следовательно, бесконеч-
ное число стратегий (см. гл. 15).
3 Игры с нулевой суммой называют также антагонистическими
играми. — Прим. перев.
11—0270
161
I
л
г
Рис. 6.1. Дерево игры для игры в развернутой[форме, на примере
упрощенной игры двух лиц в покер.
I — Ход 1: Определение ставок и сдача карт (случай-
ный ход).
II — С: старшая; М'. младшая.
Например, (С, М): игрок 1 имеет С, а игрок 2
имеет М
III — Ход 2: Игрок 1 либо раскрывает карты (Р),
либо повышает игру (В).
IV — Ход 3: Если игрок 1 повышает игру (В), то игрок 2
пасует (Я) или уравнивает (V).
V — Выигрыш игрока 1 (проигрыш игрока 2)
Существует ряд способов описания и анализа кон-
кретных игр. Один из приемов описания игры состоит
в том, что указывает, какие ходы могут делать игроки,
какой информацией во время игры они располагают,
какие варианты можно выбирать и какими могут быть
предельные размеры платежей в конце игры. Игра, опи-
санная таким образом, называется игрой в развернутой
(экстенсивной) форме х, а само описание составляется
обычно в виде дерева игры. На рис. 6.1 показано дерево
игры для упрощенной игры двух лиц в покер. В этой
игре ставка каждого из игроков равна 5 долл. После
сдачи карт на руках у игроков остается определенное ко-
1 В литературе на русском языке игры в развернутой (экстен-
сивной) форме называют также позиционными играми.— Прим,
перев.
162
личество карт. Набор карт может быть либо «старшим»
(С), либо «младшим» (Л/). (Ниже набор карт будем назы-
вать просто картой.) У игрока 1 имеется две возможности:
либо раскрыть карты (Р), либо повышать игру (В). При
раскрытых картах старшая карта выигрывает банк; если
же карты игроков равны, то банк делится пополам.
Если игрок 1 повышает игру, то он вкладывает в банк
еще 5 долл. У игрока 2 после этого имеется две альтерна-
тивы: либо пасовать (П), либо уравнивать (У). Если он
пасует, то игрок 1 выигрывает банк при любых картах.
Если же игрок 2 уравнивает игру, то он вносит в банк
еще 5 долл., после чего либо старшая карта выигрывает
банк, либо при равных картах банк делится пополам.
На дереве игры (см. рис. 6.1) изображены все возможные
ситуации игры и указаны соответствующие им платежи.
Игра^В—развернутой форме является игрой с полной_
информацией, если в ней нельзя делать одновременно
несколько ходов и если участникам известны выборы,
сделанные при предшествующих ходах, включая и случай-
ные ходы. Примерами игр с полной информацией являются
шахматы и игра в крестики и нолики. Покер, напротив,
представляет собой игру с неполной информацией, так
как игрокам не известны некоторые выборы, сделанные
при случайных ходах, — прежде всего им не известно,
какие карты находятся на руках у противника.
Другой способ описания игры состоит в том, что рас-
сматриваются все возможные стратегии каждого игрока
и определяются платежи, соответствующие любой возмож-
ной комбинации стратегий всех игроков.
Описанная таким образом игра называется игрой
в нормальной форме. Зная развернутую форму игры,
можно получить и ее нормальную форму. Нормальная
форма игры двух участников состоит из двух платеж-
ных матриц, показывающих, какую сумму получает
каждый из игроков при любой из возможных пар страте-
гий. Обычно эти две матрицы выражают в форме единой
матрицы, показанной на рис. 6.2. Элементами этой матри-
цы являются пары чисел, первое из которых определяет
величину выигрыша игрока 1, а второе — игрока 2.
Игрок 1 выбирает одну из т стратегий, обозначенных
символами iS), S*, ..., S^; каждой стратегии соответ-
ствует строка матрицы. Игрок 2 выбирает одну из п стра-
тегий iS,, SI, ..., Sn', каждой стратегии этого игрока соот-
11* 163
Игрок 2 выбирает стратегию
Игрок 1 J
выбирает A s< fni. пг\
стратегию * • " У’ 1 ТЕ
(nml’nmi)(nm2>nni2) ’ ' ‘ (птп» ^тп)
Рис. 6.2. Платежная матрица для игры двух участников.
ветствует столбец матрицы. Пара чисел на пересечении
строки и столбца, которые соответствуют стратегиям,
избранным игроками, показывает величину выигрыша
каждого из них. Например, если игрок 1 избирает страте-
гию AJ, а игрок 2 — стратегию 8%, то выигрыш первого
равен П*п а второго — П,,. В общем случае, если игрок
1 выбирает 5), а игрок 2 — S2, то выигрыши игроков 1 и 2
равны соответственно ГД; и П?, (г = 1, ..., т; j = 1, ...,лг).
Платежная матрица имеет размерность т X п,
т — (конечное) число возможных стратегий игрока 1, а
п — (конечное) число возможных стратегий игрока 2.
Предполагается, что каждому из игроков известны все
элементы платежных матриц.
6.2. ИГРЫ ДВУХ УЧАСТНИКОВ С НУЛЕВОЙ
СУММОЙ
Игры двух участников с нулевой суммой составляют
наиболее хорошо разработанную часть теории игр. Если
игра представлена в нормальной форме, то вполне доста-
точно исследовать платежную матрицу только игрока 1.
Действительно, нулевая сумма игры означает, что
+ (6.2.1)
164
Игрок 2
Выбирает столбец
Si
Игрок 1 131 Пи
выдирает < s{
строку <л п
( dm|_ 'ml
"in
Птп
Рис. 6.3. Платежная матрица для игры двух участников с нуле-
вой суммой.
Следовательно, платежная матрица игрока 2 просто равна
платежной матрице игрока 1, умноженной на (—1). Эта
платежная матрица представлена на рис. 6.3, где
Шу = Шу = -Шу. (6.2.2)
Если игрок 1 выбирает стратегию S\ (i-io строку матрицы),
а игрок 2 выбирает S* (j-it столбец матрицы), то игрок 1
получает Пгу, а игрок 2 получает — Шу- Игры такого типа
называют матричными. В подобной игре игрок 1 стремит-
ся выбрать строку матрицы так, чтобы максимизировать
свой выигрыш, а игрок 2 — такой столбец матрицы, при
котором его проигрыш минимален.
Игрой с постоянной суммой называется игра, в которой
Щу 4- П?у = а = const. (6.2.3)
Любую игру с постоянной суммой можно представить
в виде некоторой матричной игры, поскольку прибавление
какой-либо постоянной величины в каждой записи в мат-
рице не влияет на результат. Если пары’ Щу, а — Щу
представляют собой элементы платежной матрицы, то,
вычитая] у из каждого числа, входящего в эту пару,
получаем
(ЙЬ, ftfy) = (щ,—-у. —Шу - -J) ,
где Й)у = — П|у.
В качестве основного допущения в теории игр двух лиц
с нулевой суммой принимается, что каждый игрок стре-
мится обеспечить себе максимально возможный выигрыш
185
при любых действиях противника. Однако наибольший
гарантированный выигрыш определяется при том условии,
что избранная данным игроком стратегия становится изве-
стной противнику, который затем выбирает свою опти-
мальную стратегию. Пусть игрок 1 считает, что, какую бы
строку он ни выбрал, игрок 2 выберет столбец, максимизи-
рующий его выигрыш и тем самым минимизирующий
выигрыш игрока 1. Тогда можно исключить из платежной
матрицы все элементы, оставив в каждой строке только
по одному элементу, соответствующему минимальному
платежу. Оптимальная стратегия игрока 1, которая обес-
печит ему наибольший из возможных выигрышей вне зави-
симости от стратегии противника, будет состоять в выборе
строки с самым высоким из таких минимальных платежей.
Таким образом, игрок 1 выбирает i-ю стратегию, которая
является решением задачи,
тахпнпПгу. (6.2.4)
i 3
Стратегия, соответствующая максимальному значению
минимумов строк, называется максиминной стратегией.
Игрок 2 точно так же стремится обеспечить себе наивыс-
шую величину выигрыша (т. е. наименьшее значение пла-
тежа своему противнику) вне зависимости от стратегии,
избираемой партнером. Следовательно, игрок 2 может
исключить из платежной матрицы все элементы, оставив
в столбце только по одному элементу, соответствующему
максимальному платежу. Его оптимальной стратегией
будет столбец с наименьшим значением максимального
платежа. Таким образом, игрок 2 выбирает j-ю стратегию,
которая является решением задачи
min max П,(6.2.5)
3 i
Стратегия, соответствующая минимальному значению мак-
симумов столбцов, называется минимаксной стратегией.
Если игрок 1 придерживается максиминной стратегии,
то его выигрыш будет не меньше максиминного значения,
т. е.
Пц max min Пгу. (6.2.6)
Если игрок 2 избирает минимаксную стратегию, то его
проигрыш будет не больше минимаксного значения, т. е.
n^Cmin max Пи- (6.2.7)
166
Если
max min П/_/ = min max IIf/ = П&, (6.2.8)
то игроки получают свои гарантированные платежи. В этом
случае их стратегии оказываются совместимыми, а платеж-
ная матрица имеет седловую точку на пересечении г-й стро-
ки и j-го столбца, т. е. элемент П1} является одновременно
минимальным в своей строке и максимальным в своем
столбце.
На рис. 6.4 дан пример игры, в которой игрок 1 распо-
лагает двумя стратегиями, а игрок 2 — тремя. Игрок 1
рассчитывает, что если он выберет первую строку, то про-
тивник может выбрать второй столбец, так что выигрыш
будет равен 1. Если же он выберет вторую строку, то про-
тивник может взять первый столбец, так что выигрыш будет
равен —1. Эти два числа есть не что иное, как минимумы
строк, показанные на рис. 6.4.
Взяв максимальное значение этих минимумов, игрок
1 останавливается на своей первой стратегии, которая
обеспечивает ему выигрыш, равный 1 (или больший
выигрыш, если игрок 2 выберет первый или третий стол-
бец). Точно так же и игрок 2 рассматривает наихудшие
варианты, когда противник выбирает первую строку, в то
время как он сам взял первый или второй столбец, или же
когда противник выбирает вторую строку, в то время как
у него выбран третий столбец. Эти варианты соответствуют
максимальным значениям столбцов 2, 1 и 6. Взяв макси-
мальное значение этих максимумов, игрок 2 останавлива-
ется на своей второй стратегии, при которой его проигрыш
/ 2 1
Максимальные V1 0
элементы столбцов 2 [Т|
Минималь-
ные
элементы
строк
4\ □
6 J -1
6
Рис. в.4. Игра двух участников с нулевой суммой, имеющая
седловую точку (вполне определенная игра).
167
не превосходит 1. Следовательно, в этой игре существуют
совместимые выборы, т. е.
max min П;;- = min max Пгу = 1, (6.2.9)
и, следовательно, существует седловая точка матрицы,
являющаяся ценой игры (для игрока 1). Седловая точка
соответствует положению равновесия, если один из игро-
ков использует стратегию, соответствующую седловой
точке, то другому выгоднее всего избрать свою стратегию,
также отвечающую седловой точке. Так, если в примере
на рис. 6.4. игрок 1 использует первую стратегию, то
для игрока 2 оптимальной будет вторая стратегия, а если
игрок 2 применяет вторую стратегию, то для игрока 1 оп-
тимальной будет первая стратегия. Игра двух участников
с нулевой суммой, имеющая седловую точку, называется
вполне определенной. Разумно ожидать, что в игре такого
типа оба партнера изберут стратегию седловой точки.
Однако не все игры двух участников с нулевой суммой
являются вполне определенными. В общем случае
max min Пг>^т1п max Пгу. (6.2.10)
Игры, в которых выполняется строгое неравенство, назы-
ваются не полностью определенными играми без седловой
точки. Пример такой игры, для которой
max min Пг; — —2 < 4 = min max Пг;- (6.2.11)
приведен на рис. 6.5. Если игроки следуют изложенным
ранее правилам, то игрок 1 выберет стратегию 1 и будет
ожидать, что игрок 2 выберет стратегию 2, при которой
проигрыш равен — 2, в то время как игрок 2 изберет стра-
тегию 3 и будет ожидать, что игрок 1 выберет стратегию 2
с выигрышем, равным 4. Однако результат П13 = 3 ока-
Иинималь-
ные
Элементы
строк
/ 6 -2 3 \ Е2]
м . 1-4 5-4/ -4
Максимальные ' __'
элементы столбцов 6 5 |4|
Рис. 6.5. Игра двух участников с нулевой суммой, не имеющая
седловой точки (неполностью определенная игра).
468
зывается одинаково неожиданным для обоих игроков.
На самом деле, если игрок 2 выберет свою третью страте-
гию, то игрок 1 поступит правильнее, выбирая вторую,
а не первую стратегию. Аналогично, если игрок 1 выберет
первую стратегию, то игроку 2 выгоднее выбрать вторую
стратегию, а не третью. По всей видимости, в играх такого
типа принцип решения в той форме, как он изложен выше,
оказывается непригодным.
Однако этот принцип решения остается верным, если
расширить понятие стратегии за счет смешанных (или
случайных) стратегий. Стратегии, рассматривавшиеся
до сих пор, называются чистыми. Смешанная стратегия
представляет собой вероятностную комбинацию чистых
стратегий, т. е. ряд чистых стратегий, взятых в случайном
порядке с некоторыми вероятностями. Так, например т
строк платежной матрицы являются чистыми стратегиями
игрока 1. Смешанную стратегию для игрока 1 можно ука-
зать с помощью вектора (вектора-строки) вероятностей
Р1 = (р2, pl . . р'т), (6.2.12)
где р{ — вероятность выбрать i-ю стратегию (г = 1, 2,
. . ., т). Например, вектор (Ч3, 2/3, 0, . . ., 0) соответ-
ствует смешанной стратегии, при которой игрок 1 выбира-
ет строку 1 с вероятностью г/3 и строку 2 с вероятностью
2/3. Так как числа, входящие в вектор р1, являются веро-
ятностями, то они должны быть неотрицательными, а их
сумма должна равняться единице, т. е.
т
S pl = 1, pl > 0, i = 1, 2, . . т. (6.2.13)
i=l
Эти условия можно записать и в векторных обозначениях
р1!' = 1, рх>0, (6.2.14)
где 1 = (1, 1, . . ., 1),
т. е. это вектор-строка с элементами, равными единице.
Точно так же игрок 2 выбирает вектор (вектор-стол-
бец) вероятностей
Ра = (pj, pl, . . ., ptf, (6.2.15)
где pj — вероятность выбрать у-ю стратегию; j = 1, 2,
. . ., и, причем можно брать любой вектор р2, в котором
1р2 = 1, р2 > 0. (6.2.16)
169
Отметим, что чистые стратегии можно рассматривать как
частный случай смешанной стратегии, когда вектор веро-
ятностей представляет собой единичный вектор. Так,
вектор-строка (0, 1, 0, . . 0) означает, что игрок 2
выбирает вторую строку матрицы — вторую чистую
стратегию, поскольку вероятность выбрать ее равна
единице.
Основной теоремой в теории игр двух лиц с нулевой
суммой является^теорема~а_минимаксе., согласно которой
любая конечная игра имеет решение, если допускаезиС
использование смешанных стратегий \ Вполне опре-
деленная игра имеет решение в области чистых стратегий,
причем это решение может быть не единственным. Не пол-
ностью определенная игра имеет решение возможно
не единственное, при котором хотя бы один из игроков
применяет случайное комбинирование (смешивание) стра-
тегий.
Так как при выборе стратегий используется вероятност-
ный подход, то выигрыш игрока 1 (проигрыш игрока 2)
уже является не некоторым отдельным элементом платеж-
ной матрицы, а взвешенным средним значением элементов,
причем в качестве весов этой матрицы берутся вероятности.
Так, ожидаемый выигрыш (математическое ожидание
выигрыша) игрока 1 в предположении, что он использует
вектор вероятностейр1 = (р\, р\, . . ., pJJ, а игрок 2 при-
меняет свою у-ю стратегию, равен
Т1П1; + тШгу + . . . + Pmllmj — р1Пе), (6.2.17)
/ == 1, 2, . . ., п,
где П = (Пг;) — платежная матрица, а е7- есть у-й
единичный вектор (/-я строка единичной матрицы). Игрок
1, стремящийся достичь наибольшего из гарантированных
ожидаемых выигрышей, выбирает вектор вероятностей
1 Минимаксная теорема была доказана фон Нейманом [7]. См.
также работы Гейла, Куна и Таккера [8] и Нэша [9]. Эта теорема
может быть доказана различными способами, в том числе с исполь-
зованием теоремы двойственности теории линейного программиро-
вания или с помощью теорем о неподвижных точках, или же с помо-
щью теорем отделимости для выпуклых множеств. Для бесконечных
игр теорема о минимаксе не выполняется. Например, такие игры,
как игра, в которой два игрока записывают какие-либо числа и на-
писавший большее число выигрывает некоторую сумму у противни-
ка, не имеют решений ни в чистых, ни в смешанных стратегиях.
170
так, чтобы получить максимум минимальных значений
ожидаемых выигрышей. Если обозначить
П1 (р1) = min рШе), 3 (6.2.18)
то игрок 1 действует таким образом, чтобы
max П1 (р1) — max min р1Пе). (6.2.19)
pl pl 3
Ожидаемый выигрыш (математическое ожидание выигры-
ша) игрока 2 в предположении, что он использует вектор
вероятностей р2 = (р2, р%, . . ., р„)', а игрок 1 выбрал
l-ю стратегию, равен
Пг1Р1 + Пг2р1+ ... +Пгпрп=е,Пр2, 1=1, 2, . ..,пг.(6.2.20)
Цель игрока 2 — достичь минимума максимальных значе-
ний ожидаемых платежей
тахе/Пр2. (6.2.21)
г
Следовательно, игрок 2 выбирает р2 так, чтобы
min П2 (р2) = min max ejllp2. (6.2.22)
p2 р2 j
Согласно теореме о минимаксе, существуют решения
для (6.2.19) и (6.2.22) — р1* и р2*. Если положить
т п
7 = р1*Пр2*=2 3 р\*ПцрГ, (6.2.23)
i=i j=i
то при любых векторах вероятностей р1 и р2 выполняются
соотношения
рШр3*^ УСр^Пр2 (6.2.24)
и
max рЧ1р2* = V = min р1*Пр2. (6.2.25)
pi р<
Следовательно, V — цена игры — является одновремен-
но максимальным ожидаемым выигрышем игрока 1 и ми-
нимальным ожидаемым проигрышем игрока 2. Таким обра-
зом, теорема о минимаксе утверждает, что существует
хотя бы одна пара смешанных стратегий р1, р2, при кото-
рых максиминное и минимаксное значение ожидаемых
платежей совпадает, т. е.
V = max min р’Пр2 = min max рШр2, (6.2.26)
pi pi ь pa pi
171
так что любая конечная игра имеет седловую точку в про-
странстве векторов вероятностей. Цена игры V единствен-
на, а соответствующие ей векторы вероятностей оптималь-
ных смешанных стратегий, согласно (6.2.23), могут быть
и не единственными. Однако, если существует более чем
одна пара оптимальных смешанных стратегий, то все эти
пары стратегий образуют замкнутое выпуклое многогран-
ное множество, причем все входящие в это множество пары
доставляют игре одну и ту же цену.
Одно из доказательств теоремы о минимаксе исполь-
зует теорему двойственности линейного программирования.
То, что игрок 1 рассматривает минимальные ожидаемые
выигрыши, мы записали ранее с помощью выражения
(6.2.18). Это условие можно представить и в форме линей-
ных неравенств
т
рШе-= 2 Л.2.27)
<=1 > $
7 = 1, 2, ..., п.
Если, как и прежде, обозначить символом 1 вектор-строку
из единиц, то эти неравенства можно записать в эквива-
лентной форме
р1!! - П1 (р1) 1 > 0. (6.2.28)
Тогда задача (6.2.19), стоящая перед игроком 1, может быть
сформулирована как следующая задача линейного про-
граммирования:
найти
max П1 (р1)
р1
при условии, что
р1П-П1(р1)1>0 (6.2.29)
рЧ' = 1
pi>0.
Задачу игрока 2, который минимизирует максимальные
платежи, также можно сформулировать как задачу линей-
ного программирования:
найти min П2 (р2)
Р2
при условии, что
Пр2-1'П2(р2)<0
1р2 = 1 (6.2.30)
Р2>0.
172
Pl
Pi
W)
v!, Pl • • • P2„ -nV)
Pm
Пи п12’ ’ ‘ П(п 1
п21 п22* • • п2п
• • •
• « •
• •
Пщ1 пт2 ’ * птп 1
1 1 • • • Т 1
,^0
^0
= 1~П2(р2).Найти
max[l-n2(p2)],m.e. найти
min n2(p2j
^0 =1-П1(р’). Найти min^-n^p1),
m.e. найти max П1 (p1)
Рис. 6.6. Двойственные задачи определения оптимальных сме-
шанных стратегий, представленные в форме таблицы
для задач линейного программирования.
Эти две задачи являются двойственными задачами линей-
ного программирования, что легко видеть из таблицы
на рис. 6.6, аналогичной таблице на рис. 5.3. Представ-
ленная таблица является краткой формой записи обеих
задач, если положить
ш-1
Pm = 1 — 3 Pi
Z1 (6.2.31)
Рп = 1 — 3 Р*
1=1
для того, чтобы сумма вероятностей равнялась единице.
Так как для каждой из задач существует допустимый
вектор (например, единичные векторы), то по теореме суще-
ствования теории линейного программирования эти зада-
чи имеют решения р1* и р2* соответственно. Но по тео-
реме двойственности
П1 (р1*) = тахП1 (р1) =V = ттП2 (р2) =П2 (р2*), (6.2.32)
Р1 Р2
где V — цена игры. Таким образом, теорема о минимаксе
теории игр вытекает из теоремы двойственности теории
173
линейного программирования. Кроме того, из теоремы
о дополняющей нежесткости следует, что
либо 2 = К, либо р?* = 0, j = l,2, ..., п,
(6-2.33)
либо У; IIijpj*~V, либо р|* = 0, 1 = 1, 2, ..., т.
3=1
Эти соотношения часто называют сильной теоремой о мини-
максе. Эта теорема утверждает, в частности, что если
при некоторой чистой стратегии игрока 2 ожидаемый
выигрыш игрока 1 превосходит цену игры, то игрок 2~йз-
бирает эту стратегию с нулевой вероятностью.
В общем случае следует ожидать, что.в игре двух уча-
стников с нулевой суммой оба игрока применяют свои
оптимальные смешанные стратегии. В частном случае
вполне определенной игры оптимальной смешанной стра-
тегией будет такая стратегия, в которой чистой стратегии,
соответствующей седловой точке, приписана вероятность,
равная единице, т. е. векторы оптимальных стратегий
единичные. Вообще число ненулевых элементов в векторе
оптимальной смешанной стратегии не должно превышать
минимальное количество чистых стратегий, имеющихся
в распоряжении каждого игрока.
Применяя смешанные стратегии, партнеры ни в одной
из партий игры не открывают друг другу своих истинных
стратегий. Данная стратегия выбирается с помощью како-
го-нибудь механизма случайного выбора (бросание монеты
или игральной кости, таблица случайных чисел и т. д.),
причем используемые стратегии находятся в соответствии с
оптимальными вероятностями. Если бы противнику бы-
ло известно, какая именно стратегия будет применена
в данной партии, то он мог бы использовать это знание
с выгодой для себя. Однако он не может извлечь никакой
полезной информации из знания оптимальных вероят-
ностей партнера.
В общем случае можно определить оптимальные сме-
шанные стратегии, решая двойственные задачи линейного
программирования, представленные в таблице на рис. 6.6.
Но если один из игроков располагает только двумя (чис-
тыми) стратегиями, то значения его оптимальных вероят-
ностей можно найти графически. В качестве примера
рассмотрим не полностью определенную игру, показан-
174
Выигрыш игрока 1
и
I
- 4
р= —
г /у
Игрок 1 выбирает
свою первую
стратегию
Игрок f выбирает
свою вторую
'стратегию
~₽2
(вероятность,
с которой игрок 1
выбирает сбою
вторую стратегию}
Рис. 6.7. Графическое решение игры, изображенной на рис. 6.5,
для игрока 1.
ную на рис. 6.5. Графическое решение этой игры дано на
рис. 6.7. Здесь по горизонтальной оси откладывается зна-
чение р\ — вероятность того, что игрок 1 избирает вторую
стратегию (вторую строку матрицы). Так как р\ = 1 — р\,
то точки 0 и 1 соответствуют двум чистым стратегиям —
выбору соответственно строк 1 и 2. По вертикальной оси
откладывается величина выигрыша игрока 1, а каждая
из проведенных линий соответствует некоторой чистой
стратегии, выбранной игроком 2. Например, если игрок 2
выбирает первый столбец, то выигрыш игрока 1 равен либо
6 при выборе им первой строки {р\ = 0), либо — 4,
если он избирает вторую строку (р\ = 1). Величина
выигрыша, равная 6, отложена по вертикальной оси в ле-
вой части чертежа, а величина выигрыша, равная — 4, пред-
ставлена отрезком, отложенным по вертикали в правой
части. Выигрыши, которые можно получить при любой
из смешанных стратегий, соответствуют точкам прямой
соединяющей концы этих отрезков. Поскольку игрок 1
рассматривает прежде всего наихудшие для себя варианты,
то единственным геометрическим местом точек, которое
соответствует осуществимым стратегиям, являются два
отрезка, сходящиеся в форме перевернутой буквы V.
Это геометрическое место точек показано жирной линией.
175
Точки этих отрезков отвечают наименьшим значениям
ожидаемых выигрышей игрока 1, которые он может полу-
чить при той или иной вероятности выбрать вторую строку.
Максимальному выигрышу соответствует р\* — 8/17. Это
можно показать либо геометрически, либо решая алгебра-
ическое уравнение
-2 (1 -р') + 5^ = 6 (1 -pl) -М- (6-2.34)
Итак, игрок 1 должен выбирать свою первую стратегию
с вероятностью а/17, а вторую — с вероятностью ®/17. Цена
игры равна
Г= —2 ( ’ ) + 5 (»)=e $)-4 (i)=g. (6.2.35)
6.3. ИГРЫ ДВУХ УЧАСТНИКОВ С НЕНУЛЕВОЙ
СУММОЙ
В игре с ненулевой суммой уже не обязательно, чтобы
один из участников выигрывал, а другой проигрывал;
напротив, они могут и выигрывать, и проигрывать сов-
местно. Поскольку интересы игроков теперь не являются
полностью противоположными, то имеется возможность
угрожать противнику, блефовать, сообщать друг другу
о своих намерениях, накапливать опыт игры. Так, напри-
мер, если в игре с нулевой суммой игрокам не выгодно
открывать друг другу свои стратегии, то в игре с ненуле-
вой суммой иной раз желательно координировать свои дей-
ствия с партнером или каким-либо способом влиять на его
действия.
Потребность в сообщении между партнерами и в коор-
динировании их действий совершенно очевидна в координи-
рованных играх, в которых платежи обоих игроков либо
одинаковы, либо в более общем случае различаются на по-
стоянную величину, так что игроки и выигрывают, и про-
игрывают совместно. Предположим в качестве примера,
что два человека оказались в горящем доме. Дверь так
сильно захлопнута, что ее можно открыть только сов-
местными усилиями. Платежи показаны на рис. 6.8
(эта таблица составлена в той же форме, что и матрица
на рис. 6.2). Действуя вместе, оба человека могут спа-
стись — выигрыш каждого в этом случае равен 100; в про-
тивном случае могут пострадать оба — выигрыш каждого
176
Первый
человек
Рис. 6.8. Платежная матрица
Толкать
Зверь
Не толкать
Зверь
Второй человек
Толкать Не толкать
Зверь Зверь
(100, юо) (0,о)
(о,о) (о,о)
игры «двое в горящем доме».
равен 0. Очевидно, что для них лучше всего действовать
сообща.
В качестве примера игры с ненулевой суммой рассмот-
рим еще одну игру. Двое подростков едут навстречу друг
другу на автомобилях; проигравшим считается тот, кто
первым свернет в сторону. Платежи указаны на рис. 6.9.
Если один свернул в сторону, а другой нет, то «выиграв-
ший» игрок получает 5, а «проигравший» (свернувший
с дороги) получает —5. Если же сворачивают оба, то состя-
зание оканчивается вничью и выигрыши равны нулю. Если
же никто из них не свернул в сторону, то игра завершает-
ся аварией — выигрыш каждого равен — 100. Здесь ни
один из игроков не располагает доминирующей стратегией,
которая является наилучшей при любых предположениях
о поведении другого игрока. Если бы каждый из них мог
убедить другого, что он намеревается свернуть, то они
бы сыграли вничью, однако каждый испытывает желание
выиграть, нарушив любое подобное соглашение. Если
нарушают договоренность оба, то исходом является ката-
строфа.
Водитель 2
Водитель 1
Сворачи-
вать
Сворачивать
Не сворачивать
Не сворачи-
вать
(-5,5) ’
(-100,-100)
Рис. 6.9. Игра подростков на автомобилях.
12—0270
Игры с ненулевой суммой могут быть кооперативными
или некооперативными. В некооперативных играх игроки
принимают решения независимо друг от друга либо пото-
му, что координация запрещена, либо потому, что осуще-
ствление соглашения невозможно. Примером первой ситу-
ации могут служить антитрестовские законы, запрещаю-
щие некоторые виды соглашений между фирмами, а при-
мером второй — заключение международных торговых
соглашений, навязать которые трудно или невозможно.
Один из подходов к решению некооперативных игр
состоит в определении точки (точек) равновесия игры, т. е.
точки (точек), где ни один из игроков не имеет никаких
причин отказываться от своей стратегии независимых дей-
ствий х. В игре двух подростков существуют две точки рав-
новесия: (5, —5) и (—5, 5), где один игрок сворачивает
в сторону, а другой нет.
Для того чтобы дать точное определение понятию точки
равновесия, используя понятие смешанной стратегии, пред-
положим, что если игрок 1 выбирает стратегию S\, а игрок
2 — стратегию S], то, как и на рис. 6.2, выигрыш первого
игрока равен ПЬ, а выигрыш второго — П?;. Если вероят-
ность того, что игрок 1 выберет i-ю чистую стратегию S\,
равна р\ (i = 1, 2, . . т), то смешанная стратегия пер-
вого игрока выражается вектором
Р1 = (РЬ Ръ • • •, Рт), где рхГ = 1, р1 >0. (6.3.1)
Аналогично, если р] — вероятность выбора j-й чистой
стратегии Sj игроком 2 (j — 1, 2, . . ., п), то смешанная
стратегия второго игрока выражается вектором
Р2 = (Pi, Pl, • • м Рп)', где 1р2 = 1, р2 > 0. (6.3.2)
Точкой равновесия является пара векторов р1*, р2*, оп-
ределяющих оптимальные смешанные стратегии каждого
из игроков, т. е. стратегии, приводящие данного игрока
к максимальному ожидаемому выигрышу при условии, что
1 Эти точки называют также точками «равновесия по Нэшу»
[10]. Определение точек равновесия отнюдь не является единствен-
ным возможным способом решения некооперативных игр. Другие
методы решения: принцип максимина (максимизация своих мини-
мальных выигрышей, см. раздел 6.1); принцип максимакса (мак-
симизация своих максимальных выигрышей); принцип максималь-
ной суммы (максимизация суммы выигрышей); принцип макси-
мальной разности (максимизация разности выигрышей).
178
противник применяет свою (оптимальную) смешанную
стратегию. Следовательно,
р1П1р2*^р1*П1р2* для всех р1, (6.3.3)
р1*!!2?2^?1*!!2?2* для всех р2.
В каждой конечной игре двух лиц существует пара векто-
ров смешанных стратегий, приводящих к точке равновесия.
Такая пара векторов может быть не единственной, и может
оказаться, что различным парам соответствуют различные
значения (ожидаемого) выигрыша. Вообще говоря, в каж-
дой игре п лиц с конечным числом стратегий существуют
смешанные стратегии, приводящие к равновесию. Равно-
весие — это набор таких смешанных стратегий, которые
невыгодно самостоятельно изменять ни одному из игроков.
6.4. КООПЕРАТИВНЫЕ ИГРЫ
Кооперативной игрой называется игра с непостоянной
суммой, в которой игрокам разрешается обсуждать перед
игрой свои стратегии и договариваться о совместных дей-
ствиях; иначе говоря, игроки могут образовывать коали-
ции. Основная задача в кооперативной игре состоит в де-
леже общего выигрыша между членами коалиции. Сле-
дует различать кооперативные игры с побочными плате-
жами, в которых платежи являются переводимыми, и игры
без побочных платежей, в которых платежи непереводимы.
Один из принципов решения кооперативной игры без
побочных платежей для двух игроков известен как реше-
ние Нэша1. Игроки достигают некоторого соглашения о со-
гласовании своих стратегий, причем если бы им не удалось
скоординировать свои действия, то каждый игрок полу-
чил бы некоторый фиксированный платеж. Этот платеж
называется платежом при угрозе. Так, например, в соот-
ветствующей некооперативной игре точкой угрозы могли
бы быть максиминные платежи.
Нэш указал ряд разумных допущений, при которых
решение игры с торгом является единственным. Первое
допущение — симметрия-, предполагается, что решение
не зависит от того, какие номера присвоены игрокам.
Второе допущение — инвариантность относительно ли-
1 См. [12,13J. Обобщение для игры с более чем двумя игроками
рассматриваются в работах Харсаньи [14, 15J.
12* 179
нейных преобразований: решение не зависит от монотонных
линейных преобразований платежей. Третье допущение —
независимостъ от не имеющих отношения к делу альтер-
натив: решение не изменится, если исключить из рас-
смотрения те возможные выборы, которые не использова-
ны в решении. Четвертое допущение — оптимальность
по Парето: не может быть решением такой набор платежей,
помимо которого существует какой-нибудь другой набор
платежей, более выгодный хотя бы для одного игрока.
Если эти условия выполнены, то единственным решением
является пара платежей (П1*, П2*), которые максими-
зируют произведение превышений этих платежей над
платежами при угрозе
max (П1 —Т1) (П2 —Т2). (6.4.1)
П1, №
Здесь П1, П2 — выигрыш каждого игрока; Т1, Т2 —
выигрыши каждого игрока в точке угрозы.
На рис. 6.10 решение представлено в геометрической
форме. Заштрихованная часть плоскости соответствует
Рис. 6.10. Решение Нэша в задаче торгов.
множеству возможных платежей; это множество выпукло,
так как игроки могут применять смешанные стратегии.
Прямой линией на границе множества отмечена «передо-
вая линия» платежей, т. е. множество всех пар платежей,
которые удовлетворяют допущению оптимальности по Па-
рето. Точкой угрозы является точка Т, а решением Нэша
является точка S, в которой передовая линия платежей
достигает линии наибольшего уровня. Линии уровня в дан-
ном случае — это равносторонние гиперболы с центром в Т.
Решение является единственным: оно принадлежит перего-
ворному множеству, т. е. множеству всех точек на передо-
вой линии платежей, в которых выигрыши игроков боль-
ше, чем в точке угрозы.
Кооперативными играми с побочными платежами назы-
ваются игры, в которых допускается заключение взаимно-
обязывающих соглашений о стратегиях, а платежи могут
перераспределяться между игроками. Поскольку разреше-
ны побочные платежи, то следует рассматривать только
общие выигрыши любых возможных коалиций. Игры
такого типа можно анализировать, пользуясь характери-
стической функцией игры, с помощью которой описываются
все возможные коалиции, а именно указывается, какой
максимальный общий выигрыш может гарантировать себе
каждая из коалиций. Если известно множество игроков
в игре п лиц
N == {1, 2, . . ., п}, (6.4.2)
то любое подмножество S множества N является коалици-
ей; характеристическая функция указывает, чему равен
гарантированный выигрыш для S. Таким образом, харак-
теристическая функция представляет собой вещественную
функцию, область определения которой состоит из 2"
возможных подмножеств множества Nх. Запишем эту
функцию в виде
v (5), где S с= N. (6.4.3)
Пример характеристической функции для игры трех
лиц представлен на рис. 6.11. Здесь каждая из четырех
1 Кооперативные игры без побочных платежей можно ана-
лизировать с помощью векторной функции, которая характери-
зует все возможные коалиции, указывая максимальное значение
выигрыша, который может обеспечить себе каждый член коалиции.
См. [16].
181
р(ф)=о
v(l)=O v(2)=0, v(3)=0
v(l,2)=0, v(1,3) = 0,2, v(2,3) = 0,2
v(l,2,3) = v(n)= 1
Рис. 6.11. Характеристическая функция для игры трех участни-
ков.
строк соответствует значениям характеристической функ-
ции для коалиций, число игроков в которых равно соответ-
ственно 0, 1, 2, 3. Первая строка отражает предположение,
что максимальный выигрыш для пустого множества равен
нулю. Вторая строка показывает, что выигрыш любого
игрока, действующего в одиночку, равен нулю. В третьей
строке указаны выигрыши трех коалиций, которые могут
быть составлены из двух игроков. Если игроки 1 п 2 дей-
ствуют совместно, они могут гарантировать себе выигрыш
в размере 0,1; коалициям игроков 1 и 3 или 2 и 3 гаранти-
рован выигрыш, равный 0,2. Наконец, последняя строка
показывает, что если все игроки объединяются в «большую
коалицию», то выигрыш равен 1. Рассматриваемая игра
представлена в нормализованной форме 0 — 1:
v (I) = 0 при любом i g N, (6.4.4)
v (N) = 1, где N = {1, . . «},
т. e. выигрыш самостоятельно действующего игрока равен
нулю, а выигрыш большой коалиции, включающей всех
игроков, равен единице. Если для всех непересекающихся
Подмножеств А и В выполняется неравенство
v (A U В) v (4) + v (В), (6.4.5)
то характеристическая функция является супераддитив-
ной. Это значит, что если нет ни одного игрока, который
входил бы в обе коалиции А и В, то коалиция, составлен-
ная как объединение этих двух подмножеств, будет иметь
выигрыш, не меньший, чем сумма выигрышей А и В. Пред-
положение о супераддитивности характеристической функ-
ции вполне приемлемо, поскольку создание коалиций было
бы бессмысленным, если бы величина выигрыша умень-
шалась с увеличением числа участников коалиции.
Вектор П «-мерного евклидова пространства, компот
182
нентами которого являются суммарные выигрыши каждо-
го отдельного игрока, называется «дележом»:
П « (П1, П2, . . Пп), (6.4.6)
где Л* — выигрыш i-ro игрока (г = 1, 2, ..., п). Примером
дележа для игры, изображенной на рис. 6.11, является
вектор (0,3; 0,2; 0,5), т. е. игрок 1 получает 0,3, игрок 2
получает 0,2, а игрок 3 — 0,5. Предположим, что если мы
учтем всех игроков и все платежи, то величина суммарного
выигрыша игроков будет равна выигрышу большой коали-
ции, включающей всех игроков, т. е.
v(N) = 2П*= Sns. (6.4.7)
' i—1
Это допущение называется условием групповой рациональ-
ности. Вполне обосновано также предположение, чтол
участвуя в коалиции, каждый игрок получает по меньшей
мере столько, сколько он мог бы получить, действуя неза-
висимо, т. е.
П* v ({£}) при любом i С N. (6.4.8)
Это допущение называется условием индивидуальной раци-
ональности. Указанные предположения ограничиваю^
число возможных дележей. Так, например, в играх, пред-
ставленных в нормализованной форме, единственными
приемлемыми дележами являются векторы с неотрицательт
ными компонентами, сумма которых равна единице. Одна-
ко и при таких ограничениях множество дележей остается
чрезвычайно большим. Поэтому, для того чтобы еще допол-
нительно сузить это множество, приходится вводить какой-
либо критерий допустимости или доминирования на мно-
жестве дележей.
Одним из слабых критериев доминирования на множе-
стве дележей является критерий, называемый решением
по фон Нейману — Моргенштерну. Множество игроков
называется эффективным при данном дележе, если их
общий выигрыш после объединения в коалицию будет
по меньшей мере равен сумме выигрышей, получаемых
каждым игроком в отдельности. Следовательно, коалиция S
является эффективной при дележе П = (П1, . . ., Пп),
если
p(S)>W< (6,4,9)
<es
18?
В качестве примера рассмотрим игру, изображенную на
рис. 6.11. В этой игре множество, состоящее из игрока
2 и игрока 3, является эффективным при дележе (0,95;
0; 0,05). Действительно, если они образуют коалицию,
то их общий выигрыш составит 0,2, а это больше того, что
можно получить согласно данному дележу. Дележ Щ =
= (П), Пр . . ., П") доминирует над дележом П2 =
= (Щ, Щ, . . ., Щ), если существует такая коалиция
игроков, эффективная при П1? что каждый из игроков,
вступивших в коалицию, получает при П1 больше, чем при
П2. Иначе говоря, имеется некоторая коалиция S, такая,
что
3 П{, (6.4.10)
все igS
причем каждый член этой коалиции получает при П4
больше, чем при Щ.
п*>щ
при всех i S. (6.4.11)
Так, например, в игре, изображенной на рис. 6.11,
дележ nt = (0,1; 0,8; 0,1) доминирует над П2 = (0,05;
0,9; 0,05). Действительно, коалиция (1,3) является эффек-
тивной при П1, и оба игрока 1 и 3| получают при П1
больше, чем при П2. Если удастся воспрепятство-
вать независимым действиям игроков, то возможность
образования коалиции (1,3) служит гарантией того, что
дележ (0,05; 0,9; 0,05) может никогда не использоваться
в игре. Решением игры по фон Нейману и Моргенштерну
называется множество дележей со следующими свойствами:
ни один из дележей этого множества не доминирует над
другим дележом из того же множества; для любого дележа,
не входящего в множество, существует доминирующий
дележ, принадлежащий данному множеству. Этот слабый
критерий доминирования обычно несколько сужает мно-
жество дележей, однако он не приводит, как правило, к мно-
жеству, состоящему из одного дележа. В действительности,
решение фон Неймана — Моргенштерна часто содержит
бесконечное число дележей. В игре более чем с двумя
участниками даже и число решений фон Неймана — Мор-
генштерна (т. е. число множеств дележей, каждое из кото-
рых является решением фон Неймана — Моргенштерна)
может быть либо очень большим, либо бесконечным. Кро-
184
ме того, существует ряд примеров игр, которые не обладают
решениями фон Неймана — Моргенштерна [17].
Более сильный критерий доминирования на множестве
дележей можно задать с помощью понятия «ядра» иг-
ры. Ядро — это некоторое подмножество каждого реше-
ния фон Неймана — Моргенштерна (если такие решения
существуют). Число дележей, входящих в ядро, значитель-
но меньше, чем в решении фон Неймана — Моргенштерна,
поскольку дележи, входящие в ядро, должны удовлетво-
рять следующему условию: каждая из коалиций при дан-
ном дележе получает по меньшей мере столько, сколько
могли бы получить в сумме входящие в нее игроки, дей-
ствуя самостоятельно. Ядром называется множество всех
недоминируемых дележей, т. е. таких дележей П =
= (П1, . . ., Пп), которые удовлетворяют условию
для любого подмножества S из N. (6.4.12)
igs
Следовательно, множество дележей, входящих в ядро,
удовлетворяет условию «коалиционной рациональности».
Это условие включает более частные условия «индивидуаль-
ной рациональности» (когда рассматриваются подмножест-
ства, состоящие из отдельных игроков), «групповой рацио-
нальности» (когда подмножеством является большая коа-
лиция, включающая всех игроков) и условие рациональ-
ности любой коалиции промежуточного размера. Ядро
описанной на рис. 6.11 игры трех участников показано
в геометрической форме на рис. 6.12. Изображенный на ри-
сунке равносторонний треугольник является границей
симплекса в пространстве Ея, т. е. границей множества
дележей (П1, П2, П3) — векторов трехмерного простран-
ства, — таких, что
П* >0, i = l, 2, 3,
П1 + П2 + П3 = 1. (6.4.13)
Вершины треугольника соответствуют таким дележам,
при которых один из игроков выигрывает всю сумму.
Заштрихованная область треугольника — это ядро игры.
Представляется вполне разумным следующее предположе-
ние: если игра имеет ядро, то все выбираемые дележи
должны принадлежать ядру. Это означает, что игроки учи-
тывают все возможные коалиции. Однако, к сожалению,
многие игры не имеют ядра (ядро является пустым мно-
185
Рис. Ядро игры, описанной на рис, 6.11.
жеством), т. е. не существует дележей, удовлетворяющих
условию коалиционной рациональности для какой-бы
то ни было коалиции. Например, если бы в показанной
на рис. 6.11 игре трех участников все коалиции из двух
игроков получали бы 0,8, то ядро было бы пустым.
Число дележей, входящих в ядро, как правило, либо
равно нулю (т. е. ядро пустое), либо их много (как, напри-
мер, на рис. 6.12). Ядра, состоящие из единственного деле-
жа, встречаются очень нечасто. Однако в играх с ценой
Щепли ядро всегда состоит из одного дележа. Ценой Шепли
называется дележ, величина платежей в котором зависит
от «силы» каждого игрока. Последняя учитывается,исходя
из значения дополнительного выигрыша, который может
получить коалиция, если данный игрок войдет в нее [18,
19]. Так, например, третий игрок в игре, описанной на
на рис. 6.11, обладает большей силой, чем остальные,
и поэтому должен получить больше, чем они: две коали-
ции, состоящие из двух игроков и включающие игрока 3,
получают 0,2, тогда как коалиция без этого игрока полу-
чает 0,1. Предположим, что каждый игрок получает выиг-
рыш, равный средней величине своих вкладов во все те
коалиции, куда он мог бы вступить. Выигрыш г-го игрока
равен средней взвешенной из v (S (J {г}) — и (S), где
186
S — это любое подмножество игроков, не содержащее
игрока i, aS J {О т0 же самое подмножество, включаю-
щее игрока г. Средняя взвешенная равна платежу
п‘= 3 yn(S) [p(5U{0)- p(S)b (6.4.14)
все ScN
где взвешивающие множители уп (S) равны
Y* (£) = *- , (6.4.15)
as — это число игроков в S. Выбор именно таких взвеши-
вающих множителей обусловлен следующими обстоятель-
ствами: коалиция из п участников может быть образована
п\ различными способами; существует s! различных спо-
собов организации для s игроков, входящих в коалицию S
до того, как к ней присоединяется игрок г; игроки, не вхо-
дящие в расширенную коалицию, число которых равно
п — s — 1, могут быть организованы (п — s — 1)! раз-
личными способами. Следовательно, если предположить,
что все п! способов формирования коалиций, состоящих
из п игроков, равновероятны, то уп (5) представляет собой
не что иное, как вероятность присоединения игрока i
к коалиции S. В игре, описанной на рис. 6.11, каждому
игроку предоставляется четыре возможности. Для игрока
1 эти возможности следующие:
р({1})-р W = 0
р ({1, 2}) — р ({2}) = 0,1
v ({1, 3}) - v ({3}) = 0,2 (6.4.16)
v ({1, 2, 3}) - v ({2, 3}) = 0,8.
Веса, соответствующие каждому из этих четырех случаев,
таковы: а/в» */в> х/в и 2/в- Следовательно, выигрыш игрока
3 составит
П"-(4)° + т-<0’ 1) + |-(0.2) +
+ (в.4.!7)
Из аналогичных рассуждений вытекает, что выигрыш
игрока 2 равен 19/60, а выигрыш игрока 3 составит 22/60.
Итак, в данной игре вектор дележа, соответствующий цене
(19 19 22 \
60’ 60’ 60/ '
&3
6.5. ИГРЫ С БЕСКОНЕЧНЫМ ЧИСЛОМ ИГРОКОВ
Весьма интересную и важную задачу теории игр п лиц
составляет исследование случая, когда число игроков
неограниченно возрастает *. При некоторых предполо-
жениях относительно игры и характера увеличения числа
игроков выявлен примечательный результат, а именно, что
при многих из указанных в предыдущих разделах прин-
ципах решения игры получается одно и то же решение.
В игре с бесконечным числом игроков всегда существует
точка равновесия, причем и множество точек равновесия,
и ядро, а также цена Шепли сходятся к этой точке рав-
новесия при неограниченном возрастании п. Этот результат
и в самом деле замечательный, поскольку все указанные
способы решения основаны на совершенно разных прин-
ципах. Так, например, точки равновесия в общем случае
не являются точками, оптимальными по Парето. Однако,
если число игроков неограниченно возрастает, то точки
равновесия перемещаются на поверхность, образованную
точками, оптимальными по Парето. С другой стороны, ядро
можно рассматривать как область на поверхности, опти-
мальной по Парето, которая стягивается в одну точку или
в некоторое множество точек, когда число игроков неогра-
ниченно возрастает. Наконец, цена Шепли не всегда
принадлежит ядру, однако она сходится к тому же пределу,
что и ядро. Таким образом, хотя в играх с конечным числом
игроков существует много различных подходов к понятию
решения игры, однако в играх с бесконечным числом игро-
ков существует лишь одно решение (это не значит, что оно
всегда состоит из одной точки). Сказанное не относится
к простейшему случаю — игре двух участников с нулевой
суммой, который имеет единственно приемлемое реше-
ние — минимаксное. Таким образом, теория игр обеспе-
чивает удовлетворительный анализ для игр с одним или
с двумя игроками, а также для игр с бесконечным числом
игроков, однако она не указывает какого-либо одного уни-
версального способа анализа игр с конечным числом игро-
ков, большим или равным трем. В этом отношении теорию
игр можно сравнить с механикой, которая дает полное
решение задачи одного тела и задачи двух тел, а также
с помощью статистической механики обеспечивает реше-
-------- - I -
1 См. [20, 21, 22, 23J. См. также раздел 10.2.
188
ние задач с Числом тел порядка 1023 и более. Однако с по-
мощью механики в настоящее время нельзя исчерпываю-
щим образом проанализировать задачу, если число тел
лежит в промежутке между указанными границами (напри-
мер, в случае знаменитой задачи трех тел).
ЗАДАЧИ
6-А.Найти решения следующих игр двух участников
с нулевой суммой:
1. /4 04
\6 3/
2. /15 0 -2\
О -15 -1
\1 г 0 /
3. /4 -3\
\0 2 /
4. /5 3 2\
\3 4 О/
5. /1 2 3\
\3 О 2/
6. /—3> J6 \
| 8 -2 1
- \ 6 , 3, /
7. /а 0 04
ГО Ъ 01, а > 5 > е.
До о с/
6-Б. Найти решение следующей игры с нулевой сум-
мой: игроки 1 и 2 независимо друг от друга выбирают одно
из чисел 1, 2, 3. Если эти числа оказываются равными,
то первый игрок выплачивает второму сумму, равную 1.
Если же эти числа не равны, то игрок 2 выплачивает игро-
ку 1 сумму, равную тому числу, которое выбрал первый
игрок.
189
6-В. На рис. 6.1 представлен в развернутой форме упро-
щенный вариант игры двух лиц в покер. Укажите нормаль-
ную форму игры и найдите решение. Зависит ли решение
от величины ставки? Зависит ли решение от того, на какую
сумму можно увеличивать ставку?
6-Г. Игра двух участников с нулевой суммой называет-
ся справедливой, если цена игры равна нулю.
1. Показать, что симметричная игра, т. е. игра с ко-
сосимметрической платежной матрицей (П = —П'),
является справедливой и что оптимальные векторы
вероятностей совпадают с точностью до операции тран-
спонирования векторов.
2. Построить пример несимметричной не полностью
определенной справедливой игры.
3. Построить пример несимметричной вполне опре-
деленной справедливой игры.
6-Д. Доказать, что игра двух лиц с нулевой суммой
обладает следующими свойствами:
1. Седловая точка может быть не единственной;
цена игры единственна.
2. Цена игры является неубывающей непрерыв-
ной функцией элементов платежной матрицы.
6-Е. Показать, что в не полностью определенных играх
двух участников с нулевой суммой выполняется сле-
дующее:
1. Если противник использует свою оптимальную
смешанную стратегию, то никакая чистая стратегия
не может дать большего выигрыша, чем оптимальная
смешанная стратегия.
2. Если противник использует оптимальную стра-
тегию, то любая чистая стратегия, которая входит
с ненулевой вероятностью в некоторую оптимальную
смешанную стратегию, приводит к выигрышу, равно-
му цене игры, тогда как выигрыш при любой чистой
’ стратегии, входящей в любую смешанную стратегию
с нулевой вероятностью, меньше цены игры.
3. Любая доминирующая чистая стратегия исполь-
зуется в оптимальных смешанных стратегиях с нуле-
вой вероятностью (см. 6-М).
4. Любая выпуклая линейная комбинация двух
оптимальных смешанных стратегий также является
. оптимальной смешанной стратегией.
190
6-Ж. В некоторых играх Двух участников с нулевой
суммой допустимы любые монотонные преобразования
платежей:
ПЬ = Ф (П,/), ф' > 0.
В некоторых играх двух участников с нулевой суммой
допустимы любые монотонные линейные преобразования
По = аПи + b, а > 0.
1. Показать, что во вполне определенных играх
оптимальные (чистые) стратегии не меняются при лю-
бых монотонных преобразованиях, а цена игры
изменяется согласно этому преобразованию.
2. Показать, что в не полностью определенной игре
оптимальные (смешанные) стратегии не меняются при
монотонных линейных преобразованиях, а цена игры
меняется согласно этому преобразованию.
3. Показать на примере, что монотонное нелинейное
преобразование, не меняющее оптимальные чистые
стратегии во вполне определенной игре, может приве-
сти к изменениям оптимальных смешанных стратегий
в не полностью определенных играх.
6-3. Показать, что оптимальные смешанные стратегии
р1* и р2* дЛЯ не полностью определенной матричной игры
с невырожденной матрицей П размерности 2x2 имеют
следующий вид:
р1*=4-ш1
р2* = -^П-Ч',
где 1 = (1, 1), а цена игры есть
1П-1Г •
Обобщить эти результаты на случай игры с вырожденной
матрицей П размерности 2x2. Найти оптимальные сме-
шанные стратегии в играх с матрицами
/1 -1\ I 3 — 2\
\0 3 / ’ \ —6 —4 / ’
При решении воспользоваться приведенными результата-
ми. Проверить правильность решения, сопоставив его с
решением, найденным графическим способом.
191
6-И. В разделе 6.2 было показано, что из теоремы двой-
ственности теории линейного программирования вытекает
теорема о минимаксе. Докажите обратное, что из теоремы
о минимаксе следует теорема двойственности. Указание:
представьте двойственные задачи линейного программи-
рования, сформулированные в гл. 5, в форме игры двух
участников с нулевой суммой, имеющей кососимметриче-
скую платежную матрицу
/ О А -Ь\
П=| -А' 0 с' I.
\ Ь' -с 0 /
6-К. В некоторой бесконечной игре двух участников
с нулевой суммой игрок 1 выбирает целое число г, игрок
2 — целое число у, а выигрыш игрока 1 равен i — j.
Игрок 1 применяет смешанную стратегию
{1/21, если i = 2k, где к целое число |
О в противном случае J "
Показать, что эта смешанная стратегия дает игроку 1 бес-
конечно большое значение ожидаемого выигрыша при лю-
бой чистой стратегии игрока 2.
6-Л. В игре с природой имеется только один игрок,
принимающий решение, причем исход игры зависит не
только от его решений, но и от «состояния природы» [24].
Платежная матрица в этом случае похожа на матрицу игры,
показанной на рис. 6.3, где игрок 1 — это лицо, прини-
мающее одно из т различных возможных решений, а иг-
рок 2 — это «природа», имеющая п различных возможных
состояний. При выборе решения могут использоваться
несколько различных критериев.
1. Критерий Лапласа («принцип недостаточного
основания»). Предполагается, что все состояния оди-
наково вероятны, поэтому следует выбирать такую
строку матрицы, которая максимизирует средний вы-
игрыш по строке.
2. Принцип максимина. Предполагается, что при-
рода является «злонамеренным» противником, поэтому
следут выбирать ту строку матрицы, которая содержит
максиминимальный элемент, т. е. наибольший из всех
минимальных элементов столбцов.
192
3. Принцип максимакса. Предполагается, что при-
рода — это «доброжелательный» партнер, поэтому сле-
дует выбирать строку матрицы с максимаксимальным
элементом, т. е. наибольшим из всех максимальных
элементов столбцов.
4. Критерий минимаксного сожаления (риска). Пред-
полагается, что любое решение сопоставляется с тем
решением, которое было бы принято, если бы было
известно состояние природы. Этот критерий приводит
к выбору строки матрицы, содержащей элемент, кото-
рый минимизирует максимальный риск (сожаление).
Риск (сожаление) — это абсолютное значение разности
между любым данным платежом и тем платежом, кото-
рый можно было бы получить, зная состояние природы.
Постройте примеры числовых матриц таких игр с при-
родой, в которых все четыре критерия приводят к од-
ному и тому же результату, и таких игр с природой,
в которых применение каждого из четырех критериев
дает разные результаты.
6-М. Существуют три типа исходов в играх с нулевой
суммой, в которых каждый игрок располагает двумя
возможными стратегиями:
1. Каждый игрок имеет доминирующую стратегию.
2. Лишь один игрок имеет доминирующую стратегию.
3. Ни один из игроков не располагает доминирующей
стратегией.
Одна стратегия доминирует над другой, если она дает
не меньший выигрыш, чем другая при любых стратегиях
противника, и если она дает больший выигрыш при неко-
торых стратегиях противника. Привести примеры игры
различных видов, соответствующих трем типам исходов.
6-Н. Рассмотрим игру, участники которой — мужчина
и женщина — решают, пойти ли на соревнование боксе-
ров (первая стратегия) или на демонстрацию мод (вторая
стратегия). Мужчина предпочитает соревнование по боксу,
а женщина — показ мод, но в любом случае они идут вме-
сте. Платежная матрица имеет следующий вид:
’(4, 1) (0, 0)-
.(0, 0) (1, 4). ’
1. Решить задачу торгов, используя решение коо-
перативной игры по Нэшу. Будем считать, что точкой
угрозы является точка (0, 0).
13-0270
193
2. Решить задачу торгов, используя решение по Иэ-
шу, если точкой угрозы является точка м шсиминпых
платежей для каждого из игроков. Показать, что это
решение совпадает с ценой Шепли для кооперативной
игры, в которой
v (ф) = о, v (N) = 1,
v ({мужчина}) и и ({женщина}) — это максиминные значе-
ния.
6-0. Ниже перечислен ряд концепций решения игры.
Сопоставьте эти концепции на примере двух игр: игры
подростков на автомобилях и игры из п. 6-Н.
1. Точка (точки) равновесия.
2. Принцип максимина, т. е. каждый игрок максими-
зирует свой минимальный выигрыш.
3. Принцип минимакса, т. е. каждый игрок минимизи-
рует максимальный выигрыш своего противника.
4. Принцип максимальной суммы, т. е. максимизирует-
ся сумма выигрышей.
5. Принцип максимальной разности, т. е. максимизи-
руется разность между выигрышем данного игрока
и выигрышем его противника.
6-П. Рассмотрим некоторую задачу торгов. Два челове-
ка могут получить 100 долл., если они придут к соглаше-
нию о разделе этих денег. Первый из них обладает суммой
W, долл.; его функция полезности представляет собой
логарифмическую функцию, так что если он получит X
долл, из 100, то его выигрыш равен
П1 = In (Wt + X), 0 < X < 100.
Аналогично второй человек обладает суммой W2 долл,
и его выигрыш при получении оставшихся 100 — X долл,
равен
Па = In (W2 + 100 - X).
1. Предположим, что Wt 100, i = 1, 2. Как
будут разделены деньги при решении по Нэшу? (Ука-
зание: In (1 + z) л? z, если z — малое число.)
2. Предположим, что \\\ — 100, W2 100. Как
будут разделены разыгрываемые 100 долл.? Является
ли этот раздел «справедливым»?
194
6-Р. В игре «третий лишний» участвуют три Игрока,
которые независимо друг от друга выбирают одну из сто-
рон монеты: либо «орел», либо «решка». Если выбор всех
игроков одинаков, то каждому из игроков выплачивается
по одному доллару, в противном случае «третий лишний»
выплачивает каждому из двух игроков по одному доллару.
Найти характеристическую функцию игры.
6-С. Укажите примеры, иллюстрирующие указанные
ниже возможности доминирования платежей (имеется
в виду понятие доминирования дележей в решении фон
Неймана — Моргенштерна).
1. nt доминирует над П2, а П2 не доминирует над Пр
2. П1 доминирует над П2, а П2 доминирует над Пр
3. Дележи П1 и П2 не являются доминирующими друг
для друга.
6-Т. Для игры в форме характеристической функции
показать, что ядро является подмножеством решения фон
Неймана — Моргенштерна.
6-У. Игра называется игрой с постоянной суммой в фор-
ме характеристической функции, если
v (S) + v (N ~ S) = v (ЛГ)
для всех подмножеств S из N.
1. Показать на примере, что игра может быть игрой
с постоянной суммой в форме характеристической функ-
ции и в то же время не являться игрой с постоянной
суммой в нормальной форме.
2. Показать, что все конечные игры, являющиеся
играми с постоянной суммой в нормальной форме,
являются также и играми с постоянной суммой в форме
характеристической функции.
6-Ф. Некоторая игра трех участников имеет нормали-
зованную характеристическую функцию, в которую вхо-
дит параметр р — максимальный гарантированный выи-
грыш всех коалиций из двух игроков. Найти ядро и реше-
ния фон Неймана — Моргенштерна при р = 0, р = х/3,
Р = 2/'з, Р = !• •
6-Ц. Пусть в некоторой акционерной компании часть
акций, а именно простое большинство акций, требуется для
сохранения контроля над компанией. По всем акциям вы-
плачиваются одинаковые дивиденды независимо от того,
принадлежат ли они контролирующей группе или нет.
13* 195
v(S) —
Если i-му акционеру принадлежит 5г акций (i =ь 1, 2,
п
. . ., п), а т = У, Si — общее число акций, то характери-
i=l
стическая функция имеет следующий вид:
О при ,
£
пв . т.
— при ns>-r,
где /г, —число акций, контролируемых коалицией S,
ns--= 3 Si.
все i₽S
Предположим, что 5г не равны между собой. Показать, что
ядро состоит из единственного дележа (Sf/m, S^Jm, . . .
. . Sn/m). Дайте интерпретацию этого результата.
ЧАСТЬ III
Применение
статической
оптимизации
Глава 7
Теория личного потребления
Одним из основных элементов экономической теории
является домашнее хозяйство (потребитель), определяе-
мое как некоторая группа индивидуумов, распределяющая
свой доход на покупку и потребление товаров и услуг *.
Проблема рационального ведения хозяйства потребителя
(см. табл. 1-1) заключается в решении вопроса о том, какое
количество каждого наличного товара или услуг он должен
приобрести при заданных ценах и известном доходе. Объек-
том анализа данной главы является отдельный потребитель
такого типа; в гл. 9 рассматривается экономика, характе-
ризующаяся множествами взаимодействующих потреби-
телей (и фирм).
7.1. ПРОСТРАНСТВО ТОВАРОВ
Поведение потребителя, рассматриваемое с точки зре-
ния рационального ведения хозяйства, математически
выражается в выборе некоторой точки из «пространства
товаров». Под товаром мы будем понимать некоторое благо
или услугу, поступившие в продажу в определенное время
в определенном месте. Предположим, существует конечное
число наличных товаров и; количества каждого из них,
приобретенные потребителем, характеризуются набором
товаров
х = (хх, х2, . . ., хп)', (7.1.1)
т. е. п-мерным вектором-столбцом, в котором х} обозна-
чает количество j-го блага, приобретенного потребителем,
1 Основные работы по теории потребления (1, 2, 3, 4, 5, 6, 7, 8].
199
/ = 1, 2, . . п. Будем считать, что все товары обладают
свойством произвольной делрмости, так что может быть
куплено любое неотрицательное количество каждого из них.
Тогда все возможные наборы товаров являются векторами
пространства /поваров
С — {х = (xt, х2, . . хпу | Xj 0, j = 1, 2, . . ., и).
(7.1.2)
Таким образом, пространство С является неотрицатель-
ным ортантом евклидова пространства, замкнутым и вы-
пуклым множеством.
7.2. ОТНОШЕНИЕ ПРЕДПОЧТЕНИЯ
Выбор потребителем некоторого набора товаров отча-
сти зависит от его вкусов. Они характеризуются слабым
отношением предпочтения, «предпочтительнее, чем» или
«равноценен», которое записывается знаком ^=. Это отноше-
ние является одним из основных простейших понятий
теории потребления. Таким образом, запись
х > у, (7.2.1)
где х и у являются наборами товаров (точками простран-
ства товаров С), означает, что рассматриваемый потреби-
тель либо предпочитает набор х набору у, либо не делает
между ними различий, т. е. х по крайней мере так же хо-
рош, как и у, согласно вкусам этого покупателя. Тогда
можно определить понятия безразличия и строгого пред-
почтения в терминах слабого отношения предпочтения:
наборы товаров х и у безразличны для потребителя (запи-
сывается х ~ у) тогда и только тогда, когда каждый
из них предпочтительнее или безразличен по отношению
к другому, т. е.
х ~ у, если и только если х у и у х (7.2.2)
и потребитель предпочитает набор х набору у (записывает-
ся х >- у), если и только если х предпочтительнее или без-
различен у, а у не предпочтителен или не безразличен х.
х > у, если и только если х у, а отношение у х
несправедливо. (7.2.3)
200
В дальнейшем будет предполагаться, что слабое отно-
шение предпочтения удовлетворяет двум основным аксио-
мам. Первая из них утверждает, что это отношение являет-
ся совершенной полуупорядоченностью в пространстве
товаров С. Отношение называется совершенным, если для
двух данных наборов х и у из С справедливо одно из двух:
либо х у, либо у х (либо одновременно). (7.2.4)
Это означает, что в пространстве товаров нет таких «про-
белов», в которых предпочтения не существуют. Отноше-
ние называется полуупорядоченностью, если оно транзи-
тивно, т. е. для трех заданных наборов х, у, и z из С вы-
полняется условие,
если х у и у z, то х z, (7.2.5)
что выражает совместимость предпочтений, и если оно реф-
лексивно, т. е. для любого набора х из С
X > X, (7.2.6)
этот факт вытекает уже из совершенности отношения.
Первая основная аксиома, утверждающая, что слабое
отношение предпочтения является совершенной полуупо-
рядоченностью пространства товаров, означает, что отно-
шение безразличия является отношением эквивалентности,
которое транзитивно, так как при заданных х, у и z из С,
если х ~ у и у ~ z, то х z (7.2.7)
рефлексивно, так как при заданном х из С:
х ~ х, (7.2.8)
и симметрично, так как при заданных х и у из С
х ~ у означает у ~ х. (7.2.9)
Для доказательства, например, транзитивности заме-
тим, что х ~ у и у ~ z означают по определению безраз-
личия, что х^уиу^ги что г у и у х. Тогда по
транзитивности слабого отношения предпочтения х z
иг х, из чего вытекает х ~ z. Будучи отношением экви-
валентности, отношение безразличия подразделяет про-
странство товаров на классы эквивалентности — попарно
непересекающиеся подмножества, называемые множества-
ми безразличия, каждое из которых состоит из всех набо-
ров, безразличных заданному набору х
201
Л = {у€С|у~х}. (7.2.10)
Вторая основная аксиома утверждает, что слабое отно-
шение предпочтения непрерывно, т. е. предпочтительные
множества, каждое из которых состоит из всех таких набо-
ров, которые предпочитаются или безразличны заданному
набору х
Р. = {У € С | у > х}, (7.2.11)
и непредпочтительные множества, каждое из которых сос-
тоит из всех наборов, для которых заданный набор х
предпочтителен или безразличен
NP* = {у 6 С | х > у}, (7.2.12)
являются замкнутыми множествами пространства това-
ров для любого набора х. По этой аксиоме оба мно-
жества содержат все граничные точки, причем для обоих
множеств граничные точки образуют множество безраз-
личия 7Х, равное пересечению Рх Q NPX-
Из двух основных аксиом совершенной полуупорядо-
ченности и непрерывности следует, что существует непре-
рывная действительная функция, определенная на про-
странстве товаров U (•), которая называется функцией
полезности и для которой 1
U (х) U (у), только если х > у. (7.2.13)
1 Доказательство того факта, что совершенное непрерывное
упорядочение подмножества n-мерного евклидова пространства мо-
жет быть представлено действительной непрерывной функцией
(полезности), приведено в работах Дебре [9, 10]. Примером совер-
шенной упорядоченности, на которой функция полезности не опре-
делена, потому что она не удовлетворяет аксиоме непрерывности,
могут служить лексикографические предпочтения, означающие, что
х > у, где
х = (хь Хг, . . ., хп)' и у = (уь у2, . . ., уп)',
если X] > pi,
или
X! = У1 И Х2 > У2
или
Xi = Vl, Х2 = У2, • * * * * * * * * хр~Ур И *р+1 > »р+1-
Как видно из названия, эта упорядоченность может быть уподоб-
лена составлению словаря: все слова, начинающиеся с «а», предше-
ствуют словам, начинающимся с любой другой буквы; слова, начи-
нающиеся с «а», упорядочиваются по второй букве и т. д.
202
Например, возьмем любой луч в пространстве товаров,
который проходит через начало координат. Примем в ка-
честве полезности какого-либо набора расстояние от на-
чала до точки на луче, которая принадлежит тому же мно-
жеству безразличия, что и рассматриваемый набор. Конеч-
но, если такая функция полезности существует, то она
не единственна. Например, в качестве функции полезно-
сти одинаково хорошо может служить любая монотонная
строго возрастающая функция расстояния вдоль луча
и вообще, если U (х) является функцией полезности, то ею
же является и <р [[7 (х)], где <р — строго возрастающая
функция (ср' > 0). Таким образом, a U (х) Ь, где а и Ъ —
константы и а > 0, так же как и еи ('), могут выступать
в качестве функции полезности. На самом деле образовать
функцию полезности можно с помощью любого последова-
тельного множества чисел, которому поставлены в соответ-
ствие множества безразличия таким образом, что число,
соответствующее «более высокому» множеству безразличия
(в направлении предпочтения), является большим, чем
число, соответствующее «более низкому». Такую функцию
иногда называют порядковой функцией полезности, а
значения, принимаемые этой функцией, — порядковыми
полезностями.
Остальные аксиомы можно сформулировать либо в тер-
минах отношения предпочтения, либо в терминах функции
полезности. Аксиома ненасыщения (в терминах отношения
предпочтения) утверждает, что для данных двух наборов
х и у из С
X > у (т. е. Xj > ys для всех у) влечет х > у (7 2 14)
х > у и х у=у влечет х > у.
Таким образом, если х содержит не меньшее количество
каждого товара, чем у, то х должен быть предпочтительнее
или равноценен у, в то время как если х содержит не
меньшее количество каждого товара, а одного товара содер-
жит больше, чем у, то х должен быть предпочтительнее у.
В терминах функции полезности аксиома ненасыщения
утверждает:
х > у влечет U (х) U (у),
1 ттЛ (7.2.15)
х у и х ^у влечет t/(x)>t/(y).
Будем считать U(x) дифференцируемой, тогда аксиома
ненасыщения требует, чтобы все первые частное произ-
203
водные функции полезности, называемые предельными
полезностями, были положительными
dU / \ / ч I ди / ч atz , . dU . . \ . п
1г(х) = ми (х) = (-^(х)’ •••’ ^-W) >°-
(7.2.16)
Таким образом, в любой точке пространства товаров воз-
растание потребления любого товара при постоянном
потреблении всех остальных товаров приводит к увеличе-
нию полезности.
MU, (х) =-—- (х) > О, /—1,2-------п. (7.2.17)
Следующая аксиома строгой выпуклости утверждает
в терминах отношения предпочтения, что если х и у —
различные наборы в С, такие, что у х, то
ay + (1 — а) х х для всех а, 0 < а < 1, (7.2.18)
где выпуклая комбинация ay + (1 — а) х является набо-
ром, состоящим из ау} + (1 — а) Xj единиц товара /,
/ = 1, 2, . . ., п. На рис. 7.1 иллюстрируется множе-
ство предпочтений, удовлетворяющее этой аксиоме, где
граница, множество безразличия для х, называется кри-
вой безразличия; у1 > х и у'2 ~ х в терминах функции полез-
ности (предположение выпуклости) означает, что
ра = {у е с I и (у) > а} (7.2.19)
является строго выпуклым для всех действительных чисел
О’--------------------------------
Рис. 7.1. Множество предпочтений для п = 2.
204
а, или равнозначно U(-) является строго квазивогну-
той. Более сильное утверждение этой аксиомы, которое
используется ниже, состоит в том, что при предположении,
что £/(•) является дважды дифференцируемой и имеет
непрерывные вторые частные производные, матрица Гессе,
состоящая из вторых частных производных, отрицательно
определена
Н = -^- 3x2 (х) = / . —г(х) дх{ ' ' дЧ/ дх% dxi 2и , , “5—;— (х) . . дХ{ ОХч ' ' (х)^-(х).. d%iдхп ' 7 дх2дхп ’Х’
дЧ! , . дЧ , . (х) -3—3— х) ' ' дхп дх% ' ’ ” дх*п
дх^
(отрица-
тельно
опреде-
лена) .
(7.2.20)
Это означает, что функция полезности строго вогнута.
В частности,
^-(х)<0, j = l,2, ...п, (7.2.21)
т. е. предельная полезность любого товара уменьшается
по мере того, как продукт потребляется. Это допущение
получило название закона Госсена.
В табл. 7-1 приведены три типа функций полезности,
соответствующие принятым допущениям. Заметим, что
Таблица 7-1
Примеры функций полезности
Тип функции полезности Функция полезности Ограничения
Квадрати- ческая U (х) = ах х' Вх л» а-]-х'В> 0 В отрицательно опре- делена
Логариф- мическая (Бернулли) (х) = 2 log i=i н & VV J* 1 ° V о II to st
Постоян- ной эла- стичности j**1 . ,1, Й °C V?. о •*»! к AvA во н
205
Потребленное Количества X В кВаДратиЧеСкоМ СЛуЧаО
должны быть ограничены; тогда будет удовлетворяться
аксиома ненасыщения. Заметим также, что функция полез-
ности с постоянной эластичностью сводится к логарифми-
ческой функции полезности по мере того, как все bj при-
ближаются к единице; в этом случае
MUj = aj (xj — Xj)-1, 7 = 1,2,..., n.
7.3. НЕОКЛАССИЧЕСКАЯ ЗАДАЧА ПОТРЕБЛЕНИЯ
Неоклассическая задача потребления заключается
в выборе набора товаров и услуг при заданном отноше-
нии предпочтения (или функции полезности) и «бюджетном
ограничении», которое относит потребителя к некоторому
подмножеству пространства товаров.
Бюджетное ограничение означает, что денежные расхо-
ды на все товары и услуги не могут превышать денежного
дохода. При этом вектор, состоящий из п цен в денежном
выражении
Р = (Р1, Р2, • • •, Рп), (7.3.1)
где Pj — цена товара j и денежный доход I будут считаться
заданными положительными параметрами. В таком случае
бюджетное ограничение, отражающее то обстоятельство,
что общий расход не может превышать дохода, будет иметь
вид
рх I, т. е. S pjXj^J, (7.3.2)
7=1
где pjXj — расход на товар j. Допустимым Множеством
для потребителя является множество X
X = {х С С | рх 1} = {х С Е" I рх I, х > 0),
(7.3.3)
т. е. непустое компактное (замкнутое и ограниченное) вы-
пуклое подмножество пространства товаров. Граница,
вдоль которой рх = I, называется бюджетной линией.
В случае п = 2 это—прямая, при п = 3 это — плоскость
и в общем случае — гиперплоскость.
Таким образом, неоклассическая задача потребления
заключается в выборе такого набора х * из допустимого
множества X, который является «самым предпочтитель-
206
йым», т. е. для всех остальных наборов х, принадлежащих
X, справедливо соотношение х* х. В терминах функции
полезности задача формулируется следующим образом:
max U (х) при условии рх^7, х^О, (7.3.4)
X
или в развернутой форме
max U (х^ х2, • • • хп),
XI» Х2, . . . Хп
при условии
п
PPi = + Р&г + . . • + Pn^n^I (7.3.5)
Xf 0, x2 0, . . ., xn 0,
где p = (p^ p21 . . ., pn) и I — заданные положительные
параметры. Здесь мы имеем задачу нелинейного програм-
мирования, в которой инструментальными переменными
являются уровни потребления каждого из п товаров х =
— (Xi, х2, • . хп)’\ в качестве целевой функции высту-
пает функция полезности U (х), которая считается непре-
рывно дифференцируемой и имеет положительные первые
частные производные и отрицательно определенную мат-
рицу Гессе вторых частных производных; ограничением
в форме неравенства является бюджетное ограничение,
в котором функция ограничения линейна при заданных
ценах р = (pt, р2, . . ., рп), а константой является доход
I. В силу того, что целевая функция непрерывна, а допу-
стимое множество компактно, по теореме Вейерштрасса
решение этой задачи существует, а так как целевая функ-
ция строго вогнута и допустимое множество выпукло, то
по «локально глобальной теореме» оно единственно.
Необходимыми и достаточными условиями для реше-
ния этой неоклассической задачи потребления являются
условия Куна — Таккера для (7.3.5). Определим функцию
Лагранжа
L (х, у) = U (х) + у (I — рх), (7.3.6)
где у — множитель Лагранжа, и запишем условия Куна —
Таккера
4L=4L_yp<0, 2L=/-pX>o,
дх дх ду г 1
^Х ==(‘^’~г/Р)Х==0’ р-^- = р(/-Рх) = 0> (7‘3-7)
х 0 у > 0.
207
Все перемейные и частные производные здесь вычисля-
ются в (х*, у *), где вектор х * — решение задачи
(7.3.5). Таким образом,
MUj но если < , тогда ж* = 0|
х* 0, но если >, тогда MUj (х*) = у*р; Р ’
(7.3.8)
поэтому для всех закупленных предметов потребления
справедливо соотношение (для х^ > 0)
— MUj(x*)=y* для всех j, для которых х*>0. (7.3.9)
Pj
Это правило было сформулировано в табл. 1-1: отношение
предельной полезности к цене должно быть одинаковым
для всех закупленных предметов потребления. Считая, что
некоторые товары были куплены, из (7.3.9) получим, что
оптимальный множитель Лагранжа у * должен быть поло-
жительным, а из этого следует по условиям Куна — Такке-
ра, что весь доход должен быть израсходован
I- Рх* = 0, (7.3.10)
т. е. решение лежит на бюджетной прямой. Это сразу сле-
дует из факта ненасыщения: если был использован не весь
доход, то оставшуюся сумму денег можно было затратить
на приобретение некоторого товара и тем самым увеличить
полезность.
Считается, что потребители покупают все виды товаров
и услуг (в противном случае можно уменьшить размер-
ность пространства товаров, исключив из рассмотрения
непокупаемые товары). Тогда условие (7.3.7) примет вид
9U . , п
— (х)-ур = 0
I—рх = 0,
или в развернутой форме
х2, .. .,хп) — ypj = O, 7 = 1, 2,
OX j
п
I- 3 №=о.
5=1
Эти условия выполняются только в точке (х*, X*, . . .,
Хп, У *), гДе (я?» *г*> • • •, хп)' = х * является решением
(7.3.11)
•, и,
(7.3.12)
208
задачи потребления. Например, в случае двух товаров
решение должно удовлетворять системе
ypi = O
-^-(Xi,x2)-yp2 = 0 (7.3.13)
I — р^ — р2х2 = 0.
Геометрически решение лежит в точке касания бюджетной
линии и кривой безразличия, как показано на рис. 7.2.
Наклон бюджетной линии равен pjp2, а наклон кривой
безразличия U (xt, х2) — const находится из выражения
dU 5LZ , = —dxi dxi , dU , n 4-^-dx2=° (7.3.14)
и составляет dx2 dxi dU/dxi dU/dx2 (7.3.15)
В точке касания наклоны равны
dU/dxi __ Pl (7.3.16)
dU/дх2 Pi ’
или 1 dU 1 dU (7.3.17)
Pl дхх p2 dx2
Это условие можно получить из (7.3.13), исключив мно-
житель Лагранжа.
Оптимальный множитель Лагранжа, равный общему
отношению предельной полезности к цене в (7.3.17), изме-
ряется в полезности единицы товара у, деленной на коли-
чество долларов на единицу товара у, что сводится к по-
лезности на доллар, у * следует интерпретировать как
предельную полезность добавочного дохода
у* = , где U* ~ U (х*), (7.3.18)
которая называется иногда предельной полезностью денег,
(и 1) условий (7.3.11) являются условиями первого
порядка для классической задачи математического про-
граммирования
max U (х) при условии рх = I. (7 3.19)
х
14-0270
209
Рис. 7.2. Решение ь точке касания для неоклассической задачи.
Условия второго порядка для этой задачи формулиру-
ются с помощью окаймленной матрицы Гессе
/О — pt —р2... —рп
‘ « d2U . , d2U . . 9ZU . ч
/ о — р\ 9х^ Х 0*1 Зг2 Х ' 0*1 дхп Х
(-Р' Н •
*д2и , х 32{7 . . э2и . .
\ дхп dxt дхп дх2 ' дх% ,
(7.3.20)
полученной окаймлением Н ценами; условия заключают-
ся в том, что последние (п — 1) главных миноров должны
менять знак, в то время как первый положителен. Эти
условия удовлетворяются, так как матрица Гессе счи-
тается отрицательно определенной. Таким образом, усло-
вия (7.3.11) являются необходимыми и достаточными,
(п +1) условий первого порядка
Ф1 (у, х, р, /) = I — рх = 0
ЧЦу, X, p,Z) = -g-(x)-J/p = O
(7.3.21)
210
могут быть разрешены относительно (и 4- 1) неизвестных
у, х, если определитель соответствующей матрицы Якоби
не равен нулю. Записав матрицу Якоби, мы видим, что
она равна
д гр1
ду
d>F2
ду
dip1
дх
dip2
,dx
О — р
-р' Н
(7.3.22)
окаймленной матрице Гессе (7.3.20), которая действительно
имеет определитель, не равный нулю, так как матрица
Н отрицательно определена и потому невырожденна
(обратная матрица к матрице Якоби приведена ниже).
Решение задачи может быть получено в виде функций ее
параметров
х* = х* (р, Г)
У* = J/* (Р, I). (7.3.23)
Первые п уравнений называются функциями спроса на каж-
дый продукт; они характеризуют количественные значе-
ния спроса как функцию от цен на все товары и дохода
х* = х* (р^ Pz, . . ., рп, I), j = 1, 2, . . ., п. (7.3.24)
Последнее уравнение выражает оптимальный множитель
Лагранжа как функцию цен и дохода, причем у* по
(7.3.18) представляет собой количество, на которое уве-
личится оптимальный уровень полезности, если произой-
дет малое приращение дохода. Все (п + 1) уравнений един-
ственным образом определяют х* и у*, при этом функции
х* (••) и у* (••) имеют непрерывные первые частные про-
изводные в некоторой малой окрестности решения системы
(7.3.21).
Важным свойством функций спроса является их одно-
родность нулевой степени относительно всех цен и дохода,
т. е. значения спроса инвариантны по отношению к
пропорциональным изменениям цен и дохода
х* (пр, al) = х* (р, I) для всех а > 0. (7.3.25)
Это свойство сразу же вытекает из самой постановки
задачи: пропорциональное изменение всех цен и дохо-
да не влияет на допустимое множество и значение целевой
функции. По однородности спрос на любой продукт зави-
сит от отношений цен, которые называются относителъны-
14» 211
ми ценами, и от отношения денежного дохода к некоторой
цене, которое называется реальным доходом. Выбрав
какой-либо товар, скажем товар 1, в качестве «единицы
счета» и полагая коэффициент пропорциональности
в (7.3.25) а = Ир^, функции спроса можно записать в виде
= (1, К- .Рп_ _С), у = 1,2, ...п. (7.3.26)
Это выражение показывает зависимость спроса от относи-
тельных цен p2lpi, Рз/pi, • ., Pn/Pt и реального дохода
Hpi. Конечно, любой товар с положительной ценой может
быть выбран в качестве «единицы счета» (товар j считается
единицей счета, если а = 1/pj). Может случиться так, что
1 п
в качестве а выбран -у или 1/2 Рь последний случай будет
7 >=1
встречаться в дальнейших главах книги.
7.4. СРАВНИТЕЛЬНАЯ СТАТИКА ПОТРЕБЛЕНИЯ
Метод сравнительной статики заключается в изучении
чувствительности .решения задачи рационального ведения
хозяйства к изменениям ее параметров путем сравнения
положения оптимума в статике до и после того, как пара-
метры изменились. Этот метод применяется в неоклассиче-
ской теории потребления для того, чтобы определить, как
влияет на оптимальные количества товаров изменение-
(n + 1) параметров, цен и дохода [11, 1, 3, 12, 13].
По результатам последнего раздела (п + 1) условий
первого порядка для задачи потребления (7.3.11) могут
быть разрешены относительно оптимальных количеств
всех продуктов и оптимального множителя Лагранжа
в виде функций цен и дохода, как в (7.3.23). Подставляя
эти функции в условия первого порядка, получим систему,
состоящую из {п Н- 1) тождеств:
I — рх* (р, 7) = О
(х* (р, Z)) - у* (р, 7) р 0. (7.4.1)
Показатели сравнительной статики можно получить, если
продифференцировать эти (п + 1) тождеств по парамет-
рам р и I.
212
Сначала рассмотрим влияние изменения дохода I. Диф-
ференцируя (7.4.1) по .1, получим'систему
п - *
у м *4 JC-o 4 2 <7Л'2>
2j дх}дхк di Р} di — О, J —1«2, ...,n,
*=1 1
где dx*ldl, dx*/dl, ..dx^/dl и ду*!д! отражают сте-
пень чувствительности по отношению к изменениям дохо-
да. При использовании векторно-матричных обозначений,
где
Эх* _/ дх* дх* dxfi \'
~д7~~\дГ’ д! ’ д! ) ’
уравнения (7.4.2) примут вид
Эх* .
-p-gT=-i
, ди* . „ Эх* Л
-р Чг+Н—=°-
(7.4.3)
(7-4.4)
Представим эти уравнения в виде матричного уравнения
О -Р\
-р' Н /
Эу* \
а/ 1
Эх* I
д! /
-1\
О / ’
(7.4.5)
где матрицей коэффициентов является окаймленная мат-
рица Гессе.
Теперь рассмотрим влияние изменения одной цены,
причем остальные цены и доход предполагаются неизмен-’
ными. Дифференцируя (7.4.1) по pt, получим
2М
дх< дх^ dpi
h=l
" дх*
j—i
Pi —y*&Ji = o, j«1, 2,..., И,
(7.4.6)
где Sjj — дельта Кронекера, равная единице, если / = I,
и нулю в противоположном случае. Все характеристики
чувствительности могут быть записаны в виде матрицы
213
и вектора-строки
дх*
«р ~
' daf daf dx^ ’I
dpi dPs dpn
дх% dx^ dx^
dPi dpa dPn
dz% dxl
, dPi dPi ЭРп.
ду/ ду* дУ* дУ* \
ар ~ \ dpi ' дрг ’ • ” дрп )
(7.4.7)
(7.4.8)
так что, используя векторно-матричные обозначения,
уравнения (7.4.6) для I = 1, 2, . . ., п можно записать
в виде системы
-Р
дх*
~др~
X»'
, ду* . тт дх*
— р -*—ЬН~— = у *1,
г др 1 др °
(7.4.9)
или, что эквивалентно,
(ду*
др
дх*
др
(7.4.10)
где 1п — единичная матрица размерности п х п.
Наконец, рассмотрим влияние компенсированного изме-
нения цены, при котором доход компенсируется таким
образом, чтобы полезность оставалась неизменной. Так как
dU = -т— (х) dx = г/р (dx)
di=р (dx) (dp) х, ‘ (7.4.11)
то, для того чтобы U оставалось неизменным (dU = 0),
необходимо, что р (dx) =0, а это справедливо, если
di — (dp) х. Если, в частности, рг возрастает до pi + dpi,
то дополнительный доход di = (dpt) xt обеспечит неиз-
менную полезность. Дифференцируя (7.4.1) по рг, когда
di = (dp}) xh получаем
2U
_ V n 9x^
2j Pi dpi
j=i
у dZU 9x*
£-i dx] dx^ dpi
(7.4.12)
У*6я=° (j = l,2, ...,n).
Эти уравнения для I = 1, 2, . . n можно записать
в виде системы
—Р
(7.4.13)
comp
= »•!»,
где (-^Jcomp и (-^Jcomp определяются из соотноше-
ний (7.4.7) и (7.4.8), и считается, что доход компенсирует-
ся таким образом, что полезность остается неизменной.
Запишем эквивалентное выражение
/ ( ду* \ \
О —р\ I \ dp /сотр I I 0 \
-р'н/1/^xq =\у*1пГ
'• \ dp / сотр '
фА.Кк)
Все три результата дифференцирования, данные в
(7.4.5), (7.4.10) и (7.4.14), могут быть обобщены одним мат-
ричным уравнением
/*ду* ду* / ду* \ \
Л 0 —р\| д/ ~tp~ \ 5р /сотр I / — 1 X*' 0
р' Н / I дх* дх* / дх* \ I \ 0 г/*1п г/*1п
\ д/ др \ 5р /сотр'
(7.4.15)
которое является основным матричным уравнением теории
потребления. Поскольку окаймленная матрица Гессе,
умноженная на матрицу сравнительной статики, состоя-
щую из частных производных, невырожденна, постольку
основное матричное уравнение может быть разрешено
относительно показателей сравнительной статики. В ре-
зультате получим
215
(7.4.16)
Но матрица, обратная окаймленной матрице Гессе,
получается в результате обращения блочных матриц, так
как Н отрицательно определена и, следовательно, невы-
рожденна
I 0 “Н-1 -I11 ИрН1
\-р' Н / УрЦ-1// nH-VpH^ + H-1/ (7ЛЛ7)
Р = рН-1р'
Возвращаясь к выражению (7.4.16) и
можно получить
ду* * д / dU* \
Ц “ ~дГ ~ ~~ д! \ д! д!2
используя (7.4.17),
0zU*
поэтому скаляр ц можно интерпретировать как коэффици-
ент убывания предельной полезности денег. В результате
получаем характеристику влияния изменения параметров
на изменение спроса
Зх* ,
~йГ=”|,Н Р
^ = рН-*р' x*' + p.H1p'pH1y*4-H-1j/*
(7.4.19)
(7.4.20)
(7.4.21)
Эти три уравнения показывают, как изменяется значе-
ние спроса на товары х*, по мере того как меняются пара-
метры: отдельно — доход и цена, а также и цена в случае
компенсирующего изменения дохода. Из этих уравнений
следуют результаты применения метода сравнительной ста-
тики для теории потребления. В частности, их можно ском-
бинировать таким образом, что получается уравнение
Слуцкого
216
основное уравнение теории ценности. Выписывая уравне-
ние Слуцкого для каждого товара и цены, получим
±L=(±L) /,/ = 1,2, ..., п (7.4.23)
tdpi \ dpi /сотр \ 91 / ' '
Общий _ Влияние Влияние
эффект- замены ' дохода,
где, как показано, dxjldpi — общий эффект от влияния
цены на спрос; {dx*jldpi)comv — влияние замены т. е. компен-
сированного изменения цены на спрос; и (— дх*Ю1)х* —
влияние изменения дохода на спрос.
Из (7.4.21) следует, что матрица влияния замены
симметрична и отрицательно полуопределена:
отр симметрична, (7.4.24)
z'^CO, и = 0, если z ap.
\ ap / comp
Из уравнения Слуцкого, учитывая симметричность, полу-
чаем условие симметричности
дх* дх? дх? дх?
М = *’2’ <7-4-25)
Из отрицательной полуопределенности следует, что все
частные значения влияния замены отрицательны
<0, / = 1,2, ..., п. (7.4.26)
\ др; /сотр ’
Это означает, что компенсированное возрастание цены
товара всегда приводит к уменьшению спроса на этот то-
вар. Уравнение Слуцкого требует, однако, чтобы
поэтому (так как первое выражение в правой части —
собственно влияние замены — отрицательно) выра-
жение в левой части, характеризующее общий эффект,
также отрицательно в том случае, если второе выражение
в правой части достаточно малое и отрицательное:
~ со, если (4^) <0. (7.4.28)
др; ’ \ д! ) 3 \ др; /сотр '
217
Определим различные типы товаров следующим образом:
(нормальные^
J товары I,
[ Гиффина )
( ценные |
(малоценные) ’
если
если
дх*
~др]
дх*
~дГ
(7.4.29)
Таким образом, из (7.4.28) видно, что товары Гиффина
Должны быть малоценными товарами. В общем случае каж-
дый товар попадает в одну из трех категорий, приведенных
в табл, на рис. 7-3. Примером нормального ценного товара
служит масло: при повышении цены его покупается меньше,
а при повышении дохода — больше. Нормальным мало-
ценным товаром является маргарин: его покупают мень-
ше, если увеличивается цена на него, но с ростом дохода
его также покупают меньше, поскольку потребитель полу-
чает возможность покупать больше масла. В качестве
примера товара Гиффина можно привести картофель в Ир-
ландии в конце XIX века. В то время покупка картофеля
представляла собой большую часть общих расходов насе-
ления, но по мере увеличения дохода потребитель пред-
почитал покупать меньше картофеля и больше мяса.
В случае если возрастает цена картофеля, реальный доход
понижается настолько, что потребители будут не в состо-
янии покупать столько мяса, сколько прежде, и поэтому
будут вынуждены приобретать еще больше картофеля.
Некоторые результаты могут быть проиллюстрированы
геометрически, как это сделано на рис. 7.4. Пусть началь-
ное равновесие находится в точке А, в которой бюджетная
линия касается кривой безразличия. При возрастании Pi
до р[ точка пересечения бюджетной линии с осью изме-
нится, как показано, и новое равновесие установится в точ-
ке С. Компенсированное изменение цены отражается пунк-
тирной линией: отношение цен — новое (наклон пунктир-
ной линии — p'JP2)i а Доход изменился (возрос) так, что
полезность осталась неизменной (Л и В лежат на одной
и той же кривой безразличия, а точка равновесия на пунк-
тирной линии лежит в В) Ч Заметим, что В находится сле-
1 Если изменения в ценах различны, то компенсированное
изменение цены не только не изменяет полезность, но и также
дает возможность потребителю покупать старый набор товаров.
См. |14].
318
\ Влияние \ изменения \ дохода Влияние \ изменения \ частной цены\ Ценные Эх* п Э1 >0 Малоценные дх? '°
Нормальные Зх* 3pj Пример: масло Пример- маргарин
Тобары Гиффина Эх* dPj Пример: картофель 8 Ирландии 8 конце ХИ бека
Рис. 7.3.
па от А; это подтверждает тот важный результат, что влия-
ние одной замены отрицательно. Общее влияние измене-
ния pt выражается отрезком АС; влияние замены — отрез-
ком АВ и влияние дохода — отрезком ВС. В данном слу-
чае товар 1 является ценным, так как при понижении дохо-
да сокращается и спрос (С лежит слева от В). Он также
нормален; в этом можно убедиться, заметив, что при
возрастании цены спрос понижается (С лежит слева от А),
Умножим соотношение (7.4.21) на р'. Получим
/ дх* \
\ др / сотр
р' = о,
(7.4.30}
или в развернутом виде
п , дх* \
У ) /=0, Ь1,2, <7.4.31)
\ dpi /сотр '
1=1
Так как все цены положительны, то, для того чтобы это
условие выполнялось, необходимо, чтобы хотя бы один
элемент каждой строки матрицы влияния замены имел
отличный от остальных знак. Но элемент на главной диа-
гонали характеризует собой частное влияние замены, кото-
219
Рис. 7.4. Сравнительная статика в случае двух товаров.
рое должно быть отрицательным. Следовательно, по край-
ней мере один элемент каждой строки положителен.
Для всех j существует Z #= 7 такое, что
....."• (7Л32>
Два товара j и I являются
{взаимозаменяемыми ) , Эх* \ 01
г, если (-5—) ] f0. (7.4.33)
ВЗаиМОДОПОЛНЯеМЫМИ) \ ЭЩ /сотр (<д
Таким образом, два товара являются взаимозаменяемыми
(взаимодополняемыми), если компенсированное возраста-
ние цены одного приводит к увеличению (снижению)
спроса на другой. Согласно (7.4.32), каждому товару соот-
ветствует по крайней мере один такой товар, который сос-
тавляет с ним взаимозаменяемую пару. В частности, если
мы рассматриваем случай только двух товаров, они обя-
зательно должны быть взаимозаменяемыми, как это пока-
зано на рис. 7.4, где В лежит выше, чем А.
220
Из уравнения Слуцкого (7.4.22) и соотношения (7.4.30)
получаем
(О'+ (7.4.34)
или в развернутой форме
S (^)и+(т)/-°- I”1’2’ • "-PASS)
z=i
Эту зависимость можно вывести также из однородности
нулевой степени функций спроса, используя теорему Эйле-
ра об однородных функциях. Запишем соотношение (7.4.35)
в несколько другом виде
" / pt dz* \ ' i I дх* \
2 (^)+(^та-)=0- •••• "• (7-4-зв)
Z=1 3 > 1
где
Pl дх* ч
7Г 1 эластичность t
xj dpi I . I Pi I
l дх* I = cnP°ca moeaPl . . (7.4.37)
__L I no отношению к I * J
x? di f
Таким образом, из (7.4.36) следует, что для всякого товара
сумма всех (п + 1) эластичностей должна быть равна нулю,
т. е. сумма всех эластичностей по цене равна отрицатель-
ной эластичности по доходу.
Умножая (7.4.19) и (7.4.21) на р, получим
т- =°>
op / comp
(7..4.38)
где первое соотношение называется условием агрегации
Энгеля. В развернутом виде
п дх*
(7.4.39)
= 0, Z = l,2,
7 \ opt /comp
П.
221
Из того факта, что неотрицательная взвешенная сумма
изменений значений спроса по отношению к доходу долж-
на равняться единице, следует, что все товары одновре-
менно не могут быть малоценными:
дх*-
для некоторого /, /=1,2, п. (7.4.40)
Объединяя соотношения (7.4.38) с уравнением Слуцкого,
можно получить условие агрегации Курно
р^-+х*'==0, (7.4.41)
или в развернутом виде,
” ах*
р*~э^г=1’2’ •••’п- <7-4-42)
3=1
Таким образом, значение спроса на товар I равно отрица-
тельной взвешенной сумме изменений значений спроса
по отношению к цене товара I, в которой в качестве весов
выступают цены товаров.
7.5. ВЫЯВЛЕННОЕ ПРЕДПОЧТЕНИЕ
Одним из подходов к теории потребления является
выявленное предпочтение. Этот подход базируется на на-
блюдении рыночного выбора, в частности на наблюдении
сумм цен [3, 15, 16, 17, 6]. Основное понятие метода выяв-
ленного предпочтения — это отношение «явного предпоч-
тения» между парами наборов. Если потребитель поку-
пает набор товаров х1 = (#}, . . ., л^)' по ценам р1 =
= (р], р|, . . ., рУ, в то время как он мог бы купить
при этих ценах другой набор товаров х2, то считается, что
х1 явно предпочтительнее х2; это записывается в следующем
виде: х1 © х2. Таким образом,
х1 0 х2, если и только если р1х1^р1х2, (7.5.1)
где условие
р!хх= 3 3 Prtj =р1х2
5=1 5=1
(7.5.2)
означает, что расходы на первый набор, который действи-
тельно был куплен при определенных ценах, не меньше,
222
xf
Рис. 7.5. Набор товаровух1 явно предпочтительнее набора
товаров х*.
чем расходы, которые потребовались бы на покупку вто-
рого набора при этих же ценах. Это отношение иллюстри-
руется на рис. 7.5: набор х2 находится внутри множества,
ограниченного бюджетной линией, вдоль которой потре-
битель покупает х1, поэтому х1 > х2. Аналогично х1 явно
предпочтительнее всех точек, которые лежат в заштрихо-
ванной области ниже бюджетной линии.
Слабая аксиома выявленного предпочтения утверждает,
что если набор х1 явно предпочтительнее набора х2, то
набор х2 не может быть явно предпочтительнее набора х1,
т. е. отношение «явного предпочтения является асиммет-
ричным
х1 0х2 не означает х2 0 х1
(т. е. х2 0 х1 несправедливо). (7.5.3)
Используя определение отношения (7.5.1), слабая аксио-
ма формулируется так
pV^pbc2 влечет р2х2<р2х1. (7.5.4)
Таким образом, слабая аксиома означает, что если при це-
нах р1 потребитель мог купить х2, но выбрал х1, то в слу-
чае, когда при ценах р2 выбран х2, набор х1 не может быть
223
куплен потребителем. Почти все результаты применения
теории спроса, полученные до сих пор, могут быть
выведены из слабой аксиомы выявленного предпочтения.
Например, рассмотрим отрицательность собственно
эффекта замещения (7.4.25). Если два набора товаров х1
и х2 лежат в одном множестве безразличия, тогда ни один
из них явно не предпочитается другому
рххх < рхх2
р2х2 < р2х1. (7.5.5)
Положим р2 = ф1 + Ар) и х2 = (х1 + Ах), тогда из этих
неравенств следует
р1 Дх > О (7.5.6)
(р1 + Др) Дх < О,
поэтому
Др’Дх < 0, (7.5.7)
что и означает отрицательность всех собственно эффектов
замещения.
Несмотря на то что из слабой аксиомы выявленного
предпочтения могут быть получены почти все результаты
теории спроса, она не влечет условия интегрируемости,
которое заключается в том, что матрица эффектов замеще-
ния должна быть симметричной. Эти условия, необходи-
мые для того, чтобы построить функцию полезности [18,
19, 4], дает сильная аксиома выявленного предпочтения,
которая утверждает, что если набор х1 явно предпочтитель-
нее набора х2, набор х2 явно предпочтительнее х3, . . ., х”-1
явно предпочтительнее набора х”, то набор х” не может
быть явно предпочтительнее, чем х1, т. е. для всех п
х1 О х2, х2 0 Xs, ..., хп-1 0 х”
не влечет х” 0 х1. (7.5.8)
Сильная аксиома включает слабую (что соответствует
случаю п = 2), и при определенных качественных условиях
регулярности эти две аксиомы являются эквивалентными.
Сильная аксиома при определенных условиях непрерывно-
сти характеризует некоторое последовательное множество
предпочтений, таких, что удовлетворяются условия инте-
грируемости, необходимые для построения функции полез-
ности.
224
7.£L ПОЛЕЗНОСТЬ ФОН. НЕЙМАНА —
МОРГЕНШТЕРНА
Подход фон Неймана Моргенштерна основывается
на совместном использовании теории полезности и теории
вероятности. Он базируется на некоторых аксиомах о веро-
ятностной смеси наборов товаров. Результатом этого под-
хода является функция полезности, обладающая некото,-
рыми измерительными свойствами, которые могут быть
использованы в процессе решений в условиях риска. Эти
функции называются функциями полезности фон Ней-
мана — Моргенштерна [28, 20, 21, 22, 23, 5].
Основным понятием полезности фон Неймана — Мор-
генштерна является лотерея, которая определяется как
множество наборов, каждый из которых может быть полу-
чен с заданной вероятностью. Лотерея описывается век-
тором-строкой
L = (pi, х1; р2, х2; . . р„ х8), (7.6Д)
которая означает, что набор х1 может быть получен
с некоторой вероятностью рръ набор х2— с некоторой
вероятностью р2, . . и а:8 — с вероятностью ра,
где
рг > 0, г = 1, 2, . . ., 1 2 Рт =*' < (7.6.2)
Г=1
Например, (1, х1) означает то же самое, что х1, — лотерея,
в которой набоф х1 выигрывает наверняка, а (р, х1;
(1 — р), х2) — лотерея, в которой х1 выигрывает с
вероятностью р, а х2 — с вероятностью (1 — р).
Первая аксиома полезности фон Неймана — Морген-
штерна аналогична аксиоме из раздела 7.2. о предполо-
жении существования отношения предпочтения кото-
рое является совершенной полу упорядоченностью всех
лотерей, будучи совершенным, транзитивным и рефлексив-
ным. Безразличие и строгое предпочтение определяете^
здесь так же, как и в разделе 7.2.
Вторая аксиома — аксиома монотонности: пусть даны
два набора х1, х2, для которых х1 > х2; тогда
(р', х1; (1 — р'), х2) > (р, х1; (1 — р), х2), (7.6.3)
если и только если р' >р, т. е. потребитель отдает пред-
15-0270
225
почтение лотерее с большей вероятностью получить пред-
почитаемый набор. В частности,
х1 > (р, х1, (1 — р), х2)
для всех р; 0 < р с 1; (7.6.4)
т. е. набор, который получается наверняка, предпочти-
тельнее любой лотереи, содержащей его и менее пред-
почтительный набор.
Третья аксиома, аксиома непрерывности, утверждает,
что, если даны три набора х1, х2,х3, для которых х1 > х2 > х3,
тогда существует вероятность р, для которой
(р, х1; (1 — р), х3) ~ х2, (7.6.5)
где 0 < р < 1. Это предположение означает, что выбран-
ные соответствующим образом лотереи интерполируют
между предпочтениями в том смысле, что потребитель
не делает различий между лотереей, содержащей более
предпочтительный и менее предпочтительный наборы, и
определенностью получения некоторого набора, занимаю-
щего промежуточное положение.
Четвертая аксиома, аксиома о независимости не свя-
занных между собой альтернатив, утверждает следующее:
заданы два набора х1, х2, для которых х1 ~ х2; тогда для
любого третьего набора х3
(р, х1; (1 — р), х3) ~ (р, д2; (1 — р), Xs),
для всех р, 0 < р < 1. (7.6.6)
Таким образом, присутствие третьего набора не нарушает
предпочтений.
Последней аксиомой является аксиома о приведении
сложных лотерей. Пусть даны т лотерей
Li = (X, х1; pi, х2; . . .; pjxs), i = 1, 2, . . ., m. (7.6.7)
Рассмотрим сложную лотерею
L — (gi, Li; q%, L2; . . .; gmLni), (7.6.8)
под которой имеется в виду лотерея, в которой в качестве
исходов также выступают лотереи, a qt — вероятность
получить лотерею Lf. Согласно этой аксиоме, сложная
226
лотерея может быть приведена к лотерее е подходящими
вероятностями
L ~ L' = (гъ х1; r2, х’)
Г1 = Я*Р1 + «аР? + -.-* + ЯтР™
г2 = 31Р2 + ?2₽1 + - -+ Я™РТ
. . . , (7.6.9)
rs = 31Р1 + ЯгР^ +•'••+ qmp™-
Основная теорема теории полезности фон Неймана —
Моргенштерна утверждает, что при соблюдении этих
аксиом существует функция полезности, определенная
на всех лотереях, которая является однозначной с точ-
ностью до монотонного строго возрастающего линейного
преобразования. Так как одним из особых видов лотереи
является набор, где (1, х) = х, функция полезности опре-
делена для всех наборов, причем
U (х) > U(y)a если и только если х > у. (7.6.10)
В общем виде
8
и (Pi X1; р2’х2 * *; ...; ps, xs)= 2 PrU (xr), (7.6.11)
r=l
т. e. полезность лотереи есть математическое ожидание
полезности, равное взвешенной сумме полезностей набо-
ров компонент, где в качестве весов выступают вероят-
ности.
Функция полезности фон Неймана — Моргенштерна
является однозначной с точностью до монотонного строго
возрастающего линейного преобразования в противополож-
ность обыкновенным функциям полезности, описанным
в разделе 7.2, которые являются однозначными с точностью
до монотонного строго возрастающего (линейного или не-
линейного) преобразования х. Таким образом, если Е7(х) —
функция полезности, то а[7(х) Ъ, где a > 0, тоже яв-
ляется функцией полезности. Ее можно построить, произ-
вольным образом выбрав числовые значения для двух
уровней полезности; полезности других наборов оцени-
ваются соответствующим взвешиванием вероятностями.
1 Другой подход, который также строит функцию полезности
с точностью до монотонного строго возрастающего линейного преоб-
разования, но не использует вероятностных понятий, основан на ак-
сиоматике разностей полезностей. См. [24].
15* 227
Например, предположим х1 > х2 и взяты произвольные
числа U (х1) и U (х2), для которых U (х1) > U (х2); они
представляют собой уровни полезности х1 и х2 соответ-
ственно. Для того чтобы определить полезность любого
другого набора, взвесим эти значения вероятностями.
Например, если х3 — набор, для которого х1 > х3 > х2,
то по аксиоме непрерывности существует вероятность р,
такая, что
(р, х1; (1 — р), х2) ~ х3, (7.6.12)
поэтому
U (х3) = U (р, х1; (1 — р), х2) =
= pU (х1) 4- (1 - р) U (х2), (7.6.13)
где первое равенство следует из того, что безразличные
лотереи доставляют одинаковые значения полезности, а вто-
рое равенство получено из .того факта, что полезность лоте-
реи есть математическое ожидание ее полезности. Если
шкала установлена так, что U (х1) = 50, U (х2) = 10
и р = 0,2, то U (х3) = 0,2 (50) + 0,8 (10) или 18. Анало-
гично, если х4 > х1, то по той же аксиоме непрерывности
существует вероятность р, такая, что
х1 ~ (р, X*; (1 — р), х2), (7.6.14)
поэтому
и (х1) = ри (х4) ч- (1 - р) и (х2), (7.6.15)
или
U (х4) = j U (х4) - (^) U (х2). (7.6.16)
Таким образом, как только выбраны два произвольных
числа, полезность шкалы фон Неймана — Моргенштерна
определена. Поэтому она в некотором смысле аналогична
температурной шкале: если выбраны два значения, все
остальные определяются однозначно.
Следствием теоремы о математическом ожидании полез-
ности является правило рационального поведения в про-
цессе принятия решения в условиях риска. Предположим,
что человек, принимающий решение, должен выбрать одну
из т стратегий: S2, . . ., Sm, где исходом стратегии St
является лотерея Ьг
Li==(Pp Р2> хг2’ --W (7.6.17)
228
В этой записи pf. характеризует вероятность выигрыша
набора х$ при заданной стратегии S(. Поскольку полез-
ность лотереи £г оценивается как
(7.6.18)
то человек, принимающий решение, чтобы максимизиро-
вать полезность, выберет стратегию, которая обеспечивает
наибольшее значение ожидаемой полезности
max U (Li) = max 3 P\U №). (7.6.19)
si r=l
Например, если имеется три возможные стратегии, для
каждой из которых заданы вероятности выигрыша одной
из двух альтернатив (т = 3, S = 2), то оптимальной стра-
тегии соответствует наибольший элемент главной диагона-
ли следующей матрицы:
С7(х}) tf(xj)\
tZ (х|) U (х|)
pl Pl рЦ
Рг Pl Pll
(7.6.20)
где в качестве матрицы полезностей выступает платежная
матрица, как в гл. 6, а вторая матрица состоит из вероят-
ностей.
ЗАДАЧИ
7-А. Доказать, что для отношений безразличия ~и стро-
гого предпочтения >, определенных соотношениями (7.2.2)
и (7.2.3), справедливы следующие утверждения:
1. Отношение безразличия является транзитивным,
рефлексивным и асимметричным.
2. Отношение строгого предпочтения является тран-
зитивным и симметричным.
3. Для двух заданных наборов х и у из С выпол-
няется х > у, у > х, или х у.
4. Если функция полезности существует, то U (х)=
= U (у), если, и только если, х ~ у, в то время как
U (х) > U (у), если, и только если, х > у.
229
7-Б. Доказать, что если Тх является множеством безраз-
личия, определенным в (7.2.10), то:
1. Если у g /х, то 1Х = 1У и х ~ у
2. Если у $ 7Х, то Тх П Ту = ф и выполняется одно
из двух: либо х > у, либо у > х.
7-В. Рассмотрим лексикографические предпочтения, опре-
деленные в примечании на стр. 202.
1. Что является для них множеством безразличия?
2. Показать, что для них не справедлива аксиома не-
прерывности.
7-Г. Показать, что аксиома непрерывности (7.2.11) и
(7.2.12) эквивалентна допущению, что если х1 > х2 >- х3,
то любая непрерывная кривая, содержащая х1 и х3, прохо-
дит через набор х4, такой, что х4 ~ х2.
7-Д. Аксиома выпуклости (7.2.18) и закон Госсена (7.2.21)
являются зависимыми, но не эквивалентными. Показать
их зависимость в случае двух товаров.
7-Е. Показать, что необходимые условия (7.3.11) инвари-
антны по отношению к монотонному строго возрастающему
преобразованию полезности.
7-Ж. Для каждой функции полезности из табл. 7-1 выве-
сти функцию спроса в случае двух товаров (п = 2).
7-3. Предположим, что существует только два товара,
которые потребляются всегда в установленных7пропор-
циях.
1. Показать кривые безразличия и равновесие геомет-
рически.
2. Каковы необходимые алгебраические условия для
равновесия?
7-И. Функция полезности является аддитивной, если1
U (xj ж2, ..., хп) = Ui (х^ 4- Uz (хг) + ... + Un (хп).
1. Доказать, что в случае двух товаров с предель-
ной нормой замещения
Д(11,
функция полезности аддитивна, если и только если
д 92R 9R 9R
dXf дх% dii dxz *
1 См. [25]. «Почти аддитивные предпочтения», для которых мат-
рица Гессе функции полезности является «почти диагональной»,
т. е. когда недиагональные элементы очень малы по сравнение
с диагональными, рассматриваются в работе Бартена [13].
230
2. Какие ограничения на слабое отношение пред-
почтения гарантируют аддитивность функции полез-
ности?
3. Показать, что если функция полезности аддитив-
на, то спрос на каждый товар зависит только от цены
этого товара, цены любого другого товара и общего
расхода на эти два товара.
4. Показать, что в случае, если функция полез-
ности аддитивна, в экономике не будет малоценных
и взаимодополняемых товаров.
5. Показать, что аддитивная функция полезности
предполагает только монотонное строго возрастающее
линейное преобразование полезности.
6. Как изменятся результаты, если U(xit х2, .хп) =
= Е7 (^-1, *^2» • • • ? *^п,) "1“ И . Xn2-f-2i • • •, *Гп)?
7-К. Определим функции спроса Торнквиста [4]
;r = 7+F’ Ж = а7+Г’ 3 = а/(т+^)
для «предметов первой необходимости», «предметов отно-
сительной роскоши» и «предметов роскоши» соответствен-
но, где параметры а, р и у зависят от цен.
1. Найти асимптоты этих функций.
2. Найти эластичности по доходу этих функций.
3. В случае двух товаров спрос на первый выра-
жается функцией Торнквиста для «предметов первой
необходимости» при а=а, P=&Pj и р2 = 1 (второй товар
является единицей счета). Проверить, что соответствую-
щая функция полезности имеет вид
U (хи х^ — х^з^-а(х1-^-Ь—а)~ь.
7-Л. Доказать, что если в пределах определенной группы
товаров цены изменяются Пропорционально, то такую
группу можно рассматривать как один товар, который
называется сложным [1]. (Достаточно рассмотреть три
товара, причем цены двух из них всегда изменяются в оди-
наковой пропорции.
7-М. Доказать, что эластичности по относительным ценам
и доходу равны соответствующим эластичностям по де-
нежным ценам и доходу.
7-Н. Товар Гиффина определяется тем, что предъявляемый
спрос на него возрастает по мере повышения его цены.
234
1. Показать геометрически влияние дохода и влия-
ние замены для товара Гиффина.
2. Проверить, что товар является товаром Гиффина,
если он малоценен и доля дохода, истраченная на этот
1говар, превышает отношение эластичности отрицатель-
ной компенсированной цены к эластичности по доходу
этого товара.
3. Могут ли существовать товары Гиффина, если
выполняется слабая аксиома выявленного предпочте-
ния?
7-0. В (7.4.33) было дано определение взаимозаменяемых
и взаимодополняемых товаров по знаку влияния компен-
сированной цены. Сопоставьте этот критерий с критерием
полезности —
товары / и I являются
(взаимозаменяемыми 1 f <()
i г, если д-— •Г г 0,
(.взаимодополняемыми) oxj oxi [_>J
и с критерием влияния некомпенсированной цены—товары
j И I являются
{взаимозаменяемыми 1 / дх* \
} , если I -д— Н Л 0.
взаимодополняемыми J ' aPi ' (J
Какие точки зрения выражаются в этих различных кри-
териях? Когда они приводят к противоположным резуль-
татам? Являются ли они инвариантными относительно
монотонного строго возрастающего преобразования полез-
ности?
7-П. Показать, что если предельная полезность дохода
у* выражается как функция' параметров у* ~ у* (р, I),
то она однородна степени — 1. Вывести показатели сра-
внительной статики для у* и сопоставить их с соответ-
ствующими показателями для х*, используя (7.4.16) и
(7.4.17).
7-Р. Так как функция полезности определена в простран-
стве всех наборов товаров, а функции спроса выражают
оптимальный набор как функцию цен и дохода, то опти-
мальный уровень полезности косвенно зависит от цен
и дохода
Ц*^Щ^и*^1)г
где
и tpfi U* (р, Г) называется косвенной функцией полезности
(4, 2].
1. Показать, что косвенная функция полезности —
убывающая функция всех цен и возрастающая функ-
ция дохода.
2.
Показать, что
_____dU*!dpj ж 2 »
1------dU*/dI ’
Принцип взимания налогов (равенство «жертв»)
чтобы
3.
требует,
U* (р, Г) — U* (р, I—Т (/)) = const для всех I,
где Т (/) — часть дохода, взимаемого в качестве налога
на доход I. Показать, что, согласно этому принципу, раз-
меры налога будут возрастать с повышением дохода. Най-
ти зависимость налогов от дохода для частных функций
полезности из табл. 7-1.
7-С. Проблема выбора между заработком и досугом может
быть рассмотрена с точки зрения теории потребления.
Тогда задачу можно сформулировать в следующем виде:
max U (х, Z) при условии рх = 14- wh
X, I
где х обозначает набор товаров; I — досуг (dU/dl > 0);
h — рабочее время; w — уровень заработной платы;
I — нетрудовой доход и q — общее наличное время; пара-
метрами задачи являются р, I, w и q.
1. Найти функции спроса для товаров и для досуга.
Может ли быть досуг малоценным? Типа товаров Гиффина?
2. Вывести /показатели сравнительной статики.
3. Построить геометрически кривую предложения
труда, предположив, что в наличии имеется только
один товар.
7-Т. Для того чтобы ввести в теорию потребления понятие
денежного капитала, необходимо предположить, что функ-
ция полезности зависит не только от набора товаров, но
также и от ценности денежного капитала и всех цен, так
как характер спроса на деньги зависит от цен
U = U (х, р0М, р),
где ро обозначает цену денег, а М — денежный капитал
и функция полезности предполагается однородной нулевой
283
степени относительно всех п + 1 цен. Запишем бюджету
ное ограничение
рх = I + г (W - роМ),
где г — норма процента на неденежные активы, a W —
богатство [3, 26].
1. Найти условия равновесия.
2. Найти функции спроса для товаров и денег и по-
лучить показатели сравнительной статики.
7-У. В задаче потребления с направленным нормировани-
ем в дополнение к денежным ценам и доходу в бюджетном
ограничении
px^Z
потребитель встречает еще одно
рх I,
где р = (р4, р2, . . ., рп) — вектор указанных цен, а
I — указанный доход, назначенный потребителю [3, 27].
1. Проиллюстрировать задачу и ее решение гео-
метрически в случае двух товаров.
2. Найти условия равновесия, функции спроса
и показатели сравнительной статики.
3. Как повлияет направленное нормирование толь-
ко одного товара на эластичность спроса ненормиро-
ванных товаров?
7-Ф. В экономике с Н потребителями рыночный спрос
на товар получается путем обобщения индивидуальных
функций спроса. Таким образом, если спрос на товар у,
предъявляемый потребителем h, который имеет доход 1\
записывается как
= /1=1,2,...,^,
ТО рыночный спрос на товар / имеет вид
х}= 3 ^(р. /а)=^(р, т),
h=l J
где I является общим доходом
н
/₽= 3 ih.
h-1
234
1. Показать, что общие расходы равны общим, дохо-
дам
Л |в<
S
j=i
2. Показать, что функции рыночного спроса одно-
родны нулевой степени
Х} (арп ap2, . . apn) = Xj (pt, p2, . . pn, I),
a = a > 0.
3. Обратные функции спроса выражают рыночные
продажные цены как функции от рыночного спроса
и дохода
р* = р* (X, I), т. е. р? = pj (Хи Х2, Хп, 7),
= 1, 2, ..п,
где Х/(р* (X, /), 7) == Хь / = 1, 2, . . п,
I = р*Х.
Показать, что обратнее функции спроса однородны
первой степени относительно дохода, и определить
др*/5Х и др*/д1.
7-Х. Используя аксиомы выявленного предпочтения,
доказать:
1. Существование функций спроса (т. е., что на са-
мом деле любой набор цен и дохода приводит к выбору
единственного набора товаров).
2. Однородность нулевой степени функций спроса.
7-Ц. Показать, что для заданной шкалы полезности фон
Неймана — Моргенштерна:
1. Монотонное строго возрастающее линейное пре-
образование полезности дает новую шкалу полезности,
которая удовлетворяет аксиомам фон Неймана —
Моргенштерна и выводам из них; монотонное строго
возрастающее нелинейное преобразование полезности
несовместимо с этими аксиомами и результатами.
2. Разности и отношения полезностей зависят от ис-
пользуемой шкалы, но относительные величины разно-
стей полезностей (т. е. их отношения) всегда одинаковы
для различных шкал.
235
7-4. Большинство людей, если есть выбор между АпВ,
где
4 = 1 млн. долл, наверняка
В = 1 >
О
млн. долл, с вероятностью
’0,1 '
< 0,89 ,
0,01
выберут А. Большинство людей также, если есть выбор
между С и D, где
(1) (0,11)
С = < Q ( млн. долл, с вероятностью I Q gg г
(51 f0’1!
D — < п ( млн. долл, с вероятностью ) n Q ( »
выберут D. Показать, что, согласно выводам фон Нейма-
на — Моргенштерна, это поведение непоследовательно.
Глава 8
Теория фирмы
Вторым основным понятием микроэкономической теог
рии является фирма, определяемая как некоторая орга-
низация, производящая затраты экономических факторов,
таких, как земля, труд и капитал, для изготовления про-
дукции и услуг, которые она продает потребителям или
другим фирмам Ч Задача рационального ведения хозяй-
ства, с которой встречается фирма (см. табл. 1.2), заклю-
чается в определении количества продукции и в расчете
необходимых для ее выпуска затрат с учетом технологиче-
ской связи между ними и заданными ценами на затраты
(или функциях предложения затрат) и на продукцию
(или функциях спроса на продукцию).
8.1. ПРОИЗВОДСТВЕННАЯ ФУНКЦИЯ
Предположим, что фирма производит только один
вид продукции, используя несколько видов затрат; в этом
случае фирма должна выбрать точку в пространстве зат-
рат, которое состоит из всех возможных комбинаций
затрат. Если обозначить через Xj количество /-го вида
затрат, используемых фирмой, / = 1, 2, ...,«, то век-
тор затрат представляет собой вектор-столбец
х = (a=i, ж2, . . ., хп)’. (8.1.1)
Пространство затрат, I, состоящее из всех возможных век-
торов затрат, является неотрицательным ортантом п-мер-
ного евклидова пространства в предположении, что все
затраты могут непрерывно изменяться
I — х = {(х1; х2, . . j if 0}, / = 1, 2, . . ., п.
_________ (8-1.2)
1 Основная литература по теории фирмы И, 2, 3]. .
237
Каждой точке пространства затрат соответствует един-
ственный максимальный выпуск, произведенный при исполь-
зовании этих затрат. Технологическая связь между выпус-
ком продукции и затратами называется производственной
функцией \ Обозначив через q размеры выпуска, произ-
водственную функцию можно записать в виде
q = / (х) = / (хь х2, . . хп). (8.1.3)
Она представляет собой отображение любого вектора затрат
(точки пространства затрат) в единственное неотрицатель-
ное действительное число, а именно максимальный выпуск,
который может быть получен при использовании этого
вектора затрат. В дальнейшем будем считать, что про-
изводственная функция непрерывно дифференцируема.
Предполагается, что производственная функция удов-
летворяет двум аксиомам. Первая из них утверждает, что
существует подмножество пространства затрат, называе-
мое экономической областью, в которой увеличение любого
вида затрат не приводит к уменьшению выпуска продук-
ции. Таким образом, если х1 и ха — две точки этой области,
то
х1 ха влечет за собой / (х1) / (ха). (8.1.4)
Эта область характеризуется неотрицательностью всех
первых частных производных производственной функции,
которые называются предельными продуктами
= /=1, 2, ..., п. .>(8.1.5)
Определим вектор предельного продукта как вектор-строку
МР (х) = -g- (х) = (MPi (х), МР2 (х), .... МРп (х)), (8.1.6)
тогда экономическая область явится подмножеством про-
странства затрат
{х£/|МР(х)>0}. (8.1.7)
Вторая основная аксиома утверждает, что существует
особая область R, выпуклое подмножество экономической
1 См. [4, 5, 6]. О производственной функции в случае выпуска
нескольких видов продукции см.раздел «Задачи» в этой главе, а более
общая дискуссия о технологии, описанной множествами, а не функ-
циями, приводится в гл. 10.
238
области, для которой малица Гессе производственной
функции
Я»Я(х) = ^(х) (В.1.8)
отрицательно определена для всех х из Я. В этой особой
области производственные множества
{xU |/(x)>g°) (8.1.9)
являются выпуклыми для каждого неотрицательного чис-
ла q°. В ней также выполняется
^(х) = ^(Л/РДх))<0, 7 = 1,2, (8.1.10)
это соотношение называется законом убывающей отдачи
(убывающей доходности): по мере того как затраты одного
вида добавляются к установленным объемам других затрат,
в конечном счете достигается особая область, в которой
предельный продукт затрат снижается. Классическим
примером этого закона является добавление все боль-
шего и большего количества труда в производстве зерна
на фиксированном участке земли. После достижения
определенной точки дополнительный выпуск продукции,
производимый добавочным человеком, будет падать
вследствие исчерпания возможностей специализации
и в связи с трудностями координации усилий1.
Согласно этим двум аксиомам, существует выпуклая
область пространства затрат, называемая особой областью
R и определенная соотношением
R = {х£/ | МР (х) > 0), Н (х) отрицательно
определена. (8.1.11)
Производственная функция в особой области характери-
зуется отдачей (доходом) от расширения масштаба произ-
водства и «возможностями замещения».
Доход от расширения масштаба производства характе-
ризует производственную функцию с точки зрения «пове-
дения» выпуска продукции, если все затраты изменяют-
1 Рассматриваемый автором случай неизменного уровня техники
исчерпывающе разобран В. И. Лениным в статье «Аграрный вопрос
и «критики Маркса» (1901 г.). — В. И. Ленин, Поли. собр. соч.,
т. 5, стр. 100—103.— Прим. ред.
239
ся в одинаковой пропорции. Предположим, что в опреде-
ленной точке пространства затрат х все затраты умно-
жаются по масштабу на число а: ах = (аж4, ах2, . . ахп),
где а > 1. Производственная функция характеризуется
постоянным доходом от расширения масштаба производ-
ства, если выпуск возрастает в той же пропорции, что и
затраты
/ (ах) — af (х). (8.1.12)
Так, например, удвоение всех затрат приводит к увеличе-
нию выпуска продукции в два раза. Аналогично производ-
ственная функция характеризуется возрастающим (убы-
вающим) доходом от расширения масштаба производства,
если она возрастает в большей (меньшей) степени, чем все
затраты
/ (ах) > «) а/ (х). (8.1.13)
Конечно, производственная функция может характеризо-
ваться постоянным доходом от расширения масштаба про-
изводства в одних точках пространства затрат и возрастаю-
щим или убывающим доходом от расширения масштаба
производства в других. Локальным показателем измере-
ния дохода от расширения масштаба производства, опреде-
ленным в некоторой точке пространства затрат, является
эластичность производства
е (х) ~ lim т df-^ = lim ? (од)-, (8.1.14)
а-1 /(о^) da а—1 51па
т. е. эластичность выпуска по отношению к параметру
масштаба а. В случае постоянного (возрастающего, убываю-
щего) дохода от расширения масштаба производства эла-
стичность замещения равна (больше, меньше) единице.
Так как / (ах) = / (аж1; аж2, . • <ххп), то после диффе-
ренцирования обеих сторон по а получим
(3-1-15)
да хЛ d{aLXj) J vi /
i=l
Таким образом, эластичность производства можно запи-
сать в виде
1=1
4240
или
8(х)^-^-(>).' (8.1.17)
Определим эластичность выпуска по отношению к изме-
нению затрат /-го вида как
8>(x)=tW^(x)’ /я,:и2’ (8ЛЛ8)
тогда уравнение (8.1.17) примет вид
е(х)=;ЗеДХ). (8.1.19)
7=1
Таким образом, эластичность производства в любой точке
особой области равна сумме эластичностей выпуска по от-
ношению к различным затратам в этой точке.
Возможности замещения характеризуют ’ производ-
ственную функцию с точки зрения различных комбинаций
затрат, порождающих одинаковые уровни выпуска.
Локальным измерением замещения между двумя затратами,
скажем Xj и х*, когда все остальные затраты остаются
постоянными, в некоторой точке особой области может
служить эластичность замещения между затратами j и Тс,
определенная как
(х) = — ^(МР^/МР^)) ’ 7» * = 1, 2, ...,п, (8.1.20)
т. е. процентное изменение соотношения затрат, делен-
ное на процентное изменение соотношения их предельных
продуктов (знак минус подтверждает, что 0 в особой
области). Эластичности замещения характеризуют кривиз-
ну изоквант, множеств затрат, необходимых для произ-
водства одного и того же уровня выпуска
{х € I I / (х) = </>}, (8.1.21)
где q° — заданный уровень выпуска. Дифференцирование
вдоль изокванты приводит к формуле
п
(8.1.22)
7=1
поэтому, определив dx = (dxif dx2, . . ., dxn)', получаем
MP (x) dx = 0. (8.1.23)
16-0270
241
Если все затраты фиксироЬайы, кроме затрат вида / и i, то
МР} (х) dij 4- MPh (х) dxh — 0; (8.1.24)
поэтому
I - ^Pk (x) ZQ Л OCX
dxh I изокванта MPjtf '
Теперь запишем величину, обратную эластичности заме-
щения (8.1.20) в виде
1___d In (MPh (x)) ~
<Jjk ~ d^{xi/xh) ~
d In (—dxjldxh | изокванта) . „gx
— dln(xj/xh) * 1 • • J
Вышеизложенная характеристика производственной
функции может быть геометрически проиллюстрирована
в случае двух затрат (« = 2), для которых производствен-
ная функция имеет следующий вид:
q = / <&, х2). (8.1.27)
Изокванты выражаются формулой
/ (a:i, х2) = g° = const; (8.1.28)
некоторые из них показаны на рис. 8.1, где наклон изо-
квант из (8.1.25) вычисляется по выражению
^2 I ____MPj (х) .q .
dxt I изокванта Л/Р2(х) ’ , ,
В особой области, заштрихованной на рис.-8.1, оба пре-
дельных продукта неотрицательны, поэтому наклон изо-
квант неположителен. Особая область, совпадающая здесь
с экономической областью, ограничена двумя кривыми,
которые называются разделяющими линиями. Разделяю-
щая линия 1 является геометрическим местом затрат, для
которых наклон изокванты равен нулю (MPi (х) = 0),
а разделяющая линия 2 характеризует геометриче-
ское место затрат, для которых наклон изокванты равен
бесконечности (МР2 (х) = 0). Разделяющая линия 1 пока-
зывает минимальные количества х2, необходимые для про-
изводства различных уровней выпуска. Например, для
того чтобы произвести q, необходимо по крайней мере х2
затрат второго вида. Аналогично разделяющая линия 2 по-
казывает минимальные количества х±, необходимые для
выпуска различных объемов продукции. Например, для
242
того чтобы произвести q, требуется по крайней мере Xi
затрат первого вида.
Рис. 8.1 можно также использовать для иллюстрации
понятия дохода от расширения масштаба производства.
Если производственная функция характеризуется посто-
янным доходом от расширения масштаба производства, то
f (axi, ах^ = af (хь Xj). (8.1.30)
г» 1
Взяв в качестве а = —, получим
g=/(xlt х2) = -^-/(аа:1, ах2) = х1/(1,-^-) , (8.1.31)
т. е. выпуск зависит только от уровня затрат одного вида
(х^ и от отношения затрат (x2/xi'). Вдоль каждого луча,
проходящего через начало координат, такого, как ОН
на рис. 8.1, соотношение затрат постоянно, так что выпуск
продукции зависит только от Например, если количе-
ство затрат первого вида в точке, где ОН пересекает изо-
кванту q, равно удвоенному количеству в точке, где ОН
пересекает изокванту q, то q = 2q. При этом очевидно,
что если производственная функция характеризуется
постоянным доходом от расширения масштаба производ-
16* 243
ства, то все изокванты являются радиальными растяже-
ниями относительно какой-либо одной изокванты.
В качестве иллюстрации закона убывающей доходно-
сти могут служить кривые продукции, как это показано
на рис. 8.2. На верхнем графике построена кривая про-
дукции для затрат первого типа
А (х1)=/(х1|х2), (8.1.32)
показывающая" зависимость выпуска от затрат первого
типа при неизменных затратах второго типа. На нижнем
графике показаны кривые среднего и предельного продукта
APi fa) = £1^- = (8.1.33)
Мр1 (Ж1’ (8Л-34)
244
Первое равенство характеризует выпуск продукции, про-
изведенной на единицу затрат первого вида; второе —
добавочный доход, полученный при использовании допол-
нительного количества затрат первого типа. Геометрически
MPi выражает наклон кривой Ри а APi — тангенс угла,
составленного лучом, проведенным из начала координат
в
На обоих графиках показаны три критические точки:
первая — в которой Pi имеет точку перегиба, где
МР^ достигает максимума; вторая — (arj, в которой луч
из начала координат касается Pt, где APi достигает мак-
симума и равно МР^ третья — (а^), в которой Pt достигает
максимума и Д/Pi равно нулю. Рис. 8.2 иллюстрирует
закон убывающей доходности, так как MPi понижается
в конце концов после первой критической точки.
На рис. 8.2 нашли отражение также три стадии про-
изводства. Первая стадия длится до второй критической
точки, в которой средний продукт достигает максимума
(и равен предельному продукту). На этой стадии предель-
ный продукт превышает средний.
Стадия 1: MPi > APi > 0. (8.1.35)
Вторая стадия находится между второй и третьей критиче-
скими точками. На этой стадии средний продукт превыша-
ет предельный, а последний положителен.
Стадия 2: APi > MPi > 0. (8.1.36)
Третья стадия расположена за третьей критической точ-
кой. На этой стадии предельный продукт отрицателен.
Стадия 3: MPi < 0. (8.1.37)
Если производственная функция показывает постоянный
доход от расширения масштаба производства, то стадии
1 и 3 симметричны. В этом случае эластичность производ-
ства равна единице; поэтому из уравнения (8.1.17) получим
^Xi-^ + x2-IL=XiMPi + xiMPz. (8.1.38)
Разделив это соотношение на Xi и используя прежние
обозначения, получим
APi = MPi+^MP2, (8.1.39)
xi
ИЛИ
МР2^ (APi-MP^ (8.1.40)
245
Таким образом, стадию 1, в которой MPi >• APi, можно
равным образом характеризовать в виде соотношения
МР2 < 0, тогда
Стадия 1: МР2 < 0;
Стадия 3: MPi < 0; (8.1.41)
это показывает симметричность стадий 1 и 3. Такой вывод
также может быть получен нри сравнении рис. 8.1
и рис. 8.2. На рис. 8.2 затраты второго вида зафиксиро-
ваны в размере х2, показываемом горизонтальной линией
на рис. 8.1. Точки и Xi на рис. 8.1 соответствуют анало-
гично обозначенным точкам на рис. 8.2. Соответствие х^
на двух рисунках следует из того, что если затраты второго
вида остаются неизменными на уровне х2, то возрастание х^
вдоль этой горизонтальной линии на рис. 8.1 приводит
к увеличению выпуска, пока не будет достигнуто Жр После
Xi горизонтальная линия проходит через все более низкие
изокванты, поэтому максимальный выпуск находится
в точке Xi, как показано на рис. 8.2. Соответствие Xi на
двух рисунках следует из уравнения (8.1.40). Слева от
на рис. 8.1 изокванты имеют положительный наклон,
потому что МР2 < 0. По (8.1.40) это условие выполняет-
ся, только если MPi > АР^ что характеризует область
слева от х{ на рис. 8.2. Таким образом, если функция пока-
зывает постоянный доход от масштаба, то стадии 1 и 3
не только симметричны, но они соответствуют областям
снаружи разделяющих линий. Экономическая область,
в которой предельные продукты неотрицательны и изо-
кванты имеют отрицательный наклон, соответствует ста-
дии 2, где предельный продукт ниже среднего и поло-
жителен.
Некоторые частные типы производственных функций
в случае двух видов затрат представлены в табл. 8-1.
Для линейной производственной функции характерна
линейная зависимость выпуска от затрат. Производствен-
ная функция Кобба — Дугласа выражает логарифм выпу-
ска’^как линейную’ функцию логарифма [Затрат [7, 8].
Производственная функция затрат — выпуска есть одна
246
Производственные функции в случае двух видов затрат
Таблица 8.1
^Тип производ- ственной функции Производственная функция. 9 =7 (XI, “2) Эластичность замещения е Эластичность производ- ства о Параметры
1 2 3 4 5
Линейная g = e1x1+a2x4 со 1 aj—предельный физический продукт затрат / > 0, / = 1, 2
Кобба—Дуг- ласа . д = Ьох^х^' 1 Ь1+Ьа Ьо—фактор шкалы >0 bj — эластичность выпуска продукции по отношению к затратам j 0, j = 1, 2
Затраты — вы- пуск . /'*1 *а\ g = min | —, — I 4 \ Q с2 / ИЛИ (Xj~^ Cjq, 7 = 1, 2) 0 1, Xj _ хг Ci ~~ с2 Cj—количество затрат вида /, необхо- димое для производства одной еди- ницы продукции > 0, / = 1,2
Анализа спо- собов произ- водственной деятельности Р 5= 3 dkVk А=1 Р 2 djkVk xjt А=1 /=1,2 0 1 р—число способов производственной деятельности УК—уровень интенсивности способа к, к — 1, 2, р dfc—выпуск продукции при единичной интенсивности к, к = 1,2, ...,р djk—количество затрат вида /, необходи- мых при единичной интенсивности способа к,/ = 1,2; к = 1,...,р
С постоянной эластично- стью замеще- ния g=e0[eJa:J_p + -г е2^2 1 1 1+Р h е0—коэффициент шкалы >0 еу—коэффициент распределения >0, 7 = 1, 2 h—степень однородности >0 Р — коэффициент замещения > — 1
х2
Линейная производ-
ственная функция
(б = оо)
х2
Производственная функ-
ция Кобба-Дугласа
Производственная функция
затрат-выпцска
(6=0)
Производственная функция
анализа видов производ-
ственной деятельности
(р=2)(б = 0)
Рис. 8.3. Изокванты для различных производственных функций.
из заданных пропорций, которыми для производства
одной единицы выпуска определяется количество затрат
каждого вида [9, 10, 11]. Производственная функция
анализа производственной деятельности обобщает про-
изводственную функцию затрат — выпуска на случай,
когда существует р элементарных процессов, назы-
ваемых «активностями», каждый из которых может про-
текать при любой неотрицательной «интенсивности».
Выпуск, произведенный при единичной интенсивности,
и затраты, необходимые на единицу интенсивности,
248
фиксированы, а общий выпуск и общие затраты находятся
путем простого сложения выпуска и затрат соответ-
ственно для каждой активности при выбранных интенсив-
ностях х. Изокванты для этих четырех производственных
функций показаны на рис. 8.3. Производственная функция
с постоянной эластичностью замещения (constant elasticity
of substitution, CES), для которой а, эластичность замеще-
ния, равна yqrp» является обобщением производственных
функций трех первых типов: если 0 стремится к —1, CES
стремится к линейной производственной функции (а =
= оо); если 0 приближается к нулю, то CES приближается
к производственной функции Кобба — Дугласа (a = 1);
и если 0 стремится к оо, то CES стремится принять вид
производственной функции затрат — выпуска (ст = 0)
[16, 17].
8.2. НЕОКЛАССИЧЕСКАЯ ТЕОРИЯ ФИРМЫ
Неоклассическая теория фирмы построена на предпо-
ложении, что цель фирмы заключается в максимизация
прибыли путем выбора видов затрат, при заданной произ-
водственной функции и заданных ценах выпуска р и ценах
затрат (оплатах факторов производства) w = (wlt w2, . . .
. . ., wn). Прибыль П равна годовому доходу R за вычетом
издержек производства С, т. е.
П = R - С, (8.2.1)
где годовой доход вычисляется как годовая продукция,
умноженная на цену выпуска. Используя (8.1.3), получим
R = РЯ. = Р/.’(х). (8.2.2)
Издержки производства равны общим выплатам за все
виды затрат
С = 3 wixi — wX- (8.2.3)
___________ j=i
1 См. [12, 13, 14, 15]. Заметим, что задача максимизации выпу-
ска путем выбора неотрицательных затрат превращается в задачу
линейного программирования при анализе производственной
деятельности:
р р
max V dkjfvnpH условии 1 = Ъ 2, ... л,
VI. и, ....Ррь-1 л-1
Vk>0, fc=l, 2,..., #.
Решая долгосрочную задачу, фирма свободна выбрать
любой вектор затрат из пространства затрат, поэтому зада-
ча формулируется следующим образом:
max П (х) = pf (х) — wx при условии х > О, (8.2.4)
X
или в развернутой форме
п
max П(хъ ®2» • • •, xn)==pf{xi, х2, хп) — 2 и-'/®./
XI, Х2, . . . , Хп • 3 = 1
при условии
Xi 0, х2 0, . . ., Хп 0. (8.2.5)
Эта задача представляет собой задачу нелинейного про-
граммирования, в которой в качестве инструментальных
переменных выступает х, вектор затрат; целевая функция
выражается функцией прибыли П (х); единственным огра-
ничением является условие неотрицательности х и заданы
(п + 1) параметров р и w. В противоположность долго-
срочной задаче, для которой характерно, что все затраты
можно произвольно варьировать, при краткосрочной появ-
ляются ограничения на выбор затрат, как4, например, пони-
женные лимиты на определенные затраты из-за договор-
ных обязательств. В краткосрочной задаче фирма дол-
жна выбрать вектор затрат из заданного подмножества про-
странства затрат, так что к задаче (8.2.4) добавляется ряд
ограничений
g (х) < Ь, (8.2.6)
или
gi to, Х2, . . xn)^bi, i = 1, 2, . . ., m, (8.2.7)
где эти т неравенств выражают ограничения на затра-
ты для определенного краткосрочного периода.
В условиях долгосрочности необходимыми условиями
для максимизации прибыли являются условия Кун а —
Таккера
ап df . . Л
-aT==P^-(x)-w^°
^•x = (p|(x)-w)x=0 (8.2.8)
х 0.
250
Таким образом, для всех затрат
pMPj(x)=p-^(x)^.wj, j = lt2,...,n (8.2.9)
и
pMPj (х) = Wj, если Xj > 0 )
л а™ Л Ь = 1. 2, .... п, (8.2.10)
Х]= 0, если р MPj (х) <.Wj J '
где рМРj (х) представляет собой стоимость предельного
продукта в точке х, т. е. стоимость добавочного выпуска,
полученного при использовании добавочных затрат /-го
вида.
Предположим, что все затраты были действительно
использованы (х > 0), тогда условия первого порядка
будут иметь вид
р-^(х) ^рМР(х) = w, (8.2.11)
т. е. стоимость предельных продуктов равна плате за
затраты факторов производства. Точка из особой области,
определенной в (8.1.11), удовлетворяющая (8.2.11),
является решением задачи фирмы для долгосрочного пери-
ода, так как удовлетворяются условия первого порядка
и условия достаточности второго порядка.
Условия первого порядка
•ф;(х)врД-(х)-^ = 0, /==1, 2, .... п (8.2.12)
можно разрешить относительно оптимальных затрат, если
матрица Якоби
J = ^(х) oxi х ' 4*Чх) dxi ' ' 4^-(х)... Зад х ' 4*2-(х) ... Зад ' ' 4^-(х)^ За:п ' ' ^-(Х) дхп ' ' = рН (8.2.13)
( Зад ' ' -JMx) ... Зад ' 1 -^(х) 3zn v ' J
невырожденна. Предположим, что вектор затрат х лежит
в особой области; тогда матрица Якоби невырожденна
251
и оптимальные уровни затрат могут быть выражены как
функции (и 1) параметра задачи
х* = х* (р, w), (8.2.14)
т. е.
х* = х* (р, иц, w2, . . ., wn), j = 1, 2, . . n. (8.2.15)
Эти n уравнений образуют функции спроса на затраты,
выражающие оптимальные выборы затрат как функции цен
продукции и плат за факторы производства. Эти функции
однородны нулевой степени, так как, умножая цены и пла-
ты на положительный коэффициент шкалы а, меняя (р, w)
на (ар, aw) в (8.2.4), мы изменим П на all, а максимиза-
ция all, где а > 0, эквивалентна максимизации П. Таким
образом,
х* (ap, aw) = х* (р, w) для всех а > 0. (8.2.16)
Подставляя функции спроса на затраты в производствен-
ную функцию, получим выпуск как функцию цен продук-
ции и платы за факторы производства
q* — / (х* (р, w)) = q* (р, w), (8.2.17)
т. е. функцию предложения выпуска. Так как функция
спроса на затраты однородна нулевой степени, то и для
функции предложения продукции справедливо
q* (ар, aw) = q* (р, w) для всех a > 0, (8.2.18)
поэтому пропорциональное изменение в ценах продукции
и плате за факторы производства не влияет ни на затраты,
ни на выпуск продукции.
Полученные результаты можно проиллюстрировать
геометрически в случае двух видов затрат. На рис. 8.4
показаны изокванты, как на рис. 8.1, а также изокосты
(isocosts), геометрические места точек, для которых издер-
жки производства постоянны
х = {(xi, х2)' | С = wtXt + w2x2 = const}. (8.2.19)
Так как иц и w2 предполагаются заданными, изокосты
являются параллельными линиями с наклоном
-£4 = —. (8.2.20)
“^1 |изокоота
Изокванты из (8.1.29) имеют наклон
MPgx) /Я2 2П
dxi |ИЗоНМж,. МР,(х) ’ (в.^^1)
252
Запишем условия второго порядка
pMI\ (х) = Wi
рМР2 (х) = ш2,
требующие пересечения изоквант и изокост
dxg I ______MPj (х) __ dx2 I
dxij (изокванта MP% (x) dx^ (изокоста.
(8.2.22)
(8.2.23)
Геометрическое место пересечений изокост и изоквант опре-
деляет собой долгосрочный путь расширения. Он показыва-
ет затраты, максимизирующие выпуск продукции при
любом определенном уровне издержек или равнозначно
затраты, минимизирующие издержки при определенном
уровне выпуска, где уровень издержек определяется изо-
костой, а уровень выпуска — изоквантой. Используя
путь расширения изокванты и изокосты, можно получить
кривую издержек С (q), выражающую издержки как
функцию выпуска. Типичная^кривая издержек и соответ-
ствующие ей кривые средних и предельных издержек пока-
253
АС=СреЭние изЗержки
МС=ПреЗельные издержки.
Рис. 8.5. Кривые издержек.
ваны на рис. 8.5 как CL, ACL и MCLt где нижний индекс
относится к долгосрочному периоду
CL = u>iXi 4- и?2^2 = Ci (q)
ACl = ^^
J /„> (8.2.24)
dq
Заметим, что при $2 в точке перегиба CL кривая MCL
достигает минимума; при qt, где луч, проведенный из на-
чала координат, касается Съ, кривая ACL достигает мини-
254
мума и две кривые пересекаются (ACL = MCL); слева
от qif где MCL лежит ниже ACl, кривая ACL убывает;
справа от ?4, где MCL лежит выше ACL, кривая АСЪ воз-
растает.
Частный случай краткосрочного периода, для которого
затраты первого вида зафиксированы на уровне xlt пока-
зан вертикальной линией на рис. 8.4, представляющей
собой путь расширения для этого краткосрочного периода.
Тогда соответствующими кривыми издержек будут кратко-
срочные кривые издержек Cs, АС& и МС8, как это пока-
зано на рис. 8.5. В точке х на рис. 8.4, где пересекаются два
пути расширения, выпуск и издержки одинаковы, поэтому
в соответствующей точке ?на рис. 8.5 краткосрочные и дол-
госрочные издержки равны. Все остальные точки на крат-
косрочном пути расширения не оптимальны в том смысле,
что при определенном уровне выпуска, заданном изокван-
той, издержки не минимальны. Таким образом, на рис. 8.5
краткосрочные издержки и средние издержки для любого
выпуска, отличающегося от q, больше соответствующих
долгосрочных издержек и средних издержек. При qt и qa
соответственно краткосрочные предельные и средние издер-
жки достигают своего минимального значения и отношения
между издержками, средними издержками и предельными
издержками для долгосрочного и краткосрочного периодов
одинаковы. Положительная ордината FC кривой издер-
жек является фиксированными издержками и опреде-
ляет издержки при нулевом выпуске, в данном случае
равные WiXi.
Кривая издержек характеризует (минимальные) издер-
жки при различных уровнях выпуска. Тогда оптимальным
уровнем выпуска является решение задачи
шахП (?) = pq~С (q), (8.2.25)
{?}
которое в виде условий первого порядка требует, чтобы
цены равнялись предельным издержкам
(8.2.26)
а условия достаточности второго порядка утверждают,
что предельные издержки должны возрастать в этой точке
$>» (8.2.27)
255
Рис. 8.6. Определение оптимального выпуска продукции черев
доход (валовой) и кривые издержек.
Поэтому оптимальный выпуск на рис. 8.6 находится в q* и
характеризует оптимальный уровень предложения выпус-
ка при ценах выпуска р и заданных платах за затраты
факторов производства, которые были использованы при
построении кривых издержек.
8.3. СРАВНИТЕЛЬНАЯ СТАТИКА ФИРМЫ
Методом сравнительной статики определяется чувстви-
тельность оптимальных затрат и выпуска фирмы к измене-
ниям параметров задачи [1, 2, 18]. Подставляя функцию
спроса на затраты (8.2.14) и функцию предложения продук-
256
ции (8.2.17) в необходимые условия (8.2.11) и производ-
ственную функцию (8.1^3), получим (п + 1) тождеств
q*(p, w))
df . .. (0.3.1)
P-^-(*(P. w))sw-
Дифференцируя эти тождества по (« + 1) параметрам р
и w, определим степень чувствительности оптимальных
затрат и выпуска продукции.
Рассмотрим сначала влияние изменения цены выпуска р.
Дифференцируя (8.3.1) по р, получим
dg* _ VI df Sx*
dp Za dxk dp
h = l
df , _ X? в2} A ,• 4 *>
dxj+P Zl dzjdzh dp “°’ 7 —2» •••> n
или в векторно-матричных обозначениях
dq df Эх
dp Эх dp
^- + pH-^ = O.
Эх 1 r dp
(8.3.3)
где dqldp характеризует изменение оптимального выпуска
продукции, если меняется его цена; дх/др — влияние
изменения цены продукции на оптимальные затраты
dq __dq* (р, w)
"°Р ,опп
Эх __/ dxff (р, w) dx% (р, w) dxfj (р, w) \' ' ’ ’ '
dp \ dp ’ dp » • • •» Qp J ’
df/dx — вектор-строка предельных продуктов, a H —
матрица Гессе. Уравнения (8.3.3) могут быть записаны
в виде одного матричного уравнения
(8.3.5)
17-0270
257
Затем рассмотрим влйййие изменения в оплате затрат
Z-ro вида. Дифференцируй' (8.3.1) по wi, получим
dq* _ чт, df tog
dwi dzft toj
ft=l
(8.3.6)
п
р 2 дх j дх^ du>i
k = i
Используя векторно-матричные обозначения, зти уравне-
ния для I = 1, 2, . . ., п можно записать в следующем
виде:
dzf
dxt „
к ~6tJ, 7 = 1, 2,
., n.
/ dq \' df dx
\ dw ) dx dw
r dw ’
где dqldy/ — влияние изменений в оплатах затрат на про-
дукцию, a dx/5w — влияние изменений затрат при изме-
нении оплат факторов производства
дд __ / dq* (р, w) dq* (р, w)
dw \ du\ ’ dw2 ’
(8.3.7)
3w
dxf (p, w)
dw±
dx% (p, w)
dwi
dxf (р, w)
dw2
to? (р, w)
dw2
to* (p, w)y
’ ton /
dxf (p, w)
to^
dx^ {p, w)
ton
. (8.3.8)
tog (p, w)
toi
ten (P< *)
dw2
tog (р. w)
ton
Уравнения (8.3.7) могут быть записаны в виде одного мат-
ричного уравнения
/_1 4-
О
I
(8.3.9)
\ 0 рН/1 -g-
r \ dw
Уравнения (8.3.5) и (8.3.9) можно представить в форме
у at ч / to to
\ о рн) \
г \ др d-w
О 0\
Jf_\' J, (8.3.10)
’ to / */
£58
которая является основным матричным уравнением теории
фирмы. Разрешая его относительно показателей сравни-
тельной статики, получим
Jtfx -1 / 0 0\
ох I рМ' . (8-3-И)
pHj V
Так как в Особой области матрица Гессе Н отрицательно
определена и, следовательно, невырожденна, то, используя
правила обращения блочных матриц, имеем
/_4 JL\-i /-1
I дх j = I
V о pH/ \ о
-Ан-1
р дх
— н1
р
(8.3.12)
Поэтому, выполнив матричное умножение (8.3.11), получим
д9______
др ~ р \дх ) “ \дх I
=-±н-Ч-^М'
др Р \дх)
\ dw ) Р \ дх }
-^=—н-1,
OW р ’
(8.3,13)
(8.3.14)
(8.3.15)
(8.3.16)
характеризующие в явном виде показатели сравнительной
статики в терминах цены продукции, матрицы обратной
к матрице Гессе и вектора предельного продукта.
Так как Н считается отрицательно определенной, Н-1
тоже отрицательно определена и, следовательно, из
(8.3.13)
<>0. (8.3.17)
Таким образом, возрастание цен продукции всегда приво-
дит к увеличению оптимального уровня выпуска продук-
ции, т. е. кривая предложения продукции должна быть
возрастающей. Кривая предложения показана на рис. 8.6
как заштрихованная часть кривой предельных затрат,
которая находится выше средних затрат, так как оптималь-
ный выпуск определен на таком уровне, где цена равна
17* 259
предельным издержкам, и заштрихованная часть верти*
кальной оси до минимальных средних издержек, так как
при цене, меньшей, чем средние издержки, продукция не бу-
дет выпускаться; действительно, нулевая прибыль более
предпочтительна, чем отрицательная, в долгосрочном
цериоде.
Относительно знаков отдельных элементов дх/др ни-
чего определенного сказать нельзя, но из того факта,
что
дд___Э/ Дх V дх> л
др дх др ~ дх/ др ;
i—l
(8.3.18)
следует, что в особой области, где все предельные продук-
ты неотрицательны, некоторые из дх$!др должны быть
положительными
дзЛ
Для некоторого у, j — 1, 2, ..., п. (8.3.19)
Таким образом, возрастание цены продукции должно при-
вести к увеличению предложения продукции и, следова-
тельно, к повышению спроса на некоторые виды затрат.
По определению:
затраты /-го вида называются малоценными, если, и только
если,
-^-<0. (8.3.20)
Таким образом, по (8.3.19) не все затраты могут быть мало-
ценными.
Из (8.3.14) и (8.3.15) следует, что
дд___ дх
др ’
(8.3.21)
ли
дд* __
dwj др ’
/ = 1, 2, ..., п, (8.3.22)
поэтому возрастание цены продукции приводит к повыше-
нию (понижению) спроса на определенные виды затрат,
если, и только если, увеличение платы за этот вид затрат
приводит к сокращению (возрастанию) оптимального
выпуска. В частности, увеличение платы за малоценные
280
затраты ведет к увеличению выпуска. Из (8.3.21) и (8.3.18)
имеем
дд df дх
др дх др =
df 9q __
дх dw
2^1г>0' (8-328)
3=1
поэтому в особой области справедливо, что
3g*
ди>]
для некоторого j,
j = l, 2, ..., п, (8.3.24)
т. е. возрастание платы за некоторый вид затрат должно
привести к уменьшению выпуска продукции.
Из (8.3.16) следует, что
("Sw ) симметрична и отрицательно определена. (8.3.25)
В частности, элементы вдоль главной диагонали отрица-
тельны
дх*
diOj
о,
/-1, 2....п.
(8.3.26)
Таким образом, повышение платы за затраты фактора
некоторого вида всегда приводит к сокращению спроса
на эти затраты. В противоположность теории потребления
для фирмы не могут существовать «затраты Гиффина»,
потому что фирма в отличие от потребителя не должна
удовлетворять бюджетному ограничению. Поэтому кри-
вые спроса на затраты всегда убывающие. Так как при рав-
новесии MPj = Wjlp, кривая спроса для затрат первого
вида показана на рис. 8.2 как заштрихованное простран-
ство, совпадающее с кривой предельного продукта ниже
некоторого уровня, определенного из условия, что при-
быль должна быть неотрицательной (и, следовательно,
зависимой от расходов на другие затраты и цен продук-
ции), и совпадающее с вертикальной осью выше этого
уровня.
Матрица Зх/dw симметрична
9xf
dwi dwj ’
j, 1 = 1, 2, ...» n, (8.3.27)
поэтому влияние изменения платы за затраты l-го вида
на спрос, предъявляемый на затраты j-го вида, и влияние
изменения платы за затраты J-го вида на спрос, предъяв-
261
ляемый на закаты l-го, вида, одинаковы. По определению
{взаимозаменяемыми ]
„ г
взаимодополняемыми J
если 4-^-1 > 10. (8.3.28)
OWI ( '
Например, в случае когда плата за затраты j-ro вида воз-
растает, так что размеры спроса на эти затраты падают,
спрос на затраты i-ro вида увеличивается (понижается),
если затраты являются взаимозаменяемыми (взаимодопол-
няемыми).
8.4. НЕСОВЕРШЕННАЯ КОНКУРЕНЦИЯ.
МОНОПОЛИЯ И МОНОПСОНИЯ
Последние два раздела были построены на классиче-
ском предположении о совершенной конкуренции, т. е., что
заданы все цены, включая цену продукции и цены затрат.
Однако во многих случаях фирма обладает некоторой
монопольной властью оказывать влияние на цену продук-
ции, а монопсония имеет власть оказывать влияние на цены
затрат.
Монополист имеет возможность влиять на цену продук-
ции путем варьирования выпуска своей продукции, для
которой^кривую спроса можно записать в следующем виде:
р = р(?). (8.4.1)
Эта функция характеризует цену, которую фирма может
назначить при различных уровнях предложения продук-
ции. В общем случае фирма может снизить свою цену для
того, чтобы продать больше продукции, поэтому
^<0. (8.4.2)
Поскольку годовой доход (валовой) определяется как
R (9) = Р (?) Ч, (8.4.3)
а предельный доход — как изменение годового дохода
цо мере того, как меняется выпуск продукции
2lf7?(g)=-g-(g) = p+^-g, (8.4.4)
202
в случае монополии предельный доход оказывается меньше
цены.
Монопсонист может повлиять на цену затрат пу-
тем варьирования своих покупок данного вида зат-
рат
j = l,2, ..., п. (8.4.5)
Эта функция характеризует плату фирмы за затраты при
различных уровнях спроса на них. Вообще фирма мо-
жет покупать большее количество данного фактора про-
изводства, только предложив более высокую плату за
него, т. е.
^>0, /-1.2......п. (8.4.6)
Так как стоимость затрат /-го вида (издержки на затраты
/-го вида) можно представить в виде
Cj = Wj{x})xj, (8.4.7)
а предельная стоимость затрат /-го вида отражает изме-
нения в стоимости этих затрат при увеличении их коли-
чества
МСу (xj) = (х}) + х}, (8.4.8)
то в случае монопсонии предельная стоимость затрат пре-
вышает их оплату.
7* $ Тогда задача фирмы в условиях несовершенной конку-
ренции может быть представлена в виде
шах П = р (g) д— «’у (*;) х) я . q
9,Xi, .. .,хп 2=1 \О.Ч.У)
при условии д = /(а?1, ®2, •••» хп).
Введем множитель Лагранжа и запишем функцию Лаг-
ранжа
Ь(д, xlf Хг> ..., хп, y)=p(q)q— 3 Wi(xj)xj +
+ У (f (хъ • • • Г Хп)—д). (8.4.10)
263
Необходимые условия для оптимума находятся прирав-
ниванием нулю всех частных производных функции
Лагранжа
^=-^(*>) + 4^ + уД = 0, 7 = 1. •••. » (8.4-11)
..., хп) — q = 0.
Тогда необходимые условия будут иметь вид
y-t+^1 (8.4.12)
/=1-2......” <8Л13>
®г» . -^п). (8.4.14)
Первое условие показывает, что в условиях оптимальности
множитель Лагранжа равен предельному годовому доходу
» = Р + 4г<7 = МЯ. (8.4.15)
Вторая группа условий, состоящая из п уравнений, показы-
вает, что предельный продукт любого вида затрат, рав-
ный предельному валовому доходу, умноженному на пре-
дельный продукт этого вида затрат, в условиях опти-
мальности равен предельной стоимости этих затрат
MRPj^MRMP^Wj + ^-Xj^MCj, 7 = 1, ...,п.
(8.4.16)
В последнем условии представлена просто производствен-
ная функция. Таким образом (« + 1), условия, связываю-
щие п видов затрат и выпуск при несовершенной конку-
ренции, следующие:
MR (q*) МР} (х*, х*, ..., а*) = МС;(х*), 7=1, .... п
$АЛ1}
в*в/(®о •••. «*).
где MR (q) и МС; (xj), задаются соотношениями (8.4.4)
264
Рис. 8.7. Равновесный выпуск продукции для монополиста.
и (8.4.8) соответственно. Так как оптимальная предельная
стоимость выпуска равна
МС}(х*) ,
MC(q*) = х*, z*) ’ /= 1» 2» • • •> га> (8.4.18)
то условия (8.4.17) означают, что предельный годовой
доход равен предельной стоимости
MR (q*) = МС (g*). (8.4.19)
Это условие равновесия показано геометрически на
рис. 8.7, где предельный годовой доход «срезает» пре-
дельные издержки сверху,
265
8.5. КОНКУРЕНЦИЯ СРЕДИ НЕМНОГИХ.
ОЛИГОПОЛИЯ И ОЛИГОПСОНИЯ
Рыночный механизм, когда действует небольшое число
фирм, называется конкуренцией среди немногих’, случай,
когда существует несколько продавцов продукции, назы-
вается олигополией, а когда несколько покупателей неко-
торого вида затрат, называется олигопсонией [19, 20,
21]. Определяющим свойством конкуренции среди немно-
гих является то, что все конкурирующие фирмы могут
влиять на цены продукции или затрат; таким образом,
прибыль каждой фирмы зависит от политики всех осталь-
ных конкурирующих фирм. Поэтому, для того чтобы
определить оптимальную политику (максимизирующую
прибыль), каждая фирма должна учитывать не только
свое прямое влияние на рынки выпуска и затрат, но
и косвенное влияние — через взаимодействие своих кон-
курентов.
Необходимо отметить важную общность между кон-
куренцией среди немногих и теорией игр. В обоих слу-
чаях исход (прибыль или выигрыш) для одного агента
(фирмы или игрока) зависит от действий (затрат и выпус-
ков или стратегий) всех остальных агентов.
I В случае двух конкурентов каждый производит про-
дукцию, используя производственную функцию
q1 = f1 (ж}, а£, . . х„)
, , A 3 3 34 (8.5.1)
q =f* C4 «1- •..» *n)»
где через q1 обозначается выпуск фирмы 1, q* — выпуск
фирмы 2, х] — уровень использования затрат J-го вида
фирмой 1 и хJ — уровень использования затрат /-го вида
фирмой 2, / — 1, 2, . . ., п. Цены продукции опреде-
ляются обоими уровнями выпуска
Р = Р (91, 92). (8.5.2)
т. е. если оба выпуска возрастут, то в результате цены
понизятся
-£-<0, -Й-<0. (8.5.3)
ag* oq£ ' '
Цена любого вида затрат определяется покупками этого
вида затрат обеими фирмами
Wj — w3 (xj, х*), j = 1, 2, . n, (8.5.4)
268
т. е., если обе фирмы увеличивают покупки этих видов
затрат, результатом является повышение цен.
dwj
/=1, 2................ (8.5.5)
Сформулируем задачу одной фирмы, скажем первой, в слу-
чае конкуренции между двумя фирмами
max IP = p(g1, д2)?1—3 Xj)x}
«*.*1..Ч (8.5.6)
при условии 51 = /1(^> #2» . .., хп)'
Функция Лагранжа для этой задачи может быть записана
в форме
£ = p(g1, q^q1 — .3 W]{x» х])х} +
+ y(f1(x^A.....^)-в*), (8.5.7)
где через у обозначен множитель Лагранжа. Условия
первого порядка для решения этой задачи будут иметь
следующий вид:
Л+^+в'тр-^г-»=0
«-----„дд
dxl 3' 3 33 3 dxj 3 dx] dx 1
+ ^ = 0’ /-1’2............ <8*5-8)
4, ..., a£)-gi = O.
Исключив множитель Лагранжа, запишем (n-f-1) условие
Lp + 9 \ dqi + dp dqi / J dxj
, diet divj dxj . „
= и;> + а^-^_4—^г-^-. /"1, 2, ..., n (8.5.9)
zj, ...» ®J).
Выражения
dg^Sg1 и дх]/дт}, J = 1, 2, ...» n
267
называются здесь предположительными вариациями,
первое из них показывает изменение в выпуске продук-
ции второй фирмы при изменении выпуска первой фирмы,
а вторая группа характеризует влияние изменений в затра-
тах j-ro вида первой фирмы на величину затрат j-ro вида
второй фирмы. Эти (« + 1) выражения являются «пред-
положительными», потому что они должны быть выдви-
нуты первой фирмой, т. е. первая фирма должна сделать
некоторые предположения относительно реакции конку-
рента на выбранную ею политику. Относительно этих
выражений можно сделать разные предположения, каж-
дое из которых ведет к различному анализу конкуренции
среди немногих. Некоторые из этих альтернатив могут
быть проиллюстрированы, если рассмотреть частный слу-
чай — случай дуополии.
В дуополии существует только два продавца товара.
Если предположить, что товар однороден, производится
при постоянных предельных издержках и продается
согласно линейной функции спроса, то промышленный
выпуск продукции равен
3 = 91 + З2, (8.5.10)
функция спроса может быть представлена в виде
р — а — Ъ (q1 + З2)» а > 0, Ь > 0, (8.5.11)
а кривые издержек будут иметь вид
С1 = cq1 + 'd )
+ «>0. (8-5.12)
где с — предельные издержки, a d — фиксированные
издержки. Фирма 1 будет получать прибыль
п1 = [a - Ъ (q1 + g2)] f — cq1 — d, (8.5.13)
которую она хочет максимизировать путем выбора д1.
Запишем условия первого порядка для максимума
^. = [а_&(д1 + ?2)}_й?1_&^.д1_с = 0, (8.5.14)
где dffldq1 — предположительная вариация, в данном
случае влияние изменения выпуска продукции первой
фирмы на выпуск фирмы 2.
Анализ дуополии Курно основан на предпосылке, что
предположительные вариации равны нулю, т. е. что
268
каждый из дуополистов считает, что изменения в его
собственном выпуске продукции не повлияют на конку-
рента. Тогда равновесие Курно можно определить как
пару уровней продукции (q1, q2), полученную при допу-
щении о нулевых предположительных вариациях
dip I
(8.5.15)
= 0.
Заметим, что даже при этом упрощении решение для (д1,
q2) потребует одновременно решить для каждой фирмы
условия первого порядка; эта существенная одновремен-
ность присуща задачам олигополий. Учитывая вышеизло-
женное, запишем первое условие
а - Ъ (g1 + q2) - bql - с = 0. (8^5.16)
Так как q3 = q1, то равенство
= <8-5Л7)
представляет собой равновесие Курно, Тогда равновес-
ные рыночные цены и промышленный выпуск продукции
будут определяться по формулам
д—|—2 с 2 (д^—• cl .q л о\
р = д = -^. (8.5.18)
Эти результаты могут быть обобщены на случай F фирм;
тогда имеем
«'-ТГЙГ- t = Р
р—^г (8-5.19)
д.... F (g~g)
b
В пределе, по мере того как число фирм приближается
к бесконечности, равновесие Курно стремится к равно-
весию в условиях совершенной конкуренции. Если
F -> оо, индивидуальные объемы qf —> 0, а цены р —> с,
эти значения являются конкурентным равновесием, при
269
котором каждая фирма производит ничтожно малое коли-
чество продукции и поэтому не влияет на цену товара;
в этом случае цена равновесия равна предельным издерж-
кам.
Динамику при подходе Курно можно анализировать
с помощью кривых реакции, которые показывают опти-
мальный выпуск продукции каждой фирмой при задан-
ных выпусках продукции конкурентом. Предположив
временной лаг, равный одному периоду, и используя
упомянутые уравнения для равновесия Курно, запишем
следующие формулы для кривых реакции:
f (t + 1) = + = a—c—bqHt) t (8 5 20)
Решением этой пары разностных уравнений являются
траектории движения двух выпусков во времени t. Кривые
реакции и некоторые упорядоченные траектории показаны
на рис. 8.8. Например, начиная из (0, q2), первая фирма
устанавливает выпуск продукции, тогда вторая фирма
«подгоняет» свой выпуск к этому новому выпуску фирмы
Рис. 8.8. Кривые реакции и равновесие Курно для дуополии.
1 и т. д. до тех пор, пока не будет достигнута точка равно-
весия Курно. На каждом шаге этого процесса динамичес-
кой подгонки изменение выпуска одной фирмы вызывает
изменение выпуска другой. Тем не менее обе фирмы при-
нимают допущение Курно о том, что выпуск конкурента
зафиксирован. Из этого следует, что предположение Кур-
но, беспрестанно опровергаемое динамикой решения,
является достаточно наивным.
При более сложном анализе учитывается вероятная
реакция конкурента, т. е. допускается ненулевая пред-
положительная вариация. Примером может служить
анализ дуополии Стэкелъберга, когда одна или обе фирмы
считают, что конкурент будет вести себя, как дуополист
Курно. В вышеизложенном примере предположим: фир-
ма 1 полагает, что фирма 2 будет реагировать соответст-
венно кривой реакции Курно
= (8.5.21)
Тогда предположительная вариация будет равна
поэтому, используя (8.5.14), получим
= (8.5.23)
и кривая реакции фирмы 1 будет иметь следующий вид:
gl=a c-dg2 (8.5.24)
~2Ь
Тогда результаты для обеих фирм будут зависеть от пове-
дения фирмы 2. Если фирма 2 пользуется кривой реакции
Курно, как полагает фирма 1, то решением является
равновесие Стэкелъберга для фирмы 1
?2=т- <8-5-25)
Здесь фирма 1 получает большую прибыль, а фирма 2 —
меньшую, чем при равновесии Курно. Однако предполо-
жим, что фирма 2 не пользуется кривой реакции Курно,
а действует сама согласно кривой реакции Стэкелъберга,
т. е. каждая фирма неправильно предполагает, что дру-
271
гая использует наивное допущение Курно. В результате
получаем неравновесие Стэкельберга
q^q2-^, (8.5.26)
и ,
при котором обе фирмы получают меньшую прибыль, чем
при равновесии Курно. Различные результаты могут
быть проиллюстрированы матрицей выплат, как пока-
зано на табл. 8.2, где две наличные стратегии каждой
фирмы выражаются кривой реакции Курно и кривой
реакции Стэкельберга, а выплаты характеризуют при-
быль, полученную двумя фирмами х.
Таблица 8-2
Матрица выплат для двух фирм, каждая из которых
может выбрать либо кривую реакции Курно, либо кривую
реакции Стэкельберга
Фирма 2
Фирма 1
Кривая
реакции
Курно
Кривая
реакции
Стэкель-
k берга
Кривая реакции
Курно
(32, 32)
Равновесие Курно
(36, 18)
Равновесие Стэ-
кельберга для
-фирмы 1
Кривая
реакции Стэкельберга
(18, 36)
Равновесие Стэкель-
берга для фирмы 2
(23, 23)
Неравновесие Стэ-
кельберга
Еще один способ иллюстрации этих различных реше-
ний показан на рис. 8.9, на котором приведены кривые
реакции рис. 8.8. На рис. 8.9 также показаны изопро-
фиты, которые представляют собой геометрические места
равных прибылей для каждой фирмы. При этом под при-
былью имеется в виду высшая для обеих фирм «монополь-
ная точка» на оси. Кривые реакции соединяют точки,
характеризующие максимум кривых равной прибыли для
каждой фирмы. Кривые реакции пересекаются в точке
1 Здесь предполагается, что (а — с)а/Ь = 288, d = 0. Надо
отметить, что терминология дуополии не согласована с терминоло-
гией теории игр. Единственной точкой равновесия в смысле теории
игр в табл. 8.2 является неравновесие Стэкельберга.
272
ч
г
Монопольная
точка для
фирмы 2
Оптимальная
поверхность ~
Симметричная
совместная
максимизация
Кривая реакции Эля фирмы 1
Кривая равной привь/ли для фирмы 2
а-с
ь
О
а-с
2Ь
а-с
3b
а~-с --
а-с а-с а-с
4Ь ЗЬ 2Ь
Монополь-
ная точка
Зля фирмы 1
Равновесие Стэкельберга Зля фирмы 2
Неравновесие Стэкель-
оерга
Равновесие Курно
Равновесие Стэкель-
берга для фирмы 1
Кривая
реакции
Эля фирмы 2
а-с 1
b
Кривая ровной
привили Эля
фирмы 1
Рис. S.9. |Различные решения для дуополии.
равновесия Курно так же, как показано на табл. 8-2.
Равновесие Стэкельберга для фирмы 1 находится в точке
касания кривой равной прибыли для фирмы 1 с кривой
реакции второй фирмы; равновесие Стэкельберга для
фирмы 2 находится в точке, в которой кривая равной
прибыли для фирмы 2 касается кривой реакции первой
фирмы. Неравновесие Стэкельберга лежит выше равно-
весия Курно.
На рис. 8.9 также нашли отражение и другие воз-
можные решения. Предположим, что фирмы пришли
к соглашению максимизировать общую прибыль. Тогда
они бы индивидуально выбрали такие q1 и д2, которые бы
максимизировали общую прибыль
шах П = П14- П2 = [а — b (q1 + g2)] (g1 + g2) —
в1, q2
— + —2d. (8.5.27)
18-0270
273
Решение должно удовлетворять условию
^ = ^ = [a-btf + q*)]-b(q' + ?)-c = ()t (8.5.28)
так что
91 + 98=-^. (8.5.29)
Это соотношение определяет оптимальную поверхность
на рис. 8.9. Центр этой оптимальной поверхности находит-
дится в точке
51 = «a = V-’ (8.5.30)
которая является симметричной точкой совместной макси-
мизации. Оптимальная поверхность соединяет «монополь-
ные точки» [(а — с)/2Ь, 0] и [0, (а — с)/2&], и эту поверх-
ность можно определить как геометрическое место точек
касания кривых равной прибыли двух фирм, т. е. таких
точек, для которых выполняется
5Ш/5?2 — Л12/5д2 •
Так как в пределах этой поверхности ни одна из фирм
не может увеличить свою прибыль, не уменьшив прибыль
конкурента, то ее можно рассматривать как оптимальную
поверхность по Парето для дуополистов.
Таким образом, даже в простейшем случае дуополии
можно привести несколько типов решения. На самом
деле существует еще больше возможных подходов к этой
простой задаче и намного больше — к общей задаче конку-
ренции среди немногих. Избыток решений задачи анало-
гичен такому же богатству решений игровых задач с более
чем двумя игроками. На самом деле некоторые типы реше-
ний, предложенные здесь, прямо противоречат правилам
теории игр. Примеров этому очень много. Что касается
полных теорий для предельного случая игр одного или
двух лиц или игр с бесконечным числом игроков, то они
существуют для единичного монополиста или монопсо-
ниста и в задачах, где частных фирм так много и они
так малы, что не могут повлиять на цены; это случай совер-
шенной конкуренции. В промежуточных случаях, когда
имеется несколько игроков или несколько конкурирую-
щих фирм, существует много возможных подходов, но
единой теории нет и вряд ли она возможна.
274
ЗАДАЧИ
8-А. Для каждой производствеииой функции, Показан-
ной в табл. 8.1:
1. Доказать соответствующие результаты для
И 8.
2. Показать геометрически кривые полного физиче-
ского продукта, среднего физического продукта и пре-
дельного физического продукта.
3. Распространить рассуждения на п продуктов.
8-Б. Для производственной функции CES доказать, что
1. При р — 1 функция CES принимает вид
линейной производственной функции.
2. При р -> 0 функция CES принимает вид про-
изводственной функции Кобба — Дугласа.
3. При р —> оо функция CES принимает вид про-
изводственной функции затрат — выпуска.
В каждом случае показать, как параметры соответствую-
щей производственной функции зависят от параметров
функции CES (например, для 8-Б. 2 показать, как b0, bi
и &2 определяются через е0, «1, ^2, Р и h при р -> 0).
8-В. Некоторые авторы определяли закон убывающей
доходности как очевидное уменьшение скорее среднего,
чем предельного продукта. Показать, что ни одно из этих
двух утверждений не является следствием другого.
В частности,
1. Показать, что производственная функция
/(xt, =
имеет убывающий предельный продукт (для х2), но
не имеет убывающего среднего продукта.
2. Показать, что производственная функция
fir. х
7 (2-1, 2-27 — 2-2 ^2^_х2
имеет убывающий средний продукт (для х2), но не
имеет убывающего предельного продукта.
8-Г. По отношению к последней задаче показать, что если
предельный продукт убывает повсюду, то и средний про-
дукт также убывает повсюду. Показать на примере, что
обратное утверждение неверно. Проиллюстрировать гео-
метрически.
8-Д. Показать, что если производственная функция харак-
теризуется убывающей предельной нормой замещения
18* 275
и возрастанием дохода от расширения масштаба произ-
водства, то она квазивогнута, но не вогнута. Привести
пример такой функции в случае двух видов затрат.
8-Е. Показать, что если производственная функция
<1 = / fri, *2)
характеризуется постоянным доходом от расширения
масштаба производства, то:
1. Разделяющие линии ц лучи, проходящие через
начало координат, и — в экономической области —
предельные и средние продукты обоих видов затрат
являются убывающими функциями затрат.
2. Равнопропорциональное изменение затрат не
влияет на предельный и средний продукт, которые
зависят только от соотношения затрат х2/х^.
3. Эластичность замещения имеет вид
df df
&xt дх2
а = э2/
dxi дх2
и G можно выразить как функцию отношения факто-
ров X2IXi.
4. При заданных ценах путь расширения является
лучом, проходящим через начало координат, кривая
издержек линейна (постоянные предельные издержки);
фактическая оплата затрат зависит только от соотно-
шения факторов; существует граница цен факторов,
характеризующая фактическую оплату одного вида
затрат как функцию фактической оплаты другого вида
• затрат. Найти эластичность границы цен факторов.
8-Ж. Производственная функция q = / (х) является супер-
аддитивной, если
/(х1 + х2)>/(х1)+/(х2),
где х1 и х2 — некоторые векторы затрат.
1. Показать, что супераддитивная производствен-
ная функция имеет возрастающий интегральный доход
от расширения масштаба производства
/ (Zcx) > kf (х),
к—положительный множитель, но не имеет просто
возрастающего дохода от расширения масштаба произ-
водства.
276
2. Показать, что если производственная функция
супераддитивна и, кроме того, г i
/ (х1 + х2) = / (х1) + / (х2), если х1 — сх®, с = const,
то она характеризуется постоянным доходом от рас-
ширения масштаба производства.
8-3. При заданных ценах найти функции спроса на затра-
ты и функции предложения продукции для фирмы, исполь-
зующей два вида затрат при производстве готовой про-
дукции и технология которой отражена
а) производственной функцией Кобба — Дугласа;
б) производственной функцией затрат — выпуска;
в) производственной функцией CES.
8-И. Для фирмы, характеризующейся в краткосрочном
периоде условием, что она должна использовать по край-
ней мере определенное минимальное количество каждого
вида затрат, описать условия первого порядка и интер-
претировать геометрически в терминах изокост и изо-
квант равновесие при максимизации прибыли.
8-К. Вывести результаты сравнительной статики для
компенсированного изменения в оплате одного вида затрат,
где компенсация, принимающая форму изменения цен
продукции, гарантирует, что оптимальный уровень вы-
пуска продукции остался неизменным.
В частности, показать, что общий эффект от измене-
ния в оплате одного вида затрат можно подразделить на
влияние замены, при которой выпуск продукции остается
постоянным, и влияние масштаба производства, при
котором объем выпуска продукции изменяется.
8-Л. Фирма в условиях конкуренции с указанным нор-
мированием дополнительно к денежным платам за затраты
должна платить государству указанную плату Wj за еди-
ницу используемого вида затрат J, где
п
i=l
I обозначает общий объем средств, предоставленных
фирме. Получите новые
а) условия равновесия;
б) функции спроса на затраты и функции предложе-
ния продукции;
в) результаты сравнительной статики.
277
8-М. Кривая издержек характеризует минимальные из-
держки при производстве различных объемов продукции
С (q), где затраты «закупаются» на конкурентном рынке.
1. Используя метод классического программиро-
вания, построить кривую издержек (т. е. решить
задачу на минимум издержек при заданном уровне
выпуска продукции). Описать условия первого и вто-
рого порядков.
2. Для фирмы в условиях совершенной конкурен-
ции найти кривую издержек, используя производствен-
ную функцию Кобба — Дугласа.
3. Показать, что
C — Aq1/*,
где е — эластичность производства, и оптимальный
выпуск поэтому получается всегда при 0 < е < 1.
8-Н. Одним из способов описания «многопродуктовой»
фирмы при использовании нескольких видов затрат для
производства нескольких видов продукции является
построение производственной функции
O(q, х) = Ф(д4, q2, ..., qm; xit х2, ..., хп)<0,
где qt обозначает уровень выпуска продукции i, ъ х} ~
уровень затрат вида / и где
<9Ф р. * л
—^0, 1 = 1, 2, ...» т
dqt^ ' ’
5Ф . п .
-s—>0, 7 = 1, 2, ..., га.
dxj ’
Тогда прибыль определяется по формуле
n(q, x) = pq — wx= 3 PiQi — S WjXj,
i=l 3=1
где p и w — векторы заданных цен затрат и выпуска
соответственно. Найти необходимые условия равновесия,
решив задачу
maxn(q,x) при условии Ф^, х)<10, q>0, х^О.
q, х
8-0. По отношению к последней задаче одним из способов
описания технологии «составные затраты — составной
выпуск» является анализ способов производственной
деятельности, при котором фирма выбирает неотрицатель-
278
ные уровни способов производственной деятельности
У — (Уь • • ч Vp)' Для производства выпуска продукции
Ч = Ay,
используя вектор затрат
х = By,
где А — заданная матрица т X р; В — заданная матрица
п X р. Найти оптимальные уровни способов производ-
ственной деятельности. При каких обстоятельствах уро-
вень деятельности равен нулю?
8-П. Пусть монополист характеризуется линейным пре-
дельным валовым доходом и квадратической кривой пре-
дельных издержек
MR = а — bq
МС = с — dq + eg®,
где издержки зафиксированы на уровне /, а все параметры
положительны.
1. Найти валовой доход, издержки, спрос и средние
издержки.
2. Найти прибыль, максимизирующую выпуск
продукции, и максимальную прибыль.
3. Найти ставку акцизного сбора (налог с единицы
продаваемого товара), который максимизирует доход
от налогов.
4. Найти наивысшую цену, которая максимизирует
выпуск продукции.
8-Р. Найти оптимальное множество выбора переменных
для дискриминирующего монополиста, продающего свою
продукцию на двух различных рынках, на каждом из
которых существует заданная функция спроса. Будет ли
выпуск больше у дискриминирующего', 'или у недискри-
минирущего монополиста?
8-С. В фирме Баумоля целью управляющих является
максимизация объема продаж при ограничении, озна-
чающем, что прибыль не снизится ниже заданного уровня
[22].
1. Определить равновесный уровень затрат и вы-
пуска продукции. Проиллюстрировать геометрически.
2. Описать результаты сравнительной статики.
279
3. Противопоставить влияние акцизного сбора,
налога на валовую выручку от продажи и налога на
прибыль фирмы Баумоля с аналогичными налогами
на фирму, стремящуюся к максимизации прибыли.
8-Т. Расходы на рекламу могут увеличить валовой доход,
но при этом уменьшить прибыль
П = R (q, А) - С (q) - А,
где А характеризует расхода,на рекламу и
Каков оптимальный уровень расходов на рекламу?
8-У. Противопоставить решение Курно для дуополии
решению Бертрана, в котором каждая фирма устанавли-
вает свою цену, предполагая, что другие не изменяют свою.
Описать решение Бертрана алгебраически и геометрически.
Показать, что в анализе Бертрана возможны колебания
цен, если введены верхние лимиты на выпуск каждой
фирмы.
8-Ф. Особая кривая спроса в теории олигополий основы-
вается на предположении, что если фирма снижает цену,
то конкуренты также снизят свои цены, но, если фирма
повышает цену, конкуренты не последуют ее примеру.
Таким образом, кривая спроса для фирмы относительно
эластична (е > 1) над общераспространенными ценами
и относительно неэластична (е < 1) ниже этих цен. Пока-
зать равновесие геометрически и объяснить, почему цены
имеют тенденцию к устойчивости в такой ситуации.
8-Х. Экономика содержит F конкурирующих фирм, и функ-
ция спроса фирмы / на затраты i-го вида имеет следующий
вид:
Ж = (р, u?i, и>2, • • •, »n); i = 1, 2,. . ., п, f = 1, 2,..., F,
где р — цена выпуска и и?!, и>2, . . ., — цены затрат.
Общий спрос на п видов затрат характеризуется сумми-
рованием индивидуальных функций спроса
F
Xt = 5j %i, i = 1, ..., n.
Показать, что
dXt
dwj 3ioj *
i, / = 1, ...rn.
Глава 9
Общее равновесие
Задача общего равновесия заключается в анализе
взаимосвязи двух основных элементов микроэкономики —
потребителей и фирм, в терминах цен и объемов товаров
и затраченных ресурсов х. Взаимосвязь между основными
элементами показана на рис. 9.1 в виде круговой диа-
граммы потоков. Потребители, располагающие набором
некоторых факторов, в том числе рабочей силой, полу-
чают доход от их продажи на рынке и используют его для
приобретения товаров на рынке товаров. Фирмы исполь-
зуют факторы для того, чтобы произвести товары. Таким
образом, в задаче общего равновесия заданными считаются
вкусы и ресурсы потребителей и технологические про-
цессы фирм-производителей.
При изучении экономического взаимодействия между
потребителями и фирмами важное значение имеет описа-
1 Теория общего равновесия рассматривается в книгах [1, 2, 3,
4, 5, 6, 7, 8, 9].
Товарные рынки
Рынки факторов
Рже. 9.1. Круговая диаграмма потоков.
ние тех условий, которые необходимы для существова-
ния равновесия, установление обстоятельств, при которых
оно единственно, и анализ его устойчивости. Таким обра-
зом, в теории общего равновесия существует три основ-
ные проблемы: существование, единственность и устой-
чивость равновесия х.
9.1. КЛАССИЧЕСКИЙ ПОДХОД ПОДСЧЕТ
УРАВНЕНИЙ И НЕИЗВЕСТНЫХ ВЕЛИЧИН
Классический подход к общему равновесию основы-
вался на таком методе, при котором для каждого частного
потребителя и фирмы в экономике перечислялись усло-
вия равновесия и подсчитывалось количество уравнений,
описывающих эти состояния равновесия [10, И].
Рассмотрим экономику, производящую п товаров (вы-
пусков) и имеющую т факторов (видов затрат). Пусть
Pj есть цена /-го товара, / = 1, 2, . . ., п, тогда вектор-
строка
Р = (Pi, Рг, • • ; Рп) (9.1.1)
характеризует цены выпуска. Аналогично, обозначив
через гщ оплату г-го фактора, i = 1, 2, . . ., т, получим
вектор-строку
w = (wu w2, . . ., wm). (9.1.2)
Предполагается, что экономика является конкурентной
в том смысле, что все потребители и фирмы действуют по
заданным ценам.
В экономике существует F фирм, каждая из которых
производит затраты на рынке факторов для изготовления
1 Некоторые другие проблемы, встречающиеся в теории общего
равновесия, включают сравнительную статику (изучение чувстви-
тельности равновесия к изменениям определенных параметров),
вычисление равновесных цен (изучение алгоритмов нахождения равно-
весия) и оптимальность равновесия (изучение экономики благо-
состояния). Проблема оптимальности рассматривается в следующей
главе, посвященной экономике благосостояния; материал, изло-
женный в ней, тесно связан с материалом даннойГ главы. Дейст-
вительно, в ряде случаев, особенно при обсуждении конку-
рентного равновесия, здесь мог быть использован материал гл. 10.
282
продуктов, продаваемых на рынке товаров. Пусть 4 —
количество первичных затрат г-го вида, «купленных»
фирмой /, a cfj — объем выпуска /-го продукта, продавае-
мого фирмой /. Тогда прибыль этой фирмы nf будет состоять
из годового дохода от продажи за вычетом стоимости
покупок
лу= 3 Pi^i— 3 wi^i, /==1, 2, . ..,Е. (9.1.3)
j=l i=l
Пусть cf — вектор-столбец, составленный из объемов
товаров, проданных фирмой /
с' = (4, 4, . . М 4)', (9.1.4)
Н — вектор-столбец, составленный из объемов факторов,
«купленных» фирмой /
rz = (И, 4......4,)'. (9.1.5)
Тогда прибыль фирмы / может быть выражена соотноше-
нием
nf = pc* — wr\ / = 1, 2, . . F. (9.1.6)
Каждая фирма максимизирует сумму своей прибыли при
условии выполнения ограничения в форме производ-
ственной функции, которую можно записать в общем
виде неявной функцией
ФЧ4,4.........4; 4, 4, .. • >4.)=Ф/(4, 4) = 0. (9.1.7)
Сформулируем задачу для фирмы /
max л* = pcf — wr^ при условии
е^, rf
ф'(<?, г')=о. (9.1.8)
Функция Лагранжа для этой задачи записывается сле-
дующим образом:
Lf = рс/ — vrrf -|- у1 (Ф^ (с\ г^)), (9.1.9)
где yf — множитель Лагранжа для фирмы /. Предпола-
гается, что фирма производит продукцию каждого вида
и потребляет все виды факторов. Необходимым условием
283
максимизации прибыли при ограничении в виде произ-
водственной функции является выполнение соотношений
dLi . f дФГ n
йГ=°
dLf . f „
что приводит к уравнениям
^^F=-P
ф^с', r') = 0
(9.1.10)
(9.1.11)
с n + m + 1 неизвестными с/, H, уЛ Так как эти уравне-
ния справедливы для каждой из фирм (/ = 1,2, . . ., F),
в итоге мы получаем (т + п + 1) F уравнений для задачи
общего равновесия.
В экономике есть Н потребителей, каждый из которых
владеет определенным фактором, как, например, рабо-
чая сила, который он может продать на рынке факторов
по заданным ценам и получить доход. Кроме этого, каж-
дый потребитель может иметь свою долю в фирме и полу-
чать часть прибыли. Общий доход от продажи факторов
и участия в деле используется на покупку товаров по
заданным ценам на рынке товаров. Пусть Cj обозначает
количество /-го товара, купленного потребителем h, а
г? — количество i-ro фактора, проданного потребителем h.
Тогда полезность, получаемая потребителем h, завися-
щая и от потребленных товаров и от предоставленных
факторов, будет выражена функцией
t7fc=uh(c?, ch2,...,chn- rhi, rh2, ...,1<) = LJft(ch, r'1),
(9.1.12)
где сЛ — вектор-столбец товаров, потребленных потреби-
телем h, a rh — вектор-столбец факторов, предложенных
потребителем h
— Cj, .. .,<£)'
(9.1.13)
284
i* = (rt Г2, ...,4)', Ь=1,2,...,Я. («.1.14)
Запишем бюджетное ограничение для потребителя h'
mF п
ЪтЛ+Ъ shfnf = S М, (9.1.15)
i=l /=1 ;=1
где первая сумма в левой части выражает общий доход
от продажи факторов; вторая показывает доход потреби-
теля как собственника, где shl — доля участия потреби-
теля h в фирме /. Выражение в правой части характери-
зует общий расход. Участие потребителя h в фирмах
обобщено вектором-строкой
sA = (sA1, ?2. ...,shF), (9.1.16)
а прибыль всех фирм записывается вектором-столбцом
л = (л1, л2, . . ., л*)', (9.1.17)
поэтому бюджетное ограничение может быть записано
в виде:
wrA4~sAn = рс\ (9.1.18)
Таким образом, для потребителя h задача формулируется
следующим образом:
max Uh (cA, rA) при условии
ch Th
wrA-|-sAn = pcA.
Запишем функцию Лагранжа для этой задачи
Lh=Uh(ch, г'1)-|-уА (wrA-|-shn — pch),
(9.1.19)
(9.1.20)
где yh — множитель Лагранжа для потребителя h. Пред-
полагается, что потребитель покупает товары всех видов
и предлагает некоторое количество факторов всех видов.
Необходимое условие максимизации полезности при вы-
полнении бюджетного ограничения может быть выражено
системой уравнений
dLh dUh h n
-тт — У P = °
дс11
dUh , K n
----------k uw = 0
drh drh ”
— wrA -J- sA л—pcA = 0,
dyh -Г F- .
де h
д1Л
(9.1.21)
285
ЧТО дает (n-j-m + 1) уравнений с (п-\-т + 1) неизвест-
ными. .
— = /₽
ас* * v
(9.1.22)
wrft + sftn—pcft = O.
Так как эти уравнения справедливы для каждого из Н
потребителей (Л = 1, 2, . . ., Н), то в итоге мы получаем
(т + п + 1) Н уравнений для задачи общего равновесия.
Следующая группа уравнений связана с рыночным
механизмом и устанавливает, что общая сумма спроса
на любой товар или фактор должна быть равна сумме
предложения этого товара или фактора. Равновесие на
товарных рынках порождает п уравнений
н Р ’
2 4 = 2 4 j = l, 2, ...,п, (9.1.23)
Л=1 /=1
а равновесие на рынках факторов порождает т уравнений
н 'Р
2 4= 2 Н, 4 = 1,2, ...,тп. (9.1.24)
л=1 /=ц
Следовательно, описание рыночного механизма дает
(т + п) уравнений.
Уравнения (9.1.11) для всех /, (9.1.22) для всех ht
(9.1.23) и (9.1.24) — все вместе дают (тп п + 1) (F -f-
+ Н) + (т + п) уравнений. Основное равенство тео-
рии общего равновесия, закон Вальраса, утверждает,
однако, что общая величина спроса должна быть равна
общей величине предложения при какой-либо системе
цен. Из этого вытекает, что одно из полученных урав-
нений не является независимым от всех остальных.
Для иллюстрации закона Вальраса рассмотрим бюд-
жетное ограничение (9.1.15). Проведем суммирование
по всем потребителям
Нт Н п
2 2«v*+2«'=S 2 рЖ (9.1.25)
h=l i=l h=l i=i
При этом мы воспользовались тем фактом, что сумма долей
по всем потребителям для каждой фирмы должна быть
286
равна единице, так как общая собственность владельцев
каждой фирмы составляет 100%. Уравнение (9.1.25)
означает, что общий доход всех потребителей вместе
с общей прибылью всех фирм равняется общей стоимости
товаров; этот вывод используется при подсчете нацио-
нального дохода. Пользуясь определением прибыли
(9.1.3), получаем
Н т F п т
2 S u,«ri+ 2 (S — 2
Л=1 i=l /=1 j=l i=l
= Й (9.1.26)
/i=i j=i
или, сгруппировав выражения,
т Н Г
Л—1
П Н F
-2рЛ24-24). • (9.1.27)
1=1 Л=1 /=1
Из этого выражения закона Вальраса сразу же следует,
что одно из уравнений общего равновесия зависимо от
остальных. Например, предположим, что все рынки нахо-
дятся в состоянии равновесия, кроме рынка последнего
фактора
н F
2 ei ~ i = 1» 2, ..., П
н‘ (9-1.28)
2 2 И, i = l, 2, ...,m —1.
Л-1 /=1
Подставив эти выражения в (9.1.27), в правой части полу-
чим нуль, так как каждое выражение в скобках обра-
щается в нуль; все члены в левой части также будут
нулями, кроме последнего; поэтому
Н F
uUS г?-2 Г0=О (9.1.29)
Л=1 /=1
требует равновесия на рынке^последнего фактора при
предположении, что значение шт ненулевое. Таким обра-
зом, последнее уравнение может быть выведено из осталь-
ных.
287
В соответствии с законом Вальраса мы имеем
(т + п + 1) (F + Н) + (т + п—1) независимых урав-
нений. Теперь рассмотрим число неизвестных. Для каж-
дой фирмы / существует набор п объемов продаваемых
товаров, т покупаемых факторов и множитель Лагранжа
o', rf, yf, f — i,2,...,F, (9.1.30)
т. e. всего (n + m + 1) F неизвестных. Каждого потре-
бителя h характеризует n купленных товаров, т продан-
ных факторов и множитель Лагранжа
с\ гл, у\ h — i,2....,H, (9.1.31)
т. е. (n-f-m + l)# неизвестных. Наконец, существуют
цены товаров и факторов
р, w. (9.1.32)
Но решение задачи (9.1.8) для каждой фирмы при ценах
(р, w) является также решением и при ценах (ар, aw), где
а — некоторая положительная константа. Это вытекает
из того, что максимизация omf эквивалентна максимиза-
ции л/. Аналогично решение задачи (9.1.19) для каждого
потребителя при (р, w) является также решением при
(ap , aw) для всех а > 0, так как, умножая все цены
на неотрицательный коэффициент, мы умножаем на него
обе стороны бюджетного ограничения. Таким образом,
все функции спроса и предложения являются однород-
ными нулевой степени при любых ценах; зто означает, что
множество цен можно пронормировать, выбрав один
выпуск или затраты в качестве единицы счета и измерив
все цены относительно него. Например, выбрав первый
товар в качестве единицы счета и взяв поэтому a = i/pi,
запишем относительные цены в виде вектора
/ Р w \ _. / j Р* Рз Рп и?! Ш2 Wm \
\ Pl ’ Pl / \ ’ Pl ’ Р1 ’ “ ’ Р1 ’ Р1 ’ Р1 ’ ’ ” Р1 /
(9.1.33)
Таким образом, в итоге мы получим (п + т — 1) цен-
ностных отношений или относительных цен в качестве
неизвестных, причем в данном случае все цены выражены
относительно цены первого товара, общее число неизвест-
ных поэтому будет (пг 4- п + 1) (F + Н) + (т + п — 1),
равное числу уравнений. Конечно, равенство количества
288
неизвестных количеству уравнений не является ни необ-
ходимым, ни достаточным условием для существования
равновесия. Это также не означает, что решение, если оно
существует, является «содержательным» в том смысле, что
объемы покупаемых или продаваемых товаров не отри-
цательны. Эти недостатки классического метода преодоле-
ваются с помощью более современных подходов к теории
общего равновесия.
9.2. ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ
В ПРИМЕНЕНИИ К МОДЕЛИ
«ЗАТРАТЫ—ВЫПУСК»
В экономике, которая описывается производственными
функциями типа «затраты — выпуск», задача общего рав-
новесия приводит к задаче линейного программирования
и существование содержательного решения может быть
строго доказано
Как и раньше, экономика производит п товаров,
потребляя т первичных (невоспроизводимых) факторов.
Пусть Xj обозначает выпуск всей экономикой товара 1 2
Xj, j = 1, 2, ...,«, a rt — общие затраты фактора I,
i = l, 2, . . ., т. Заметим, что часть выпуска может
быть продана как товары производителя другим фирмам.
Обозначим через х^ количество k-го товара, потреблен-
ного для производства /-го товара и через rtj количество
i-ro фактора, затраченного при производстве /-го товара;
запишем производственную функцию типа «затраты —
выпуск» для товара /
. / xij x2j xnj rlj r2j rmj \
Xj = mm I---, ---, . • •,-, -г— , -г— , •.., -г— I ,
\ ац a2j anj^ o-jj b2j bmj /
/ = 1, 2, (9.2.1)
Постоянные параметры ah] и Ьц — это технологиче-
ские коэффициенты, неотрицательные величины, характе-
1 См. [12, 13, 14, 4]. При рассмотрении метода «затраты —
выпуск» см. раздел 8.1 нашей книги, а также [15, 16, 17, 18, 4, 8].
2 В отличие от предыдущего раздела затраты и выпуски
не будут подразделяться на затраты и выпуски потребителей и фирм.
Тогда гг представляет собой общий объем фактора i, имеющийся
в распоряжении всех потребителей, и общие затраты этого фактора
всеми фирмами. Однако в процессе анализа в этом разделе потреби-
тели и фирмы могут быть разделены [3,19].
19-0270
289
ризующие количество i-ro продукта и г-го ресурса соот-
ветственно, необходимое для производства одной единицы
товара j. При этом предполагается, что для каждого про-
дукта / существует по крайней мере один ресурс i, такой,
что btj > 0, т. е. по крайней мере один первичный фактор
требуется для производства каждого товара.
В предположении, что цены на все товары, факторы
и прибыль положительны, максимизация производства всех
продуктов требует, чтобы все аргументы функции min (...)
были равны между собой и, следовательно, равны выпуску
продукции. Таким образом, согласно уравнениям пропор-
циональности
Xbi — ahiXi, 7, Л = 1, 2, ..., л,
п i-i 2 т i-i 2 п <9’2-2)
т. е. затраты продуктов и факторов, необходимых для
производства любого продукта, пропорциональны выпуску
этого продукта; при этом коэффициентами пропорциональ-
ности являются технологические коэффициенты х.
Выпуск каждого продукта либо затрачивается в про-
изводстве товаров, либо удовлетворяет конечный спрос.
Таким образом, согласно балансовым уравнениям
п
хк = S хм + сь, k — (9.2.3)
7=1
где xh — выпуск продукта к; первое выражение в правой
части характеризует общие затраты продукта к для произ-
водства всех остальных продуктов; второе выражение
в правой части ch — конечный спрос на продукт к, включая
потребление, инвестиции, экспорт и государственные
расходы.
Комбинируя балансовые уравнения и соотношения
пропорциональности, получаем
п
= 2 flkjXj с^, & = 1, 2, .,., n, (9.2.4)
7=1
1 Технологические коэффициенты в данном случае были выве-
дены из производственной функции типа «затраты-выпуск». Однако
по теореме замещения затраты пропорциональны выпуску даже
в случае, если в производственных функциях общего вида появ-
ляются возможности замещения при условии, что имеется только
один дефицитный фактор — отдача, постоянная по масштабу,—
и не существует взаимосвязанных продуктов [20, 21, 4, 7].
290
где левая часть отражает выпуск, а два выражения в пра-
вой части — затраты и конечный спрос соответственно.
Эти п уравнений, записанные в матричной форме, пред*
ставляют собой уравнение Леонтьева
х = Ах + с, (9.2.5)
где х — вектор-столбец выпусков; А — матрица п X п
технологических коэффициентов, а с — вектор-столбец
конечного спроса
012 • • • Oin
O22 . . . 02n
On2 • • • Onn
(9.2.6)
Oil
O21
Onl
все йлементы здесь, как указано, не отрицательны. Пред-
ставим уравнение в виде
(I - А) х = с, (9.2.7)
где I — единичная матрица п X п. Если матрица (I — А)
невырожденная, то уравнение Леонтьева может быть раз-
решено относительно выпуска, необходимого для произ-
водства заданного вектора конечного продукта
х = (I - А)-1 с, (9.2.8)
где (I — А)-1 называется матричным мультипликатором,
так как изменение конечного продукта на Дс вызывает
изменение выпуска Дх = (I — А)-1 Дс1.
1 Обратная матрица к I — А существует и не отрицательна, если
удовлетворяются условия Хоукинса — Саймона, т. е. все главные
миноры I — А положительны. Тогда обратная матрица может быть
19* 291
Теперь рассмотрим первичные факторы (ресурсы). Ко-
личество фактора i, необходимое для выпуска х}, из (9.2.2),
вычисляется по формуле
~ btjZj, i = 1, 2, . . ., т; j = 1, 2, . . ., n, (9.2.9)
поэтому суммирование по всем выпускам дает спрос всей
экономики на i-й фактор
(9.2.10)
j=i j=i
Но спрос на i-й фактор не может превышать его предло-
жение
3 btjXj^n, i = l, 2, .. .,ш, (9.2.11)
>=i
где Г| отражает реальное предложение фактора i. В мат-
ричном обозначении имеем
Вх^г, (9.2.12)
где х — упомянутый выше вектор-столбец выпусков; В —
матрица технологических коэффициентов производства
факторов размерности т X п, аг — вектор-столбец на-
личных первичных факторов
все элементы которых не отрицательны.
Цены в экономике, как и раньше, характеризуются
двумя векторами-строками
P = (Рп Рг, • • •, Рп) > °>
w = (wb w2, . . ., wm) > 0, (9.2.14)
найдена (или аппроксимирована) как степенной ряд матриц:^ “
(I-А)-‘ = 1+А +А2+ • • • = (ам).
где а^у — количество продукта к, необходимого для производства
одной единицы конечного выпуска продукта /. Тогда из (9.2.8)
общий выпуск может быть записан в виде:
с+Ас-)-А2с-|-...,
где с — конечный продукт, Ас — выпуск, необходимый для произ-
водства с, А2с — выпуск, необходимый для производства Ас, н т. д.
292
где Pj — цена продукта /, wt — цена фактора I и все
цены не отрицательны, в то время как некоторые из них
положительны. Предполагается, что экономика конкурент-
на, т. е. все экономические единицы (потребители и фир-
мы) пользуются заданными ценами.
Так как в условиях равновесия при совершенной кон-
куренции в производственном процессе не создается ника-
кой прибыли, средние издержки производства любого
товара должны быть больше или равны цене этого товара
3 Pkakj+ 3 wibij^pj, j = l,2,...,n. (9.2.15)
fe=l i=l
В левой части этого выражения показаны средние издерж-
ки, где Pk<ikj — стоимость того количества товара к, кото-
рое необходимо для производства одной единицы товара /;
toibij — стоимость фактора I, необходимого для производ-
ства одной единицы товара j. Суммирование по всем това-
рам и факторам дает издержки производства одной едини-
цы продукта /. Используя матричное обозначение, условие
неприбыльности записывается в виде
рА + wB > р. (9.2.16)
^группировав выражения, получаем
р (I - А) WB. (9.2.17)
Имея в виду предположения, сделанные нами относи-
тельно метода «затраты — выпуск» и совершенной конку-
ренции, задача общего равновесия может быть представ-
лена как задача линейного программирования и задача,
двойственная ей. Прямая задача заключается в макси-
мизации значения конечного продукта (в терминах макро-
экономики — максимизации национального продукта) пу-
тем выбора неотрицательных значений выпусков всех
продуктов, удовлетворяющих ограничениям — уравнению
Леонтьева и условиям спроса и предложения факторов.
Прямая задача формулируется следующим образом:
шахрс при условии х = Ах-|-с, Вх^г, х^О, (9.2.18)
X
где рс — значение конечного продукта
п
рс= 3 PjCj- (9.2.19)
j—1
293
Эту задачу можно представить в виде задачи линейного
программирования, исключив с при помощи уравнения
Леонтьева
max р (1-А)х при условии Вх^г, х^О. (9.2.20)
В этой задаче переменными являются количества, а целе-
вая функция характеризует ценность, поэтому, согласно
рассуждениям, приведенным в разделах 4.4 и 5.3, в каче-
стве переменных двойственной задачи выступают цены.
Поставив двойственную задачу, как показано в разделе 5.1,
нолучим
minwr при условии pA-|-wB>p, w^O, (9.2.21)
w
т. е. задачу минимизации стоимости первоначальных
факторов (в терминах макроэкономики — минимизации
национального дохода), заданной в виде
т
wr = 3 «’/П,
1=1
(9.2.22)
путем выбора неотрицательных значений цен факторов,
удовлетворяющих условию о том, что производство любого
продукта не прибыльно. В более общих обозначениях
двойственная задача принимает вид
minwr при условии wB^p(I— A), w>0, ,49.2.23)
w я»
Определив упорядоченные цены р как р (I — А),* вформу-
лируем прямую и двойственную задачи 4^
ня
max рх при условии Вх^г, х^О, «(9.2.24)
X
minwr при условии wB^>p, w^O. (9.2.25)
w
Эти задачи проиллюстрированы для случая двух товаров
и двух факторов (т = п = 2) на рис. 9 2.
Для того чтобы доказать существование равновесия,
недостаточно описания механизма экономики. Нужно
также описать систему предпочтений, заданную в виде
функций спроса на товары и функций предложения фак-
торов. Функции спроса и предложения получаются путем
обобщения индивидуальных функций потребителей того
294
W2
i\
b2)
Двойственной
задача: p2
min wr при
условии
w wB>p,
ws3 0
Направление
наискорейшего
' роста г
Рис. 9.2. Подход к теории общего равновесия с помощью методов
линейного программирования.
же типа, которые были получены в результате максими-
зации полезности при бюджетном ограничении. Поэтому
в общем виде функции спроса и предложения зависят от
всех цен, включая цены товаров и оплату факторов. Спрос
на /-й товар обозначается вектором
Cj = Cj (/?!, р2, . . ., pn; wu w2, . . wm),
/ = 1, 2, . . ., п, (9.2.26)
а предложение г-го фактора — вектором
П = rt (Pl, РЪ • • Рп, U>i, W2, . . ., Wm),
i = 1, 2, . . . m. (9.2.27)
295
В векторных обозначениях
с = с (р, w)
г = г (р, w). (9.2.28)
Предполагается, что эти функции однозначны и непрерыв-
ны для любых неотрицательных наборов цен.
Существование векторов р*, w*, х*, т* и с*, удовлет-
воряющих условиям
х* — Ах* + с*
Вх* ^г*
p*A + w*B р*
С* = С (р*, W*)
г* = Г (р*, W*)
(9.2.29)
при заданных А, В, с (..) и г (...), может быть доказано
при помощи теоремы Какутани о неподвижной точке. Про-
нормируем цены таким образом, чтобы в сумме они давали
единицу
П m
5=1 4=1
(9.2.30)
это законно, так как единицы, в которых измеряются
цены, могут быть выбраны произвольно. Таким образом,
нормированные цены являются точками множества S
п m
5 = ((р, W)| S Pi + 3 p>0, w>0}, (9.2.31)
;=i <=i
непустого, компактного, выпуклого множества в (m + п)-
мерном евклидовом пространстве. Для доказательства
строится полунепрерывное сверху отображение точек мно-
жества S в подмножестве из S, которое по теореме Какутани
о неподвижной точке имеет неподвижную точку. Эта точка
и является равновесием, удовлетворяющим условиям
(9.2.29).
Приступая к доказательству, рассмотрим множество
нормированных цен (р°, w°) из S. Тогда по функциям
спроса и предложения получим векторы требуемых товаров
и предлагаемых факторов (с°, г°). Конечный продукт
296
определяет собою общий выпуск, записанный в виде
х° == (I - А)-1 с°. (9.2.32)
Но эти уровни общего выпуска не обязательно совместимы
с технологией задачи, поэтому все общие выпуски сво-
дятся к определенной шкале множителем X, где Хх° лежит
на границе производственной поверхности
{(х, г) I Вх^г, х^О). (9.2.33)
Такое соизмерение может быть проиллюстрировано на верх-
нем графике на рис. 9.2, где заштрихованная область
является производственной поверхностью. Если заданы В
и г° (= г (р°, w0)), определена и производственная поверх-
ность, и если х° (= (I — А)-1 с (р°, w0)) не лежит на гра-
нице заштрихованной области, то для нахождения общих
выпусков будем смещать луч вверх (или вниз), пока он
не достигнет границы в точке Хх°, как показано.
Если точка Кх° на производственной поверхности зада-
на, найдется множество упорядоченных цен, для которых
Хх° является решением (9.2.24). Например, в случае, про-
иллюстрированном на рис. 9.2, вектор упорядоченных
цен является нормалью к границе производственной
поверхности в точке Хх°. Он единственен, если Хх° не верши-
на производственной поверхности. Однако, если же Хх°
является вершиной, то любой вектор упорядоченных цен,
лежащий между нормалями, проведенными к прилежащим
граням, удовлетворит задаче. Множество векторов всех
относительных цен образует множество Р
Р = {Р I Хх° максимизирует р (I — А) х
при условии Вх^г0, х 0). (9.2.34)
Пусть задан вектор р из Р, тогда вектор относительных
упорядоченных цен р (=р (I — А)) совместно с В опреде-
ляет область определения задачи (9.2.25), которая пока-
зана на нижнем графике рис. 9.2 как заштрихованная
область. Множество всех возможных векторов оплат
факторов, удовлетворяющих (9.2.25), когда р заключается
в пределах Р при заданном г°, составляет множество W
W — {w | w минимизирует wr° при условии
wB > р (I — А), р € Р).
(9.2.35)
297
Затем определяется множество (Р, Ж) как множество нор-
мированных векторов
(Р, W) — {(р, w)£S|p£PHwf РК}. (9.2.36)
В итоге мы совершили длинную цепочку отображений
(р°, w°) —(с°, г») -> (х°, г°) (1х,°г°) (Р, W), (9.2.37)
где первое отображение непрерывное, так как функции
спроса и предложения непрерывны; второе непрерывно
в силу того, что х° получено из с° путем линейного пре-
образования; третье отображение непрерывно, так как
оно заключается в установлении масштаба х°; четвертое
отображение — это полунепрерывное сверху точечно-
множественное отображение. Таким образом, отображе-
ние, совершенное из точки (р°, w°) в S в подмножество
(Р, W) множества S, является полунепрерывным сверху
отображением точки непустого, компактного и выпук-
лого множества в подмножество этого множества. По тео-
реме Какутани о неподвижной точке существует по край-
ней мере одна неподвижная точка, которая принадлежит
подмножеству, полученному в результате этого отображе-
ния, т. е. существует (р*, w*), такая, что
(р*, w*) € (Р, W). (9.2.38)
Эти векторы (р*, w*) и соответственные количественные
векторы с* = с (р*, w*), г* = г (р*, w*), х* = (I — А)-1 с*
являются равновесными, удовлетворяющими (9.2.29). Точ-
ка равновесия является единственной, если функции
спроса удовлетворяют слабой аксиоме выявленного пред-
почтения.
Равновесие обладает свойством, что х* является реше-
нием задачи линейного программирования (9.2.20), aw* —
решением двойственной задачи линейного программирова-
ния (9.2.21) при заданных А, В, р = р*, г = г* и с = с*.
По теореме двойственности линейного программирования
значения целевых функций в этих точках равны между
собой
р*с* = w*r*, (9.2.39)
где р*с* — максимальное значение конечного спроса,
a w* г* — минимальная стоимость первоначальных фак-
торов. Таким образом, по теореме двойственности общее
значение произведенного конечного продукта (нацио-
298
нального продукта) равно общей плате за факторы произ-
водства (национальному доходу) х.
Вторая важная теорема линейного программирования,
теорема о дополняющей нежесткости, утверждает, что
если ограничение удовлетворяется в точке решения как
строгое неравенство, то соответствующие двойственные
переменные в оптимальном плане будут равны нулю.
Таким образом, для прямой задачи (9.2.18) имеем:
если 3 bijX* <Zrt, то w* = 0, i - 1, 2, . . ., т. (9.2.40)
з
Это условие означает, что если общий спрос на фактор
меньше, чем наличное предложение, то оптимальная опла-
та этого фактора равна нулю. Поэтому подход линейного
Рис. 9.3. Если предложение фактора превышает спрос на него
при ненулевой плате, то равновесная оплата этого фак-
тора равна нулю.
программирования к общему равновесию распространяет-
ся не только на дефицитные факторы, обладающие поло-
жительной оплатой, но также и на свободные факторы,
оплата которых равна нулю. Условие равенства цены
нулю, когда при любой ненулевой цене предложение пре-
вышает спрос, еще встретится в других формулировках
задачи общего равновесия. Этот случай проиллюстрирован
на рис. 9.3.
1 К аналогичному заключению мы пришли в предыдущем разде-
ле в уравнении [9.1.251.
299
Условия дополняющей нежесткости для двойственной
задачи записываются следующим образом:
если Ph.ahi + S > Рь т0 ** = 0. (9.2.41)
k i
Это означает, что, если товар произведен с убытком, т. е.
средние издержки его производства превышают цену,
тогда оптимальный выпуск этого продукта равен нулю,
т. е. товар не производится. Таким образом, подход линей-
ного программирования к общему равновесию охватывает
не только производимые товары (при средних издержках
производства, равных цене), но и товары, которые не про-
изводятся.
Методы линейного программирования также приме-
няются при сравнительном анализе показателей общего
равновесия [22—26]. Случай, иллюстрирующий два фак-
тора и два товара, изображен на рис. 9.4, который основан
на рис. 9.2.
Предположим, что ресурсы, цены и коэффициенты
затрат таковы, что решение прямой задачи находится
в точке а верхнего графика на рис. 9.4. Пусть затем про-
изошло расширение объема второго ресурса г2, показанное
геометрически параллельным переносом одной из линий
ограничения до пунктирной линии. Новое решение нахо-
дится теперь в вершине а', в которой выпуск товара 2 воз-
рос, а выпуск товара 1 уменьшился. Основным результа-
том является теорема Рибчинского, которая утверждает,
что возрастание одного фактора при сохранении всех
остальных параметров неизменными приводит к увели-
чению выпуска тех товаров, которые используют этот
фактор относительно интенсивно, и к уменьшению объема
выпуска товаров, использующих этот фактор недостаточно
интенсивно. В случае, изображенном на рис. 9.4, выпуск
х2 возрастает, в то время как выпуск уменьшается, так
как (b22lbi^ > (&21/&11), т- е. товар 2 использует фактор 2
относительно интенсивно.
Теперь рассмотрим нижний график на рис. 9.4, на ко-
тором ресурсы, цены и коэффициенты затрат таковы, что
решение находится в точке 0. Предположим, цена на вто-
рой товар р2 возросла. Так как
Pi = (1 ~ «и) Pi — «12Р2 (д 2 42)
Рг = —а12р! + (1 — а22) р2,
то увеличение р2 приводит к уменьшению pi и увеличению
300
р
Прямая задача:
(теорема
Рибчинского)
-X,
w2
Направление наискс-
рейшего роста г
Двойственная задача
(теорема Столпера-
Самуэльсона)
к с. 9.4. Сравнительные показатели подхода к теории общего
равновесия с помощью методов линейного программи-
рования.
р2, что показано геометрически двумя пунктирными ли-
ниями. В точке нового решения в вершине 0' произошло
увеличение цены второго фактора и уменьшение цены пер-
вого. Основным результатом является теорема Столпе-
ра — Самуэльсона, которая утверждает, что повышение
цены любого товара при неизменных остальных парамет-
рах приводит к повышению цен тех факторов, которые
используются относительно интенсивно в производстве
этого товара, и к снижению цен тех факторов, которые
301
в производстве товара используются Относительно неинтен-
сивно. В случае, изображенном на рис. 9.4, повышение р2
приводит к повышению w2 и снижению wly так как (b22/bi2)>
> (^21/^11), как и раньше. Очевидна двойственная природа
этих двух теорем, как показано в случае т = 2, п = 2.
9.3. НЕОКЛАССИЧЕСКИЙ ПОДХОД.
ИЗБЫТОЧНЫЙ СПРОС
Неоклассический подход к общему равновесию, свя-
занный с использованием избыточного спроса, соединяет
некоторые черты классического подхода и методов линей-
ного программирования. При этом не делается никаких
допущений относительно технологии, а для доказательства
существования равновесия используется теорема о непод-
вижной точке [27, 28].
Рассмотрим экономику, состоящую из потребителей
и фирм, которая производит п товаров х^, х2, . . ., хп.
В отличие от термина, введенного раньше, здесь товары
могут включать продукты, факторы и даже такие товары,
которые являются одновременно и продуктами, и факто-
рами (например, электричество). Цены товаров характе-
ризуются вектором-строкой
р = (Р1, Pz, рп)- (9-3.1)
Для любого неотрицательного набора цен существует
функция спроса на товар j
^ = 4(р), (9.3.2)
полученная путем обобщения индивидуальных функций
спроса потребителей и фирм. Аналогично для любого
Неотрицательного набора цен существует функция пред-
ложения товара j
^} = хЦр), (9.3.3)
полученная обобщением индивидуальных функций предло-
жения потребителей и фирм. Избыточный спрос на про-
дукт / получается вычитанием предложения из спроса.
Е} (р) = (р) — х‘ (р), j = 1, 2, . . ., п. (9.3.4)
Избыточные опросы на п продуктов образуют вектор-
столбец
Е (P) = & (р), Е2 (р), . . „ Еп (р))'. (9.3.5)
302
Равновесие бпредёляетсй как набор неотрицательных
цен р*, таких, что все избыточные опросы не положитель-
ны, и цена на любой товар равна нулю, если избыточный
спрос на этот товар отрицательный (как на рис. 9.3)
Р* > О
Е (р*)<0, (9.3.6)
если Ej (р*) < 0, тогда р* = 0.
Существование такого равновесия можно доказать, если
относительно функций избыточного спроса введены неко-
торые предпосылки. Во-первых, предполагается, что
функции избыточного спроса однозначны и непрерывны.
Во-вторых, функции избыточного спроса считаются огра-
ниченными снизу
Е (р) Ь для всех р, (9.3.7)
где Ь — вектор-столбец, состоящий из конечных компо-
нент. Согласно этому предположению, предложение
любого продукта всегда ограничено. В-третьих, предпо-
лагается, что функции избыточного спроса однородны
нулевой степени относительно всех цен
Е (ар) = Е (р) для всех а > 0. (9.3.8)
Следовательно, имеют значение только относительные
цены. Наконец, считается, что функции избыточного
спроса удовлетворяют закону Вальраса в том смысле,
что рыночное значение избыточного спроса равно нулю
рЕ(р)= 3 0 Для ввех Р^0> (9.3.9)
7=1
поэтому рыночное значение спроса равно рыночному зна-
чению предложения при любых неотрицательных ценах.
При этих допущениях существование равновесия сле-
дует из теоремы Брауэра о неподвижной точке. Используя
предпосылку об однородности, можно пронормировать
цены так, чтобы их сумма равнялась единице. Таким обра-
зом, вектор цен принадлежит симплексному множеству 8
5 = {р| S р>0) . (9.3.10)
Рассмотрим некоторый набор ЦЙ0Г р из S. Функции избы-
точного спроса дают набор значений избыточного спроса
303
Е (р). Для этих функций избыточного спроса определим
новые цены р, так что
Pi — Рь если Ej (р) = 0 ч
Pi ~ Pi + А> если Ej (р) > 0 > j = 1, 2, ..., п,
Pi = max (0, р} — А), если Ej (р) < 0
(9.3.11)
где А — малая положительная константа. Новые цены
упорядочены так, что в сумме они равны единице и, сле-
довательно, принадлежат множеству S. Таким образом,
было совершено преобразование
р->Е(р)->р, (9.3.12)
где р получаются из Е (р) следующим образом: цены
остаются неизменными при нулевом избыточном спросе;
цены увеличиваются, если избыточный спрос положите-
лен; и снижаются, но не ниже нуля, если избыточный
спрос отрицателен. Принимая во внимание предположе-
ние непрерывности и ограниченности, мы имеем непре-
рывное преобразование непустого компактного выпуклого
множества S в себя. Поэтому, согласно теореме Брауэра
о неподвижной точке, существует неподвижная точ-
ка, которая остается неизменной в результате преобразо-
вания
р* Е (р*) -> р*. (9.3.13)
Но процесс упорядочения остается неизменным только
в том случае, если все значения избыточного спроса не по-
ложительны и любой продукт с отрицательным значением
избыточного спроса обладает нулевой ценой, т. е. только
тогда, когда р* представляет собой равновесие, определен-
ное в (9.3.6).
Надо отметить, что если из этих предпосылок относи-
тельно функций избыточного спроса сразу следует суще-
ствование равновесия, то для доказательства его единст-
венности их недостаточно. На самом деле, равновесие
является единственным, если, как и раньше, общие функ-
ции спроса удовлетворяют слабой аксиоме выявленного
предпочтения [12].
304
Другое доказательство единственности при предполо-
жении о дифференцируемости функций избыточного спро-
са основано на использовании матрицы Якоби. Выберем
в качестве единицы счета товар п и предположим, что
избыточный спрос на этот товар стремится к бесконечно-
сти, если его цена равна нулю независимо от цен па дру-
гие товары. Тогда матрица Якоби этой нормированной
системы может быть представлена в виде
дЕ j дЕ j
дрг ' ' ' дрп-1
дЕ2 дЕ2
&Р2 ‘ ’ дрп^
dEn-i дЕп{
дрг ' " дРп-1
(9.3.14)
Равновесие единственно, если главные миноры матрицы J
меняются в знаке, при этом главные миноры четных (не-
четных) номеров строк и столбцов J должны быть поло-
жительными (отрицательными) х.
9.4. УСТОЙЧИВОСТЬ РАВНОВЕСИЯ
Если мы предположим, что равновесие существует,
возникает проблема его действительного достижения.
Централизованное вычисление равновесия, основанное
на использовании таких данных, как предпочтения, техно-
логия, ресурсы и т. и., вряд ли возможно, так как тре-
буется огромный объем памяти и велики трудности рас-
четов. Другой возможный выход — децентрализованное
итеративное вычисление, ведущее к использованию вре-
менных траекторий для объемов и цен. Если эти временные
траектории в конечном счете достигают равновесных зна-
чений, тогда лежащий в основе динамический процесс
считается устойчивым.
Используя обозначения предыдущего параграфа, обоз- .
значим через х вектор-столбец, состоящий из п товаров
х = (хь х2, . . ., хп)', (9.4.1)
1 См. [28]. Хикс [1] развил это условие при исследовании устой-
чивости, поэтому иногда это условие называют «условием устойчи-
вости Хикса».
20-0270
305
a kepeb j) — bektop-строку Цей Tobapofi
P = (Pi. P2, • • •, Pn)- (9.4.2)
Здесь под товарами подразумеваются как продукты, так
факторы. Предположим, равновесие существует в точ-
ке р*. Равновесие называется локально устойчивым, если
оно в конечном счете достигается, начиная с некоторого
набора цен, достаточно близкого к точке равновесия.
Пусть р (t) — вектор цен в момент t, тогда равновесие
в точке р* является локально устойчивым, если
lim р(£) = р* при заданных |p(i0) — Р* | <С 6» (9.4.3)
t->00
где <о — начальный момент времени, а | р (i0) — р* | —
евклидова норма в пространстве цен, неотрицательном
ортанте в Еп. Равновесие называется глобально устойчи-
вым, если оно в конечном счете достигается независимо
от начальной точки
limp(i) = p* для всех р(£0). (9.4.4)
t-*OO
Глобальная устойчивость предполагает локальную (и един-
ственное равновесие); обратное неверно.
Классическим методом решения проблемы устойчиво-
сти является процесс «нащупывания» Вальраса, представ-
ляющий собой итеративное решение, полученное в резуль-
тате использования закона спроса и предложения для кон-
курентного рынка [10, 11, 29, 30, 31]. Для каждого рынка
Вальрас предлагает аукционера, который в отличие от
большинства акционеров не представляет ни покупателя,
ни продавца. Аукционер Вальраса реагирует на неравно-
весие на рынке через упорядочение цен. Таким обра-
зом, в действительности аукционер является антропо-
морфическим представлением самого рынка. Правила уста-
новления упорядоченных цен совпадают с правилами
процесса «нащупывания»: цены поднимаются, если общий
рыночный спрос превышает общее рыночное предложение;
цены понижаются, если общего рыночного спроса не хва-
тает для покрытия общего рыночного предложения; и це-
ны остаются неизменными, если общий рыночный спрос
равен общему рыночному предложению. В терминах
функций избыточного спроса процесс «нащупывания»
должен повысить (понизить, оставить неизменными) цены,
306
» 0,7 = 1,2,... ,п. (9.4.5)
> 0, если Ej (р) <
где
если избыточный спрос положитблен (отрицателей, равен
нулю) * 1
dpi
~аГ~Р} '
Индивидуальные покупатели и продавцы могут переза-
ключать договоры после изменения цен, но сделка не долж-
на совершиться, пока не будет достигнуто равновесие.
Вальрас предположил, что процесс «нащупывания» будет
сходиться к равновесию, даже при произвольном началь-
ном наборе цен, т. е. что этот процесс глобально устойчив.
Это предположение Вальраса не является справедливым,
если не сделать дополнительных оговорок. Например, при
процессе «нащупывания» система может бесконечно коле-
баться около точки равновесия.
Современные методы решения проблемы устойчивости
рассматривают системы «нащупывания», в которых траек-
тории цен задаются формулой
Pi НУ = f} (Е} (p (/))),
., n,
(9.4.6)
(9.4.7)
т. e. скорость изменения всех цен во времени — возра-
стающая функция избыточного спроса на те товары,
объем которых стремится к пулю, если равен нулю
избыточный спрос 2. Далее предполагается, что п функ-
ций /;(•) являются непрерывными, однородными нуле-
вой степени в отношении всех цен и неотрицательными
при нулевых ценах
/;(•)> О при pj = 0, (9.4.8)
т. е. цены не могут стать отрицательными. Важным част-
ным случаем являются линейные системы «нащупывания»,
в которых изменение цен соответствует избыточному спросу
Pi = Ej(p), j = 1, 2, . . ., n. (9.4.9)
Анализ локальной устойчивости равновесия основан
на аппроксимации скорости изменения цен
Р (О = (А (0. • • ; Рп (*)) (9.4.10)
1 Заметим, что преобразование, определенное в (9.3.11),
является процессом «нащупывания» без явных элементов динамики,
которые были введены здесь.
2 См. [2, 32, 33, 34, 35, 37, 28, 7]. Процесс, противоположный
процессу «нащупывания», в котором имеют место некоторые сделки
при неравновесных ценах, рассматривается в 136, 38, 39].
20* 307
около равновесия. Равновесной точкой р* является набор
цен, который не изменяется во времени
р = О в точке р = р*, (9.4.11)
а для процесса «нащупывания» равновесие требует нуле-
вого избыточного спроса для каждого товара
Е} (р*) = 0, у = 1, 2, . . п. (9.4.12)
Пусть имеется линейный процесс «нащупывания»
р' = Е (р) = (^ (р), . . ., Еп (р)) (9.4.13)
с точкой равновесия в р*; разложим Е (р) в ряд Тейлора
в окрестности точки р*
р'=Е(р*) + ^-(р*)(р-₽*)+..., (9.4.14)
где дЕ/dp — матрица Якоби
дЕ^ дЕ j дЕ]
( dpi др2 ' дрп \
дЕ% дЕ% дЕ% 1
дР1 др2 ’ • ’ дрп I (9.4.15)
дЁп дЕп дЕп I
dpi др2 ‘ ’ дрп ' ’
оцененная в точке равновесия. Так как р*—точка равнове-
сия, то
Е (р*) = 0, (9.4.16)
и, определив л как вектор разностей между реальными
и равновесными ценами
л — р — р*, (9.4.17)
мы придадим разложению (9.4.14), отбрасывая все члены
высших порядков, следующий вид:
я =—(₽*) я. (9.4.18)
Эта система дифференциальных уравнений устойчива,
т. е. л стремится к нулю тогда, и только тогда, когда все
характеристические корни матрицы Якоби имеют отрица-
тельные действительные части. Это условие выполняется,
308
если все товары являются явно заменяемыми, т. е. увели-;
чение цены на любой продукт при неизменных остальных
ценах приводит к увеличению избыточного спроса на лю-
бой другой продукт
4тЧр) >0 Для всех р, jy=j. (9.4Л9)
UP]
Таким образом, точка равновесия является локально
устойчивой, если все продукты являются явно заме-
няемыми.
На самом деле глобальная устойчивость может быть
обеспечена, если товары явно заменяемы или если функ-
ции избыточного спроса удовлетворяют слабой аксиоме
выявленного предпочтения. Доказательства глобальной
устойчивости основаны на том факте, что расстояние
до равновесия со временем снижается до нуля. Например,
рассмотрим квадратичное евклидово расстояние между
вектором реальных и равновесных цен
н (0 = S (0 = S {Pi (0 - Pi)2 = (р W - р*) (р(0 - р*)'•
7=1 7=1
(9.4.20)
Дифференцируя по времени, получим
D (0 = 2 (р (0 - р») р (0 = 2 (р (0 - р*) Е (р (0).
(9.4.21)
Но, согласно закону Вальраса,
р (0 Е (р («)) = 0, (9.4.22)
поэтому
Ь (t) = —2р*Е (р (£)). (9.4.23)
Теперь рассмотрим, например, слабую аксиому выявлен-
ного предпочтения, примененную к функциям избыточного
спроса:
р*Е (р1) рхЕ (р2) влечет
р2Е (pi) > р2Е (р2). (9.4.24)
При р1 = р и ра = р* верхнее неравенство удовлетворяется.
Нижнее неравенство дает
р*Е (р) > р*Е’(р*) = 0, (9.4.25)
309
и при р ¥= Р*
Ь (t) = —2р*Е (р) < 0. (9.4.26)
Таким образом, расстояние между фактическими и равно-
весными ценами уменьшается во времени, что и означает
глобальную устойчивость.
Наконец, если система нормирована (например, рп =
= 1), она является глобально устойчивой в том случае,
если функция Якоби избыточного спроса имеет домини-
рующую диагональ, иначе говоря, каждый диагональный
элемент отрицателен и превышает по абсолютной величине
сумму всех остальных элементов строки
-^<0 и |4^|>У 4^’ / = 1,2, (9.4.27)
др] I др; I ZJ dpt J ' >
Это условие означает, что изменения цен на данный товар
влияют на избыточный спрос в большей степени, чем изме-
нения любых других цен.
9.5. МОДЕЛЬ РАСШИРЯЮЩЕЙСЯ ЭКОНОМИКИ
ФОН НЕЙМАНА
Модель фон Неймана — это модель расширяющейся
экономики, в которой все выпуски и затраты возрастают
в одинаковой пропорции х. Модель замкнута в том смысле,
что все выпуски одного периода становятся затратами
следующего периода; первичные факторы в ней не исполь-
зуются. Так, потребление рассматривается как затраты
в технологическом процессе, производящем труд, который
будет использоваться в производстве следующего периода.
Поэтому все затраты являются воспроизводимыми,
а первичные ресурсы не имеют места.
Нейман описывает экономику, характеризуемую ли-
нейной технологией производственных процессов, которая
состоит из р процессов; с их помощью п видов затрат
товаров превращается в п видов продукции. Технология
описывается двумя матрицами размера п X р единичных
уровней затрат и выпусков соответственно
1 См. [40, 41, 42, 7]. Динамический материал представлен в этом
и предыдущем разделах, а не в третьей части книги потому, что он
тесно связан с темой данной главы.
310
A = (ajk) > 0
в = (bJk) 0, (9.5.1)
где ajh — затраты продукта j, используемого при единич-
ном уровне интенсивности к-го процесса, a bjk — выпуск
продукта j, произведенного Л-м процессом при его еди-
ничной интенсивности, / = 1,2, . . ., п", к ~ 1, 2, ...
...,/>. Эти коэффициенты затрат и выпуска, конечно,
не отрицательны. Далее предполагается, что для каждого
процесса необходимы затраты некоторого продукта, т. е.
для каждого к существует некоторое j, такое, что
aik > 0 (9.5.2)
и каждый продукт может быть произведен каким-либо
производственным процессом х, т. е.
для каждого /’ существует некоторое к, такое, что
bjh > 0. (9.5.3)
Из этих предположений вытекает требование, что каждый
столбец матрицы А и каждая строка В должны иметь
по крайней мере один положительный элемент.
Интенсивности процессов обозначаются вектором-
столбцом
у = у (О = (г/i (0, у2 (0> • • •. уР (t)Y > о, (9.5.4)
где yk (Z) — уровень интенсивности процесса к в момент t,
к = 1, 2, . . ., р. Интенсивности не отрицательны и могут
быть пронормированы так, что в сумме дают единицу
к = 1, 2, . . ., р
р (9.5.5)
S Ук = 1-
h=i
Цены продуктов определяются вектором-строкой
р = р (z) = (Pl (Z), р2 (z),. . ., Рп (z)) > О, (9.5.6)
1 В своей работе Нейман [40] сделал более сильное предпо-
ложение:
ojh-[-6jh>0, для всех /, к,
т. е. любой продукт является либо затратами, либо выпуском в каж-
дом производственном процессе. Более слабое предположение, кото-
рое используется здесь, было предложено Кемени, Моргенштерном
и Томпсоном [41].
311
где Pj (t) — цена продукта j в момент t; j = 1, 2, . . п.
Цены не отрицательны и могут быть пронормированы так,
что в сумме дают единицу
/ = 1, 2, . . ., п
2р/ = 1. (9.5.7)
j—t
Затраты продукта j в процессе к равны a.jkyh, поэтому
р
общие затраты продукта j в момент t будут 2 а)кУь (t)‘,
вектор общих затрат равен* Ay (7). Аналогично общий
р
выпуск продукта / в момент t равен 2 ЬцгУк (О и вектор
k=i
общих выпусков составляет By (t). Предполагается, что
производственные процессы требуют один полный период
времени для выпуска продукции, поэтому затраты любого
продукта не могут превышать выпуска этого продукта
в предыдущий период
р р
2 ajkyh(t-i-i)^ 2 bjkyk(t), / = 1,2, (9.5.8)
- ь=1 k=i
или в матричном обозначении
Ay (t + 1)< By (7). (9.5.9)
Однако, если для какого-либо продукта выполняется стро-
гое неравенство, тогда, поскольку предложение превышает
спрос, предполагается, что цена падает до нуля, т. е. если
2 а^Ул(^+1)< 2 b]hyh(t), (9.5.10)
h=l h=l
то Pj (7) = 0, 7 = 1, 2, . . ., n.
Умножив (9.5.10) на вектор-строку цен, получим
р (7) А у (7 + 1) = р (7) By (7). , (9.5.11)
Если в экономике имеет место совершенная конкурен-
ция, то при равновесии нигде не может быть получена
прибыль. Таким образом, для каждого процесса значение
выпуска не может превышать значения затрат предыду-
щего периода
2 Pi 1) bjK^. 2 Pj (t) ajk, к = 1,2,.. ., p, (9.5.12)
;=i j=i
312
дли б матричном обозначении
p(/ + l)B<p(t)A. (9.5.13)
Если для к—оГо процесса выполняется строгое неравен-
ство, то, так как прибыли являются отрицательными
величинами, предполагается нулевая интенсивность, т. е.
если
S Pi (t +1) Ъ» < S Pi (Z) ajh, TO (9 5 14)
Ук (0 = 0, к = 1, 2, . . ., p.
Таким образом,
P (t + 1) By (z) = p (z) Ay (Z). (9.5.15)
Предполагается, что в экономике наблюдается сбалан-
сированный рост в том смысле, что все уровни интенсив-
ности возрастают одинаковыми темпами А
yk (Z + 1) = (1 + A) yh (t), к = 1,2,...,р. (9.5.16)
В матричном обозначении решение этой системы разност-
ных уравнений выглядит следующим образом:
у (z) = (1 4-А),-/о у (z0), (9.5.17)
где вектор у (Zo) — вектор интенсивностей в момент Zo.
Константа А, называется темпом сбалансированного роста
экономики.
Предполагается, что цены всех товаров снижаются
одинаковыми темпами р
Pz(i + l) = f^-, 7 =1,2, .. .,п. (9.5.18)
В матричном обозначении решение этой системы разност-
ных уравнений примет следующий вид:
р (Z) = (1 + р)<0-'р (Zo), (9.5.19)
где р (Zo) — вектор цен в момент Zo. Постоянная р обозна-
чает норму процента в экономике, которая характеризует
заинтересованность во владении деньгами, потому что
определенная сумма денег, на которую можно приобрести
данное количество какого-либо товара в момент Z, даст
возможность купить в (1 -}- р) раз большее количество
того же товара в момент Z 4- 1.
313
Подставляя (9.5.17) и (9.5.19) в (9.5.9), (9.5.11),
(9.5.13) и (9.5.15), получим, что в модели для всех t
(1 + X) Ay (Z) By (Z), но
(1 + X) p (Z) Ay (Z) = p (Z) By (Z)
(1 + p) p (Z) A > p (z) В, но (9.5.20)
(1 + p) p (Z) Ay (Z) = p (Z) By (Z).
При этих условиях существует максимальный темп
сбалансированного роста X* и минимальная норма про-
цента р*, которые равны между собой Ч
1» _ П»_ Р (0 Ву (О Л /А Е
Х -Р —РЮАУЮ-1’ (9-5-21)
Это равновесие справедливо для всех периодов времени Z
при соблюдении предположения о том, что начальные точки
р (Zo) и у (Zo) удовлетворяют (9.5.21). Траектория, соответ-
ствующая максимальному сбалансированному росту,
известна под названием луча фон Неймана.
ЗАДАЧИ
9-А. Экономика чистого обмена отличается тем, что в ней
нет производства. Каждый потребитель имеет определен-
ный начальный (до обмена) запас каждого потребитель-
ского товара.
1. Описать условия равновесия в общем случае Н
потребителей и п потребительских товаров. Будет
ли в этом случае число уравнений совпадать с чис-
лом неизвестных?
2. Описать условия равновесия в случае Н = п = 2,
при котором каждый потребитель имеет квадрати-
ческую функцию полезности.
9-Б. Рассмотрим случай экономики чистого обмена при
Н = п = 3. Начальное распределение характеризуется
матрицей
1 См. [40]. Решение X* (=р*) является единственным, если спра-
ведлива предпосылка фон Неймана из примечания на стр. 311.
Если принята предпосылка Кемени, Моргенштерна и Томпсона [14],
то существует по крайней мере одно решение, но не больше min
(р, п) решений.
814
/а О О\
I О Ъ О j
\О О с)
и дана матрица предельной полезности
в которой строки относятся к потребителям, а столбцы —
к товарам. Найти равновесные цены и конечное распреде-
ление. Описать обмен словесно. Является ли решение
разумным?
9-В. Экономисты классической школы молчаливо пред-
полагали, что для существования равновесия необходимо
и достаточно, чтобы число уравнений совпадало с количе-
ством неизвестных. Показать на алгебраическом и гео-
метрическом примерах, что это не является ни необходи-
мым. ни достаточным условием.
9-Г. Классический подход, описанный в разделе 9.1, был
основан на предположении, что каждая фирма производит
все товары и использует факторы всех видов и что каждый
потребитель потребляет все товары и продает все факторы.
Ослабление этих предположений ведет к появлению нера-
венств в условиях равновесия.
1. Сформулировать условия, состоящие из неравенств,
и показать, что среди оставшихся соотношений
неравенств не будет.
2. Что будет представлять собой закон Вальраса
в этом случае?
9-Д. В паутинообразной модели спрос зависит от текущих
цен, а предложение зависит от цен в предыдущие периоды
(например, сельскохозяйственные рынки, на которых
предложение зависит от посевной площади, а она в свою
очередь зависит от цен, действующих в момент сева).
В каждом периоде предложение должно равняться спросу.
1. Показать на графике возможность циклического
изменения цены и выпуска.
315
2. При каких условиях цена будет стремиться к устой-
чивому равновесию?
3. Обобщить результат для п рынков.
9-Е. Если А — матрица типа «затраты — выпуск», то
все главные миноры (I — А) положительны (условия
Хоукинса — Саймона).
1. Сформулировать эти условия и дать их экономиче-
скую интерпретацию для экономики, производящей
2 товара.
2. Показать, что из условий Хоукинса — Саймона сле-
дует, что
lim А* = О
t—»оо
(I-A)-! = I + A + A2H---.
9-Ж. В экономике с двумя товарами и тремя ресурсами
технология «затраты — выпуск» описывается матрицами
Наличные ресурсы являются неэластичными и задаются
вектором
г= (10, 12, 16).
1. Показать на графике множество возможных выпу-
сков и множество всех возможных значений конеч-
ного спроса.
2. Найти равновесные цены, объемы и платы за
пользование факторами, если конечный спрос
на второй товар имеет вид
13
С2=-д---Рг,
а первый товар служит единицей счета.
9-3. Для доказательства существования конкурентного
.равновесия с линейной технологией, как изложено в раз-
деле 9.2, показать, что
1. Преобразование (Хх°, г°) -> (Р, W) является полу-
непрерывным сверху.
2. X = 1 для неподвижной точки.
3. Равновесие является единственным, когда функции
спроса удовлетворяют слабой аксиоме выявленного
316
Предпочтения, а ресурсы ПоЛаГаЮТСЯ неэластичными.
9-И. Как влияют изменения в уровнях ресурсов на их
оплату в модели общего равновесия, построенной па осно-
ве линейного программирования? Каково влияние изме-
нения цен товаров на выпуск продукции? Проиллюстри-
ровать, как это сделано на рис. 9.4.
9-К. В экономике с тремя продуктами функции избыточ-
ного спроса для двух товаров имеют следующий вид:
Е\ — —Pi + Р2 + 1
Е2 = Pi — 2j»2 + 2,
а третий продукт служит единицей счета.
1. Каков избыточный спрос на третий продукт?
2. Как выглядит матрица Якоби функций избыточного
спроса?
3. Найти равновесие. Устойчиво ли оно?
9-Л. Показать, что в случае, если потребитель h характе-
ризуется логарифмической функцией полезности
.2 apogc* /i = l, 2,..., Н
а>>0, для всех /, h; = 1 Для всех
i
то при фиксированном предложении все товары являются
явно заменяемыми. Найти равновесные цены.
9-М. Допустим, индивидуум имеет функцию полезности
для избыточного спроса на 2 товара экспоненциального
вида
U = —di exp (—biEi) — a2 exp (—b2E2),
где a,{, a2, bi и b2 — положительные константы. Он макси-
мизирует полезность при соблюдении бюджетного огра-
ничения
Р1Е1 + Р2Е2 —
где pi и р2 — цены. Найти оптимальный избыточный спрос
как функцию соотношения цен p^Pi- Являются ли товары
явно заменяемыми? При каком соотношении цен суще-
ствует экономическое равновесие?
9-Н. Примером экономики с неустойчивым равновесием
может служить экономика чистого обмена с тремя потре-
317
бнтелями И Трем товарами [43]. Начальные Зайасы
определяются матрицей
1 0 0\
О 1 0 j
О О 1/,
а функции полезности имеют вид
Ul = min (х\, гс')
U2 = min (х3, xl)
U3 — min (х3, xl).
1. Найти функции спроса и функции избыточного
спроса для потребителя 1.
2. Найти вектор рыночного избыточного спроса и пока-
зать, что равновесие существует и является един-
ственным, когда все цены равны между собой.
3. Предполагая линейную систему «нащупывания»,
в которой уровень обмена при каждой цене равен
избыточному спросу, показать, что равновесие
потребителя 2 является устойчивым.
9-0. Матрица Якоби избыточного спроса J =
является хиксианом, если ее главные миноры меняются
в знаке, и является устойчивой, если ее характеристиче-
ские корни имеют отрицательные действительные части
[1, 2, 44, 45].
1. Показать, что если J — симметричная матрица, то
условия того, что J является хиксианом, совпадают
с условиями того, что J устойчива.
2. Показать, что если все товары являются явно за-
меняемыми, то J является устойчивым хиксианом.
3. Показать, что если J- отрицательно определена,
то J является устойчивым хиксианом.
9-П. Доказать, что дискретная система «нащупывания»
р (< +1) = max (0, р (t) + рЕ (р (1))), р (£0) > О
является устойчивой при условии, что функции избыточ-
ного спроса непрерывны, однородны нулевой степени
и удовлетворяют слабой аксиоме выявленного предпочте-
ния и р — достаточно малая положительная величина.
318
Что слуЧитбй, если р не являетбй «достаточно малой»?
9-Р. Показать, что если все товары являются явно заме-
няемыми, то следующая норма в пространстве цен
Dm (t) = max
з
\l p*(t) I/
есть монотонно убывающая функция времени, если р =
= ар*, где а > 0.
9-С. В одной модели фон Неймана
А =
/1 0\
\0 1/
/1,4 0 \
0 1,8/ ’
1. Описать технологию словесно.
2. Сформулировать два возможных решения для цен,
интенсивностей и коэффициентов роста и инфляции.
Глава 10
Экономика благосостояния
Задача экономики благосостояния заключается в опи-
сании условий экономического оптимума *. Лица, прово-
дящие ту или иную экономическую политику, могут поль-
зоваться определенными инструментами в целях достиже-
ния оптимума — налогами, тарифами, политикой управ-
ления. Кроме того, существует гораздо более широкий
круг вопросов оптимальных экономических систем. Прин-
цип «управляющей руки» Адама Смита, означающий, что
частные решения в конкурентной экономике являются
социально оптимальными, в дальнейшем преобразовался
в теорему об оптимальности совершенной конкуренции
при определенных обстоятельствах и явился основой для
разработки правила формирования цен в социалистической
экономике. В процессе анализа этих широких проблем
становится очевидным, что экономика и политика тесно
взаимосвязаны. Например, одним из возможных методов
установления рыночных цен могла бы служить система
голосования с правилом большинства голосов или «дикта-
торство» [11, 12, 13, 14, 15]. Однако основным понятием
экономики благосостояния, как оно введено здесь, являет-
ся господство потребителя, означающее, что предпочтения
индивидуального потребителя (и фирмы) должны вклю-
чаться в какой-нибудь рациональный критерий эконо-
мического оптимума 1 2.
1 Основная литература по экономике благосостояния: [1, 2,
3, 4, 5, 6, 7, 8, 9, 10].
2 Если принять допущение о том, что имеют значение индиви-
дуальные предпочтения и некоторые другие разумные предпосыл-
ки, тогда придется, видимо, оставить надежду на существование
разумной социальной структуры, которая поможет согласовать
все индивидуальные различия. Согласно теореме (не)возможности
Эрроу [14], в общем случае не существует последовательного сно-
320
Современный подход к экономике благосостояния
основан на понятии «оптимальности по Парето», дающем
необходимое условие экономического оптимума. Под опти-
мумом по Парето понимается ситуация, при которой
никакое допустимое перераспределение продукции и/или
затрат в экономике не может увеличить полезности для
одного или нескольких потребителей, не уменьшив при
этом уровень полезности для других. Экономический
оптимум должен обязательно быть оптимумом по Парето,
так как в противном случае некоторые потребители могут
улучшить свое состояние, не ухудшая состояния других,
т. е. возможно перераспределение, которое явно улучшает
состояние некоторых потребителей. Однако существует
много, можно сказать бесконечно много, возможных опти-
мальных по Парето ситуаций. Даже если все не опти-
мальные по Парето ситуации будут исключены, все же
возникнет проблема выбора среди оставшихся одной
ситуации, оптимальной по Парето. Этот конечный выбор
является в большей степени задачей социальной, полити-
ческой и этической, чем экономической, поскольку он
поднимает вопрос сравнения полезностей или «заслуг».
Критерий сравнения полезностей приобрел форму функ-
ции социального благосостояния, выражающей социальное
благосостояние как функцию полезностей всех потреби-
телей \
соба получения социальной структуры из системы индивидуальных
предпочтений, которая не являлась бы либо «диктаторской» (т. е. от-
ражающей предпочтения только одного индивидуума), либо пред-
писанной (т. е. в определенных альтернативах индивидуальные пред-
почтения не играют никакой роли). Для разумной социальной
структуры должна существовать определенная система в индиви-
дуальных предпочтениях, т. е. такая система, которая, возможно,
связана с дальнейшим «выживанием» общества. См. [6].
1 Первые авторы, занимавшиеся проблемами экономики благо-
состояния, использовали в качестве критерия социального благосо-
стояния (т. е. в качество функции социального благосостояния)
сумму (или среднюю взвешенную) индивидуальных полезностей
потребителей, предполагая, что полезности аддитивны. «Новая эко-
номика благосостояния» отвергла этот подход, так как порядковая
сущность полезности исключала какое бы то ни было «межперсональ-
ное» сравнение полезности. Однако появление полезности фон Ней-
мана — Моргенштерна привело к возрождению линейной функции
социального благосостояния, в которой весами, примененными
к индивидуальным полезностям потребителей, служили коэффици-
енты распределения. См. [16, 17].
21-0270
321
10.1. ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ
ЗАДАЧИ В СЛУЧАЕ 2x2x2
Задачу экономики благосостояния можно проиллю-
стрировать геометрически в случае 2 X 2 X 2, в котором
два вида неэластичных ресурсов используются при про-
изводстве двух видов товаров, которые распределяются
между двумя потребителями *.
Технологическая связь, характеризующая экономику,
определяется двумя рядами изоквант, одним для каждого
из двух видов товаров. Эти изокванты показаны
на рис. 10.1, где фирма 1 использует ресурсы первого
и второго видов для производства продукции вида 1 соот-
ветственно производственной функции
= А (г], г|), (10.1.1)
а фирма 2 использует ресурсы 1 и 2 при производстве
продукции вида 2 соответственно производственной
функции
?2 = /г (г?, rl), (10.1.2)
где обозначает затраты фактора i фирмой /, а —
выпуск товара J; / = 1,2; i = 1,2; j = 1,2.
1 См. работы Ватора [18], Кенена [19] и Ньюмана [20]. См. так-
же задачу 10-Г.
Рис. 10.1. Ряды изоквант для двух фирм.
822
Фирма 2
Рис. 10.2. Производственная прямоугольная диаграмма Эдж-
ворта — Боули.
Ресурсы поставляются неэластично, поэтому общий
расход каждого вида затрат должен равняться общему
наличному количеству
где через и г2 обозначены наличные объемы ресурсов 1
и 2 соответственно. Эти уровни наличных ресурсов и тех-
нологическую связь можно геометрически изобразить
на производственной прямоугольной диаграмме Эджвор-
та — Боули, как на рис. 10.2. Размеры прямоугольника
определяются заданными объемами двух ресурсов и г2.
В нижнем левом углу прямоугольника на рис. 10.2 нахо-
дится начало координатных осей фирмы 1, и г\ и г[ изме-
ряются, начиная от этого угла. Аналогично правый
верхний угол на рис. 10.2 — начало координатных осей
для фирмы 2, и г] и г* измеряются, начиная от этого угла.
Каждая точка прямоугольника, как, например, А, харак-
теризуется шестью показателями: rj, rj, rf, r%, и qz,
21* 323
Которые удовлетворяют соотношениям (10.1.1), (10.1.2)
и (10.1.3), т. е. производственным функциям и балансам
ресурсов. На прямоугольной диаграмме изображены изо-
кванты, при этом для фирмы 1 они определяются усло-
виями qi = 10, qi = 25 и т. д., а для фирмы 2 — условиями
д2 = Ю, д2 = 25 и т. д. Кривая РР', соединяющая все
точки касания между изоквантами фирмы 1 и фирмы 2,
называется производственной кривой. Все точки этой кри-
вой эффективны в производстве в том смысле, что не может
быть произведено большее количество любого продукта
без снижения выпуска другого. Точки вне производствен-
ной кривой не являются эффективными в производстве,
что, очевидно, вытекает из рассмотрения точек А и В.
Точка А не лежит на производственной кривой и поэтому
не эффективна в производстве, так как переход из точки А
в любую точку, лежащую на производственной кривой
между А' и А", приведет к увеличению производства обоих
товаров. В точке А уровни производства определены как
gi = 10, q2 — Ю. Передвижение из точки А в А' приведет
к увеличению производства товара 2 с 10 до 30, не умень-
шая производства товара 1, в то время как передвижение
из Л в Л" приведет к увеличению производства товара 1,
не уменьшая производства товара 2. Передвижение из Л
в В ведет к увеличению производства обоих товаров. Точ-
ка В, находящаяся на производственной кривой, эффек-
тивна в производстве, так как невозможно перейти к точ-
ке, в которой бы увеличилось производство одного товара
и не уменьшилось производство другого. Например, при
передвижении из В вдоль изокванты q2 — 25 выпуск
товара 2 остается неизменным, но происходит уменьшение
выпуска товара 1. Передвижение вдоль производственной
кривой влечет за собой увеличение одного выпуска и одно-
временное сокращение другого. Например, при передви-
жении из В в Л" <?1 возрастает с 25 до 30, но q2 умень-
шается с 25 до 10.
Таким образом, точки, эффективные в производстве,
которые лежат на производственной кривой, характери-
зуются равенством наклонов изоквант. А так как наклон
изокванты определяет предельную норму технического
замещения между затратами (отношение предельных про-
дуктов), то условие эффективности в производстве для
этой задачи примет вид
MB TS\2 = MB TS\, 00.1.4)
324
Рис. 10.3. Кривая производственных возможностей,
i
где через MRTS^ обозначена предельная норма техни-
ческого замещения между затратами вида г и г' в фирме /.
Вообще эффективность в производстве требует равенства
предельных норм технического замещения между двумя
затратами во всех фирмах, которые используют эти затра-
ты в своем производственном процессе.
Из множества точек, эффективных в производстве,
которые составляют производственную кривую РР'
Ен рис. 10.2, можно получить кривую производственных
возможностей на рис. 10.3, если нанести совместные уров-
ни выпуска двух товаров. Эта кривая показывает макси-
мально возможные комбинации уровней выпуска. Напри-
мер, точка В на рис. 10.2 определяет точку В на рис. 10.3,
в которой = 25, q2 = 25. Аналогично Р, А', А" и Р'
на рис. 10.2 соответствуют Р, А', А" и Р’ на рис. 10.3.
Точки, лежащие выше или правее кривой производствен-
ных возможностей, недостижимы. Точки, лежащие ниже
или слева от нее, достижимы; однако они соответствуют
таким точкам на прямоугольной диаграмме Эджворта —
Боули, которые не принадлежат производственной кривой.
Например, точка А на рис. 10.2, которая не является
оптимальной по Парето, соответствует точке А на рис. 10.3,
лежащей в пределах достищимой области, но не на кривой
325
Рис. 10.4. Кривые безразличия для двух потребителей.
производственных возможностей. В дальнейшем пред-
полагается, что достижимая область выпукла, как пока-
зано на рисунке.
Теперь рассмотрим проблему распределения товаров
между двумя потребителями. Вкусы потребителей харак-
теризуются двумя семействами кривых безразличия
на рис. 10.4. Предположим, что можно построить функ-
цию полезности. Тогда кривыми безразличия являются
геометрические места точек, удовлетворяющие условиям
Uh = Uh(c^, СЛ) = const, (10.1.5)
где Uh — полезность потребителя /г, ас, — потребление
товара / потребителем h; h = 1,2; j = 1,2. Общее потреб-
ление обоих видов товаров должно равняться произве-
денным количествам этих товаров
ci + ci = 91 '
Сг + сг2 = ?2-
(10.1.6)
Точка на кривой производственных возможностей
на рис. 10.3 показывает общий выпуск двух товаров.
Поэтому каждую такую точку можно использовать при
построении прямоугольной диаграммы, Эджворта — Бо-
ули для распределения, которая показана на рис. 10.5.
Кривая производственных возможностей показана здесь,
326
Как на рис. 10.3. Если задана точка 0' на этой кривой,
то прямоугольник строится так, чтобы углы его находились
в 0 и О'. Тогда угол 0 принимается за начало координат
для кривых безразличия потребителя 1, а угол 0' — в ка-
честве начала координат для кривых безразличия потре-
бителя 2. Каждая точка в прямоугольнике, как, например,
С, характеризуется шестью показателями: с*, c^, с2, с|, U1
и U~, которые удовлетворяют условиям (10.1.5) и (10.1.6).
Кривая АА', представляющая собой геометрическое место
точек касания двух множеств кривых безразличия, являет-
ся договорной кривой. Все точки этой кривой оптимальны
по Парето, а все остальные точки — нет. Например, точ-
ка С, не лежащая на этой кривой, не оптимальна по Паре-
то, так как можно улучшить положение потребителя 2,
не ухудшая положения потребителя 1, если перейти
из С в С. Аналогично переход из С в С" улучшит положе-
ние первого потребителя, не ухудшая положения второго
Потребитель 2
^^УКривая производственных
। т---------- боэ нежностей
Кривые безразличия
для потребителя 1
Потребитель!
Кривые Звзмзличия
Зля потребителя 2
Рцс. 10.5. Прямоугольная диаграмма Эджворта — Боули для
распределения.
327
потребителя \ Однако вдоль договорной кривой увели-
чение полезности одного потребителя вызывает умень-
шение полезности другого. Поэтому договорную кривую
иногда называют «конфликтной».
Таким образом, точки, оптимальные по Парето, при-
надлежат договорной кривой и характеризуются равен-
ством наклонов кривых безразличия. Так как наклон
кривой безразличия определяет предельную норму заме-
щения между товарами (отношение предельных полез-
ностей), условия оптимальности по Парето для распре-
деления в этой задаче примут вид
MRS\2 = MRS\, (10.1.7)
где через MRS1^- обозначена предельная норма замещения
между товарами / и ]' для по1ребителя h. Вообще опти-
мальность по Парето требует равенства предельных
норм замещения двух товаров для всех потребителей,
имеющих эти товары.
Так как используемые до сих пор графики не дают
четкой иллюстрации этого факта, введем еще одно важное
необходимое условие экономического оптимума, кото-
рое можно наглядно показать на рис. 10.5. Для экономи-
ческого оптимума необходимо, чтобы (общие) пре-
дельные нормы замещения двух товаров были равны
предельной норме преобразования товаров, которая опре-
деляется как наклон кривой производственных возмож-
ностей, MRT{2- Таким образом, <ч
MRS\2 = MRS\2 * MRTIZ. (10.1.8)
Необходимость этого дополнительного равенства очевидна
в случае только одного потребителя. Тогда на рис. 10.5
1 В «обменной» экономике, в которой фиксированы количества
товаров, если С на рис 10 5 определяет начальное распределение
товаров между двумя потребителями, то единственной «особой»
частью договорной кривой является С’С. Эта часть договорной
кривой в терминах теории шр на илваетсяядром, под которым пони-
мается множество недоминирующпх исходов, удовлетворяющих
и индивидуальной рациональности (ни один потребитель не должен
ухудшить свое состояние) и совместной рациональности (оптималь-
ность по Парето) для каждого множества потребителей (см. раз-
дел 6 4). Современные исследователи-юоретики показали, что кон-
курентное равновесие всегда лежит в ядре и что по мере беспре-
дельного увеличения числа потребителей ядро С С" сокращается
и в пределе является множеством распределения, полученным при
конкурентном равноресии. См. [21, 22, 23, 24, 25, 26].
328
оптимум находился бы в Q, точке касания кривой без-
различия потребителя 1 и кривой производственных воз-
можностей. Это условие касания задается равенством
наклонов = MRT12. В случае двух потребителей
точку, не удовлетворяющую равенству предельной нормы
преобразования, наклона кривой производственных воз-
можностей в О' и общих предельных норм замещения —
общих наклонов кривых безразличия, проходящих через
выбранную точку на договорной кривой,— можно улуч-
шить, выбрав другую, лежащую на кривой производст-
венных возможностей. Тогда на новой прямоугольной
диаграмме Эджворта — Боули для распределения мо-
жет быть показано увеличение уровня полезности одного
потребителя без уменьшения уровня полезности дру-
гого.
Следующий шаг будет состоять в рассмотрении уров-
ней полезности двух потребителей в точке (или точках)
на рис. 10.5, которая принадлежит договорной кривой
и удовлетворяет вышеприведенному требованию, что (об-
щие) предельные нормы замещения должны равняться
предельным нормам преобразования (10.1.8). Такие точки
принадлежат пространству полезностей (U1, U2), а множе-
ство точек, соответствующих точкам производственных
возможностей на кривой производственных возможностей,
образует кривую возможных полезностей, изображенную
на рис. 10.6. Эта кривая показывает максимально воз-
можные комбинации уровней полезностей и представляет
собой границу допустимой области. Она является оги-
бающей кривых полезностей, каждая из которых харак-
теризует геометрическое место комбинаций полезностей,
связанных с договорной кривой некоторой точкой, при-
надлежащей кривой производственных возможностей.
Однако единственной точкой (или точками) на какой-
либо кривой полезности, которая касается кривой воз-
можных полезностей, является точка, удовлетворяющая
условию (10.1.8).
Кривая возможных полезностей характеризует макси-
мально возможную полезность одного потребителя при
заданной полезности другого и представляет собой мно-
жество экономических оптимумов или точек, оптимальных
по Парето. За любой точкой этой кривой кроются
условия эффективности и оптимальности по Парето.
Б общем случае при движении вдоль этой кривой необ-
329-
Допустимая
Линии
уробня
Функции
социального
благосостоя-
ния
-*~и1
Направление
наискорейшего
роста
Возможных
полезностей
Рис. 10.6. Кривая возможных полезностей и социальный опти-
мум.
ходимо изменение структуры выпуска и перераспределение
ограниченных ресурсов в экономике.
Для того чтобы выбрать единственную точку на кри-
вой возможных полезностей, необходимо ввести этическое
понятие «заслуги», определяемое функцией социального
благосостояния
W = W (U1, U2), (10.1.9)
подлежащей максимизации. Предполагается, что социаль-
ное благосостояние W положительно зависит от обоих
уровней полезности, т. е. если полезность одного потре-
бителя возрастает в то время, как полезность другого
остается неизменной, то социальное благосостояние уве-
личивается
^>0, fe=l, 2, (10.1.10)
где через dW!dUh обозначена предельная социальная значи-
мость потребителя h. Однако сравнения взаимовлияний
полезностей двух потребителей невозможны, поэтому
полезности нельзя складывать. На самом деле, функции
330
(юлезности могут быть подвергнуты любому монотонному
строго возрастающему преобразованию.
На рис. 10.6 показаны линии уровня и направление
наискорейшего роста для некоторой функции социального
благосостояния. Социальный оптимум находится в точке
S — точке на кривой возможных полезностей, в которой
достигается наивысший уровень социального благосостоя-
ния, т. е. наивысшая возможная линия уровня функции
социального благосостояния. Комбинация полезностей в S
определяет некоторую структуру выпуска, а именно такую
же, как на прямоугольной диаграмме Эджворта — Боули
для распределения на рис. 10.5, дающей эту же комбина-
цию полезностей. Тогда определенная структура про-
дукции влечет за собой некоторое распределение ресурсов,
а именно такое же, как на прямоугольной диаграмме
Эджворта — Боули для производства на рис. 10.2, соот-
ветствующее этой же комбинации товаров. Таким образом,
в процессе последовательных шагов социальный оптимум
определяет социально оптимальные уровни продукции
и затрат х.
Основные теоремы экономики благосостояния, кото-
рые доказываются при большей степени общности в сле-
дующем параграфе, связывают эффективные точки кри-
вой возможных полезностей с условиями конкурентной
экономики, в которой все потребители и фирмы поль-
зуются заданными ценами. Эти теоремы утверждают, что
при определенных условиях конкурентное равновесие
оптимально по Парето и что любое оптимальное по Па-
рето распределение ресурсов может быть достигнуто
в конкурентной экономике с определенным множеством
цен и распределением ресурсов собственников. Здесь
можно рассмотреть иллюстрации этих теорем, используя
теорию потребления и теорию фирмы, изложенные
в гл. 7 и 8.
Рассмотрим условия эффективности в производстве,
показанные геометрически как производственная кривая
1 Линии уровня функции социального благосостояния в про-
странстве полезностей U1, U2 соответствуют линиям уровня в про-
странстве выпуска продукции (qt, q2) при условии, что полученный
при этом доход оказывается оптимально перераспределенным меж-
ду потребителями. Непересекающиеся линии уровня в пространстве
выпуска продукции, соответствующие линиям уровня W (V1, V2)
в пространстве полезностей, называются кривыми социального без-
различия. См, [27, 3, 28, 29],
331
на рис. 10.2. Условием оптимальности по Парето в про-
изводстве выступало равенство наклонов изоквант, т. е.
равенство предельных норм технического замещения меж-
ду затратами для двух фирм
MRTS\2 = MRTS*V (10.1.11)
В конкурентной экономике, однако, платы за факторы
заданы, и максимизация прибыли требует касания изо-
квант и изокост, т. е.
MRTSfi2 = ^, f=l, 2, (10.1.12)
где через обозначено соотношение оплат двух видов
затрат, наклон изокост. Так как обе фирмы в условиях
оптимальности приравнивают свои предельные нормы
замещения к одному и тому же параметру — отношению
оплат, то в конкурентной экономике предельные нормы
технического замещения должны быть равны; иначе гово-
ря, любое конкурентное равновесие эффективно в произ-
водстве \ Геометрически в любой точке производственной
кривой на рис. 10.2 обе изокванты касаются одной и той
же линии, наклон которой определяется соотношением
плат за затраты.
Аналогичные рассуждения проводятся для оптималь-
ности по Парето. В конкурентной экономике потребители
пользуются заданными ценами, а максимизация полезно-
сти требует касания кривой безразличия и «бюджетной
линии» (budget line), т. е.
MRS\= — , fe=l, 2. (10.1.13)
1 Если цены продукции равны предельным издержкам произ-
водства, то после умножения на предельный продукт какого-
либо фактора предельный продукт оказывается равным реальной
плате за факторы (плате, деленной на цену продукта), поэтому пре-
дельная норма технического замещения, которая является соотно-
шением предельных продуктов, равна соотношению плат. Такой
метод анализа лежит в основе исследования эффективности цен, осно-
ванных на предельных издержках. См. [30, 31, 3, 32]. Некоторые
авторы предполагали, что установление цен, пропорциональных
предельным издержкам, будет достаточно для оптимума. Эта «гипо-
теза пропорциональности» оказывается неверной, если предложе-
ние факторов отвечает изменениям в оплатах или если продукт
используется одновременно в качестве конечного ц промежуточного
товаров.
532
Таким образом, предельные нормы замещения равны
MRS\2=MRS2n = -^, (10.1.14)
так как обе равны соотношению цен. На рис. 10.5 в любой
точке договорной кривой обе кривые безразличия касают-
ся одной и той же линии, наклон которой равен pjpz.
Наконец, в конкурентной экономике предельная нор-
ма преобразования должна тоже равняться соотноше-
нию цен
MRTa = ^- , (10.1.15)
так как в противном случае для одной фирмы будет вы-
годно использовать свои ресурсы в производстве другой
продукции. Это условие вытекает из того факта, что
предельная норма преобразования равна соотношению
предельных издержек, а предельные издержки равны
ценам в конкурентной экономике.
Вторая основная теорема экономики благосостояния
утверждает, что при заданном множестве оптимальных
по Парето затрат и выпусков (например, при социальном
оптимуме S) они могут быть получены в условиях совер-
шенной конкуренции, при которой соотношение оплат
и соотношение цен задаются общими предельными нормами
технического замещения и общими предельными нормами
преобразования соответственно. Однако необходимо пред-
положить, что собственность потребителей на факторы
приносит им доход, необходимый для покупки по этим
ценам товаров, предназначенных для них в S.
Перед тем как приступить к доказательству основных
теорем экономики благосостояния при большой степени
общности, важно еще раз остановиться на кратком рас-
смотрении утверждений этих теорем. Согласно теоремам,
конкуренция оптимальна по Парето и любой оптимум
по Парето можно достичь в условиях конкуренции. Это
совсем не означает, что конкуренция необходима и доста-
точна для оптимальности по Парето. Конкуренция доста-
точна при определенных условиях, развитие этих условий
(точнее, отсутствие этих условий), при которых опти-
мальность по Парето не достигается, представлено в раз-
деле 10.3. В общем случае конкуренция не является необ-
ходимой, так как оптимальность по Парето может быть
333
достигнута и без конкуренции. Например, всемогущий
«диктатор» мог бы достичь оптимальности по Парето
с помощью декрета вообще без использования системы
цен х.
10.2. КОНКУРЕНТНОЕ РАВНОВЕСИЕ
И ОПТИМАЛЬНОСТЬ ПО ПАРЕТО
Как уже было отмечено, основные теоремы экономики
благосостояния связывают между собой равновесие в кон-
курентной экономике, при котором все потребители и фир-
мы пользуются заданными ценами с условиями оптималь-
ности по Парето. Современный подход использует ряд
понятий теории множеств для доказательства существо-
вания и оптимальности конкурентного равновесия [34, 35,
4, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45].
Предположим, что в экономике имеется п товаров,
которые могут служить в качестве продуктов или факто-
ров, причем товары устанавливаются на определенную
дату и определенное место так, что один «физический»
товар, поступивший в продажу в двух различных перио-
дах времени или в двух разных местах, будет рассматри-
ваться как два разных экономических товара.
Количество товаров п предполагается конечным, и счи-
тается, что каждый из них обладает свойством произволь-
ной делимости. Некоторый набор товаров характеризуется
вектором-столбцом х
х = (xi, х2, . . ., хп)', (10.2.1)
1 Выводом, достаточно важным для того, чтобы его рассматри-
вали как третью основную теорему экономики благосостояния,
является теорема «второго наилучшего», которая утверждает, что
частичная оптимальность, как правило, не желательна. Согласно
этой теореме, если некоторые условия оптимальности не могут
выполняться, например если некоторые предельные нормы техниче-
ского замещения оказываются не равными, то другие условия опти-
мальности вообще не являются условиями второго наилучшего опти-
мума, который определяется как оптимум при дополнительных огра-
ничениях, означающих, что некоторые (первые наилучшие) условия
оптимальности не могут выполняться. Таким образом, движение
в направлении конкуренции, например движение к установлению
цен, основанных на предельных издержках в каком-либо секторе,
не обязательно желательно, если остальная часть экономики не кон-
курентна. См. [33] и задачу 3-Л.
334
где Xj — количество товара j; j = 1, 2, . . n. Этот век-
тор определен в евклидовом «-мерном пространстве Еп,
которое называется пространством товаров.
Цены в экономике определяются вектором-строкой
Р = (Pi> Рг, • • • , Рп), (10.2.2)
где Pj — цена товара j; j = 1, 2, . . ., п. Цены не отри-
цательны, и по крайней мере одна из них не равна нулю
р 0, р 0, т. е. pj 0 для всех
Р; > 0 для некоторых /. (10.2.3)
Цены можно пронормировать, так как имеют значение
только относительные цены, и одной из возможных нор-
мализаций является такое измерение цен, при котором их
сумма равна единице, т. е.
2Л = 1. (Ю.2.4)
7=1
Так как рассматривается конкурентная экономика, то
цены одинаковы для всех потребителей и фирм, пользую-
щихся ими как заданными. Достаточными условиями кон-
куренции на каком-либо рынке являются следующие:
товары однородны, покупатели и продавцы анонимны,
осведомлены и многочисленны, «входы» и «выходы» фирмы
свободны. Однако эти условия не являются необходимы-
ми. Например, если в социалистической экономике цент-
ральный плановый орган устанавливает цены, налагает
большие штрафы за самовольное изменение цен, поддер-
живает порядок на рынке, то конкуренция на рынке
все же будет существовать (в смысле параметрических
цен) \
Каждая из F фирм в экономике должна установить
уровни затрат и выпуска продукции для максимизации
прибыли, учитывая технологические возможности. Если
выпуски продукции определяются как положитель-
ные уровни товаров, а затраты как отрицательные, то
1 См. [46, 47, 48, 49, 50, 51, 45, 52]. Оптимальность по Парето
будет гарантирована, если цены, установленные центральным
плановым органом, являются теневыми ценами (множителями Лаг-
ранжа), полученными при решении задачи максимизации благосо-
стояния при ограничениях, аналогичных ограничениям задачи
10-Г. Такие цены называются ценами Ланге — Лернера.
335
фирма / должна выбрать вектор затрат — выпуска у/
из пространства товаров •' ’
У7 = (//(, УЬ • (10.2.5)
где yf- — выпуск (затраты) товара j фирмой / и предпола-
гается, что ^положителен (отрицателен); / = 1, 2, ..., F.
Технологические возможности фирмы / характеризу-
ются множеством допустимых векторов затрат — выпуска,
которые образуют множество производственных возмож-
ностей Yf, являющееся подмножеством пространства
товаров. Фирма / должна выбрать вектор затрат — выпу-
ска из ее множества производственных возможностей
/=1, 2, ..., F. (10.2.6)
Эти условия являются более общими и заменяют произ-
водственные функции, которые использовались раньше.
Предполагается, что каждое множество производственных
возможностей есть замкнутое подмножество пространства
товаров, содержащее начало координат
Yf замкнуто, ОбУ^, / = 1, 2, ...,F, (10.2.7)
где замкнутость Ys означает, что векторы затрат — выпуска,
которые можно сколь угодно точно аппроксимировать
допустимыми векторами затрат — выпуска, сами допустимы;
а тот факт, что Y1 содержит начало координат, означает,
что любая фирма с технологической точки зрения может
не выпускать продукцию или не производить затраты.
Также предполагается, что каждое множество производ-
ственных возможностей независимо от векторов затрат —
выпуска, выбранных другими фирмами (и от структуры
покупок потребителей).
Общеэкономический вектор затрат — выпуска у опре- ,
деляется суммированием векторов затрат — выпуска всех
отдельных фирм
F F F F
У = Зу/=(2 у{, 3^» •••» S yfn)- (Ю.2.8)
/=1 /=1 /=1 /=1
В этой операции суммирования промежуточные продукты,
которые считаются положительными для производителей
и отрицательными для их потребителей, уничтожаются, и
в у входят только конечный выпуск (измеренный положи-
тельно) и первичные ресурсы (измеренные отрицательно).
336
Общеэкономический вектор затрат — выпуска Должен при-
надлежать общеэкономическому множеству производствен-
ных возможностей У, полученному при" суммировании
множеств производственных возможностей для всех фирм
F F
y£Y = 3 у/={уеЕ"|у= з у'; у€У' /=1, 2............F).
/=1 /=1
(10.2.9)
По сделанным предположениям У является замкнутым
подмножеством пространства товаров, содержащим нача-
ло координат. Примем еще несколько допущений, отно-
сящихся к общеэкономическому множеству производст-
венных возможностей У. Во-первых, предполагается, что
У — выпуклое множество, т. е. выпуклые комбинации
допустимых общеэкономических векторов затрат — вы-
пуска тоже допустимы
у, я£У влечет ау-|-(1 — а)я£У, 0^а^1. (10.2.10)
Для экономики в целом это означает, что в производстве
не существует возрастающего дохода от расширения
масштаба производства. Во-вторых, считается, что У
не содержит положительных векторов
Ур|й = {0}, (10.2.11)
где Q — неотрицательный ортант
Q = {yf5«|^.>0, / = 1, 2, ..., п}. (10.2.12)
Это условие означает, что невозможно производить про-
дукцию, не делая затрат. В-третьих, предполагается, что
если ненулевой у принадлежит У, то —у не принадлежит
У, поэтому
УП( —У)с{0}. (10.2.13)
Это условие выражает тот факт, что производство необ-
ратимо в том смысле, что выпуски и затраты нельзя
обратить, т. е. производить затраты как выпуски и исполь-
зовать выпуски в качестве затрат. В-четвертых, считается,
что У содержит неположительный ортант
-ЙсУ, (10.2.14)
т. е. можно использовать затраты, но не производить
выпуски в том случае, если нет ограничений на исполь-
зование затрат. Примером общеэкономического мно-
28-0270
337
хг (Товар 2, нЛфрмер,1
продукт пШпания)> ъ
х1 (Тобар 1,
например,
труб;
Рис. 10.7. Общеэкономическое множество производственных воз-
можностей.
жества производственных возможностей, удовлетворяю-
щего этим допущениям, может служить заштрихованная
область на рис. 10.7 в случае двух товаров, где, например,
товаром 1 может быть труд, а товаром 2 — продукт пита-
ния. Его граница во втором квадранте характеризует мак-
симальные выпуски продуктов питания для различных
объемов затрат труда.
Так как выпуски считаются положительными, а за-
траты — отрицательными, прибыль фирмы / задается
скалярным произведением цены и вектора затрат — вы-
пуска
я/_ру/=Д Р]У^ (10.2.15)
Общая прибыль всей экономики может быть представлена
в виде
F F
л = ру = р 3 У/ = 2 nf- (10.2.16)
/=1 /=1
Общая прибыль л максимальна в пределах Y, если,
и только если, все фирмы максимизируют свою индиви-
дуальную прибыль в пределах множеств производст-
338
венных возможностей^^. Этот результат следует’ из того',
что максимум линейной функции (прибыли) на каждой
из нескольких множеств (множеств производственных
возможностей) тождествен максимуму этой функции
на сумме множеств (множеств общеэкономических про-
изводственных возможностей). Таким образом, в усло-
виях, описанных предпосылками модели, децентрализо-
ванная экономика, в которой каждая фирма максимизи-
рует свою собственную прибыль, приходит к той же сум-
марной прибыли, что и централизованная экономика,
в которой максимизируется общая прибыль. Следова-
тельно, выбор между централизацией и децентрализацией
зависит от факторов, которые не были рассмотрены здесь,
таких, как информация и ее «цена».
Каждый из Н потребителей должен выбрать уровни
покупок и продаж товаров и услуг (например, покупок
продуктов питания, продажи труда) при условии бюджет-
ного ограничения. Потребитель h выбирает вектор потреб-
ления ch из пространства товаров
(10.2.17)
где Cj — покупка (продажа) товара j потребителем Л; с>
считается положительным (отрицательным); h ~ 1, 2, ...
. . ., Н. Вкусы потребителя h характеризуются отно-
шением предпочтения которое предполагается непре-
рывным, выпуклым и ненасыщеннымх. Непрерывность
означает, что если один вектор потребления строго пред-
почтительнее другого, то это строгое предпочтение сохра-
няется, если оба вектора немного изменятся; выпуклость
означает, что при заданном некотором множестве векторов
потребления, лежащем на отрезке прямой в простран-
стве товаров, один из конечных векторов потребления
наименее предпочтителен; ненасыщение выражает тот факт,
что для заданного некоторого вектора потребления из про-
странства товаров найдется еще один вектор потребления,
который строго предпочтительнее его. Также предпола-
гается, что отношение предпочтения для одного потреби-
теля не зависит от структуры потребления остальных
(и структур затрат — выпуска фирм).
Бюджетное ограничение для каждого потребителя
означает, что расходы не могут превышать доходов. Рас-
1 См. гл. 7.
22* 339
Ходы йотребителя h задаются скалярным Произведе-
нием
рсл= 3 Prf- (10.2.18)
>=1
Доход состоит из стоимости товаров, составляющих
начальные запасы, и дохода от участия в фирмах при
предположении, что в экономике господствует принцип
частной собственности. Начальные запасы потребителя h
выражаются ненулевым вектором
ал = (а*, ...,>*)', (10.2.19)
где а1} — начальный запас товара j. Кроме этого, потре-
битель h имеет право на фиксированную долю зл/ прибыли
фирмы /, где .
п, я
вл/>0, 2вл/=1. (10.2.20)
Л=1
Тогда бюджетное ограничение для потребителя h имеет вид
г
pcfl^pa/,+ S shfaf. (10.2.21)
/-1
Общий экономический уровень потребления задается век-
тором с, полученным суммированием индивидуальных
векторов потребления всех потребителей
н
с-Ус\ (10.2.22)
Л=1
Полный объем ресурсов, имеющихся в экономике, опре-
деляется вектором а, полученным суммированием началь-
ных запасов всех потребителей
н
а= 2а\ (10.2.23)
Л=1
а стоимость этих ресурсов составляет богатство экономи-
ки W
н
1У = ра = р 2 а'1. (10.2.24)
Л=1
Конкурентное равновесие определяется как ситуация,
при которой вектор цен устанавливается на уровне р*
р* = (р:,рг*, (Ю.2.25)
340
где р? — равновесная цена j-го товара; равновесный
(максимизирующий прибыль) вектор затрат — выпуска
каждой фирмы обобщается F векторами-столбцами
(У1*, У2*, ...,УР*), (10.2.26)
где — равновесный вектор затрат — выпуска фирмы
f; равновесные вектора потребления каждого потребителя
характеризуются Н векторами-столбцами
(с1*, с2*, ..., ся*), (10.2.27)
где сЛ*— равновесный вектор потребления потребителя h.
Вектор цен удовлетворяет условиям неотрицательности
и «нормальности»
р*>0 и 2р? = 1. (10.2.28)
Каждый из векторов затрат — выпуска допустим и опти-
мален при равновесных ценах; иначе говоря, вектор за-
трат — выпуска для каждой фирмы максимизирует при-
быль, учитывая наличные технологические возможности
,, * .* f , _v4/=l, 2, ...,F. (10.2.29)
л/* = р*у' \>р*у; для всех у' 6 YTJ '
Каждый из векторов потребления удовлетворяет бюджет-
ному ограничению и является оптимальным при равно-
весных ценах; т. е. для любого потребителя этот вектор
самый предпочтительный из всех, удовлетворяющих бюд-
жетному ограничению
F
р*см'^р*аЛ-|- 2 и
/=1
cft* > hCft для всех с\
удовлетворяющих
/1=1,2, ..., Н. (10.2.30)
F
p*ch^p*aA4- 2 8Л^л/*
/=1
Общее потребление каждого товара не может превышать
его выпуска и начальных запасов
с*<у* + а*,
(10.2.31)
и если общее потребление (спрос) для некоторого товара
строго меньше выпуска плюс начальный запас (предло-
жение), то на этот товар устанавливается нулевая цена
341
' ci + влечет за собой р? — 0, / = 1, 2, ..., п.
(10.2.32)
Эти условия
ниями:
характеризуются следующими соотноше-
г(с* — у*—’в*)^0
р* (с* — у*—а*) = (У?
(10.2.33)
Основная теорема теории общего равновесия утвер-
ждает, что при допущениях, сделанных выше, такое кон-
курентное равновесие существует. Доказательство этой
теоремы следует из анализа структуры предложения’фирм
и структуры спроса потребителей. Предложение фирмы /
характеризуется следующим соответствием:
S* (р) - {у** | yf* 6 Yf и pyf*^py^ для всех yz С У*}, (10.2.34)
а спрос потребителя h—соответствием следующим требо-
ваниям:
Dh (р) = {сЛ* ] pcft*^pah + 3 и с'!* hch
• г
для всех с\ удовлетворяющих pch^pah+ 3 shW}.
7=1
(10.2.35)
Каждое из этих соответствий представляет собой преобра-
зование точек множества неотрицательных нормированных
цен в подмножество пространства товаров. Соответствие
для общего избыточного спроса имеет вид
н f н
Е (Р) = з Dft (Р) - ( s S' (Р) +34 (10.2.36)
Л=1 /=1 Л=1
это означает, что общий спрос меньше, чем общее предло-
жение. В условиях равновесия
Е(р)^0 и р/ = 0, если 2?>(р)<0. (10.2.37)
Если применить теорему Какутани о неподвижной точке,
то существование такого равновесия последует из’по лупе-
прерывности сверху соответствий для избыточного'спроса +
1 Эта теорема могла быть в гл. 9, так как она касается
скорее существования, чем оптимальности. Однако она представле-
на здесь, поскольку, как будет показано далее, из нее вытекают
некоторые аспекты оптимальности конкурентного равновесия.
342
Оптимум по Парето представляет собой множество
векторов потребления
(с1*, с2*, ...,ся*), (10.2.38)
которые согласованы с технологией и бюджетными огра-
ничениями и для которых вЫ существует другого множе-
ства векторов потребления
(с1, с2, ..., ся), (10.2.39)
удовлетворяющих ограничениям,-*- тякого, что ни один
из потребителей не ухудшил своего положения, а по край-
ней мере один улучшил
ch hch* для всех h
h* г, (Ю.2.40)
с > ьс" для некоторых п. ' '
Как было замечено раньше, в общем случае существует
много таких ситуаций, оптимальных по Парето.
Первая основная теорема экономики благосостояния
утверждает, что конкурентное равновесие представляет
собой оптимум по Парето: для равновесия, описанного
выше, характерно, что невозможно увеличить хотя бы
один уровень полезности, не уменьшив при этом некото-
рого другого. Эта теорема является основным аргументом
в пользу желательности конкурентных рынков. Доказа-
тельство ее ведется от противного. Пусть конкурентное
равновесие, заданное (1 + F + Н) векторами
(р*. у1*; y2*f , yF*. ci*, с2*, , сн*), (10.2.41)
не является оптимумом по Парето. Тогда должно суще-
ствовать другое множество векторов потребления, опи-
санных в (10.2.39), удовлетворяющих (10.2.40). Но если
определенное множество векторов потребления (и векто-
ров затрат — выпуска и цен) составляло конкурентное
равновесие, то
с'1* hch для всех сЛ, удовлетворяющих р*сЛ^р*а/14-
F
+ 3 shfnf. (10.2.42)
/=1
Очевидно, что для «некоторого Л» из (10.2.40) или ch
не будет удовлетворять бюджетному ограничению, или
сЛ* не может входить (быть частью) в конкурентное
равновесие. Таким образом, теорема доказана методом
343
от противного; основой доказательства является пред-
положение о ненасыщении отношения предпочтения.
Вторая основная теорема экономики благосостояния
утверждает, что любой оптимум по Парето можно пред-
ставить как некоторое конкурентное равновесие, т. е.
с каждым оптимумом по Парето связана система цен
и система собственности на ресурсы, которые могут при-
вести к этому особому оптимуму по Парето как к кон-
курентному равновесию. Так как существует много воз-
можных оптимальных по Парето решений с различными
распределениями полезности, эта теорема гарантирует,
что можно достичь через конкурентное равновесие одного
оптимума по Парето, выбранного из всех на основе спра-
ведливости. Для этой теоремы важно, что потребитель-
ские предпочтения обладают свойствами выпуклости
и ненасыщенности и что технологические возможности
выпуклы. Тогда доказательство последует непосредственно
из теоремы о разделяющих гиперплоскостях выпуклых
множеств. Сущность теоремы проиллюстрирована на
рис. 10.8 для случая одного потребителя и одного произ-
водителя, где в качестве двух товаров выступают продукт
питания и труд, а первоначальных запасов нет. По пред-
положению, предпочтительные множества (точки, лежащие
выше некоторой кривой безразличия) и множество произ-
водственных возможностей выпуклы г. Оптимумом по Па-
рето является просто точка, в которой достигается наи-
высшая в пределах множества производственных возмож-
ностей кривая безразличия. В данном случае в качестве
оптимума' по Парето выступает точка касания границы
множества производственных возможностей (производст-
венной границы) и наивысшей достижимой кривой безраз-
1 На рис. 10.8 предположена строгая выпуклость как предпо-
чтительных множеств, так и множества производственных возможно-
стей. Для потребителя существует убывающая предельная норма
замещения междуТпродуктами питания и досугом, т. е. последова-
тельное уменьшение досуга (увеличение труда) должно быть ком-
пенсировано последовательно большим увеличением продуктов
питания. Аналогично у производителя имеет место уменьшающаяся
отдача гпри последовательном увеличении трудовых затрат, что
влечет за собой уменьшение прироста выпуска продуктов пита-
ния. Случай выпуклости, но не строгой, при которой границы
предпочтительных множеств (кривые безразличия) и/или граница
множества производственных возможностей содержат линейные
сегменты, рассматривается в работах Купманса J35] и Макоуэра [53J.
344
xz (Товар 2, например,
Кривые безразличия Л продукт питания)
Множество предпочтений
Множество производ-
ственных возможностей
Разбеляющая гиперплоскость
(линия цены)
(Товар 1, например,
труЗ)
Рис. 10.8. Оптимум по Парето может рассматриваться как кок
курентное равновесие.
личин, где вектор потребления потребителя обозначен
через с*, а вектор затрат — выпуска фирмы — через у*.
Но по предположению выпуклости существует разделяю-
щая гиперплоскость, в данном случае прямая, для которой
множество производственных возможностей лежит по одну
сторону, а предпочтительное множество, связанное с
наивысшей достижимой кривой безразличия,— по
другую.
Гиперплоскость, или линия цен, представляет собой
набор векторов z, для которых справедливо соотношение
p*z = V, где V — р*с* = р*у*, (10.2.43)
а вектор-строка р* является вектором цен, который
может привести к оптимуму по Парето в с* (= у*), как
к конкурентному равновесию. Потребитель, двигаясь
вдоль линии цен, достигает наивысшего уровня полезности
с*, в то время как производитель двигается вдоль произ-
водственной границы и достигает наивысшего уровня
прибыли в у*. Линия цен единственна, если предпочтитель-
ные множества и множество производственных возможно-
стей строго выпуклы,
345
10.3. РЫНОЧНАЯ НЕДОСТАТОЧНОСТЬ
Оптимальность по Парето' конкурентной экономики,
одна из основных теорем благосостояния, зависит от раз-
личных предпосылок. Они становятся очевидными в про-
цессе рассмотрения рыночной недостаточности, под кото-
рой имеется в виду ситуация, когда совершенная конку-
ренция не ведет к экономическому оптимуму. Главной
причиной рыночной недостаточности является прямое
воздействие внешних факторов [54, 18, 55]. В этом
случае рыночные цены не несут всей нужной информации
об экономике.
Под прямым воздействием внешних факторов (exter-
nalities) понимается ситуация, при которой, например,
полезность одного потребителя зависит не только от его
вектора потребления, но и от векторов потребления неко-
торых других потребителей или векторов затрат— выпуска
некоторых фирм. Примерами зависимости полезности
от потребления других членов общества могут служить
эффекты «как у Джонсов» и мода. Примеры зависимости
полезности от структуры затрат — выпуска — загрязне-
ние воды и воздуха. Другим типом внешнего влияния
является ситуация, при которой выпуск продукции одной
фирмы зависит не только от вектора затрат — выпуска
этой фирмы, но и от векторов затрат—выпуска других
фирм или от векторов потребления некоторых потребите-
лей. В качестве примера могут выступать два нефтепро-
изводителя, добывающие нефть из одной залежи.
Другим условием, при котором конкуренция не обяза-
тельно должна быть оптимальной, является существова-
ние общественных благ, потребляемых совместно несколь-
кими членами общества, для которых несправедливо
утверждение, что увеличение потребления одного потре-
бителя влечет за собой уменьшение потребления другого
[56, 57, 58, 59]. Примеры: национальная оборона, радио-
вещание и телевидение.
Рыночная недостаточность связана с невыполнением
первой основной теоремы экономики благосостояния —
оптимальности конкуренции. Вторая основная теорема,
возможность достижения оптимума по'.Парето в процессе
конкуренции также теряет смысл, если не удовлетворяют-
ся^предпосылки, используемые в доказательстве теоремы.
Возможно, наиболее важным допущением в этой теореме
349
является предположение выпуклости. Если предпочти-
тельные множества не выпуклы из-за неделимости или
возрастающей предельной нормы замещения или множе-
ство производственных возможностей не выпукло из-за
неделимости или возрастающей отдачи, то в процессе
конкуренции оптимум по Парето будет недостижим\
10.4. ОПТИМАЛЬНОСТЬ И ФАКТОР ВРЕМЕНИ
До сих пор в процессе анализа не рассматривалась роль
времени, особенно роль времени в экономике, которая
должна учитывать все будущие периоды времени. Для
такой экономики тоже можно ввести понятия оптималь-
ности по Парето и конкурентного равновесия при усло-
вии, что будущие вкусы и технология известны 1 2 *. Предпо-
лагается, что время измеряется в дискретных единицах
t = 1, 2, 3, . . . (10.4.1)
Технология экономики характеризуется технологиче-
ским соотношением затрат и выпуска. Предположим, что
есть п товаров, служащих и затратами, и выпуском, каж-
дый из которых определяется вектором-столбцом про-
странства товаров. При условии, что лаг времени равен
одному периоду, вектор затрат в момент времени t, at
приведет к вектору выпусков bi+1 в момент времени
t + 1, где
а( = (au, a2t, . . ., ant)'
, (10.4.2)
®i+l — O2t+1. • • •> »n*+l) •
Например, для модели расширяющейся экономики фон
Неймана,4 описанной в разделе 9.5," затраты заданы
1 Если на рынке существует большое количество торговцев
объем операций каждого из которых ничтожно мал по сравнению
со всем рынком, условие выпуклости может быть отброшено. На-
пример, даже если предпочтения каждого потребителя не выпуклы,
объединение большого числа незначительных потребителей приводит
к выпуклым общим предпочтениям См. [60, 61, 62, 63, 23, 24].
4 См. [64, 4]; проблема неопределенности рассматривается в ра-
ботах Дебре [43] и Эрроу [65]. Материал этого раздела содержит
динамику, но тем не менее помещен здесь, а не в части V, так как
он тесно связан с предыдущим разделом. Соответствующий материал
см. в гл. 16,
соотношением af = Ay (t), в то время как выпуски вычис-
ляются по формуле b(+1 = By (t + 1), где А и В — задан-
ные матрицы, а у (/) — вектор интенсивностей различных
существующих процессов в момент времени t. Однако
в модели, представленной здесь, не принимается никаких
дополнительных предпосылок касательно затрат и выпу-
сков по отношению к формулировке модели фон Неймана.
Производственные связи в экономике в момент вре-
мени t характеризуются двумя векторами аг и Ь(+1, опре-
деляющими затраты в момент t и выпуски в момент t + 1.
Во времени производственные связи характеризуются
производственной программой
{at, bi+1} = {az, bz+1 | i = 1, 2, . . (10.4.3)
Производственная программа допустима, если она при-
надлежит заданному множеству производственных воз-
можностей, которое содержит все допустимые комбинации
затрат и выпусков во времени. Это множество производ-
ственных возможностей определено на бесконечномерном
пространстве, которое представляет собой декартово
произведение бесконечного числа пространств товаров —
одного пространства для каждого периода времени. Это
пространство предполагается выпуклым и1 компактным.
Вкусы в экономике отражаются предположением, что
потребление — желаемый результат экономической дея-
тельности, где потребление в любой период времени t
задается мгновенной разностью между выпуском и затра-
тами этого периода. Таким образом, вектор-столбец уров-
ней потребления всех п продуктов определяется соотно-
шением
с< = bz — а(. (10.4.4)
Программа потребления задается последовательностью
векторов потребления во времени
{cf} = {сг И = 1, 2, . . .}. (10.4.5)
Она считается достижимой, если существует допустимая
производственная программа, при которой составляется
рассматриваемая программа.
Достижимая' программа потребления оптимальна по
Парето, если не существует другой достижимо ^програм-
мы потребления, которая' бы привела по крайней мере
к такому же уровню потребления всех товаров в каждый
948
период ьреМёйй й й уйелиЧейию Потреблений некоторого
товара в какой-либо один период. Таким образом, для
оптимальных по Парето программ потребления одним
из способов увеличить потребление одного товара в каком-
либо периоде является уменьшение потребления этого
товара или какого-либо другого товара в другом периоде
или уменьшение потребления какого-нибудь товара в этом
периоде.
Цены в экономике в момент времени t отражаются
вектором-строкой р(
Pf = (Pit, Pzt, , Pnt), (10.4.6)
где цены не отрицательны и нормированы. Программой
цен является последовательность векторов цен во вре-
мени * 1
{pj = {Pdf = 1, 2, . . .}. (10.4.7)
Конкурентное равновесие определяется как ситуация,
при которой установлена программа цен
{Р?}, (Ю.4.8)
где р* — равновесный вектор цен в момент времени t;
производственная программа
{at*; b?+i}, (Ю.4.9)
1 Поведение цен во времени определяется своими собственными
нормами процента, характеризующими степень заинтересованности
во владении определенным товаром. Собственная норма процента
для товара / в интервале времени 0, начинающемся в момент т,
определяется как р’ 0
/л । -i \9 . т+0
(1+Рт,е) - Р.х
Например, собственная норма процента на седьмой товар в течение
двух периодов, начинающихся в третий период, равна:
1
I Pi s\2
— 1.
Р»>»
Другим способом определения процентных норм является выраже-
ние их через денежную норму процента — норму процента, которая
характеризует степень заинтересованности во владении деньгами,
а не во владении товаром. Денежная норма процента товара j
в интервале времени 0, начинающемся в момент т, г}х 0 определяется
как
,е_ рДг _ / 1 \0
р;, т+е '1+₽т, е'
349
где а* — равновесный вектор затрат й момент Времени I;
b*+i — равновесный^, вектор выпуска Ъ момент времени
t + 1; программа потребления
{с?} = {Ь? - а?}, ($0.4.10)
где с* — равновесный вектор потребления в момент вре-
мени t.
Программа цен удовлетворяет условиям неотрицатель-
ности и нормализации; производственная программа допу-
стима; следовательно, программа потребления достижима.
Производственная программа оптимальна при равновесных
ценах в том смысле, что векторы затрат и выпуска макси-
мизируют прибыль в рамках существующей технологии
P*+ib*+i — pt*a* > p*+ib/+1 — р?аь (10.4.11)
где {а4, Ь(+1} — любая допустимая производственная про-
грамма. Программа потребления оптимальна при равно-
весных ценах, т. е. потребление максимально в каждом
периоде в рамках существующей технологии
с? > с,, (10.4.12)
гДе {с«} — любая Достижимая программа потребления.
Тогда теоремы предыдущего раздела можно применить
к экономике, описанной здесь. Конкурентное равновесие
существует и является оптимумом по Парето; и любой
оптимум по Парето может быть достигнут как конкурент-
ное равновесие. Метод доказательства этих теорем заклю-
чается в рассмотрении только таких программ, которые
продолжаются Т периодов; их можно рассматривать, как
в предыдущем разделе, считая, что имеют место пТ това-
ров. После этого нужно применить предельный переход
при неограниченном возрастании Т (Т -> оо).
ЗАДАЧИ
10-А. Состояние экономики S считается лучшим по Па-
рето, чем другое состояние S', если все потребители пред-
почитают S или не делают различий между S и S', в то
время как какой-нибудь потребитель считает S предпо-
чтительнее S'. Состояние S безразлично по Парето состоя-
нию S', если все потребители не делают между ними раз-
личий. Состояние S оптимально по Парето, если не суще-
ствует такого допустимого состояния экономики, которое
было бы лучше, чем это.
350
1. Пока&атЬ геометрически в Пространстве Полезностей
для потребителей множество состоянии, содержа*
щее несколько состояний, оптимальных по Парето.
Аналогично показать множество состояний, содер-
жащее только одно оптимальное по Парето состоя-
ние; множество, содержащее два оптимальных
по Парето состояния, и множество, не содержащее
оптимальных по Парето состояний.
2. Показать геометрически, что оптимальное по Паре-
то состояние не обязательно должно быть лучше
по Парето, чем не оптимальное по Парето состояние.
3. Показать, что если есть два оптимальных по Паре-
то состояния, то они либо безразличны, либо не-
сравнимы.
10-Б. Показать, что множество точек, которые являются
эффективными в производстве при линейной технологии,
описанной в разделе 9.2, выпукло. Проиллюстрировать
геометрически в случае двух товаров и четырех неэла-
стично поставляемых ресурсов.
10-В. Показать, используя диаграмму Эджворта — Боули:
1. Если каждый из двух потребителей имеет «центр
эь наслаждения» (точку максимума полезности), то для
достижения некоторых оптимальных по Парето
точек в условиях конкуренции может потребоваться
установление отрицательных цен.
2. Оптимум по Парето, в котором один потребитель
совсем не потребляет некоторого вида товаров
(договорная линия лежит на границе диаграммы
Эджворта — Боули), может не быть достигнут как
I конкурентное равновесие, использующее отрица-
тельные цены.
10-Г. Задача экономики благосостояния в случае 2 X 2 X
X 2 заключается в максимизации социального благосо-
стояния, заданного функцией потребительских полез-
ностей
W = W[U1(c11, сг2, U2 (с2, с|)]
при ограничении производственной функции и условий
поставки ресурсов
+ с? = /i (i, >1)
4 + = /2
+ г? = £1
4 + = г2
351
Путем выбора неотрицательных уровней потреблений
и затрат:
л с1 с4 с2 О
тД т*® (")
М’ lv г 11
1. Используя метод классического программирования,
показать, чго условия первого порядка для решения
классической задачи максимизации выражаются
геометрическими и алгебраическими условиями из
раздела 10.1. Вывести также условия второго
порядка.
2. Показать, что оптимальные множители Лагранжа
можно интерпретировать как цены и платы за фак-
торы (в условиях конкуренции или при установле-
нии цен центральным органом планирования), при-
водящие к оптимальным уровням потребления и
затрат.
3. Найти показатели чувствительности решения к из-
менениям общих уровней неэластично поставляе-
мых ресурсов и г2.
k. Предположим, что ограничения имеют форму не-
равенства
(4« 4) и т- д-
Вывести и интерпретировать условия Куна — Та-
ккера соответствующей задачи нелинейного програм-
мирования.
10-Д. В последней задаче предположим, что ресурсы при-
надлежат потребителям, каждый из которых максимизи-
рует полезность при условии бюджетного ограничения
max Uh — Uh (cf, c£) при условии, что
РА + р2<^ = + w2rh2 = I\
тце rht — количество ресурса i, принадлежащее потреби-
телю /г, pj — цена товара у; wt — оплата ресурса I и Ih—
доход потребителя h. Конечно, справедливы следующие
соотношения:
с} + cj = f} (г{,
Гц + r2i = ~Tt = + rf.
1. Найти цены, оплаты и объемы ресурсов, принадле-
жащие каждому потребителю и максимизирующие
352
социальное благосостояние. Связать ответ с п. 2
предыдущей задачи.
2. Показать, как могут быть компенсированы измене-
ния в объемах ресурсов, принадлежащих потреби-
телям, за счет изменения цен и оплаты.
10-Е. В случае 2x2x2 функция социального благосо-
стояния имеет вид
W = W\17\ U2].
Косвенные функции полезности определяются соотноше-
ниями
= uh* (р, Ih),
где р — вектор цен, a Ih — доход потребителя h (см. зада-
чу 7-И). Таким образом, косвенная функция благосостояния
примет вид
Ж* = W [ С74* (р, Г), U2* (р, I2)] = W* [р, I1, Р].
Она показывает зависимость оптимального благосостояния
>т цен и доходов.
1. Показать, что dW/dp <0 и dW*/dIh > 0, h = 1,2.
2. Предположим, I1* (W, р, I2) — минимальный уро-
вень дохода потребителя 1, необходимый для дости-
жения уровня благосостояния W, если цены — р,
а доход потребителя 2 равен I2. Найти
W1* д!1* д!1*
aw ’ ар ’ а/2 ’
10-Ж. Показать, что простая дискриминация цен, при
которой цены заданы, но различаются у потребителей и у
фирм, не может быть оптимальной по Парето.
10-3. Показать: теорема, утверждающая, что конкурент-
ное равновесие оптимально по Парето, требует принятия
допущения о том, что предпочтения каждого потребителя
характеризуются ненасыщением.
10-И. Показать на графиках, аналогичных рис. 10.8.
1. Не обязательно существует вектор цен, при котором
достигается оптимум по Парето в процессе конкурен-
ции, если предпочтительные множества или мно-
жество производственных возможностей не выпуклы.
2. Может существовать много векторов цен, при кото-
рых достигается оптимум по Парето в условиях
конкуренции, если предпочтительные множества
и множество производственных возможностей вы-
пуклы, но не строго.
23-0270
ЧАСТЬ IV
Динамическая
оптимизация
23*
Глава 11
Задача управления
Статической задачей рационального ведения хозяйства
(рациональной экономической деятельности) мы называли
ранее задачу распределения ограниченных ресурсов для
достижения комплекса конкурирующих целей в некоторый
определенный момент времени. Говоря языком математи-
ки, задача состоит в выборе из заданного допустимого
множества значений ряда переменных, называемых сред-
ствами («инструментами») таких значений, при которых
достигается максимум заданной целевой функции. Пред-
ставленная в такой форме задача была названа нами зада-
чей математического программирования.
Динамическая задача рационального ведения хозяй-
ства — это задача распределения ограниченных ресурсов
для достижения комплекса конкурирующих целей на про-
тяжении некоторого промежутка времени от начального
момента до конечного. Сформулируем эту задачу в мате-
матических терминах. Рассмотрим некоторые переменные
величины, называемые управляющими параметрами. Зада-
но некоторое множество функций времени, называемое
множеством управления (control set). Задача состоит
в выборе управляющих параметров как функций време-
ни, принадлежащих множеству управлений. Выбранные
функции времени в свою очередь определяют, какой вид
имеют функции времени некоторых других переменных,
с помощью которых описывается поведение системы. Эти
переменные называются фазовыми координатами. Значе-
ния фазовых координат в каждый момент времени выби-
раются таким образом, чтобы максимизировать заданный
целевой функционал, зависящий от фазовых координат
и управляющих параметров (и те и другие рассматри-
ваются как функции времени). Функции времени для
357
управляющих параметров и для фазовых координат свя-
заны с помощью системы дифференциальных уравнений,
называемых уравнениями движения. Задача, представлен-
ная в указанной форме, называется задачей управления.
Классическим примером задачи управления является
определение оптимальной траектории движения ракеты.
Управляющие параметры в такой задаче — это моменты
включения двигателей и длительность их работы, величина
и направление силы тяги, которую следует приложить
к ракете в каждый отдельный момент времени. Режим
работы двигателей выбирается в зависимости от ряда огра-
ничений, например в зависимости от общего количества
ракетного топлива, имеющегося на борту. Фазовыми пере-
менными, описывающими траекторию ракеты, являются
ее масса, а также положение и скорость’1 относительно
фиксированной системы координат. Зависимость фазовых
координат от силы тяги выражается с помощью системы
дифференциальных уравнений, получаемых на основе
законов физики. В результате расчет траектории пред-
стоящего космического полета заключается в отыскании
максимума некоторого целевого функционала. Так, напри-
мер, при разработке проекта полета на Луну на ракете
«Аполлон» целью является максимизация полезной нагруз-
ки последней ступени. При этом считаются известными
место посадки на Луну и конечная скорость — достаточно
малая, чтобы экипаж ракеты и ее оборудование не постра-
дали при посадке на лунную поверхность.
11.1. СТРОГАЯ ФОРМУЛИРОВКА ЗАДАЧИ
При строгой формулировке задачи управления исполь-
зуются следующие понятия: время (момент времени), фа-
зовые координаты, управляющие параметры, уравнения
движения, определение конечного момента, целевой функ-
ционал х.
Время t измеряется как непрерывная величина. Пред-
полагается, что t изменяется в некотором фиксированном
промежутке: от начального момента t0, который обычно
1 Основная литература по задаче управления [1, 2, 3, 4, 5,
6]. Важные с исторической точки зрения статьи, относящиеся к за-
дачам управления, содержатся в сборниках под редакцией Веллмана
и Калаба [71 и Ольденоургера [8].
358
известен, до конечного момента tt, который чайи> требует-
ся определить. Следовательно, время твадано- на проме-
жутке 1
(11.1.1)
Состояние системы в любой момент времени t из ука-
занного промежутка характеризуется с помощью п веще-
ственных чисел Xi (t), х2 (t), • • •, хп (О, называемых фазо-
выми координатами. Составленный из фазовых координат
га-мерный вектор-столбец
х (t) = (Xi (t), х2 (t), . . хп (t))', (11.1.2)
называемый фазовым вектором (фазовой точкой), можно
геометрически интерпретировать как точку в га-мерном
евклидовом пространстве Еп. Каждая фазовая координата
считается непрерывной функцией времени, поэтому фазо-
вая траектория
{х (t)} = {х (t) е Еп | (11-1.3)
представляет собой непрерывную вектор-функцию време-
ни, значениями которой в каждый данный момент време-
ни t из указанного промежутка являются фазовые векто-
ры (11.1.2). С геометрической точки зрения фазовая траек-
тория представляет собой некоторую кривую, состоящую
из точек пространства Еп. Началом этой кривой является
фиксированное начальное состояние
х(£о)=Хо, (11.1.4>
а окончанием — конечное состояние
X (ti) = Xi, (И 1 5)
которое во многих задачах требуется определить.
Выборы (решения), которые нужно осуществлять
в каждый данный момент времени t из указанного интер-
вала, характеризуются с помощью г вещественных чисел
ui (t), и2 (t), . . ., ur (t), называемых управляющими пара-
метрами. Составленный из управляющих параметров
г-мерный вектор-столбец
u (t) = (щ (t), и2 (t), . . ., ur (t))', (11.1.6)
1 Задачи управления, в которых время измеряется как дис-
кретная величина (t — 0, 1, 2, . . .) рассматриваются в работах.
Чанга [9], Ариса [10], Фана и Ванга Ill], Уайлда и Бейтлера [12].
См. также разделы 11.4 д 13.3.
359
называемый управляющим вектором, можно интерпретиро-
вать геометрически как точку в ЕТ. Управлением («траек-
торией управления») называется функция
{„(,)} = {u w । (ц.1.7)
Требуется, чтобы каждый управляющий параметр являлся
кусочно-непрерывной функцией времени. Поэтому управ-
ление представляет собой кусочно-непрерывную функцию
времени. Значениями этой функции в каждый данный
момент времени t из указанного промежутка являются
управляющие векторы (11.1.6). С геометрической точки
зрения управление представляет собой некоторую кривую,
состоящую из точек пространства, причем эта кривая
непрерывна всюду, за исключением, возможно, некоторо-
го конечного числа точек разрывов первого рода.
Предполагается, что возможные значения управляю-
щих параметров удовлетворяют некоторым ограничениям.
Эти ограничения в общей форме состоят в том, что управ-
ляющий вектор в каждый момент времени из интервала
должен принадлежать некоторому фиксиро-
ванному непустому подмножеству Q r-мерного евклидова
пространства
u (Z) 6 £2, (11.1.8)
Обычно предполагается, что множество £21 является выпук-
лым и компактным (т. е. замкнутым и ограниченным)
и что оно инвариантно относительно времени. Управление
(11.1.7) называется допустимым, если оно представляет
собой кусочно-непрерывную вектор-функцию времени, зна-
чения которой в любой момент времени из указанного
интервала принадлежат £2. Множество управлений U —
это множество всех допустимых управлений, т. е. таких
управлений, которые являются кусочно-непрерывными
функциями времени, заданными в промежутке
<71, значения которых в любой момент из указанного
промежутка принадлежат £2. Управление должно принад-
лежать указанному множеству управлений, т. е.
{u(t)}€U. (11.1.9)
Фазовая траектория {х (t)} определяется из уравнений
движения, т. е. из системы дифференциальных уравнений,
1 Множество О называют областью управления.— Прим,
rupee.
360
в которых скорость изменения каждой фазовой координа-
ты представлена в виде функции фазовых координат,
управляющих параметров и времени
х (0 = f (х (0, и (0, /), (11.1.10)
или в развернутом виде
тг-(0 = (t) (*i (0, *2 (t), . . хп (Z);
Wi (0> и2 (0> • • •» ur W; ^), 1 — 1> 2,..., п. (Н.1.11)
Предполагается, что каждая из заданных п функций
(• • •), /2 ('' ')> • • ч fn (• • •) является непрерывно диф-
ференцируемой. Если эти дифференциальные уравнения
не зависят явно от времени, то уравнения движения назы-
ваются автономными. Важным примером такой системы
уравнений являются линейные автономные уравнения
движения
х = Ах + Ви, (11.1.12)
где А — фиксированная матрица размерности п X п,
а В — фиксированная матрица размерности п X г.
Фиксированные начальные значения фазовых коорди-
нат (11.1.4) являются граничными условиями для урав-
нений движения. Если заданы эти начальные значения и
управление {и (/)}, то существует единственная фазовая
траектория {х It)}, удовлетворяющая уравнениям дви-
жения и граничным условиям. Эту траекторию можно най-
ти интегрированием дифференциальных уравнений при
данных начальных условиях х (Zo) = х0. Фазовая траекто-
рия, найденная в результате решения уравнений движе-
ния при данном начальном состоянии с использованием
допустимого управления, называется допустимой, а лю-
бая фазовая точка на фазовой траектории, которую можно
достичь за конечное время, называется достижимой.
Конечный момент времени определяется условием
(х (t), t) при t = tlt (11.1.13)
где Т — заданное подмножество в £n+1, называемое ко-
нечной поверхностью. Важными частными случаями зада-
чи управления являются задача с фиксированным време-
нем, ’ когда конечный момент времени Z, задан'в явной
форме как параметр задачи, и задача с фиксированным
361
конечным моментом времени, когда х (0) задан в явной
форме как вектор параметров задачи.
Целевой функционал, максимум которого требуется
найти, представляет собой отображение управлений (функ-
ций времени) на точки вещественной’ прямой. Этот функ-
ционал будет рассматриваться, как правило, в следующей
форме 0
L1
J = J{и (0} = J I (х (0, и (0, 0 At + F (х„ 0). (11.1.14)
м
Подынтегральная функция /(•••) показывает, что функ-
ционал зависит от фазовых координат и управляющих
параметров, являющихся функциями времени, и от вре-
мени, т. е.
I (х, п, 0 = Z (0, х2 (0, . . ., хп (0; ut (0, и2 (0, . . .,
иг (0; 0, (И.1.15)
где 0^<^0.
Второе слагаемое F (• •) в выражении для функционала,
которое мы назовем функцией конечных параметров, пока-
зывает, что функционал зависит от конечного состояния
и от конечного момента времени:
F (х1т 0) = F (xi (0), х2 (0), . . ., хп (0); 0). (11.1.16)
Предполагается, что как /(•••), так и F (• •) являются фик-
сированными непрерывно дифференцируемыми функция-
ми. Целевой функционал записан в (11.1.14) как функцио-
нал, зависящий от управлений, потому что если вектор-
функция !(•••) и вектор хо заданы, то управление {и (0)
определяет фазовую траекторию {х’(0}.
Задачу с целевым функционалом такого вида, как в
(И. 1.14), обычно называют задачей Больца. Если функция
конечных параметров тождественно равна нулю, так что
й
J= f Цх, u, t)dt, (И.1.17)
__________ to
1 Отметим, что стандартные обозначения в задаче управления
отличаются от обозначений в задачах математического програм-
мирования. Динамическим аналогом вектора" инструментальных
переменных х из теории математического’программирования являет-
ся управление {u (t)), а не фазовая траектория (х (/)).
362
то такую задачу называют задачей Лагранжа. Задачу, в ко-
торой подынтегральная функция тождественно равна ну-
лю, так что
J = F (хь ti), (11.1.18)
называют обычно задачей Майера. Может показаться, что
задача Больца является более общей, нежели задача Ла-
гранжа или задача Майера, однако на самом деле все три
задачи эквивалентны, что можно доказать с помощью соот-
ветствующих преобразований переменных. Так, например,
всякую задачу Больца можно свести к задаче .Майера,
определив следующим образом дополнительную фазовую
координату хп+1:
х„+1 (i) = I (х, U, t)
xn+i (i0) = о. (11.1.19)
Тогда выражение (11.1.14) принимает вид
J = яп+1 (М + F (Х1, /,), (11.1.20)
а функционал такого типа является целевым функционалом
задачи Майера.
Итак, общая задача управления состоит в следующем:
требуется найти
ti
maxJ = ( Г(х, u, i)di-|-/’(x1, ij) (11.1.21)
{n(f)} J
•0
при условии, ЧТО X = f (х, u, i)
io и x (i0) = x0 фиксированы
(x (Z), i) g T при t =
{u (i)} e u.
Геометрическая интерпретация этой задачи для случая
одной фазовой координаты дана на рис. 11.1. Из множе-
ства допустимых фазовых траекторий, начало которых со-
ответствует заданному начальному состоянию xq в на-,
чальный момент времени io, требуется выбрать определен-,
ную фазовую траекторию, при этом необходимо учитывать,
что каждая допустимая фазовая траектория осуществляет-
ся при использовании некоторого допустимого управления
{u (Z)}. Оптимальной траекторией {х* (Z)} является такая
383
Х|
х (Фазовая
,, координата)
Альтернативные Эопустимые
траектории(х(1)}|
бкоХо’й негп'ЖЖ
допустимых траекторий
О t0
Начальный
момент
бремени
Начало
'ная'/
точка
тональная траектория
Конечная точка х^
Конечная поверхность
Конечный
момент
бремени
Рис. 11.1. Геометрическое изображение задачи управления в слу-
чае одной фазовой координаты.
допустимая фазовая траектория, заканчивающаяся на ко-
нечной поверхности, на которой достигается максимум
целевого функционала.
11.2. НЕКОТОРЫЕ ЧАСТНЫЕ СЛУЧАИ
Задача с целевым функционалом вида (11.1.14), или с
эквивалентными ему целевыми функционалами вида
(11.1.17), или (11.1.18) является особенно важной, так как
она представляет собой обобщение ряда частных задач
управления. Одним из таких важных частных случаев
является задача об оптимальном быстродействии (задача
о минимальном времени перехода), в которой требуется
за минимальное время перевести фазовую точку из задан-
ного начального положения в заданное конечное поло-
жение. В этом случае целевой функционал принимает вид
J = -(«! - М- (11-2.1)
Тот же вид имеет функционал в задаче Лагранжа, в кото-
рой /(•••) = —1. Так как время t0 задано, то в эквива-
364
внтной задаче Майера функция F (••) = —Классиче-
ким примером задачи о минимальном времени перехода,
Относящимся еще к XVII столетию, является задача о бра-
хистохроне. В этой задаче рассматривается движение ма-
териальной точки, которая под действием силы тяжести
скатывается без трения вдоль некоторой кривой из фикси-
рованной верхней точки нефиксированную нижнюю точку.
Требуется определить кривую, соответствующую мини-
мальному времени перехода. Другим примером может
служить задача управления кораблем, когда требуется
достичь места назначения за минимальное время.
Второй частный случай задач управления связан с ра-
ботой автоматических следящих устройств (сервомеханиз-
мов). В задачах такого рода известны желательные состоя-
ния объекта х°(/) в каждый момент определенного проме-
жутка времени и требуется обеспечить, чтобы фактические
значения фазового вектора в каждый момент времени были
достаточно близкими к желательным состояниям. Напри-
мер, при отапливании дома фазовой координатой является
температура в помещении, которую желательно поддер-
живать на уровне, достаточно близком к заданному. Целе-
вой функционал в этом случае имеет вид
h
J= j ф(х°(£) — (11.2.2)
to
где ф (•) — функция, измеряющая отрицательный эффект
от различия между фактическим и желательным состоя-
нием. Например, если применяется критерий метода наи-
меньших квадратов, то функция ф (•) представляет собой
квадратичную форму
Ф (х° (г) — х Ц)) = (х° (г) — х (/))' D (х° (0 — х (0),
(11.2.3)
где D — заданная отрицательно определенная матрица
взвешивающих коэффициентов. Произведя перемножение
и отбросив постоянный член, поскольку его значение несу-
щественно при поиске максимума, получим интегральный
функционал с функцией, равной сумме линейной формы
и квадратичной формы:
365
*i
J=j (cx4-x'Dx)tft, (11.2.4)
<0
где c = —2x° (/)' D — вектор-строка.
Третий важный частный случай — задача на минимум
энергии, в которой целевой функционал зависит только
от управлений. Если подынтегральная ^функция в этой
задаче представляет собой квадратичную форму, то
<1
J= f u(/)'Eu(*M, (11.2.5)
<oi
где E — фиксированная отрицательно определенная ма-
трица взвешивающих коэффициентов. Если объединить
эту задачу с предыдущей, то можно образовать целевой
функционал
Ч
(cx-j-x'Dx4-u'Eu)dt, (11.2.6)
to
где с — фиксированный вектор-строка, a D и Е — фик-
сированные отрицательно определенные матрицы. Не те-
ряя общности, можно считать, что желательным состоя-
нием является начало координат х° (t) = 0, при этом с =
= 0. Измеряя различия между фактическими и желатель-
ными состояниями, приходим к функционалу
ч
J = j (x'Dx-j-u'Eu)dt, (11.2.7)
to
который является комбинацией функционалов (11.2.4)
и (11.2.5).
11.3. ВИДЫ УПРАВЛЕНИЯ
В задачах управления встречаются два вида управле-
ния. Один из них — управление по разомкнутому контуру.
В этом случае оптимальное управление, являющееся реше-
нием (11.1.21), определяется как функция времени
{и* (/)}. (11.3.1)
366
Управление по разомкнутому контуру полностью опреде-
ляется в начальный момент t0, а фазовая траектория {х (£)}
отыскивается в результате интегрирования уравнении дви-
жения при фиксированных начальных условиях. Другой
вид управления — управление по замкнутому контуру
(с обратной связью). В этом случае оптимальное управ-
ление определяется как функция текущих фазовых коор-
динат и времени
{и* (х (0, t)j. (11.3.2)
В отличие от управления по разомкнутому контуру, когда
все решения принимаются заранее, при управлении по
замкнутому контуру решения можно пересматривать с уче-
том новой информации, которую несут текущие фазовые
координаты. Задача определения оптимального управле-
ния по замкнутому контуру называется задачей синтеза.
Различия между управлением по разомкнутому конту-
ру и управлением по замкнутому контуру хорошо видны
на примере работы двух простых устройств: сушилки для
белья и отопительной системы в здании. Вольшинство ти-
пов сушилок для белья представляет собой системы с управ-
лением по разомкнутому контуру: режим работы их зада-
ется с помощью реле времени. Отопительная система, на-
против, обычно регулируется с помощью термостата, кото-
рый включает обогревающее устройство, если температура
в помещении понизилась, и выключает его, если темпера-
тура становится слишком высокой. Следовательно, управ-
ление обогревающим устройством зависит от текущего
значения фазовой координаты — температуры в поме-
щении.
Примеры этих двух видов управления существуют так-
же и в экономике. Автоматические стабилизаторы, такие,
как страхование по безработице и прогрессивный подо-
ходный налог, представляют собой системы управления
с обратной связью. Так, например, рост числа безработных
приводит к росту суммы выплат пособий по безработице,
что в свою очередь противодействует росту безработицы.
Аналогично этому расширение инфляции приводит при дей-
ствующей системе прогрессивного налогообложения к соот-
ветствующему увеличению подоходного налога, что про-
тиводействует росту инфляции. Управляющие параметры
в каждом из этих случаев (пособия по безработице или нало-
говые отчисления) соответствуют текущему состоянию эко-
367
номики. Другой пример системы управления с обратной
связью — зто денежная политика в том виде, как она осу-
ществляется федеральной резервной системой США, кото-
рая регулирует выпуск денег и определяет условия креди-
та в соответствии с текущими значениями экономических
переменных. Правда, имели место предложения пре-
вратить эту систему управления с обратной связью в разом-
кнутую систему управления, в которой определенный зара-
Ключ к обозначениям:
ИсхоЗные
банные
Что
требуется
определить
(максимизи-
ровать J]
Типы управления
(управление с зам-
кнутой цепью и
управление с разом-
кнутой репью]
Рис. 11.2. Задача управления с фиксированным конечным мо-
ментом времени.
нее темп роста суммы денег, участвующих в обороте,щаррйг
мер в размере 5% в год, выдерживался бы неизменным вне
зависимости от текущего состояния экономики.
На рис. 11.2 в виде схемы показаны два вида управле-
ния и некоторые другие аспекты задач управления на при-
мере задачи с закрепленным временем. Здесь кружками
обозначены исходные данные: начальный момент и на-
чальное состояние, уравнения движения, область (множе-
ство) управления и целевой функционал. В прямоуголь-
никах указано, что требуется найти — управление и фазо-
вую траекторию. Ромбами обозначены два вида управления:
управление по замкнутому контуру и управление по разом-
кнутому контуру. Взаимосвязи, существующие между
различными частями задачи, показаны с помощью стрелок.
Так, например, поскольку для определения скорости изме-
нения фазовых координат с помощью уравнений движения
используется текущее состояние, определенное управление
и время, то эти величины влияют на фазовую траекторию.
В дальнейшем, как правило, предполагается, что задача
управления не содержит случайных переменных и что все
необходимые параметры, функции и множества, указанные
в (11.1.21), полностью определены. В этом случае управ-,
ление по замкнутому контуру и управление с обратной
связью приводят к одинаковым результатам. Поэтому ос-
новное внимание будет уделено управлению по разомк-
нутому контуру, которое обычно легче определить, чем
управление по замкнутому контуру. Однако в двух типах
задач управления, указанных ниже, управление по замк-
нутому контуру имеет преимущество перед управлением
по разомкнутому контуру, так как первое доставляет боль-
шее максимальное значение целевого функционала. Этими
двумя типами задач являются задачи стохастического
управления, которые содержат случайные переменные с фик-
сированными распределениями, и задачи адаптивного уп-
равления, которые содержат неопределенности относитель-
но начальных условий на параметры, функции или множе-
ства, которые уменьшаются или полностью устраняются
по мере развертывания процесса. Задачи этих двух типов
в настоящей книге не рассматриваются х.
1 Проблемы стохастического управления рассматриваются в ра-
ботах Аоки [13] и Кушнера [14]. Об адаптивном'управлении см.
[15, 16, 17].
24-0270
369
11.4. ЗАДАЧА УПРАВЛЕНИЯ КАК ЗАДАЧА
ПРОГРАММИРОВАНИЯ
В БЕСКОНЕЧНОМЕРНОМ ПРОСТРАНСТВЕ;
ОБОБЩЕННАЯ ТЕОРЕМА ВЕЙЕРШТРАССА
Задачу управления можно считать задачей математиче-
ского программирования в бесконечномерном пространстве.
Рассмотрим следующую задачу управления:
h
max J = I I(xhu)dt
{u(O £ J
' x = / (x, u) (11.4.1)
to hl x (to) — x0 фиксированы
hJ tf фиксирован
{u (/)} 6 U.
‘-'i
Эта задача отличается от (11.1.21) следующими своими
свойствами: она автономна, т. е. уравнения движения и це-
левой функционал не зависят явно от времени; данная зада-
ча относится к классу задач Лагранжа, так как целевой
функционал не зависит от конечного состояния или от ко-
нечного момента времени; это задача с закрепленным вре-
менем, так как задано, а х (t^) произвольно; задача содер-
жит только один управляющий параметр и одну фазовую
координату.
Заданный промежуток времени (£0^^^Ч) можно
разбить на N интервалов равной длины А
Д = 21Гр> . (И-*-2)
Время измеряется в дискретных единицах
tg + 3А, (11.4.3)
где индекс q изменяется от 0 (что соответствует t = tg)
др N (что соответствует t — tt). Состояния и управле-
ния замеряются в отмеченные дискретные моменты вре-
мени
370
Xя == x (io + ?Д)
ия = и (tQ + <?Д). (11.4.4)
Рассмотрим теперь задачу математического программиро-
вания с N + 1 переменной и°, и1, . . uN:
N N
max J = 2/(*’.«’) Д
u®, ul,... tu^ g=0
xg+1 _ хч = / uq) Д, q = 0, 1, . . N - 1
ж° = Xo, u* 6 fi, (11.4.5)
где Д — фиксированный положительный параметр. Пре-
делом целевой функции этой задачи при N, стремящемся
к бесконечности, и А, стремящемся к 0, и при фиксирован-
ной величине ЛТД, равной (tj — t0), является целевой функ-
ционал задачи (11.4.1), т. е.
lim (11.4.6)
N-+co
Д-0
«д=(«1-ад
При указанном переходе к пределу разностные уравнения
в (11.4.5) превращаются в дифференциальные уравнения
задачи (11.4.1). Таким образом, задачу управления можн^
считать задачей математического программирования н
бесконечномерном пространстве. Этим пространством
является множество всех кусочно-непрерывных веще-
ственных функций и (i), определенных на промежутке
*0^*<*1-
Основная теорема математического программирова-
ния — теорема Вейерштрасса, рассматривавшаяся в пара-
графе 2.2, указывает условия, достаточные для существова-
ния максимума. Эти условия состоят в том, что целевая
функция должна быть непрерывной, а допустимое множе-
ство — компактным. Обобщая эту теорему на случай беско-
нечномерного пространства, можно получить основную тео-
рему существования для задач управления — обобщенную
теорему Вейерштрасса. Согласно этой теореме, решение
общей задачи управления (11.1.21) существует, если целе-
вой функционал J {u (t)} является непрерывным функ-
ционалом от функций управления и если подмножество U
бесконечномерного пространства, к которому принадле-
24* 371
жат управления, является компактным Важным част-
ным случаем, когда решения существуют, является задача,
в которой функции /(•••) и !(•••) линейно зависят
от п.
1 Для доказательства обобщенной теоремы Вейерштрасса обо-
значим символом J* точную верхнюю границу функционала J {u (t)}
по всем {и («)} С U, т. е. J {и (/)} С5 J* при всех {и (г)} £ U. Возьмем
некоторую последовательность управлений {up}, такую, что
Так как множество V компактное, то эта последовательность содер-
жит подпоследовательность {uph}, сходящуюся к некоторому управ-
лению {U*} j 17, Тогда
и следовательно,
lim J{u₽fe} = J*.
pft-»oo
Но так как функционал J непрерывен, т. е.
lim J {uPft} = 7 {u*},
Ph”00
то оптимальным является управление {u*} g U, для которого
/{«•} = /•
Глава 12
Вариационное исчисление
Начнем рассмотрение основных направлений в теории
решения задач управления с методов вариационного ис-
числения *. Задача управления в классическом вариацион-
ном исчислении состоит в следующем: среди множества
функций времени — фазовых траекторий,— соединяющих
две фиксированные точки, соответствующие начальному
и конечному моментам времени, требуется выбрать функ-
цию, максимизирующую некоторый интеграл от заданной
функции, которая зависит от фазовой координаты, скоро-
сти изменения фазовой координаты и времени. Таким обра-
зом, классическая задача вариационного исчисления имеет
вид
h
max 7= I I(x(t), x(t), t)dt
{x(t)) »o (12.0.1)
X (t0) = Xo
X (ti) = Xi,
где J, (x, x, t) — фиксированная непрерывно дифферен-
цируемая функция, a ti, Хо, — фиксированные пара-
метры. Эту задачу можно рассматривать как частный слу-
чай общей задачи управления (11.1.21), в которую не вхо-
дит функция конечных параметров (задача Лагранжа).
Задача зависит от одной фазовой координаты и от одного
управляющего параметра — скорости изменения фазовой
координаты. Уравнение движения в этом случае имеет вид
х=и, (12.0.2)
1 Основная литература по вариационному исчислению
11, 2, 3, 4].
373
X
Рис. 12.1 Несколько альтернативных допустимых траекторий,
так что х в /£•••) заменяет и, а управляющий параметр
может Принимать любое значение, т. е.
Q = Е. (12.0.3)
Следовательно, управление должно отвечать единственно-
му условию — быть кусочно-непрерывной функцией вре-
мени. Любая траектория {х (t)} называется допустимой,
если она удовлетворяет граничным условиям из 12.0.1
и следующему условию непрерывности: х (t) — непрерыв-
ная, а х (t) — кусочно-непрерывная функции времени.
Классическая задача вариационного исчисления со-
стоит в выборе допустимой траектории, которая максими-
зирует интегральный целевой функционал. На рис. 12.1
изображены несколько альтернативных допустимых тра-
екторий.
Классическую задачу вариационного исчисления мож-
но рассматривать как динамический аналог классической
задачи математического программирования. Замена и
на я в целевом функционале аналогична замене перемен-
ных в целевой функции после разрешения ограничений-ра-
венств, которая производится в классических задачах мате-
матического программирования. Кроме того, если введение
ограничений-неравенств в статических задачах привело
374
к созданию современных методов линейного и нели-
нейного программирования, то исследование ограниче-
ний-неравенств g динамических задачах привело к раз-
работке динамического программирования, принципа мак-
симума и обогатило вариационное исчисление новыми под-
ходами.
12.1. УРАВНЕНИЕ ЭЙЛЕРА
Решением задачи вариационного исчисленйя (12.0.1)
называется допустимая траектория {х (Z)}, на которой
достигается максимальное значение интегрального целе-
вого функционала. Если такое решение существует, то оно
должно удовлетворять некоторым необходимым услови-
ям, которые можно считать динамическими аналогами
необходимых условий в классических задачах математи-
ческого программирования при отсутствии ограничений.
Необходимым условием, аналогичным условию первого
порядка — обращению в нуль первой производной,—
является выполнение уравнения Эйлера.
Необходимые условия в классических задачах мате-
матического программирования были получены при рас-
смотрении небольших изменений решения, которым в этом
случае являлась точка евклидова пространства. Необ-
ходимые условия для решения классической задачи ва-
риационного исчисления можно получить сходным мето-
дом, варьируя в малых пределах траекторию, являющую-
ся решением, т. е. рассматривая малые изменения этой
траектории. Пусть траектория {х (t)} является решением.
Проварьируем траекторию решения, т. е. рассмотрим тра-
екторию {z (i)}, близкую к {a: (t)},
Z(t) =Х (t) + 8Т] (t), (12.1 Д)
где т] (t) — произвольная функция с кусочно-непрерыв-
ной производной, у которой
n (*о) = П («1) = о. (12.1.2)
Проварьированная функция {z (t)} удовлетворяет как
граничным условиям, так и условиям непрерывности и,
следовательно, является допустимой траекторией. Пара-
метр е измеряет «разность» между траекторией решения
875
X
Рис. 12.2Л Изменение (варьирование) траектории решения.
{х (£)} и проварьированной траекторией( {$ (£)}, причем
lim{z(Z)) = {x(Z)}. (12.1.3)
Е—>0
Эти две траектории изображены на рис. 12.2.
Значение целевого функционала на {z (£)} можно рас-
сматривать как функцию от е
й
J (е) = j I (ж-|- ец, ж-|-ет], t) dt. (12.1.4)
to
Так как {x(i)} является решением, то J (е) достигает
максимума при е = О, следовательно,
^-(0) = 0. (12.1.5)
Однако
to ах
Применяя ко второму члену подынтегрального выраже-
ния правило интегрирования по частям, получим
" (0) - [£ ч]’^- Н (f) Ч *. (12.1.7)
Д76
а так как выполняются граничные условия (12.1.2), то
to
Для того чтобы этот интеграл обращался в нуль при лю-
бых т] (t), удовлетворяющих граничным условиям и усло-
вию непрерывности, необходимо, чтобы
4-4 (^-)=° <121-9>
при всех t (t0 t ti). Действительно, в противном слу-
чае можно было бы взять функцию ц (/), не равную нулю
именно в тех точках, где не равно нулю выражение, стоя-
щее в квадратных скобках в (12.1.8). Тогда интеграл
в (12.1.8) не мог бы быть равным нулю. Доказанное поло-
жение называют обычно основной леммой вариационного
исчисления.
Уравнение '(12.1.9) называется Уравнением Эйлера1.
' о
1 В другом доказательстве необходимости выполнения уравне-
ния Эйлера используется прием аппроксимации функции с помощью
разбиения интервала на конечное число промежутков, изложенный
в разделе 11.4. Разделив данный временной интервал на N проме-
жутков равной длины Д, рассмотрим
W-1 jn= 2 z(3*. «л, «)д 9=0 «=«0-НД х9 = х (tl) п хЧ-хЧ~^ U9- Д ’
где lim JN — J I N^-ao ( Д-0 i^ = (t1-i0).
Для того чтобы димо, чтобы функций JN достигала максимума на х^.иеобхо- J^o. 8х«
377
(12.1.11)
Раскрывая полную производную по t От > которая
дх
является функцией от х, х и t, можно записать это уравне-
ние в следующем виде:
(^£\*+(^q£+(2!L ")_0. (12.1Л0)
\ дх2 I dt \ дхдх ' dt ' dt дх дх '
Отсюда видно, что уравнение Эйлера представляет собой
обыкновенное дифференциальное уравнение второго по-
рядка. Граничные условия, соответствующие этому урав-
нению, те же, что в исходной задаче
х (t0) = х0
x(ti)-=Xi.
Любая траектория {х (t)}, удовлетворяющая уравнению
Эйлера (12.1.9) при всех t (t0 t tj) граничным усло-
виям (12.1.11), называется экстремалью. Если классиче-
ская задача вариационного исчисления имеет решение,
то оно необходимо является экстремалью.
Подынтегральная функция I (х, х, t) в общем случае
зависит от трех переменных. Если же эта функция не зави-
сит явно от х, то уравнение Эйлера принимает вид
-g- = 0. (12.1.12)
Это условие совпадает по форме с необходимым условием
экстремума в классической задаче математического про-
qjN
Преобразуем выражение для —— следующим образом:
дх*
Г/ и-i, +7 , я
0x9 0x9 L Д J \ Д
д! 1.8/ 81 1
диЯ~1 д дзА difl
Г г а/ - 91
di J 0u’ 8и9-1
д=о.
L а»*
д
Переходя к пределу при ЛГ-*-оо, Д->0, получим
уравнение Эйлера t
д!____d
дх 'ЗГ
0.
3?8
граммирования при отсутствии ограничений. Такая дина-'
мическая задача является, по существу, только обобще-
нием классических задач статической оптимизации с ко-
нечным числом переменных на случай бесконечного числа
переменных. Если подынтегральная функция не зависит
явно от х, то уравнение Эйлера принимает вид
(12.1.13)
Непосредственным интегрированием получаем
= const. (12.1.14)
дх
к
Наконец, если подынтегральная функция не зависит явно
от t, то уравнение Эйлера всегда можно представить в виде
£=0.
ot
(12.1.15)
Отсюда следует, что Ч?
т д! •
I-----г- х = const.
дх
(12.1.16)
Примером задачи, подынтегральная функция которой
не зависит от фазовой координаты х, может служить дока-
зательство того, что кратчайшей плоской кривой, соеди-
няющей две точки, является отрезок прямой. Пусть t
обозначает здесь не время, а расстояние. Требуется оты-
скать кратчайший путь, соединяющий я (f0) =тоиз: (ti) —
= хъ Так как дифференциал длины кривой ds равен
У dt2 + dx2 или 1 + х2 dt, тр расстояние между точ-
ками равно
Следовательно
I (х, X, f) = — V1 + X®.
(12.1.17)
1 5
(12.1.18)
379
Эта функция явно не содержит х. Согласно 12.1.14, урав-
нение Эйлера имеет вид
const. (12.1.19)
а* V 14-^2
Отсюда следует, что х является постоянной величиной.
Следовательно, х (t) должна быть линейной функцией
я(0 = с1* + с2. (12.1.20)
Значения постоянных ct и с2 определяются из граничных
условий
= с2= х^х^. . (12.1.21)
Ч —«о 1‘1 —<0
Таким образом, используя теорему Эйлера, мы доказали,
что кратчайшим путем на плоскости, соединяющим две
точки, является отрезок прямой.
12.2. НЕОБХОДИМЫЕ УСЛОВИЯ
Уравнение Эйлера — это необходимое условие, ана-
логичное условию первого порядка (обращению в нуль
производной) в статических задачах. Ряд других необхо-
димых условий, которым должно удовлетворять решение
задачи классического вариационного исчисления, можно
установить по аналогии с соответствующими условиями
для классических задач математического программирова-
ния в статике.
Необходимому условию второго порядка для статиче-
ских задач в вариационном исчислении соответствует усло-
вие Лежандра, заключающееся в том, что решение {х (£)}
должно удовлетворять неравенству
-^<0 (12.2.1)
дх2
при всех t (t0 t Zj). Этот вывод следует из необходимо-
го условия второго порядка
^-(0)^0 (12.2.2)
380
Рис. 12.3. Точка излома при t = т.
для существования максимума функции J (е) из 12.1.4
дри е = 0, что можно доказать, проварьировав траекторию
решения.
Условие Вейерштрасса'. если {х (£)} — траектория реше-
ния, a {z (<)} — любая другая допустимая траектория, то
Е(х, х, t, z)^0, (12.2.3)
где функция Е (••••) определена следующим образом:
Е (х, х, t, z) = I (x,z, t) — I (x, x, t) —
—~(x,x,t)(z—x). (12.2.4)
dx
Эта функция называется функцией Вейерштрасса. Условие
Вейерштрасса аналогично условию вогнутости целевой
функции в статическом случае. Если функция I (х, х, t)
является вогнутой относительно управляющего параметра
х, то условие Вейерштрасса выполнено.
Последние из приводимых здесь необходимых условий —
условия Вейерштрасса—Эрдмана для точки излома допу-
стимой траектории. Эти условия не имеют прямой ана-
логии в статических задачах, поскольку они существенным
381
образом зависят от времени. Хотя фазовая траектория
{х (i)} является непрерывной, однако управление {х (i)}
должно быть только кусочно-непрерывной функцией.
Следовательно, эта функция может в действительности
состоять из «кусков» непрерывных кривых, соединенных
точками излома, в которых х (i) разрывна. Функция на
рис. 12.3 имеет точку излома при t = т. Условия Вейер-
штрасса — Эрдмана требуют, чтобы и (l — —г#) были
дх ' дх
непрерывны в точках излома {х (£)}. Следовательно, если
моменту времени т соответствует точка излома, то
(12.2.5)
где
(12.2.6)
т. е. т- и т+ обозначают пределы в точке т слева и справа.
Выше рассматривалась задача с одной фазовой коор-
динатой. Задача классического вариационного исчисле-
ния с п фазовыми координатами имеет вид
*i
max J — f 7 (х (Z), х (i), t) dt
W)} J
l0
X (i0) == x0
x (ii) = Xj,
(12.2.7)
где x (i) и x (i) — это векторы-столбцы:
X (i) = (Xi (t), x2 (t), , xn (t))f
I, x (i) = (zi (i), x2 (/), . «г,., xn (i))'.
Дриведем необходимые условия дд^^того случая.
Уравнение Эйлера: ( ~т-= 0.
dt 'ах '
Граничные условия:,! (Zo) = х0, х 0i)>= *!• Д12.2.9)
д21 ' '
Условие Лежандра: матрица —— отрицательно епре-
дх2
деЛена или отрицательно полуопределена.
Условия Вейерштрасса:
Е (х, х, I, z)^0
Условия Вейерштрасса — Эрдмана: и I—х
дх дх
являются непрерывными в точке излома.
Здесь
az / а/ д! д! \
дх \ dxi ’ дх2 ’ • • •’ дхп /
di__ / az az az
дх ' дц дх2 дхп *
а2? д21 д21
дх2 dxt дх2 дц дхп
„ а2/ дЩ д21
а2/ —;—;— —— • • • —;—;—
дх2 дх± dxi дхг дхп
дх2
д21 д21 д21
\ дхп dXi дхп дхг дх% у
Е (х, х, t, z) = I (х, z, t) — Z (x, x, t)—(x, x, t) (z —x).
dx
Таким образом, имеется n уравнений Эйлера
Д-4-О-0’ '-1’2..............
12.3. УСЛОВИЕ ТРАНСВЕРСАЛЬНОСТИ
В рассматривавшейся до сих пор задаче конечный мо-
мент времени и конечное состояние были фиксированными.
Если конечная точка лежит на заданной поверхности, то
условие
(x (i), t) £ T при t = ti (12.3.1)
определяет конечный момент времени и конечное состоя-
ние х (ii) = хР Пусть конечная поверхность задана с по-
мощью условий
Т (х (t), t) = 0 при t = ti, (12.3.2)
где Т — вектор-функция фазовых координат и времени.
Необходимые условия и в этом случае можно получить, ис-
пользуя малые изменения решения. Предположим, что
в задаче с одной фазовой координатой функция {х (£)}
есть траектория решения, a {z (/)} — изменение траекто-
рии, т. е.
z (t) — х (t) 4- ет| (t). (12.3.3)
Траектория решения достигает конечной поверхности
в момент т. е.
Т (х (t), t) = 0 при t = tlt (12.3.4)
а проварьированная траектория решения достигает конеч-
ной поверхности в момент (е), т?е.
Т (z (t), t) = 0 при \t = ti (е), (12.3.5)
где • г
limit (е) = 4£. (12.3.6)
Соответствующая графическая иллюстрация приводится
на рис. 12.4. Значение целевого функционала {z (i)} явля-
ется функцией от е
Ще)
j(8)= j /(х + ец, х-{-8Т1, t)dt. (12.3.7)
<0
Так как J (е) достигает максимума при в = О, что соответ-
ствует решению {х (£)}, то
М /Q\ __ у I (е) I _j_
. .'de ' |ti(e) de |e=0
14 tf . >
,Ш! + J (-£-n + 4-n)* = °- (12.3.8)
384
X
Рис. 12.4. Вариация траектории решения в задаче с фиксирован-
ной конечной поверхностью.
Интегрируя по частям, как и ранее, получим, что
<iW)+
+ J 1т7~'гг(т’)],|*=0' («-а»)
to Ох
Уравнение Эйлера должно выполняться и в этом слу-
чае, т. е.
следовательно,
/I *1(8)1 +_а/_| (# (е)) = о. (12.3.11)
|ti(e) * |в=0 |<1(е) к v '
Выражение для производной (e)/de найдем, дифферен-
цируя относительно 8 соотношение
Т (х (8)) + 8Т] (ti (8)), tt (8)) = 0. (12.3.12)
25-0270
385
В результате дифференцирования получаем
ЭТ / dx dt^e.) , . , „ dT) dtj (8) \ ,
дх \ dt4 (e) de, ‘ ' 1' '' "r dti (e) de )
+#^r-=°- (12.3.13)
Переходя к пределу при е->0, получим
дТ / dx d^ . , ST dti п /ло о
аГ (-dTi -dT+W ) + -дГ- °- (12-ЗЛ4>
Сопоставляя это выражение с (12.3.11), приходим к усло-
вию трансверсальности
____д_1_ *4 дТ Г SZ ~l ST _
дх -1*1 дх *- & &
Так как
<?т / \ дТ
дх \ dt )т(- )=0 ~ dt ’
(12.3.15)
12.3.16)
то это условие можно представить как
+[4-1 (-J-) в = 0- (12.3.17)
L дх <Мт(..)-о v >
В общем случае, когда в задачу входит вектор фазовых ко-
ординат, условие трансверсальности имеет следующий вид:
(,2'зл8)
где (<2х/«Й)т(..)=о — это градиент, т. е. веКТор-столбец,
нормальный к конечной поверхности.
12.4. ОГРАНИЧЕНИЯ
Метод вариационного исчисления можно использовать
для решения некоторых задач управления с ограничениями.
Одним из важных видов ограничений являются инте-
гральные ограничения, когда предполагается, что инте-
грал некоторой функции равен постоянной величине. Зада-
386
(12.4.1)
«а с такими ограничениями, называемая обычно изопери-
^яетрической, имеет следующую форму:
h
max J = I I (x, x, t) dt
{(xt)} £
x(/o) = xo
X (ti) = Xj
ti
K = j G(x, x, t) dt — c,
to
где G (• • •) — заданная непрерывно дифференцируемая
функция, ас — заданная постоянная. Задачи такого типа
получили свое название по классической задаче отыска-
ния среди кривых с фиксированной длиной (постоянным
периметром) такой кривой, которая ограничивает наиболь-
шую площадь. Интегральное ограничение учитывают, вво-
дя множитель Лагранжа у и определяя функционал
ti
J'= j [7(...) +yG(...)*• (12.4.2)
‘о
Необходимые условия в данном случае являются условия-
ми существования максимума функционала на траекториях
{х (t)) и условиями существования минимума относитель-
но множителя Лагранжа у. Например, уравнение Эйлера
имеет вид
А. (/(...)+,в(...))_^.(^(/(...)+,в(...j,),.».
,(12-4.3)
Это уравнение вместе с граничными условиями и ограни-
чением определяет решение.
Для изопериметрических задач выполняется важньп|
принцип взаимности, согласно которому, если х (t) мак-
симизирует J при условии, что К равно постоянной вели-
чине, то х (t) минимизирует К при условии, что J равно
постоянной величине. Например, кривая постоянной дли-
ны, ограниченная площадь которой максимальна, явля-
ется также кривой с минимальной длиной, ограничиваю-
щей заданную площадь. Такой кривой является окруж-
ность.
25* 387
Другой важный вид ограничений составляют ограни-
чения в форме равенств, связывающих фазовые координа-
ты, скорости их изменения и время. Задача в этом случае
имеет вид
ti
max J = \ I (х, х, t) dt
{x(0> J
x(io) = «o (12.4.4)
g(x, x, £) = b,
где g (• • •) — заданный вектор-столбец, составленный из г
функций, а Ь — заданный вектор-столбец. Предполага-
ется, что п > г. Разность п — г называется числом сте-
пеней свободы задачи. Предполагается также, что ранг
матрицы Якоби
f dgj dgj dgj \
д%1 dx2
dgz dgz dg2
dg _ дх, 8x2 dxn (12.4.5)
дх •
dgr dgr „ ’1Ы 8g r
dx% dxnJ
равен количеству ее строк во всех точках траектории реше-
ния. Эти предположения полностью аналогичны соответ-
ствующим предположениям в классических задачах мате-
матического программирования. Задача решается с помо-
шью г множителей Лагранжа
У=(У1, У2, • • •» Уг)- (12.4.6)
Если определить функцию Лагранжа как
L(x, х, t, y) = I(x, х, Z) + y[b —g(x,x, 0], (12.4.7)
TO для решения задачи нужно выбрать {х (£)}, максимизи-
рующий функционал
J' = j L (х, х, t, у) dt, (12.4.8)
«о
388
й у, минимизирующйй J'. Отсюда следует, что решение
Можно найти, решая уравнение Эйлера
>-т(^-)=° <12ЛЭ>
совместно с граничными условиями и ограничениями-ра-
венствами.
Третьим важным видом ограничений являются огра-
ничения в форме неравенств, связывающие фазовые коор-
динаты, скорости их изменения и время. Задача в этом слу-
чае имеет вид
ti
max J — I I (x, x, t) dt
t0
x(£o) = xo (12.4.10)
X(Zi) = Xt
g(x, x, £)<b,
где g (•••), как и прежде, представляет собой вектор-
столбец, составленный из г функций. Построим функцию
Лагранжа так же, как в (12.4.7). Тогда решение должно
удовлетворять соотношениям
dL d ( dL\ л
~ U
g(x, х, 0<b (12.4.11)
у>0
У [Ь —g (х, х, 0 = 0,
где первые п соотношений — это уравнения Эйлера, а оста-
льные представляют собой условия Куна — Таккера, по-
добные тем, которые рассматривались в гл. 4. Из условий
Куна — Такера вытекают условия дополняющей нежестко-
сти, состоящие в том, что любой множитель Лагранжа ра-
вен нулю, если соответствующее ограничение выполня-
ется как строгое неравенство и что любое ограничение
выполняется как равенство, если соответствующий множи-
тель Лагранжа положителен.
Таким образом, с помощью вариационного исчисления
можно решать ряд задач управления с определенными типа-
389
ми ограничений. Однако принципиальный недостаток клас-
сического вариационного исчисления состоит в том, что
оно неприменимо для непосредственного решения задач,
в которых значения управляющих параметров принадле-
жат фиксированной области. Этот недостаток преодолен
в более новых подходах — в динамическом программиро-
вании и в принципе максимума.
ЗАДАЧИ
12-А. Найдите экстремали в задаче с одной фазовой коор-
динатой х (t) и проверьте выполнение условий Лежандра
в следующих примерах:
1. I = ixt— х2
2. I = tx—2ж2
з.
4. I = x2—Qxt
5^ = -#.
12-Б. Найдите экстремали в задаче с двумя фавовыми коор-
динатами (xi (t), х% (f))' и проверьте выполнение условий
Лежандра в следующих примерах:
1. 1 = х*—x}-!r2xlxi—2x1
2. 7 = X*-j-Х%Х{Х%.
12-B. Найдите решение задачи
• 1/
min 1 -—~—dt
х (0) — 0
х (ti) = ti — 5.
12-Г. Рассмотрите следующую задачу:
з
min j а^(1—x)2dt
1
ж(1)—0 z(3) = e.
390
1. Показать, что если а =» 0 или а = 2, то реше-
нием является прямая.
2. Показать, что если 0 < а < 2, то решение содер-
жит точку излома. Изобразите графически несколько
возможных решений, если а = 1. Убедитесь, что эти
решения удовлетворяют уравнению Эйлера и услови-
ям Вейерштрасса — Эрдмана в точке излома.
3. Что будет при а > 2?
12-Д. Найдите и изобразите графически несколько воз-
можных решений следующей задачи:
4
min j (1 — x)z (1 + х)2 dt
л(1) = 0
x(4) = l.
12-Е. Покажите, что решение задачи о проведении кратчай-
шей кривой, соединяющей две точки, т. е. отрезок прямой,
удовлетворяет условиям Лежандра и Вейерштрасса.
12-Ж. Покажите, что если подынтегральная функция
I (• ) является квадратической, то оптимальное управле-
ние (с обратной связью) представляет собой линейную
функцию фазовых координат.
12-3. Провод длины I подвешен на двух опорах, располо-
женных на одном уровне. Форма висящего провода опре-
деляется кривой х (t) (i0 i < М, где
X (t0) = Хо
x(ti) = Xi.
Потенциальная энергия висящего провода
V = j mgx ds — mg x у 14- я2 dt
to
равна минимуму, если он находится в равновесии. Пред-
полагается, что длина провода фиксирована
*|й= С ds= j 1 х2di.
to
Покажите, что провод провисает по цепной линии
х = q’cosh + сз>
391
где сп с2 и с3 — постоянные, зависящие от параметров зада-
чи.
12-И. Рассмотрите задачу, которая содержит управляющий
параметр в явной форме
ti
max J — I I (x, и, t) dt
{«(<)}
*0
x — f(x, u, t)
x (i0) = x0
, x(ti) = Xi.
Используя интегрйрование по частям, докажите, что урав-
нение Эйлера длй* этой задачи имеет вид.
di df/дх di d / д!/ди \ q
дх df/du ди dt \ df/ди /
См. [5,6],
12-К. В задаче с целевым функционалом
°
J= j (х, х, х) dt
подынтегральная функция зависит от вектора .^торых
производных х. Покажите, что уравнение Эйлера в этом
случае имеет вид
di d j di \ j d2 / di \ _ n
Рассмотрите общий случай, когда I зависит от всех произ-
водных по времени от х (/) до Z-ro порядка включительно.
12-Л. Докажите, что для функционалов вида
J = J А (х, Z) 1 + xz dt
условие трансверсальности сводится к условию ортого-
нальности. Покажите, в частности, что кратчайший отрезок
прямой, соединяющий точку и заданную кривую, является
перпендикуляром к касательной к кривой в точке пересе-
чения этого отрезка и прямой.
12-М. Покажите, что уравнение Эйлера выполняется авто-
матически (и, следовательно, не может быть использовано
392
для отыскания решения) тогда, и только тогда, когда црдьж-
тегральная функция линейно зависит от х, т. е.
I (х, x,t) = A (х, t)+B(x, t) х,
где
дА дВ
дх dt
Что делает эту задачу аналогичной задаче Максимизации
функции, равной постоянной величине? t,
12-Н. Покажите, 4ga, уравнение Эйлера д^я
ti
j I (х, х, t) dt
to
совпадает с уравнением Эйлера для
ц
j {cl (х, х, t) 4-1' (х, х, t)} dt.
to
Здесь с—постоянное число, не равное нулю, а
Г(х, хЛ) = -|- + -§-х,
где-ф (х, t) — любая непрерывно дифференцируемая функ-
ция.
12-0. Проверьте необходимость условия Вейерштрасса,
показав, что в задаче
1
min J = j x?dt
о
х (0) = О
х (1) = 1
Прямая х — t удовлетворяет и уравнению Эйлера и усло-
вию Лежандра, однако она не удовлетворяет условию Вей-
ерштрасса и не является решением задачи [3].
12-П. Убедитесь в том, что уравнение Эйлера всегда мож-
но представить в виде (12.1.15).
12-Р. Вывести условие Лежандра для задачи с одной фазо-
вой координатой из условия (12.2.2), где J (е) — значение
393
целевого функционала для проварьированной траектории
решения
z (t) = х (t) + ец {t),
где т) (t) == 0, но т) (t) О,
например ц (t) = (sin wt)/w, тце w — большое число.
12-C. Один из способов учета ограничений-неравенств,
наложенных на управляющие параметры, состоит в преоб-
разовании переменных. Так, вместо ограничения х К
можно ввести переменную z, положив z2 = К — х, а вместо
ограничения | х ] gC 1 можно использовать переменную
6, положив х = sin 6. Укажите необходимые условия для
существования решения классической задачи вариацион-
ного исчисления в каждом из этих случаев [7, 8].
Глава 13
Динамическое
програ ммирование
Динамическое программирование является одним из
двух современных направлений в теории задач управле-
ния х. Метод динамического программирования может
применяться непосредственно при решении общей задачи
управления 2:
max J — I I (х, u, t) dt + F (xi,
{U(t)> J
X = f (x, U, t)
X (*o) = *0
x (ii) -= Xi (13i(fe4)
{u (0} € U.
Сущность подхода динамического программирования
состоит в следующем: данная конкретная задача управле-
ния «погружается» в более широкий класс задач, которые
характеризуются рядом параметров; затем с помощью цент-
рального принципа —«принципа оптимальности»— опре-
деляется основное рекуррентное соотношение, связываю-
щее задачи из этого класса. Если выполнены некоторые
дополнительные предположения относительно гладкости
участвующих в рассмотрении функций, то из главного
рекуррентного соотношения вытекает основное дифферен-
циальное уравнение в частных производных — уравнение
1 Основная литература по динамическому программирова-
нию [1, 2, 3, 4, 5, 6, 7].
1 Более полно общая задача управления рассматривалась
в гл. 11.
395
Веллмана,— решая которое можно найти решение выше-
упомянутого широкого класса задач.
Вслед за этим, как частный случай, определяется и ре-
шение данной конкретной задачи.
13.1. ПРИНЦИП ОПТИМАЛЬНОСТИ
И УРАВНЕНИЕ БЕЛЛЦАНА
Формулировка принципа оптимальности:
«Оптимальное поведение обладает тем свойством,
что, каковы бы ни были первоначальное состояние
и решение (т. е. управление) в начальный момент,
последующие решения должны составлять оптимальное
поведение относительно состояния, получающегося в ре-
зультате первого решения \
На рис. 13.1 дана иллюстрация этого принципа на при-
мере задачи с одной фазовой координатой. Кривая х* (/)
(io < i < ii) — это фазовая траектория, соответствующая
оптимальному управлению, при этом предполагается, что
начальное состояние и конечное — фиксированы. Вся
траектория разделена на две части: фи® относительно
момента времени т. Согласно принципу оптимальности, тра-
ектория ®, определенная при r^i^ij, должна представ-
лять собой оптимальную траекторию по отношению к на-
чальному состоянию х (т). Следовательно, вторая часть
оптимальной траектории сама по себе должна быть опти-
мальной траекторией, вне зависимости от того, что проис-
ходило с системой до того, как она пришла к состоянию,
являющемуся начальным для второй части траектории.
Предположим, что общая задача управления (13.0.1)
имеет решение. Максимальное значение целевого функцио-
нала задачи с начальным состоянием х и начальным вре-
менем t
J* (х, t),w
(13.1.2)
1 См. работу Веллмана [1]. Доказательство необходимости прин-
ципа оптимальности можно легко получить, рассуждая от про-
тивного. Арис [8] выразил этот принцип в следующих словах:
«Если вы не используете наилучшим образом то, чем вы располагае-
те, ю вы никогда не распорядитесь наилучшим образом и тем, что
вы могли бы иметь в дальнейшем».
396
Рис. 13.1. Согласно принципу оптимальности, отдельный участок
оптимальной траектории @ также представляет собой
оптимальную траекторию.
назовем функцией оптимального поведения *. Тем самым
задача оказывается «погруженной» в более широкий класс
задач, характеризуемых значениями п + 1 начальных
параметров. Оптимальное значение целевой функции дан-
ной конкретной задачи (13.0.1) имеет, таким образом, вид
J* = J* (х0, io). (13.1.3)
Если J* (х, t) является функцией оптимального пове-
дения для задачи с начальным состоянием х в момент i,
то, согласно принципу оптимальности, J* (x-f-Ax, i-|- Ai)
является функцией оптимального поведения для второй
части оптимальной тректории с начальным моментом вре-
мени t -|- Ai и начальным состоянием х + Ах. Поскольку
прирост функции оптимального поведения на протяжении
всего промежутка времени между t и t + Ai может про-
исходить только за счет изменения подынтегральной функ-
ции, то он равен I (х, u, t) А/. Значения функции опти-
мального поведения на всем интервале времени, начав-
шемся в момент i, представляют собой оптимальную сумму
1 Отметим, что в то время как J представляет собой функционал,
зависящий от управления {и (<)}, J* является функцией, зависящей
от n + 1 параметров: х и t.
397
вкладов двух частей этого интервала времени. Таким обра-
зом, приходим к основному рекуррентному соотношению
J* (х, t) = max [I (х, u, t) A/4-J*(x-)-Ax, t Af)]. (13.1.4)
{U(t)}
В динамическом программировании существенную роль
играет предположение, что функция оптимального пове-
дения J* (х, t) представляет собой однозначную и непре-
рывно дифференцируемую функцию от п -|- 1 перемен-
ных. Иначе говоря, решения задач более широкого класса
являются однозначными и непрерывными функциями отно-
сительно изменений начальных параметров г. Благодаря
этому предположению можно разложить J* (х + Ах,
t 4- Аг) в точке (х, t) по формуле Тейлора:
J*(x4-Ax, i-|-Af) = J*(x, i)+-^-Ax + -^A«+...
(13.1.5)
где dJ*/dx — это вектор-строка
• (13.1.6)
ОТЕ у ОХ^ дх% иЗ'П I ' ’
Подставляя (13.1.5) в (13.1.4), получаем
0=;Xl(x,u,0+^^+^+•••-!• (13л,7)
Переход к пределу при Ai -► 0 приводит к соотношению
“^=x[/(x’u’0+'^'f(x,u’0]’ (13,1‘1 * * * * * * 8)
так как
lim-^- = х= f (х, и, <). (13.1.9)
1 Во многих задачах эти предположения о гладкости не выпол-
няются, кроме того, заранее вообще неизвестно, будут ли они выпол-
нены в данной конкретной задаче. См. [9]. В качестве примера реше-
ния, которое не является гладкой функцией параметров, рассмот-
рим задачу об отыскании геодезических линий (линий, соответствую-
щих кратчайшим расстояниям между двумя точками) на сфере.
Такой линией является дуга большого круга. В частности, кратчай-
ший путь, соединяющий две точки земного экватора, проходит
именно по экватору. Предположим теперь, что начальная точка
перемещается по экватору, удаляясь от конечной точки. В конце
концов будет достигнуто такое положение начальной точки, при ко-
тором кратчайший путь, соединяющий эту точку с конечной, будет
соответствовать движению в направлении, противоположном исполь-
зованному ранее. Производная кратчайшего расстояния относитель-
но положения начальной точки (измеряемого, например, долготой
точки) претерпевает разрыв в указанной точке.
398
Уравнение (13.1.8) является основным дифференциаль-
ным уравнением в частных производных, используемым
в динамическом программировании. Оно называется урав-
нением Беллмана1. Так как второй член в квадратных скоб-
ках представляет собой скалярное произведение вектора-
строки dG*/dx. и вектора-столбца f (х, u, t), то уравнение
Беллмана можно записать как
п
— ^- = max [Z (х, и, t) + 2 -^7 fj (х. «> 01 • (13.1.10)
at м»L "i 1 J
С уравнением Беллмана связано в качестве гранич-
ного условия ограничение, налагаемое на конечное
состояние:
/•(х(^), Z1) = Z’(x1,Z1). (13.1.11)
Это условие показывает, что значение функции опти-
мального поведения для задачи, начальным моментом и на-
чальным состоянием которой являются соответственно
конечный момент и конечное состояние, равно значению
функции F(•••), рассчитанному в данный момент времени
при данном состоянии.
Если бы уравнение Беллмана было решено, то мы полу-
чили бы функцию оптимального поведения и, следователь-
но, оптимальное значение целевой функции для исходной
задачи можно было бы определить, как частное значение
этой функции при указанных в формулировке задачи конк-
ретных начальных условиях. Однако в общем случае это
уравнение в частных производных первого порядка, как
правило, нелинейное, не имеет аналитического решения.
В принципе можно решать уравнения Беллмана, пред-
ставленные в виде разностных схем, на цифровых элект-
1 Пусть {u* (f)} является решением задачи максимизации пра-
вой части уравнения Беллмана и функция Н (х, dJ*/dx, t) опреде-
лена следующим образом:
Я(х,^, t) = 7(x,u*,0+^/(x,uM).
Тогда приходим к дифференциальному уравнению в частных про-
(dJ \ 0J*
х, д— , £ I + -дг = 0, называемому уравнением Гамиль-
ох / ot
тона — Якоби. См. дополнительно к основной литературе, ука-
занной в примечании на стр. 395, Гельфанд и Фомин [10]
и Хестенс [11].
399
ронно-вычислительных машинах с большим быстродейст-
вием. Однако даже современные электронно-вычислитель-
ные машины, работающие с высокой скоростью счета, не
обладают такой машинной памятью, которая позволяла
бы найти достаточно хорошее приближение к решению,
даже если система имеет сравнительно скромную размер-
ность1. Беллман называет это препятствие «проклятием
размерности» («curse of dimensionality»).
13.2. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
И ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
Задача динамического программирования является!
более общей, нежели задача классического вариационного
исчисления. Если рассматривать классическую задачу
вариационного исчисления как частный случай задачи
динамического программирования, то из необходимого усло-
вия динамического программирования — выполнения урав-
нения Веллмана — должны вытекать необходимые усло-
вия вариационного исчисления, включая уравнения Эйле-
ра, условия Лежандра, условие Вейерштрасса и усло-
вия Вейерштрасса — Эрдмана для точки излома [1,2,
12, 13].
Классическая задача вариационного исчисления явля-
ется частным случаем задачи динамического программи-
рования (13.0.1), в которой
т. е. в этой задаче управляющими параметрами являются
скорости изменения фазовых координат во времени, причем
1 Задачи динамического программирования требуют, чтобы
память машины содержала Qn ячеек памяти, где Q — это размер
сетки, т. е. число дискретных значений, принимаемых каждой из фа-
зовых координат. Если, например, каждая фазовая координата
разбита на 100 дискретных значений, а п = 4, то память должна
состоять из 100 млн. ячеек. Поскольку оперативная память боль-
шинства современных машин не содержит 100 млн. ячеек, то вычис-
лительные процедуры динамического программирования зависят
от информации, хранимой во внешней памяти машины на дисках
или лентах. Существуют, правда, несколько способов уменьшения
трудностей, вызываемых размерностью задачи. См. Беллман и
Дрейфус [3].
400
на значения управляющих параметров не накладывается
никаких ограничений. У равнение Беллмана принимает вид
—^ = m_ax[l(x, x,t) + -^-x] . (13.2.2)
{X}
Необходимым условием существования максимума вы-
ражения, стоящего в квадратных скобках, является выпол-
нение соотношения
0 + = 0 (13.2.3)
или соотношения
поскольку dJ*/dx не зависит от х.
Найдем производную по t от 31'дх.
Учитывая тот факт, что dJ*!dx зависит от х и от t, и вводя
обозначения
d2J* _ / d2J* d2J* \
dt Зх \ dt dxi ’ ‘' * dt dxn /
(d2J* d2J* \
dx$ ‘’ dxt dxn \
I
I ’
d2J* d2J* I
dxn dxi ‘ ‘ ’ dx\ >
волучавм, что
d ( di \_____d I dJ*\ _ 3V* d2J*
d^ \ f dt \ Ox / dt dx dx2
Однако из уравнения Беллмана следует, что
_________________d_ ! dJ* \ _ di , d2J*
dx \ dt ) dx ' 'X' dx2
(13.2.5)
(13.2.6)
(13.2.7)
Сопоставим (13.2.6) и (13.2.7). Учитывая, что в данном
случае величина смешанных частных производных второго
порядка не зависит от порядка дифференцирования, при-
ходим к уравнению Эйлера для вариационного исчисления:
4-т (#)=“• <13-2-8)
Условие Лежандра следует непосредственно из необ-
ходимого условия второго порядка для существования
26-0270
401
максимума выражения в квадратных скобках в (13.2.2),
состоящего в том, что матрица
-4- + (13.2.9)
дх2 L J
является отрицательно полуопределенной или отрица-
тельно определенной.
Поскольку dJ*/dx не зависит от х, то это условие за-
ключается в том, что матрица
(13.2.10)
дх2
является отрицательно полуопределенной или отрицатель-
но определенной, а это есть не что иное, как условие Ле-
жандра.
Если {х (/)} представляет собой решение уравнения
Веллмана, то для любого вектора-столбца z
7(х, х, 0 + -^-х>7(х, z, Z)+~z. (13.2.11)
Преобразуем это выражение, воспользовавшись равен-
ством (13.2.4):
I (х, z, t) — Z (х, х, t) —Ц- (х, х, t) (z— х)^0. (13.2.12)
дх
Полученное неравенство представляет собой условие
Вейерштрасса.
Наконец, условия Вейерштрасса — Эрдмана для точки
излома можно получить из следующих уравнений:
д! __ dj*
дх~ д&
яг • йт* • йт* (13.2.13)
т д1 ’ т dj* • dJ* ' '
I -X=Z--—— X — 5— .
dx *
Так как функции dJ*jdx и dJ*ldt являются непре-
рывными, то
— n(Z--^i) (13.2.14)
дх ' дх '
непрерывны в точке излома, т. е. выполнены условия Вей-
ерштрасса — Эрдмана.
Таким образом, подход динамического программиро-
вания позволяет получить необходимые условия для клас-
402
сической задачи вариационного исчисления. Динамиче-
ское программирование можно применять также и для
исследования задач вариационного исчисления при нали-
чии ограничений, рассмотренных в разделе 12.4. Так, на-
пример, уравнение Беллмана для изопериметрической зада-
чи, т. е. задачи с ограничением вида
Ц
jG(x,x,t) = c, (13.2.15)
to
принимает следующую форму.
~'л!г==т?х[1 + х, О] • (13-2.16)
{х} "*
Из этого выражения можно вывести те же условия, что
и при постановке задачи в обычном для вариационного ис-
числения виде, поскольку множителем Лагранжа здесь
является величина изменения оптимального значения
функционала, вызванного изменением константы ограниче-
ния с, т. е.
У = (13.2.17)
Вообще говоря, частные производные функции опти-
мального поведения можно интерпретировать как множи-
тели Лагранжа, измеряющие чувствительность решения.
13.3. РЕШЕНИЕ МНОГОШАГОВЫХ ЗАДАЧ
ОПТИМИЗАЦИИ МЕТОДОМ ДИНАМИЧЕСКОГО
ПРОГРАММИРОВАНИЯ
Во многих динамических задачах время рассматрива-
ется не как непрерывная, а как дискретная величина.
Задачи' такого типа, называемые многошаговыми задачами
оптимизации, можно решать методом динамического про-
граммирования [1, 14, 8, 15, 16].
В многошаговых задачах оптимизации время принимает
дискретные значения
to, to -f- 1, to + 2, . . ., ti. (13.3.1)
Состояние системы в момент времени t задается векто-
ром X/, а управление в момент t задается вектором иг. Со-
стояние в момент t + 1 задается соотношением
xt+i = f< (xt, ut), t == tq, t0 + 1, • • h — 1, (13.3.2)
26* 403
где if (•••) — вектор, Составленный из непрерывно диф-
ференцируемых функций текущего состояния и текущих
значений управляющих параметров. Предполагается, что
фиксировано начальное состояние
х0. (13.3.3)
Требуется найти такую последовательность управляю-
щих векторов
{и*о, uto+1, . . (13.3.4)
принадлежащих фиксированной области управления
и, £ Й, t = «0, t0 + 1, . . ., tx - 1, (13.3.5)
которая максимизирует целевую функцию
*1—1
/= 3 Л (Xi> ut)+^(Xtl, ti). (13.3.6)
t=to
Вполне очевидно, что поставленная таким образом зада-
ча аналогична задаче управления (с непрерывным вре-
менем).
Подход динамического программирования и в данном
случае состоит в том, что решаемая задача «погружается»
в более широкий класс задач, описываемых рядом пара-
метров, и вслед за этим с помощью принципа оптимально-
сти определяется основное рекуррентное соотношение.
Возьмем в качестве параметров многошаговой задачи опти-
мизации начальный момент времени и начальное состоя-
ние. Тогда функция оптимального поведения равна опти-
мальному значению целевой функции в задаче с начальным
состоянием х и начальным моментом времени t:
J* (х,«). (13.3.7)
Оптимальное значение целевой функции рассматривае-
мой задачи равно
J* (х0, t0). (13.3.8)
Согласно принципу оптимальности,
J*(x, 0 = тах[7г(х(, иг)4- J* (xt+t, i 4-1)1- (13.3.9)
ut
Это означает, что оптимальное значение целевой функции
в задаче с начальным состоянием х и начальным временем
t равно оптимальному значению суммы двух слагаемых:
функции Ц (хг, ut) в момент t и оптимального значения
404
функции J* (xi+1, t + 1) в момент t. Используя уравне-
ние (13.3.2), можно представить рекуррентное соотноше-
ние в виде
J* (х, t) = max [It (хг, иг) Д- J* (ft (xt, ut), t + 1)J. (13.3.10)
ut
Граничное условие
J*(x1,f1) = /’(xtl,f1)» (13.3.11)
показывает, что оптимальное значение целевой функции
в задаче с начальным состоянием х4 в момент просто сов-
падает со значением функции конечных параметров, рас-
считанным при х = Xi, t = Вполне очевидно, что рас-
смотренная задача аналогична задаче с непрерывным вре-
менем.
Другой подход при решении многошаговой задачи опти-
мизации состоит в том, что в качестве характеристических
параметров выбираются не начальное состояние и началь-
ный момент, а начальное состояние и промежуток времени,
остающийся до конечного момента. В этом случае функ-
цией оптимального поведения является
J?(xf|_t), (13.3.12)
которая представляет собой оптимальное значение целе-
вой функции для процесса с начальным состоянием xtt_t,
развертывающегося в промежутке протяженностью т.
Оптимальное значение целевой функции рассматриваемой
нами задачи, соответствующей т = равно J*t (х0).
В этом случае последовательность решений определяется
методом динамического программирования в порядке,
обратном тому, который рассматривался до сих пор, т. е.
начиная с конечного момента времени ti- Первым членом
этой последовательности является Jq (х41), т. е. оптималь-
ное значение целевой функции с временным промежутком
нулевой протяженности, начинающимся (и заканчиваю-
щимся) в xtp Оптимальное значение целевой функции этой
задачи равно значению функции конечных параметров:
Je*(xtl) = F(xtl,fi). (13.3.13)
Рассмотрим теперь 7* (хц-i) — оптимальное значе-
ние целевой функции задачи с промежутком, равным
одной единице времени, начинающимся в xf_i. Эта задача
называется первым шагом.
Оптимальное значение в этой задаче определяется как
максимальное значение суммы той части целевой функ-
405
ции, которая соответствует указанному времени —
Лi-i (xtj-i, Uf-,-1), и оптимального значения задачи
с начальным моментом относительно управляющего
вектора и^, т. е.
J* (хй_!) = тах17й_1 utj—i) + J* (xtl)] (13.3.14)
u«H-i
или, используя (13.3.2),
J* (xtj-t) = max Utj—i) +
«ti-i
+ A* (xtl-!, Uf.-!))!. (13.3.15)
Данный выбор управления на первом шаге согласуется
с принципом оптимальности, поскольку управление ufl_t
является оптимальным по отношению к состоянию Хц-i-
которое достигнет в результате — 1 предшествующих
выборов управляющих векторов u(o, и,о+1, ..., uij_2. Ана-
логично этому на втором шаге (в задаче с промежутком,
равным двум единицам времени)
J* (xfl_2)= max[/fl_2 (xtl_2, u0_2)-4-
uil —2
+J:(ffl_2(x<1_2,u<1_2))]. (13.3.16)
Общее рекуррентное соотношение на шаге с номером х
имеет вид
(xtj-т) = max (xfl_t, ntl_t) +
Utl-T
+ J?-i (fti-т(хц—г» иц-т))]" (13.3.17)
Оптимальное значение целевой функции рассматриваемой
задачи, равное является оптимальным значением
последней задачи в последовательности одношаговых задач
оптимизации, описываемых функциональными уравнения-
ми (13.3.17) при т = 1, 2, 3, . . ., ti с граничным условием
(13.3.13). Таким образом, многошаговая задача оптимиза-
ции методом динамического программирования приведена
к последовательности одношаговых задач оптимизации х.
1 Численное решение многошаговых задач оптимизации мето-
дом динамического программирования на электронных вычислитель-
ных машинах, как и в непрерывном случае, затрудняется недоста-
точным объемом машинной памяти. При таком решении необходимо
найти всю последовательность функции J* (xf _т) и хранить ее
в памяти машины. Обычно решения находят с помощью некоторых
приближений. См. Веллман и Дрейфус}[3].
406
В качестве примера применения подхода динамическо-
го программирования к многошаговым задачам оптими-
зации рассмотрим задачу, в которой требуется найти набор
из неотрицательных чисел uto, u<o+1, . . utl, максими-
зирующих сепарабельную целевую функцию при условии,
что сумма этих чисел равна фиксированному числу 1 с:
tt
max J = 2 It (ut)
t=to
Ut^O, t-ty, , ti (13.3.18)
tl
2 Ut — C.
t=t0
Можно интерпретировать постоянную с, как общий уро-
вень имеющихся ресурсов и рассматривать ее в качестве
параметра задачи. Обозначим через
(с) (13.3.19)
функцию оптимального поведения для процесса, разверты-
вающегося в промежутке протяженности т и заканчиваю-
щегося в момент с общим запасом ресурсов, равным с.
Для процесса на временном промежутке, протяженность
которого равна нулю, заканчивающегося при fr = ti
J* (с) = max Itl (utl) = Ju (c). (13.3.20)
Uti=c
Для одношагового процесса, заканчивающегося в момент
ti, надо распределить ресурсы между utl и иц-i. Согласно
принципу оптимальности,
/J(c)= max Hti-1 («*i-i) + ^J (с —wti-1)!» (13.3,21)
так что (из 13.3.20)
J*(c)= max + —(13.3.22)
Общее рекуррентное соотношение для этой задачи имеет вид
Л* (О — max х (tt'ti—x)-f"*I*—i (с— x)L (13.3.23)
1 См. работу Веллмана [1J, а также книгу Веллмана и Дрей-
фуса [3]. С формальной точки зрения данная задача сходна с задачей
нелинейного программирования с сепарабельной целевой функцией.
Использование динамического программирования для решения неко-
торых задач нелинейного программирования рассматривается в кни-
ге Хедли [17].
407
оно показывает оптимальное распределение ресурсов между
и(1_х, определяющим значение Zfl_x (utl_x)t и с — и(1_х,
определяющим значение J*_i (с — uit_x).
Решение задачи отыскивается с помощью общего рекур-
рентного соотношения (13.3.23) последовательно, начиная
с граничного условия (13.3.20) вплоть до шага с номером
tt. Оптимальное значение целевой функции задачи равно
(с).
Рассмотрим теперь частную задачу о минимизации сум-
мы квадратов неотрицательных переменных при условии,
что их сумма равна фиксированному числу
ti
max J — — 2 uf
t=to
ut>0, t=t0, t0 + l, ..., ti (13.3.24)
ti
X ut = c.
t=to
Согласно методу динамического программирования,
оптимальное значение целевой функции для задачи с вре-
менным промежутком нулевой протяженности равно
J* (с) == max - uft = —&. (13.3.25)
“ц-е
Первое функциональное уравнение для процесса, разверты-
вающегося на промежутке единичной протяженности, со-
гласно (13.3.21), имеет вид
J*(c)= max [ — uft-i+Jt (с — uti-i)]. (13.3.26)
Следовательно, используя (13.3.25), можно получить, что
7*(с)= max [ — Щ* — (с~ tttj-i)8]. (13.3.27)
Так как частная производная выражения в квадратных
скобках в точке максимума равна нулю, то
что совместимо с ограничением ^с. Таким образом,
половина ресурсов должна быть использована в момент
а половина — в момент — 1. Следующее функциональ-
ное уравнение имеет вид
J*(c)=« max [ — Uti-2 + Jt(c— Utt-г)2]- (13.3.29)
0<ut)_2<c
408
£
Но так как в оптимальной точке J*(c) — ——с2, то
J*2(c) = max [-14,-2-|(c-u11_2)2]. (13.3.30)
В точке максимума
1
Uti-2 = -^C.
(13.3.31)
Следовательно, одна треть имеющихся ресурсов приме-
няется в момент ti — 2, а оставшиеся две трети распреде-
ляются поровну между моментами — 1 и Общее реше-
ние задачи имеет вид
Uto^Ui^+i = .. .= uit= (ii_fo)+1 , (13.3.32)
т. е. для того, чтобы минимизировать сумму квадратов,
следует использовать равное количество ресурсов в каж-
дый отдельный момент времени.
ЗАДАЧИ
13-А. Классической задачей управления является задача
о брахистохроне: найти такую кривую, соединяющую две
точки Р и Q, что материальная точка, двигающаяся под
действием силы тяжести по этой кривой без трения и с нуле-
вой начальной скоростью в точке Р, достигает точки Q
за минимальное время. Пусть точка Р' лежит на кривой,
являющейся решением, между Р и Q. Является ли часть
этой кривой между Р’ и Q оптимальной? Если да, то в ка-
ком смысле? Что можно сказать по этому поводу относи-
тельно части кривой между Р и Р'?
13-Б. Найдите уравнение Беллмана для следующей задачи:
maxJ= — ( {(ж—с)2-[-и2] ей
<“<*» 4
x = ax bu
x(t0) = x0
x(«1) = x1.
409
13-В. Найдите уравнение Веллмана для следующей задачи:
ti
maxJ— I (х—и) di
{«(t)} J
r0
X =
% Oo) ===
X (ti) = Xi -4
О и x.
13-Г. Используя метод динамического программирования,
решить задачу управления по минимуму энергии при усло-
вии, что уравнения движения линейны:
ti
max J = I (x'Dx + u'Eu) dt
{u(‘)} /
•О
x = Ax + Bu
X (t0) = x0,
X (ti) = Xp
Здесь D и E — отрицательно определенные матрицы, a A
и В — некоторые фиксированные матрицы.
13-Д. Найдите уравнение Веллмана в задаче о минималь-
ном времени перехода из фиксированного начального со-
стояния х (t0) = хо в точку начала координат х (tt) — 0,
в которой можно выбирать управления
{u (t)} £ U, а х = f (х, и, t).
13-Е. Примените результаты решения предыдущей задачи
к решению частной задачи о минимальном времени пере-
хода из (Xi, х2)' в (0, 0)', в которой
Xi = V cos х3
х2 = V sin х3
х3 = и
У = У,/
где V — величина скорости.
410
13-Ж. Пусть функция оптимального действия в задаче
управления типа Лагранжа зависит от начального состоя-
ния х и продолжительности процесса т:
to+T
J* (х, т) = тах Г 7(х, u, t)dt
{u(t)> /
to
X = f (x, u,
X (to) = x0
{u (t)} e u,
причем оптимальное значение целевой функции равно
J* (х0, tl — t0)- Найти дифференциальное уравнение
в частных производных — уравнение Веллмана — для этой
задачи; сравнить полученное уравнение с (13.1.8).
13-К. Используя метод динамического программирования,
покажите, что необходимое условие для максимума в клас-
сической задаче вариационного исчисления, в которой
функция /(•••) не зависит от времени t, заключается
в выполнении уравнения
, д! •
I----г х = const.
дх
13-Л. Вывести условие трансверсальности для задач ва-
риационного исчисления с помощью динамического про-
граммирования.
13-М. Рассмотрите следующее обобщение примера, приве-
денного в разделе 13.3.
ц
max J = — 3 w’/w?
t=t0
ut 0, t = t0, to + 1, . . h
ti
2 Ut=C,
t=to
где wto, ^0+i, • • wtt — фиксированные неотрицатель-
ные веса.
1. Решите эту задачу методом динамического про-
граммирования.
2. Покажите, что решение по методу динамического
программирования совпадает с решением этой задачи
как задачи нелинейного программирования.
411
3. Решите частную задачу, в которой
t0 = 0, ti = 2, wto = 2, wta+l = 3, wti = 6, с = 100.
13-H. Другое обобщение примера из параграфа 13.3:
ti
max J = — 3 u₽t
t=to
uf > 0, t = t0, to + 1. • • •» tj
11
2 Ut — C,
i=to
где Pt0, Pto+i» •••»₽*! — фиксированные положитель-
ные постоянные.
1. Решите задачу с помощью динамического про-
граммирования.
2. Покажите, что решение по методу динамического
программирования совпадает с решением этой задачи,
как задачи нелинейного программирования.
3. Решите частную задачу, в которой t0 = 0, tj = 2,
Pto = 1, P«o+1 = 2’ Pti = з, c = 100.
4. Решите общую задачу при условии, что на управ-
ляющие параметры наложены следующие условия:
щ 1, t — to, to + 1, ...» ti
h
П ut = c.
t=t0
13-0. Решите задачу:
<=to
где pt и st — такие параметры, что
Pt 0? St Oj == ^Oj *0
tl
3 pt=i,
<=io
а для управляющих переменных выполняются условия
ut > О, t = t0, to + 1» . . ., h
ti
2 ut = c.
t=to
412
13-П. Покажите, что если функция 1 (•) в следующей
задаче
maxJ = 2 I
t=to
Щ0, i = io, -|- 1, • • -t ti
ti
2 Ut = c
t=to
является выпуклой, то max J — I (c).
13-P. Решите задачу нелинейного программирования
n
max F (x) = xt, x2, . xn = П xj
i=i
xj 0, j = 1, 2, . . ., n
[n
2 £j = a
j=i
методом динамического программирования.
13-C. Рассмотрим некоторую матрицу А = (aij). Требуется
среди всех возможных траекторий перехода по элементам
матрицы от ац до атп найти траекторию, минимизирую-
щую сумму элементов, через которые она проходит. Пере-
мещения от одного элемента к другому разрешаются только
вправо или вниз. Решить задачу методом динамического
программирования.
13-Т. Задачу линейного программирования:
найти max F (х) = сх при условии, что Ах^Ь, х О,
х
можно рассматривать как дискретную многошаговую зада-
чу оптимизации. Ее можно решать с помощью принципа
оптимальности, взяв за функцию оптимального поведения
функцию Е? (bi, b2, . . ., bm), определяемую как решение
указанной задачи при дополнительных условиях, что
3-fe+l = Xfr-i-2 = . . . Хп = 0.
Найти рекуррентное соотношение и граничное условие для
функции оптимального поведения. Может ли указанный
метод быть альтернативой симплекс-метода?
413
Глава 14
Принцип максимума
Третьим направлением в теории решения задач управ-
ления является принцип максимума. Этот метод в отличие
от классического вариационного исчисления позволяет
решать задачи управления, в которых на управляющие
параметры наложены весьма общие ограничения, причем
в отличие от динамического программирования обычно за-
ранее предопределяется ряд свойств решения *. Благода-
ря этому принцип максимума является основным матема-
тическим приемом, используемым при расчете оптимально-
го управления во многих важных задачах математики, тех-
ники и экономики.
Принцип максимума применяется к общей задаче управ-
ления, имеющей вид
h
max J = f I (x, u, t) dt + F (xlt ti)
io
X = f (x, u, t)
x (Zo) = x0 (14.0.1)
x (*i) = Xi
{u (z)} e v.
Здесь /(•••), F и !(•••)— заданные непрерывно
дифференцируемые функции; Zo, Xg — фиксированные па-
раметры; Zj или Xi — фиксированные параметры (либо с по-
мощью уравнения Т (х, Z) — 0 определяется конечная
поверхность). Траектория управления {u (Z)} должна при-
1 Основная литература по принципу максимума [1,2,3, 4, 5].
414
надлежать фиксированному множеству управлений U,
причем и (Z) — кусочно-непрерывная функция времени,
значения которой должны принадлежать некоторому фик-
сированному множеству Q, являющемуся непустым ком-
пактным подмножеством пространства Ег.
14.1. СОПРЯЖЕННЫЕ ПЕРЕМЕННЫЕ, ФУНКЦИЯ
ГАМИЛЬТОНА, ПРИНЦИП МАКСИМУМА
В ряде предшествующих глав мы применяли метод мно-
жителей Лагранжа к различным задачам статической оп-
тимизации. При решении задач этим методом вводились
новые переменные — множители Лагранжа — по одной
переменной для каждого ограничения, затем строилась
функция Лагранжа (лагранжиан) и определялась седло-
вая точка" этой функции, т. е. точка, где функция имеет
максимум по исходным переменным и минимум по новым
переменным. Принцип максимума можно рассматривать
как распространение метода множителей Лагранжа на за-
t дачи динамической оптимизации (задачи управления).
Рассмотрим частный случай задачи управления (14.0.1),
когда фиксирован конечный момент времени, а на управ-
ляющие параметры не накладываются никакие ограниче-
ния. Эта задача относится к классу задач максимизации
при наличии ограничений. Максимизируемое выражение
представляет собой целевой функционал
о
J — j Z(x, u, t)dt-)-F (тц, ti), (14.1.1)
to
а ограничениями являются п дифференциальных уравне-
ний, которые можно представить в виде
f (х, u, t) — х (t) = 0, t0 t sC (14.1.2)
Действуя способом, аналогичным тому, который приме-
нялся в статических задачах, введем вектор (вектор-стро-
ку) новых переменных — по одной переменной для каж-
дого из п ограничений
У (t) = (z/i (t), у2 (Z), . . ., уп (Z)). (14.1.3)
Эти новые переменные, называемые сопряженными пере-
менными, представляют собой динамические эквиваленты
415
множителей Лагранжа в статических задачах максимиза-
ции при наличии ограничений х. Так как каждая из сопря-
женных переменных соответствует одному из дифферен-
циальных уравнений движения, определенных на проме-
жутке времени от t0 до то и сопряженные переменные,
вообще говоря, зависят от времени, что иотмеченов (14.1.3),
причем предполагается, что эти переменные являются нену-
левыми непрерывными функциями времени.
Поступая и далее по аналогии со статическим случаем,
определим функцию Лагранжа, равную максимизируемому
выражению плюс скалярное произведение вектора мно-
жителей Лагранжа и вектора ограничений. Поскольку
ограничения и сопряженные переменные определены на
всем временном промежутке, то скалярное произведение
следует определить с помощью знака интеграла. Выраже-
ние, соответствующее функции Лагранжа, приобретает
вид
*1
L — J + j у [f (х, u, t) —x]dt =
to
г • +
| {Z(x, u, f) + y[f (x> u> О —F (xit tt). (14.1.4)
Как и в задачах статики, седловая точка лагранжиана
и здесь определяет решение. Однако в данном случае сед-
ловая точка принадлежит пространству функций. Точка
({и* (£)}, {у* (()}) представляет собой седловую точку
в том случае, если
L ({U (0), {У* («)}) С L ({и* (/)}, {у* (0}) <
^L({u* (i)}, {у («)}). (14.1.5)
Тогда траектория управления {u* (Z)} является реше-
нием задачи управления.
1 Для сопряженных переменных нет общепринятых наимено-
ваний и обозначений. Эти переменные называют также «множите-
лями», «вспомогательными переменными», «двойственными перемен-
ными». Используются также обозначения Т, г, Хи р. Применяемое
в данной книге обозначение согласуется с обозначениями множите-
лей Лагранжа в задачах статической оптимизации (см. гл. 2—6).
416
В самом деле, второе неравенство
${(У*-у)1«(х%и*. Z)-i*j)dZ<0 (14.1.6)
to
выполняется для всех непрерывных функций (у (t)} только
тогда, когда
х* = f (х*, u*, t). (14.1.7)
Действительно, в противном случае можно было бы взять
такую функцию {у (£)}, значения которой в тех точках,
где это равенство не выполняется, подобраны с учетом
того, чтобы интеграл в 14.1.6 был больше нуля. Следова-
тельно, оптимальная траектория удовлетворяет уравне-
ниям движения. С другой стороны, первое из неравенств
(14.1.5) показывает, что
J {u*(z)}>«4u(0} + j {y*[f(x, u, t)— x}}dt. (14.1.8)
to
Следовательно, при всех траекториях {u (Z)}, удовлетво-
ряющих уравнениям движения, выполняется неравенство
J {u* (Z)} > J {и (Z)}, (14.1.9)
и, следовательно, {и* (£)} является оптимальной траек-
торией. Оптимальное значение целевого функционала
равно значению функции Лагранжа в седловой точке.
Рассмотрим теперь необходимые условия для суще-
ствования такой седловой точки. Из (14.1.4) следует, что
переход от сопряженных переменных у (Z) к {у (Z) Ay (£)},
где Ay (Z) — произвольная непрерывная функция вре-
мени, изменит функцию Лагранжа на
ti
AL = j Ду [f (х, u, t)~x]dt. (14.1.10)
to
Так как необходимое условие первого порядка для суще-
ствования минимума L относительно {у (Z)} требует, чтобы
AL = 0, то, согласно основной лемме вариационного исчис-
ления, должны выполняться уравнения движения, т. е.
х = f (х, u, Z). / (14.1.11)
27-0270
417
Таким образом, выполнение уравнений движения, являю-
щееся в данном случае необходимым условием, полностью
аналогично необходимому условию для статических
задач — выполнению соответствующих ограничений.
Выведем теперь остальные необходимые условия. Отме-
тим, что если в (14.1.4) проинтегрировать по частям выра-
жение — у (Z) х (i), то L преобразуется к виду
ti
L = j {/(х, у, *) + yf (х, u, f) + yx]di +
«0
+ F (хь tt) — [у (tt) х — у (t0) х (Zo)). (14.1.12)
Первые два слагаемых, стоящих под знаком интеграла,
являются по определению функцией Гамильтона:
Н (х, и, у, t) sb I (х, u, t) + yf (х, у, t). (14.1.13)
Иначе говоря, функция Гамильтона определяется как сум-
ма подынтегральной функции целевого функционала
и скалярного произведения вектора сопряженных пере-
менных и вектора функций, указывающих скорость изме-
нения фазовых координат. Следовательно,
й
L = j {Н (х, и, у, I) 4- ух} dt +
to
+ F (х1? h) — [у (ti) х (ti) — у (Z0)x (*„)]. (14.1.14)
Исследуем теперь, каков результат перехода от траекто-
рии управления {u (t)} к траектории управления {u (t) +
+ Ди (t)} н соответствующего перехода с фазовой траекто-
рии {х (Z)} на фазовую траекторию {х (t) + Дх (/)}. При
этом
дь4{«д„+(»+;)Д1}Л+[£_у((1)] 4К1,
<0
(14.1.15)
где
ЭЯ _ / дЯ дН дН \
du k dUi • ди2 • •••’ диг )
дЯ / дЯ дН дН \ (14.1.16)
дх \ дц ’ дх2 ’ " ‘ ‘ * дхп ) '
418
Так как для существования максимума необходимо, что-
бы приращение лагранжиана ДА обращалось в ноль, и
поскольку (14.1.15) должно выполняться при любых
' {Au (Z)), то
-f- = 0. (14.1.17)
У=—(14.1.18)
= (14.1.19)
I VA1
Необходимые условия (14.1.17) показывают, что в каждой
точке оптимальной траектории функция Гамильтона дости-
гает максимума относительно управляющих параметров.
При этом г условий (14.1.17) являются условиями суще-
ствования внутреннего максимума, так как в рассматри-
ваемой задаче не наложено никаких ограничений на зна-
чения управляющих параметров. В общем случае, если
на значения управляющих параметров наложены некото-
рые ограничения, условия (14.1.17) принимают вид
тахЯ(х, и, у, t) при всех t, (14.1.20)
{и£й}
т. е. в точках оптимальной траектории, в каждый момент
времени функция Гамильтона достигает максимума отно-
сительно управляющих параметров х. Следовательно,
в любой момент времени t из указанного промежутка дости-
гается либо внутренний максимум, при котором, как и в
классических задачах математического программирования,
< = 0. (14.1.21)
либо максимум достигается на границе. В последнем слу-
чае, как в нелинейном программировании,
-^ = 0
(14.1.22)
где п — вектор нормали к границе области Й. На рис. 14.1
эти две возможности проиллюстрированы на примере
скалярного случая (г = 1).
1 Предполагается, что матрица Гессе д2Н/ди.2 порядка г X г
отрицательно определена или отрицательно полуопределена в каж-
дый момент времени из указанного промежутка.
27* 419
Граничное
решение
Н (функция Гамильтона^
Внутреннее
решение
Pic. 14.1. Иллюстрация принципа максимума для скалярного
случая (г= 1). Время t фиксировано (t0 t i).
Необходимые условия (14.1.18) и (14.1.19) представля-
ют собой соответственно дифференциальные уравнения
и граничные условия для сопряженных переменных. Диф-
ференциальные уравнения показывают, что скорость изме-
нения каждой из сопряженных переменных равняется част-
ной производной функции Гамильтона по соответствующей
фазовой координате, взятой со знаком минус. Граничные
условия показывают, что конечное значение каждой из
сопряженных переменных равно частной производной
функции F (х, t) по соответствующей фазовой координате.
Используя функцию Гамильтона, можно представить
дифференциальные уравнения для фазовых координат,
т. е. уравнения движения, в виде
i = (14.1.23)
Данные дифференциальные уравнения для фазовых коор-
динат и дифференциальные уравнения для сопряженных
переменных плюс все граничные условия образуют систе-
му уравнений, называемых каноническими уравнениями
дН ч
x = ’ х(^о) = хо
• дН . dF
(U.1.24)
420
Эта система состоит из 2п дифференциальных уравнений,
на одну половину которых наложены граничные условия,
'заданные в начальный момент, а для оставшихся п урав-
нений граничные условия заданы в конечный момент.
Рассмотрим теперь, как функция Гамильтона изме-
няется во времени. Так как Н = Н (х, и, у, t), то
ан дн • . он • • ан . ан ... .
dt - дх х+ ди и + У ду dt * (14.1.25)
Преобразуем это выражение, используя уравнения дви-
жения
Первый член этого выражения равен нулю в точках опти-
мальной трагектории, в силу дифференциального уравне-
ния для сопряженных переменных. Второй член обра-
щается в нуль потому, что либо частная производная
равна нулю, если максимум внутренний, либо и обращается
в нуль, если максимум достигается на границе. Следова-
тельно, в точках оптимальной траектории
= (14.1.27)
jut ut ' '
В частности, если задача является автономной, т. е. если
I (• • •) и f (• • •) не зависят явно от времени, то и гамиль-
тониан не зависит явно от времени и, следовательно, функ-
ция Гамильтона постоянна во времени в точках оптималь-
ных траекторий, так как dHIdt = 0.
Итак, при решении задачи с помощью принципа мак-
симума сначала вводятся п сопряженных переменных у (t)
и определяется функция Гамильтона
Н(х, и, у, г) = 7(х, u, O + yf (х, я, t). (14.1.28)
Затем отыскиваются функции {и(£)}, {y(i)| и {х (f)), удов-
летворяющие следующим условиям *:
max Н (х, и, у, t) при всех t, t0^.t^.ti
{П6О}
X — gy > X (to) — х0
эн ... dF
у=—дГ’у^л?-
1 Данная формулировка принципа максимума основана на не-
которых условиях регулярности, аналогичных условиям регуляр-
ности ограничений в задачах нелинейного программирования (см.
стр. 106). Если не делать предположения о выполнении этих усло-
(14.1.29)
421
Эти условия являются необходимыми для существования
локального максимума х. Форма искомого решения, т. е.
оптимального управления, очень часто может быть най-
дена непосредственно в результате максимизации гамиль-
тониана. При этом оптимальные управляющие параметры
обычно определяются не как функции времени, а как функ-
ции сопряженных переменных. Для того чтобы записать
управляющие параметры в виде функций времени, тре-
буется предварительно определить, как зависят от времени
сопряженные переменные. Это в свою очередь приводит
к необходимости решать двухточечную граничную задачу,
представленную каноническими уравнениями с гранич-
ными условиями. В этой системе, состоящей из 2п диф-
ференциальных уравнений, для п уравнений заданы
начальные граничные условия (относительно фазовых ко-
ординат), а для других п уравнений заданы конечные
граничные условия (относительно сопряженных пере-
менных).
14.2. ИНТЕРПРЕТАЦИЯ СОПРЯЖЕННЫХ
ПЕРЕМЕННЫХ
Как уже было показано выше, принцип максимума мож-
но считать обобщением метода множителей Лагранжа для
задач динамики. Множители Лагранжа в статических зада-
вий, то можно ввести неотрицательную сопряженную переменную у0,
соответствующую подынтегральной функции. Тогда функция
Гамильтона имеет вид
Я' = у07(х, u, i) + yf(x, и, <)•
Если условия регулярности выполнены, то величина у0, соответ-
ствующая решению задачи, всегда положительна. Поэтому можно
нормализовать набор из га + 1 сопряженных переменных, положив
равным единице, при этом функция Н’ сводится к Я, При невыпол-
нении условий регулярности величина гап, соответствующая реше-
нию, может быть равной нулю. Этот случай аналогичен задач нели-
нейного программирования, в которой не выполняются условия
регулярности ограничений.
1 Указанные условия, вообще говоря, не являются достаточны-
ми для существования максимума. Кроме того, они не всегда приво-
дят к единственному решению или к глобальному максимуму. Одна-
ко этп условия являются необходимыми и достаточными, если функ-
ция Гамильтона линейна относительно управляющих параметров
[Розоноеп (1959)] или если максимум функции Гамильтона представ-
ляет собой вогнутую функцию относительно фазовых координат
[Мангасарян ,(1966)].
422
пах доставляют информацию о чувствительности решения
к изменениям постоянных ограничений, а сопряженные
церемонные, появляющиеся при применении принципа
Максимума, также несут информацию о чувствительности
решения к изменениям параметров.
Значение функции Лагранжа, определенной выраже-
нием (14.1.4), при u (t) = {и* (£)}, у (i) = {у* (t), х (t) =
= {х* (t)} совпадает с оптимальным значением целевой
функции. Следовательно, из (14.1.14) вытекает, что
й
J* = {Я(х*, и*, у*, 0 + У*, +
to
(14.2.1)
Характеристиками чувствительности решения к изме-
нениям параметров £0, (( и х (t0) являются частные произ-
водные от J* по этим переменным.
Чувствительность оптимального значения целевого
функционала к изменению начального момента времени’^
определяется значением производной
= - [Я* + + [у*х* + у*х*]г0 = - (Я* - y*x*]f0 =
= -!Z(x%u*,f)V (14.2.2)
т. е. величиной подынтегральной функции в начальный
момент времени, взятой со знаком минус. Следовательно,
при сдвиге начального момента времени происходит умень-
шение J* на величину, зависящую от того, какая часть
подынтегральной функции оказывается потерянной в ре-
зультате этого сдвига. Характеристикой чувствитель-
ности величины J* к изменениям конечного момента вре-
мени ti является величина производной
— [Я* 4- у*х*Ъ 4___9F I
dti 1 тУ х IfiT -t-
+ 4^- - [у*х* + y*x*]tl = [Z (х*, u*, f)ltl +
, OF dx* (M , &F . , . . ,
+-7МЙ)-----+ <14-2-3)
Чувствительность оптимального значения целевого
функционала к изменениям начального фазового состояния
(14.2.4)
x Цо) определяется начальным значением оптимальной со-
пряженной переменной, т. е.
0J* • и \
-Мад ”у w-
В частности, если значение одной из сопряженных пере-
менных в начальный момент равно нулю, то решение не-
чувствительно к малым изменениям начального значения
соответствующей фазовой координаты. Отсюда следует,
что начальные значения сопряженных переменных можно
интерпретировать как изменения оптимального значения
целевого функционала, вызванные изменениями началь-
ных значений соответствующих фазовых координат. Если
целевой функционал имеет размерность некоторой эконо-
мической величины, такой, например, как выручка, стои-
мость или прибыль (когда цена умножается на количество),
а фазовая координата имеет размерность экономического
количества, то сопряженная переменная измеряется как
цена. Поэтому ее можно называть теневой ценой. Таким
' образом, любой динамической задаче рационального веде-
ния хозяйства, связанной с распределением ресурсов во
времени, соответствует некоторая двойственная задача
оценивания во времени, состоящая в определении сопря-
женных переменных как функций времени. Вполне оче-
видно, что при такой интерпретации сопряженные пере-
менные являются динамическими аналогами множителей
Лагранжа, возникающих в статических задачах рацио-
нального хозяйствования.
14.3. ПРИНЦИП МАКСИМУМА И ВАРИАЦИОННОЕ
ИСЧИСЛЕНИЕ
С помощью принципа максимума можно вывести необ-
ходимые условия существования экстремума в задачах
вариационного исчисления [8, 9, 3]. В классической зада-
че вариационного исчисления управляющие параметры
суть скорости изменения фазовых координат, причем на
значения управляющих параметров не накладывается ни-
каких ограничений
х=и
(14.3.1)
424
лении z
Функция Гамильтона в данном случае имеет вид
Я(х, и, у, £) = 7(х, х, 0 + ух. (14.3.2)
Условие первого порядка существования максимума функ-
ции Гамильтона относительно х требует, чтобы
Д- = -^- + у = 0, (14.3.3)
дх дх
так что
у=-4- (14.3.4)
дх
Продифференцируем по времени правую и левую части
этого уравнения
Но, согласно каноническим уравнениям для сопряженных
переменных,
• dff д! ... „
Сопотасвляя (14.3.5) и (14.3.6), получаем уравнение Эйле-
ра, известное в вариационном исчислении:
(14.3.7)
дх at \ '
Условия второго порядка для существования максимума
Функции Гамильтона определяются свойствами матрицы
Гессе, составленной из вторых частных производных функ-
ции Гамильтона. Если матрица
(—) (14.3.8)
' 9х2 ’
отрицательно определена или отрицательно полуопре-
делена,
то выполняется условие Лежандра: матрица
) (14.3.9)
' 9х2 1
отрицательно определена или отрицательно полуопрё-
делена.
Согласно принципу макси ума, если и = х является
оптимальным управлением, то при любом другом управ-
Н (х, х, у, f) > Я (х, z, у, <), (14.3.10)
425
так что, привлекая (14.3.2),
/ (х, х, t) + ух > I (х, х, t) 4- yz. (14.3.11)
Преобразуя это неравенство с использованием (14.3.4),
получаем условие Вейерштрасса
Е(х, х, t, z)==Z(x, z, £) — Г (х, x, t) —
--^-(x,x,0(z-x)<0. (14.3.12)
dx
Наконец, согласно принципу максимума, и у и Я явля-
ются непрерывными функциями времени, а так как
то дНдх и 7 — (<?1/дх) х также суть непрерывные функции
времени. Следовательно, выполняются условия Вейер-
штрасса — Эрдмана в точке излома
-^4- и I—^-х непрерывны в точке излома. (14.3.14)
дх дх
Итак, мы вывели из принципа максимума необходимые усло-
вия экстремума в задачах вариационного исчисления.
Частные задачи вариационного исчисления также можно
исследовать с помощью принципа максимума. Например,
если подынтегральная функция /(•••) не зависит явно
от времени, т. е. в случае автономной задачи, то, согласно
(14.1.27), функция Гамильтона является постоянной вели-
чиной вдоль оптимальной траектории
H — I —х = const. (14.3.15)
дх ,
Тот же вывод для данного случая был получен и в (12.1.16).
14.4. ПРИНЦИП МАКСИМУМА И ДИНАМИЧЕСКОЕ
ПРОГРАММИРОВАНИЕ
Между принципом максимума и динамическим програм-
мированием, представляющими собой два подхода к реше-
нию общей задачи управления, существуют тесные взаи-
мосвязи [10, 111.
428
Функция оптимального поведения J* (х, t) определяет-
ся в динамическом программировании как оптимальное
значение целевого функционала задачи с начальным со-
стоянием х и начальным временем t; затем требуется найти
решение основного дифференциального уравнения в част-
ных производных (уравнения Беллмана)
—= <х’ У’ ^ + ‘77'f<x’ и’ *>]• (14.4.1)
Взаимосвязь между этим подходом и подходом принципа
максимума основана на уравнении (14.2.4), которое пока-
зывает, что изменение оптимального значения целевого
функционала, вызванное изменением начального состоя-
ния, равно начальному значению сопряженной перемен-
ной. Используя понятие функции оптимального поведе-
ния, можно записать
dJ*
дх
У-
(14.4.2)
Следовательно, выражение, стоящее в квадратных
скобках в уравнении Беллмана, представляет собой функ-
цию Гамильтона
Г(х, U, f) + -Ц— f (х, u, t) = I (х, U, t) + yf (х, u, t) =
= Я(х, и, у, t). (14.4.3)
Выражение (14.4.1) можно записать в виде
— = тах[Я (х, и, у, $)]. (14.4.4)
{И}
Это уравнение включает отыскание максимума функции
Гамильтона относительно управляющих параметров, при-
надлежащих области управления. То же самое требуется
сделать согласно принципу максимума. Если и — это
управление, максимизирующее функцию Гамильтона, то
Полученное уравнение называется уравнением Гамильто-
на — Якоби. Возьмем производную по х от обеих частей
этого уравнения
5V* _ дН . ! дН \' д2/*
dxdt ~ дх ' \ ду ) дх2
(14.4.6)
427
Но в результате дифференцирования (14.4.2) получаем
Поскольку J* (х, t) в динамическом программировании
предполагается непрерывно дифференцируемой, то ве-
личины смешанных производных второго порядка не зави-
сят от порядка дифференцирования. Сопоставляя два по-
следних уравнения и используя указанное свойство сме-
шанных производных, приходим к каноническим уравне-
ниям принципа максимума
дН
• 1н <14-4-8)
Наконец, из конечного граничного условия для уравне-
ния Беллмана
/«(хь^^^Схьй) (14.4.9)
вытекает конечное граничное условие для сопряженных
переменных, т. е.
(44.4.10)
Таким образом, при выполнении условий решения по мето-
ду динамического программирования, а именно при выпол-
нении уравнения Беллмана и граничного условия для
этого уравнения, выполняются и условия принципа мак-
симума. Однако из принципа максимума не вытекает вы-
полнение уравнения Беллмана, поскольку в этом случае
не требуется вводить предположение о непрерывной диф-
ференцируемости функции оптимального поведения. Кро-
ме того, при численном определении оптимальных управ-
лений эти два метода представляют весьма различные
подходы к динамической задаче рационального ведения
хозяйства: динамическое программирование приводит к не-
линейному дифференциальному уравнению в частных про-
изводных, а принцип максимума — к двум системам обык-
новенных дифференциальных уравнений. Принцип мак-
симума оказывается часто более плодотворным, поскольку
он, по~ существу, разбивает решение уравнения ГБелл-
мана на два шага: на первом шаге оптимальные управле-
ния определяются как функции сопряженных переменных,
428
а на втором сопряженные переменные определяются как
функции времени. Первый шаг обычно не вызывает затруд-
нений; он часто позволяет увидеть свойства решения, а это
может подсказать и способ решения задачи. Второй шаг
оказывается более трудным, так как приходится решать
двухточечную граничную задачу. С другой стороны, в ди-
намическом программировании оба эти шага требуется осу-
ществить одновременно, решая уравнение Беллмана. Поэ-
тому при аналитическом решении подход принципа макси-
мума обычно более полезен, чем подход динамического про-
граммирования. Однако при численном решении оба мето-
да приводят к сходным машинным программам и к тем
же проблемам, связанным с объемом памяти машины («про-
клятие размерности»), поскольку в динамическом про-
граммировании требуется найти приближенное решение
нелинейного дифференциального уравнения в частных
производных, а метод принципа максимума требует опре-
деления приближенного решения двухточечной граничной
задачи \
14.5. ПРИМЕРЫ
Рассмотрим несколько примеров, иллюстрирующих
использование принципа максимума при решении задач
управления. В качестве первого примера обратимся к ли-
нейной задаче об оптимальном (минимальном) времени
перехода от заданных начальных значений фазовых коор-
динат к определенным конечным значениям при условии,
что уравнения движения линейные и автономные. Для
простоты рассмотрим лишь задачу с одной фазовой коор-
динатой г = 1, которая может принимать значения в пре-
делах от —1 до 4-1.
Задача имеет следующий вид:
ti
max J— — I dt= —(ti—
. J
x = Ax-f-b u
ta и x(/0) заданы (14.5.1)
x(fj) задан
— l^iz(i)^l и u(t) кусочно-непрерывны.
1 Численное решение двухточечной граничной задачи рассма-
тривается в книге под ред. Балакришнана и Нойштадта [12].
429
Функция Гамильтона в этом случае является линейной
относительно фазовой координаты
Н — — 1+у(Ах + Ьи). (14.5.2)
Оптимальным управлением, согласно принципу максимума,
является
Г 1 1 (>)
u* = | if , если yb j j 0, (14.5.3)
т. е. и* = sgn (yb)1. (14.5.4)
Здесь sgnz—это сигнум-функция, т. е.
( 1 ] (>]
sgnz=< I, z j |0. (14.5.5)
Таким образом, оптимальное управление в любой момент
времени лежит на границе множества управлений и с тече-
нием времени может происходить переключение управ-
ления с одной граничной точки на другую. Такое решение
называется релейным управлением. Тот факт, что решение
задачи (14.5.1) совпадает с решением задачи, в которой
управляющий параметр может принимать только два зна-
чения (-|-1 и —1), называется принципом оптимального
релейного управления 2. Функция yb называется функцией
переключения, поскольку при изменении знака функции
yb оптимальное управление может переключаться с 4-1
на —1 (или наоборот). Функция времени для сопряженной
переменной, которая определяет функцию переключения^
отыскивается из дифференциальных уравнений >,
у = - — уА. (14.5.6)
Если характеристические корни матрицы А порядка п X п
являются различными, вещественными и отрицательны-
1 Отметим, что и* не определено в точках, где yb = 0. Задача
называется вырожденной, если это условие выполняется на про-
тяжении конечного промежутка времени. См. работы Атанса и Фал-
ба [2], Келли, Коппа и Мойера [13].
2 См. работы Беллмана, Гликсберга и Гросса [14, 15], Ласалля
[16], Халкина [17]. Принцип оптимального релейного управления
имеет важное значение в технических приложениях, в которых обыч-
но выгоднее обеспечить способность системы находиться в крайних
состояниях, нежели и в крайних и во всех промежуточных состояни-
ях. Например, термостат в отопительной системе здания, который
либо включает, либо выключает обогревающее устройство, является
более экономичным, чем термостат, регулирующий интенсивность
работы обогревающего устройства.
430
ми, то существует такое оптимальное управление, при кото-
ром происходит п — 1 переключение. Иначе говоря, вре-
менной промежуток t0 t ti можно разделить на п
интервалов, в каждом из которых оптимальное управле-
ние принимает либо максимальное значение (и* = 1),
либо минимальное значение (и* = —1) \
В качестве частного случая приведенной выше задачи
рассмотрим задачу о минимальном времени перехода,
управляющим параметром в которой является вторая про-
изводная единственной фазовой координаты
u==Xi = ^~‘ (14.5.7)
Приведем соответствующий физический пример: будем
считать и силой, приложенной к массе, величина которой
равна единице, a Xi будем считать мерой расстояния этой
массы до некоторой фиксированной точки. Уравнения
(14.5.7) показывают, что сила и равна массе (равной еди-
нице), умноженной на ускорение (х^. Поскольку в фор-
мулировку общей задачи управления входят только пер-
вые производные, то будет удобнее представить (14.5.7)
либо в виде двух уравнений движения
*1 = а* (14.5.8)
Хг = 11,
1 См. [14,15,18,19, 20,16,11]. Отметим, что если характеристи-
ческие корни матрицы А вещественные и отрицательные, то система
х = Ax-[-bu
является устойчивой, а система
№=—Ау
является неустойчивой, так как характеристические корни —А
вещественные и положительные. Это свойство, называемое двой-
ственной (дуальной) неустойчивостью, сильно увеличивает трудно-
сти решения двухточечной граничной задачи, так как малые ошибки
в у значительно возрастают при интегрировании сопряженных
дифференциальных уравнений от начального момента, а малые
ошибки в х значительно возрастают при интегрировании дифферен-
циальных уравнений состояния (уравнений движения) начиная
с конечного момента времени. В работах Солоу [21] и Джоргенсона
[22] двойственная неустойчивость рассматривается в связи с дина-
мическими экономическими моделями «затраты — выпуск», в кото-
рых либо система уравнений для определения выпусков, либо систе-
ма уравнений для определения цен является неустойчивой.
431
либо, прибегая к обозначениям, применяемым * общих
линейных уравнениях движения (14.5.1), в виде >
/О 1\ /0\
А==(о о)’ ь= (1/ • <14-5-9)
Пусть задача состоит в том, чтобы перевести фазовые коор-
динаты точки от заданных начальных значений (z4 (t0),
х2 (t0)' в начало координат (0, 0)' за минимальное время.
Функция Гамильтона имеет вид
Н — — 1 + у1Х2 + Уги. (14.5.10)
Следовательно, согласно принципу максимума,
u*=sgn(y2). (14.5.11)
Дифференциальные .уравнения для сопряженных перемен-
ных таковы:
дН Л
У1 =
У 2 =
Отсюда следует, что
дН (14-5.12)
где Ci и с2 — константы, определяемые из начальных усло-
вий. Так как у2 может изменить знак не более одного раза,
то оптимальное решение требует не более одного переклю-
чения управляющего параметра. Этот вывод согласуется
с приведенным выше общим принципом, устанавливающим
максимальное число необходимых переключений.
Используя фазовую плоскость для переменных Xi
и х2 = Xi, можно дать изящную иллюстрацию решения этой
задачи. Согласно принципу оптимального релейного управ-
ления, следует рассматривать только и = 1 и и = —1.
Если и = 1, то из уравнений движения следует, что
xt = -2 xl+c, с = const, (14.5.14)
а если и — —1, то
Xi = — у + е, с = const. (14.5.15)
432
Рис. 14.2. Решение задачи об оптимальном быстродействии на
фазовой плоскости. Управляющий параметр — вторая
производная фазовой координаты.
На рис. 14.2 изображены некоторые из этих кривых:
управлению и = 1 соответствуют кривые с направленными
вверх стрелками (в этом случае х2 = возрастает),
а управлению и = — 1 соответствуют кривые с направлен-
ными вниз стрелками (в этом случае x2 = Xi уменьшается).
Оптимальную траекторию перехода фазовой точки из любо-
го положения в некоторое другое положение, например
в начало координат, составляет перемещение вдоль одной
или двух из указанных кривых. Если начальная точка
лежит на меченой волнистой линии, то переключений не
требуется, если же начальная точка не принадлежит этой
линии, то оптимальное управление содержит одно пере-
ключение. Например, при переходе из точки А в начало
координат переключений не требуется (и = —1), а при
переходе из точки В в начало координат требуется одно
переключение, а именно переключение с и = —1 на и = +1
в точке С.
1 В' качестве второго примера применения принципа
максимума рассмотрим задачу управления по минимуму
28-0270
433
энергии, в которой уравнения движения являются линей-
ными и автономными:
«1
If 1
= (х Dx + u'Eu)di-)--s-x^Fxi
{u(t)} z J z
x = Ax-j-Bu (14.5.16)
x (i0) = Xo
x(«i)=xi.
Здесь D и F — заданные отрицательно определенные ма-
трицы порядка п, Е — заданная отрицательно определен-
ная матрица порядка г, а А и В — заданные матрицы раз-
мерности п X п и п X г соответственно. Будем предпола-
гать, что и может принимать любые значения, т. е. 12 =
= Ег.
Функция Гамильтона имеет вид
Я = у (x'Dx4-u'Eu) + у (Ах-J-Ви). (14.5.17)
Согласно принципу максимума,
Л£ = и'Е4-уВ=0, (14.5.18)
Следовательно, оптимальным управлением является ли-
нейная функция сопряженных переменных
и* = — Е-1В'у'. (14.5.19)
Канонические уравнения имеют вид
x«-^ = Ax + Bu = Ax-BE-1B'y', x(i0)=xo
. ап (14.5.20)
У =—^Г=-x'D — уА, y(ii) = x;F.
Рассмотрим линейное решение в форме
y = x'Q(i), (14.5.21)
где Q — матрица размерности п X п с элементами, зави-
сящими от времени. Матрицу Q (/) найдем из уравнения
Рикатти
Q-QBE-1B'Q4-QA + A'Q4-D = 0 (14.5.22)
с граничными условиями
Q(ii) = F. (14.5.23)
434
Таким образом, оптимальным управлением по замкнутому
контуру является
u*(0=—E^B'Q'WxfO- (14.5.24)
Следовательно, оптимальные управления в задаче управ-
ления по минимуму энергии с линейными автономными
уравнениями движения являются линейными функциями
фазовых координат. Этот результат представляет собой
распространение на динамические задачи правила линей-
ного решения задач математического программирования,
согласно которому решение задачи с квадратичной целе-
вой функцией и линейными ограничениями является
линейным.
ЗАДАЧИ
14-А. Используя подход, развитый в разделе 14.1, дока-
жите, что в задачах с заданной конечной поверхностью
Т(х (£),£) = 0 при t = ti,
условие трансверсальности для принципа максимума со-
стоит в следующем:
(нм
dF \ / dF
dti / \ Sxj
) ( — 11
/ \ dt / |т(.
О
•)=
14-Б. Используя принцип максимума, покажите, что урав-
нение Эйлера для такой задачи вариационного исчисле-
ния с одной фазовой координатой, в которую в явной фор-
ме входит управляющий параметр, имеет вид
/ df dl/ди df \ d / dl/du \ „
\ 9х df/du dx f dt \ df/du )
14-B. Покажите, что оптимальные управления, получен-
ные методом принципа максимума, удовлетворяют прин-
ципу оптимальности: если {u* (t)} — оптимальное управ-
ление, а {х* (/)} — соответствующая оптимальная траек-
тория при х = х0), то {u (t)} при
Sj t ti является оптимальным управлением для задач
с начальным моментом времени т и начальным состоянием
х* (т).
14-Г. В указанной ниже задаче управления х является
единственной фазовой координатой, а и — единственным
управляющим параметром
28* 435
2
maxJ= j (2x—3u—au2)dt
о
x = x-}-u
x(0)~5
0<^г<2.
Используя принцип максимума, найдите оптимальное
управление при а = 0 и при а = 1.
14-Д. Используя принцип максимума, решите следующую
задачу управления:
1
max J — j (х*—и2) dt
о
!х\\ /0 1 \ !хЛ /0\
^Н-2 ~3* W”u/“
Xi (0) = х2 (0) = 1
xi(l) = x2(l)=0.
14-Е. Решите приведенную ниже задачу Майера с помо-
щью принципа максимума.
max 8xt (18) + 4х2 (18)
Xi = 2xi + х2 4- и
х2 = ix — 2и
Xi (0) = хю
х2 (0) = х20
0^iz< 1.
14-Ж. Рассмотрите задачу о минимальном времени пере-
хода, в которой управляющим параметром является вторая
производная фазовой координаты. Покажите, что время,
необходимое для перемещения из (хь х2)' в начало коор-
динат, определяется следующими выражениями:
х2 2х2
_Ж2-|-/__4х14-2х| , если Xi <
1 । 1
у «2 | Х2 |.
436
14-3. Решите задачи об оптимальном быстродействии, в ко-
торых требуется за минимальное время достичь начала
координат. Уравнения движения и множества управле-
ний указаны ниже.
1. z4-2dx-|-x = u
2. Xi = U}Xt
X2 — U2
I «2 |С1
3. x = f (x, 0 + u
14-И. Решите задачу
h
max J = — I I и | dt
{«(<)> £
Z== U
X (t0) = x0
X (ti) = Xi
lu I<1.
14-K. Решите задачу
i
max J = — j u2dt
0
x = x = u
x (0) = 1
x (1) = 0.
Покажите, что оптимальное управление меняется во вре-
мени по экспоненте.
14-Л. Используя принцип максимума, докажите, что крат-
чайшее расстояние от фиксированной точки до заданной
линии равно длине перпендикуляра, проведенного к линии
из этой точки.
437
14-М. Расстояние между Бостоном и Вашингтоном состав-
ляет 400 миль. В настоящее время строится сверх-
скоростной поезд для перевозки пассажиров, который будет
курсировать между этими двумя городами.
1. Какой может быть кратчайшая продолжитель-
ность поездки, если накладывается единственное огра-
ничение: максимальное допустимое ускорение равно
2g, где g — ускорение свободного падения, равное
9,8 м/сек2?
2. Какой может быть кратчайшая продолжитель-
ность поездки, если в дополнение к ограничению на
ускорение скорость не должна превосходить
360 миль/час ( = 528 фут/сек, g = 32 фут/сек2)?
14-Н. Автомобиль поднимается вверх по горе, имеющей
осевую симметрию. Высота горы равна h. Скорость автомо-
биля v зависит от угла наклона а, причем v (а) и dv/da
являются монотонно убывающими функциями и v (0) = Но»
v (л/2) = 0. Найдите путь, двигаясь по которому автомо-
биль достигнет вершины за минимальное время [23].
14-0. Лодка движется с постоянной скоростью, равной
единице, в потоке, движущемся с постоянной скоростью s.
Найти оптимальный угол курса, при котором лодка про-
ходит расстояние между двумя заданными точками за мини-
мальное время [4]. Если оси координат хх и х2 соответст-
вуют движению лодки параллельно потоку и перпендику-
лярно к нему, а 0 — угол курса, то уравнения движения
имеют вид
Xi = S + cos 0
хг sin 0.
14-П. Предположим, что в некоторой стране в момент вре-
мени t имеется 5 (/) ученых, работающих либо как препо-
даватели, либо как исследователи. Число ученых-препо-
давателей равно Е (t), число исследователей R (/) и 5 (/) =
= Е (t)-\- R (t). Благодаря работе ученых-преподавателей
подготавливаются новые ученые, причем требуется 1/у пре-
подавателей для того, чтобы подготовить за один год одно-
го нового ученого. Ученые прекращают научную деятель-
ность с темпом, равным 6 в год. Следовательно,
S («) = уЕ (/) - 6S (/).
Соответствующие параметры для США оцениваются сле-
дующим образом: у = 0,14, 6 = 0,02. С помощью раз-
438
личных средств можно влиять на величину a (t) — долю
ученых-преподавателей- Выполняются соотношения
Е (t) = a (?) уЕ (?) - 8Е (?)
R (?) = (1 - а (?)) уЕ (?) - 67? (?)
О < а а (?) а < 1.
Определите, каким должно быть оптимальное распределе-
ние ученых, если цель состоит в том, чтобы число препода-
вателей и число исследователей достигли заданных уров-
ней за минимальное время [24].
14-Р. Найдите оптимальную политику в области реклам-
ной деятельности, которая стимулирует объем продаж
данного продукта за некоторый период времени при сле-
дующих условиях: скорость изменения объема продаж
уменьшается пропорционально объему продаж и увеличи-
вается пропорционально уровню рекламной деятельности
в той части рынка, которая еще этим продуктом не насы-
щена. Задача имеет вид
ц
шах ( S(t)dt
{А(Щ J
*0
.у=_а(У+м[1-4]
8 (?о) = So
О^Л (?)
где S — объем продаж; А — уровень рекламной деятель-
ности; М — емкость рынка, а ?0, ?i, а, Ъ, So, А — заданные
положительные параметры [25].
14-С. Пусть в предыдущей задаче эффект от рекламной
деятельности со временем накапливается следующим
образом:
$ = —aS 4- Ь | А (? — т) е-т dx.
Покажите, что это уравнение можно записать в виде диф-
ференциального уравнения второго порядка с помощью
замены переменных X — t — т. Решите задачу, предста-
вив это уравнение второго порядка в виде двух уравне-
ний первого порядка и используя принцип максимума [25].
Глава 15
Дифференциальные игры
В дифференциальных играх исследуются ситуации кон-
фликта или кооперации, вкоторых игроки осуществляют
выбор стратегии во времени х. В отличие от материала,
изложенного в предыдущих четырех главах, в дифферен-
циальной игре участвуют не менее двух игроков, а выигры-
ши патдою yidLiHUKd зависят от траектории управления।
принятых всеми участниками игры, С другой стороны, еще
одно отличие от игр, рассмотренных в гл. 6, состоит в том,
что игроки делают свои ходы в течение некоторого интер-—
вала времени, так что число ходов и вместе с ними страте-
гий бесконечно.
Дифференциальные игры можно классифицировать на
основе тех же принципов, по которым классифицировались
игры в гл. 6. Один способ — классификация по числу игро-
ков: дифференциальная игра с двумя, тремя и более участ-
никами, при этом задачу управления из главы 11 можно
рассматривать жак особую дифференциальную игру с одним=
участником. Другая классификация — по характеру пла-
у (*. и с Нб-тьулссси,-
суммой в зависимости от того, фавна или не равна нулю —
(в общем с л учаеГ—~ к7шстанте)"общая сумма выигрышей =
__всех игроков. Еще один способ — разделение дифферен-__
пиальных игр на стохастические-, несли-в-пих- содержатся—
случайные переменные, и на детерминированные — в про-
тивном случае-1 2. Если время измеряется в дискретных еди-
1 Основная литература по теории игр: [1, 2, 3, 4, 5]. В тео-
рии дифференциальных игр используются многие термины теории
игр, такие, как «игрок», «стратегия» и «выигрыш». Эти понятия
рассматриваются в гл. 6.
2 Для более глубокого ознакомления со стохастическими диф-
ференциальными играми см. работу Хо [6].
440
лицах, то такая игра называется дискретной дифферен-
циальной игрой, а если время измеряется как непрерывная
величина, то соответствующая игра называется непрерыв-
ной дифференциальной игрой.
15.1. НЕПРЕРЫВНЫЕ ДЕТЕРМИНИРОВАННЫЕ
----ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ--------
ДВУХ УЧАСТНИКОВ
Темой этой главы будут непрерывные детерминирован-
ные дифференциальные игры двух игроков. Игра проис-
to t t\,
(15.1.1)
1ДО to — филсированное время начала, a it - время икон—
чания — либо задается, либо определяется самой игрой.
Игра происходит в некоторой системе; описываемой
с помощью набора из п фазовых координат, представлен-
ных в виде фазового вектора. Фазовый вектор — это
n-мерный вектор-столбец
X = X (t) = (zt (t), х2 (t), • • Хп (f)Y, (15.1.2)
составляющие которого могут изменяться во времени на-
чиная с заданного начального состояния
х (t0) = «о
и кончая заданным конечным состоянием
(15.1.3)
х(Ь) = Хр (15.1.4)
Конечный момент времени определяется конечной поверх-
пением
Предполагается^—что рассматриваемая игра — игра с
нои инфорл1аци.ей^т2о. игрокам пзвестньгзначения всех
в течение игры значения своего вектора управляющих
параметров, которые образуют траекторию управления.
Игрок 1 выбирает траекторию управления {u1 (t)}
{и1 (<)} = {(и] (t), и\ (t), . . .
(15.1.6)
441
а игрок 2 выбирает траекторию управления {и2 (£)}
{и2 «)} = «), U2 (Z), . . .
• • ; игп (ty | (15.1.7)
Эти траектории управления принадлежат заданным мно-
жествам управлений
{и1 (0) € U1
{и2 (Z)j£ U2. (15.1.8)
Это означает, что управления должны быть кусочно-
непрерывными функциями времени, значения которых во
всех точках указанного промежутка времени принадле-
жат непустым компактным множествам
и1 (t) Е Q1 при всех t,
Q1(= ETi
u2 (/) £ £22 при всех t, (15.1.9)
Q2 <= Eri.
Уравнения движения — это система’ дифференциальных
уравнений
X = f (х, u1, u2, t), (15.1.10)
причем предполагается, что !(••••)— это известная, не-
прерывно дифференцируемая функция. Уравнения движе-
ния (15.1.10) с начальным состоянием (15.1.3) и траектория-
ми управления (15.1.6) и (15.1.7), выбранными игрока-
ми, определяют фазовую траекторию {х (Z) }
{х (/)} = {(Zi (Z), х2 (Z), . . .
• • хп (Z))' (15.1.11)
Выигрыши каждого игрока зависят от траекторий
управления, выбранных обоими игроками. Выигрыш
игрока 1 определяется как!
Л = Л [{u1 (Z)}, {и2 (Z)}] =
ti
= j В (х, и1, и2, t) dt + F1 (Xi, zt), (15.1.12)
io
442
а выигрыш игрока 2 — как
J2 = J2 [{и1 («)}, (и* (/)}] =
ti
= J F (х, и\ и2, 0 dt + F2 (хь <0. (15,1.13)
*о
Каждый игрок пытается максимизировать свой собствен-
ный выигрыш выбором траектории управления.
Стратегией каждого игрока называется правило для
определения своего управляющего вектора в любой момент
времени как функции фазовых координат в этот момент
времени
и1 (/) = S1 (х (г)) )
и2 (г) = S2 (х (i)) J для всех *о<*<*1» (15.1.14)
причем смешанные стратегии не исключаются. Поскольку
стратегия определяет выборы, производимые игроком
в любой возможной ситуации, описываемой фазовым
вектором, то используемое здесь понятие стратегии согла-
суется с определением стратегии в гл. 6. В терминах
задачи управления стратегия представляет собой управ-
ление с обратной связью, обсуждавшееся в гл. 11. Так
как каждый игрок знает только свою стратегию и получает
информацию о противнике только в процессе игры,
то он должен выбирать свой управляющий вектор по теку-
щим фазовым координатам. Таким образом, по самому
своему существу дифференциальным играм соответствует
управление с обратной связью, а не управление по разомк-
нутому контуру.
Стремясь выбрать такую стратегию, чтобы максимизи-
ровать свой выигрыш, каждый игрок приходит к опти-
мальной стратегии S1* (х) или S2* (х) соответственно.
Считая их известными, уравнения движения записываем
следующим образом:
i = f (х, Si* (х), S2* (X), t). (15.1.15)
Чтобы получить-фазовую траекторию {х (i)} и величины
выигрышей каждого игрока, можно, начиная с заданного
начального состояния, проинтегрировать эти уравнения.
В результате получим
Ji* = Л [{Si* (х)}, {S2* (х)}1
J2* = J2 [{Si* (х)}, {S2* (х)}1. (15.1.16)
443
15.2. ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ ДВУХ
УЧАСТНИКОВ С НУЛЕВОЙ СУММОЙ
В дифференциальной игре двух участников с нулевой
суммой выигрыш игрока 2 равен выигрышу игрока 1,
взятому со знаком минус. Пусть/—выигрыш игрока 1—
равен
J [{и* 1 («)}, {ч2 (0}1 =
п
= f I (х, и1, и2, t) dt + F (хь zt). (15.2.1)
*0
Игрок 1 пытается максимизировать J выбором {u1 (z)},
а игрок 2 — минимизировать J выбором {u2 (Z)}. Задача,
таким образом, заключается в отыскании таких стратегий
u1* (z) = S1* (х (Z))
U2* (z) = S2* (х (z)), (15.2.2)
при которых {u1* (Z)} £ Г1 и {u2* (Z)} С СТ2 образуют
седловую точку платежного функционала
/[{u1 (Z)}, {и2* (Z)}]<
/[{и1* (Z)}, {и2* (Z)}]<
</[{и1* (Z)}, {и2 (Z)}]
для всех {и1 (Z)} 6 U1, {и2 (Z)} С U2. (15.2.3)
Величина J [{u1* (Z)}, {и2* (z)}] называется ценой диф-
ференциальной игры. Необходимые условия для того,
чтобы управления могли образовывать седловую точку
данного функционала, можно вывести с помощью принципа
максимума по аналогии с прежним выводом условий опти-
мальности управления х.
Введем n-мерный вектор-строку сопряженных пере-
менных
У W = (JZ1 (О, У2 (t), . . ., уп (Z)) (15.2.4)
1 Доказательства аналогичны приведенным в предыдущих
трех главах. Доказательство, использующее вариационное исчис-
ление, см. в работе Берковича [7], доказательства, использующие
динамическое программирование, рассматриваются в книгах Айзек-
са [1] и Берковича [8]; доказательство, использующее принцип
максимума, см. в [9]. В этих доказательствах обычно предполагает-
ся, что для обоих игроков существуют оптимальные стратегии и что
игра имеет конечную цену. О существовании решения см. в [10].
444
и определим гамильтониан
Н (х, и1, и2, у, t) = I (х, u1, u2, t) +
+ yf (X, u1, u2, t). (15.2.5)
Необходимые условия для оптимальных стратегий двух
игроков состоят в том, что в любой момент из заданного
интервала времени игрок 1 максимизирует гамильтониан,
выбирая свой управляющий вектор, а игрок 2 миними-
зирует гамильтониан, выбирая свой управляющий вектор.
Если дифференциальная игра удовлетворяет некоторым
условиям регулярности и вполне определена, т. е. реше-
нием будут чистые, а не смешанные стратегии, то необ-
ходимое условие существования решения состоит в том,
что в любой момент из заданного интервала времени
функция Гамильтона имеет седловую точку 1
Н (х, и1, и2*, у, (х, и1*, и2*, у, /)^
< (х, и1*, и2, у, t) (15.2.6)
для всех и1 С Q1, и2 € й2, t,
Иначе говоря,
max min Я (х, 1?» и2, у, t) =
ulgQl U2£Q2
= min тахЯ(х,"и'1, и2, у, £) = Я(х, и1*, и2*, у, t). (15.2.7)
U2£Q2 U1CQ1 <
Таким образом, в соответствии с этим результатом, который
по аналогии с принципом максимума может быть назван
принципом минимаксимума, дифференциальная игра двух
игроков с нулевой суммой в каждый момент заданного
1 Из гл. 6 известно, что игры с полной информацией всегда явля-
ются вполне определенными, если только это конечные игры. В отли-
чие от игр с полной информацией дифференциальные игры бесконеч-
ны, поэтому могут оказаться необходимыми смешанные стратегии,
т. е. будет использоваться набор возможных альтернативных страте-
гий из множества траекторий управлений, взятых с некоторыми
вероятностями. Примеры не полностью определенных дифференци-
альных игр, решениями которых являются смешанные стратегии,
см. в работах Берковича [4] и Оуэна [5]. Однако если как подынтег-
ральная функция I (•••), так и функция f (• • •), входящая в уравне-
ния движения, сепарабельны в том смысле, что гамильтониан можно
представить в виде суммы двух функций, одна из которых зависит
только от и1, а другая только от и2, то дифференциальная игра
является вполне определенной и имеет решением чистую стратегию.
Примером служит случай, когда и I (• • •) и f (• • •) линейны. Он рас-
смотрен в книге Понтрягина и др. [9].
445
интервала времени должна быть вполне определенной
(статической) игрой. Другими словами, эта статическая
игра двух участников с нулевой суммой имеет седловую
точку. Остальные необходимые условия — это канони-
ческие уравнения, и граничные условия такие же, как
и в принципе максимума
ЗЯ .
х = х(«0)=хо
дН , dF , дТ
у =----г“» ---hv~s—•
J ds. J v ' dxj 1 dxj
(15.2.8)
Здесь v — вектор-строка множителей Лагранжа. Преобра-
зуя полученную систему, приходим к условию трансвер-
сальности
(* *+£) + (£-*) (^)
Значения переменных и производных здесь берутся в конеч-
ный момент времени tj.
Если задача автономна, т. е. функции /(••••) и f (••• •)
не зависят явно от времени, то минимаксное значение
гамильтониана является константой, которую можно
положить равной нулю. Итак, в данном случае 1
max minZ(x, u1, и2, i) + yf(x, ul> ц2> t) = Q. (15.2.10)
ulgQl U2£Q2
Примером дифференциальной игры двух участников с нуле-
вой суммой, которую можно решить с помощью принципа
минимаксимума, является игра с квадратичным функцио-
налом и линейными автономными уравнениями движения.
1 Айзекс [1] заменяет вектор у представлением его в виде dj*ldx.
(см. об этом в разделе 14.4) и называет уравнение
max min [Z(x, и1, и2, 0-|—^-/(х, и1, и2, 4)1=0
U1£Q1 U2£Q2 ох
главным, уравнением. Это уравнение представляет собой не что иное,
как уравнение Беллмана для данной задачи. Айзекс [1] записывает
канонические уравнения как уравнения траекторий, взятых в обрат-
ном направлении:
• дН • ЭН
х = --эГ’ У=’эГ-
Здесь кружок сверху обозначает, что дифференцирование произво-
дится по времени, остающемуся до окончания, т. е.
° dz , ,
, где x — ti — t—остающееся время.
446
Аналогом этой задачи в теории управления является
задача управления по минимуму энергии, разобранная
в разделе 14.5. В этой дифференциальной игре фазовый
вектор можно разложить на две части
/х1 \
Х=Ц, (15.2.11)
где х1 включает фазовые координаты игрока 1, а х2 — фазо-
вые координаты игрока 2. Уравнения движения линейны
и автономны
x^Ab^ + Bhi1
х2 = А2х2 + В2иг. (15.2.12)
Здесь и1 и и2 — это управляющие векторы игроков 1 и 2
соответственно, причем никаких ограничений на и1 и и*
не накладывается. Время окончания задано, а выигрыш
игрока 1 определяется как
ti
J= j [x1'C1xx4-x2'C2x8+uvD1x1-|-
to
+ u2'D2u2 + u]'D3u2] dt +
+ [xi'^x1, + x2;E2x2 + x11'E8x2], (15.2.13)
где D1 — отрицательно определенная матрица, a D2 —
положительно определенная матрица. Гамильтониан
в этом случае имеет вид
Н = Ixi'CV + х2'С2х2 + и1'!)1»1 +
+ u2'D2u2 + tf'W] + у1 [А’х1 + Ши1] +
+ у2 [А2х2 + В2и2]. (15.2.14)
Здесь вектор сопряженных переменных представлен в виде
у = (уху2). (15.2.15)
По принципу миним’аксимума получаем необходимые усло-
вия оптимальности
= 2u' 'D' + и2'!)3 + у’В1 = О
ап ' - Уй»’2.16)
= 2u2,DZ + UVD3_|_у2В2 = 0 ,
Условия второго порядка выполняются, так как, по пред-
положению, D1—отрицательно определенная матрица,
a D2 — положительно определенная матрица. Оптималь-
ный вектор управления, выраженный через вектор сопря-
женных переменных, имеет вид
и1 = —- D1’1 {D3u2 + В^у1'} , (15.2.17) и2« Dr,{D3u1+B2'ys'},
а дифференциальные уравнения для сопряженных пере-
менных имеют вид У1=-^=”2х1'С1-У1А1 (15.2.18) у2 = —~ ~ — 2х2'С2 - у2А2. * иХ~ *
Тогда, предположив, что решение линейно и что его можно
представить в виде
y‘=x2'Q* (О
y = x2'Q2(i),
(15.2.19)
получаем, как и в разделе 14.5, матричные уравнения
Рикатти для Q1 V и Q2 (t). Итак, найдены оптимальные
управления с обратной связью
и1 = - 4 D1"1. {IPu2 + В^'х1}
. (15.2.20)
и2 = -4- D2-"1 {D3'u‘ + B2'Q2'x2}.
А
Отсюда видно, что оптимальное управление для каждого
участника — это линейные функции своих собственных
фазовых координат и управляющих параметров другого
участника. Точка равновесия достигается тогда, когда при
выборе игроком 1 управления и1 на основе управления и2
игрока 2 оптимальным выбором для последнего является
именно и2, что в свою очередь принуждает игрока 1 повто-
рить свое решение. Точка равновесия отыскивается
в результате решения системы уравнений (15.2.9) относи-
тельно и1 и и2
448;
fti[j-X EH’1 D3!)2^3'] 1 • [ -X D^'Q1' (t)x1-]-
+ X D1-1D3D21B2 Q2' (t) X2]
4 J (15.2.21)
^^[i-Xd2-1133'01"103]1 x
X [4 (t) x1 -X D2-iB2'Q2/ X2j .
Причем предполагается, что обратные матрицы сущест-
вуют. При этом оптимальные управляющие векторы
каждого участника представляют собой линейные функции
фазовых векторов обоих участников, т. е. каждый участ-
ник при оптимальном поведении пользуется правилом
линейного решения, выбирая линейную форму связи линей-
ных управляющих параметров и фазовых координат х.
15.3. ИГРЫ ПРЕСЛЕДОВАНИЯ
В теоретическом плане и с точки зрения практических
приложений наиболее важным классом дифференциальных
игр двух участников с нулевой суммой являются игры
преследования. В них игрок 1 является преследователем,
а игрок 2 — преследуемым [9,11,12,1,3]. Игра заканчи-
вается, когда преследователь «захватил» преследуемого.
Продолжительность игры равна времени, нужному для
«захвата». Цель преследователя — минимизировать «время
захвата», в то время как цель преследуемого — максими-
зировать его. Если преследователь не может подойти
достаточно близко к преследуемому для захвата послед-
него, то преследуемый «спасен» и время захвата беско-
нечно. Такое определение игры преследования достаточно
широкое, и оно позволяет отнести к играм такого типа
множество примеров преследования, включая такие раз-
личные ситуации, как преследование игрока в футболе
или преследование ракеты антиракетой.
Простейшей игрой преследования является преследо-
вание на плоскости, когда участники управляют двумя
1 Ср. с решением соответствующей задачи управления (раз-
дел 14.5). — Прим, перев.
29-0270
44Э
Рис. 15.1. Задача преследования на плоскости.
точками на плоскости, двигающимися с фиксированными
скоростями, причем скорость преследователя превосходит
скорость преследуемого. Здесь управляющими парамет-
рами являются направления движения точек. Фазовые
координаты и управляющие параметры показаны на
рис. 15.1. Прямая L — ось отсчета, а прямая М в любое
время проходит через эти две точки. В качестве фазовых
координат в движущейся системе отсчета выбраны
— расстояние от игрока 1 до игрока 2
х2 — угол между L и М. (15.3.1)
Характеристики направления движения
и1^ угол между вектором скорости участника 1 и L
u2.-m угол между вектором скорости участника 2 и L
(15.3.2)
являются управляющими параметрами.
Игрок 1 (преследователь) движется со скоростью з1,
игрок 2 (преследуемый) движется со скоростью s2 (s1 > з2),
и
О и1 < 2л
О и2 < 2л.
Уравнения движения имеют вид
xi = ~ s1 cos (и1 — х2) + s2 cos (н2 — Яг)
*2 =
— з1 sin (u4 —xo)-j-s2sin (и2 —г2) '
(15.3.3)
(15.3.4)
Xi
450
Отметим, что если преследователь движется прямо за пре-
следуемым, а преследуемый удаляется от преследователя
по прямой линии, то
и1 = х2
и2 — х2
и уравнения движения принимают вид
Xt = s2 — s1
г2 = 0.
(15.3.5)
(15.3.6)
Первое уравнение показывает, что расстояние между пре-
следователем и преследуемым уменьшается со скоростью,
равной разнице их скоростей.
Конечный момент времени определяется временем,
когда расстояние между участниками сократится до задан-
ной величины I, т. е.
Xi(ti)^l. (15.3.7)
В момент Zj преследователь «захватывает» преследуемого.
Выигрыш преследователя (игрок 1) равен
J ---pj- У dt — (ti Zo) •
to
В этой задаче гамильтониан имеет следующий вид:
Н = — 1 + ih (—s1 cos (и1 — Хз) + s2 cos (и2 — х2)) +
+ — (—sin (и1 — х2) + «2sin (и2—х2)). (15.3.8)
Согласно принципу минимаксимума, нужно найти мак-
симум функции Гамильтона по и1 и минимум по и2. Из усло-
вий первого порядка
-jr-r — ytgl sin (и1 — х2) —— s1 cos (и1 — х2) — О
’ Xl (15.3.9)
^2 = —J/1S2 Sin (u2 —x2) + -|?-s2cos(u2 —ж2) = 0
следует, что
tg (и1—ж2) = tg (и2 —ж2) = .
(15.3.10)»
29* 45/
Запишем дифференциальные уравнения для сопряженных
переменных
--^-= --^(-^sin^-^ + ^sinfu2-^))
ft = —(—S1 Sin (и1 — х2) + s2 sin (и2 — х2)) +
(s1 cos (и1 — х2) — s2 cos (и2 — х2)).
Но, согласно (15.3.10),
? sin (и1 — z2) = cos (и1 — х2)
sin (и2—х2) = cos (и2—х2).
Отсюда следует, что
У2 = 0,
(15.3.41)
(15.3 12)
(15.3.13)
т. е. у2 есть величина, постоянная во времени. Поскольку
никаких ограничений на конечное значение х2 нет, то
Уг (к) = 0 (15.3.14)
и
У2 0) = 0, t0 Z < ti. (15.3.15)
Итак, цена игры не зависит от величины начального угла
х2 (0» так как сопряженная переменная, являющаяся
характеристикой чувствительности, равна нулю
Из (15.3.10) видно, что и1 и и2 являются решениями, если
sin (и1 — х2) = sin (и2 — х2) = 0
tg (и1 — х2) = tg (и2 — х2) « 0. (15.3.16)
Следовательно, оптимальная траектория управления
должна удовлетворять условиям
и1 = х2
и2 = хг.
Это, как отмечалось раньше, соответствует случаю, когда
преследователь настигает преследуемого по прямой, а пре-
следуемый удаляется от преследователя также по прямой.
(15.3.17)
452
Захват
ZZ
/
Хигрок 2 (преследуемый)
/
хХИгрок 1 (преслеЗователь)
Захват м
zM
'X/
i У Игрок 2 (преслеЗуемыи)
/ /'Неоптимальная игра
Ltf преследуемого
'Игрок 1 (преслеЗователь)
Рис. 15.2. Оптимальная игра преследования и неоптимальная
игра преследования на плоскости.
В этом случае скорость уменьшения расстояния между
ними равна
= s2 - Л (15.3.18)
Следовательно,
X! (О = (? - s2) (to -t)+xi (to), (15.3.19)
где Xi (to) — заданное первоначальное расстояние между
участниками. Так как по определению ti
(h) = (s1 — s2) (to — t) = Xi (t0) = I, (15.3.20)
то цена игры для игрока 1 (преследователя) равна
J^=-(ti-to)=-[Xis^~) (15.3.21)
На рис. 15.2 показаны оптимальная и неоптимальная
игры преследования на плоскости. Верхний чертеж демон-
стрирует оптимальное поведение: преследователь дви-
жется прямо в направлении преследуемого, а преследуе-
453
М х Здхйатп
Рис. 15.3. Игра преследования на плоскости. Преследователь
и преследуемый разделены препятствием в виде круга.
мый движется от преследователя по прямой М, соединя-
ющей обоих игроков. На нижнем чертеже показано неоп-
тимальное поведение, когда преследуемый движется под
прямым углом к линии М. Преследователь выбирает опти-
мальное поведение: движется все время в направлении
преследуемого (и1 = х2} и «захватывает» его за меньшее
время.
Возможны различные усложенения игры преследова-
ния на плоскости. Как одно из таких усложнений рас-
смотрим случай, когда между преследователем и пресле-
дуемым лежит препятствие, например, в виде круга,
как на рис. 15.3. Оптимальной стратегией для игрока 2
будет движение по прямой М2, касательной к окружности
и проходящей через начальное положение этого игрока.
Оптимальной стратегией игрока 1 будет движение по
прямой Mi, касательной к окружности и проходящей
через его начальное положение, потом по окружности
и, наконец, по прямой Мг, на которой и происходит
захват. Оптимальное поведение для каждого игрока пока-
зано на рис. 15.3. Никакие другие стратегии игрока 1
не могут сократить время захвата, и никакие другие
стратегии участника 2 не приводят к продлению времени
захвата.
Если прямая М, связывающая начальные положения
участников, проходит через центр окружности, то в рас-
45£
поряжении каждого игрока имеются две касательные,
одинаково выгодные для движения. В этом случае игроки
могут использовать смешанные стратегии, выбирая путь
случайным образом так, что каждый путь может быть
выбран с вероятностью 1/2. Множество таких симметрич-
ных положений называется рассеивающей поверхностью.
Эта поверхность исчезает, как только выбор сделан, при
этом один или оба участника могут изменить свое решение.
Если оба изменяют свои решения, тогда они могут ока-
заться на другой рассеивающей поверхности [1].
15.4. КООРДИНИРОВАННЫЕ
ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ
В игре с нулевой суммой участники находятся в состоя-
нии прямого конфликта, так как выигрыш одного участ-
ника равен проигрышу другого. В координированных
играх, напротив, игроки действуют в полном согласий
друг с другом, стремясь максимизировать одинаковые
выигрыши, равные
й
/[{«ЧОЬ {и3 (0}] = у Z (х, и1, и’, ^dt + F^ti) (15.4.1)
to
за счет выбора своих управляющих траекторий {и (/)}
и {u2 (t)} соответственно. Иллюстрацией подобной игры
служит задача о совместном стремлении избежать столкно-
вения двух движущихся машин (например, автомобилей,
кораблей, самолетов), причем выигрыш равен либо О,
либо 1 в зависимости от того, будет ли расстояние между
ними в момент наибольшего сближения меньше или больше
некоторого критического.
Решение кооперативной дифференциальной игры двух
участников можно получить аналогично решению задачи
управления с помощью принципа максимума. В нашем
случае при предположении, что дифференциальная игра
удовлетворяет некоторым условиям регулярности, опти-
мальное управление обязательно удовлетворяет следую-
щему условию, налагаемому на функцию Гамильтона:
шах шахЯ(х, и1, и2, у, t) = H(x, и1*, и2*, у, t) (15.4.2)
U1£Q1 u2gQ2 '
455
во всех точках указанного интервала времени. Это условие
можно назвать принципом максимаксимума Канонические
уравнения те же самые, что и в предыдущем параграфе.
В качестве примера кооперативной дифференциальной
игры двух участников рассмотрим игру, в которой двое
участников управляют ускорением единичной массы с коор-
динатами (zj х^)' в одном и том же направлении. Диф-
ференциальные уравнения имеют следующий вид:
Х{ = и1
х2 = и2<
Ограничения на управляющие параметры
|и2|^1
[15.4.3)
(15.4.4)
показывают, что максимальное ускорение для каждого
игрока не превосходит единицы. Цель игры — достичь
начала координат за минимальное время, т. е.
й
/= <— f dt — — (ti — to). (15.4.5)
to
В заданном начальном положении масса находится в покое
£1 (t0) = £10
(«о) т= £20 (15.4.6)
£i (to) = 0
£2 (to) — 0.
Эта координированная игра представляет собой
дифференциальную игру, аналогом которой в теории управ-
ления является задача о минимальном времени перехода,
где в качестве управляющего параметра берется вторая
производная фазовой координаты (см. раздел 14.5). Вос-
пользовавшись приемом этого раздела, можно наши диф-
ференциальные уравнения свести к уравнениям первого
порядка. Введем новые фазовые переменные х3 и xt
456
xi — #3> Xi (^o) — #10
a?2 = xii x2 {tg) = X20
X3 = U1, X3 {tg) = 0
Xi = U1, Xi {tg) — 0.
Тогда гамильтониан принимает вид
Н = — 1 + ytx3 + y&i + Уз»1 + Vtu',
и по принципу Максимаксимума
Г 1) (>1
и1 = | 1, если уз j < | О
( 11 [>>
u2 = । _ । г > если У* । Г О-
(15.4.7)
(15.4.8)
(15.4.9)
Канонические уравнения для сопряженных переменных
выглядят следующим образом:
ЁН (15.4.10)
• дН
У*=~^=-У'
дН
Уь=—д^=~У*-
Их решениями являются
У1 = Ci
У2 = с2 (15.4.11)
Уз = с3 — Cit
Уь = СЬ — c2^i
где С(, с2, с3 и с4 — постоянные. Поскольку на значения
конечные скоростей не наложено ограничений, то
Уз {ti) - 0
у4 {ti) ~ Л (15.4.12)
45?
Рис. 15.4- Кооперативная дифференциальная игра.
Из конечных условий и вида решения для сопряженных
переменных видно, что у3 и у4 не могут менять знак —
они или всегда положительны, или всегда отрицательны,
или равны нулю. Решение задачи показано на рис. 15.4.
Решение, начинающееся в некоторой точке на прямой ОЬх,
например, если начальная точка — это точка (6.6), являет-
ся очевидным
u1 = -1, u2 = -1, (15.4.13)
при этом уз и у4 отрицательны. Так как начальные зна-
чения сопряженных переменных можно интерпретировать
как характеристики чувствительности, то
Уз (*о) =
dJ*
дх30
Уь Цо)
dJ*
^^40
(15.4.14)
Отрицательные начальные значения у3 и у4 показывают
в данном примере, что при увеличении положительных
начальных скоростей в любых направлениях, началом
458
Которых служат точки на прямой OL, увеличилось бы
время достижения начала координат.
Аналогично получается решение, начинающееся
из какой-либо точки на прямой ОЬ2
и1 = 1, и2 = -1. (15.4.15)
Точно так же решением, начальная точка которого лежит
на прямой OL3, является
и1 = 1, и2 = 1, (15.4.16)
а если начальная точка лежит на прямой OLk, то
и*=-1, и2 = 1. (15.4.17)
Посмотрим, что получится для точек, не лежащих
ни на одной из этих прямых, например таких, как точка
(3.1). Решение по-прежнему проходит по прямой и
u1 = —1, U« = --L. (15,4.18)
Это решение удовлетворяет указанным ранее необходимым
условиям, хотя и2 и не находится на границе. В этом
случае
1/2 = 0 (15.4.19)
г/4 = 0.
Отсюда, поскольку сопряженные переменные измеряют
чувствительность, следует, что целевой функционал (мини-
мум времени) не зависит от начального положения
и от скорости в вертикальном направлении. Это очевидно,
так как в данном случае единственное влияющее на время
направление — горизонтальное.
Начиная с более высокой точки или с большей скоро-
ростью в вертикальном направлении, мы просто изменявши
значение и2 без изменения J*. По приведенным сообра-
жениям решение всегда проходит по прямой, а опти-
мальный выигрыш и минимальное время зависят только
от большей из начальных координат.
15.5. НЕКООПЕРАТИВНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ
ИГРЫ
Некооперативная дифференциальная игра — это диф-
ференциальная игра с ненулевой суммой, в которой участ-
ники не могут принимать связывающие их обязательства
459
дб используемых ими стратегиях до начала игры. В диф-
ференциальной игре двух участников с ненулевой суммой,
где выигрыши участника 1 и участника 2 определяются
соответственно как
h
J1 [{и1 (/)}, {и2 (i)}] = j 71 (х, и1, и2, t) dt + F1 (x^i)
Ц (15.5.1)
/[(и1»}. {«’(0)1 = f Р(ж, (’?«*, 0*+/a(*i«i),
to
некооперативным равновесием (по Нэшу) называется пара
стратегий
и1* (/) = S1* (х (£))
2* S2* /, (15.5.2)
и2* (г) = о2* (х (/)), '
таких, что ни один из игроков не имеет намерения изме-
нить свою стратегию при заданной стратегии противника.
Следовательно,
J1 [{и1* («)}, {иа* W}] > J [{и1 (0). {«2* (0}]
для всех {и1 (<)} 6 U1 (15.5.3)
/2 [{и1* (/)}, {и2* «)}] > J [{и1* (0}> {и2 (ОН
для всех {и2 (<)} 6 U2.
Если выполнены некоторые условия регулярности,
то можно получить необходимые условия некооператив-
ного равновесия (по Нэшу) с помощью понятия функции
Гамильтона, действуя по аналогии с методом принципа
Максимума [13].
Гамильтонианы для участника 1 и участника 2 соответ-
ственно имеют вид
Н1 (X, U1, и2, у1, t) = I1 (х, U1, U2, i) +
+ уЧ (х, u1, u2, t) (15.5.4)
Я2 (х, и1, и2, у2, t) = Р (х, u1, u2, t) +
+ y2f (х, и1, u2, t),
где у1 — вектор-строка сопряженных переменных игро-
ка 1, а у2 — вектор-строка сопряженных переменных
игрока 2. Необходимым условием некооперативного равно-
весия (по Нэшу) является условие, что векторы управ-
400
ления в любой точке заданного интервала времени должны
образовывать некооперативные равновесия (по Нэшу) длй
статической игры с ненулевой суммой, в которой выигрыши1
равны Н1 (......) и Н2 (.....), т. е.
Н1 (х, и1*, и2*, у1, t) Н1 (х, и1, и2*, у1, t)
для всех и1 £ Й1 (15.5.5)
Я2 (х, и1*, и2*, у2, i) > Я2 (х, и1*, и2, у2, /)
для всех и2 £ й2.
Иначе говоря,
и1* (i) = S1* (х (/)) максимизирует
Я1 (х, u1, S2* (х), у1, t) “(15.5.6)
и2* (0 = S2* (х (<)) максимизирует
Я2 (х, Si* (х), и2, у2, t).
Канонические уравнения принимают следующий вид:
x = f (х, U1, U 2 t\ dHl - дЯ2
'*>- dyi - ду2
V1— . дЯ‘ dHt dS2* (15.5.7)
у — дх ди2 дх
V2 дЯ2 дЯ‘ dS1*
у — дх ди1 дх ’
где последние члены в двух последних дифференциальных
уравнениях определяют влияние стратегии одного из уча=-
стников на гамильтониан другого.
ЗАДАЧИ
15-А. Найти решение игры Двух лиц с нулевой суммой
с выигрышем по окончаний времени игры. Уравнения
движения заданы
Xi = аи1 + b sin и2
х2 —1 + Ъ cos и2.
Управляющие параметры удовлетворяют следующим усло-
виям [1]:
—i<;ul^i
0^u2< 2л.
461
15-Б. В дифференциальной игре уравнения движения
имеют вид
Х1 = ut (1 + 2 У Гх! |) + и2
х2 = —1.
Управляющие параметры удовлетворяют ограничениям
0<^и2<1 .
Игра начинается в х2 (t0) > 0 и оканчивается при х2 (ti) =
— О, а выигрыш игрока 1 определяется как
j ~ 1
i-H*i (*i)l2 ’
Показать, что ось х2 является «сингулярной поверх-
ностью» в том смысле, что все оптимальные траектории —
это кривые, начинающиеся на этой оси [5].
15-В. В дифференциальной игре двух участников с нуле-
вой суммой уравнения движения имеют вид
Л = (и1 - U2)2
х2 = —1.
Скалярные управляющие параметры удовлетворяют усло-
виям
| и1 I С 1
| U2 I С 1.
Игра начинается в х2 (t0) > 0 и оканчивается в х2 (ti) = 0.
Выигрыш участника 1 равен
J — Хх (ti).
Показать, что игра не имеет решений в чистых стратегиях.
Дайте геометрическую иллюстрацию в плоскости (х1У х2)'.
15-Г. Предположим, что в игре преследования уравнения
движения линейны и сепарабельны, т. е. '
х1 = AV -f- bV
х2 = А2х2 + b2u2,
462
а скалярные параметры удовлетворяют ограничейиям
0^| и1 |<1
0^| и2 |^1.
Начальные состояния х1 (to) и х2 (t0) фиксированы.
Игра заканчивается, когда х2 (^) = х2 (^). Цель игрока
1 (2) — минимизировать (максимизировать) время окон-
чания tf — t0. Найти решение. См. [9, 11].
15-Д. В игре преследования на плоскости преследователь
(игрок 1) осуществляет управление по координате xt,
преследуемый (игрок 2) — по координате х2, где
Xi + axi = и1 | и1 |^1
Х2 + Рх2 = и2 | и2 |^1.
Игра оканчивается в ti, когда
*1 (ti) = х2 (t2).
Показать, что выигрыш конечен (т. е. игра может быть
окончена), если а < р [14].
15-Е Вывести «главное уравнение», указанное в приме-
чании на стр. 446, используя методы динамического
программирования.
15-Ж. В дифференциальной игре о вратаре игрок 1 защи-
щает зону нападения, к которой приближается игрок 2.
Игра похожа на хоккей, где участник 1 — вратарь. Игра
происходит на плоскости (х^ х2)'. Зона нападения лежит
на оси Xi, ось х2 делит ее на две равные части длины L.
Игрок 1 начинает движение из зоны нападения, поки-
дая ее с постоянной скоростью и1, но он может управлять
своей горизонтальной скоростью
х\ = и1, х\ (t0), причем | и1 | < и1
х2 — V1, 4 (t0) = 0.
Игрок 2 начинает движение к зоне нападения из точки,
расположенной над зоной нападения с постоянной ско-
ростью v2, управляя своей горизонтальной скоростью
х2 = и2, х\ (t0), причем | и2 | =Сн2, и2 > и1
я2 = —и2, х*Л (to) > 0.
463
Игра заканчивается, когда
^2 (^1) = Х2 (^1)’
Здесь выигрыш (проигрыш) участника 1 (2) определяется
так: .
1 I
X 2 ,, й2[> еСЛИ ] у2
( 1 ( и Xi vi)/ j 'Ч I в противном случае
Дайте интерпретацию платежной функции. Подробно
проанализируйте решение. См. [15].
15-3. Лев и человек находятся на круглой арене, у них
одинаковые максимальные скорости. Сможет ли лев
настичь человека?
15-И. Атакующий и защищающийся — две точки на пло-
скости, лежащие вне некоторой области цели. Они дви-
гаются с одинаковой скоростью и могут управлять направ-
лением движения. Когда атакующий и защищающийся
находятся достаточно близко друг от друга, защищаю-
щийся захватывает атакующего. Защищающийся пытается
максимизировать расстояние от точки захвата до области
цели. Атакующий пытается подойти как можно ближе
к области цели. Предполагая, что захват происходит вне
области цели, покажите графически стратегию игры [1].
15-К. В динамической модели ракетной войны две сто-
роны А и В, принимают участие в игре в промежутке
времени от i0 до ti- Фазовыми координатами будут ракеты,
остающиеся в каждой стране МА и Мв, и потери каждой
страны — СА и Св. Уравнения движения имеют вид
МА = —аМА — $Мв$'1в
Мв = —₽Мв — a.MAa'fA
СА = (1 — Р') рЛ/дУд
Св = (1 — а') аМАиА.
Управляющие параметры для А — это интенсивность огни
а и а' — доля ракет, которые используются для противо-
ракетной обороны. Аналогичные управляющие Параметры
для В — р и Р', причем
464
О^а^а, задано а
0<^а' 1
О-<Р^Р, задано fl.
O^fl'^1.
В уравнениях движения /в — это эффективность ракет В
против ракет А, то есть количество ракет А, уничтожен-
ных одной ракетой В. Аналогично /А — эффективность
ракет А против ракет В, ив — эффективность ракет В
против городов А и vA — эффективность ракет А против
городов В. Таким образом, два члена в уравнении для МА
показывают потери ракет А, включая ракеты, израсходо-
ванные на обстрел противника и уничтоженные противо-
ракетной обороной В. Граничные условия таковы:
МА (t0) =
Mb (t0) — Мв0
С A (to) — О
Св (t0) — 0.
Предположим, что задано. Найти оптимальные стратегии
интенсивности огня и противоракетной обороны для А и В,
считая, что целью для А является минимизация СА (<i) —
— Св (ti), а для В — минимизация Св (ij) — СА (^).
15-Л. Дифференциальной игрой на выживание называется
дифференциальная игра двух участников с нулевой суммой.
В ней один участник обязательно выигрывает, а другой
проигрывает. Конечную поверхность можно разделить
на две поверхности: одну W, на которой выигрывает
участник 1, и другую L, на которой он проигрывает.
Пространство фазовых координат (некоторое подмноже-
ство Еп) также можно разделить на область выигрыша WZ,
состоящую из тех точек, откуда игрок 1 наверняка попа-
дает в W, область проигрыша LZ, состоящую из тех точек,
откуда игрок 2 наверняка попадает на L, и ничейную
область N, в которой ни один из участников не имеет
гарантированного успеха.
1. Заданы уравнения движения, множество траек-
торий управления и граничные условия такие же, как
в задаче 15-В. Предположим, что
3 0 -0270
465
w = fa (ZO | X, (ti) > 0}
L = {Xi (ti) | Xi (ti) < 0}.
Показать графически WZ, LZ и N.
2. Снова используя условия задачи 15-В, пред-
положим, что
W= (Xi (h) |Л1 (M^l}
£ == {Xi fa) | Xi fa) > 1}.
Показать WZ, LZ и N графически.
3. Предположим, что N является гладкой поверх-
ностью. Показать, что нормальный к N вектор V =
= (Уъ . Уп), направленный в сторону WZ, удов-
летворяет условию. См. [1, 51.
max min [V-f (х, и1, u2, Z] = 0.
ul£Q u*£Q
ЧАСТЬ V
Применение
динамической
оптимизации
30*
Глава 16
Оптимальный экономический
рост
В любой экономике обязательно производится выбор
между обеспечением текущего спроса (потребление) и обес-
печением будущего спроса (капитальные вложения).
Несмотря на то что более высокий уровень потребления
всегда предпочтительнее более низкого, тем не менее
более высокий уровень потребления означает меньшие
капитальные вложения, что влечет за собой соответственно
уменьшение объема выпуска в будущем и как следствие
понижение уровня будущего потребления. Поэтому воз-
никает задача выбора той или иной политики в области
потребления. Одну из крайностей представляет политика
потребления, при которой насколько возможно полно
удовлетворяются текущие потребности, даже если это
грозит катастрофой в будущем из-за понижения уровня
потребления: «Живи сегодня, а завтра мы умрем». Другой
крайностью является политика потребления, при которой
стремятся ограничить текущее потребление, с тем чтобы
увеличить капитал и уровень потребления в будущем.
Множество функций времени (траекторий) для потреб-
ления, капиталообразования и выпуска продукции воз-
никает при выборе между потреблением и накоплением
капитала. Из этого множества возможных траекторий
роста экономики необходимо выбрать одну, но предва-
рительно следует получить оценку соотношения текущего
и будущего потребления. Как только такая оценка выпол-
нена, тотчас возникает задача выбора оптимальной траек-
тории роста, т. е. задача об оптимальном экономическом
росте х.
1 Основная литература по оптимальному экономическому росту:
[1, 2, 3, 4, 5, 6]. Первым исследовал эту задачу Рамсей [7].
469
16.1. НЕОКЛАССИЧЕСКАЯ МОДЕЛЬ РОСТА
Неоклассическая модель роста описывает экономиче-
ский рост в агрегированной замкнутой экономике [8, 9].
Агрегированная экономика означает, что во время t про-
изводится единственный однородный продукт, выпуск
которого составляет Y (£). При этом в процессе произ-
водства используются два однородных фактора: труд
L (t) и капитал К (t) (предполагается, что t изменяется
непрерывно). Замкнутости здесь означает, что ни выпуск,
ни затраты не импортируются и не экспортируются: весь
выпуск или потребляется, или инвестируется в экономику1.
Если обозначить через С (£) потребление во время t,
а через I (t) капиталовложения во время t, то, согласно
тождественному равенству дохода и расходов,
Y(t) = C (t) + I (t). (16.1.1)
Это тождество показывает, что выпуск (валовой нейро-
нальный продукт) может идти либо на потребление, либо
на инвестиции.
Инвестиции идут в свою очередь и на увеличение раз-
мера наличного капитала, и на замещение изношенного
капитала. Пусть К (£) — размер капитала в момент вре-
мени t, тогда капитальные вложения измеряются скоростью
изменения наличного капитала К (i) = dK (t)/dt. Пред-
положим, что амортизация наличного капитала пропор-
циональна его величине и равна ц (норма амортизации),
т. е. в момент времени t необходимо заменить иК (t)
амортизированного капитала. Предположим также, что
выполняется следующее тождество для валовых инвести-
ций'.
I(t) = К (t) + рА (/). (16.1.2)
Таким образом, чистые капитальные вложения составляют
ту часть инвестиций, которая не идет на замещение изно-
шенного капитала.
Размеры выпуска определяются агрегированной про-
изводственной функцией, которая характеризует техни-
1 В следующих разделах описаны обобщения для случая двух-
продуктового выпуска, неоднородных капитальных благ, дискрет-
ного времени и открытой экономики.
470
чески "эффективный возможности производства в зависи-
мости от величины капитала и труда *
Y = F (К, L). (16.1.3)
Предполагается, что производственная функция инва-
риантна во времени и дважды дифференцируема, причем
при любых положительных затратах факторов имеют место
следующие соотношения:
<0,
д*Р
дК2
(16.1.4)
,. dF(K, L)
lim ——- — оо
к-» о дК
.. dF (К, L)
ь-о dL
= оо
шп
•кг 01л.
' dF(K,Lf „ С16-1-5»
так что оба предельных продукта принимают вначале беско
нечно большие значения, а затем постепенно уменьшаются
до нуля. Предполагается также, что отдача от масштаба
производства постоянна, т. е. для любого положитель-
ного числа а
F (аК, aL) = aF (К, L) = аУ. (16.1.6)
В частности, выбирая а = 1/L, получим
’ Р(4’,'Н(тЬ к«а.7>
Функция / (•) определяет выпуск продукции на одного
рабочего (производительность труда) в зависимости от
величины’ капитала на ’одного рабочего (капиталовоору-
женность) 2 *.
Обозначая все величины на одного рабочего строчными
буквами, можно представить (16.1.7) в виде
У = / (к), (16.1.8)
где у (t) — выпуск продукции на одного рабочего,
а к (t) — величина капитала на одного рабочего:
яо-НЬ <16л-9>
1 Производственные функции рассматриваются более подробно
в гразделе 8.1, 'там же приводится'литература по этому’вопросу.
2JB советской литературе этот показатель обычно называется
фондовооруженностью.— Прим. ред.
471
Согласно предположениям (16.1.4) и (16.1.5),
= <0, Для всех Л>0,
lim /' (к) = оо, 1пп/'(Л) = 0. (16.1.10)
h-*0 h->oo
Итак, производственная функция на одного рабочего
является строго вогнутой монотонно возрастающей функ-
цией с наклоном касательной, равным бесконечности при
к = 0 и равным нулю при к = -|-оо.
Переменные и уравнения, введенные ранее, можно пере-
писать, используя величины в расчете на одного рабочего.
Пусть с (t) — потребление на одного рабочего, a i (i) —
капитальные вложения, приходящиеся на одного рабо-
чего, соответствующие времени t:
(16.1.0)
Тогда тождество дохода и расходов (16.1.1) можно пере-
писать как
У (t) = с (0 + I (0, (16.1.12)
а тождество для валовых инвестиций (16.1.2) как
(16.1.13)
Скорость изменения величины капиталовооруженности
рабочего можно записать следующим образом:
Теперь тождество для валовых инвестиций принимает вид
i (t) = к+ (и + т;) к. (16.1.15)
Предполагается, что численность рабочей силы возрастает
экспоненциально с показателем (темпом роста) п:
= (16.1.16)
Поэтому
i (t) = Л+ (р + п) к — к + U (16.1.17)
472
Здесь 1 — сум^а нормы амортизации капитала и темпа
роста численности рабочей сиды:
= (16.1.18)
В дальнейшем будем предполагать, что Л есть положитель-
ная константа.
Введенные выше три основных уравнения — уравне-
ние доходов и расходов (16.1.12), уравнение валовых инве-
стиций (16.1.15) и производственная функция (16.1.8) —
позволяют составить основное дифференциальное уравнение
неоклассической модели экономического роста'.
f (к (0) = с (0 + кк (0 + к (0. (16.1.19)
Это уравнение показывает, что выпуск продукции, при-
ходящейся на одного рабочего, раскладывается на три
слагаемых: потребление на одного рабочего с; поддер-
жание капиталовооруженности рабочего на прежнем
уровне Л к', чистый прирост капиталовооруженности
рабочего к х. Это основное соотношение проиллюстриро-
вано на рис. 16.1. На верхнем графике изображена функция
/ (Z0 и прямая кк. Вычитая прямую из кривой, получаем
функцию с + к, изображенную на нижнем графике. В двух
критических точках к тл к функция с + к достигает
максимума и обращается в нуль соответственно:
/ (к) — kk^f (к) — ГЛ для всех к > 0 ,16 * 2().
/ (к) - ГЛ = 0. ' ‘
При сделанных выше предположениях точки к и К суще-
ствуют и единственны.
Свойства устойчивости основного дифференциального
уравнения экономического роста зависят от уровня потреб-
ления на одного рабочего. Это показано на рис. 16.2.
В случае (а) потребление на одного рабочего равно нулю,
по вертикальной оси откладывается к, так что получаем
график на фазовой плоскости. В точке к производная
1 Если рассматривается случай с дискретным временем, где
t = t0, ti, . . ., то основное дифференциальное уравнение имеет
вид f [кд = ct -р kkt + (kf+t — kt)- Это уравнение — аналог основ-
ного дифференциального уравнения в случае с непрерывным вре-
менем. См. также примечание на стр. 479.
473
(Размер капитала
на оЗного рабочего)
Рис. 16.1. Основное дифференциальное уравнение неоклассиче-
ской модели экономического роста.
к равна 0, так что к является точкой равновесия. Слева
от точки к производная к положительна, значит, к дви-
жется вправо; справа от к производная к отрицательна,
следовательно, к движется влево. Эти направления изобра-
жены стрелками. Очевидно, что к есть точка локально
устойчивого равновесия. При рассмотрении поведения
системы в динамике очевидно, что любое малое отклоне-
ние к от к со временем исчезнет и система вернется в к1.
1 Функция Ляпунова показывает локальную устойчивость
в точке fc: ~ у = [/ (£) —Мр,
В окрестности к имеют место следующие соотношения:
V'^-0 F = 0, только если к = к,
^- = 2[f (к)—№][/' (к)—к]к^О и = 0, только если к=к.
474
Рис. 16.2. Характеристика устойчивости основного дифферен-
циального уравнения неоклассической модели эконо-
мического роста:
а) нулевой уровень потребления на одного рабочего
(с = 0);
б) максимальный уровень потребления на одного ра-
бочего (с = с) (уровень потребления, соответствую-
щий золотому правилу).
в) фиксированный уровень потребления на одного
рабочего (с = с, 0 < с < с).
Как видно из рис. 16.1, в случае (6) потребление на одного
рабочего может принимать максимальное значение с, рав-
ное ординате кривой в точке к, где к определяется из урав-
нения
/' (к) = % = р + п при к = к. (16.1.21)
Уровень капиталовооруженности, равный к, называется
уровнем капиталовооруженности золотого правила накоп-
ления. Этому уровню соответствует равновесие, при кото-
ром достигается максимум такого уровня потребления
475
на одного рабочего, который может выдерживаться сколь
угодно долго. Максимальное значение уровня потреб-
ления, которое может сохраняться неопределенно долго,
равно
с=/(Л)-й. (16.1.22)
Величина с называется уровнем потребления на одного
рабочего, соответствующим золотому правилу. Условия
(16.1.22) называют золотым правилом накопления [10].
Как показывает рис. 16.2, в точке равновесия к (уро-
вень капиталовооруженности золотого правила) устойчи-
вости нет. Отклонения вправо от к исключены, но влево
возможны, что показано стрелками. Если капиталовоо-
руженность снижается ниже к, то она будет продолжать
падать. Предположим, что с = 0 при к = 0, тогда един-
ственной устойчивой точкой равновесия в случае (6)
будет только начало координат.
Наконец, в случае (с) зафиксировано потребление
на одного рабочего с меньшее, чем максимально воз-
можное потребление на одного рабочего, 0 < с < с. В этом
случае линия потребления на одного рабочего с = с пере-
секает кривую в двух точках, соответствующих уровням
капиталовооруженности к^ и kv (kL < kv). Эти точки
являются точками равновесия в том смысле, что, достиг-
нув одной из них, система более не перемещается из этого
положения. Однако по характеру устойчивости эти точки
различны. Точка kv является точкой устойчивого равно-
весия: стрелки показывают, что слабые отклонения со вре-
менем устраняются. В точке kL наблюдается неустойчивое
равновесие. Как показывают стрелки, если к меньше, чем
kL, то происходит уменьшение капиталовооруженности
рабочего до нуля, а если к больше кь, тогда капитало-
вооруженность рабочего возрастает до kv. Таким обра-
зом, если потребление на одного рабочего установлено
на некотором промежуточном уровне, соответствующем,
например, прожиточному минимуму, то для того, чтобы
система могла достичь точки устойчивого равновесия
(fcy), необходим достаточно высокий первоначальный
уровень капиталовооруженности рабочего. Это замечание
показывает необходимость «большого толчка» для дости-
жения критического уровня капиталовооруженности рабо-
чего, после чего экономика будет благодаря собственной
476
динамике переходить ко все более высоким уровням капи-
таловооруженности рабочего, а следовательно, и к боль-
шему выпуску продукции на одного рабочего \
16.2. НЕОКЛАССИЧЕСКАЯ МОДЕЛЬ
ОПТИМАЛЬНОГО ЭКОНОМИЧЕСКОГО РОСТА
Задачу об оптимальном экономическом росте можно
рассматривать как динамическую задачу рационального
ведения хозяйства (задачу управления). Ее можно описать
и проанализироватыс помощью понятий теории управления:
фазовых координат, управляющих параметров, уравне-
ний движения, начального состояния и целевого функ-
ционала. В неоклассической задаче об оптимальном эконо-
мическом росте имеется одна фазовая координата — капи-
таловооруженность рабочего к (£), а уравнение движения —
это основное дифференциальное уравнение неоклассиче-
ского экономического роста:
к (t) = / (к (0) - кк (i) - с (i). (16.2.1)
Начальное состояние задается значением капиталовоору-
женности рабочего при t = to'
к (t0) = к0. (16.2.2)
С точки зрения центрального планирующего органа, обла-
дающего властью над развитием всей экономики, управ-
ляющим параметром является потребление на одного
рабочего, и задача состоит в выборе траектории потреб-
ления на одного рабочего в заданном интервале времени.
{c(t)} = {c(t) I to^t^h}. (16.2.3)
Здесь t0 и ti — начальное и конечное время — считаются
заданными, причем ti может принимать любые значения,
как конечные, так и бесконечные. Допустимой траекто-
рией называется любая кусочно-непрерывная траекто-
рия {с (£)}, удовлетворяющая уравнению движения и гра-
ничному условию, для которой
0<с (t)^f (к (£)) для всех t, (16.2.4)
1 Ростоу [11, 12] рассматривает «взлет», который можно рас-
сматривать как критический период времени, в течение которого
в результате внешних и. внутренних потрясений экономика прохо-
дит через kL.
477
Задача центрального планирующего органа состоит
в выборе допустимой траектории потребления на одного
рабочего, оптимальной для достижения некоторой эконо-
мической цели х.
Предполагается, что экономическая цель такого цент-
рального планирующего органа должна основываться
на стандартах уровня жизни, оцениваемых величиной
потребления на одного рабочего. В частности, предпола-
гается, что в распоряжении центрального планирующего
органа имеется функция полезности, определяющая полез-
ность U в любой момент времени как функцию от потреб-
ления на одного рабочего 1 2:
U = U (с (t)). (16.2.5)
Будем считать, что функция полезности дважды дифферен-
цируема и что предельная полезность — положительная,
но убывающая функция, определенная при всех положи-
тельных значениях потребления на одного рабочего:
= U (с)> 0, = U (с) < 0 для всех с,
0<cj<oo. (16.2.6)
Следовательно, функция полезности U (•) — это строго
вогнутая монотонно возрастающая функция. Предполо-
жим также, что функция полезности удовлетворяет сле-
дующим предельным условиям:
lim U' (с) = оо, lim V (с) = 0. (16.2.7)
с-»-0 с —* оо
Показателем кривизны функции полезности является эла-
стичность предельной полезности
<т(4=(16.2.8)
которая, по (16.2.6), положительна при всех положитель-
ных значениях потребления на одного рабочего.
1 В экономике при отсутствии центрального планирующего
органа задача об оптимальном экономическом росте заключается
в выборе подходящих комбинаций, из имеющихся инструментов
экономической политики, например таких, как валютная и нало-
говая политика, с тем чтобы достичь поставленной цели. См. работы
Удзава [13] и Эрроу и Курца [14].
2 Более подробно функции полезности рассматриваются в раз-
деле 7.2.
478
Функция полезности определяет полезность в некото-
рый момент времени, цо задача центрального планирую-
щего органа состоит в выборе всей траектории потребле-
ния в расчете на одного рабочего, а для этого надо
сопоставлять показатели полезности, соответствующие
разным моментам времени. Условимся, что полезности
в различные моменты времени не зависят друг от друга:
полезность в какой-либо момент времени непосредственно
не зависит от потребления или полезности в любой другой
момент времени. Условимся далее, что можно складывать
полезности, соответствующие различным моментам вре-
мени, только после соответствующего дисконтирования
для учета того факта, что ближайшее потребление более
важно, чем отдаленное. Предположим, что норма дискон-
тирования 6 постоянна и положительна, причем большая
норма дисконтирования свидетельствует о большем пред-
почтении близких по времени полезностей. Положив, что
дисконтирующий множитель имеет вид экспоненты, полу-
чим значение полезности в момент времени t, приведенное
к моменту времени t0, равное е-4(‘-‘о) [7 (с (/)). В указан-
ный интервал времени от ta до 7t благосостояние W, соот-
ветствующее траектории потребления на одного рабочего
{с (/)}, определяется интегрированием (суммированием)
всех мгновенных полезностей по всему интервалу х:
h
W = j е~й (‘-ад и (с (7)) dt. (16.2.9)
to
Горизонт времени планирования может быть конечным
или бесконечным. В случае если это время конечно,
нужно задавать в конечный момент времени минимально
допустимое значение капиталовооруженности для того,
чтобы обеспечить возможность потребления и за преде-
лами данного горизонта времени:
к (7i) = ki.
(16.1.10)
1 В случае дискретного времени, как в примечании ва стр. 473,
т-2 (-гпг)‘в<“>-
t=to
Здесь дисконтирующим множителем является 1/(1 + р). См. работы
Раднера [15], Гейла [16] и Мак-Фаддена [17].
479
Это граничное условие задано в форме неравенства, так
как можно получить неправильные результаты, если
величину капиталовооруженности рабочего в конечный
момент времени принять строго равной Ар Минимальный
уровень капиталовооруженности в конечный момент вре-
мени связан с периодом, который следует за рассматри-
ваемым интервалом времени. Можно было бы избежать
многих трудностей, связанных с определением минималь-
ной величины капиталовооруженности в конечный момент
времени, если считать, что ti бесконечно, т. е. рассматри-
вать тот случай, когда траектория { с (t)} выбирается
на все время в будущем. В этом случае, однако, интеграл
благосостояния может расходиться. Сходимость интеграла
гарантирована, если начальное значение капиталовоору-
женности рабочего меньше максимально достижимого
уровня к и норма дисконтирования положительна, так
как в этом случае с (t) / (£) и
j e-ea-to) и (с (0) j е-в«-«о) и (f (к)) dt = ,
(16.2.11)
так что интеграл благосостояния ограничен сверху.
Таким образом, задача о неоклассическом оптималь-
ном росте для агрегированной замкнутой экономики с бес-
конечным горизонтом планирования и положительной
нормой дисконтирования представляет собой задачу
о выборе траектории потребления на одного рабочего
{с (*)} такой, что
max W = f е-в(‘-‘о) (и (с) (t)) dt
к = f (к) — U — с
к (t0) - к0
(16.2.12)
с (<) — кусочно-непрерывная функция.
Очевидно, что это динамическая задача рационального
ведения хозяйства. Это задача управления, в которой
единственной фазовой координатой является капитало-
вооруженность рабочего к, единственным управляющим
480
параметром — потребление на одного рабочего с, а в каче-
стве целевого функционала берется интеграл благосостоя-
ния; основное дифференциальное уравнение неокласси-
ческого роста служит уравнением движения, а начальное
значение капиталовооруженности рабочего — граничным
условием. Множеством управлений здесь будут все кусочно-
непрерывные функции потребления на одного рабочего,
причем значения потребления не могут опускаться ниже
нуля и в замкнутой экономике не могут подниматься
выше выпуска продукции на одного рабочего. Решением
этой задачи будет оптимальная траектория потребления
на одного рабочего {с* (£)} и оптимальная траектория для
капиталовооруженности рабочего {к* (£)}. Эти траекто-
рии определяются для всех t t0. Решение зависит
от двух строго вогнутых функций: функции полезности
U (•) и производственной функции / (•) и от трех неотри-
цательных параметров: нормы дисконтирования 6, нормы
амортизации плюс темп роста рабочей силы, р, + п = А,
и начального значения капиталовооруженности рабо-
чего к0.
Так как (16.2.12) является задачей управления, то
ее можно решить, используя принцип максимума. Функ-
ция Гамильтона для этой задачи записывается в виде
Н = е-би-/0) {у + q[j -Xk-с]}, (16.2.13)
где q — сопряженная переменная х. В фигурных скобках
заключена сумма полезности и сопряженной переменной,
умноженной на чистые капитальные вложения на одного
рабочего. Это выражение подсказывает интерпретацию q
как вмененной ценности (теневой цены) дополнительного
капитала, измеряемого в терминах полезности. Таким
образом, выражение в фигурных скобках представляет
вмененную ценность выпуска на одного рабочего, а гамиль-
тониан — вмененную ценность выпуска на одного рабо-
чего, приведенную к моменту времени t0. В соответствии
с принципом максимума оптимальное управление (опти-
мальное потребление на одного рабочего) максимизирует
гамильтониан в каждый момент времени. Из условия
1 В стандартной форме, принятой в гл. 14,
Н = е~Щ-*°>и (с) + у[/ (&) —кк—с].
Здесь у представляется в виде
31-0270
481
первого порядка для внутреннего максимума дШдс = О
следует, что
q = V (с), (16.2.14)
т. е. теневая цена капитальных вложений вдоль опти-
мальной траектории является просто предельной полез-
ностью добавочного потребления на одного рабочего. Усло-
вия второго порядка для внутреннего решения выпол-
няются благодаря строгой вогнутости функции полезности.
Каноническое уравнение для сопряженной переменной
записывается следующим образом:
4(e-^-'o)g(O)=-4f. ,(16.2.15)
Отсюда следует, что
g = -(/' (*) - (X + 6)) q. (16.2.16)
Преобразуем это уравнение
/'(*)+ - И - п - 6 = 0. (16.2.17)
Его можно интерпретировать так, что чистый доход
от применения единицы капитала на одного рабочего
в некотором интервале времени равен нулю; при этом
чистый доход складывается из предельного продукта
и доходов с капитала (qlq) минус потери от амортизации
(ц), изменения в распределении в соответствии с ростом
населения (п) и норма дисконтирования во времени (6).
Поскольку на оптимальной траектории q (i) =
= U' (с (<)), то после дифференцирования равенства по вре-
мени получим:
-о(с)-, (16.2.18)
q U (с) v ' с ’ ' >
где о (с) есть ненулевая эластичность предельной полез-
ности, определенная в (16.2.8). Итак, каноническое урав-
нение для сопряженной переменной можно представить
как дифференциальное уравнение для управляющего пара-
метра:
c = -(Х + 6)1 с. (16.1.19)
Итак, по принципу максимума, если траектории {с* (/)}
и {к* (/)} оптимальны, то они должны удовлетворять
дифференциальным уравнениям lt
482
‘=Йо(/'(Л)-(Х+б)1с (16-2-20)
й = / (к) — М — с.
Для того чтобы определить оптимальную траекторию, вре-
менно пренебрежем условием, наложенным на начальное
значение капиталовооруженности рабочего. Тогда одним
из возможных решений для (16.2.20) будет такое, в кото-
ром ни потребление на одного рабочего, ни капитало-
вооруженность не меняются во времени:
с = 0, к = 0. (16.2.21)
Чтобы потребление в расчете на одного рабочего было
постоянным, необходимо, согласно (16.2.20), чтобы А = к*,
при этом
/' (Л*) = X + 6 (16.2.22)
и капиталовооруженность рабочего сохраняет свое значе-
ние к*, если потребление на одного рабочего равно
с* = / (к*) - Мс*. (16.2.23)
При сделанных предположениях относительно производ-
ственной функции величины к* и с* существуют, един-
ственны и удовлетворяют следующему неравенству:
0<с* </(/с*), (16.2.24)
так что условие (16.2.4) выполнено. Равновесие при к (/) —
= к* и с (t)=c* удовлетворяет всем необходимым усло-
виям, за исключением начального граничного условия. Это
равновесие при {&*}, {с*} называется траекторией сбалан-
сированного роста, поскольку вдоль нее потребление
на одного рабочего и капиталовооруженность постоянны
и как следствие этого общее потребление (С = cL), весь
объем капитала (К = kL) и общий выпуск (У = Lf (й)) рас-
тут с одинаковыми темпами, равными темпу роста рабочей
силы. Если X фиксировано, то из уравнения (16.2.22) к*
определяется как функция от 6 такая, что
lim/c*==A, (16.2.25)
б-о
где к — значение капиталовооруженности по золотому
правилу, определенное в (16.1.21). Траекторию сбалан-
31* 483
Рис. 16.3. Траектории оптимального акономического роста на
фазовой плоскости.
сированного роста называют также «модифицированной
траекторией роста, согласно золотому правилу», поскольку
она является модификацией траектории роста в соответ-
ствии с золотым( правилом при ненулевой норме дискон-
тирования. Теперь рассмотрим траекторию оптимального
роста, когда учитывается начальное ограничение (16.2.2)
на начальное значение капиталовооруженности рабочего.
Взаимосвязь двух дифференциальных уравнений (16.2.20)
можно показать графически, например так, как на
рис. 16.3. Графики здесь построены с учетом рис. 16.1.
На верхнем графике изображены производственная функ-
ция на одного рабочего / (&) и луч из начала координат
484
с тангенсом угла наклона X, пересекающий f (к) в к. Отме-
чены две другие точки: к, где касательная к производствен-
ной функции имеет тангенс угла наклона 1, и к*, где
тангенс угла наклона равен X + 6, как в (16.1.21)
и в (16.2.22). В нижней части рисунка по осям отклады-
ваются показатели по капиталовооруженности к и потреб-
лению на одного рабочего с.
Из дифференциального уравнения для потребления
на одного рабочего следует, что
н <
С
Как видно из
верхнего графика,
(16.2.26)
если к <
(16.2.27)
Это соотношение проиллюстрировано на нижнем чертеже.
Влево от вертикальной прямой, проходящей через к*
и обозначенной с = 0, расположена область с направлен-
ными вверх стрелками (с > 0). Вправо от нее (к > к*)
расположена область с направленными вниз стрелками
(с < 0).
Из дифференциального уравнения для капиталовоору-
женности рабочего следует, что
к <
> 0, если с <
/(&)—!*.
(16.2.28)
Поскольку по вертикальной оси на нижнем графике нано-
сится с, то кривая f (к) — кк изображает точки, в кото-
рых к = 0 (так она и обозначена). В точках, лежащих
ниже этой кривой, к > 0, а в точках выше кривой к < 0.
Это показано стрелками, направленными налево и направо.
Две кривые с = 0 и к = 0 разбивают весь чертеж на четыре
области, в каждой из которых поведение сяк характе-
ризуется парой стрелок. Например, в верхней правой
области и с, и А уменьшаются, тогда как в нижней левой
485
области и с, и к возрастают. Обе кривые пересекаются
в точке (к*, с*), которая соответствует траектории сбалан-
сированного роста. Угловой коэффициент касательной
к кривой /(к) — кк в этой точке равен норме дисконти-
рования 6.
Локальная устойчивость решений пары автономных
дифференциальных уравнений (16.2.20) определяется
с помощью характеристических чисел матрицы коэффи-
циентов, получаемой при линеаризации этих уравнений
в окрестности рассматриваемой точки. После линейного
разложения в окрестности точки (к*, с*) уравнения при-
нимают следующий вид:
' _ С*/* (L*) /7 7 *4
с -Л/ (к—к*),
а (с*) ' п
А — (с — с*) + 6 (к — к*),
Так что искомые характеристические числа
характеристическими корнями матрицы
/ л
о (с*) ,
\-1 б )
(16.2.29)
являются
(16.2.30)
равными
4[s±/e>-i2S]. («.2.31)
Поскольку эти корни действительные и противоположные
по знаку числа, то точка равновесия (fc*, с*), соответ-
ствующая сбалансированному росту, является седловой
точкой. Ее ветвью устойчивости является кривая, кото-
рая обозначена на рис. 16.3 как (Тс* (/), с* (<)). Ветвь
устойчивости состоит из всех тех точек, откуда можно
достичь указанной точки равновесия.
Траектория оптимального экономического роста долж-
на проходить по ветви устойчивости. Любому заданному
начальному значению капиталовооруженности рабочего
соответствует единственное оптимальное начальное значе-
ние потребления на одного рабочего, явлющееся точкой
ветви устойчивости. Такая точка существует и единственна
для любого положительного к0. Поэтому траектория опти-
мального роста является однозначно определенным отрез-
ком ветви устойчивости. Другие траектории не удовлетво-
486
ряют необходимым условиям оптимума, так как они захва-
тывают либо недопустимые точки в верхней левой области
рис. 16.3, либо внутренние точки нижней правой области *.
Итак, поскольку траектория сбалансированного роста
является отрезком ветви устойчивости, то если ко = к*,
то как с, так и к, будучи постоянными во времени, имеют
оптимальные значения, что уже было показано ранее.
Ветвь устойчивости — это монотонно возрастающая кри-
вая, поэтому если к0 < к*, то с* (Z) и к* (Z) оптимально
возрастают со временем, двигаясь вверх по ветви устой-
чивости к точке равновесия, соответствующей сбаланси-
рованному росту, если же к() > к*, то с* (i) и к* (i) опти-
мально убывают со временем, опускаясь по ветви устой-
чивости к точке равновесия.
В любом случае
lime*(/) = c*, lim к* (t) = к-. (16.2.32)
t-*oo
Это означает, что оптимальная траектория экономи-
ческого роста в случае с бесконечным промежутком вре-
мени асимптотически приближается к точке равновесия,
соответствующей сбалансированному росту.
Задача об оптимальном неоклассическом росте в конеч-
ном промежутке времени аналогична задаче (16.2.12),
за исключением того, что верхний предел в интеграле
благосостояния теперь равен t{ — фиксированному конеч-
ному параметру и, кроме того, вводится дополнительное
условие на значение капиталовооруженности в конце
промежутка времени в t\,— оно должно превышать неко-
торый заданный (достижимый) уровень (условие 16.2.10).
Задача решается так же, как и в случае с бесконечным
промежутком времени; остаются применимы и дифферен-
циальные уравнения (16.2.20). Однако в этом случае
конечное условие для сопряженной переменной имеет
вид
е-в(*-«0)д (ti) (к (t,)-kt) =0. (16.2.33)
Отсюда следует, что значение капиталовооруженности
в момент ti либо равно ki, либо тенецая цена q (ti) равна
1 Точка (к*, с*) ле является локально устойчивой, и неболь-
шие смещения увеличиваются по истечении некоторого времени.
Для того чтобы вернуть систему обратно на оптимальную траекто-
рию, требуются разрывные решения. См. работу Курца [18].
487
нулю. Можно показать, что в этом случае траектория
оптимального роста удовлетворяет магистральному свой-
ству. если промежуток времени достаточно велик, то тра-
ектории потребления на одного рабочего и капиталовоору-
женности в течение сколь угодно долгого времени
находятся вблизи линии равновесия, соответствующей
сбалансированному росту. В частности, капиталовоору-
женность при начальном значении изменяется в сторону к*
и остается в окрестности этой величины, покидая
ее только для того, чтобы не нарушить условие к (^) к^.
Таким образом, оптимальная траектория, выходя из
начальной точки, направляется к «магистрали» сбалан-
сированного роста и уходит с магистрали только для
достижения предписанного конечного состояния х.
Другое развитие основной результат получает
в случае, когда предельная полезность постоянна,
т. е. U" (с) — 0. Отсюда следует, что ст = 0. В этом случае
соответствующим подбором единиц полезности или потре-
бительских продуктов можно сделать U (с} = с; тогда
подынтегральной функцией целевого функционала основ-
ной задачи (16.2.12) является дисконтированная величина
потребления на одного рабочего
Ж= f е-м-Ыс(Г) dt. (16.2.34)
tn
Будем предполагать также, что потребление ца одного
рабочего не может опускаться ниже некоторого Минималь-
ного уровня с, так что
~c^c(t)<^f (к). (16.2.35)
Гамильтониан в этом случае имеет вид
Я = e-e(t-to) 4-g f / (А:) _ U _ с]} =
= e-^-^{c(i—q)+q[f(k) — Me]}. (16.2.36)
Так как Н линейно зависит от с, то решение имеет вид
оптимального релейного управления:
(16.2.37)
1 См, работы Самуэльсона [19, 20] и Касса [21]. Первоначальный
вариант магистральной теоремы рассматривается в разделе 1Л4.
489
(16.2.38)
Например, если q >• 1, то дН/дс < 0, т. е. гамильтониан
является убывающей функцией потребления на одного
рабочего. Следовательно, максимум достигается при мини-
мальном значении потребления на одного рабочего. Кано-
нические уравнения имеют вид
fc = /(/c) — Xfc—с
9=~(f (k)-(X + S))q.
Точкой равновесия, соответствующей сбалансирован-
ному росту (Тс = 0, q = 0), является точка (к*, q*), коор-
динаты которой определяются из соотношений
/' (&*) = Л + б,
д* = 1, (16.2.39)
с* = / (к*) - АЛ*.
На рис. 16.4 показан общий вид траектории оптималь-
ного роста в плоскости (к, q). Вертикальная прямая q = 0,
проходящая через к — к*, отделяет область, в которой q
убывает1 (слева от к*), от области, в которой q возрастает
(справа от к*). В области ниже прямой q — 1 с* = / (к),
так как решение имеет вид оптимального релейного управ-
ления (отсюда следует, что к — —кк, т. е. к убывает).
Выше прямой q = 1 с — с, причем левее къ к убывает.
Между къ и kv к возрастает и убывает правее kv. Значения
къ и kv показаны на рис. 16.2 (е); предполагается, что
къ < к* < kv. Оптимальная траектория, помеченная вол-
нистой линией, существует при условии, что'
с <_ с*, к (0) > kL. (16.2.40)
Например, если начальное значение капиталовоору-
женности рабочего меньше, чем в точке равновесия,
то потребление на одного рабочего должно сначала нахо-
диться на уровне прожиточного минимума с, а затем,
когда к = к*, оно переключается (пепеходит скачком)
на стационарный уровень:
с* = / (Л*) - АЛ*. (16.2 41)
1 Здесь рассматривается рост и убывание как функции от t.—
Прим. пере».
480
Рис. 16.4. Траектории оптимального экономического роста на
фазовой плоскости при постоянной предельной полез-
ности.
Следовательно, траектория оптимального роста асимп-
тотически приближается к единственной седловой точке
равновесия (к*, 1):
lim fc* (t) = к*
<-►00
lim 5* (f) = l (16.2.42)
<-*оо
lim e* (f) = c*.
<-►00
В последнем варианте основной задачи промежуток
времени ограничен и предельная полезность постоянна.
В этом случае обсуждавшееся выше магистральное свойст-
ство строго выполняется, т. е. если достаточно велико?
490
Рис. 16.5. Оптимальяые траектории при постоянной предельной
полезности (t* > to* < fc* < М-
то существуют t* > t0 и t** > 0 такие, что
к* (t) = к* для всех t, t* — t**. (16.2.43)
Если k0 <Z к* <Z то, как показано на рис. 16.5,
капиталовооруженность рабочего на оптимальной траек-
тории сначала возрастает до к*, некоторое время сохра-
няется на этом уровне, а потом постепенно увеличивается
До ki.
16.3. ДВУХСЕКТОРНАЯ МОДЕЛЬ РОСТА
Обобщением неоклассической модели роста является
двухсекторная модель роста. В этой модели рассматрн*
ваются два сектора с различными технологиями произ-
водства продукции [22, 23, 24, 25]. Обычно в одном
из секторов производятся однородные капитальные блага
(средства производства), а в другом — однородные потре-
бительские блага (предметы потребления).
491
Если Yc (t) — выпуск потребительских благ во время t,
a YT (<) — выпуск благ, идущих на капиталовложения,
то валовой национальный продукт, соответствующий
времени t, равен
У (0 = Ус (0 + pYT (f), (16.3.1)
где р — цена средств производства в единицах предметов
потребления.
Каждый сектор в процессе производства использует
для выпуска продукции два фактора — капитал и рабо-
чую силу. Выпуск определяется производственными функ-
циями
Уу = F} (Kh Lf), j = С, I, (16.3.2)
где К} (t) — величина капитала в секторе j, a Lj (t) —
труд, используемый в этом секторе. Каждая производ-
ственная функция F] (••) удовлетворяет неоклассическим
условиям, аналогичным (16.1.3) и (16.1.4). В производ-
ственную функцию не входят внешние параметры,
т. е. выпуск одного сектора непосредственно не зависит
от выпуска или затрат в другом секторе.
Факторы производства однородны и могут свободно
перемещаться из сектора в сектор. Предположим, что
оба фактора используются полностью, т. е.
xo(0+x,w-xw (i63
L€ (i) + L, (I) - L (i).
Здесь К (f) и L (t) — значения имеющихся в наличии
в момент t общих объемов капитала и рабочей силы.
Общий объем капитала расширяется за счет капитальных
вложений и подвергается изнашиванию с постоянной
нормой амортизации р:
К = Уг - (16.3.4)
В то же время численность рабочей силы возрастает
с постоянным темпом п:
L = nL. (16.3.5)
Модель можно сформулировать, рассматривая значения
капитала и выпуска, приходящиеся на одного рабочего,
так как предполагается, что в производственной функции
отдача на масштаб йроизводства постоянна. Тогда
-гг-МтЬ1)-^')'
(16.3.6)
Здесь кс и kt— значения капиталовооруженностей по сек-
торам, т. е. ,
kj = -^- ^0, j^C, I. (16.3.7)
Производственные функции f} (к}) удовлетворяют усло-
виям, аналогичным (16.1.10).
Через lj обозначим долю всей рабочей силы, которая
относится к сектору /:
1с + li = 1-
Тогда потребление на одного рабочего выражается как
Ус = -^ = /с/с(М. (16.3.9)
а капиталовооруженность рабочего равна
yI = ^- = hfI(kI). (16.3.10)
Валовой национальный продукт, приходящийся на одного
рабочего, равен
У = Ус + РУг- (16.3.11)
Общая капиталовооруженность рабочего во всей экономике
равна
k = ~=kclc + kili. (16.3.12)
Следовательно, согласно (16.3.4),
к = уг — кк, (16.3.13)
где к = р, + п, как и ранее.
Задача об оптимальном экономическом росте для двух-
секторной модели в случае, когда рассматривается беско-
нечный промежуток времени и постоянная предельная
493
павеаность, состоит в выборе таких траекторий {/г (;)},
{Zc (*)}, {*г (t)} и {к0 («>}, что
max W — j е~6^~*^ус dt
to
к = У! — АА
к (to) — ко
Ус = Zc/c (кс)
Ут — lifi(kt)
lt + lc = i
к = kjlf “f" kclc
Zj, Z^, /cj, kc 0
(16.3.14)
lt (t), lc (0> kj (t), kc (t) — кусочно-непрерывные функции.
Здесь к — фазовая переменная, lz, 1С, кг и кс — управ-
ляющие параметры, fc (•) и/г (•) — строго вогнутые функ-
ции, a t0, 6 и к0 — заданные параметры.
Можно получить решение этой задачи, предположив,
что в экономике существует свободная конкуренция.
В конкурентной экономике доход от используемых в про-
изводстве факторов одинаков во всех секторах и равен
их предельным продуктам. Пусть производятся оба вида
благ. Обозначим через w конкурентную ставку заработной
платы, а через г — конкурентную оплату капитала, причем
w и г определяются в единицах потребительского блага.
При дифференцировании производственных функций
Yj = Ljfj (kj/Lj), j — С, I получаем, что
T = -^=tc(kc), г = р-^ = рЪ(кт),
w = ^ = fc (кс) - fcc/c (кс), (16.3.15)
w==p = р V1 ~ W1 (к^-
Если отношение ставки заработной платы к оплате
капитала обозначить через со:
® = у-, (16.3.16)
то в конкурентной экономике
<1в-ЗЛ7>
Это соотношение проиллюстрировано на рис. 16.6.
494
Рис. 16.6. Отношение заработной платы к оплате капитала «,
где <в = -£Ц^|-—fcy.^ = C, Z.
tj (kj) '
Функция <о (kj), определенная как
k}, i = C, I, (16.3.18)
Tj \Kj)
монотонно возрастает:
da _
dkj
tj (kj) f- (kj)
[fj(kj№
(16.3.19)
Поэтому можно найти обратную функцию, получив тем
самым конкурентную капиталовооруженность рабочего
в обоих секторах как функцию от отношения заработной
платы к оплате капитала:
fcy = kj (со), kj (со) > 0, j = С, I,
(16.3.20)
причем из условий, которым удовлетворяет производствен-
ная функция, следует, что
kj (0) = 0, kj (оо) = оо. (16.3.21)
Таким образом, каждому неотрицательному значению
со соответствует в каждом секторе единственное отношение
капитала к труду. Условимся далее, что или в секторе
495
производства потребительских благ капйтал используется
интенсивнее, чем в секторе производства капитальных
благ при любом положительном со, т. е.
fcc (м) > (м) Для всех 0 < <л < оо, (16.3.22)
или же капитал используется интенсивнее в секторе про-
изводства капитальных благ при любом положительном
со, т. е.
А/ (со) > кс (со) для всех со, 0 < со < оо. (16.3.23)
В частности, исключены такие случаи, когда для неко-
торых со кс (со) > кг (со), а для других со кс (со) < кг (со)
(перемена интенсивностей фактора).
Так как кс =/=к1г то из системы двух уравнений
li + lc = 1, kih + кс1с = к (16.3.24)
всегда можно найти lt и 1С
(16.3.25)
кс — v kc—ki v '
Отсюда
Кроме того, из условия о наличии свободной конку-
ренции следует, согласно (16.3.15), что если производятся
оба вида благ, то цена благ, идущих на инвестиции, опре-
деленная в единицах потребительских благ, является
функцией от отношения заработной платы к оплате капи-
тала со:
Гс(кс (<о)) „
р^ = /ИМ*)) • (16-3-27)
Запишем это выражение в логарифмах, а затем продиф-
ференцируем, используя (16.3.18) и (16.3.19),
log р (со) = log f'c (кс (со)) — log fi (^ (со)) (16.3.28)
1 dp _ 1 1
Р d<o kj (со) + со кс (<в) + <о "
Полученное выражение положительно (отрицательно), если
кс > (<) кг.
496
До сих пор предполагалось, что производятся оба вида
5лаг. Если экономика специализируется на проиаводстве
5лаг для капитальных вложений, то
ц = 1, 1С = О,
/с/ = /с, к с ~ О,
Vi = fl (ty, Ус = 0.
(16.3.30)
Если же она специализируется на производстве потреби-
тельских благ, то
h = 0,
кг = 0,
Vi = о,
1с = 1,
кс = к,
Ус = fc (&)•
(16.3.31)
Зависимость между специализацией и отношением зара-
ботной платы к оплате капитала со показана на рис. 16.7.
Предполагается, что kj (со) < кс (со) для всех поло-
жительных со. Следовательно, кс к и kj к в силу
условий (16.3.24), неотрицательности lt и 1С и предпо-
ложения, что кс > kj. Экономика специализируется
на производстве капитальных благ, если
(16.3.32)
и на производстве потребительских бййг, если
(16.3.33)
Таким образом, на рис. 16.7 специализация происходит
на одной из кривых, а одновременное производство обоих
благ происходит в области, заключенной между ними.
Границей эффективного производства при фиксирован-
ном уровне капиталовооруженности рабочего к называется
геометрическое место точек (уг, ус), в которых выпуск
одного из видов благ, приходящийся на одного рабочего,
достигает максимума при фиксированной величине выпу-
ска другого блага на одного рабочего. Выражение для
этой границы в параметрической форме получим, исполь-
зуя (16.3.9), (16.3.10) и (16.3.25),
32-0270
497
Р ЛА. ДбЛ.ЧИроизводятся оба двда продукции,
< <в < а>! (к). Производится только еавдьиддмюдуку
ции, если <в = Ш/ (к), или со = <ос~(Л]..
где kj = kj (со) и со меняется от <ос (к) до coz (к). Если
оба блага производятся, тоотнрщение цен р равно абсо-
лютной величине тангенса угла^Шклона границы эффек-
тивного производства:
, (16.3.35)
аУ1 *1
Это показано на рис. 16,8. Еслр, $днако, экономика спе-
циализирована G на ироДЗДОДСТДС , капитальных благ,
то и = со/ (к) х.
р<^. (16.3.36)
Если экономика; специализирована на произивдсиве потрее
бительских благ, то со = а>с (к) и
. (16.3.37)
h
Точки специализации на рис. 16.8 находятся на пере-
сечении границы эффективного производства с осями коор-
динат.
498
Рис. .1(5.8. Граница эффективного производства.
I — В этой точке экономика специализируется на
производстве только потребительских благ
(Р > fcHi).
dyc
II-------------где р—отношение цен.
dyi fl
III — Граница эффективного производства
IV — Допустимые комбинации выпускаемых продук-
тов.
V — В этой точке экономика специализируется толь-
। ко на производстве капитальных благ (р <С
< /с//Ъ-
Задачу об оптимальном экономическом росте (16.3.14)
можно теперь сформулировать с помощью со следующим
образом:
ОО
max ГК— ( е-«0-<о) (Л—fc(kc)dt,
{«(О), £ \ ice —k! /
i * FO
Mis?)''(*')-**’
k (t0) = к0, kj = kj (со), j = С, I, (16.3.38)
®С (&)^ 0)^(0/ (к),
<0 (t) есть кусочно-непрерывная функция.
32* 499
Здесь, как и ранее, к есть фазовая координата, но теперь
управляющим параметром является отношение заработ-
ной платы к оплате капитала со. Прежде всего условимся,
что кс (со) > кт (со) для всех со, как на рис. 16.7.
Функция Гамильтона для этой задачи имеет вид
в-«-«'-*>{(^=%-)мад+
+4 (тКГ'<*'>-“]} <1М-39>
где q (t) — сопряженная переменная. Канонические урав-
нения записываются как
,=<>.+в)1с (ад+/, (ад, (16.3.40)
причем q (t) снова можно интерпретировать как теневую
цену капитальных вложений.
Оптимальное значение ю должно максимизировать
гамильтониан Н[ или, что эквивалентно, Не6^-^,
но, используя приведенные выше соотношения, получаем
^(^<‘-‘»)) = (g/i(.)-/c(-)]x
I \ кс-кт /
7 кс-—к
\ кс — кт
В этом выражении второй сомножитель всегда положи-
телен. Таким образом, если первый сомножитель положи-
телен, т. е. если
(16.3.41)
9
(16.3.42)
то Н достигает максимума при со = сог (А) и производятся
только капитальные блага. Если же
/с(-)
(16.3.43)
то co = юс (к) и производятся Только потребительские
блага.
500
Если
(•)
fit ) '
(16.3.44)
то <вс (&)<«>< <ог (к) и производятся оба вида благ.
В этом последнем случае специализация отсутствует,
учитывая (16.3.17), можно написать каноническое уравне-
ние для сопряженной переменной из (16.3.40) в следую-
щем виде:
д = [(Х +6}(16.3.45)
В этом случае^ однако,
(©))
<16-3-46)
так что
Я i dp ‘
— = — (0.
g р а®
Используя (16.3.29) и (16.3.45), получаем
Л + 6-/НМа))
(16.3.47)
(16.3.48)
кт (<в) + <о кс (<о) + <о
Итак, если экономика не специализирована на про-
изводстве одного из благ, то дифференциальные уравнения
для фазовой и. сопряженной переменных принимают вид
Й'= (f ) /г (ki (“)) ~
\ кс(<й) — / ,L v 1 v п
co = -—j-----------j—- • (16.3.49)
Aj(<o)H-<° ^c(w)+®
Траектория сбалансированного роста, на которой к и <о
стационарны, существует и единственна при <о = со*, к = к*,
причем
Л(М“*)) = М6
7 * _______кс (<о*) fi {к[ (<о*))_ (16.3.50)
fi (кг (<о*)) + к (кс (<о*) - кг (©*)) •
Такий? образом, значения координат точки равновесия
(к*, а*)это те единственные значения капиталовоору-
-501
P Й'С-. 16.9. Определение на фазовой плоскости траекторий сбалан-
сированного роста в двухсекторной модели (кс (ш) >
> к/ (<о) при любых со).
женности и отношения заработной платы к оплате капи-
тала, по достижении которых экономика всегда будет
поддерживаться на неизменном оптимальном уровне.
Динамическое поведение неспециализированной двух-
секторной экономики, описываемое уравнениями (16.3.49),
можно показать на графике в фазовой плоскости (рис. 16.9).
Этот график построен на основе рис. 16.7. На горизон-
тальной прямой <в = со* не происходит изменений <о,
а на кривой к = к (<в), определяемой выражением
А: (о) = ( и > (16.3.51)
не происходит изменений к. Прямая и кривая пересекают-
ся в точке равновесия, соответствующей сбалансирован-
ности росту, где со = со* и к = к (со*) = к*. Направ-
ления изменения переменных показаны стрелками: ы воз-
растает (убывает), если со больше (меньше) со*, тогда как
к возрастает (убывает), если к меньше (больше) к (ы). Опти-
мальная траектория роста показана па рис. 16.9 волни-
стой линией. Если начальное значение капиталовоору-
женности меньше АД то сначала экономика .будет специа-
5D2
лизироваться на производство капитальных благ, пере1
мещаясь по кривой (со), на которой возрастают к и со.
Когда к достигает значения к*, то со = со*. Далее, в эко-,
номике будет осуществляться оптимальное производство
обоих продуктов, причем со = со*, и экономика асимпто-
тически приближается к состоянию сбалансированного
роста. Аналогично, если начальное значение капитало-
вооруженности больше кс, то оптимальная траектория
проходит сначала через точки, в которых имеет место
специализация на производстве потребительского про-
дукта вплоть до достижения кс- После этого начинается
производство обоих продуктов при постоянном значений
а = й* и убывании к до к*. Поэтому для любого началь-
ного значения к траектория оптимального роста асимпто-
тически приближается к точке равновесия (к*, со*), соот-
ветствующей сбалансированному росту.
После рассмотрения случая, когда кс (со) > кт (со)
при всех со, перейдем к рассмотрению случая, в котором
капитал в секторе капитальных благ используется интен-
сивнее, чем в секторе потребительских благ, т. е. кс (со) <<
< kf ((d) при всех (D. График в фазовой плоскости для
этого случая изображен на рис. 16.10. Точка (к*, со*) —
Рис. 16.10, Определение на фазовой плоскости траектории сба-
лансированного роста в двухсекторной модели
(Л/ (со) > (со) при любых со).
вновь точка равновесия, соответствующая сбалансирован-
ному росту. Но здесь, как и в предыдущем разделе, точка
равновесия является седловой точкой. Единственная опти-
мальная траектория сбалансированного роста, располо-
женная вблизи точки равновесия, проходит по ветви
устойчивости, изображенной на рисунке волнистой ли-
нией. Однако, как и в предыдущем случае, если началь-
ное значение капиталовооруженности рабочего очень мало
или очень велико, то сначала возможен период специали-
зации. В частности, если к0 < к**, то сначала происходит
специализация на производстве капитальных благ, после
чего следует движение без специализации по ветви устой-
чивости от kJ*. Если же к0 > кс*, то первоначальная
специализация на производстве потребительских благ
сменяется движением без специализации по ветви устой-
чивости от кс*. Итак, волнистая линия на рис. 16.10
отмечает траекторию оптимального роста.
Таким образом, в общем случае двухсекторная модель
роста дает только одну траекторию оптимального роста
капиталовооруженности рабочего и отношения заработной
платы к оплате капитала {к* (/)} и {со* (£)}. При этом
сначала может быть период специализации на производ-
стве капитальных (потребительских) благ в зависимости
от того, достаточно ли мало (велико) начальное значение
капиталовооруженности. Но, начиная с некоторого момен-
та, специализация временно прекращается и траектория
асимптотически приближается к точке равновесия, соот-
ветствующей сбалансированному росту
lim к* (t) — к*, lim a* (t) = а>*.
(-*>00 t-*oo
(16.3.52)
Уровни капиталовооруженностей в секторах стре-
мятся к пределам, равным к* = kj (<в*), кс = кс (о*),
а уровни выпусков на одного рабочего стремятся соответ-
ственно к
ь*___ь*
kf, —к*
(16.3.53)
16.4. НЕОДНОРОДНЫЕ КАПИТАЛЬНЫЕ БЛАГА
В предыдущем разделе была обобщена неоклассическая
модель роста на случай существования различных техно-
логий производства. В этом разделе та же модель обоб-
щается на случай, когда имеются различные виды капи-
тальных благ [26, 27, 28, 29, 30, 9, 18].
В простейшем случае имеются два вида капитала
и (однородный) труд. Выпуск, определяемый затратами
факторов производства, может использоваться или для
потребления, или для инвестиций. Имеющиеся техноло-
гические способы могут быть описаны в форме границы
производственных возможностей:
С = Ф(Ь, Alt К2, Ki + itKi, А2+рА2). (16.4.1)
Здесь С (/) — это (максимально возможное) потребление
в момент времени t, при следующих затратах факторов
производства: труда L (£), капитала типа 1 Ki (t) и капи-
тала типа 2 К2 (/). Часть выпуска, которая идет на уве-
личение капитала типа 1, равна К^ + pAj (/), часть,
которая идет на увеличение капитала типа 2, равна
А2 (0 + рА'г (/). Здесь р — общая норма амортизации
капитала. Справедливы следующие предположения: уве-
личение затрат какого-либо фактора влечет за собой уве-
личение потребления, тогда как за увеличением величины
одного из двух типов валовых капиталовложений следует
уменьшение потребления:
•£><•• ^>4
°* <„, (16Л2>
d^i + pXi) й(К2 + рЯ2) .
Предположим далее, что при увеличении затрат сразу
всех трех факторов производства и валовых капиталов
вложений в одинаковой пропорции потребление также
увеличивается в той же пропорции, т. е. функция Ф (.)
есть однородная функция со степенью однородности, рав-
ной 1, т. е.
аС =*Ф (aL, aKi, ЧК2, a (Kt + рАл),
а (Кг + ИА2)) (16.4.3)
Ьо!>
для всех а>'0. Беря а лолучг®»
^2 К, К\ Ка
~Г ’ ~Т * t* Т4» "Г- +^’4^)
(16.4.4)
шли
с =- <р (kt, k2, ki + kki, k2 + kk2), (16.4.5)
где c — потребление на одного рабочего, kt — капитало-
вооруженность рабочего i-м типом капитала, 1 = 1, 2,
а л = р, + п — сумма темпа роста рабочей силы и нормы
амортизации капитала х.
Положим
Z1 = ki + X/Cj, z2 = k2 + Xk2. (16.4-6)
Тогда потребление на одного рабочего, согласно (16.4.5),
равно
с — ф {k\, k2, zb z2).
При этом, согласно (16.4.2),
Ф1 = -^>0, Фг = -^>0,
Ф,=-^<0, ф«-=-^<?о.
vZj C/Z2
(16.4.7)
(16.4.8)
Задача об оптимальных накоплениях с неоднородными
капитальными благами состоит в выборе траекторий
{Zi (t)) и {z2 (£)}, таких, чтобы
tt
Ji ’ИП
[ф^ zlt z2)l di +,jj 8
to >!Ы
±F{ki{ti)„^(ti)), (16.4.9)
ki - Zi — ).kf, k2 = z2 —- kk2,
•>₽
kt (0) = kiQ. k2 (0) = k20.
Первое слагаемое в выражении для благосостояния — это
дисконтированное значение полезности потребления за про-
межуток времени от 10 до tr, а другое слагаемое — вели-
чина конечного капитала в момент времени Его можно
использовать для производства потребительских благ
за пределами рассматриваемого промежутка времени.
1 Но смешивайте К, и К2 с Кс и Kt, рассматриваемые в разде-
ле 16.3. Первые (К, и К2) — это капитальные фонды двух типов,
а последние — капитальные фонды, используемые в двух разных
ректорах.
5Q6
Поставленная задача — это задача управления, в кото-
рой и есть фазовые координаты, a Zj и z2 — управ-
ляющие параметры. Эту задачу можно решить с помощью
принципа максимума.
Введем две сопряженные переменные qx и qz и напи-
шем гамильтониан
Я = {U [ф (кь кг, Zi, z2)] + 91 (Z1- kkt) +
+ g2(z2 — ккг)}. (16.4.10)
Сопряженные переменные можно интерпретировать как
теневые цены капитальных вложений каждого из двух
типов капитала. Для того чтобы гамильтониан достигал
максимума по и z2, необходимо, чтобы
91 — U’ (с) ф3, q2 = — U' (с) ф4, (16.4.11)
если решение является внутренним. Канонические урав-
нения для сопряженных переменных имеют вид
или
91 = (X + 6) 9i — U' (с) ф1,
91 = (Л + 6) 9г — U' (с) Фг
с граничными условиями
\ dF
91 dki (ti) ’
9* (М - дк2 (ti) •
Дифференцируя (16.4.11), получаем
9i = —U" (с) Фэе — U' (с) ф3
9г — —U" (с) ф4с — U' (с) ф4.
Используя (16.2.8), перепишем канонические
1 ( Ф1_ Ф1_(Х + 6))с
о (с) \ фз . фз ' '
(X-f-6)) С.
с(с)Ачч н 'г
(16.4.12)
(16.4431
(16.4.14)
(16.4.15)
уравнений
(16.4.16)
507
Следокйт^но,
ФЗ Ф1 ф4
фз фз ф4 ф*
(16.4.17)
Это основное условие эффективности, его можно выра-
зить через прибыль на капитал. Если своя собственная
норма прибыли для первого капитального блага равна
Г1 (16.418)
Фз дс , dkt 1 ' >
’ ---;---U X 1
д(к±+Щ) .
Но величина валового национального продукта равна
У = с + pi (к + Mei) + р2 (&2 4" £16.4.19)
где pi и р2 есть соответственно цены валовых инвестиций
на одного рабочего для капиталов типа 1 и 2, выраженные
в единицах потребления на одного рабочего. Следова-
тельно,
----3--------Фз. (16.4.20)
д (ki+Л/q)
Записав г2 и р2 аналогичным способом для второго капи-
тального блага, можно основное условие эффективности
(16.4.17) представить в виде
г1+Ь.-г!+А. (16.4.21)
Это соотношение показывает, что валовая прибыль, рав-
ная собственной норме прибыли плюс прирост за счет
капитала, должна быть одинаковой для обоих типов капи-
тала.
Рассмотрим теперь равновесие, при котором ~ 0
и к2 = 0, причем начальные условия для зцачений капи-
талов пока не будем принимать во внимание. В этом
случае, согласно (16.4.5),
с = <р (кг, к2, kki, ХЛ2), (16.4.22)
а поскольку все аргументы постоянны, jo с = 0. Следова-
тельно, все экстенсивные переменные'-^- К±, К2, С — имеют
508
одийаКовыё тейпы роста,' равные темпу роста рабочей
силы п. При таких условиях для того, чгобы с достигло
максимального значения при некоторых значениях
ki (= ki (0)) и (= к2 (0)), требуется, чтобы
или
_-П = Х=-^-. (16.4.24)
ФЗ Ф4 ' '
При этом основной условие эффективности (16.4.17)
выполнено, так как в этом случае ф3 и <р4 не зависят от вре-
мени Значениями к{ и к2, которые удовлетворяют этим
условиям, являются ki и к2 — уровни капшпаловооружен-
ностей золотого правила. Как и в случае одного капиталь-
ного блага, уровень капиталовооруженности золотого пра-
вила не удовлетворяет условиям оптимальности, если
норма дисконтирования отлична от нуля, так как тогда
при постоянном во времени значении с не выполняется
дифференциальное уравнение
; = _l_(il_JPL_(X + 6))c=--------(16.4.25)
а (с) \ фз фз ' ' / о (с) ' •
Равновесие, соответствующее сбалансированному росту,'
при котором к*, к*, с* остаются постоянными и удовлет-
воряют условиям оптимальности, определяется из следую-
щих условий
ki = 0, к2 = 0, с = 0,
с* = ф(/г*, к*, кк*, U*)
_ 1-6= — ф2 (16.4.26)
фз ' Ф4
Именно к этому состоянию сбалансированного роста асимп-
тотически приближается оптимальная траектория, если
рассматриваемый промежуток времени бесконечен. Если
промежуток времени конечен, то оптимальная траектория
обладает магистральным свойством по отношению к состоя-
нию сбалансированного роста: если достаточно велико,
то оптимальные траектории {к* (/)} и {к* (t)} сначала
изменяются от начальных значений (/с10, к20) в направ
509
Р иа Л Л!. Теорема о магистрали.
лении к точке равновесия (к*, к*), соответствующей сба-
лансированному росту, некоторое время остаются вблизи
нее и уходят от нее со временем только для того, чтобы
выполнялись условия на конечные размеры капиталов.
При сбалансированном росте
Kt = kiL, К2 - k2L (16.4.27)
величины ki и к2 постоянны и равны соответственно к*
и к*\ размеры капиталов возрастают темпом, равным темпу
роста рабочей силы
вдодв.луча
А Ц
(16.4.28)
(16.4.29)
Этот луч называется «магистралью». Если Zj достаточно
велико, то оптимальные траектории для Kl (t) и К2 (t)
перемещаются ол начальных значений к магистральному
лучу, находятся около него и уходят от него только
510
в конце рассматриваемого промежутка времени. Эта1?
результат, проиллюстрированный 1Ж« рис.' ;16.11, назьг
вается «теоремой о магистрали» Ч
ЗАДАЧИ
16-А. Докажите, что из предположений (16.1.4) и (16.1.5)
относительно производственной функции F (К, L) следует
справедливость условий (16.1.10) для производственной
функции на одного рабочего / (Л), где к = K/L.
16-Б. В модели экономического роста Харрода — Домара
отношения капитала к выпуску и отношения потребления
к доходу предполагаются постоянными и равными ИЬ
и у соответственно.
1. Какие из предположений моделиинеоклассййё-
ского роста здесь нарушены?
2. Найти темпы роста дохода на одного рабочего
и капиталовооруженности у/у и к‘к.
3. Рассмотрите свойства устойчивости этой модели.
16-В. Пусть в неоклассической модели роста зафикси-
ровано удельное потребление на одного рабочего с > 0
и не происходит амортизации капитала (ц = 0). Пока-
зать, что темп роста капитала g = К!К достигает макси-
мума тогда, когда темп роста равен предельному про-
дукту капитала, т. е. когда темп роста равен норме про-
цента. Проиллюстрировать графически и обобщить на слу-
чай, когда ц > 0.
16-Г. Рассмотрите золотое правило для каждой из про-
изводственных функций табл. 8.1.
16-Д. Докажите, что {с* (?)} и {к* (#)}, удовлетворяющие
(16.2.20), являются оптимальными траекториями задачи
о неоклассическом оптимальном экономическом росте
1 В работах Дорфмана, Самуэльсона и Солоу [27], Раднера [31],
Моришима [32, 33], Фуруя и Инада [34], Инада [35], Никайдо [36] и
Мак-Кензи [37] в отличие от материала, изложенного в разделе 16.4,
рассматривается задача Майера, в которой в целевой функционал
входят только конечные размеры наличного капитала. Кроме
того, рассматривается такая (условная) экономика, в которой для
производства продукции не требуется рабочая сила, уровень потреб-
ления равен нулю и задано соотношение объемов конечных капи-
талов.
511
(16.2.12) в том смысле, что еСйй ($} й (J)*} — это
любые Другие допустимые траМйЧНййй^, Ю ШЗ^А!
j e-«(t-io)J7 (с* (t)) dt > J e-^-^U (c* (0) dt.
to to
16-Е. В первом исследовании проблемы оптимального эко-
номического роста Рамсей обосновывал бесконечность рас-
сматриваемого промежутка времени (ti = сю) и отсутствие
дисконтирования (б = 0) этическими соображениями.
Поскольку интеграл благосостояния в общем случае
не сходится, Рамсей предложил другой подход. Он пред-
положил, что существует конечный верхний предел либо
для производственной функции, либо для функции полез-
ности. В каждом из этих двух случаев полезность ограниче-
чена некоторым конечным верхним пределом В, называе-
мым «.блаженством» (bliss)
В — max U (с) = (J (св).
Здесь потребление на одного рабочего на уровне «бла-
женства» является конечным числом. Затем он рассмат-
ривал целевой функционал
jpain R
М*»
(В — U [c(t)]) dt.
Этот подход имеет сходство с минимизацией «сожаления»
(«риска») в теории решений. Решите задачу Рамсея о мини-
мизации В в условиях неоклассической модели роста [7].
16-Ж. Решить неоклассическую задачу об оптимальном
экономическом росте, если, как и в предыдущей задаче,
ti = оо и б = 0, но благосостояние измеряется как накоп-
ленный избыток сверх значения полезности, соответствую-
щего золотому правилу, где
W = J [U (с (t)) — U(c (t)]dt,
о
с = / (к) - кк, г (к) = к.
Сравнить полученное решение р решением Задачи Рам-
сея [39, 10].
51Я
16-3. В неоклассической модели роста допустимая траек-
тория роста {с (t)}, {к (t)} для t0 t оо неэффективна
тогда и только тогда, когда существует другая допустимая
траектория роста {с' (Z)}, {к' (/)}, имеющая ту же самую
начальную капиталовооруженность и обеспечивающая
по крайней мере то же потребление на одного рабочего
в течение всего бесконечного промежутка времени и боль-
ший уровень потребления на одного рабочего на протя-
жении некоторой части этого периода, т. е.
с' (0 с (0,
с' (0 > с (z), t2, t1 < t2.
1. Показать, что неэффективные программы не могу^
быть оптимальными с точки зрения оптимизации
интеграла благосостояния.
2. Показать, что любая допустимая программа,
которая с некоторого момента времени поддерживает
значение капиталовооруженности выше уровня, соот-
ветствующего золотому правилу, является неэффек-
тивной. Иначе говоря, любая допустимая программа,
для которой при некотором е > 0 существует время t,
такое, что k(t)^k-\- е, tZ>t или, что эквивалентно,
/' (к (t)) — е, t t
является неэффективной. См. [10].
16-И. В современном подходе к задаче с неограниченным
интегралом благосостояния, когда tr = оо и 6 = 0, вво-
дится критерий «превосходства», по которому траектория
потребления на одного рабочего с1 (t) превосходит траекто-
рию потребления на одного рабочего с2 (t) тогда и только
тогда, когда существует время Т* такое, что [40, 10]
т т
J J U^(f))dt
для всех Т Т* (см. [40, 10]).
1. Доказать, что критерий превосходства является
рефлексивным и транзитивным.
2. Показать на примере, что существуют две про-
граммы потребления, ни одна из которых не превосхо-
дит другую.
33-0270
Ж
16-К. Получить решение неоклассической задачи об опти-
мальном экономическом росте, используя фазовую пло-
скость (к, q), а не плоскость (к, с), приведенную на
рис. 16.3 (указание: найти множество точек, где к = О,
геометрически, используя четырехмерное представление,
когда осями являются к, q, U' (с), с).
16-Л. Рассмотрим две следующие альтернативные возмож-
ности изменения условий в неоклассической модели роста:
1- /'(&)> X + 6 для всех /с > 0;
2. /' (0) < X.
В каждом из этих двух случаев вывести условия золо-
того правила и исследовать решение неоклассической
задачи об оптимальном экономическом росте.
16-М. В неоклассической задаче об оптимальном экономи-
ческом росте с конечным временном горизонтом и постоян-
ной предельной полезностью магистральное свойство
выполняется строго, т. е. если достаточно велико,
но конечно, и ст = О, то
к* (£) = к* для — £**.
1. Опишите, как вычисляются t* и t**.
2. Найдите в цвной форме решение для случая,
когда отношение капитала к выпуску постоянно
и / (к) = Ък.
16-Н. Коэффициент накоплений — это доля накоплений,
идущих на инвестиции в общей сумме дохода:
I к+у.к
С помощью этого понятия можно сформулировать неоклас-
сическую задачу об оптимальном экономическом росте
[41, 40, 42].
1. Выведите основное уравнение неоклассического
экономического роста с помощью s. Определите значе-
ние капиталовооруженности к и доли прибыли в доходе
а в точке равновесия:
rK 3F
а = где г = -5Г.
Определите, является' ли равновесие устойчивым,
и исследуйте чувствительность значений к и а в точке
514
раййбЁеСиЯ it иЭМенбнийм Параметров s и 1 = ц -р Й.
Каково значение з, соответствующее золотому пра-
вилу?
2. Интеграл благосостояния можно записать с помо-
щью коэффициента накопления:
ti
W= J
to
Предположим, что s постоянно во времени. При
каком значении з достигается максимум W?
3. Обычно максимум W находят, выбирая функции
времени для коэффициента накоплений {з (/)}, где
О^з (0^1- Покажите, что без специальных пред-
положений относительно вида функции полезности
и производственной функции невозможно добиться
того, чтобы оптимальная функция s (Z) всегда воз-
растала (или всегда убывала).
4. Отыщите оптимальную траекторию (функцию
времени) для {s (Z)}, если производственная функция
имеет вид
f (fc) — Ък,
а функция полезности имеет вид
с1~а
U(c} = -.--,
' ' 1—0 ’
где b — постоянное положительное отношение капи-
тала к выпуску, а а — постоянная положительная эла-
стичность предельной полезности.
5. Обобщите (4) на случай функции Кобба — Дуг-
ласа, т. е. когда
/ (к) = Ька, Ь^>0, 0<а^1.
16-0. В «обратной» задаче оптимизации траектория потреб-
ления {с (t)} задана, а задача состоит в определении класса
целевых функционалов, для которых эта траектория опти-
мальна. Решите обратную задачу оптимизации для нео-
классического случая с производственной функцией
Кобба — Дугласа, где / {к) = Ака, а отношение накоп-
лений постоянно, з = з С а [18, 43, 44].
16-П. Предположите, что функция полезности в неоклас-
сической задаче об оптимальном экономическом росте
33* 515
(16.2.15) зависит от благосостояния, измеряемого яелйчи-
ной капиталовооруженности, так же как и от потребления
на одного рабочего, так что функционал благосостояния
имеет вид
ti
W = [ e-6(t-to)U(c,k)di
4
atz Q dV о
дс ’ дк >
Покажите, что может существовать множество стационар-
ных решений. См. [45].
16-Р. В неоклассической модели роста с техническим про-
грессом производственная функция имеет вид
Y (0 = A (0 F [В (0 К (t), С (0 L (0].
Здесь функция А (0 характеризует технические нов-
шества, способствующие увеличению выпуска продукции,
В (0 характеризует технические новшества, способствую-
щие росту капитала, и С (0 характеризует технические
Новшества, способствующие росту рабочей силы [10, 4, 42].
1. Покажите, что единственным видом технического
прогресса, согласующегося с равновесием сбалансиро-
ванного роста, является технический прогресс, способст-
вующий только росту рабочей силы (технический про-
гресс, нейтральный по Харроду). Получите решение для
неоклассической задачи оптимального экономического
роста в случае, когда А (0 = В (0 = 1 и С (0 = е&.
2. Получите решение для неоклассической задачи
об оптимальном экономическом росте в случае, когда
технические новшества способствуют только увеличе-
нию выпуска (технический прогресс, нейтральный
по Хиксу), когда А (0 = eat и В (0 = С (0 = 1.
3. Получите решение для неоклассической задачи
об оптимальном экономическом росте в случае, когда
технические новшества способствуют только росту
капитала (технический прогресс, нейтральный
по Солоу), когда А (0 = С (0 = 1 и В (0 = e₽f.
16-С. Если неоклассическая модель включает иностранную
помощь, то основное дифференциальное уравнение эконо-
мического роста имеет вид
к — f (к) — кк — с + а,
где а размеры помощи на одного рабочего. Покажите
516
графически, при каких условиях страна может достичь
роста только с иностранной помощью. Полагая, что
начальный капитал пренебрежимо мал и производствен-
ная функция является функцией Кобба — Дугласа, опре-
делить, как долго должна продолжаться помощь, чтобы
экономика страны смогла достичь состояния, при котором
возможен самостоятельный рост.
16-Т. Если неоклассическая модель включает иностранные
займы, то уравнение дохода принимает вид
Y = С + I + (X - М),
где X обозначает экспорт, а М — импорт. Однако,
в соответствии с уравнением платежного баланса,
X +D = М + pD,
где размеры иностранных кредитов D и величина про-
цента по этим кредитам р считаются заданными.
1. Напишите основное дифференциальное уравне-
нение экономического роста для этого случая, считая,
что размер иностранного кредита на одного рабочего
равен d.
2. Найдите траекторию оптимального экономиче-
ского роста, максимизирующую функционал
W = j е-б(‘-‘о)?7(с, d)dt
to
при условии, что
*L>0 ^-<0
dU п п d2U _ п
dd 5d2 dcdd ~
Управляющими параметрами являются потребление
па одного рабочего с, причем (к) и скорость
изменения величины иностранных кредитов, приходя-
щихся на одного рабочего, d = и, причем О^н^Пщах-
16-У. В неоклассической модели со свободной конкурен-
цией ставка заработанной платы в условиях равновесия
равна предельному продукту труда. Так как F (К, L} —
= Lf (K/L) — Lf (к), то ставка заработной платы в усло-
виях равновесия равна
517
Следовательно,
-^=-W)>o,
т. е. чем больше значение капиталовооруженности рабо-
чего, тем выше заработная плата в условиях равновесия.
В условиях неравновесия с меняющейся заработной платой
заработная плата будет стремиться к величине заработной
платы в условиях равновесия:
w = ^[w—(f(k)—kf (к))], 4>(£o) = O, ф'<0.
Предположим, что рабочие полностью используют свою
заработную плату на потребление. Покажите в плоскости
(к, w) значения к и w, соответствующие состоянию равно-
весия. Покажите возможные траектории к точке равно-
весия после эпидемии, которая вывела из строя значи-
тельную часть рабочей силы (капитал сохраняется на преж-
нем уровне). При каких условиях траектории наверняка
будут двигаться прямо к точке равновесия, а не закручи-
ваться вокруг нее по спирали?
16-Ф. В экономике с избыточной рабочей силой предло-
жение рабочей силы гибко реагирует на назначаемую
государством ставку заработной платы w. Если число
занятых рабочих в момент времени t равно L (t), то общая
сумма заработной платы равна wL (t). Общая сумма
заработной платы равна общему потреблению, если рабо-
чие не делают сбережений, а капиталисты не потребляют.
При равном посемейном распределении потребление
на душу населения одинаково для всех и составляет
c — -p-~wl,
где Р — численность всего населения, растущая темпом
п, а I — это доля работающих во всем населении.
Пусть к — капитал на душу населения, тогда дифферен-
циальное уравнение экономического роста имеет вид
к — F (к, I) — wl — кк,
где А = р. + п и &(f0) задано. Благосостояние опреде-
ляется так:
W = [ e-^-^U (с (0) dt.
518
Так как I — правильная дробь, а потребление не превос-
ходит выпуска (wl^.F (к, I)), то , -
• I (к, I) л\
OCZ^min —*-----~ ,11.
\ W /
1. Найдите оптимальную траекторию для I (t).
2. Обобщите модель на случай, когда допускаются
сбережения. Пусть s — это та доля выпуска сверх
выплаты рабочим, которая идет на образование капи-
тала (в предыдущем случае s = 1).
Найдите оптимальные траектории для s (I) и I (t) [46].
16-Х. Как и в предыдущей задаче, предположим, что
число занятых L (t) не обязательно совпадает с числен-
ностью всего населения Р (t). Пусть I (I) — доля рабо-
тающего населения (I (1) — j . Если к — капитал
на душу населения, ас — потребление на душу насе-
ления, то
k-F {к, 1)-с -кк.
Предположим, что функция полезности зависит не только
от с, но и от I, тогда интеграл благосостояния имеет вид
W±= J I) ch,
to
где .
dU . n &U . n »U n
•эГ>0’ -^г<0’ -аг(0»П = «>.
^.<-0 w <-0 d4J <0
dl ^U’ 5Z2 dcdl
»— об».
Найдите оптимальные траектбрйи для с (Z) и I (t) при
условии [47], что
O^c^F (к, Z), O^Z^l (см. [47]).
16-Ц. Согласно неомальтузианцам, темп роста числен-
ности рабочей силы зависит от уровня жизни, измеряе-
мого по потреблению на одного работающего. Найдите
уровень золотого правила и определите оптимальные
519
траектории экономического роста, еслй п = п (с), причем
п' (с) >0, п" (с) <_ 0.
16-4. Рассмотрим задачу о региональном распределении
капиталовложений в экономике, состоящей из двух райо-
нов. Пусть отношение выпуска Yj к капиталу Kj в /-м рай-
оне постоянно, т. е.
Y} = bKh j = 1, 2.
Если коэффициент накопления в районе / равен Sj, то
общий размер фондов для инвестиций равен
si^i + s2Y2 = giKi + g2K2,
где gj = Sjbj, j = 1, 2. Пусть 0 — доля инвестиционных
фондов, предназначенная для района 1, тогда, если пре-
небречь амортизацией,
К, = 0 (g^ + g2K2), К2 = (1 - 0) + g2K2).
Найдите оптимальную функцию времени (траекторию)
для {0 (<)}, 0^0 (<)^1, при которой достигается мак-
симум следующего интеграла благосостояния [47, 48, 49,
50]:
ti
W = j e-W-W [(1 - *0 btki + (1 - s2) 62fczl dt.
to
16-Ш. Задачу^ об оптимальном экономическом росте для
двухсекторной модели можно сформулировать с помощью
коэффициента накопления
О — •
1/
1. Сформулируйте задачу с помощью s.
2. Разберите задачу сравнительной статики для этой
модели. Определите влияние изменений значений к,
соответствующих уровню равновесия, на величины
Ус, gi, У и р при предположении, что s фиксировано
и производятся оба вида благ.
3. Решите задачу оптимального экономического
роста.
16-Щ. Обобщите анализ для двухсекторной модели
на случай, когда предельная полезность является убы-
вающей функцией, причем
'>
520
W = j e-ei'-W’Orc)*,
„7„х_ Усицус) й
° (Ус)----й^->0.
16-Э. В двухсекторной модели, в которой рабочая сила
свободно перераспределяется из одного сектора в другой,
а капиталы закреплены за секторами, уравнения движения
имеют вид
fcj = aljfj (kj) — JJtj, kj (0) = Л/о
fcc = (1 — a) Ijfj (kj) — “kkc, kc (0) = kc0-
Здесь a — доля валовых капиталовложений, направляе-
мых в сектор, производящий капитальные блага (О^а^
^1), и lj — доля рабочей силы, занятой в этом секторе
(O^Z/ ^1), являются управляющими параметрами.
1. Найдите управления, минимизирующие время
достижения максимально возможного потребления
на одного рабочего.
2. Найдите управления, максимизирующие
W=^e-^-^{i-h)fc(kc)dt.
*о
Приложение А
Анализ
А-1. Множества
Множество 1 — это любая совокупность объектов, называемых
точками или элементами. Примерами множеств могут служить
множество студентов в группе, множество всех четных чисел. Если
множество S состоит из точек а, Ь, с, то это записывается следую-
щим образом:
5 = {а, Ъ, с}, (АЛЛ)
причем порядок, в котором записаны элементы в скобках, не имеет
значения. Условие, что точка & принадлежит множеству S, a d
не принадлежит S, записывается так:
b£S, d$S. (АЛ .2)
Множество можно определить, указав некоторое свойство, общее
для всех его элементов. Так, множество А, определяемое выраже-
нием
А = {х С 5 IР (х)}, (А.1.3)
состоит из всех тех элементов множества S, которые обладают
свойством Р (х). Иногда в такой записи опускают символ большего
множества S.
Приводим некоторые важные примеры множеств: I =
= {1, 2, 3, . . .} — множество всех положительных чисел; Е —
множество всех вещественных чисел (геометрически — это множе-
ство всех точек вещественной оси); Q~ {х|х — р/д или х —
= —p/q, где д С I и либо р = 0, либо р 1} — множество всех
рациональных чисел;
0 — пустое множество, т. е. множество, не содержащее эле-
ментов.
Множество А является подмножеством множества В, что обозна-
чается как A cz В, в том, и только в том случае, если любая точка
множества А принадлежит также и В. Например, I cz Q, a Q с Е.
Множества Л иВ равны (Л = В) в том, и только в том случае, если
любая точка множества Л принадлежит также и множеству В,
и наоборот. Следовательно, Л = В тогда, и только тогда, когда Л
является подмножеством В, а В — подмножеством Л . Множество Л
1 Основная литература по теории множеств, а также по отно-
шениям и функциям [1, 2, 3, 4]. В качестве введения в теорию
множеств и в анализ см. [5, 6, 7].
522
называется собственным подмножеством множества В, если А пред-
ставляет собой подмножество В, не равное В.
Пусть множество А является подмножеством множества S
(в этом случае множество S называют «универсальным множе-
ством»). Множество А называется дополнением А до множества
S, если
A = {z£S|z$A}, (АЛЛ)
т. е. А содержит точки S, не принадлежащие А. Например, Q —
это множество всех иррациональных чисел.
Объединением подмножеств А и В множества S называется
множество точек, принадлежащих каждому множеству (или обоим
множествам). Объединение А и В обозначают символом A J Я:
A J В= {х g S | х £ А или х £ В]. (А.1.5)
Пересечением А и В называют множество точек, общих множе-
ствам А и В. Пересечение А и В обозначают символом A Q В:
АГ\В={х£3\х£Аих£В], (АЛ.6)
Множества А и В называются непересекающимися, если А f) В =
= 0. Примерами непересекающихся множеств являются любое
множество и его дополнение.
Множество точек А ~ В, состоящее из точек, принадлежа-
щих А, но не принадлежащих В, называется разностью множества
А и В:
А~ B={x£S\x£A и x£B]=Af]B. (АЛ.7)
Декартовым произведением А X В множеств А И В называется мно-
жество упорядоченных пар элементов А и В'.
АхВ={(а,Ъ)\а$А, Ь$В}. (АЛ.8)
Совокупность элементов (а, ft) является упорядоченной парой тогда,
и только тогда, когда из соотношения (а, Ь) = (а', &') следует, что
а = а', Ь—Ь'. Например, если А = {1,2,3}, 5 = {1,6}, то А хВ = {(1,1),
(1,6), (2,1), (2,6), (3,1), (3,6)}. Декартово произведение мно-
жества А самого на себя — это А х А= А2. В частности,
Е2 — множество всех упорядоченных пар вещественных чисел,
или геометрически, множество всех точек на евклидовой плоскости.
Трехмерное евклидово пространство Е3 есть Е X Е2, а евклидово
«-мерное пространство Еп есть Е X Е71"1. Другими словами,
оно представляет собой множество всех упорядоченных наборов
из п вещественных чисел:
Еп= {х | х = (xj, х2, ..., хп), где Xj g Е, j = i, 2, ..., п}. (А.1.9).
А-2. ОТНОШЕНИЯ И ФУНКЦИИ
Отношением В называется подмножество декартова произведе-
ния X X Y, в котором при любых фиксированных х £ X и у £ Y
выполняется следующее
хВу тогда, и только тогда, когда (г, у) С Я
хВу тогда, и только тогда, когда (х, у) $ Я. (А.2Л)
523
Примерами отношений, определенных на Е2, являются =, >,
примерами отношений на множестве Р2, где Р — множество, состоя-
щее из всех людей, являются отношения «быть отцом» или «быть
братом»; примерами отношений, определенных на S2, где S —
семейство множеств, являются отношения с и =.
Отношение R, определенное на X2, называется совершенным,
если при любых х, у £ X имеет место либо xRy, либо yRx
(либо оба эти отношения). Отношение R на X2 называется транзи-
тивным, если при всех х, у, z £ X из xRy и yRz следует xRz. Отно-
шение R называется рефлексивным, если при всех х g X имеет
место xRx. Отношение R симметрично, если из xRy следует yRx',
асимметрично, если из xRy следует yRx', антисимметрично, если
из xRy и yRx следует, что х = у при любых х, у С X. Отноше-
ние называется отношением полуупорядоченности, если оно тран-
зитивно и рефлексивно.
Отношение называется отношением эквивалентности, если оно
обладает свойствами транзитивности, рефлексивности и симметрич-
ности. К отношениям эквивалентности относится отношение =.
Используя отношение эквивалентности R, можно строить классы
эквивалентности, то есть множества {х £ X | xRy}, где у С X —
некоторые заданные элементы X. Отношение называется отноше-
нием слабого порядка, если оно транзитивно, рефлексивно и анти-
симметрично, например отношения >. Отношение называется
отношением сильного (строгого) порядка, если оно транзитивно и
асимметрично, например отношение >.
Отношение /, определенное на X X Y, называется функцией,
если при любом х С X существует единственный элемент у С Y,
такой, что xfy, то есть, если (х, у) С f и (х, у’) С f, то у = у'. Следо-
вательно,
у = / (х) тогда, и только тогда, когда (х, у) £ /. (А.2.2)
Множество X называется областью определения функции, а мно-
жество У —областью значений функции. Образом функции назы-
вается множество точек области значений, которое можно получить,
используя данную функцию:
{у € Y | у = f (х) при некотором х£Х]. (А.2.3)
Функция называется «отображением на», если ее образ совпадает
с областью значений. Функция называется взаимнооднозначной, если
две различные точки никогда не отображаются ею в одну и ту же
точку:
f(x) = f(x') тогда, и только тогда, когда х = х'. (А.2.4)
Если функция / (х) представляет собой взаимнооднозначное отоб-
ражение на, то существует обратная функция f'1 (у). Это озна-
чает, что,
если f~i(y) = x, то y=f(x). (А.2.5)
Функция называется вещественной, если ее областью значений
является Е. Укажем некоторые примеры вещественных функций,
524
определенных на множестве вещественных чисел:
линейная функция: у^ах^Ь
Р
полиноминальная функция: у = aQ-^-aiX-j-aix2-^- ... -1-архР = а^
i=0
показательная функция: у=ах, где а>0
логарифмическая функция—функция обратная к показательной:
y = logaz.
Функцией п переменных называется вещественная функция,
определенная на «-мерном евклидовом пространстве. Такая функция
обозначается следующим образом:
У = f fa, х2, ..., хп) = f (х). (А.2.6)
Приведем некоторые примеры:
линейная форма:
п
У = а1ц+а2х2+ .. . +апхп = ajXj
з=1
квадратичная форма:, ы
у = atlx? + а22х% +... + аппх% Ц-2ai2nx2 + у,'1ГЬ 2ainXixn + ... =
П п
= Е S auxixh г№ аИ=аЦ-
i=l j=l
Функционал — это вещественная функция, определенная на неко-
тором множестве функций, т. е. область определения функционала
есть некоторое множество функций. Например, если в качестве
такого множества взять множество всех вещественных функций
х (/) одной переменной t, определенных на отрезке t0 t Ц, то,
у = sup х (t)
to^t^ti
Представляет собой функционал. Другим примером функционала
может служить известный в вариационном исчислении функционал
h
J{z(i)}= j Т (i(t),-^-(t),t)dt. (А.2.7)
to
Соответствием (точечно-множественным отображением) назы-
вается функция, которая отдельным точкам ставит в соответствие
множества. Множество <р (г) называется множеством, поставленным
в соответствие точке х.
Множество называется счетным, если существует взаимноодно-
значная функция, отображающая элементы этого множества в неко-
торое подмножество множества целых чисел. Например, для мно-
жества рациональных чисел такой функцией является f (р, ф) =
= 2Р39, следовательно, множество рациональных чисел счетно.
Множество S называется бесконечным, если существует взаимно-
однозначная функция между S и некоторым собственным подмно-
жеством множества S. Так, например, множество целых чисел бее-
525
КОВеЧйо, Поскольку функция у = 2z есть ВзаимнооднозиачЗДй
функция между множеством целых чисел и множеством четных
чисел.
А-3. МЕТРИЧЕСКИЕ ПРОСТРАНСТВА
Множество X является метрическим пространством *, если
на декартовом произведении X2 определена вещественная функция
d (х, у) называемая метрикой, такая, что для всех х, у, z из X выпол-
няются условия:
d(x, У)^>® и d(x< у) = 0 тогда, и только тогда, когда х — у,
d(x, y) = d(y, х)
d (z, z)<d (z, у)-|-d (у, z). (А 3.1)
Величина d (х, у) называется расстоянием между х и у. Евклидово
re-мерное пространство Еп является метрическим пространством
с евклидовым расстоянием между х = (zj, z2, . , хп) и у ==
= (У1, У2> •, Уп), т- е-
/ п
d(x, у) = 1/ 2 (х1~уА2- (А.3.2)
г з—1
Другим примером функции расстояния (метрики) в Еп или вообще
в произвольном множестве X является дискретная метрика, по ко-
торой d (х, у) = 1, если х не равен у, и d (х, у) =0, если х равен у
Если задано метрическое пространство X и расстояние d (х, у),
определенное на X2, то множество
Ме.&) = {у € X | d (z, у) < е}, (АЗ 3)
где 8 — некоторое положительное число, называется е-окрестно-
стью точки х f X Например, е-окрестностью точки х на веще-
ственной прямой Е, согласно (А 3 2), является {у £ Е | | х — у | < е},
где | х | — это абсолютное значение х, равное х, если х 0, и рав-
ное — х, если х < 0 В пространстве Е2 с евклидовой метрикой
е окрестность представляет собой внутреннюю часть круга радиуса
е с центром в точке х
Пусть А — подмножество метрического пространства Точка
х называется внутренней точкой А, если существует е-окрестность
х, содержащая только точки из А , т е.
(х) С А при некотором е > 0. (А 3 4)
Множество всех внутренних точек А — внутреннюю часть множе-
ства А — обозначим I (А)
I (А) С А.
Множество А называется открытым, если оно совпадает с множе-
ством своих внутренних точек, то есть если все точки А внутренние.
1 Основная литература по метрическим пространствам: 18,
9, 10].
526
В частность, ВСс е-оКреСтйОстй суть открытые множества Открытым
множеством является также открытый интервал (а, Ь) на веществен-
ной прямой, т о множество {iCL | а < х < 6} Множество
внутренних точек любою множества открыто, оно является «наи-
большим» открытым множеством, содержащимся в данном множе-
стве Иначе говоря, множество внутренних точек суть объединение
всех открытых множеств, содержащихся в данном множестве
Точка х является граничной точкой некоторого подмножества А
метрического пространства, если любая е окрестность х содержит
хотя бы одну точку из И и хотя бы одну точку, не принадлежащую
А, то есть
(л Г, .4 0, Ne(x) fl А ф & при любом е > О (А 3 5)
Границей В (А) множества А называется множество всех граничных
точек А Объединение А и границы В (А) называется замыканием
С (А) множества А Множество А замкнуто тогда, и только тогда,
когда оно равно своему замыканию, то есть тогда, и только тогда,
когда А содержит все свои граничные точки Примером замкнутого
множества может служить замкнутый промежуток [a, ft] веществен-
ной прямой, то есть множество {х £ Е | а х 6}, для которого
В ([а, 6]) = {а, 6} и I ([а, 6]) = {а, 6} Замыкание любого множе-
ства замкнуто, оно является «наименьшим» замкнутым множеством,
содержащим данное множество Иначе говоря, замыкание суть пере-
сечение всех замкнутых множеств, содержащих данное множество
Конечно, существуют множества, не являющиеся ни замкнутыми,
ни открытыми Таковы, например, полуоткрытые интервалы на ве-
щественной прямой — [а, 6) и (а, 6], т е множества {х £ Е | а
55: х < Ь} и {х £ Е | а < х Ь} Евклидово п мерное простран-
ство Еп и пустое множество 0 являются и замкнутыми и открытыми.
Пространство Еп обладает следующим свойством любое его под-
множество S имеет конечное или счетное подмножество, замыкание
которого содержит S
Подмножество А метрического пространства называется огра-
ниченным, если расстояние между любыми двумя точками из А
является конечным числом В противном случае А неограничено
Функция, область определения которой есть множество поло-
жительных чисел I, а область значений — метрическое простран-
ство X, называется последовательностью точек в X и обозначается
символом {хг}, где i £1 Последовательность {хг} сходится к х0
тогда, и то 1ько тогда, когда для любого е > 0 найдется целое число
N, такое, что если i > N, то d (хг, х0) < е Точка х0 называется
пределом последовательности {хг}, что записывается следующим
образом
хо=11шхг. (А.3.6)
г-+оо
Например, предел последовательности {1/г} равен 0 Пусть А —
подмножество метрического пространства. Точка х является пре-
дельной точкой множества А тогда, и только тогда, когда в А суще-
ствует последовательность попарно различных точек, сходящих-
ся к х
Множество А метрического пространства называется компакт-
ным, если в любой последовательности точек из А существует неко-
торая подпоследовательность, сходящаяся к точке, принадлежа-
527
щей А (свойство Больцано — Вейерштрасса). Множество является
компактным тогда, и только тогда, когда в любом семействе откры-
тых множеств, объединение которых содержит А, существует неко-
торое конечное подмножество открытых множеств, объединение
которых также содержит А (свойство Гейне — Бореля). Если А —
подмножество в Еп, то А компактно тогда, и только тогда, когда
оно замкнуто и ограничено. Примерами таких множеств являются
любой конечный замкнутый промежуток [а, 6] в Е и любая ограни-
ченная сфера (с включением границы) в Е3. Любое компактное под-
множество из Е содержит свою точную верхнюю границу, т. е для
любого компактного подмножества А существует вещественное
число х £ А, такое, что х является наименьшим из чисел, для кото-
рых у х при любых у g А.
Пусть область определения и область значений функции / (х)
являются подмножествами метрических пространств Тогда у0
является пределом функции / (х) при х, стремящемся к х0,
Уо — lim f(x) (А.3.7)
х-*х0
тогда, и только тогда, когда для любого е > 0 существует такое
число б > 0, что если 0 < d (х, х0) < 6, то d (f (х), уп) < в Иначе
и о является предлогом тогда, и только тогда, когда функция / (х)
принимает значения, сколь угодно близкие к у0, если х достаточно
близок к х0
Функция f (х) называется непрерывной в точке ха, если
lim f(x) = f(x0), (А.3.8)
X-J-Xo
т. е. если 0 < d (х, х0) < 6, то d (f (х), / (х0)) < е при любом е > 0.
Для того чтобы функция f (х) была непрерывной в точке х0, необ-
ходимо и достаточно, чтобы любой последовательности {х;}, схо-
дящейся к х0, соответствовала последовательность {/ (хг)}, сходя-
щаяся к / (х0) Функция называется непрерывной, если она непре-
рывна во всех точках своей области определения. Вещественная
функция / (х) называется полунепрерывной сверху в точке х0, если для
любого е > 0 существует такое 6 > 0, что если 0 < d (г, ха) < 6,
то f (х) < / (хд) е. Функция / (х) называется полунепрерывной
снизу в точке х0, если из тех же условий следует, что / (х0) — е <
< f (х) Следовательно, вещественная функция / (х) непрерывна
в точке х0 тогда, и только тогда, когда она полунепрерывна сверху
и снизу в точке х0’, вещественная функция непрерывна тогда, и толь-
ко тогда, когда она полунепрерывна сверху во всех точках (полу-
непрерывна сверху) и полунепрерывна снизу во всех точках (полу-
непрерывна снизу) Для того чтобы функция f (х) была полунепре-
рывна сверху, необходимо и достаточно, чтобы множество
{х | f (х) < а} было открытым при любом а, а для того чтобы f (х)
была полунепрерывна снизу, необходимо и достаточно, чтобы
{х | f (х) > а} было открытым при любом а.
Теорема Брауэра о неподвижной точке Если X — непустое,
замкнутое и ограниченное (компактное) выпуклое подмножество
пространства Еп, а / (х) — непрерывная функция, отображающая
X в себя, то существует хотя бы одна точка х* £ X, которая отобра-
жается сама в себя, т. е.
/ (х*) = х». (А3.9)
328
Точка х* называется неподвижной точкой функции /. Простым при-
мером, иллюстрирующим эту теорему, может служить любая попрей
рывная вещественная функция / (х) одной переменной, такая, что
О х < 1 и0</(г)<1. Всякая функция такого типа пересе-
кает прямую, образующую с осью абсцисс угол в 45° по меньшей
мере в одной точке.
Пусть <р (х) — соответствие, сопоставляющее каждой точке х
некоторого} подмножества X метрического пространства некоторое
подмножество (р (х) из X. Соответствие <р (х) называется полунепре-
рывным сверху в точке х0, если выполнено следующее условие:
пусть {х,} — произвольная последовательность точек, сходящаяся
к х0, тогда, если {уг} произвольная последовательность точек, схо-
дящаяся к у0, причем yt С <р (хг), г/о € <р (х0). Соответствие назы-
вается полунепрерывным снизу в точке х0, если для любой последо-
вательности {хг}, сходящейся к х0, и некоторой точки у0 С <р (х0)
существует сходящаяся к у0 последовательность {у,}, где
Уг Е <р (х;). Соответствие называется полунепрерывным сверху (снизу),
если оно полунепрерывно сверху (снизу) во всех точках своей обла-
сти определения; соответствие непрерывно, если оно полунепрерыв-
но и сверху и снизу.
Теорема Какутани о неподвижной точке. Если X — непустое,
замкнутое и ограниченное (компактное) выпуклое подмножество
пространства Еп, а <р (х) — соответствие, сопоставляющее точкам
из X подмножества из множества X, причем <р (х) полунепрерывно
сверху, то существует хотя бы одна точка х* £ X, такая, что
х*£<р(х*). (А.ЗЛО)
Точка х*, принадлежащая множеству <р (х*), в которое она отобра-
жается, называется неподвижной точкой соответствия.
А-4. ВЕКТОРНЫЕ ПРОСТРАНСТВА
Векторное пространство 1 V — это множество точек, называе-
мых векторами, для которых определены две операции: сложение
векторов и умножение вектора на скаляр. Сложением векторов
называется операция, которая каждой паре векторов (х, у) из V2
ставит в соответствие некоторый вектор х у множества V, назы-
ваемый суммой х и у, причем выполняются следующие условия:
х+У=У+х
x + (y+z) = (x + y) + ® (А,44)
х-|-0 = х
х+(-х) = 0,
где х, у, z — любые элементы множества V, 0 — некоторый един-
ственный элемент из V, называемый нулевым вектором (не смеши-
вать с числом 0!), а (—х) — некоторый элемент из V. Умножением
вектора на скаляр называется операция, которая каждой точке
1 Основная литература по векторными пространствам: [11,
12, 23].
34-0270
529
(a, x) из E X V ставит в соответствие ноюторую точку ах из 7,
называемую произведением скаляра а и вектора х, причем выпол-
няются следующие условия: . ,
<’(Х+У) = вх+«У
(а + Ь) х = ах -f- Ьх (А.4.2)
(аЬ) х = а (&х)
1х = х
при любых х, у б V и любых а, Ъ € Е. Евклидово пространство Еп
представляет собой векторное пространство, в котором эти две опе-
рации определены следующим образом:
* + ? = (?!, х2, а:п) + (У1, у2, .... уп) =
= (*1+ У1, *2+ Уг, • • •. «п+ Уп) (А.4.3)
ах=а(х1,х2, xn) = (axi, ах2, ахп),
т. е. для того, чтобы сложить наборы из п вещественных чисел, сле-
дует сложить соответствующие компоненты этих наборов, а для
умножения набора из п вещественных чисел на скаляр следует
умножить каждую из компонент на этот скаляр.
Если множества А и В являются подмножествами векторного
пространства V, то суммой А 4- В этих множеств называется мно-
жество всех тех точек, которые могут быть представлены в виде
суммы точки из А и точки из В, т. е.
Л-|-5 = {х€ 7|х=а+Ь, а£Л, Ь^В}. (А.4.4)
Например, если А= {1, 2, 3}, а В={1, 6}, то Л-|-В = {2,3,4, 7, 8,9}
Если и область определения и область значений функции /
суть векторные пространства, то функция называется аддитив-
ной, если
/(х1+х2) = /(х1)4-/(х2) (А.4.5)
при любых xj, х2 6 X, X — область определения f. Функция назы-
вается супераддитивной (субаддитивной), если
/ (Х1 + х2) > (О / (Xi) + / (х2). (А.4.6)
Следовательно, аддитивная функция является и супераддитивной
и субаддитивной. Аддитивная функция, удовлетворяющая условию
/(ах)=а/(х) (А.4.7)
при любом х б X и любом а 6 Е, называется линейным преобразо-
ванием. Примером линейного преобразования является линейная
форма.
Векторы х4, х2, . . хп, принадлежащие векторному простран-
ству V, называются линейно независимыми, если из
в1х1 + а2х2 4*•••+ впхп = О (А.4.8)
следует, что
а^ — а2 — . • • — ап — О, (А.4.9 j
т. е. линейная комбинация этих векторов обращается в нуль лишь
тогда, когда все ее коэффициенты равны 0. В противном случае
530
векторы Xj, Х2, . . Хп линейно зависимы, т. е. один из них можно
представить в виде линейной комбинации остальных. Пользуясь
геометрическими представлениями, можно сказать, что два вектора
линейно зависимы, если они лежат на одной прямой, проходящей
через начало координат, и что три вектора линейно зависимы, если
они лежат на одной и той же плоскости, проходящей через начало
координат.
Если векторы xj, х2, . . ., хп линейно независимы и любой
вектор х из V может быть представлен в виде линейной комбинации
этих п векторов
x=eiX1 + a2x2+...+enXn, (АЛЛО)
то векторы xj, х2, . . ., хп являются базисом пространства V, а раз-
мерность V равна п. Размерность Еп равна п; один из базисов этого
пространства состоит из единичных1 векторов
ej = (l, 0..0)
е2=(0, 1....0)
еп = (0, 0, ...» 1).
(А.4.11).
Подмножество S векторного пространства называется подпро-
странством, если оно замкнуто относительно операций сложения
векторов и умножения на скаляр, так что если х и у принадлежат S,
то х + у и ах также принадлежат S. Размерностью подпространства
называется максимальное число линейно независимых векторов,
которое может входить в это подпространство. Например, плоскость,
проходящая через начало координат в Е3, есть подпространство
размерности 2.
Векторное пространство V называется нормированным, если
для каждого вектора х g V существует вещественное число
|| х || 0, называемое нормой вектора х, такое
что ||х||>0 и ||х||=0 тогда, и только тогда, когда х = 0,
Цах|| = |а| И х Ц, (А.4.12)
II *+У II <11 *11+ 11 У II.
(| а | — абсолютное значение скаляра а). Евклидово п-мерное
пространство является нормированным векторным пространством,
например, при норме
IX | = У^+х1+...+^. (А.4.13)
Нормированное векторное пространство является метрическим про-
странством, так как расстояние между векторами х и у можно опре-
делить по формуле
<*(х, у)=1|х—у||.
34* 531
А-5. ВЫПУКЛЫЕ МНОЖЕСТВА И ВЫПУКЛЫЕ ФУНКЦИИ *
Подмножество S векторного пространства называется выпук-
лым, если для любых точек х С S и у f S
ах-|-(1—a)yg S, (А.5.1)
С геометрической точки зрения множество является выпуклым лишь
тогда, когда вместе с любыми двумя своими точками это множество
содержит и соединяющий их отрезок. Приводим некоторые примеры
выпуклых множеств:
евклидово пространство Еп
гиперплоскость в Еп, определяемая как
п '' •
{х££п| 2 <W=b} ”
{замкнутое) полупространство в Enf определяемое как
п
{x€£n| У} afcj^b} .
j=l
Еще одним примером выпуклых множеств является выпуклый
конус. Выпуклым конусом называется любое подмножество вектор-
ного пространства, замкнутое относительно сложения векторов
и умножения вектора на неотрицательные скаляры, т. е. С является
выпуклым конусом, если наряду с любыми точками х, у, принадле-
жащими С, точки х + у и ах (а > 0) также принадлежат С. При-
меры невыпуклых множеств: множество целых чисел, множество
рациональных чисел.
Выпуклой линейной комбинацией точек Xj, х2, . . ., хп назы-
вается точка х, которую можно представить в виде
х = ajXj agX2 + apXp,
где
р
aj, aa, ..., ap>0, ai = l- (A.5.2)
i=l
Множество S выпукло тогда, и только тогда, когда любая выпуклая
линейная комбинация точек из S принадлежит S.
Если множества А и В выпуклы, то их пересечение А Г) В
и сумма А + В также выпуклы. Однако объединение этих множеств
может быть невыпуклым. Пересечение конечного числа замкнутых
полупространств есть выпуклое множество, называемое многогран-
ным выпуклым множеством.
Крайней (экстремальной) точкой выпуклого множества назы-
вается такой элемент этого множества, который не может быть
представлен в виде выпуклой линейной комбинации двух различ-
ных точек множества. Например, крайними точками треугольника
являются его вершины. Множество называется строго выпуклым,
1 Основная литература по выпуклым множествам и выпуклым
функциям: [14, 15, 16].
532
»сли оно выпукло и все его граничные точки являются крайними,
[римером такого множества может служить замкнутая сфера в Е3.
Рыпуклое множество, вообще говоря, может не иметь ни одной
Крайней точки. Примером такого множества является любое откры-
тое выпуклое множество.
Выпуклой оболочкой множества А называется «наименьшее»
выпуклое множество, содержащее А, т. е. множество, являющееся
пересечением всех выпуклых множеств, в которые входит А. Вы-
пуклое множество совпадает со своей выпуклой оболочкой. Если же
множество невыпукло, то его линейная оболочка получается как бы
В результате «заполнения» всех его «невыпуклостей».
Выпуклая оболочка конечного числа точек в Еп называется
выпуклым многогранником — ограниченным многогранным выпук-
лым множеством. Оно представляет собой множество всех выпуклых
линейных комбинаций данных точек. Замкнутое ограниченное вы-
пуклое множество есть выпуклая оболочка своих крайних точек.
Пусть А — некоторое выпуклое замкнутое множество в Еп,
а у — точка в Еп, не принадлежащая множеству А. Тогда сущест-
п
вует ограничивающая гиперплоскость Н = {х £ Еп | 2 ajxj = Ь},
7=1
содержащая у, такая, что все точки множества А лежат в одном
из замкнутых полупространств, определяемых гиперплоскостью
Я, т. е.
п п п
S aiUi~b и либ° 2 aJzJ^b, либо 2 aJzJ^b при любом z£4.
7=1 7=1 7=1
(А.5.3)
Если у — граничная точка А, то существует опорная гиперплоскость
Н, содержащая у, такая, что все точки множества А лежат в одном
из определяемых ею замкнутых полупространств. Пусть в Еп
заданы два таких непустых выпуклых множества А в В, что они
либо не имеют общих точек, либо их общими точками являются
только граничные точки. Тогда существует разделяющая гиперпло-
скость Н, такая, что все точки А лежат в одном из определяемых
гиперплоскостью Н замкнутых полупространств, а все точки В лежат
в другом определяемом ею замкнутом полупространстве. Примеры
перечисленных гиперплоскостей для пространства Е2 показаны
на рис. А.1.
Вещественная функция f (х), определенная на выпуклом мно-
жестве X, называется выпуклой, если при любых двух различных
точках х и у из X
/(ах+(1 — а)у)<а/(х) + (1 — “)/(у), гдеО<а<1. (А.5.4)
Функция f (х) называется строго выпуклой, если это неравенство
выполняется как строгое неравенство. Функция f (х) называется
вогнутой, если —/ (х) выпуклая; функция f (х) строго вогнута,
если функция —/ (х) строго выпукла, т. е. знак неравенства в
в (А.5.4) изменяется на противоположный. Говоря языком геомет-
рии, некоторая функция в Е2 является выпуклой тогда, и только
тогда, когда отрезок прямой, соединяющий любые две точки кривой
ее графика, лежит не ниже данной кривой. Линейная функция
583
Рис. АЛ. Ограничивающая, опорная и разделяющая гиперпло-
скости для выпуклых множеств.
I Н — ограничивающая гиперплоскость для А.
II Я — опорная гиперплоскость для А.
III Я — разделяющая гиперплоскость для А.
является и выпуклой и вогнутой, но она не является ни строго
выпуклой, ни строго вогнутой. На рис. А.2 показаны примеры
выпуклой функции, строго вогнутой функции и функции, не являю-
щейся ни выпуклой, ни вогнутой.
Если f (х) и g (х) есть заданные на X выпуклые функции, то
функции f (х) + g (х), max [f (х), g (х)], с/ (х), где с > О, также
выпуклы. Следовательно, неотрицательная взвешенная сумма
выпуклых функций выпукла. Если f (х) есть выпуклая функция,
определенная на открытом выпуклом подмножестве X п-мерного
евклидова пространства Еп, то j (х) суть непрерывная функция на X.
Функция / (х), заданная на выпуклом подмножестве X про-
странства Еп, будет выпуклой тогда, и только тогда, когда мно-
жество
{(^1,^2, •••, хп, у) | (xlt х2, ..., хп)£Х, f(xXy} (А.5.5)
является выпуклым множеством в Еп+1.
Вещественная функция / (х), определенная на выпуклом множе-
стве X, называется квазивыпуклой, если при любых двух различных
точках х и у из X
/(ax-f-(l — а)у)<тах[/(х), /(у)] для всех •, 0<e<l?>4 (А.5.6)
534
и с. А.2. Выпуклые и вогнутые функции.
I — Выпуклая функция, не являющаяся строго
выпуклой.
II — Строго вогнутая функция.
III — Функция, не являющаяся ни выпуклой, ни вог-
нутой.
У‘(х) называется строго квазивыпуклой, если это неравенство выпол-
няется как строгое неравенство; f (х) квазивогнута, если —/ (х)
квазивыпукла; / (х) строго квазивогнута, если —f (х) строго квази-
выпукла. Таким образом, / (х) строго квазивогнута, если при любых
различных х и у из X выполняется неравенство
/(ах + (1 —а) у) > min (х), /(у)], 0<а<1, (А.5.7)
что следует из соотношения
max—/ (х) = —min f (х).
xgX
Фунцкия / (х) квазивыпукла тогда, и только тогда, когда мно-
жество
{х £ X | f (х) 6} (&—любое вещественное число) (А.5.8)
является выпуклым; / (х) строго квазивыпукла, если это неравен-
ство выполняется как строгое неравенство; / (х) квазивогнута, если
535
выполняются противоположные неравенства. Таким образом, / (х)
строго квазивогнута^догда, и только тогда, когда множество
{х g X | / (х) > 6} (Ь—любое вещественное число) (А.5.9)
является выпуклым.
Выпуклая (вогнутая) функция является также квазивыпуклой
(квазивогнутой), однако обратное неверно. Например, любая моно-
тонно убывающая функция одной переменной (т. е. / (zi) > f (х2),
если xt < х2} является квазивогнутой, однако она не обязательно
будет вогнутой.
А-6. ДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 1
Вещественная функция п переменных / (х) = / (®j, х2, . . ., хп)
является дифференцируемой в точке х° = (zj, х2, . . ., х^)', если
существует набор из п чисел а = (alt а2, . . ., ап), такой, что
|f(xo+h)-/(xo)-
где h= (hi, h2, . . ., hny — произвольная точка пространства Еп,
|| h || — норма h. Числа aj называются частными производными'.
=-йгИ-х*.......х^’ >=1-2.....п- <А-6-2>
VvCj ujjj
Функция называется дифференцируемой, если она дифференцируема
во всех точках своей области определения. В этом случае вектор
(вектор-строка) частных производных функций
....
называется градиентом. Эластичностью функции / (х) по перемен-
ной xj в точке х называется величина
7ДГ'4-<х>’ ,=1’2.......(А'6'4)
Функция называется непрерывно дифференцируемой, если она диф-
ференцируема и все ее частные производные непрерывны.
Если все п частных производных дифференцируемы, то их также
можно продифференцировать, в результате чего возникают частные
производные второго порядка
d2f (x)=-j-(-^-(х)) , i, 7 = 1,2, ...,n. (А.6.5)
dxtdxj ' ' dxiXdxj''/
1 Основная литература по дифференциальному исчисле-
нию: [17, 6].
536
Матрица производных второго порядка
/а2/ а2/ а2/ \
dxf ' 1 дх^ дх2 Х " ’ ’ dxi дх2
-^_(Х)^(Х).. W (х)
д2/ эд = дх2 9х1 дх1 дх2 дхп 1 (А.6.6)
называется матрицей Гессе. Если / (х) непрерывно дифференци-
руема, то
- . 92fa , «,/ = 1,2, ..., п, (А.6.7)
дхг ох] дх] dxi ' '
т. е. значение производной не зависит от порядка дифференцирова-
ния. Полным дифференциалом функции у — f (х) называется ве-
личина
*^=Йг(х) 9X1+Й-{х) dXi+ ‘ • • +_йг(х) dXn =
п
=2йг(х)*+ <А-6-8)
1
Вторым полным дифференциалом функции у = / (х) называется
величина
п п
1=1 3=1
Если / (х) непрерывно дифференцируема, то ее можно следующим
образом разложить по формуле Тейлора в окрестности точки х°:
/(х)=/(х0)+3 JLw{Xi_ty +
3=1 3
п п
+ 22 d^dXj <xl) (А.6.Ю)
г=1 з=1
где x^axO-j-fl—а) х, 0<а<1.
Функция / (х) называется однородной функцией степени h, если
/ (ах) = / (ац, аг2, .А, ахп) = аЦ (Х1, хг, хп). (А.6.11)
Так, например, линейная форма — это однородная г. функция пер-
вой степени, а квадратичная форма — однородная функция степени
537
два. Согласно теореме Эйлера, если / (х) — дифференцируемая
и однородная функция степени h, то ч
п
3 -Д-(х)^=л/«- <А-б-12>
5=1
Если f (х) дифференцируема, то / (х) является выпуклой функ-
цией тогда, и только тогда, когда для любых двух точек
Х1=(хц, ^12, ...» xln) ® ^2=(x2i, х22* ...» х2п)
П
f M-f (Х2) > 2 (х) (xi}-х2]). (А.6.13)
5=1 3
Если f (х) два раза дифференцируемая, то f (х) является выпук-
лой функцией тогда, и только тогда, когда ее матрица Гессе поло-
жительно полуопределена или положительно определена; / (х)
является вогнутой функцией тогда, и только тогда, когда ее матри-
ца Гессе отрицательно полуопределена или отрицательно опреде-
лена.
А-7. ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ1
Дифференциальным уравнением называется уравнение, содер-
жащее производные. Обыкновенным дифференциальным уравнением
называется уравнение, в которое входят производные некоторой
функции одной независимой переменной. Порядком дифференциаль-
ного уравнения называется порядок наивысшей производной, вхо-
дящей в это уравнение. Общее дифференциальное уравнение п-го
порядка можно представить в виде
dnx . I dx d?x dF-ix \ ,. _
~d&~~f \Х' ~dt' dfi ’ •••’ din-1 ’ *)’ (А’7Л)
где t — независимая переменная, а х = х (t), Решением уравне-
ния (А.7.1) является любая функция х (i), удовлетворяющая этому
уравнению при всех возможных значениях t и удовлетворяющая,
всем наложенным граничным условиям (например, х (i0) = х0,
(М = zi)-
Общее дифференциальное уравнение n-го порядка эквивалентно
системе п дифференциальных уравнений первого порядка
^-=xi=fi(xi, х2, - ..,xn,f)
^. = xa=ft(xlt x2...xn, t) (A.7.2)
n » t V —= xn = /n (xl, x2i •••, xnt
1 Основная [18, 19, 20J. литература по дифференциальным уравнениям:
533
Действительно, если положить х = xg, то система
asj — xg
Xg = x3
(А.7.3)
= *2> хп, t)
эквивалентна уравнению (А.7.1). Система (А.7.2) в векторных обо-
значениях может быть записана как
х = f (х, t),
(А.7.4)
где х, х и f(x, t)—векторы-столбцы:
Xg, ...,хп, t)\
fg(xg, хг, хп, f) \
I . г (А.7.5)
I '/
fn(xi, xg, ...,xn,t)/ U.
Пусть при tg = to на все переменные наложены граничные условия
вида
x(t0) = x0, (А.7.6)
где х0 — заданный вектор-столбец. Пусть функции f (х, t) опреде-
лены и непрерывны в некоторой области и, кроме того, удовлетво-
ряют условию Липшица, т. е. для любых двух векторов х1 и х® суще-
ствует некоторое постоянное положительное число I, такое, что
|| /Дх‘, t)-/;(x2, t) || <111^-^11, 7 = 1,2, ..., п. (А.7.7)
Тогда система дифференциальных уравнений при данных гранич-
ных условиях имеет единственное решение. Если функции f (• •)
дифференцируемы и их производные ограничены, то условие Лип-
шица выполнено и, следовательно, существует единственное
решение.
Система дифференциальных уравнений (А.7.4) называется
автономной, если функции f (••) не зависят явно от переменной t
(времени), т. е.
x=f(x). (А. 7.8)
Далее, точкой равновесия называется такая точка Xе, в которой
f(x«) = O, т.е. /;(г?,»|, ...,®«)=0, ; = 1, 2, .... п. (А.7.9)
539
Перемещения из точки равновесия не происходит. Точкой устой-
чивого равновесия называется точка равновесия, обладающая сле-
дующим свойством: если система начинает двигаться из некоторой
точки, достаточно близкой к точке равновесия, то она будет пере-
мещаться сколь угодно близко к этой точке. Таким образом, хе
является точкой устойчивого равновесия, если для любого е > О
существует зависящее лишь от е число о > 0, такое, что если
II xi (<<>) —Xе, II < о при всех j,
1 (А.7.10)
то ||£;(<) — ^;||<е при всех Л
где т — некоторое число, а (() — решение (А.7.8) при условии
(А.7.6). В противном случае хе называется точкой неустойчивого
равновесия. Равновесие в хе называется асимптотически устойчи-
вым, если оно устойчиво и если любая траектория (решение систе-
мы), начинающаяся в некоторой определенной области, со временем
приближается к хе, т. е. при любом фиксированном е > О
lim | xj (i) — хе. | < е при всех /, (А.7.11)
t-00
где х («о) принадлежит к указанной области.
Согласно второму методу Ляпунова, равновесие в начале коор-
динат х = 0 является устойчивым, если для некоторой открытой
области, близкой к началу координат, можно найти непрерывно
дифференцируемую функцию V (х) со следующими свойствами:
V(x)>0; V(x) = O лишь при х = 0
7(х)= V -4—-^-<0; Ё(х) = 0 лишь при х = 0, (А,7>*2)
' dxj at
i=i
где х — любая точка из указанной открытой области. Функция
V (х) называется функцией Ляпунова. Если, кроме того, V (х) — О
только при х = 0, то начало координат является точкой асимптотиче-
ски устойчивого равновесия. Так как функция Ляпунова положитель-
ная всюду, кроме точки равновесия, то ее можно интерпретировать
как меру расстояния до точки равновесия. Поскольку производная
по времени < неположительна всюду и равна нулю в точке равнове-
сия, то это расстояние со временем уменьшается, так что в конце
концов достигается состояние равновесия.
Система дифференциальных уравнений (А.7.9) называется
линейной, если все производные входят в эти уравнения в первой
степени и не встречаются произведения производных. Например,
автономная система линейных дифференциальных уравнений
с постоянными (т. е. не зависящими от t) коэффициентами имеет вид
Х1 — а11х1~}~ а12х2 + • • • -i-alnxn
х2 ~ a2ixi + 0.22X2 + • • • Л~а2пхп . . _ .
= ап1х1 + • • • + вПП»П
540
или в векторных обозначениях
х = Ах, (А.7.14)
где
(аИ а12 • • • ain \
а21 а22 • • • a2n I
I • (А.7.15)
ап1 ап2 • • • апп /
Очевидно, что точка х = 0 является точкой равновесия этой системы.
В системе, состоящей из одного уравнения (п = 1), уравнение
к = ах можно записать в виде
— = adt. (А.7.16)
Решение
x = ceat (А.7.17)
итого уравнения можно получить непосредственным интегриро-
ванием. Константа с зависит от граничного условия (с = e”aZoz0).
Равновесие при х = 0 является устойчивым, если а < 0, так как
При этом функция Ляпунова V (х) = х2.
В общем случае решение (А. 7.13) имеет вид
*1 = сце%1<+ с12е%2‘+ ... + clneKni
xi= сueKlt+ с22е%2<-Ьи• • + .с.
. . . . (А.7.1О)
хп = CnieKit 4" еп2е^ Ч- • ••4" cnne^n* 1
где постоянные (i,j— 1, 2, . . ., п) определяются из граничных
условий (А.7.6), а Хг—характеристические корни матрицы А (пред-
полагается, что эти корни различны). Равновесие при х = 0 являет-
ся асимптотически устойчивым, если все характеристические корни
имеют отрицательные вещественные части.
Решениями системы двух уравнений с двумя неизвестными
г1 = аНл:1 + а12:1:2 ,. - ,о.
. (А.7.1У)
®2==a21iEi*l"
ЯВЛЯЮТСЯ
xt = Сце^1* 4- ctae^
Ы Ш (А’7-2О)
х2 — С21« + С22еЛ2* »
где Xi и Ха—корни уравнения
X2 — (ац+агг)Х + (аиа22 — а12а21)= 0. (А.7.21)
Траектории движения этой системы могут быть изображены графи-
чески на плоскости (х4, х2). Начало координат является точкой рав-
новесия, а поведение траектории вблизи начала координат опреде-
ляется характеристическими корнями Xi и Х2. Если эти корни веще-
ственные и отрицательные, то траектории приближаются к началу
541
A1-J3i,A2~~^ Af—cL+fii
A.z=cL-J$i A2-d.-J3t
d.<0 oC>0
Рис. А.З. Примеры возможных траекторий.
координат, которое в этом случае является устойчивым узлом.
Если корни вещественные и положительные, то траектории удаля-
ются от начала координат, которое в этом случае является неустой-
чивым узлом. Если корни вещественные и имеют противоположные
знаки, то существует геометрическое место точек, называемое
сепаратрисой, разделяющее плоскость на две области, причем
траектории приближаются к началу координат лишь вдоль сепара-
трисы. Начало координат в этом случае является седловой точкой.
Если корни комплексные, то они являются комплексно сопряжен-
ными (Х4 = а 4- Pi, Х2 = а — Pi), при этом вид траекторий зави-
сит от вещественной части корня (а). Если вещественные части
корней отрицательны, то траектории спиралевидно приближаются
к началу координат, являющемуся устойчивым фокусом; если веще-
ственные части равны нулю, то траектории имеют эллипсообраз-
ную форму и стягиваются к началу координат, являющемуся цен-
тром; если вещественные части положительны, то траектории уда-
ляются по спирали от начала координат, являющегося неустойчи-
вым фокусом. На рис. А.З даны иллюстрации к перечисленным
случаям. Изображенные в верхней части рисунка три типа точек
для случая вещественных характеристических корней соответствуют
простейшей системе второго порядка: xi = XjZj, х2 ~ Х2ж2, где
Xj =# Х2.
Нелинейные системы второго порядка можно анализировать
в некоторой окрестности точки равновесия с помощью линейных
542
аппроксимаций функций в этой точке. Так, если х = х* есть точна
равновесия системы
(А.7.22)
*2 =/2 (xi, Sts),
то после замены функций fi (xlt х2) и /2(хь «г) их линейными аппрок-
симациями в окрестности Xе система преобразуется к виду
^-^-(хе>г1+-Й‘(хв)л:8-
Теперь поведение системы в окрестности хе определяется характе-
ристическими корнями матрицы
/4^-(х«) 4^-(л»)
I dxi ' дх2
\-^-(х«) 4^-(х«)
\ dxi ' ох2
(А.7.23)
(А.7.24)
Например, если корни вещественные и положительные, то точка
равновесия является седловой точкой.
Приложение Б
Матрицы1
В-1. ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ
Матрица — это прямоугольная таблица вещественных чисел.
Размеры этой таблицы (число строк и число столбцов) определяют
порядок матрицы. Матрица А имеет порядок т X п, если
(аи й12 • • • ап1 \
а21 а22 • • • а2п I
• I = («»). (Б.1.1)
I
«.а /
aml ат2 ;,у “тп /
где i — индекс строки (i = 1, 2, . . ., т), a. j — индекс столбца
(; = 1, 2, . . ., п). Если т = п = 1, то матрица представляет собой
не что иное, как скаляр (обычное действительное число). Матрица,
у которой число т или п равно 1, представляет собой вектор',
вектор-строку, если т = 1, или вектор-столбец, если п = 1.
Для обозначения скаляров обычно применяются строчные буквы
(например, к), для обозначения векторов — строчные буквы,
набранные жирным шрифтом (например, х), а для обозначения
матриц — прописные буквы, набранные жирным шрифтом (напри-
мер, А). Если т = п, то матрица называется квадратной. В этом
случае все элементы, у которых i = j, начиная со стоящего в левом
верхнем углу элемента с индексами (1,1) и кончая стоящим в пра-
вом нижнем углу элементом с индексами (ге, п), называются элемен-
тами главной диагонали.
Приведем некоторые примеры матриц, используемых в эконо-
мике: матрица, составленная из данных временных рядов
X =(хе(), g=l, 2, ..., G; f=l, 2, ..., T, (Б.1.2)
GXT
где Xgt — наблюденное значение переменной g в момент времени V,
матрица Леонтьева (матрица затраты-выпуск)
L = (»«), i, j = i, 2, ..., п, (Б.1.3)
ПХП
где — затраты i-ro вида продукции, необходимые для произ-
водства единицы /-го вида продукции, причем рассматривается
1 Основная литература по теории матриц: [1, 2, 3, 4].
В настоящей книге рассматриваются только матрицы, составленные
из вещественных чисел.
544
Экономика, производящая п видов продукций (товаро*)? матриц^
Маркова (матрица переходных вероятностей)
М = (тг;); т^>0, i, )^=1, 2, ....
nxn ' г
п
2»Ч;==1, i=l, 2,..., п (Б.1.4)
7=1
где mij — вероятность перехода системы, имеющей п возможных
состояний, из состояния i в состояние /.
Б-2. НЕКОТОРЫЕ СПЕЦИАЛЬНЫЕ МАТРИЦЫ
Нулевой матрицей называется матрица, все элементы которой
равны нулю:
О =(ан), где ан = О, 1—1, 2, ..., т; / = 1, 2, ..., в,
mxn
например,
(°). (00), (J . (Б.2.1)
Единичной матрицей Называется квадратная матрица, у кото-
рой все элементы главной диагонали равны единице, а все прочие
элементы равны нулю:
I =(S^), где если 1 = /,
пхп
S^=0, если i т4=/, i, /=1, 2, ..., п, (Б.2.2)
например,
Строки единичной матрицы—это единичные векторы-строки:
et = (l, 0, ..., 0), е2=(0, 1, 0, ... 0) и т. д.
Вектор, составленный из единиц, имеет вид
I =(1, 1, ..., 1). (Б.2.3)
1хп
Диагональной матрицей называется квадратная матрица,
в которой все элементы, стоящие вне главной диагонали, равны
нулю:
D =(dtj), где dtj = O, если i =£ /, i, / = 1, 2, ..., Я. (Б.2.4)
пхп
tj /2 0\ ,
Например, I q з I ; любая единичная матрица.
Треугольная матрица — это квадратная матрица, у которой
35-0270
545
«ее элементы, стоящие йо одну из сторон главной диагонали, равны
нулю:
ях»
(Б.2.5)
1
О
о
О'
о
1,
(Б.2.6)
i, 7 = 1, 2, ..., л.
Например, — ; любая диагональная матрица.
Квадратная матрица называется матрицей перестановок, если
в каждой ее строке и в каждом ее столбце содержится один элемент,
равный 1, а все остальные элементы нулевые, например,
(“) (?:>• (*
Существует n! = п (п — 1) (п — 2) ... (2) (1) матриц пере-
становок порядка п, одной из которых является единичная матрица.
Блочная матрица — это матрица, элементы которой разбиты
на некоторое число подматриц, например, следующим образом:
/Ан А12\ wij
А = ......
ту.п \A2iiA22/ni — m2,
л2 п—
где Ац—матрица порядка Ai2—матрица порядка пцх
х(п—т) и т. д.
Блочно-диагональная матрица — это матрица, которую можно
разбить на подматрицы таким образом, чтобы только на ее «главной
диагонали» стояли ненулевые квадратные матрицы:
О
О
Ан
о
А22
О
(Б.2.7)
О
О
:Agg
Блочно-треугольная матрица — это матрица, которую можно
разбить на подматрицы таким образом, чтобы по одну сторону ее
«главной диагонали», составленной из подматриц, стояли нули.
Примерами блочных треугольных матриц могут служить треуголь-
ная матрица и блочно-диагональная матрица.
Б-3. ОТНОШЕНИЯ МЕЖДУ МАТРИЦАМИ И ДЕЙСТВИЯ
НАД МАТРИЦАМИ
Две матрицы равны, если они имеют одинаковый порядок и их
соответствующие элементы равны, т. е.
А = В, если atj=bij, i = l, 2, ... m; /=1, 2, ..., л. (Б.3.1)
546
Матричные неравенства:
А>В, если ац>Ьц, 1^1, 2, rt; ’ 7 = 1, 2, п
А>В, если <H}>bt}, i = i, 2, ..., m; j = l, 2, ...f n.
Сложение двух матриц одного и того же порядка означает сло-
жение соответствующих элементов этих матриц:
А+В = С, где ctj — atj+btj, i=i, 2, т;
7 = 1, 2, п. (Б.3.3)
Например,
Отметим, что
А-|-В = В-|-А ’
А+(В + С) = (А+В) + С (Б.3.4)
А+О=А
Умножение матрицы на скаляр означает умножение всех элементов
этой матрицы на скаляр:
ЛА = В, где Ьц = кац, /=1, 2, т; 7 = 1, 2, п. (Б.3.5)
Например,
Отметим, что
kA = Ak
к(А + В) = ЛА+кВ
(Л+0А=ЛА+1А (Б.3.6)
(kl)A = k(lA)
(— 1) А = — А — противоположная матрица,
А+(-1)В = А—В — вычитание матриц.
При умножении двух матриц число столбцов в матрице, стоящей
слева, должно равняться числу строк в матрице, стоящей справа.
Элементы произведения матриц получают в результате попарного
перемножения элементов строки матрицы, стоящей слева, и соот-
ветствующих элементов столбца матрицы, стоящей справа, и после-
дующего сложения этих попарных произведений:
А В = С , где cjj= 2
mxrrxn mxn Й=1
г = 1,2,..., т; /=1, 2,..., п. (Б.3.7)
Например,
(“11“1г) )= (<*цЬц 4-«12^21 “11^12+ <*12^22)
/2 1\ /8 -1\ /18 1\
\0 5Л2 3/ —\Ю15/
35* 54Т
Отметим, что АВ, как правило, не равно ВА, даже если ВА опре-
делено. В том случае, когда произведения АВ и ВА определены
и равны, матрицы А и В называются коммутативными.
Отметим, что 1
А (В+С) = АВ+АС
(А+В) С = АС + ВС
А (ВС) = (АВ) С (Б.3.8)
*(АВ) = А(ЛВ)
АО=0А = 0
А1 = 1А = А.
Умножение матрицы слева на матрицу перестановок приводит
к перестановке строк матрицы, а умножение на матрицу переста-
новок справа приводит к перестановке столбцов матрицы, например,
/О 1\ /2 4\ _ /6 1\
\1 О/ \6 4/
(П) с:н“)-
Степенью матрицы называется результат многократного умно-
жения матрицы самой на себя:
А*=АА<~1; 4=1,2,... (Б.3.9)
Отметим, что
А° = 1
А'А« = А'+» (Б .3.10)
(А/)* = А<«.
Матрица А называется идемпотентной, если А* = А. Например,
/ 6 10\
матрица I з ____является идемпотентной.
Внутреннее, или скалярное, произведение двух векторов — это
произведение вектора-строки на вектор-столбец, равное скаляру:
п
w х = V Wjxp (Б.3.11)
IxnnXl j—4
/ 2\
Например, (13) ( _ 1 = — 1.
Векторы называются ортогональными, если их скалярное произве-
дение равно нулю. Например, векторы (4 6) и ( g) ортогональны.
Внешнее произведение двух векторов — это произведение век-
тора-столбца на вектор-строку, равное матрице:
... XlU>n \
: | (Б.3.12)
I
XnWl ... xnwnf
548
Транспонирование матрицы состоит в том, что строк? матрицы
(ановятся столбцами, а столбцы строками:
если А = (а,у), То А' = (а^), 1=1, 2, т,
шхп пхт
/<=1, 2, .... п. (Б.3.13)
Например,
Отметим, что
(А')'=А
(ЛА)' = *А' (Б.3.14)
(А + В)' = А'4-В'
(АВ)' = В'А'
Матрица А называется симметрической, если А = А'. Например,
/8 2\
матрица ( g I есть симметрическая. Симметрическая матрица
порядка п содержит п (п + 1)/2 независимых элементов. Квадратная
матрица А называется кососимметрической, если А — —А'. Напри-
/ 0 5\ „
мер, I gj есть кососимметрическая матрица. Кососимметриче-
ская матрица порядка п содержит п (п — 1)/2 независимых элемен-
тов , так как все элементы главной диагонали должны равняться нулю.
Если х есть вектор-столбец длины п, то скалярное произведение
х'х= 3^ = |хр
1=1
(Б.3.15)
представляет собой сумму квадратов. Величина | х | — корень
квадратный из суммы квадратов называется нормой х. Вектор х
называется нормализованным, если | х | = 1. Матрицей рассеяния
называется симметрическая матрица, являющаяся внешним про-
изведением:
Например, если х
то х'х=10,
(aj ... xixn
ЗД ... .
(Б.3.16)
|х| = У10, хх'=(д .
Квадратная матрица А называется ортогональной, если каждый
вектор-столбец в А нормализован и ортогонален к любому другому
ее вектору-столбцу, так что
А'А=1, (Б.3.17)
549
например,
3_______________________________2_\
У1б V40 1
1 -6 I •
у 10 У4б/
Любая матрица перестановок является ортогональной.
Квадратная матрица А называется разложимой, если суще-
ствует матрица перестановок Р, такая, что
Ми А1г\
Р'АР=------... , (Б.3.18)
\ 0 М22/
где Atl и А22 — квадратные матрицы. В противном случае матрица А
называется неразложимой (или связанной). Например, матрица
/0 2 0\
I 0 —8 0) разложима, так как из нее с помощью матрицы переста-
\1 3 5/
/О 1 0\ /5 1 3\
новок I 0 0 1) можно получить матрицу (0 0 21.
\1 0 0/ \0 0 —8/
Матрица А порядка п X п неразложима тогда, и только тогда, ког-
да для любой пары индексов (i, 7) существует набор индексов
/1, /2> • • •, jl, такой, что . a}li, 0, i, 7 = 1, 2, . .
. . ., п.
Б-4. СКАЛЯРНЫЕ ФУНКЦИИ, ОПРЕДЕЛЕННЫЕ НА
МАТРИЦАХ
Следом квадратной матрицы порядка п называется сумма эле-
ментов ее главной диагонали
tr (A) =£au, (В.4.1) 1 i=l
например, tl(g |)=Ю.
Отметим, что tr (!) = », tr(O) = O tr(A') = tr(A) (Б.4.2) tr(AA')=tr(A'A) = J i=l tr (kA) = к tr (A) tr (AB) = tr (BA)
Если порядок А и В одинаков, то tr(A-|-B) = tr(A)-|-tr (В).
Определителем квадратной матрицы порядка п называется
алгебраическая сумма гс! слагаемых, каждое из которых представ-
ляет собой произведение п элементов матрицы — по одному эле-
550
менту из каждой строки и из каждого столбца, взятое^определен-
ным знаком: ;
|A| = det(A)= 2 s8n (Ч» • • •» 4i) ania2it • • • ®nin’ (Б.4.3)
все n!
перестановок
(Ч.....in)
|«Ц «12 I
„ „ = «Ha22— «12«21i
«21 агй |
где sgn(ii, ..., in) равен 1, если перестановка ц, in
четная, или —1, если эта перестановка нечетная. Расположение
чисел ц, . . ., in называется четной (нечетной) перестановкой, если
оно получено в результате четного (нечетного) числа попарных
перестановок (транспозиций) элементов множества (1, 2, . . ., п).
Отметим, что
например,
(Б.4.4)
|1| = 1, ]0) = 0
| А 1 = 1 А'| = (—1)п | —А ] = (Х)-п|кА |
IАВ|=|ВАI
Если А — диагональная или треугольная матрица, то | А | =
= «И«22 • • • апп-
Если каждая строка (или столбец) А является нетривиальной линей-
ной комбинацией всех остальных строк (или столбцов) матрицы А,
то | А | = 0. В частности, если две строки (два столбца) матрицы А
равны или некоторая строка (некоторый столбец) состоит из одних
нулей, то | А | = 0.
Если В получена из А в результате перемены местами двух
строк (или столбцов), то | В | = —| А |.
Если В получена из А умножением одной из строк (одного
из столбцов) А на к, то | В | = к | А |.
Главным минором к-го порядка квадратной матрицы называется
детерминант матрицы порядка к х к, составленной из первых к
строк и первых к столбцов матрицы А:
аи aik
Мк =
(Б.4.5)
«А1 ••• «АА
Матрица удовлетворяет условиям Хоукинса — Саймона, если все ее
главные миноры положительны.
Минором к-го порядка квадратной матрицы А порядка назы-
вается главный минор Л-го порядка матрицы Р'АР, где Р—некотб-
рая матрица перестановок. Следом к-го порядка — aft называется
сумма всех возможных п!/Л1 (п — &)! главных миноров к-то поряд-
ка, т. е.
®1 —а11 + а224“ • • • +ann — ti (А)
1 <41 <42 I I I ali ai3 I I
а2 +1 IТ • • •
«21 «22 I I ®31 а33 I
(Б.4.6)
®П — I -А- |.
551
Если из квадратной матрицы А вычеркнуть t-ю строку и j-й стол-
бец, то определитель Mi3; получающейся при этом- квадратной
матририцы порядка (п — 1) х (п — 1) называется минором
глемента с индексами (i, 7)'
Mi3
®ii
®и
®П1
®11 .... Я1Л
®ij .... а1п .
®п7 • • •• ®пя
(В.4.7)
Выражение
Ci} = (— i=l, 2, ..., n; J = l, 2, .... n. (Б.4.8)
называется алгебраическим дополнением элемента с индексами (г, j).
Алгебраическое дополнение либо совпадает с минором М,/, либо
равно —М[] в зависимости от того, четно или нечетно число i + / .
Определитель можно вычислить, разлагая его по алгебраическим
дополнениям:
п
|А| = aijCiP i = 2, п (разложение по столбцу)
' ' (В.4.9)
|А|= 2 г==*» 2» ...» п (разложение по строке).
7=1
Рангом р (А) матрицы А называется наибольший порядок
не обращающихся в нуль миноров этой матрицы. По другому,
эквивалентному, определению, ранг матрицы — это максимальное
число линейно независимых строк (или столбцов) матрицы А, т. е.
ранг матрицы — зто размерность подпространства, натянутого
на строки (или векторы) матрицы А.
Например,
Отметим, что
О < р (А) = целое число < min (m, п), где А — матрица порядка т х п
р(1) = тг, р(0) = 0, р (Р) = п (Б.4.10)
р(А') = р(А) = р(А'А).
Если матрицы А и В имеют один и тот же порядок, то
р (А + В) < р (А) + р (В).
Если АВ определено, то р (AB)<min[p (А), р(В)].
Если А есть диагональная матрица, то р (А) равен числу ненуле-
вых элементов.
Если А есть идемпотентная матрица, то p(A) = tr(A).
Ранг матрицы не меняется, если одна строка (или столбец) умноже-
на на постоянное число, не равное нулю или если строка (столбец),
умноженная на число, прибавлена к другой строке (столбцу).
552
Квадратная матрица порядка п называется невырожденной, если
р (А) = п, то есть | А [ =/= 0. В противном случае А называется
вырожденной (|А| = 0). Ранг произведения некоторой матрицы А
справа или слева на невырожденную матрицу равен рангу матри-
цы А.
Б-5. ОБРАТНАЯ МАТРИЦА
Если А — квадратная невырожденная матрица порядка п, то
существует единственная обратная матрица А-1, такая, что
АА-‘=А-‘А = 1. (Б.5.1)
Обратную матрицу можно вычислить по формуле
д-1 = = ((-i)i+^u)
|А| |А|
(Б.5.2)
где (Сц) — матрица, составленная из алгебраических дополнений.
Матрица (С}})' называется присоединенной. Например, если
(1 —1\
1 2 ).
з/
Отметим, что
1-1 = 1
(А-1)-1 = А, (А')-1 = (А-*У, |А-1| = |А|-‘,
(АВ)_1 = В“1А"1, если обе матрицы А и В, невырожденные; (Б.5.3)
А_1 = А' тогда, и только тогда, когда А—ортогональная матрица.
Если входящие в блочную матрицу
А =
Ац : А12^
А21 А22/
(Б.5.4)
матрицы А22 и D = An—AtjAjjA^ невырожденные, то
д-1 —/ 'D-1 I — D-IA12A5I \ /к 55\
А "r-A^AaiD-iiAsHI^ 1 ’ 1
Если А — неотрицательная квадратная матрица, то (I — А)
имеет неотрицательную обратную матрицу тогда, и только тогда,
когда I — А удовлетворяет условию Хоукинса — Саймона (все
главные миноры положительны). Кроме того,
(1-А)-1 = 1-|-А+А2+... (Б.5.6)
Две квадратные матрицы одного порядка А и В называются
подобными, если существует невырожденная матрица М, такая»,
что
В=М-‘А1^
(Б.5.7)
553
при этом
1А|=|В|
р(А)=р(В)
В*=М-‘А«М.
(Б.5.8)
Б-6. ЛИНЕЙНЫЕ УРАВНЕНИЯ И ЛИНЕЙНЫЕ,
НЕРАВЕНСТВА
Систему т линейных уравнений с п неизвестными
а11х14" а1212 + • • • + а1пхп =
а21х1~}~а22х2~}~ • • • ~t~a2nxn — ^3 (Б.6.1)
amlxi~t~am2x2^~ • • • JTamnxn = ^m
записываем в виде матричного уравнения
Ах = Ь, (Б.6.2)
где А = (a;j) — матрица коэффициентов порядка m X л,х = (xj) —
вектор-столбец переменных, а Ь = (Ьг) — вектор-столбец постоян-
ных (i = 1, 2, . . m; j — 1, 2, . . п). Применяя знак сумми-
рования, эту систему можно записать в виде
п
2 afjXj=bt, i=l, ... т. (Б.6.3)
Пример такой системы:
2х1-|-Зг2 = 7
Х14-4г2 = 6.
Матричное уравнение этой системы:
G Ж И)-
Система линейных уравнений либо имеет единственное реше-
ние, либо имеет неединственное решение, либо не имеет решений.
Решение существует тогда, и только тогда, когда
р(А) = р(А!Ь) = г. (Б.6.4)
Если решение существует, то оно будет единственным тогда, и толь-
ко тогда, когда г = п. Если решение существует, но г п, то п — г
переменным можно присваивать произвольные значения.
Если матрица коэффициентов квадратная (число уравнений
равно числу неизвестных) и невырожденная (уравнения независимы),
т. е. т = п и р (А) = п, то решение единственно. Решение можно
получить, умножая обе части матричного уравнения слева на обрат-
ную матрицу
х = А-‘Ь. (Б.6.5)
Например» решение матричного уравнения
(? Ж И)
554
есть
(2ИНГ СНП-
Решение можно также получить с помощью правила Крамера-.
1=1,2...п' (Б-б-в)
где A.J — матрица, полученная из А заменой ;-го столбца матрицы
А столбцом Ь. В приведенном выше примере
7 3
1 4
Единственное решение может существовать и в том случае, когда
т ф п. Например, если
(?)-(«)
то
®1=3.
Если система уравнений является однородной, т. е. вектор постоян-
ных этой системы равен нулю (Ь = 0), и если ранг матрицы коэф-
фициентов меньше п (р (А) = г < п), то система имеет неединствен-
ное решение. В этом случае п — г переменным можно присваивать
произвольные значения. Приведем пример:
(з
где п — г = 1. Если положить xt, равным произвольному числу с,
то решение имеет вид
СН-У-
Так как р (А) min (m, п), то решение системы неединственно
и в том случае, когда число уравнений меньше числа неизвестных
(т < п), конечно, если выполнено условие, что р(А) = р(А:Ь).
Например, если
С -И)(?)-О=
то если положить xi равным произвольному значению с, то все
решения имеют вид
(Xi \ / с \
1 = 1 2—4с I.
хз / \8—14с/
Система не имеет решений, если
р(А)<р(А:Ь).
Примеры таких систем:
С геометрической точки зрения всякое линейное уравнение
определяет гиперплоскость в n-мерном евклидовом пространстве Еп.
Если все т. гиперплоскостей пересекаются в одной точке, то эта
точка является единственным решением системы линейных урав-
нений. Если же при пересечении этих гиперплоскостей образуется
прямая (плоскость и т. д.), то все точки этой прямой (плоскости
ит. д.) являются решениями и одной (двум или более) переменным
можно присваивать произвольные значения. Если они не пересе-
каются (например, если это параллельные прямые в £2), то система
не имеет решения. Однородное уравнение определяет гиперпло-
скость, проходящую через начало координат. Если система имеет
единственное решение, то им является тривиальное решение —
точка начала координат.
Систему линейных неравенств
анх1 + а12х2 4* • • • 4" а1пхп
......................................... (Б.6.7)
ат1х1~\~ат2х2'}' • • • ~1Гатпхп ^Ьт
можно представить в виде матричного неравенства
Ах < Ь (Б.6.8)
(А, х и Ь определены выше) J. Эта система также либо имеет един-
ственное решение, либо неединственное решение, Либо не имеет
решений. Например, система
состоящая из двух неравенств xt Sj 6 и х^ > 6, имеет единственное
решение при xt = 6, тогда как система
не имеет решений, поскольку неравенства xt 2 и ац 4 не могут
выполняться одновременно. Примером системы, имеющей неедин-
ственное решение, может служить
(I Ж )<(!)
1 Основная литература по линейным неравенствам: [5,
6, 7].
556
Решениями этой системы являются все точки, лежащие ниже пря-
мых 2x1 + Зх2 = 7 и х, + 4х2 = 6.
Геометрически каждое линейное неравенство определяет зам-
кнутое полупространство в я-мерном евклидовом пространстве,
а система линейных неравенств определяет пересечение полупро-
странств. Такое пересечение называется многогранным выпуклым
множеством, если же это множество замкнуто, то оно называется
многогранником.
Одним из важных видов систем линейных однородных нера-
венств является
> 0, х2>0, ... хп >0,
где т = п, А = —I. Эта система определяет неотрицательный
ортант n-мерного евклидова пространства.
Приведем ряд важных теорем о системах линейных неравенств.
Согласно теореме Фаркаша, если при всех х, удовлетворяющих
однородным линейным неравенствам
Ах<0, (Б.6.9)
справедливо неравенство
сх<0, (Б.6.10)
то вектор-строка с является неотрицательной линейной комбина-
цией строк матрицы А, т. е.
с = уА, у>0. (Б.6.11)
Следовательно, возможно одно из двух: либо система неравенств
Ах<0, сх>0 (Б.6.12)
разрешима, либо существует решение системы
с=уА, у>0. (Б.6.13)
Тривиальной иллюстрацией теоремы является скалярный случай,
когда А и с есть скаляры. Тогда (Б.6.12) выполняется, если знаки
чисел А и с различны, а (Б.6.13) выполняется, если знаки Лис
совпадают.
Существует несколько важных теорем, касающихся двойствен-
ных систем однородных линейных неравенств
Ах<0, х>0 (Б.6.14)
уА > 0, у > 0
Одна из этих систем называется прямой, а другая — двойственной.
Согласно теореме об альтернативах для матриц, возможно одно
из двух: либо существует нетривиальное решение прямой системы,
либо существует такое решение двойственной системы, при котором
все неравенства выполняются как строгие неравенства. В частно-
сти, система
Ах<0, х>0 (Б.6.15)
не имеет решений тогда, и только тогда, когда существует нетри-
виальное решение у системы
уА>0, у>0 (Б.6.16)
557
Согласно ключевой теореме, двойственные системы всегда обла-
дают решениями х*, у*, при которых
Ax*_|_y*'>0 y*A-J-x*>0. (В-6.17)
В важном случае, когда А — кососимметрическая матрица (А =
== —А'), система линейных однородных неравенств
Ах<0, х>0, (Б.6.18)
имеет решение х*, при котором
—Ах*-|-х*>0. (Б.6.19)
Б-7. ЛИНЕЙНЫЕ ПРЕОБРАЗОВАНИЯ;
ХАРАКТЕРИСТИЧЕСКИЕ ЧИСЛА И ВЕКТОРЫ
Любая матрица А порядка т х п определяет некоторое линей-
ное преобразование n-мерного евклидова пространства в т-мерное
евклидово пространство. Это означает, что для любого вектора
х £ Ев существует единственный вектор у С £п, такой, что
у=Ах = А(х). (Б.7.1)
Это преобразование является линейным, так как
А (хЧ-х2) = АхЧ-Ах2 2)
А (Ах1) = ЛА (х1), ' ’ ‘ ’
где х1 и ха есть векторы в Еп, а. к — скаляр. Отметим, что А (0) = О
и что линейное преобразование отображает выпуклое множество
из Еп в выпуклое множество, принадлежащее пространству
Характеристическим (собственным) вектором квадратной мат-
рицы А называется такой ненулевой вектор х, который после пре-
образования А переходит в вектор, отличающийся от х лишь
на постоянный числовой множитель, т. е.
Ах = Ах. (Б.7.3)
Числовой множитель А называется характеристическим корнем
для А. Так как уравнение (Б.7.3) может быть представлено в виде
однородной системы уравнений
(А — А1)х = 0, (Б.7.4)
то нетривиальное решение этого уравнения существует лишь в том
случае, если
|А—А1| = 0 (Б.7.5)
(см. раздел 6.6). Уравнение (Б.7.5) называется характеристическим
уравнением. Если А — матрица порядка п X п, то характеристи-
ческое уравнение является алгебраическим уравнением степени п
относительно А:
|A-AI| = (-A)’»+a1(-A)n-1+...+an_I(-A)-|-an=0, (Б.7.6)
где aft — след k-ro порядка матрицы А, к = 1, . . п. Это урав-
нение имеет п не обязательно различных корней Aj, Aj, . . ., An,
558
причем некоторые из них могут быть комплексными. Каждому
из этих характеристических корней соответствует характеристи-
ческий вектор, определенный с точностью до постоянного множи-
теля. Так, например, характеристическое уравнение для матрицы
А = имеет ВИД Ха — ЗХ + 2 = 0. Корни этого уравне-
ния: = 1, Х2 = 2. Характеристическими векторами, соответ-
ствующими Xt и Х2, являются соответственно х1 = I С,_ ) и ха =
\— с/2/
= I 11 где с — произвольная постоянная. Постоянные часто
2/5с /
исключают из рассмотрения, вводя нормализованные векторы.
В данном примере нормализованными векторами являются
2/V5 \
-1/У5/
Сумма характеристических корней равна следу матрицы:
Xi + Xj-f- • • • Н-А.П = tr (А) — + ^22 + • • • ~1~апп —а1' (Б.7.7)
Произведение характеристических корней равно определителю
матрицы:
XjXa • • • Хл = | А |=<хп (Б.7.8)
Число ненулевых характеристических корней А совпадает с ран-
гом матрицы А. В частности, характеристическими корнями диа-
гональной матрицы являются элементы ее главной диагонали,
а характеристическими корнями идемпонентной матрицы являются
либо 0, либо 1. Если X — характеристический корень А, то X* —
характеристический корень A*, t — любое положительное целое
число (если А — невырожденная, то t — любое целое число).
Согласно теореме Кэли — Гамильтона, матрица А является
корнем своего собственного характеристического уравнения, т. е.
(-А)"+Ю1 (-А)"-‘+... +<Xn-i (-А)+<хп1=0. (Б.7.9)
Согласно теореме о доминантной матрице, характеристические кор-
ни матрицы А неотрицательны, если в любой строке ее диагональ-
ный элемент будет не меньше суммы абсолютных значений всех
остальных элементов этой строки:
ац> 2 1®и1> «=1, 2, ...,п. (Б.7.10)
i=/=i
Согласно теореме Рута — Гурвица, действительные части характе-
ристических корней матрицы А отрицательны тогда, и только тог-
да, когда положительны указанные ниже п определителей:
Р1 1 0 0 0...
Рз Ра Pi 1 0 ...
Р1>0. ₽1 1 к Рз РаГ >0,.... ₽5 Р* Рз р> Р1 • • • >0, (Б.7.11)
• > : i
Pan- -1 • •
559
где Pft — коэффициент] при № в характеристическом уравнении
к = 1, 2, . . п. Например, в случае, если п = 2, то теорема утвер-
ждает, что действительные части характеристических корней отри-
цательны тогда, и только тогда, когда след матрицы отрицателен,
а определитель ее положителен (поскольку = tr (А), р2 = I А j,
₽з = 0).
Если матрица А симметрическая, то все ее характеристические
корни вещественны, характеристические векторы взаимно ортого-
нальны и существует такая ортогональная матрица М, что
М'АМ = Л. (Б.7.12)
Здесь Л — это диагональная матрица, диагональными элементами
которой являются характеристические корни матрицы А. Ортого-
нальная матрица М называется модальной. Столбцами этой матрицы
являются нормализованные характеристические векторы матрицы
А. Например, симметрическую матрицу А =
можно привести к диагональному виду A=(q 2) ’ где 1^1 = 7>
(2 1 \
। 2/ •
Согласно теореме Фробениуса, если А — неразложимая матри-
ца с неотрицательными вещественными элементами, то существует
единственный вещественный неотрицательный характеристический
корень X*, превышающий по абсолютной величине все другие харак-
теристические корни X матрицы А, т. е. | X | X* Корень X*
является невозрастающей функцией любого элемента матрицы А.
Выполняется следующее неравенство:
п п
min 2 а»;<Х*<тах 2 аЦ- (Б. 7.13)
i i=l
Б-8. КВАДРАТИЧНЫЕ ФОРМЫ
Если А — квадратная симметрическая матрица, ах — вектор-
столбец, то квадратичной формой матрицы А называется
<?аХх)=х'Ах= 2 S aijZiXj^a^xl-};-
i=l з=1
4-022X24-... 4'annIn"b2ai2®iXa4*
4-2а1Эа:1хз4---F2an-in*n-i*n- (Б.8.1)
/1 3\
Например, если A=Ig I , то QA (х) = zJ4-4z^4-6ziz2,
Квадратичной формой диагональной матрицы D = (dfiij) является
п
"^djXf, представляющая собой просто взвешенную сумму квадратов.
з=1
560
Приводя сзммязцинеску^ матрицу клиаходальному виду (Б. 7.12),
получаем:
п
<?А (х) = х'Ах=±=у'М'АМу = у'Лу= 2 (Б.8.2)
' i=l ’
где М —модальная матрица, а у=М-1х=М'х. Следовательно, квад-
ратичную форму а (х) всегда можно представить в виде взвешенной
суммы квадратов, весами в которой являются характеристические
корни матрицы А.
Квадратичная форма Qa (х) называется положительно опре-
деленной, если Qa (х) > 0 при всех х 0; Qa (х) называется отри-
цательно определенной, если Qa (х) < 0 при всех х =# 0; она назы-
вается положительно полуопределенной, если Qa (х) > 0 при всех х
и если существуют такие х, что Qa (х) = 0; квадратичная форма
называется отрицательно^полуопределенной, если Qa (х) 0 при
всех х и если существуют такие х, что Qa (х) = 0; во всех остальных
случаях квадратичная форма называется неопределенной. Матрицу
А, соответствующую квадратичной форме, иногда называют поло-
жительно определенной (отрицательно определенной и т. д.), если
Qa (х) является положительно определенной (отрицательно опре-
деленной ит. Д.).
Квадратичная форма Qa (х) является положительно опреде-
ленной тогда, и только тогда, когда все характеристические корни
А положительны или, что эквивалентно, если все главные миноры
матрицы А положительны. Квадратичная форма Qa (х) отрица-
тельно определена тогда, и только тогда, когда все характеристи-
ческие корни А отрицательны или, что эквивалентно, когда у глав-
ных миноров чередуются знаки «плюс» и «минус». Квадратичная
форма положительно полуопределена тогда, и только тогда, когда
все характеристические корни неотрицательны и по крайней мере
один из них равен нулю; она отрицательно полуопределена тогда,
и только тогда, когда все характеристические корни неположитель-
ны и по крайней мере один из них равен нулю.
Квадратичная форма Qa (х) является положительно (полу) опре-
деленной тогда, и только тогда, когда Q-a (х) отрицательно (полу)
определена. Если Qa (х) положительно определена, то обратная
матрица А-1 существует, a @a-i(x) является положительно опре-
деленной.
Пусть А — симметрическая матрица порядка п. Тогда квад-
ратичная форма, Qa (х), удовлетворяющая т линейным огра-
ничениям Вх = 0, где В — фиксированная матрица порядка
т X п (т < п) является положительно определенной лишь в том
случае, если знаки последних п — т главных миноров окаймлен-
ной матрицы
совпадают со знаком (—1)т, т. е. если т — четное (нечетное), то
все п — т главных миноров являются положительными (отрица-
тельными) числами. Эти условия можно представить в следующей
форме:
<-1>т|в; Аг|>0’ г='"+1.•••>". (Б-М
Зв—0270
561
Где Вг — матрица, составлейцйя йз йерйых г столбцов матрицы В
а Аг — матрица, составленная из первых г строк и столбцов матри-
цы А. Например, если т = 2, п = 4, то условия имеют вид
О О
О О
*11 *21
*12 *22
*13 *23
*11
*21
аи
“21
a3i
*12
*22
“12
“22
“32
*13
*23
“13
“23
“33
О
о
*11
*14
О
О
*21
*24
*11 • •• *14
*21 • • • *24
“11 • •• “14
“41 “U
0.
Если А — симметрическая матрица порядка л, удовлетворяю-
щая т линейным ограничениям Вх = 0, где В — матрица порядка
т X п (т < л), то А будет отрицательно определенной матрицей
тогда, и только тогда, когда знаки последних п — т главных мино-
ров окаймленной матрицы
/ ° В \
\В' А }
(Б.8.5)
чередуются, причем знак первого из этих миноров определяется
знаком (—Этиусловия можно представить в следующей форме:
(—-1)г| 9 I > 0 при ,, я, (Б.8,6)
| х>г А.? |
где Вг и Аг определяются так же, как было указано выше. В при-
веденном примере, где т = 2, я = 4, эти условия состоят в том,
что первый определитель должен быть отрицательным, а второй
положительным. ,
Б-9. ПРОИЗВОДНЫЕ ЮТ МАТРИЦ
При дифференцировании матриц и при дифференцировании
относительно матриц принимается ряд условных соглашений.
Во-первых, считают, что производной вектора-строки (век-
тора-столбца) относительно скалярной переменной также является
вектор-строка (вектор-столбец). Так, например, если х — это
вектор-столбец
x = (xi, га, (Б.9.1)
a t—скалярный параметр, от которою зависит х; (г = 1,..., я), то
dx ( dxi dx2, dxn \'
Во-вторых, принимают, что производной скалярной величины
относительно вектора-столбца (вектора-строки) является вектор-
строка (вектор столбец). Так, если скаляр у есть дифференцируе-
мая функция вектора-столбца х
y = /(x)^f (Т1, х2, ...,хп), (Б.9.3)
562
fo Лектором частные пройзЬодйык iiepBoto порядка — градиентом**
является вектор-строка
(х)=(х)- «.....(’)) • <Б-9-4)
Например, для линейной формы
Лс(х) = сх
dLe
дх
(х) = с,
а для квадратичной формы
<?А (х) = х'Ах
'^А ,
(Б.9.5)
(Б.9.6)
В обоих случаях производной скалярной величины относительно
вектора-столбца является вектор-строка. Производной билинейной
формы
ВА (w, x) = wAx,
(Б.9.7)
где w — вектор-строка, х — вектор-столбец, а А — матрица поряд-
ка т X л,
dBA(w, х) dBA(w, х)
л "г т-1- А у ~ А — — Ах
dx dw
(Б.9.8)
по вектору-столбцу (вектору-строке) является вектор-строка (век-
тор-столбец).
Третье условное соглашение состоит в том, что производной
скалярной величины по матрице порядка т X п является матрица
порядка п х т. Так, для билинейной формы (Б.9.7)
dBA (w, х)
---57-----= XW,
дА
(Б.9.9)
а если А — квадратная невырожденная матрица, то
ВА (W, х) = wC-A где С = А-1, (Б.9.10)
так что
дВА (w, х)
——=-C-ixwC-t. (Б.9.11)
Наконец, принимают, что производной вектора по вектору
является матрица. Так, производной градиента (Б.9.4) по гс-мерно-
му вектору-столбцу х является матрица Гессе порядка п X п:
36* 563
w w ’ (WW)_
dx2 ' dx \ dx /
J±(x)
dxi W
dzf
dx2 dxi
d2f
dxn dxi
&f d2f ,_x
taxf dx2 axi dxn 4 '
(X) J^(x)...^_(x)
3^1 3x2 dxn
(X) « (X)... «(X)
дхп дх2 dxn
(Б.9.12)
Например, матрицей Гессе квадратичной формы (Б.9.6) является
матрица 2А. Аналогично, если вектор-столбец ч ,
g=g(x) (Б.9.13)
состоит из т функций, зависящих от n-мерного вектора-столбца х,
то производной этого вектора по х является матрица Якоби поряд-
ка т X п:
3g
Зх
(Б.9.14)
3gm
дх2
Если, кроме того, xt (i = 1, . . ., п) зависят от параметра t, то
производная вектора-столбца g по скаляру t суть вектор-столбец
3g _ 3g dx
dt dx dt
[(Б. 9.15)
Согласно теореме о неявной функции, если имеются т непре-
рывно дифференцируемых функций п переменных — g (х) (т < п)
и если ранг матрицы Якоби равен числу строк, т. е.
(Б.9.16)
то систему уравнений g (х) = 0 можно разрешить относительно
некоторых т переменных, скажем xi, х2, . . ., представив их
в виде функций от остальных п— т переменных xm+i, хт+2, . . .
xt = hi{xm+i, хт+2, ..., хп), i= 1, 2, ..., т. (Д.9.17)
Библиография
К главе 3
1. Hancock Н., Theory of Maxima and Minima, Boston, Mass.,
Ginn and Co., 1917; Sec. ed. — Dover Publications, New York,
1960.
2. Courant R., Differential and Integral Calculus, Trans., New
York, Interscience Publishing Co., 1947.
3. H a d 1 e у G., Nonlinear and Dynamic Programming, Reading,
Mass., Addison-Wesley Publishing Co., Inc., 1964.
4. Samuelson P. A., Foundations of Economic Analysis, Cam-
bridge, Mass., Harvard University Press, 1947.
5. В u r g e r E., On Extrema with Side Conditions, Econometrica,
23 (1955), 451-452.
6. Apostol T., Mathematical Analysis, Reading, Mass., Addi-
son-Wesley Publishing Co., Inc., 1957.
7. Lipsey R. and Lancaster K., The General Theory of
the Second Best, Review of Economic Studies, 24 (1956), 11—32.
К главе 4
1. Kuhn H. W., and Tucker A. W-, Nonlinear Program-
ming, in «Proceedings of the Second Berkeley Symposium on
Mathematical Statistics and Probability», ed. J. Neyman,
Berkeley, Calif., University of California Press, 1951.
2. G r a v e s R. and Wolfe P., eds., Recent Advances in
«Mathematical Programming, New York», McGraw-Hill Book
Company, 1963.
3. H’a'dley G., Nonlinear and Dynamic Programming, Reading,
Mass., Addison-Wesley Publishing Co., Inc., 1964.
4. Kunzi H. P., and К r e 1 1 e W., Nonlinear Programming,
trans. F. Levin, Waltham, Mass., Blaisdell Publishing Cb., 1966,
5. Abadie J., ed., Nonlinear Programming, Amsterdam, North-
Holland Publishing Co., 1967.
6. H u r w i c z L., Programming in Linear Spaces, in «Studies in
Linear and Nonlinear Programming», ed. K.J. Arrow, L. Hurwicz
and H. Uzawa, Stanford, Calif., Stanford University Press, 1958.
565
7. Mangasarian 0. L., Nonlinear Programming Problems
with Stochastic Objective Functions, Management Science, 10
(1964), 353-359.
8. Mangasarian 0. L. and Rosen J. B., Inequalities
for Stochastic Nonlinear Programming Problems, Operations Re-
search, 12 (1964), 143-154.
9. A г г о w К. J. and Enthoven A. C., Quasi-Concave
Programming, Econometrica, 29 (1961), 779-800.
10. R о с к a f e 11 a r R. T. , Duality in Nonlinear Programming,
in «Mathematics of the Decision Sciences», Part I, ed. G. B. Dant-
zig and A. F. Veinott, Ir. Providence, R. I., American Mathemati-
cal Society, 1968.
11. А г г о w K. J., H u r w i c z L. and U z a w a H., Con-
straint Qualification in «Maximization Problems», Naval Research
Logistic Quarterly, 8 (1961), 175-191.
12. U z a w a H., The Kuhn—Tucker Theorem in Concave Program-
ming, in «Studies in Linear and Nonlinear Programming», ed.
К. I. Arrow, L. Hurwicz and H. Uzawa, Stanford, Calif. Stanford
University Press, 1958.
13. John F., Extremum Problems with Inequalities as Subsidiary
Conditions, in «Studies and Essays», Courant Anniversary Volume,
New York, Interscience Publishers, 1948.
14. D о r n W. S., Nonlinear Programming — A Survey, Manage-
ment Science, 9 (1963), 171—208.
15. Zoutendijk G., Nonlinear Programming, A Numerical
Survey, J. SIAM, Control, 4 (1966), 194—210.
16. Wolfe P., Methods of Nonlinear Programming, in «Nonlinear
Programming», ed. J. Abadie, Amsterdam, North-Holland Publis-
hing, Co., 1967.
17. W i 1 d e D. J. and Beightler C. S., Foundations of
Optimization, Englewood Cliffs, N. J., Prentice-Hall, Inc., 1967.
18. В о о t J. C. G., Quadratic Programming, Amsterdam, North-
Holland Publishing Co., Chicago, Ill., Rand McNally and Co.,
1964.
19. К a r 1 i n S., Mathematical Methods and Theory in «Games,
Programming and Economics», Reading, Mass., Addison-Wesley
Publishing Co., Inc., 1959.
20. G e о f f r i о n A., Proper Efficiency and the Theory of Vector
Maximization, Journal of Mathematical Analysis and Applica-
tions, 22 (1968), 618—630.
21. Markowitz H., Portfolio Selection Cowles Foundation Mo-
nograph № 16, New York, John Wiley and Sons, Inc., 1959.
К главе 5
1. С a 1 e D., The Theory of Linear Economic Models, New York,
McGraw-Hill Book Company, Inc., 1960.
2. Hadley G., Linear Programming, Reading, Mass., Addison-
Wesley Publishing Co., Inc., 1962.
566
3. Dantzig G. В., Linear Programming and Extensions, Prin-
ceton, N. J., Princeton University Press, 1963.
4. Gass S. I., Linear Programming: Methods and Applications,
Second Edition, New York, McGraw-Hill Book Company, Inc.,
1964.
•5. Simonnard M., Linear Programming, trans, by W. S. Je-
well, Englewood Cliffs, N. J., Prentice-Hall, Inc., 1966.
6. Duffin R. J., Infinite Programs, in «Linear Inequalities and
Related Systems», Annals of Mathematics Study № 38, ed.
H. W. Kuhn and A. W. Tucker, Princeton, N. J., Princeton
University Press, 1956.
,7-Charnes A. and Cooper W. W., Chance Constrained
Programming, Management Science, 6 (1959), 73—80.
8. Madansky A., Inequalities for Stochastic Linear Program-
ming Problems, Management Science, 6 (1960), 197—204.
9. Madansky A., Methods of Solution of Linear Programs under
Uncertainty, Operations Research, 10 (1962), 463—471.
10. Dantzig G. B., On the Significance of Solving Linear Program-
ming Problems with Some Integer Variables, Econometrica, 28
(1960), 30-44.
11. В a 1 i n s к i M. L., Integer Programming: Methods, Uses,
Computations, Management Science, 12 (1965), 253—313.
12. D a n t z i g G. B., Maximization of a Linear Function of Vari-
ables Subject to Linear Inequalities, in «Activity Analysis of Pro-
duction and Allocation», Cowles Commission Monograph 13,
ed. T. C. Koopmans, New York, John Wiley and Sons, Inc., 1951.
13. Samuelson P. A., Frank Knight’s Theorem in Linear Pro-
gramming, Santa Monica, Calif., Rand Corp., 1960. Reprinted
in The Collected Scientific Papers of Paul A. Samuelson», ed.
J. Stiglitz, Cambridge, Mass., M. I. T. Press, 1966.
14. Klein B., Direct Use of Extremal Principles in Solving Cer-
tain Optimizing Problems Involving Inequalities, Journal of the
Operations Research Society of America, 3 (1955), 168—175.
15. Stigler G. J., The Cost of Subsistence, Journal of Farm Eco*
nomics, 27 (1945), 303—314.
16. Kelley J. E., Jr., An Application of Linear Programming to
Curve Fitting, J. SIAM, 6 (1958), 15—22.
17. Fisher W. D., A Note on Curve Fitting with Minimum Devi-
ations by Linear Programming, Journal of the American Statistical
Association, 56 (1961), 359—362.
18. F 1 о о d M. M., The Travelling Salesman Problem, Operations
Research, 4 (1956), 61—75.
19. F о r d L. R., Jr. and Fulkerson D. R., Flows in Nett
works, Princeton, N. J., Princeton University Press, 1962.
К главе 6
1. Von Neumann J. and Morgenstern O., Theory
of Cames and Economic Behavior, Princeton, N. J., Princeton
University Press, 1944.
567
2. L u c e R. D. and H. R a i f f a, Carnes and Decisions, New
York, John Wiley and Sons, Inc., 1957.
3. S h u b i к M., ed., Came Theory and Related Approaches to
Social Behavior, New York, John Wiley and Sons, Inc., 1964.
4. Dresher M., Tucker A. W. and Wolfe P., eds.,
Contributions to the Theory of Games, Annals of Mathematics
Studies, 3, № 39, Princeton, N. J., Princeton University Press,
1957.
5. D r e s h e r M., S h a p 1 e у L. W. and Tucker A. W,
eds., Advances in Game Theory, Annals of Mathematics Studies,
№ 52, Princeton, N. J., Princeton University Press, 1964.
6. К a r 1 i n S., Mathematical Methods and Theory in Games,
Programming, and Economics, Reading, Mass, Addison-Wesley
Publishing Co., Inc., 1959.
7. Von Neumann J., Zur Theorie der Gesellschaftspiele,
Mathematische Annalen, 100 (1928), 295-300, translated in «Con-
tributions to the Theory of Games», Annals of Mathematics Stu-
dies, 4, K° 40, eds. A. W. Tucker and D. Luce, Princeton, N. J.,
Princeton University Press, 1959.
8. Gale D., Kuhn H. W. and Tucker A. W., Linear
Programming and the Theory of Games, in «Activity Analysis
of Production and Allocation», Cowles Monograph 13,
ed. T. C. Koopmans, New York, John Wiley and Sons, Inc.,
1951.
i Nash J. F., Non-Cooperative Games, Annals of Mathematics,
54 (1951), 286-295.
16. N a s h J. F., Equilibrium Points in n-person Games, Proc.
Nat. Acad. Sci., U. S. A., 36 (1950a), 48-49.
11. T u с к e r A. W. and Luce D., eds., Contributions to the
Theory of Games, Annals of Mathematics Studies, k, № 40, Prin-
ceton, N. J., Princeton University Press, 1959.
12. Nash J. F., The Bargaining Problem, Econometrica, 18 (1950b),
155—162.
13. Harsanyi J. C., Approaches to the Bargaining Problem
Before and After the Theory of Games, A Critical Discussion of
Zeuthen’s, Hick’s and Nash’s Theories, Econometrica, 24 (1956),
144—157.
14. H a r s anyi J. C., A Bargaining Model for the Cooperative
n-person Game, in «Contributions to the Theory of Games»,
Annals of Mathematics Studies, 4, № 40, eds. A. W. Tucker
and D. Luce, Princeton, N. J., Princeton University Press,
1959.
15. Harsanyi J. C., A Simplified Bargaining Model for the
n-person Cooperative Game, International Economic Review,
4 (1963), 194—220.
16. Aumann R. J., A Survey of Cooperative Games Without Side
Payments, in «Essays in Mathematical Economics in Honor of
Oskar Morgenstern», ed. M- Shubik, Princeton, N. J., Princeton
University Press, 1967.
568
17. L u c a s W. F., A Game With No Solution, RM-5518-PR, San-
ta Monica, Calif., Rand Corp., 1967.
18. S h a p 1 e у L. S., A Value for n-Person Games, in «Contributi-
ons to the Theory of Games», Annals of Mathematics Studies, 2,
№ 28, eds. H. Kuhn and A. W. Tucker, Princeton, N. J., Princeton
University Press, 1953.
19. Selten R., Valuation of n-person Games, in «Advances in
Game Theory», Annals of Mathematics Studies, № 52, ed. M. Dres-
her, L. W. Shapley and A. W. Tucker, Princeton, N. J., Princeton
University Press, 1964.
20. S h u b i к M., Edgeworth Market Games, in «Contributions t®
the Theory of Games», Annals of Mathematics Studies, 2, № 40,
eds. A. W. Tucker and D. Luce, Princeton, N. J., Princeton Uni-
versity Press, 1959.
21. D e b r e u G. and Scarf H., A Limit Theorem on the Core
of an Economy, Intenational Economic Review, 4 (1963), 235 — 246.
,22 . A u m a n n R. J., Markets with a Continuum of Traders, Eco-
nometrica, 32 (1964), 39—50.
23. S h a p 1 e у L. S. and S h u b i к M., Concepts and Theories
of Pure Competition, in «Essays in Mathematical Economics in
Honor of Oskar Morgenstern», ed. M. Shubik, Princeton, N. J.,
’^Princeton University Press, 1967.
24. M i 1 n о r J., Games Against Nature, in «Decision Processes»,
ed. R. M. Thrall, С. H. Coombs and R. L. Davis, New York, John
Wiley and Sons, Inc., 1954.
К главе 7
1. H i cks J. R., Value and Capital, Second Edition, London,
, Oxford University Press, 1946.
2. Hicks J. R., A Revision of Demand Theory, London, Ofxord
University Press, 1956.
3. Samuelson P. A., Foundations of Economic Analysis,
Cambridge, Mass., Harward University Press, 1947.
4. W о 1 d H. and J u r e e n L., Demand Analysis, New York,
John Wiley and Sons, Inc., 1953.
5. L u c e R. D. and R a i f f a H., Games and Decisions, New
York, John Wiley and Sons, Inc., 1957.
6. Uz a w a H., Preference and Rational Choice in the Theory of
Consumption, in «Mathematical Methods in the Social Sciences»,
1959, ed. K. J. Arrow, S. Karlin and P. Suppes, Standford, Calif.,
Standford University Press, 1960.
7. Houthakker H. S., The Present State of Consumption
Theory, Econometrica, 29 (1961), 704—740.
8. F i s h b u r n P. C., Decision and Value Theory, New York,
John Wiley and Sons, Inc., 1964.
9. D e b r e u G., Representation of a Preference Ordering by a
Numerical Function, in «Decision Processes», ed. R. M. Thrall,
С. H. Coombs and R. L. Davis, New York, John Wiley and Sons,
Inc., 1954.
569
10. D е Ь r e u G., Theory of Value, Cowles Foundation Monograph,
17, New York, John Wiley and Sons, Inc., 1959.
11. Slutsky E., Sulla Teoria del Bilancio del Consumatore,
Giornale degli Economist!., 51 (1915), 19—23, translated as «On
the Theory of the Budget of the Consumer», in «Readings in Price
Theory», ed. G. Stigler and K. Boulding. Homewood, Ill., Richard
D. Irwin, Inc., 1952.
12. Frisch R., A Complete Scheme for Computing All Direct and
Cross Demand Elasticities in a Model with Many Sectors, Econo-
metrica, 27 (1959), 177—196.
13. Barten A. P., Consumer Demand Functions Under Conditi-
ons of Almost Additive Preferences, Econometrica, 32 (1964),
1-38.
14. M о s a к J. L., On the Interpretation of the Fundamental
Equation in Value Theory, in «Studies in Mathematical Economics
and Econometrics in Memory of Henry Schultz», ed. O. Lange,
F. McIntyre and T. 0. Yntema, Chicago, Ill., University of Chica-
go Press, 1942.
15. Samuelson P. A., Consumption Theory in Terms of Revea-
led Preference, Economica, 15 (1948), 243—253.
16. H о u t h а к к e r H. S., Revealed Preference and the Utility
Function, Economica, 17 (1950), 159 —174.
17. N e w m a n P., Complete Ordering and Revealed Preference,
Review of Economic Studies, 27 (1960), 65—77, 202—205.
18. Georgescu-Roegen N., The Pure Theory of Consumer
Behavior, Quarterly Journal of Economics, 50 (1936), 545—593.
19. Samuelson P. A., The Problem of Integrability in Utility
Theory, Economica, 17 (1950), 355—385.
20. Marschak J., Rational Behavior, Uncertain Prospects, and
Measurable Utility, Econometrica, 18 (1950), 111 —141.
21. H e r s t e i n I. N. and Milnor J., An Axiomatic Approach
to Measurable Utility, Econometrica, 21 (1953), 291—297.
22. Edwards W., The Theory of Decision Making, Psychological
Bulletin, 5 (1954), 380—417.
23. E d w a r d s W., Behavioral Decision Theory, Annual Review
of Psychology, 12 (1961), 473—498.
24. S u p p e s P. and W i n e t M., An Axiomatization of Utility
Based on the Notion of Utility Differences, Management Science,
1 (1955), 259-270.
25. H о u t h а к к e r H. S., Additive Preferences, Econometrica,
28 (1960), 244-257.
26. P a t i n к i n D., Money, Interest, and Prices, Second Edition,
New York, Harper and Row, Publishers, 1965.
27. T о b i n J., A Survey of the Theory of Rationing, Econometrica,
20 (1952), 521—553.
28. Von Neumann J. and Morgenstern O., Theory
of Games and Economic Behavior, Second Edition, Princeton,
N.J., Princeton University Press, 1947.
570
К главе 8
1. Hicks J. R., Value and Capital, Second Edition, London,
Oxford University Press, Inc., 1946.
2. Samuelson P. A., Foundations of Economic Analysis, Cam-
bridge, Mass., Harvard University Press, 1947.
3. Cohen K. J. and Cyert R. M., The Theory of the Firm,
Englewood Cliffs, N. J., Prentice-Hall, Inc., 1965.
4. Walters A. A., Production and Cost Functions: An Economet-
ric Survey, Econometrica, 31 (1963), 1—66.
5. Frisch R., Theory of Production, Skokie, Ill., Rand-McNally
&Co., 1965.
6. Brown M., ed., The Theory and Empirical Analysis of Pro-
duction, Studies in Income and Wealth, vol. 31, National Rureau
of Economic Research, New York, Columbia University Press,
1967.
7. Douglas P. H., Are There Laws of Production?, American Eco-
nomic Review, 38(1948), 1—41.
8. N e r 1 о v e M., Estimation and Identification of Cobb-Douglas
Production Functions, Skokie, Ill., Rand-McNally & Co., 1965.
9. L e о n t i e f W. W., The Structure of the American Economy,
1919—1939, Second Edition, New York, Oxford University Press,
1951.
10. L e о n t i e f W. W. et al., Studies in the Structure of the
American Economy, New York, Oxford University Press, 1953.
11. CheneryH. B. and Clark P., Interindustry Economics,
New York, John Wiley and Sons., Inc., 1959.
12. К о о p m a n s T. C., ed., Activity Analysis of Production Al-
location, Cowles Commission Monograph 13, New York, John Wi-
ley and Sons, Inc., 1951.
13. M о r g e n s t e r n 0., ed., Economic Activity Analysis, New
York, John Wiley and Sons, Inc., 1954.
14. Dorfman R., S a m u e 1 s о n P. A. and Solow R. M.,
Linear Programming and Economic Analysis, New York, McGraw-
Hill Book Company, 1958.
15. В о u 1 d i n g К. E. and Spivey A. W., eds., Linear Pro-
gramming and the Theory of the Firm, New York, The Macmillan
Company, 1960.
16. A г г о w K. J., Chenery H., Minhas B. and So-
low R. M., Capital—Labor Substitution and Economic Effi-
ciency, The Review of Economics and Statistics, 43 (1961), 225—250.
17. Nerlove M., Recent Empirical Studies of the CES and Rela-
ted Production Functions, in «The Theory and Empirical Analy-
sis of Production», Studies in Income and Wealth, Vol. 31, National
Bureau of Economic Research, ed. M. Brown, New York, Colum-
bia University Press, 1967.
18. В e a r D. V. T., Inferior Inputs and the Theory of the Firm,
Journal of Political Economy, 73 (1965), 287—289.
57,1
19. Felluer W, Competition Among the Few, New York,
Alfred A Knopf, Inc , 1949
20. S h u b i к M , Strategy and Market Structure, New York, John
Wiley and Sons, Inc , 1959
21. В i s h о p R L , Duopoly Collusion or Warfare?, American
Economic Review, 50 (1960), 933—961
22. Baumol W. J, Business Behavior, Value, and Growth,
Revised Edition, New York, Harcourt, Brace and World, Inc ,
1967
К главе 9
1 H i с к s J R , Value and Capital, Second edition, New York,
Oxford University Press, 1946
2. Samuelson P A, Foundations of Economic Analysis,
Cambridge, Mass , Harvard University Press, 1947.
3. Koopmans T C, Three Essays on the State of Economic
Science, New York, McGraw-Hill Book Company, 1957.
4. Dorfman R, Samuelson P A. and S o-
1 о w R M , Linear Programming and Economic Analysis, New
York, McGraw-Hill Company, 1958
5 Debreu G, Theory of Value, Cowles Foundation Monograph
17, New York, John Wiley and Sons, Inc , 1959
6. KuenneR E, The Theory of General Economic Equilibrium,
Princeton, N J , Pnnceton University Press, 1963.
7. Morishima M, Equilibrium, Stability, and Growth, A
Multi-Sectoral Analysis, Oxford, The Clarendon Press, 1964.
8. Nikaido H, Convex Structures and Economic Theory, New
York, Academic Press, Inc , 1968
9. Quirk J and Saposnik R, Introduction to General
Equilibrium Theory and Welfare Economics, New York,
McGraw-Hill Book Company, 1968
10. Walras L , Elements of Pure Economics, Trans W. Jaffe, Ho-
mewood, Ill , Richard D Irwin, Inc , 1954
11. P a t i n к i n D , Money, Interest, and Prices, Second edition,
New York, Harper and Row, Publishers, 1965.
12. Wald A , On Some Systems of Equations of Mathematical Eco-
nomics, Econometrica, 19 (1951), 368—403
13. M с К e n z i e L W , On Equilibrium m Graham’s Model of
World Trade and Other Competitive Systems, Econometrica, 22
(1954), 147—161
14. К u h n H W , On a Theorem of Wald in «Lineal Inequalities
and Related Systems», Annals of Mathematics Study X» 38, ed.
H W Kuhn and A W Tucker, Princeton, N J , Princeton Uni-
versity Press, 1956
15 LeontiefW W, The Structure of the American Economy,
1919—1939, Second edition,'New York, Oxford University Press,
1951.
16 Leontief W. W, Input-Output Economics, New York,
Oxford University Press, 1966.
572
17. Leontief W W и др, Studies in the Structure of the Ame-
rican Economy, New York, Oxford University Press, 1953 Имеет-
ся русск перев Леонтьев В В. и др, Исследования
структуры американской экономики, М., Госстатиздат, 1958.
18. Chenery Н В and Clark Р G-, Interindustry Eco-
nomics, New York, John Wiley and Sons, Inc , 1959 Имеется
русск перев • Ченери X и Кларк И, Экономика
межотраслевых связей, М , ИЛ, 1962
19 G а 1 е D , The Theory of Linear Economic Models, New York,
McGraw-Hill Book Company, 1960
20 Samuelson P A, Abstract of a Theorem Concerning Sub-
stitutability in Open Leontief Models, in «Activity Analysis of
Production and Allocation», Cowles Commission Monograph
13, ed T C Koopmans, New York, John Wiley and tSons, 1951.
21. Arrow К J, Alternative Proof of the Substitution Theorem
for Leontief Models in the General Case in «Activity Analysis of
Production and Allocation», Cowles Commission Monograph 13,
ed T C Koopmans, New York, John Wiley and Sons, Inc , 1951.
22. Stopler W F and Samuelson P A, Protection
and Real Wages, Review of Economic Studies, 9 (1941), 58—73.
23. Rybczynski T M, Factor Endowment and Relative
Commodity Prices, Econometrica, 22 (1955), 336—341
24. К e m p M C , The Pure Theory of International Trade, Engle-
wood Cliffs, N J , Prentice Hall, Inc , 1964
25. J о n e s R W , Duality m International Trade, A Geometrical
Note, Canadian Journal of Economics and Political Science, 31
(1965a), 390—393
26. J о n e s R W , The Structure of Simple General Equilibrium
Models, Journal of Political Economy, 73 (1965b), 557—572
27 Arrow К J and D e b r e u G , Existence of an Equilib-
rium for a Competitive Economy, Econometrica, 22 (1954), 265 —
290
28 Arrow К J, Economic Equilibrium, International Encyclo-
pedia of the Social Sciences, Vol 4, New York, The Macmillan
Company and The Free Press, 1968, 376—388.
29. Edgeworth F Y, Mathematical Psychics, London, Rout-
ledge and Kegan Paul, Ltd , 1881
30. Edgeworth F Y, Papers Relating to Political Economy,
London, Macmillan and Co , Ltd , 1925
31. L a n g e О and Taylor F, On the Economic Theory of
Socialism, Minneapolis, Minn , University of Minnesota Press,
1938.
32 ArrowK J and Hurwicz L, On the Stability of Com-
petitive Equilibrium, I Econometrica, 26 (1958), 522—552
33. ArrowK J , В 1 о c k J D and Hurwicz L, On the
Stability of Competitive Equilibrium, II», Econometrica, 27 (1959),
82—109
34. U z a w a H , Walras Tatonnement in the Theory of Exchange,
Review of Economic Studies, 27 (1960), 182—194.
573
35. tJ z a w а Й., The Stability of Dynamic Processes, ЙсопотеМса
29 (1961), 617—631.
36. N e g i sh i T., On the Formation of Prices, International Eco-
nomic Review, 2 (1961), 122—126.
3*7 . N e g i s h i T., The Stability of a Competitive Equilibrium,
A Survey Article, Econometrica, 30 (1962), 635—669.
38. H a h n F., On the Stability of a Pure Exchange Equilibrium,
International Economic Review, 3 (1962), 206—213.
39. H a h n F. and N e g i s h i T., A Theorem on Non-Tatonne-
ment Stability, Econometrica, 30 (1962), 463—469.
40. Von Neumann J.,A Model of General Equilibrium, Review
of Economic Studies, 13 (1945), 1—9.
41. К e m e n у J. G., Morgenstern 0. and Thomp-
son G. L., A Generalization of the von Neumann Model of an
Expanding Economy, Econometrica, 24 (1956), 115—135.
42. G a 1 e D., The Closed Linear Model of Production in «Linear
Inequalities and Related Systems», Annals of Mathematics Study,
№38,ed. H. W. Kuhn and A. W. Kucker, Princeton, N. J., Prin-
ceton University Press, 1956.
43. Scarf H., Some Examles of Global Instability of the Compe-
titive Equilibrium, International Economic Review, 1 (1960),
157-172.
44. Samuelson P. A., The Stability of Equilibrium, Compara-
tive Statics and Dynamics, Econometrica, 9 (1941), 97—120.
45. Samuelson P. A., The Relation Between Hicksian Stabili-
ty and True Dynamic Stability, Econometrica, 12 (1944), 256—
К главе 10
1. Samuelson P. A., Foundations of Economic Analysis,
Cambridge, Mass., Harward University Press, 1947.
2. Boulding K., Welfare Economics, in «А Survey of Contem-
porary Economics», Vol. II, ed. B. F, Haley, Homewood, Ill.,
Ij. Richard D. Irwin, Inc., 1952.
3. Graaff J. deV., Theoretical Welfare Economics, Cambridge,
, Mass., Cambridge University Press, 1957.
4, Koopmans T. C., Three Essays on the State of Economic
Science, New York, McGraw-Hill Book Company, 1957.
.^Little L. M. D., A Critique of Welfare Economics, Second
' Edition, Oxford, The Clarendon Press, 1957.
K, Rothenberg J., The Measurement of Social Welfare, Engle-
\ wood Cliffs, N.J., Prentice-Hall, Inc., 1961.
7. Mishan E. J., Welfare Economics, New York, Random Hou-
se, Inc., 1964.
8. Scitovsky T., Papers on Welfare and Growth, Stanford,
Calif., Stanford University Press, 1964.
9. Bergson A., Essays in Normative Economics, Cambridge,
Mass., Harvard University Press, 1966.
574
10. Q u i rk J. and Saposnik ft., introduction to General
Equilibrium Theory and Welfare Economics, New York, McGraw-
Hill Book Company, 1968.
11. D a h 1 R. A. and Lindblom С. E., Politics, Economics
and Welfare, New York, Harper and Row, Publishers, 1963.
12. D о w n s A., An Economic Theory of Democracy, New York,
Harper and Row, Publishers, 1957.
13. В 1 а с к D., The Theory of Committees and Elections, Cambridge,
Mass., Cambridge University Press, 1958.
14. А г г о w K. J., Social Choice and Individual Values, Second
Edition, Cowles Foundation Monograph 12, New York, John Wi-
5 ley and Sons, Inc., 1963.
15. Baumol W. J., Welfare Economics and the Theory of the
State, Second Edition, Cambridge, Mass., Harvard University
Press, 1965.
16. H a r s a n у i J. C., Cardinal Welfare, Individualistic Ethics,
and Interpersonal Comparisons of Utility, Journal of Political
Economy, 63 (1955), 309—321.
17. Inada K.-L, On the Economic Welfare Function, Econome-
trica, 32 (1964), 316-338.
18. В a t о r F., The Simple Analytics of Welfare Maximization,
American Economic Review, 47 (1957), 22—59.
19. Kenen P. B., On the Geometry of Welfare Economics, Quar-
t terly Journal of Economics, 71 (1957), 426—447.
20. N e w m a n P., The Theory of Exchange, Englewood Cliffs,
N. J., Prentice-Hall, Inc., 1965.
21. D e b r e u G. and Scarf H., A Limit Theorem on the Core
of an Economy, International Economic Review, 4 (1963), 235—
246.
22. D e b r e u G., On a Theorem of Scarf, Review of Economic Stu-
dies, 30 (1963), 177—180.
23. A u m a n n R. J., Markets with a Continuum of Traders, Eco-
nometrica, 32 (1964), 39—50.
24. A u m a n n R. J., Existence of Competitive Equilibrium in a
Market with a Continuum of Traders, Econometrica, 34 (1966),
1—17.
25. V i n d K., Edgeworth Allocations in an Exchange Economy,
International Economic Review, 5 (1964), 165 —177.
t£6. Shapley L. S. and S h u b i к M., Concepts and Theories
of Pure Competition, in «Essays in Mathematical Economics in
j,, Honor of Oskar Morgenstern», ed. M. Shubik, Princeton, N.Jy
, Princeton University Press, 1967.
28. Samuelson P. A., Social Indifference Curves, Quarterly
Journal of Economics, 70 (1956), 1—22.
28. G о r m a n W. M., Are Social Indifference Curves Convex?,
Quarterly Journal of Economics, 73 (1959), 485—496.
29» N e g i s h i T., On Social Welfare Function, Quarterly Journal
of Economics, 77 (1963), 156 —158.
575
30. Hotelling H., The General Welfare in Relation to Problems
of Taxation and Railway and Utility Ratos, Econometrica, 6 (1938).
242-269.
31. R u g g 1 e s N., The Welfare Basis of Marginal Cost Pricing;
Further Developments in Marginal Cost Pricing, Review of Eco-
nomic Studies, 17 (1949—1950), 29—46 and 107—126.
32. N e 1 s о n J. R., ed., Marginal Cost Pricing in Practice, Engle-
wood Cliffs, N.J., Prentice-Hall., Inc., 1964.
33. Lipsey R. G. and Lancaster K., The General Theory
of the Second Best, Review of Economic Studies, 24 (1956), 11—32.
34. A г г о w K. J., An Extension of the Basic Theorems of Classi-
cal Welfate Economics, «Proceedings of the Second Berkeley Sym-
posium on Mathematical Statistics and Probability», ed. J. Ney-
man, Berkeley, University of California Press, 1951.
35. Koop m'a ns T. C., Analysis of Production as an Efficient
Combinations of Activites, in «Activity Analysis of Production
and. Allocation», Cowles Commission Monograph 13, ed. T. C.
Koopmans, New York, John Wiley and Sons, Inc., 1951.
36. Arrow K. J. and D e b r e u G., Existence of an Equili-
brium for a Competitive Economy, Econometrica, 22 (1964), 265—
290.
37. M с К e n z i e L. W., On Equilibrium in Graham’s Model of
World Trade and Other Competitive Systems, Econometrica, 22
(1954), 147—166.
38. M с К e n z'i e L. W., On the Existence of General Equilibrium
for^a Competitive Market, Econometrica, 27 (1959), 54—71.
39. Gale D., The Law of Supply and Demand, Mathematica Scan-
dinavia, 3 (1955), 155—169.
40. Gale D., The Theory of Linear Economic Models, New York,
McGraw-Hill Book Company, 1960.
41. Nikaido H., On the Classical Multilateral Exchange Pro-
blem, Metroeconotnica, 8 (1956), 135—145.
42. Nikaido H., Convex Structures and Economic Theory, New
York, Academic Press Inc., 1968.
43. D e b r e u G., Theory of Value, Cowles Foundation Monograph,
17, New York, John Wiley and Sons, Inc., 1959.
44. Debreu G., New Concepts and Techniques for Equilibrium
Analysis, International Economic Review, 3 (1962), 257—273.
45. N e g i s h i T., Welfare Economics and Existence of an Equili-
brium for a Competitive Economy, Metroeconomica, 12 (1960),
92—97.
46. Barone E., The Ministry of Production in the Collectivist
State (in Italian), 1908. Translated in «Collectivist Economic Plan-
ning», ed. F. A. von Hayek, London, Routledge & Kegan Paul,
Ltd., 1935.
47. Dickinson H. D., Price Formation in a Socialist Economy,
Economic Journal, 43 (1933), 237—250.
48. Dickinson H. D., Economics of Socialism, Oxford, Oxford
University Press, 1939.
576
49. D о b b M , Economic Theory and the Problem of the Socialist
Economy, Economic Journal, 43 (1933), 588—598.
50. D о b b M , Political Economy and Capitalism, London, Rout-
ledge and Kegan Paul, ltd., 1937.
51. Lange О and Taylor F. M., On the Economic Theory
of Socialism, ed. B. Lippincott, Minneapolis, Minn., University
of Minnesota Press, 1938.
52. Lerner A. P., The Economics of Control, New York, The
Macmillan Company, 1944.
53. M а к о w e r H., Activity Analysis and the Theory of Economic
Equilibrium, London, Macmillan & Co , Ltd , 1957.
54. M e a d e J. E , Trade and Welfare, New York, Oxford Univer-
sity Press, 1955.
55. В a t о r F., The Anatomy of Market Failure, Quarterly Jour-
nal of Economics, 72 (1958), 351—379.
56. Samuelson P. A, The Pure Theory of Public Expenditure,
Review of Economics and Statistics, 36 (1954), 387—390.
57. S a m u e 1 s о n P. A., Diagrammatic Exposition of a Theory
of Public Expenditure, Review of Economics and Statistics, 37
(1955), 350—356.
58. Samuelson P. A, Aspects of Public Expenditure Theories,
Review of Economics and Statistics, 40 (1958), 332—338.
59. Buchanan J. M., The Demand and Supply of Public Goods,
Chicago, Ill., Rand McNally and Co., 1968.
60. Farrell M J., The Convexity, Assumption in the Theory of
Competitive Markets, Journal of Political Economy, 67 (1959),
377-391.
61. Rothenberg J., Nonconvexity, Aggregation, and Pareto
Optimality, Journal of Political Economy, 68 (1960), 435—468.
62. В a t о r F., On Convexity Efficiency, and Markets, Journal of
Political Economy, 69 (1961), 480—483.
63. К о о p m a n s T. C., Convexity Assumptions, Allocative
Efficiency, and Competitive Equilibrium, Journal of Political Eco-
nomy, 69 (1961), 478—479.
64. Malinvaud E, Capital Accumulation and Efficient Allo-
cation of Resources, Econometrica, 21 (1953); 233—268.
65. Arrow K. J., The Role of Securities in theOptimal Allocation
of Risk Bearing, Review of Economic Studies, 31 (1964), 91—96.
К главе 11
1. Pontryagin L. S., Boltyanskii V. G., G a m-
krelidze R. V. and Mischenko E. F., The Mathe-
matical Theory of Optimal Processes, trans, by K. N. Trirogoff,
New York, Interscience Publishers, 1962.
2. Z a d e h L. A. and DesoerC A, Linear System Theory,
The State Space Approach, New York, McGraw-Hill Book Com-
panny, 1963.
37-0270
577
3. F е 1 d b a u m A. A., Optimal Control Systems, New York,
Academic Press Inc., 1965.
4. Athans M. and Fa lb P. L., Optimal Control, New York,
McGraw-Hill Book Company, 1966.
5. H e s t e n e s M. R-, Calculus of Variations and Optimal Con-
trol Theory, New York, John Wiley and Sons, Inc., 1966.
6. Lee E. B., and Markus L., Foundations of Optimal Con-
trol Theory, New York, John Wiley and Sons, Inc., 1967.
7 Bellman R. and К a 1 a b a R., eds., Selected Papers on
Mathematical Trends in Control Theory, New York, Dover
Publications, Inc., 1964.
8. О 1 d e n b u r g e r R., ed., Optimal and Self-Optimizing Con-
trol, Cambridge, Mass., The M. I. T. Press, 1966.
9. C h a n g S. S. L., Synthesis of Optimal Control Systems, New
York, McGraw-Hill Book Company, 1961.
10. A r i s R., Discrete Dynamic Programming, New York, Blais-
dell, 1964.
11. Fan L. T. and Wang C. S., The Discrete Maximum Prin-
ciple, New York, John Wiley and Sons, Inc., 1964.
12. W i 1 d e D. J. and Beightler C. S., Foundations of
Optimization, Englewood Cliffs, N. J., Prentice-Hall, Inc.,
1967.
13. А о к i M., Optimization of Stochastic Systems, New York,
Academic Press Inc., 1967.
14. К u s h n e r H. J., Stochastic Stability and Control, New York,
. Academic Press Inc., 1967.
15. В e 1 1 m a n R., Adaptive Control Processes, A Guided Tour,
Princeton, N. J., Princeton University Press, 1961.
16. M i s h к i n E. and Braun L., Jr., Adaptive Control Sys-
tems, New York, McGraw-Hill Book Company, 1961.
17. Murphy R. E., Jr., Adaptive Processes in Economic Systems,
New York, Academic Press Inc., 1965.
К главе 12> ,
1. В 1 i s s G. A., Lectures on the Calculus of Variations, Chicago,
University of Chicago Press, 1946.
2. Gelfand I. M. and Fomin S. V., Calculus of Variations,
trans, from Russian by R. A. Silverman. Englewood Cliffs, N. J.,
Prentice-Hall, Inc., 1963.
3. DreyfusS. E., Dynamic Programming and the Calculus of
Variations, New York, Academic Press Inc., 1965.
4. Hestenes M. R., Calculus of Variations and Optimal Con-
trol Theory, New York, John Wiley and Sons, Inc., 1966.
5. Bellman R., Dynamic Programming, Princeton, N. J.,
Princeton University Press, 1957.
6. Bellman R., Adaptive Control Processes: A Guided Tour,
Princeton, N. J., Princeton University Press, 1961.
578
7. V a 1 e n t f n e F. A., The Problem of tagrange with Differential
Inequalities as Added Side Conditions, in «Contributions to the
Theory of the Calculus of Variations», 1933—1937. Chicago, Ill.,
University of Chicago Press, 1937.
8. M i e 1 e A., The Calculus of Variations in Applied Aerodynamics
and Flight Mechanics, in «Optimization Techniques», ed. G. Leit-
mann, New York, Academic Press Inc., 1962.
К главе 13
1. Bellman R., Dynamic Programming, Princeton, N. J.,
Princeton University Press, 1957.
2. Bellman R., Adaptive Control Processes: A Guided Tour,
Princeton, N. J., Princeton University Press, 1961.
3. Bellman R. and Dreyfus S., Applied Dynamic Prog
ramming, Princeton, N. J., Princeton University Press, 1962.
4. F e 1 d b a u m A. A., Optimal Control Systems, trans, from
Russian by A. Kraiman. New York, Academic Press Inc., 1965.
5. Nemhauser G., An Introduction to Dynamic Programming,
New York, John Wiley and Sons, Inc., 1966.
6. Kaufmann A. and С r u о n R., Dynamic Programming,
trans, from French by H. C. Sneyd, New York, Academic Press
Inc., 1967.
7. W h i t e D. J., Dynamic Programming, San Francisco, Calif.,
Holden-Day, Inc., 1969.
' 8. A r i s R., Discrete Dynamic Programming, Waltham, Mass.,
Blaisdell Publishing Co., 1964.
9. Pontryagin L. S., Boltyanskii V. G., Gam-
krelidze R. V. and Mischenko E. F., The
Mathematical Theory of Optimal Processes, trans, by
K. N. Trirogoff, New York, Interscience Publishers, John Wiley
and Sons, Inc., 1962.
10. G e 1 f a n d I. M. and Fomin S. V., Calculus of Varia-
tions, trans, by R. A. Silverman, Englewood Cliffs. N. J., Pren-
tice-Hall, Inc., 1963.
11. H e s t e n e s M., Calculus of Variations and Optimal Control
Theory, New York, John Wiley and Sons, Inc., 1966.
12. Dreyfus S., Dynamic Programming and the Calculus of Va-
riations, New York, Academic Press Inc., 1965.
13. В e г к о v i t z L. and Dreyfus S.,A Dynamic Program-
ming Approach to the Nonparametric Problem in the Calculus of
Variations, J. Math, and Meeh. 15 (1966), 83—100.
14. Aris R., The Optimal Design of Chemical Reactors, New York,
Academic Press Inc., 1961.
15. Blackwell D., Discrete Dynamic Programming, Annals of
Mathematical Statistics, 33 (1962), 719—726.
16. Roberts S. M., Dynamic Programming in Chemical Engi-
neering and Process Control, New York, Academic Press Inc.,
1964.
37* 579
17. Hadley G., Nonlinear and Dynamic Programming, Heading,
Mass., Addison-Wesley Publishing Co., Inc., 1964.
К главе 14
1. Pontryagin L. S., Boltyanskii V. G., G a m-
krelidze R.V. and Mischenko E. F., The Mathema-
tical Theory of Optimal Processes, trans, by K. N. Trirogoff,
New York, Interscience Publishers, John Wiley and Sons, Inc.,
1962.
2. Athans M. and F a 1 b P. L., Optimal Control, New York,
McGraw-Hill Book Company, Inc., 1966.
3. H e s t e n e s M. R., Calculus of Variations and Optimal Con-
trol Theory, New York, John Wiley and Sons, Inc., 1966.
4. L e i t m a n n G., An Introduction to Optimal Control, New
York, McGraw-Hill Book Company, Inc., 1966.
5. L e e E. B. and Markus L., Foundations of Optimal Con-
trol Theory, New York, John Wiley and Sons, Inc., 1967.
6. R о z о n о e r L. I., L. S. Pontryagin’s Maximum Principle in
Optimal Control Theory, Automat, i. Telemech., 20 (1959), 1320—
1334, 1441—1458, 1561—1578. Translated in Automation and
Remote Control, 20 (1960), 1288-1302, 1405—1421, 1517-1532.
7. Mangasarian O. L., Sufficient Conditions for the Opti-
mal Control of Nonlinear Systems, J SIAM Control, 4 (1966),
139-152.
8. Berkovitz L., Variational Methods in Problems of Control
and Programming, J. Math. Anal, and A ppi ., 3 (1961), 145 —169.
9. К a 1 m a n R. E., The Theory of Optimal Control and the Cal-
culus of Variations, in «Mathematical Optimization Techniques»,
ed. R. Bellman, Berkeley and Los Angeles, Calif., University
of California Press, 1963.
10. D e s о e r C. A., Pontryagin’s Maximum Principle and the
Principle of Optimality, J. Franklin Institute, 271 (1961), 361—
367.
11. F e 1 d b a u m A. A., Optimal Control Systems, New York,
Academic Press Inc., 1965.
12. В a 1 a к r i s h n a n A. V. and N e u s t a d t L. W., eds.,
Computing Methods in Optimization Problems, New York, Acade-
mic Press Inc., 1964.
13. К e 11 e у H. J., Kopp R. E. and Moyer H. G.,
Singular Extremals, in «Topics in Optimization», ed. G. Leitmann,
New York, Academic Press Inc., 1967.
14. В ellman R., Glicksberg I. and Gross 0.,
On the ‘Bang-Bang’ Control Problem, Quarterly of Applied Mathe-
matics, 14 (1956), 11—18.
15. В ellman R., Some Aspects of the Mathematical Theory of
Control Processes, R-313. Santa Monica, Calif., Rand Corp., 1958.
16. L a s a 1 1 e J. P., The 'Bang—Bang’ Principle, Proc, of the
IFAC, Moscow, 1960. London, Butterworths, 1961.
580
177 Halkin H., A Generalization of Lasalle’s ‘Bang-Bang’ Prin-
ciple, J. SIAM Control, 2 (1965), 199—203.
18. В ushaw D. W., Optimal Discontinuous Forcing Terms, in
«Contributions to Nonlinear Oscillations», vol. 4, Annals of Mat-
hematics Study, № 24, ed. S. Lefschetz, Princeton, N. J., Prince-
ton University Press, 1958.
19. L a s a 1 1 e J. P., Time Optimal Control Systems, Proc. Nat.
Acad. Sci., USA, 45 (1959), 573—577.
20. Lasalle J. P., The Time Optimal Control Problem, in «Con-
tributions to the Theory of Nonlinear Oscillations», vol. V,
Annals of Mathematics Study, No 45, eds. L. Cesari, J. Lasalle
and S. Lefschetz, Princeton, N. J., Princeton University Press,
1960.
21. S о 1 о w R. M., Competitive Valuation in a Dynamic Input-
Output System, Econometrica, 27 (1959), 30—53.
22. Jorgenson D., A Dual Stability Theorem, Econometrica,
28 (1960); 892—899.
23. С о u r a n t R., Calculus of Variations, with Supplementary
Notes and Exercises, revised and amended by J. Moser, New York,
Courant Institute of Mathematical Sciences, New York University
Press, 1962.
24. I n t r i 1 i g a t о r M. D. and Smith B. L. R., Some As-
pects of the Allocation of Scientific Effort Between Teaching and
Research, American Economic Review, 61 (1966), 494—507.
25. С о n n о r s M. M. and Teichroew D., Optimal Control
of Dynamic Operations Research Models, Scranton, Pa., Interna-
, tional Textbook Co., 1967.
К главе 15
1. Isaacs R., Differential Games, New York, John Wiley and
Sons, Inc., 1965.
2. H о Y. C., Differential Games and Optimal Control Theory,
Proc. Nat. Elect. Conf., 21 (1965), 613-615.
3. Simakova E. N., Differential Games, Automat, i Telemech.,
27 (1966), 161 —178. Translated in «Automation and Remote Con-
trol» 27, (1966), 1980—1998.
4. Berkovitz L. D.,A Survey of Differential Games, in «Mat-
hematical Theory of Control», ed. A. V. Balakrishnan and
L. W. Neustadt, New York, Academic Press, Inc., 1967.
5. Owen G., Game Theory, Philadelphia, Pa., W. B. Saunders
Company, Inc., 1968.
6. H о Y. C., Optimal Terminal Maneuver and Evasion Strategy,
J. SIAM Control, 4 (1966), 421—428.
7. Berkovitz L. D., A Variational Approach to Differential
Games, in «Advances in Game Theory, Annals of Mathematics
Study», № 52, ed. M. Dresher, L. S. Shapley, and A. W. Tucker,
Princeton, N. J., Princeton University Press, 1964.
581
8. Berkovitz L. D., Necessary Conditions for Optimal Stra-
tegies in a Class of Differential Games and Control Problems-
J. SIAM Control, 5 (1967), 1—24.
9. Pontryagin L. S., Boltyanskii V. G., Gam-
krelidze R. V. and Mischenko E. F., The Mat-
hematical Theory of Optimal Processes, trans, by K. N. Trirogoff,
New York, Interscience Publishers, John Wiley and Sons, Inc.,
1962.
10. V a r a i у a P. P., On the Existence of Solutions to a Differen-
tial Game, J. SIAM Control, 5 (1967), 153—162.
11. H о Y. C., and Baron S., Minimal Time Intercept Problems,
IEEE Trans. Autom. Control, AC-10 (1965), 200.
12. H о Y. C., Bryson A. E. and Baron S., Differential
Games and Optimal Pursuit-Evasion Strategies, IEEE Trans.
Autom. Control, AC-10 (1965), 385—389.
13. S t a r r A. W. and Ho Y. C., Nonzero-Sum Differential
Games, Journal of Optimization Theory and Applications, (1969),
3.
14. Pshenichniy B. N., Linear Differential Games in «Mathe-
matical Theory of Control», ed. A. V. Balakrishnan and
L. W. Neustadt, New York, Academic Press, Inc., 1967.
15. M e s c h 1 e r P. A., On a Goal-Keeping Differential Game,
IEEE Trans. Autom. Control, AC-12 (1967), 15—21.
К главе 16
1. Koopmans T. C., Objectives, Constraints and Outcomes in
Optimal Growth Models, Econometrica, 35 (1967), 1—15.
2. F a r r e 1 1 M. J. and Hahn F. H., eds., Problems in the
Theory of Optimal Accumulation, Edinburgh, Oliver and Boyd,
Ltd., 1967, Review of Economic Studies, 34 (1967), 1 —151.
3. Malinvaud E. and В a c h a r a c h, M. 0. L., eds.,
Activity Analysis in the Theory of Growth and Planning, London,
Macmillan and Co., Ltd., 1967.
4. S h e 11 K., Optimal Programs of Capital Accumulation for an
Economy in Which There is Exogenous Technical Change, Essays
on the Theory of Optimal Economic Growth, ed. K. Shell, Cam-
bridge, Mass., M.I.T. Press, 1967.
5. Arrow K. J., Applications of Control Theory to Economic
Growth, in Lectures in Applied Mathematics, Vol. 12 (Mathematics
of the Decision Sciences — Part 2). Probidence R. I., American
Mathematical Society, 1968.
6. Shell K., Applications of Pontriagin’s Maximum Principle to
Economics, in «Mathematical Systems Theory and Economics»,
ed. H. W. Kuhn and G. P. Szego, Berlin, Springer-Verlag, 1969.
7. Ramsey F., A Mathematical Theory of Saving, Economic
Journal, 38 (1928), 543-559.
8. S о 1 о w R. M., A Contribution to the Theory of Economic
Growth, Quarterly Journal of Economics, 70 (1956), 65—94.
582
' 9. Hahn F. and Matthews R.C.O. The Theory of Econo-
mic Growth, A Survey Economic Journal, 74 (1964)', 779—902.
10. Phelps E. S., Golden Rules of Economic Growth, New York,
W. W. Norton and Company, Inc., 1966.
11. Rostow W. W., The Take-Off into Self-Sustained Growth,
Economic Journal, 66 (1956), 25—48.
12. Rostow W. W., The Stages of Economic Growth, Cambridge,
, Cambridge University Press, 1961.
13. U zawa H., An Optimum Fiscal Policy in an Aggregative Mo-
del of Economic Growth, in «The Theory and Design of Economic
Development», ed. I. Adelman and E. Thorbecke, Baltimore, Md.,
The Johns Hopkins Press, 1966.
14. Arrow K. J. and Kurz M., Public Investment, The Rate
of Return and Optimal Fiscal Policy, Baltimore, Md., the Johns
Hopkins Press, 1970.
15. R a d n e r R., Dynamic Programming of Economic Growth, in
«Activity Analysis in the Area of Growth and Planning», ed. E.
Malinvaud and M.O.L. Bacharach, London, Macmillan and Co.,
Ltd., 1967.
16. a 1 e D., On Optimum Development in a Multisector Economy,
Review of Economic Studies, 34 (1967), 1—18.
17. McFadden D., The Evaluation of Development Programmes,
The Review of Economic Studies, 34 (1967), 25—50.
18. К u r z M., The General Instability of a Class of Competitive
Growth Process, Review of Economic Studies, 35 (1968), 155—174.
19. Samuelson P. A., A Catenary Turnpike Theorem Involving
Consumption and the Golden Rule, American Economic Review,
55 (1965), 486-496.
20. S a m u e 1 s о n P. A., The Two-Part Golden Rule Deduced
as the Asymptotic Turnpike of Catenary Motions, Western Economic
Journal, 6 (1968), 85—89.
21. Cass D., Optimum Growth in an Aggregative Model of Capital
Accumulation, A Turnpike Theorem, Econometrica, 34 (1966)1
833—850.
22. U z a w a H., On a Two-Sector Model of Economic Growth,
Review of Economic Studies, 29 (1961), 40—47.
23. U z a w a H., On a Two-Sector Model of Economic Growth, IT,
Review of Economic Studies, 30 (1963), 105—118.
24. U z a w a H., Optimal Growth in a Two-Sector Model of Ca-
pital Accumulation, Review of Economic Studies, 31 (1964), 1—24.
25. S r i n i v a s a n T. N., Optimal Savings in a Two Sector Model
of Growth, Econometrica, 32 (1964), 358—373.
26. S a m u e 1 s о n P. A., and Solow R. M., A Complete
Capital Model Involving Heterogeneous Capital Goods, Quarterly
Journal of Economics, 70 (1956), 537—562.
27. Dorfman R., Samuelson P. A. and Solow R. M.,
Linear Programming and Economic Analysis, New York, McGraw-
Hill Book Company, 1958.
583
28. 8 amuelson P. A., Efficient Paths of Capital Accumulation
in Terms of the Calculus of Variations, in «Mathematical Methods
; in the Social Sciences», 1959, ed. К. J. Arrow, S. Karlin and P. Sup-
pes, Stanford, Calif., Stanford University Press, 1960.
29. Samuelson P. A., Indeterminacy of Development in a He-
terogeneous Capital Model with Constant Saving Propensity, in
«Essays on the Theory of Optimal Economic Growth,» ed. K. Shell,
Cambridge, Mass., M.I.T. Press, 1967.
30. H a h n F., Equilibrium Dynamics with Heterogeneous Capital
Goods, Quarterly Journal of Economics, 80 (1966), 633—646.
31. Radnor R., Paths of Economic Growth That Are Optimal
with Regard only to Final States, A Turnpike Theorem, Review of
Economic Studies, 28 (1961), 98—104.
32. M о r i s h i m a M., Proof of a Turnpike Theorem, The 'No Joint
Production’ Case, Review of Economic Studies, 28 (1961), 89—97.
33. M о r i s h i m a M., Equilibrium, Stability and Growth, London,
Oxford University Press, 1964.
34. F u r u у a H. and Inada K., Balanced Growth and Inter-
temporal Efficiency in Capital Accumulation, International Eco-
nomic Review, 3 (1962), 94—107.
35. Inada K., Some Structural Characteristics of Turnpike Theo-
rems, Review of Economic Studies, 31 (1964), 43—58.
36. Nikaido H., Persistence of Continual Growth Near the von
Neumann Ray: A Strong Version of the Radner Turnpike Theorem,
Econometrica, 32 (1964); 151 —162.
37. M с К e n z i e L., Maximal Paths in the von Neumann Model
in «Activity Analysis in the Theory of Growth and Planning»,
ed. E. Malinvaud and M. O. Bacharach, London, Macmillan and
Co., Ltd., 1967.
38. Cass D., Optimum Growth in an Aggregative Model of Capital
Accumulation, Review of Economic Studies, 32 (1965), 233—240.
39. К о о p in a n s T. C., On the Concept of Optimal Economic
Growth, in «The Econometric Approach to Development Planning»,
Amsterdam, North-Holland Publishing Co., 1965.
40. Von Weizsiicker С. C., Existence of Optimal Programs
of Accumulation for as Infinite Time Horizon, Review of Economic
Studies, 32 (1965), 85—104.
41. Chakravarty S., Optimal Savings with Finite Planning
Horizon, International Economic Review, 3 (1962), 338—355.
42. Mirrless J. A., Optimum Growth when the Technology is
Changing, Review of Economic Studies, 34 (1967), 95—124.
43. Goldman S. M., Optimal Growth and Continual Planning
Revision, Review of Economic Studies, 35 (1968), 45—54.
44. Hahn F., On Warranted Growth Paths, Review of Economic
Studies, 35 (1968), 175-184.
45. Kurz M., Optimal Economic Growth and Wealth Effects,
International Economy Review, 9 (1968), 348—357.
46. Dixit A. K., Optimal Development in the Labor-Surplus
Economy, Review of Economic Studies, 35 (1968), 23—34.
584
47. Chase E. S., Leisure and Consumption in «Essays on the Theo-
ry of Optimal Economic Growth», ed. K. Shell, Cambridge, Mass.,
The M. I. T. Press, 1967.
48. R ahman M. A., Regional Allocation of Investment, Conti-
nuous Version, Quarterly Journal of Economics, 80 (1966), 159—160.
59. Intriligator M. D., Regional Allocation of Investment,
Comment, Quarterly Journal of Economics, 78 (1967), 659—662.
50. Takayama A., Regional Allocation of Investment, A Further
Note, Quarterly Journcd of Economics, 81 (1967), 330—337.
К приложению A
1. К a m к e E., Theory of Sets, trans. F. Bagemihl, New York,
Dover Publications, 1950.
2. F r a e n к e 1 A. A. and Bar-Hillel Y., Foundations
of Set Theory, Amsterdam, North-Holland Publishing Co., 1958.
3. H a 1 m о s P., Native Set Theory, Princeton, Van Nostrand
Reinhold Company, 1960.
4. S u p p e s P. C., Axiomatic Set Theory, Princeton, N. J., Van
Nostrand Reinhold Publishing Co., 1960.
5. Rudin W., Principles of Mathematical Analysis, New York,
McGraw-Hill Book Company, 1953.
6. Apostol T. M., Mathematical Analysis, Reading, Mass.,
Addison-Wesley Publishing Co., Inc., 1957.
7. В u с к R. C., Advanced Calculus, Second Edition, New York,
McGraw-Hill Book Company, Inc., 1965.
8. Kolmogorov A. N. and Fomin S. V-, Elements of
the Theory of Functions and Functional Analysis, (перев. с русск.),
Rochester, New York, Graylock Publishing Co., 1957.
9. Dunford N. and Schwartz J. T., Linear Operators,
New York, Interscience Publishing Co., 1958.
10. Berge C., Topological Spaces, New York, The Macmillan
Company, 1963.
11. В i г к h о f f G. and MacLane S.,A Survey of Modern Al-
gebra, New York, The Macmillan Company, 1941.
12. H a 1 m о s P., Finite Dimensional Vector Spaces, New Vork,
Van Nostrand Reinhold Company, 1958.
13. Hoffman K. and Kunze R., Linear Algebra, Englewood
Cliffs, N. J., Prentice-Hall, Inc., 1961.
14. F e n c h e 1 W., Convex Cones, Sets, and Functions, Office of
Naval Research Logistics Project, Department of Mathematics,
Princeton University, 1953.
15. Eggleston H. G., Convexity, Second Edition, Cambridge,
Cambridge University Press, 1963.
16. Valentine F., Convex Sets, New York, McGraw-Hill Book
Company, 1964.
17. С о u r a n t R., Differential and Integral Calculus, New York,
Intersciepce Publishing Co., 1947.
585
18. Coddington E. A., and Levinson N., Theory of
Ordinary Differential Equations, New York, McGraw-Hill Book
Company, Inc., 1955.
19. Pontryagin L., Ordinary Differential Equations, Reading,
Mass., Addison-Wesley Publishing Co., 1962.
20. Hartman P., Ordinary Differential Equations, New York,
John Wiley and Sons, 1964.
К приложению Б
1. Frazier R. A., Duncan W. J. and Collar A. R.,
Elementary Matrices, London, Cambridge University Press, 1957.
2. Gantmacher F. R., Matrix Theory, Chelsea, New York,
Chelsea Publishing Co., Inc., 1959.
3. В e 11 m a n R. E., Introduction to Matrix Analysis, New York,
McGraw-Hill Book Company, 1960.
4. Hadley G., Linear Algebra, Reading, Mass., Addison-Wesley,
Inc., 1961.
5. H a d 1 e у G., Linear Programming, Reading, Mass., Addison-
Wesley, Inc., 1962.
6. Kuhn H. W. and Tucker A. W., eds.. Linear Inequali-
ties and Related Systems, Princeton, N. J., Princeton University
Press, 1956.
7. G a 1 e D., The Theory of Linear Economic Models, New York,
• < McGraw-Hill Book Company, 1960.
Именной указатель
Айзекс (Isaacs R.) 444, 446
Аоки (Aoki М.) 369
Арис (Aris R.) 359, 396
Атанс (Athans М.) 430
Ауманн Р. 41
Балакришнан (Balakrishnan
А. V.) 429
Балинский (Balinski М. L.)
123
Бартен (Barten А. Р.) 230
Батор (Bator F.) 322
Бейтлер (Beightler С. S.) 359
Веллман (Bellman R.) 358,
396, 400, 406, 407, 430
Беркович (Berkovitz L. D.)
444, 445
Борель Э. 30
Борткевич В. И. 33
Броди А. 31, 32
Бронфенбреннер М. 10
Бэр Д. 41
Вальрас Л. 11, 12, 19, 20, 27*
31, 37, 306, 307
Вальтух К. К. 23
Ванг (Wang С. S.) 359
Вульф (Wolfe Р.) 161
Гасс (Gass S. I.) 122
Гейл (Gale D.) 122, 170, 479
Гельфанд 399
Гликсберг (Gliksberg I.) 430
Гросс (Gross О.) 430
Данциг (Dantzig С. В.) 5, 122,
123, 142
Даффин (Duffin R. I.) 123
Дебре (Debreu G.) 11, 20, 22,
27, 202, 347
Джефрион А. 41
Джон (John F.) 109
Джоргенсон (D. Jorgenson) 430
Дмитриев В. К. 21, 33
Дорфман (Dorfman R.) 511
Дрейфус (Dreyfus S.) 41, 400,
406, 407
Дрешер (Dresher М.) 161
Инад (Inada К.) 511
Калаба (Kalaba R.) 358
Калман П. 41
Канторович Л. В. 5
Карлин (Karlin S.) 161
Касс (Cass D.) 488
Келли (Kelley Н. J.) 430
Кемени (Kemeny J. G.) 311,
314
Кенен (Kenen Р. В.) 322
Кларк Дж. Б. 11, 12, 18
Копп (Корр Н. W.) 430
Кун (Kuhn Н. W.) 170
Купер (Cooper W. W.) 123
Купманс (Koopmans Т. S.) 344
Курц (Kurz М.) 41, 478, 487
Кушнер (Kushner Н. J.) 369
Кьюэнн Р. 41
Ланкастер К. 9
Ласалль (Lasalle] J. Р.) 430
Лейбниц Г. 5
Леланд X. 41
Леонтьев В. В. 9, 27, 29
Маданский (Madansky А.) 123
Мак-Дональд Дж. 41
587
Мак-Кензи 511
Макоуэр (Makower Н.) 344
Мак-Фаддеи (McFadden D.)
479
Мангасарян (MangasarianO. I.)
422
Манн А. 41
Маршалл А. 11, 25
Минхас (Minhas В. S.) 27
Мойер (Moyer Н. G.) 430, 436
Моргенштерн (Morgenstern О.)
14, 183, 185, 195, 311, 314
Моришим М. 31, 32, 41, 511
Нейман (Neumann I.) 9, 11, 14,
20, 28, 30, 32, 33, 37, 170,
183, 185, 195, 310, 311, 314,
319
Никайдо (Nikaido Н.) 511
Нойштадт (Neustadt L. W.)
429
Ньюман (Neuman Р.) 322
Ньютон И. 5
Нэш (Nash J. F.) 170, 178, 179
Ольденбургер (Oldenbur-
ger В.) 358
Оуэн (Owen G.) 445
Планк М. 25
Плотт Ч. 41
Понтрягин Л. С. 8, 445
Раднер (В ad пег В.) 479, 511
Рамсей (Bamsey F.) 469, 512
Рикардо Д. 11, 19, 21, 33, 36
Робинсон Р. 26
Руфф Л. 41
Самуэльсон (Samuelson Р, А.)
25, 26, 28, 488, 511
Симонар (Simmonnard М.) 122,
123
Смит А. 11, 25, 36, 320
Солоу Р. (Solow В. М.) 9, 431
511
Сто леру Л. 9
Таккер (Tucker A. W.) 161, 170
Томпсон (Thompson G. L.) 311,
314
Уайлд (Wilde D. I.) 359
Удзава (Uzawa Н.) 107, 478
Фалб (Falb Р. L ) 430
Фалкерсон (Fulkerson D. R.)
158
Фан (Fan L. Т.) 359
Фельс Э. 12
Фомин (Fomin S. V.) 399
Форд (Ford L. В.) 158
Фуруй (Furuya Н.) 511
Халкин (Halkin Н.) 41, 430
Харсанья (Harsany J. С.) 179
Хедли (Hadley G.) 122
Хестенс (Hestenes М.) 399
Хикс (Hicks J. R.) 305
Хо (Но Y. С.) 41, 440
Чанг (Chang S. S. L.) 359
Чарнс (Charhes А.) 123
Шелл К. 41
Шепли (Shapley L. W.) 161,
186-188
Штиглер (Stigler G. I.) 155
Эрроу (Arrow К. I.) И, 22,
27, 40, 320, 347, 478
Предметный указатель
Аксиома выпуклости 230
— выявленного предпочтения
(axiom of revealed preferen-
ce) 235
— — —, сильная 224
— — —, слабая (weak axiom
of-------) 223, 224, 232, 235,
298, 304, 309, 316, 318
— монотонности (axiom of mo-
notonicity) 225
— ненасыщения (— — non-
satiation) 13, 203, 206
— непрерывности (— — con-
tinuity) 202, 226, 228, 230
— полезности фон Неймана —
Моргенштерна 225, 235
Анализ дуополии Курно (Co-
urnot analysis of duopoly)
268
— — Стэкелъберга (Stackel-
berg — — —) 271
— анализ чувствительности
141
Аппроксимация скорости из-
менения цен 307
Баланс межотраслевой 20, 29
Блага капитальные (capital
goods) 491, 497, 498, 500,
504, 505
— потребительские (consump-
tion —) 491, 492, 497, 498,
500, 504, 505
Вектор вероятностей 170, 171,
190
— двойственной задачи 133
— допустимый 54, 131, 132,
134, 173
Вектор единичный 170, 172
— затрат-выпуска 335, 336,
341, 346, 347
— инструментальных перемен-
ных (instrument vector)
54-58, 115
— квадратной функции 558
— множителей Лагранжа 98,
99, 416
— неотрицательный 155
— ограничения 416
— оптимальный 86
— ортогональный 548
— сопряженных переменных
418
— потребления 348, 350
— пространства товаров 200
— смешанных стратегий 179
— управляющий 360
— управляющих параметров
441
— фазовый (state vector) 359
Величины инструментальные
(instruments) 66
Вероятность оптимальная 174
Влияние замены (substitution
effect) 277
— масштаба производства (sca-
le -) 277
Гамильтониан 421, 445—447,
451, 457, 461, 481, 488, 500
Гипотеза Адама Смита 25, 26
— пропорциональности 332
Градиент ограничений неотри-
цательности 102
— — неравенств 102
— функции 71, 80
----I целевой 136
589
Граница допустимого множе-
ства 125
— множества производствен-
ных возможностей 344
— предпочтительных мно-
жеств 344
— граница эффективного про-
изводства 497, 499
Дельта Кронекера 213
Дерево игры (game tree) 162,
163
Диаграмма потоков круговая
(circular flow diagram) 281
— Эджворта — Боули (Ed-
geworth-Bowley —) 323, 325,
327, 329, 331, 351
Дуополия 268, 270-, 273, 274,
280
— Курно 268
— Стэкельберга 271
Единицы интенсивности про-
цессов 29
— счета (numeraire) 288
Задача Больца (problem of
Bolza) 362, 363
— вырожденная (singular
problem) 154, 430
— граничная, двухточечная
(two-point boundary —) 427,
429, 431
— двойственная 128, 129, 136,
140, 152, 153, 156, 174, 298,
300
— изопериметрическая 386,
387, 403
— квадратичного рограмми-
рования 117
— классического вариацион-
ного исчисления 373—375,
378, 380, 382, 394, 400, 402,
403, 411, 424, 426, 435
— Лагранжа 363, 364, 370,
373
— линейного программирова-
ния 54, 57, 92, 122—125, 127,
131, 132, 142, 149, 151, 152,
154, 155, 173, 249, 293, 298,
413
— Майера 363, 365, 436
— максимизации 54, 58, 129,
132-134, 136, 138, 335, 416
Гр Задача максимизации благо-
состояния 335
— — выпуска 249
— — дохода 120
— — классическая 84, 85
— математического програм-
мирования 53, 63, 357, 370,
371, 374, 380, 388, 419
— — — классическая 10, 39,
41, 54, 55, 57, 66, 78, 79, 87,
89, 95, 96, 98, 112, 117, 118,
153
— минимизации 54, 129, 130,
134, 136—138
— — двойственная 131, 138
— нелинейного программиро-
вания 54, 56, 57, 92—94,
101—107, НО, ИЗ, 116—
118, 140, 207, 250, 352, 411,
421
— — — при ограничениях
неотрицательности 95
— об оптимальном быстродей-
ствии (time optimal control
problem) 364, 365
— о брахистохроне (Brachi-
stochrone —) 365
— общего равновесия 281,284,
260, 293
— олигополий 296
— оптимизации, математиче-
ская 41
— — многошаговая (multi-
stage optimization —) 403—
406, 413
— — при наличии ограниче-
ний 114
— — функций 75
— — экономической деятель-
ности 47
— о седловой точке 105, НО
— потребления, неоклассиче-
ская 206, 207
— преследования на плоско-
сти 450
— программирования в бес-
конечном пространстве 370
— Рамсея (Ramsey proylem)
512
— рационального ведения хо-
зяйства (economizind —) 7,
39, 53, 357, 424
— — — _ динамическая
357, 424, 428
590
Задача максимизации стати-
стическая (static — -.-) 357
— с фиксированной конечной
поверхностью 385
— управления 8, 40, 357,358,
370
— — с закрепленным концом
361
— — — фиксированным ко-
нечным моментом времени
368
— экономики благосостояния
320, 322, 350
Закон Вальраса 286—288, 303
— Госсена (Gossen law) 205,
230
— убывающей доходности (от-
дачи) (law of diminishing
returns) 239, 244, 245, 275
— взаимозаменяемости 262
Затраты Гиффина 261
Значение максиминное 171
— минимаксное 171
— целевой функции 153
Значимость социальная, пре-
дельная (marginal social
significance) 20, 330
«золотое правило накопления»
(golden rule of accumulation)
475, 476, 483, 484, 513, 514,
519
Игры антагонистические 161
— бесконечные 161
— в нормальной форме 163
— — развернутой (экстен-
сивной) форме (game in
extensive form) 162
— дифференциальные 40, 41,
161, 440, 445
— — детерминированные 440
— — дискретные (discrete
differential games) 441
— — кооперативные (coope-
rative — —) 455, 458
— — на выживание (differen-
tial games of survival) 465
— — непрерывные (continu-
ous — —) 441
— — с нулевой суммой 444,
460-462
— — стохастические 440
— конечные 161
Игры кооперативные (coopera-
tive —) 161, 178, 181, 194
— координированные 455
— матричные 165
— некооперативные 161, 178
— не полностью определен-
ные 168
— несимметричные 190
— позиционные 162
— преследования (pursuit —)
449, 454, 462, 463
— — неоптимальные 453
— — оптимальные 453
— с бесконечным числом иг-
роков 188
— симметричные 190
— с неполной информацией
(game of imperfect informa-
tion) 163
— — нулевой суммой 197,
168, 176, 440
— — ненулевой суммой 177,
178, 440, 446
— согласованные 176
— с полной информацией (ga-
mesof perfect—) 163,441,445
— — постоянной суммой
(constant sum games) 165,
195
Издержки предельные 255,
260, 268, 270, 332, 333
— долгосрочные 255
— средние 255, 268
— — минимальные 260
— фиксированные 255, 268
Изокванты 241—244, 246,
248, 249, 252, 253, 255, 322,
324
Изокосты (isocosts) 252, 253
Исчисление вариационное 6,
8, 9, 39, 66, 373, 375, 380,
389, 390, 400, 401Л411, 424,
426
Конкуренция несовершен-
ная 262
— совершенная 262, 269, 274
Концепция предельного про-
дукта рабочей силы 19
— «экономики благосостоя-
ния» 23
Координаты фазовые (state va-
riables) 259, 361, 365, 367,
370, 373, 379, 384, 391, 397,
591
422, 429, 433, 435, 441, 447,
449, 450, 456, 465, 500, 506
коэффициенты сбаланирован-
ного роста 313
— технологические 289, 290
Кривая безразличия (indiffe-
rence curve) 14, 24, 25, 204,
209, 218, 220, 230, 326, 327,
329, 332, 333, 344
— возможных полезностей
329—331
— договорная (contract —)
327, 329, 333
— издержек 253—256, 276
— предельного продукта 244,
261
— предельных затрат 259
— — издержек, квадратиче-
ская 279
— производственная 244,
324, 325, 332
— равной прибыли 273
— реакции (reaction —) 270—
273
-----Курно 271, 272
— — Стеке льберга 271, 272
— спроса 48, 261, 262, 280
— средних издержек 253
— среднего продукта 244
Критерий влияния некомпен-
сированной цены 232
— Лапласа 192
— метода наименьших квад-
ратов 156, 365
— минимакса 156
— минимального сожаления
(риска) (minimax regret cri-
terion) 193
— полезности 232
— превосходства 513
— социального благосостоя-
ния 321
— сравнения полезностей 321
Линия бюджетная (budget
line) 206, 209, 210, 218,
223, 332
— разделяющая (ridge —)
242, 243
— уровня (contour —) 61,
62, 64, 67, 85, 104, 136, 137,
142, 181, 210, 331
— цен 345
Потерей 225, 226
Луч фон Неймана (Neumann
ray) 324 —aafc
Максимум внутренний 97
— глобальный 57, 58, 60, 87,
94, 95, 103, 117, 119, 422
— — строгий 37, 58, 61
— локальный (local maximum)
59, 68-70, 75, 76, 86, 94—
96, 118, 422
— — строгий 60, 61,69, 69, 73,
100
Матрица блочная (partitioned
matrix) 216, 546
— блочно-диагональная 546
— взвешивающих коэффи-
циентов 365, 366
— выплат (payoff —) 272
— Гессе (Hessian —) 71—73,
82—84, 86, 88, 205, 207, 210,
211, 213, 215, 216, 230, 238,
257, 259, 419, 425, 537, 564
— диагональная 545, 546,
551, 552, 560
— единичная 102, 136, 137,
170, 214, 291, 545
*- игры 192
— идемпотентная 548, 552,
559
— квадратная вырожденная
552
— квадратная невырожден-
ная 139, 552, 563
— — ортогональная 549, 553,
560
— коммутативная 548
— кососимметрическая 152
— коэффициентов 136, 137,
139, 141, 486, 554
— Леонтьева 544
— Маркова 545
— норм выпуска 29
— норм затрат 29, 34, 35
— нулевая 545
— обратная 291, 553
— платежная 163—166, 169,
170, 177, 190, 192, 193
— — кососимметрическая 190
— предельной полезности 315
— симметрическая 152, 318,
549, 562
— Якоби (Jacobian matrix) 78,
80, 82-84, 102, 115, 211,
251, 305, 308, 388, 564
592
Метод вариационного исчис-
8, 373, 386
— градиентный (gradient me-
thods) 113, 114, 154
— —, дифференциальный 114
— динамической оптимизации
38
— динамического программи-
рования 8, 395, 398, 405—
408, 410, 413
— искусственных перемен-
ных 144
— Лагранжа 79
— линейного программиро-
вания 299—302
— математической оптимиза-
ции 45
— множителей Лагранжа (me-
thod of Lagrange multipliers)
90, 130, 153, 415, 428
— ограниченной вариации
(— — constrained varia-
tion) 153
— производственных функций
10
— решения проблемы устой-
чивости 306, 307
— сравнительной статики 212,
256
— статистической оптимиза-
ции 38, 39
— экономической теории, нео-
классической 47
Минимум строгий локальный
71
Множество 522
— безразличия (indifference)
sets) 201, 203, 204, 230
— допустимое (opportunity —)
46, 53, 57—60, 65, 67, 81, 94,
104, 105, 108, 109,4 114,
115,119,124—127,131,137—
139, 142—144, 150, 153, 206,
207, 223, 357, 371
— инструментальных пере-
менных 124
— квазивыпуклое 534
— недоминирующих исходов
328
— непустое компактное, вы-
пуклое 304
— предпочтений (preference—)
202, 204, 345, 347
— — упорядочненное 224
Минимум производственных
возможностей 54, 336
— — —, общеэкономическое
338, 339, 344, 345, 347, 348
— распределения 328
— симплексное 303
— управления (control —)
357, 430, 442
Множители Лагранжа (Lag-
range multipliers) 7, 16, 75,
77, 80, 81, 85, 91, 101, 103,
109, 110, 114, 115, 118, 130,
138, 297—209, 211, 212, 263,
264, 283, 285, 288, 335, 352,
387—389, 403, 416, 422,
446
Модель «затраты — выпуск»,
динамическая 9, 431
— календарного планирова-
ния производства 8
— «общего равновесия» фон
Неймана 28, 30, 32—37
— оптимального экономиче-
ского роста 9
— паутинообразная 315
— расширяющейся экономи-
ки фон Неймана 310
— роста «неоклассическая» 9,
470, 473, 491, 505
— фон Неймана 319, 347, 348
— экономико-математическая
13
— «экономического равнове-
сия» Вальраса — Эрроу —
Дебре 27, 36, 37
— — —, статистическая 12
— роста двухсекторная 491,
493, 504, 520, 521
— экономического роста, нео-
классическая 477, 511, 512,
514, 516, 517
— — — Харрода — Д омара
511
Монопсония 47, 48, 262, 263
Набор товаров (commodity
bundle) 199, 200, 223
Наклон бюджетной линии 209
— изоквант 242, 324, 332
— изокост 332
— кривой безразличия 209,
328, 329
— — производственных воз-
можностей 328, 329
38-0170
593
Направление наискорейшего
роста (preference direction)
105, 125, 127, 137, 138, 142,
145, 148, 210, 295, 301, 330,
331
Нежесткость дополняющая
139
Ненасыщение (nonsatiation)
. 203
Неравновесие Стэкельберга
272
Неустойчивость двойственная
(дуальная) (dual instability)
431
Область особая 243, 251, 259
— производственного множе-
ства 239
— пространства затрат 239
«Общее равновесие» по Валь-
расу 19
Ограничения (budget constra-
int) 206, 261, 285, 286, 288,
295, 317, 339—341, 343, 352
— интегральные 386
— линейные 65
— неравенства 153, 154
— равенства 153, 389
Олигополия (oligopoly) 48,
266
Олигопсония (oligopsony) 266
Оптимальность равновесия
282
— по Парето (Pareto optima-
lity) 23, 119, 180, 181, 188,
274, 321, 325, 327, 329,
332—335, 343, 346, 347, 349,
353
Оптимум социальный 329—331
Отношение безразличия 201
— предпочтения (preference
relation) 200, 201, 204
_— — слабое (weak — —) 201,
204
j-~ эквивалентности (equiva-
lence relation) 201
Параметры управляющие
(control variables) 8, 357—
359, 361, 370, 414, 420, 424,
427, 431—433, 436, 448—
450, 456, 461, 500, 506, 517.
Переменные базисные 145, 146
594
Переменные вспомогательные
(auxiliary/slack —) 416
j— двойственные (dual —) 130,
416
— инструментальные (ia-
, struments) 59, 62, 81, 82, 98,
96, 112, ИЗ, 122, 159, 207,
250, 362
— небазисные 144—147, 149
— неотрицательные 153
— сопряженные (costate va-
riables) 415, 416, 422—425,
428—430, 434, 444, 448, 452,
457—460, 482, 487, 501, 507
— фазовые 457, 494
Платежи максиминные 179 -
— при угрозе 179
Плоскость фазовая 502
Поверхность конечная (termi-
nal surface) 441
— оптимальная 273, 274
— производственная 297
— сингулярная («singular —)
462
Полезность порядковая (ordi-
nal utility) 203
— предельная 12, 47, 203—
205, 208, 488, 490, 491, 493
— фон Неймана — Морген-
штерна 225, 321
Правило Крамера 555
Предпочтение выявленное 222.
— лексикографическое (lexi-
cographic preference) 202, 230
— строгое (strict —) 225, 229
Преобразование ведущее (pivot
transformation) 145
Преследование на плоскости
(pursuit in the piane) 449
Принцип аналогии 7
— взаимности (principle of
reciprocity) 387
— Ле-Шателье (Le Chatelier
principle) 89
— максимакса 193
— максимаксимума (maxima-
ximum —) 456, 457
— максимальной суммы 178,
194
— максимальной разности 178,
194
— максимина 178, 194
— максимума 8, 9, 39, 41,
390, 414, 415, 420, 421, 423—
430, 432, 433, 436—439, 446,
447, 451, 455, 460, 481, 506
— минимакса 192, 194, 445,
446
— оптимального релейного
управления (band-band
principle) 430
— оптимальности 395—397,
404, 406, 407
— «управляющей руки» Ада-
ма Смита 320
Программирование динамиче-
ское 9, 39, 41, 390, 395,
400, 402—404, 412, 426—
429
— квазивыпуклое 94
— классическое 62
— линейное 6—8, 39, 41, 56,
122
— нелинейное 7, 39, 41, 55,
63, 92
Прогресс технический по Солоу
516
— — — Харроду 516
Продукт национальный вало-
вой 492, 493, 508
Произведение Декартовое 523,
525
Пространство векторное 529,
. 531
— Евклидовое 54, 62, 67, 123,
124, 182, 200, 237, 335, 375,
530, 532
— затрат (input space) 237,
238
— товаров (commodity —) 201,
203, 335, 337, 339, 342, 348
Процесс «нащупывания» Валь-
раса (tatonnement process)
306-308
Путь расширения долгосроч-
ный (long-run expansion
path) 253
— — краткосрочный 253
Равновесие 179, 302, 317
— глобально устойчивое (glo-
bally stable equilibrium) 306
— конкурентное 269, 316,
328, 334, 340, 342, 344,
345, 347, 349-351
— Курно 261—273
— локально устойчивое 306
Равновесие некооперативное
(по Нэшу) (noncooperatjve
(Nash) equilibrium) 460, 461
— неустойчивое 317
— по Вальрасу— Дебре 20
-----Нэшу 178
— — фон Нейману 20
— , соответствующее сбалан-
сированному росту 509
— Стэкелъберга (Stackelberg
equilibrium) 271, 273
Решение Бертрана (Bertrand
solution) 280
— граничное (boundary —)
96, 97
— допустимое, базисное 144,
147, 149
— кооперативной игры по
Нэшу 193, 194
— Курно (Cournot —) 280
— Нэша 179—181
— по Нейману — Морген-
штерну 184, 185
Ряд Тейлора 95, 308
Свойство Больцано — Вейер-
штрасса 528
— магистральное (turnpike
property) 488, 490, 509, 514
Симплекс-метод 142, 143, 145-
149, 153, 154
Стратегия 160, 161, 164, 166,
176, 178, 440
— доминирующая 177, 193
— максиминная (maximin
strategy) 166
— минимаксная (minimax —)
166
— оптимальная 166, 444, 454
— седловой точки 168
— смешанная оптимальная
178, 443
— смешанная (случайная)
(mixed/random —) 169, 170,
172, 174, 178, 181, 190, 445,
455
— чистая 170, 174, 175, 178,
190, 191, 455
Схема воспроизводства Маркса
31
Траектория допустимая (fea-
sible trajectory) 477
38* 595
Траектория кусочно-непре-
рывная 477
— оптимальная 396, 397,
482, 483, 509, 519
— оптимального экономиче-
ского роста 484, 486, 488-
490, 517
— сбалансированного роста
(balanced growth path) 483,
484, 486, 487, 501—504
— управления (control trajec-
tory) 441, 455
Теорема Броуэра о неподвиж-
ной точке (Brouwer fixed
point theorem) 303, 304, 528
— Вейерштрасса (Weierst-
rass—) 57, 58, 67, 94, 126,
207, 370, 371
— —, обобщенная 370, 371
— «второго наилучшего» (se-
cond best —) 334
— двойственности 7, 130, 132,
135, 139, 152, 170, 172, 173,
192, 298
— замещения (substitution —)
290
— Какутани (Kakutani —)
296, 298, 342, 529,
— ключевая 558
— Куна — Таккера 7, 105—
107, 130, 132
— Кэли — Гамильтона 559
— «локально-глобальная»
(local-global —) 60, 207
— невозможности Эрроу 320
— о дополняющей нежестко-
сти (complementary slack-
ness —) 130, 135, 136,
174
— о дополнительном ослабле-
нии условий 299
— — достаточных условиях
существования максимума
126
— — магистрали (turnpike —)
510
— — минимаксе (minimax —)
7, 170—174
— — неподвижных точках
(fixed point —) 170, 302, 304,
342
— — неявной функции 78
— — разделяющей гиперпло-
скости 24, 108, 344
596
Теорема Рибчинского (Ryb-
czynski—) 300, 301
— Рута — Гурвица 559
— Столпера — Самуэльсона
301
— существования (existen-
ce —) 131, 132
— Фаркаша 557
— Фробениуса 560
— Эрроу — Дебре 23
— Эйлера 221, 380, 537
— экономики благосостояния
331, 334, 343, 344
— игр 6, 9, 30, 39, 41, 92,
159, 160, 164, 165, 173, 266,
207, 272, 274, 328
— — бесконечных 161
— личного потребления 13,
14, 199
— математического програм-
мирования 9, 38
— олигополии 280
— общего равновесия 281,
282, 286, 289, 295, 342
— полезности фон Неймана —
Моргенштерна 227, 228
— потребления 200, 233, 331
— «предельной полезности»
И, 12
— предельной Производитель-
ности 18
— равновесия Вальраса —Эр-
роу — Дебре 22, 25
— Рикардо 21
— спроса 224
— фирмы 237, 331
— фирмы, неоклассическая
249
— экономического благосо-
стояния 10, 119
— — роста 10
Товары Гиффина (Giffin com-
modities) 218, 219, 231—233
Точка внутреннего максимума
96
— глобального оптимума 143
— Евклидова пространства
375
— излома 381—383, 391, 400,
402
— кривой возможных полез-
ностей 331
— локального максимума 72,
82
Теорема локального минимума
74
— максимума полезностей 351
— монопольная 272, 273
— равновесия 179, 298, 307—
309, 448, 486, 489, 501—503
— — Курно 271
— седловая 106, 109, 117,
167, 168, 171, 174, 190, 415—
417, 444, 486, 490, 504
— стационарная 72—74
— угрозы (threat point) 179,
193, 194
— устойчивою равновесия
540
— фазовая 359
— функции Лагранжа, сед-
ловая 105
— экстремальная 153
Управление по замкнутому
контуру (closed loop con-
trol) 367, 369 432
— — разомкнутому контуру
(open-------) 366, 367, 369,
443
Уравнение балансовое 290
— Беллмана (Bellmans equa-
tion) 395, 396, 399—401,
403, 409, 411, 427—429, 446
— движения (equation of
motion) 357, 360, 361, 367,
369, 370, 417, 421, 429, 433,
442, 446, 450, 451, 462,
465, 477
— — автономное 361
— Гамильтона — Якоби (Ha-
miltonian—Jacobi equation)
399, 427
— Леонтьева 291, 293, 294
— Рикатти (Ricatti —) 434,
448
— Слуцкого ( Slutsky —)[216,
217, 221, 222
— Эйлера (Euler —) 375,
377—380, 383, 385, 387, 389,
391—393 , 400, 401, 425, 435
Уровень потребления 14—16,
34, 207, 340, 343, 348
Условия агрегации Курно
(Cournot aggregation condi-
tions) 222
— Вейерштрасса (Weierst-
rass—) 381, 393, 400, 426
Условия Вейерштрасса — Эрд-
мана (Weierstrass—Erd-
mann-) 381-383, 391, 400,
402, 426
— граничные boundary —)
375, 377, 378, 380, 389, 420—
422, 428, 432, 435, 458, 465,
481, 539
— — конечные (terminal
----) 422
— — начальные (initial
------) 422
— групповой рациональности
(group rationality) 183, 185
— дополняющей нежестко-
сти (complementary slack-
ness conditions) 102, 138,
389
— достаточности 251, 255
— индивидуальной рацио-
нальности (individual ra-
tionality) 183, 185
— интегрируемости (integra-
bility conditions) 224
— «коалиционной рациональ-
ности» 185, 186
— Куна — Таккера 98—100,
102—105,110,111,114,116—
121, 130, 131, 133, 135, 207,
250, 352, 389
— Лежандра 380, 383, 390,
393 , 400—402, 425
— Лишиина 539
— нарицательности 115
— неотрицательности 118
— непрерывности 376, 377
— равновесия 234, 282
— трансверсальности (trans-
versality —) 383, 386, 392
— устойчивости Хикса (con-
ditions of stability of
Hicks) 305
— Хоукинса — Саймона 291,
316, 551, 553
— Якоби (Jacobian assump-
tion^ 78, 79
Устойчивость глобальная
309, 310
— локальная 309, 487
— равновесия 305
Факторы внешние (externali-
ties) 346
Функция Вейерштрасса 381
597
Функция вектора инструмен-
тальных переменных 54
. констант ограничений,
супераддитивная 153
— — коэффициентов субад-
дитивная 153
векторно-значная 181
— вещественная 181
— вогнутая 535
— времени 112, 114
— — кусочно-непрерывная
(piecewise continuous fun-
ction of time) 360, 374, 382,
415 , 480, 481, 494 , 499
— выпуклая 532, 535
— Гамильтона (Hamiltonian
function) 415, 418—422,
425-427, 430, 432, 434, 451,
455, 460, 500
— дохода 212, 232
— затрат, убывающая 276
— затрат-выпуска, производ-
ственная 246, 247, 249, 277,
289, 290
— конечных параметров 362
— Куна — Таккера 131
— Лагранжа (лагранжиан)
77, 81, 82, 86, 98, 99, 102,
103, 106, 109—111, 130, 131,
207, 263, 267, 388, 389,
415—417, 423
— Ляпунова 474, 540, 541
— оптимального поведения
(optimal performance —) 397
— переключения (switching—)
430
— платежная (payoff —) 159,
-- 161, 464
'j— полезности 13, 14, 16, 47,
-i 202—207, 227, 229, 232—
io 234, 318, 326, 478, 479,
481, 515
— — квадратическая 205, 314
— — косвенная 233
— — логарифмическая (Бер-
нули) 205, 206, 317
— —, непрерывная 202
— — фон Неймана — Мор-
генштерна 225, 227
— — полиноминальная 525
— — порядковая (ordinal
utility —) 203
— производственная 13, 17,
19, 237—243, 245, 246, 249,
264, 266, 274—278, 283, 322,
324, 336, 470—472, 474, 483,
485, 492—495, 511, 516
— —, Кобба — Дугласа 246 —
249, 275, 276, 278, 515, 517
— —, линейная 246, 248, 249
— —, супераддитивная 276,
277
— сопряженных переменных
422
— социального благосостоя-
ния (social welfare —) 49,
321, 330 , 331, 353
— с постоянной эластичностью
замещения (constant elasti-
city of sulstitution CES) 249
— спроса 211, 212, 221, 232—
234, 237, 252, 277, 279, 288,
294-296, 298, 316, 318
— — избыточного 303—306,
309, 310, 318
•*>- — на затраты 252
— — обратная 235, 318
— — Торнквиста (Tornguist
demand funktion) 231
— целевая 45, 47, 48, 53,
57—59, 64, 65, 67, 77, 83,
87, 93, 99, 107, 109, 111—
114, 119, 122, 123, 125, 126,
129, 131, 133, 139, 141, 143,
145, 147, 148, 151, 159, 211,
250, 294, 298, 357, 371,
381, 399, 404-408, 411, 435
— цен 213, 232, 252
— Якоби 310, 318
Функционал целевой (objecti-
ve functional) 357, 358,
362—364, 366, 369—371,
374, 376, 384, 392, 393,
396, 403, 415, 418, 423,
424, 427, 459, 481, 488, 511
Хиксиан 318
Цена игры (value of game) 168,
452
— Ланге-Лернера (Lange-Ler-
ner price) 335
— относительная 211, 212
— средняя взвешенная 186,
187
— теневая (shadow —) 85,
140, 141, 335, 424, 482, 507
598
Цена Шепли (Shaply value)
186-188, 194
Шкала полезности фон Ней-
мана — Моргенштерна 235
Эластичность выпуска 241,
247
— замещения 240—242, 276
— предельной полезности 478,
482
— производства 240, 241, 245,
278
Эластичность функции 536
Экономика благосостояния
(welfare economics) 13, 320,
321
— замкнутая агрегированная
470
— институционная (описа-
тельная) 47
Эффект замещения (substitu-
tion effect) 224
Ядро 185, 196
— игры («core») 186
Содержание
Предисловие ...................................... 5
От автора ....................................... 38
Часть I. Введение ............................... 43
Глава 1
Рациональное ведение хозяйства и экономика ... 45
1.1. Проблема рационального ведения хозяйства 45
1.2. Основные экономические организации (ин-
ституты) .................‘............... 46
1.3. Экономическая наука . 46
Часть II. Статистическая оптимизация............. 51
Глава 2
Задача математического программирования ... 53
2.1. Формальная постановка задачи............. 53
2.2. Типы максимумов, теорема Вейерштрасса
и теорема о достаточных условиях глобаль-
ного максимума............................ 57
2.3. Геометрический комментарий............... 61
Глава 3
Классическая задача математического программи-
рования ................................... 66
3.1. Задачи оптимизации при отсутствии ограни-
чений .................................... 67
601
3.2. Метод множитеяец Лагранжа................... 74
3.3. Интерпретация множителей Лагранжа . . 83
Глава 4
Нелинейное программирование........................ 92
4.1. Задача нелинейного программирования при
ограничениях неотрицательности .... 95
4.2. Условия Куна — Таккера ..................... 98
4.3. Теорема Куна — Таккера .....................105
4.4. Интерпретация множителей Лагранжа . . . 110
4.5. Алгоритмы решения..................112
Глава 5
Пинейное программирование..........................122
5.1. Двойственные задачи линейного программи-
рования ....................................127
5.2. Метод множителей Лагранжа; теорема двой-
ственности и теорема о дополняющей неже-
сткости .................................. 130
5.3. Интерпретация двойственных переменных и ,
анализ чувствительности.................". 138
5.4. Симплекс-метод........................ .. , 142
Г л а в а 6 ц
Теория игр................................... . 159
6.1. Классификация и описание игр................160
6.2. Игры двух участников с нулевой суммой 164
6.3. Игры двух участников с ненулевой суммой 176
6.4. Кооперативные игры.........................179
6.5. Игры с бесконечным числом игроков . . . 188
Часть III. Применение статической оптимизации 197
Глава 7
Теория личного потребления . . . . . . . .Rr . . 199
7.1. Пространство товаров . .f4j. . . . ,rf . . 199
7.2. Отношение предпочтения .. ..... . • . 200
602
7.3. Неоклассическая задача потребления . . .. 206
7.4. Сравнительная статика потребления . . j, 212
7.5. Выявленное предпочтение ’ ............ 222
7.6. Полезность фон Неймана — Моргенштерна 225
Глава 8
Теорйя фирмы ...................* *..........237
8.1. Производственная функция . .1.........237
8.2. Неоклассическая теория фирмы..........249
8.3. Сравнительная статика фирмы...........256
8.4. Несовершенная конкуренция. Монополия и
монопсония............................... 262
8.5. Конкуренция среди немногих. Олигополия
и олигопсония..............................266
Г л а в а 9
Общее равновесие......................... . . . 281
9.1. Классический подход. Подсчет уравнений и
неизвестных величин........................282
9.2. Линейное программирование в применении
к модели «затраты — выпуск»................289
9.3. Неоклассический подход. Избыточный спрос 302
9.4. Устойчивость равновесия...............305
9.5. Модель расширяющейся экономики фон Ней-
мана ......................................310
Глава 10
Экономика благосостояния .....................320
10.1. Геометрическая интерпретация задачи в слу-
чае 2 X 2 X 2 ..............................322
10.2. Конкурентное равновесие и оптимальность
по Парето...................................334
10.3. Рыночная недостаточность .,..........346
10.4. Оптимальность и фактор времени.......347
Часть IV. Динамическая оптимизация ..... 355
603
Глава 11
Задача управления...........................357
11.1. Строгая формулировка задачи........358
11.2. Некоторые частные случаи...........364
11.3. Виды управления ........•..........366
11.4. Задача управления как задача программи-
рования в бесконечномерном пространстве; „
обобщенная теорема Вейерштрасса .... 370
Глава 12
Вариационное исчисление .................... 373
12.1. Уравнение Эйлера ..................375
12.2. Необходимые условия................380
12.3. Условие трансверсальности..........383
12.4. Ограничения .......................386
Глава 13
Динамическое программирование...............395
13-1. Принцип оптимальности и уравнение Белл-
мана .................................396
13.2. Динамическое программирование и вариа-
ционное исчисление....................400
13.3. Решение многошаговых задач оптимиза-
ции методом динамического программи-
рования ..............................403
Глава 14
Принцип максимума ..........................414
14.1. Сопряженные переменные, функция Гамиль-
тона, принцип максимума...................415
14.2. Интерпретация сопряженных переменных 422
14.3. Принцип максимума и вариационное исчис-
ление ....................................424
14.4. Принцип максимума и динамическое про-
граммирование ............................426
14.5. Примеры............................л 429
604
Глава 15
Дифференциальные игры.......................440
15.1. Непрерывные детерминированные диффе-
ренциальные игры двух участников . . . 441
15.2. Дифференциальные игры двух участников
с нулевой суммой.........................444
15.3. Игры преследования.............. (449
15.4. Координированные дифференциальные игры 455
15.5. Некооперативные дифференциальные игры 459
Часть V. Применение динамической оптимизации 467
Глава 16
Оптимальный экономический рост..............469
16.1. Неоклассическая модель роста.......470
16.2. Неоклассическая модель оптимального эко-
номического роста .......................477
16.3. Двухсекторная модель роста.........491
16.4. Неоднородные капитальные блага .... 505
Приложение А
Анализ......................................522
А-1. Множества......................... 522
А-2. Отношения и функции.................523
А-3. Метрические пространства............526
А-4. Векторные пространства..............529
А-5. Выпуклые множества и выпуклые функции 532
А-6. Дифференциальное исчисление.........536
А-7. Дифференциальные уравнения..........538
Приложение Б
Матрицы.....................................544
Б-1. Основные определения и примеры .... 544
Б-2. Некоторые специальные матрицы.......545
Б-3. Отношения между матрицами и действия над
матрицами .................546
605
В-4. Скалярные функции, определенные на ма-
трицах ................................550
Б-5. Обратная матрица.......................553
Б-6. Линейные уравнения и линейные неравен-
• ства .....................................554
Б-7. Линейные преобразования; характеристиче-
ские числа и вектора.................. 558
Б-8. Квадратичные формы................t . .. 560
Б-9. Производные от матриц..................562
Библиография ..................................565
Именной указатель..............................587
Предметный указатель...........................589
Содержание ....................................601
М. Интрилигатор
МАТЕМАТИЧЕСКИЕ МЕТОДЫ ОПТИМИЗАЦИИ
И ЭКОНОМИЧЕСКАЯ ТЕОРИЯ
Редактор А. Латышев
Художник Н. Старцев
Художественный редактор В. Пузанков
Технический редактор Е. Гоц
Корректор Р. Аксенова
Сдано в производство 8.11.1974 г.
Подписано к печати 16.1.1975 Г.
Бумага SlxlOSVac, тип. № 1, бум. л. 91/2.
Печ. л. 31.92. Уч.-изд. л. 30,56. Изд. № 17867,
Цена 2 р. 13 к. Заказ 0270.
Издательство «Прогресс» Государственного
комитета Совета Министров СССР по делам издательств,
полиграфии и книжной торговли
Москва Г-21, Зубовский бульвар, 21
Ордена Трудового Красного Знамени Московская типография Ш 7
«Искра революции» Союзполиграфпрома при Государственном комитете
Совета Министров СССР по делам издательств, полиграфии
и книжной торговли
Москва, К-1, Трехпрудный пер., 9