/
Author: Вильсон А.Дж.
Tags: математика системный анализ математическое моделирование теория информации теория систем
Year: 1978
Text
ТЕОРИЯ И МЕТОДЫ
СИСТЕМНОГО АНАЛИЗА
РЕДАКЦИОННАЯ КОЛЛЕГИЯ СЕРИИ
член-корреспондент АН СССР Д. М. ГВИШИАНИ
(председатель)
член-корреспондент АН СССР С. В. ЕМЕЛЬЯНОВ
(заместитель председателя)
член-корреспондент АН СССР С. С. ШАТАЛИН
доктор экономических наук Б. 3. МИЛЬНЕР
доктор технических наук Ю. С. ПОПКОВ
МОСКВА «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
1978
А. Дне. ВИЛЬСОН
ЭНТРОПИЙНЫЕ МЕТОДЫ
МОДЕЛИРОВАНИЯ
СЛОЖНЫХ СИСТЕМ
Перевод с английского
Ю. А. ДУБОВА
Под редакцией
Ю. С. ПОПКОВА
С дополнением
Ш. С. ИМЕЛЬБАЕВА И Б. Л. ШМУЛЬЯНА
МОСКВА «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
1978
32.81
В 46
УДК 519.95
Entropy in urban
and regional modelling
A. G. Wilson
Pion Limited
London 1970
Энтропийные методы моделирования сложных систем. Вильсон
А. Дж. Перев. с англ. Главная редакция физико-математической литературы
издательства «Наука», М., 1978, 248 стр.
Книга посвящена применению методов статистической физики для
моделирования процессов в сложных системах, какими являются экономические,
социальные, городские, организационные системы и т. п.
Излагается общая теория энтропийных моделей, описывающих наиболее
вероятное макросостояние сложной многоэлементной системы, в которой
взаимодействия на микроуровне характеризуются статистикой Больцмана.
Эти общие результаты используются для моделирования потоков в
стохастических коммуникационных системах, многопродуктовых экономических
системах, для построения моделей размещения с учетом предпочтения
элементов.
Илл. 13, бьбл. 226.
В
30501-172
053(02)-78
178-78
Перевод на русский язык,
Главная редакция
физико-математической литературы
издательства «Наука», 1978.
ОГЛАВЛЕНИЕ
Книга А. Дж. Вильсона и теория макросистем (от редактора перевода) 7
Предисловие к русскому изданию 14
Предисловие к английскому изданию 15
Глава 1. Что такое энтропия? 17
§ 1.1. Введение 17
§ 1.2. Энтропийное описание статистических свойств системы 17
§ 1.3. Использование концепции энтропии 26
Глава 2. Транспортные модели: распределение поездок, типы
коммуникаций, маршруты 30
§ 2.1. Введение 30
§ 2.2. Гравитационная модель распределения поездок .... 31
§ 2.3. Обобщенные модели распределения 37
§ 2.4. Последствия расщепления типов коммуникаций 40
§ 2.5. Поведенческие гипотезы ^ 41
§ 2.6. Альтернативная модель расщепления типов коммуникаций 42
§ 2.7. Альтернативные оценки составных затрат 44
§ 2.8. Расщепление маршрутов 46
§ 2.9. Заключительные замечания и обсуждение 49
Глава 3. Межрегиональные потоки продуктов 52
§ 3.1. Введение 52
§ 3.2. Гравитационные модели 54
§ 3.3. Получение семейства гравитационных моделей с помощью
методов максимизации энтропии 62
§ 3.4. Модель «затраты — выпуск» 64
§ 3.5. Объединение моделей 69
Г л а в а 4. Модели размещения 78
§ 4.1. Гравитационные модели как модели размещения .... 78
§ 4.2. Размещение центров отдыха 79
§ 4.3. Размещение торговых центров 80
§ 4.4. Элементарные модели размещения жилого фонда .... 81
Глава 5. Информационные аспекты энтропийных моделей потоков
и размещения 103
§ 5.1. Введение 103
§ 5.2. Внешние зоны в транспортных моделях: гравитационная
модель с неполной информацией 103
§ 5.3. Ограничения на автомобильные стоянки в транспортных
моделях j • • Ю7
§ 5.4. Ограничения, связанные с планированием и конечной
емкостью 111
ОГЛАВЛЕНИЕ
Глава 6. Использование энтропии при анализе систем с
максимальной полезностью 114
§ 6.1. Введение # 114
§ 6.2. Системы с максимальной полезностью 114
§ б!з! Использование энтропии при анализе систем с
максимальной полезностью 116
§ 6.4. Городские системы как системы с максимальной
полезностью 119
Глава 7. Энтропия и физические аналогии в общественных системах 126
§ 7.1. Введение 126
§ 7.2. Социальные аналогии некоторых физических концепций 126
§ 7.3. Неравновесное состояние и динамика системы .... 130
Приложения 137
1. Энтропия распределения вероятностей 137
2. Теория ансамблей 138
П.2.1. Введение 138
П.2.2. Микроканонический ансамбль 142
П.2.3. Канонический ансамбль 145
П.2.4. Большой канонический ансамбль 149
П.2.5. Микрораспределения в каноническом и большом
каноническом ансамблях 151
П.2.6. Выводы: виды вероятностных распределений,
присутствующих в различных типах ансамблей 157
3. Модель конкурирующих возможностей и некоторые ее варианты 158
П.3.1. Введение 158
П.3.2. Вывод на основе максимума энтропии 161
П.3.3. Модель распределения гравитационного типа,
использующая конкурирующие возможности как меру затрат . . 163
4. Применение метода Дарвина — Фаулера для вывода
гравитационной модели 164
Дополнение. Моделирование стохастических
коммуникационных систем (Ш. С. Имелъбаев, В. Л. Шмульян) .... 170
Введение 170
§ 1. Понятие коммуникационной системы 171
§ 2. Модели стохастических коммуникационных систем .... 177
§ 3. Модели, сохраняющие априорную информацию 192
§ 4. Обобщения моделей 200
§ 5. Алгоритмы определения потоков в коммуникационных
системах 206
§ 6. Некоторые приложения и интерпретации 211
§ 7. Моделирование и анализ процессов миграции населения
в городах 220
§ 8. Доказательство сходимости трехмерной балансировки . . 230
Литература 234
Предметный указатель 247
КНИГА А. ДЖ. ВИЛЬСОНА И ТЕОРИЯ МАКРОСИСТЕМ
(от редактора перевода)
Моделирование сложных систем является эффективным
методом их исследования. Один из распространенных классов
образуют такие системы, в которых детерминированный характер
наблюдаемых процессов сочетается с их стохастической природой.
Формальная модель систем этого класса, которую будем
называть макросистемой, описывает преобразование случайных
межэлементных микровзаимодействий в некоторый вполне
регулярный процесс. Тем самым в макросистеме выделяются два уровня:
микроуровень, где связи между элементами случайные, и
макроуровень, на котором связи между параметрами состояния системы
детерминированные. Взаимодействие между уровнями или
характер преобразования случайных движений элементов макросистемы
в регулярный процесс зависит как от конкретного вида системы,
так и от тех физических, экономических, биологических,
социальных и других закономерностей, сочетание которых определяет
ее функционирование.
Классическим примером макросистемы является совокупность
большого числа частиц — молекул, атомов и т. д. Общий характер
закономерностей, присущих таким системам, в весьма малой
степени зависит от того, каким образом осуществляется движение
каждой отдельной частицы. При этом индивидуальные и
коллективные свойства частиц могут существенно отличаться друг от
друга.
Физическая макросистема как модель реальной физической
системы совершенствовалась по мере расширения представлений
о строении материи.
Первоначально изучалось лишь макросостояние физической
системы, которое характеризовалось так называемыми
термодинамическими величинами: температурой, давлением, объемом,
энергией. Связи между этими величинами формулировались в виде
вполне детерминированных соотношений.
Проникновение в микромир привело к существенному
пересмотру такой модели. В ней появился еще один уровень, на
котором происходило взаимодействие огромного количества частиц
8
ОТ РЕДАКТОРА ПЕРЕВОДА
составляющих физическую систему, и оно являлось причиной того
или иного макросостояния системы. И хотя набор
термодинамических величин от этого не изменился, но существенно изменилась
их природа. Они оказались усредненными характеристиками
случайных микровзаимодействий, образующих физическую систему.
В результате макросистема приобрела ту структуру, которая
является предметом исследования и в настоящее время.
Дальнейшее совершенствование этой модели в основном
касалось ее микроуровня, а именно, поведения микрочастиц и их
распределения по квантовым состояниям. J
В зависимости от физических гипотез о пребывании
микрочастиц в том или ином квантовом состоянии, получались различные
функции распределения: Гиббса, Больцмана, Ферми — Дирака,
Бозе — Эйнштейна.
Все перечисленные модели микровзаимодействий,
сформулированные в виде функций распределения, а также модели,
связывающие термодинамические величины, характеризуют
стационарное (равновесное) состояние микросистемы. Полученные в этой
области теоретические результаты, подтвержденные
многочисленными экспериментами, стали классическими, и сейчас без них не
обходится ни один учебник по статистической физике.
Несмотря на это, нельзя считать, что все проблемы в данной
области исчерпаны. Напротив, в ней возникло и сейчас интенсивно
развивается новое направление, связанное с изучением
нестационарных термодинамических процессов.
Многие свойства и закономерности, присущие физическим
макросистемам, обнаруживаются в сложных системах совершенно
иной природы. Среди них прежде всего следует указать системы
обмена или распределения экономических ресурсов. Обычно такой
обмен осуществляется между экономическими ячейками и, в
зависимости от степени централизации, принятой в данной
экономической системе, может быть как чисто стихийным, так и
регламентированным.
Однако как бы ни была высока степень централизации,
экономическая система обмена столь сложна, что случайные
(неуправляемые) факторы в ней всегда остаются. Тем самым на
«микроуровне» экономической системы происходят обменные взаимодействия
между ее элементами, которые имеют как случайную, так и
детерминированную компоненты. Вес каждой из них зависит от
возможностей вмешиваться в единичные акты обмена, совершаемые
в данной экономической системе.
Если такие возможности отсутствуют, то обмен экономическими
ресурсами носит чисто случайный характер. Но несмотря на это,
система в целом все-таки приобретает «средний» ресурс, т. е.
в ней происходит преобразование случайного процесса обмена
в детерминированный процесс, определяющий ее состояние.
ОТ РЕДАКТОРА ПЕРЕВОДА
9
В экономической системе обмена, где имеется возможность
влиять на характер взаимодействий между ее ячейками,
регулирование единичных актов обмена осуществляется путем
регламентирующих и управляющих воздействий. И те и другие воздействия
направлены на то, чтобы снизить элемент случайности и придать
актам обмена более целенаправленный характер. Остаточные
случайные явления, которые по-прежнему присутствуют во
взаимодействиях экономических ячеек, выступают при этом в роли
некоторого «шума».
I- Отсюда видно, что хотя характер взаимодействий в такой
экономической системе обмена оказывается иным, природа их остается
случайной в широком смысле.
Но, так же как в системе с чисто случайными
взаимодействиями, состояние данной системы определяется детерминированными
характеристиками.
Таким образом, в системе экономического обмена существует
два существенно отличающихся друг от друга уровня: уровень
стохастических межэлементных взаимодействий и уровень
детерминированных характеристик поведения системы в целом. Это дает
основания использовать макросистемную модель для исследования
процессов в системах экономического обмена.
Наиболее полно процессы, происходящие в системах
экономического обмена, изучаются в рамках математической экономики.
Математические модели обмена и экономических рынков были
построены в работах Парето, Вальраса, Гейла, Леонтьева, фон
Неймана, Эджворта, Самуэльсона и др.
Основное внимание в них уделяется изучению условий
равновесия. При этом под равновесием понимается такое состояние, для
которого функция полезности системы достигает максимума.
Функция полезности является обобщенной характеристикой
системы экономического обмена и определяется на множестве частных
функций полезности отдельных ее подсистем. Их формирование
обычно не представляет большого труда, тогда как установление
связи между функциями полезности отдельных подсистем и
системы в целом оказывается задачей не формальной. И здесь речь
может идти лишь о некоторых гипотезах, на основе которых удается
построить формальную модель такой связи. В частности, одна из
них приводит к функции полезности типа энтропии физической
системы.
Закономерности, присущие равновесным состояниям в
системах экономического обмена, во многом аналогичны тем, которые
имеют место в физических (термодинамических) системах. Они
оказались столь глубокими и полезными, что были провозглашены
в качестве неких общих для термодинамических систем и систем
экономического обмена принципов: Ле Шателье — Самуэльсона,
Карно — Хикса и др.
10
ОТ РЕДАКТОРА ПЕРЕВОДА
Хотя эти аналогии не привели к появлению новых моделей
экономического обмена, но они способствовали упорядочиванию и
формализации качественных идей и понятий, присущих
экономической науке, и развитию общественной методологии
исследования экономики.
Изучение равновесия и динамики систем экономического
обмена касается только их верхнего (макро) уровня. Здесь имеется
ввиду, что методы исследования, модели равновесных состояний,
их основные характеристики формулируются через
макропеременные системы; цена, процент, капитал и т. д. Уровень
межэлементных взаимодействий (микроуровень) формально в этом «не
участвует». Характер микровзаимодействий описывается лишь
качественно и служит для того, чтобы высказать определенные
соображения о свойствах функции полезности системы
экономического обмена.
В этом также можно обнаружить аналогии между
термодинамикой и экономикой, но несколько иного, а именно исторического
плана.
Напомним, что основные законы термодинамики появились
задолго до исследования внутримолекулярных и внутриатомных
процессов.
Поэтому, сопоставляя термодинамику и экономику, нетрудно
заметить, что последняя пока находится на этапе
макроскопических исследований, и если термодинамические аналогии
действительно глубоки, то очередной этап в анализе процессов
экономического обмена будет, вероятно, связан с изучением их
«микромира».
Наряду с существующими аналогиями между процессами,
происходящими в термодинамических системах, и процессами
экономического обмена последние обладают некоторыми
специфическими свойствами. Это прежде всего относится к централизованному
или полуцентрализованному обмену, т. е. во взаимодействиях
между элементами системы случайность либо полностью, либо
частично подавляется.
Изучение этих явлений и их формальное описание позволяет
расширить наши представления о макросистеме, как
двухуровневой модели сложной системы.
И, наконец, третьим примером, где макросистемный подход
может оказаться полезным, являются процессы городского
развития.
Город представляет собой весьма сложную, многоэлементную
и неоднородную динамическую систему. Внутренние
взаимодействия в этой системе настолько разнообразны, не постоянны, а
иногда и случайны, что часто не удается выделить
причинно-следственные связи между ее элементами, т. е. представить систему в виде
какого-либо соединения элементов с входом и выходом. Но, с дру-
ОТ РЕДАКТОРА ПЕРЕВОДА
И
гой стороны, внешние проявления этих взаимодействий можно
наблюдать и оценивать при помощи показателей состояния городской
системы.
Своеобразие городской системы проявляется, прежде всего,
в ее неоднородности. Город является весьма локализованным по
своим масштабам объектом, и поэтому экономические, социальные,
организационные, технические и др. показатели его состояния
весьма тесно связаны друг с другом.
Другая особенность городской системы заключается в том, что
ей, в отличие от других систем, не свойственны процессы
сокращения, умирания, деградации. Городская система может либо
находиться в стабильном состоянии (своеобразное состояние покоя)
либо расширяться. Здесь имеются в виду агрегированные
показатели состояния городской системы, рассматриваемые на
значительных интервалах времени.
Конечно, при этом исключаются какие-либо уникальные
воздействия внешней среды на город (война, природные
катаклизмы и т. д.).
И, наконец, третья специфическая черта городской системы
заключается в ее особом взаимодействии с внешней средой.
Классическая модель системы и среды строится на гипотезе
о том, что состояние системы в бесконечно малой степени
влияет на внешнюю среду и, следовательно, не меняет свойств
последней.
Для городской системы эта гипотеза оказывается неверной.
Городская система, испытывая на себе влияние внешней среды, сама
в значительной степени воздействует на ее состояние. Однако,
несмотря на своеобразие городской системы, в ней проявляются
и некоторые общие для макросистем свойства. Это, прежде всего,
двухуровневая природа процессов, происходящих в городской
системе. Она проявляется и при пространственной организации
системы, и при взаимодействии составляющих ее подсистем, и при
управлении процессами городского развития. Причем, в
отличие от систем экономического объема, где микроуровень играет
пока вспомогательную1 роль, микропроцессы, происходящие в
городских системах (миграции населения, взаимодействие подсистем
и т. д.), определяют ее основные свойства. В этом смысле более
глубокие аналогии существуют, между городскими и
термодинамическими системами.
Однако для развития теории макросистем значительно большее
значение имеют особенности городских систем, описание которых
позволит расширить возможности таких моделей сложных систем.
Все, что было отмечено выше, в какой-то мере характеризует
состояние и некоторые перспективы одного из направлений в
моделировании сложных систем, связанного с применением и
расширением теории макросистем.
12 ОТ РЕДАКТОРА ПЕРЕВОДА
Развитию этого направления во многом способствовали работы
проф. А. Дж. Вильсона, первые из которых появились в 1966 г.
В течение 1967—1969 гг. вышло довольно много работ,
посвященных исследованию процессов миграции населения в городах. Часть
из них была связана с моделированием и затем экспериментальной
проверкой полученных результатов на реальном материале. Эти
и некоторые другие исследования экономических и социальных
систем послужили основой для монографии, перевод которой
предлагается вниманию советского читателя.
Основная мысль, которая проводится в книге, строится, с одной
стороны, на гипотезе о том, что состояние равновесия в
макросистеме достигается при максимуме ее энтропии, а с другой — что
при этом должны выполняться некоторые дополнительные
условия, учитывающие конечность ресурса, содержащегося в системе.
В книге рассмотрены различные по сложности варианты этих
условий, каждый из которых приводит к соответствующей задаче
математического программирования. По своему формальному виду
они достаточно просты, что позволяет в большинстве случаев
провести их анализ, не прибегая к численным методам.
Эти модели используются для имитации пассажирских потоков
в транспортной сети города, процессов обмена в многопродуктовых
экономических системах, процедур размещения с учетом
предпочтений элементов. На основе энтропийных моделей получены
интересные интерпретации экономической теории полезности.
Разнообразие объектов применения энтропийного подхода,
описанных в книге, явилось поводом к некоторому изменению ее
названия. В нем хотелось подчеркнуть большую общность
излагаемого в ней метода, который может использоваться не только при
исследовании городских и региональных систем.
Несомненным достоинством книги является рассмотрение
весьма разнообразных проблем в исследовании сложных систем
с единой точки зрения.
Книга снабжена обширной библиографией, часть которой
(публикации после 1970 г.) была любезно предоставлена автором в
процессе подготовки ее перевода.
Приведенная автором библиография дополнена ссылками на
отечественную литературу, отмеченными звездочками.
Следует также отметить одну особенность книги А. Дж.
Вильсона: многие проблемы обсуждаются в ней в плане постановок
задач для будущих исследований. За время, прошедшее со дня
выхода в свет монографий А. Дж. Вильсона, многие из них были
решены, но возникли и некоторые новые задачи.
В связи с этим оказалось целесообразным снабдить
русский перевод дополнением, написанным Ш. С. Имельбаевым и
Б. Л. Шмульяном. В него включены результаты, полученные в
теории специального класса макросистем — стохастических коммуни-
ОТ РЕДАКТОРА ПЕРЕВОДА
13
кационных систем, в которых случайный обмен ресурсами
происходит по реальным каналам связи. Здесь рассмотрены вопросы
моделирования таких систем, способы учета априорной информации
о системе, методики формирования глобальных показателей
функционирования системы и вычислительные алгоритмы для
машинной реализации предлагаемых моделей. В заключение
описывается конкретная задача, связанная с расчетом пассажиропотоков
в транспортной системе крупного города.
Дополнение написано в более формальном духе, и потому
может представлять интерес для специалистов, занимающихся
математическими вопросами моделирования сложных систем*
Ю. Попков
ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ
Я очень обрадован и польщен тем, что моя книга переводится
на русский язык, поскольку это должно привести к более
широкому использованию рассмотренных в ней методов. За годы,
прошедшие со дня ее выхода в свет, модели, использующие методы
максимизации энтропии, применялись в различных странах. Это
привело к некоторым модификациям ряда моделей в конкретных
задачах. Однако сами методы в своем первоначальном виде
зарекомендовали себя как полезные инструменты решения задач
анализа и планирования. Особенно приятно, что эти методы нашли свое
применение в системных исследованиях, поскольку именно на
таком уровне общности обеспечивается наилучшее понимание
сути энтропии. Энтропийный подход можно связать с более
широким классом методов в теории систем.
Хотя содержание книги не устарело, мне показалось полезным
снабдить русский перевод дополнительной библиографией,
которая даст читателю представление о литературе, вышедшей после
первого издания книги.
А. Дж. Вильсон
ПРЕДИСЛОВИЕ К АНГЛИЙСКОМУ ИЗДАНИЮ
Эта книга появилась в результате исследований, которые
проводились в 1966 г., когда стало очевидным, что хорошо известная
гравитационная модель может быть получена скорее на основе
аналогии со статистической механикой, чем на основе аналогии с
механикой Ньютона. Позднее выяснилось, что метод максимизации
энтропии связан с более высоким уровнем общности (описание
этого метода как общего метода построения моделей сложных
систем приводится в гл. 1). Удалось также установить, что этот метод
полезно применять для развития широкого класса городских и
региональных моделей, которым в значительной степени посвящена
книга. Я надеюсь, что эта книга будет полезной для читателей,
занимающихся экономикой, географией, планированием,
гражданским строительством, математикой, статистикой, а также
проблемами, связанными с городскими и региональными
исследованиями. Мне кажется, что эта книга будет полезна для аспирантов
и научных работников, но она также может сыграть определенную
роль при подготовке специалистов и представить интерес для
работников административного аппарата.
Часть материала, приведенного в этой книге, представляет
собой переработку статей, опубликованных в различных
журналах. В этой связи мне хотелось бы выразить признательность
издателям следующих журналов: Operational Research Quarterly,
Transportation Research, Geographical Analysis, Papers, Regional
Service Association, а также Journal of Regional Sciences за
предоставленные ими материалы.
При написании книги весьма полезными оказались беседы с
моими коллегами в министерстве транспорта и в Центре по
изучению окружающей среды, а также со студентами и сотрудниками на
лекциях и семинарах во многих учебных учреждениях как в
Великобритании, так и за рубежом. Мне хотелось бы особо выразить свою
признательность Тони Блэкберну из Гарвардского университета
и Бриттону Харрису из Пенсильванского университета, которые
исключительно внимательно изучили мои более ранние работы
в этой области, и чья критика заставила меня более четко осознать
16 ПРЕДИСЛОВИЕ К АНГЛИЙСКОМУ ИЗДАНИЮ
многие из моих собственных мыслей. Я также многим обязан
Уолтеру Айзерду и его коллегам из Департамента по региональным
исследованиям в Пенсильвании, сотрудничество с которыми привело
к появлению моих статей по методам максимизации энтропии на
конференциях по региональным исследованиям. Я хотел бы также
поблагодарить Анджелу Холл и Шейлу Джемисон, которые
терпеливо и многократно перепечатывали довольно сложную рукопись.
За все оставшиеся ошибки любого вида полную ответственность
несет, конечно, автор.
А. Дж. Вильсон
профессор городской и региональной географии,
Лидский университет
Глава 1
ЧТО ТАКОЕ ЭНТРОПИЯ?
§1.1. Введение
Городские и региональные модели представляют интерес по
двум основным причинам. Во-первых, моделирование лежит в
основе всех научных исследований, а городское и региональное
моделирование представляет собой одну из попыток достигнуть
научного понимания принципов функционирования городов и
регионов. Во-вторых, существует ряд весьма сложных городских
и региональных проблем, а соответствующие задачи планирования
приобретают все большее значение; городское и региональное
моделирование составляет часть исследований и в этом
направлении.
Перед исследователем в области городских и региональных
задач стоит ряд серьезных теоретических проблем. В своей работе
ему приходится применять понятия, используемые в различных
отраслях — в экономике, географии, социологии и т. д.
Понятие энтропии до недавнего времени использовалось, в
основном, для изучения физических систем. Эта книга
представляет собой попытку показать, что энтропия играет полезную роль в
исследовании самых различных по своей природе систем, например,
городских, региональных, экономических и т. д.
Одна из возникающих при этом особенностей заключается в
том, что концепция энтропии может использоваться по-разному;
поэтому прежде всего (в § 1.2) будут рассмотрены различные
способы энтропийного описания статистических свойств системы.
В § 1.3 в достаточно общих чертах обсуждаются возможности
использования этого понятия: для построения теории, с целью
интерпретации результатов и для изучения динамики системы.
§ 1.2. Энтропийное описание статистических
свойств системы
1.2.1. Связь энтропии с вероятностью и неопределенностью.
В данной книге мы будем рассматривать в основном городские и
региональные системы. Прежде всего необходимо определить
состояние интересующей нас системы. Какая информация необхо-
jg гл. i. что Такое энтропия?
дима для полного описания состояния системы? Этот вопрос, как
выяснится из дальнейшего, является далеко не простым, но
частично на него можно ответить, приведя несколько примеров.
В классической физике состояние газообразной системы полностью
определяется координатами и скоростями всех частиц газа в
каждый момент времени. Такая система может изучаться с помощью
классических ньютоновских методов. Однако эти методы (для газа
их можно назвать микроаналитическими) оказываются
неконструктивными во многих ситуациях, когда имеется около 1023 частиц
газа. Для изучения таких систем была развита статистическая
механика. Возникшие новые методы позволили физикам объяснять
и предсказывать определенные макросвойства системы с нужной
степенью точности, не изучая поведение каждой отдельной частицы
(на микроуровне). Такие макроаналитические методы связываются
с микроситуациями с помощью концепции энтропии *).
.Рассмотрим аналогичный пример из другой области. Пусть
задана система с фиксированным пространственным
распределением населения по местам проживания и с фиксированным
пространственным распределением рабочих мест, между которыми
образуется некоторый поток. Как можно описать состояние этой
системы? Для этого необходимо указать для каждого работающего
его зону проживания и зону работы. При большой размерности
задача предсказания поведения
Прибытие] каждого индивидуума в этом
смысле елишком трудна (как и в
аналогичной ситуации в случае газа).
Рассмотрим макроподход к
описанию состояния данной
системы, для чего обратимся к
таблице, показанной на рис. 1.1. По
вертикали этой таблицы будем
располагать номера i (i = 1, ...
. . . , п) пунктов отправления,
а по горизонтали — номера
Рис. 1.1. Таблица, связывающая / (/ = 1, • • • , гп) пунктов при-
места отправления и прибытия, бытия. Будем считать, что все
индивидуумы (частицы) в системе
помечены, например,
пронумерованы. Тогда под состоянием системы понимается размещение
помеченных частиц по клеткам таблицы на рис. 1.1. При
определении потока между пунктами* i и / важным является лишь общее
количество Ttj перемещающихся индивидуумов, а не их
структурный состав. Распределением в системе будем называть матрицу
*) См., например, монографию Л. Д. Ландау иЕ-.Н. Лифшица [1*Ь и
статью Джейнса [1].
I
f
§ 1.2. ЭНТРОПИЙНОЕ ОПИСАНИЕ СТАТИСТИЧЕСКИХ СВОЙСТВ 19
Т = {Tij, i = 1, . . ., щ j = 1, . . . , m}. Распределение Т
характеризует макросвойства системы.
Таким образом, каждая клетка матрицы «отправление —
прибытие» на рис. 1.1 состоит как бы из двух частей: во-первых, из
множества помеченных индивидуумов, передвигающихся из i в /
и, во-вторых, из общего числа Ttj индивидуумов, передвигающихся
из i в /'.
Легко видеть, что существует много состояний, приводящих
к одному и тому же распределению. Предположим, что каждое
состояние системы осуществляется с равной вероятностью. Тогда
можно найти наиболее вероятное распределение, вычислив
множество значений Г^-, с которыми связано наибольшее число
состояний. Эти вычисления можно произвести, не располагая никакой
информацией о поведении отдельных индивидуумов.
Прежде чем проводить вычисления, следует пояснить основную
идею обсуждаемого подхода, более детально рассмотрев понятие
состояния системы. Состояние системы было определено как полное
описание интересующей нас системы. Назовем такое описание
описанием микросостояния. Тогда под распределением можно
понимать описание макросостояния, но оно является отнюдь не полным
в информационном смысле и, как уже было показано, многие
микросостояния могут приводить к одному и тому же
макросостоянию. Более того, на распределение поездок могут быть наложены
ограничения. Например, территориальное распределение (в
отличие от распределения поездок на работу) по местам проживания и
рабочим местам задано заранее: следовательно, любое
распределение поездок должно быть связано с данным территориальным
распределением. Ниже будет показано, что удобно также ввести
ограничение на полные транспортные затраты. Поэтому введение
полных затрат и территориального распределения представляет
собой описание макросостояния на более высоком уровне. Оно,
очевидно, содержит меньше информации, чем описание
макросостояния распределения поездок, поэтому многие распределения
поездок могут приводить к одному и тому же территориальному
распределению. Связь между этими определениями состояний
качественно показана на рис. 1.2. Каждый квадратик представляет
собой некоторое состояние. Если все микросостояния (нижний
уровень) равновероятны, то можно найти наиболее вероятное
распределение поездок (средний уровень), вычислив количество
микросостояний, связанных с каждым распределением, при
любых существенных ограничениях. Учет стоимостных
ограничений означает, что нас интересуют лишь те макросостояния
распределения поездок, которые соответствуют некоторому наперед
заданному территориальному распределению. Эта структура
является достаточно общей предоставлении моделей максимизации
энтропии, хотя деуали могут, очевидно, меняться, в соответствии с
2q ГЛ. 1. ЧТО ТАКОЕ ЭНТРОПИЯ?
предположениями и гипотезами разработчика модели. В
аналогичной ситуации при рассмотрении системы молекул газа ее микро-
состояпия характеризуются координатами и скоростями частиц;
макросостояния среднего уровня (рис. 1.2) — числом частиц на
каждом энергетическом уровне, а макросостояния верхнего
уровня — полной энергией системы и числом частиц.
Перейдем к формальному описанию рассматриваемой задачи *).
Введем следующие переменные: Ttj — число индивидуумов,
живущих в зоне i и работающих в зоне /; Qt — полное число
работающих, живущих в зоне i; Dj — полное число рабочих мест в зоне /;
I—| Макросостояние „территориальное
I I распределение/полные затраты»
( >>
□ I I I | Манрососгпояния распре-
I—I I—I деления поездон
г Л < ^
□ | I I I |—] |—| |—| Микросостояния индивиду-
'—' I—» I—I I—I I—I алмызв размещении
Рис. 1.2. Макросостояния и микросостояния.
ctj — затраты на передвижение из зоны i в зону /; С — полные
затраты на передвижение к местам работы.
Тогда ограничения на Тц (ограничивающие число размещений,
приводящих к данному распределению) могут быть записаны в
виде
2^ = <?ь (1.1)
3
2г« = Д*. (1.2)
г
22Г«е„ = С. (1.3)
г j
Теперь следует найти матрицу Т = {7\;}, с которой связано
наибольшее число W({Ttj}) состояний, при ограничениях (1.1)—
(1.3). Количество состояний, соответствующих матрице {Т^},
можно получить следующим образом. Пусть Т — полное число
индивидуумов (У = SS^ij) • Сперва из Т выберем Гц, затем из
г j
оставшегося числа Т — Тп выберем Т12 и т. д.; таким образом,
число возможных размещений (или состояний) есть Ст11 — число
способов выбора Тп элементов из Г, умноженное на Cf-Tu —
) См работу Вильсона [2].
§ 1.2. ЭНТРОПИЙНОЕ ОПИСАНИЕ СТАТИСТИЧЕСКИХ СВОЙСТВ 21
число способов выбора Т12 элементов из Т — Тп и т. д. То есть
W({T4}) = Ср-С^тп-Скт^тг •.. (1.4)
или
W(lT ))- п (У-Уи)1 „__1!_ /15)
УУ KV г,))- Тп1 {Т-Тп)\ Г12! (Г- Ти- Г1а)! " ' " П 7V! ' * '
Очевидно, что результат не зависит от того, в каком порядке
рассматривать клетки рис. 1.1.
Теперь нужно максимизировать W ({Ttj}) при ограничениях
(1.1) — (1.3), чтобы найти наиболее вероятную матрицу {Ttj}.
Для удобства будем максимизировать In W({Ttj}) при
ограничениях (1.1) — (1.3), хотя, конечно, может быть использована
любая монотонная функция W ({Ти}). Получаем Ttj в виде *)
Ти = AtBjQiDj ехр ( - ficu), (1.6)
где
и
4 = -2^ = [£адехР(-рс„)Г
(1.7)
В,=
, = е»р^'>) = |у А^ехр (_ ^ ^ (1 8)
где р — множитель Лагранжа, связанный с (1.3), и Х[г) и Я<2) -
наборы множителей Лагранжа, связанные с ограничениями (1.1)
и (1.2) соответственно**). Этот результат основан на формуле
Стирлинга (справедливой при больших Ttj)
In Tu\ = Ти In TtJ - TtJ. (1.9)
Изложенная методика получения оценки {Ttj} аналогична
используемой в статистической механике. В статистической
механике эквивалентом In W является энтропия системы,
представляющая собой логарифм вероятности того, что осуществится
некоторое распределение.
Так же можно установить взаимосвязь между энтропией и
неопределенностью. Неопределенность в данном случае связана с
состояниями системы (и, в частности, с микросостояниями в
терминах рис. 1.2). Ранее отмечалось, что представляют интерес только
*) См. Вильсон [2].
**) Оценка {Тц}, получаемая с помощью уравнений (1.6) — (1.8),
использовалась как эмпирическая. Опыт показывает, что она довольно точно
отражает существующую реальность. Возможны различные уточнения этой
оценки; они обсуждаются, например, в работах Вильсона [2, 6] и более подробно
рассмотрены^ гл. 2.
22
ГЛ. 1. ЧТО ТАКОЕ ЭНТРОПИЯ?
распределения и что наиболее вероятным распределением является
то, к которому приводит наибольшее число микросостояний.
Наиболее вероятное распределение соответствует такой ситуации,
в которой ощущается наибольшая неопределенность о
микросостоянии системы, так как здесь имеется наибольшее возможное
число таких состояний, и нельзя осуществить обоснованный выбор
между ними. Поэтому другой способ формулировки принципа
максимума вероятности состоит в том, что не представляется
возможным выбрать распределение, уменьшающее предполагаемую
неопределенность о микросостояниях.
Представляет определенный интерес, что идеи, рассмотренные
в этом параграфе, были выдвинуты независимо различными
авторами в разных странах. Мерчланд [1] показал с помощью
метода Самуэльсона [1], что гравитационная модель может быть
получена с помощью некоторой задачи максимизации, и он использовал
формулировку задач математического программирования. Идея
максимизации функции, имеющей вид In W, просматривается в
работе Шнейдера [1], хотя он использовал этот метод для несколько
других целей. Максимизация In W для получения гравитационной
модели, основанная на аналогии со статистической механикой,
использовалась для различных целей Спуркландом [1], Томлином
[1], Вильсоном [2], Лоубалом [1] и Сасаки [1]. Нейдеркорн и Вех-
долт [1] предприняли попытку получить разновидность
гравитационной модели, исходя из того, что они назвали процедурой
максимизации полезности. Она включает в себя отождествление
понятия энтропии с полезностью. Использование методологии
максимизации энтропии при анализе систем, максимизирующих
полезность, обсуждается в гл. 6.
1.2.2. Энтропия распределения вероятностей. Другую
интерпретацию понятия энтропии мы рассмотрим, следуя Джейнсу *).
Рассмотрим случайную величину х, которая может принимать
значения х19 х2, . . . , хп с вероятностями рх, р2, . . . , рп, т. е.
для случайной величины х существует дискретная функция
распределения вероятностей Р (xt) со значениями рх, . . . , рп-
Возникает вопрос, каким образом можно количественно
охарактеризовать связь между априорной информацией о случайной
величине'(например, ее средним значением, дисперсией и т. д.) и
видом функции Р (xt). Наши интуитивные представления сводятся
к тому, что более размытое распределение вероятностей связано с
большей неопределенностью (с меньшей априорной информацией),
чем распределение с явно выраженным пиком*). Такая мера
неопределенности была введена Шенноном **) в виде
S(Pi, р2, • • • ,РП) = -*2р*1прг (1.Ю)
г
*) См. Джейнс [1].
••) См. Шеннон, Уивер [1].
§ 1.2. ЭНТРОПИЙНОЕ ОПИСАНИЕ СТАТИСТИЧЕСКИХ СВОЙСТВ 23
> По определению, это есть энтропия вероятностного распределения
Р (xi). Доказательство того, что это единственная однозначная мера
неопределенности, приведено в Приложении 1.
Если о случайной величине никакой дополнительной
информации нет, то максимизация энтропии S (1.10) при условии 2)р* = 1
г
дает оптимальное распределение Р (х^ == — , что, как уже
отмечалось выше, совпадает с качественными представлениями о неоп-
I ределенности.
Допустим, что известно среднее значение некоторой функции
/ (х). Тогда задача поиска оптимального распределения сводится
к следующей
S -*тах,
2р«/(*«) = #, (i-U)
I *
SPi-l. (1.12)
I г
| Ее решение имеет вид
I Pi = ехр [ - X — \if (xt)]9 (1.13)
[ откуда с учетом (1.12) получаем, что
** = 2exp[-|i/(ж,)], С1-14)
I *
I где X и \л — множители Лагранжа, связанные с уравнениями (1.11)
3 и (1.12) соответственно. Этот результат может быть легко обобщен
1 на случай, когда известны средние значения нескольких функ-
] ций *).
I Теперь покажем, что мера «неопределенности» — энтропия
I (1.10) — совпадает с той, которая была введена в разделе 1.2.1.
J Определим
J PV - 4f (1.15)
I Тогда из (1.5), используя формулу Стирлинга для 7^/., получаем
InW = 1пУ! - SS^ijln Тц - Г,,). (1.16)
I * з
\ Это можно переписать, выразив неизвестные величины Тц через ptj
| InW = ЫТ\-%%Тр l(\np -1пТ)-Тр ] =
I * 3
I = 1пТ\-Т%%рц1пр -(Т1пТ-Т)%%р..=
1 =(lnT\-TlnT + T)-T42l^tpi5\np.j. (1.17)
I * j
I *) См. Джейнс [1], Вильсон [7].
24
ГЛ. 1. ЧТО ТАКОЕ ЭНТРОПИЯ?
Поэтому максимизация
S(Pll, P12, • • • ,Рпт) = -SSPylnpy (1.18)
при ограничениях (1.1) — (1.3) (с помощью уравнения (1.15)
их можно записать в виде условий на ptj) приведет к оценке Ttjf
которая совпадает с оценкой, полученной в разделе 1.2.1.
Действительно, In W и S линейно зависимы при больших Ttj.
Но разница между двумя определениями не является совсем
уж тривиальной, и второе из них по ряду причин является более
предпочтительным. Во-первых, в любых расчетах, основанных на
применении In W, существенно используется приближенная
формула Стирлинга, тогда как случай (1.10) лишен этого недостатка и
не требует никаких приближений. (Впрочем, это не очень
существенно, так как используется на самом деле только производная от
формулы Стирлинга, а производные в обоих случаях совпадают *)).
Во-вторых, и это более существенно, определение энтропии (1.10)
является более гибким и полезным, чем первое. Разница между
определениями аналогична разнице между объективной и
субъективной точками зрения на вероятность. Объективная точка зрения
заключается в том, что вероятность всегда можно измерить,
наблюдая частоту осуществления событий в случайном эксперименте;
субъективная точка зрения рассматривает вероятности как
выражение человеческого незнания; вероятность события представляет
собой попросту формальное выражение основанных на имеющейся
информации ожиданий о том, что событие произойдет или
произошло. С субъективной точки зрения цель теории вероятностей
заключается в том, чтобы помочь получать правдоподобные прогнозы в
случаях, когда мы не располагаем достаточной для однозначных
выводов информацией. Поэтому полного осуществления прогнозов
ожидать не следует. Проверка хорошего субъективного
распределения вероятностей заключается в том, чтобы установить,
насколько оно соответствует нашему знанию величины х **). Легко видеть,
что первое определение является существенно объективным, а
второе — существенно субъективным.
Совсем не обязательно пытаться свести все либо к объективной,
либо к субъективной точкам зрения; обе точки зрения полезны.
Но важно их не смешивать. Здесь есть также и оборотная сторона:
энтропию нельзя рассматривать в отрыве от системы и задач,
связанных с ней. Если появляется желание воспользоваться
концепцией энтропии, то следует четко определить, как ее можно
измерить или же описать распределение вероятностей, связанное
с каким-либо свойством системы и порождающее энтропию этой
системы.
*) На этот факт мне указал Бриттон Харрис.
**) См. Джейнс [1].
§ 1.2. ЭНТРОПИЙНОЕ ОПИСАНИЕ СТАТИСТИЧЕСКИХ СВОЙСТВ 25
Более подробное обсуждение типов вероятностных
распределений, которые могут быть определены для систем, связанных с
соответствующим определением энтропии, приведено в
Приложении 4. Кроме того, в Приложении 4 обсуждается альтернативный
метод оценки Ttj или ри, а именно метод Дарвина — Фаулера.
1.2.3. Энтропия и байесовская статистика. Байесовский
статистик — в основном субъективист, поскольку его интересует степень
уверенности и оценка вероятности распределений, которая
наиболее четко согласуется с экспериментальными данными. Но граница
между объективной и субъективной точками зрения является
достаточно условной *). Имея это в виду, рассмотрим байесовские
методы статистических выводов и покажем, что они могут быть
связаны с энтропией. Это даст нам третью интерпретацию энтропии.
Пусть х — случайная величина, которая может принимать значения
#i, х2, х3 ... . Случайной выборкой длины п называется набор из п
независимых случайных величин, каждая из которых распределена
так же, как х. Пусть р (xt | 9) (или, короче, pt) характеризует
распределение, параметром которого является 9. Пусть Я —-
априорная информация о выборке. Тогда 9 будет иметь
распределение, зависящее от Я; запишем его в виде я (9 | Я). Пусть х =
= C^i» 32, • • • > #п) — наблюдаемая случайная выборка; тогда
его плотность распределения / (х | 9, Я) может быть записана в
виде
/(*|е,я) = 1Ь&|е,#). a.i9)
г
где справа стоит знак произведения, поскольку случайные
величины xt по предположению являются независимыми. Теперь новое
распределение 9, связанное со случайной выборкой х, определяется
по теореме Байеса
*тю=н']*;$яв?]Я). (1-20)
где р (х | Я) — априорная функция распределения случайной
величины х.
Оценку 9 по методу максимума правдоподобия можно найти,
определив значение 9, максимизирующее я; (9 | х, Я). Часто более
удобно работать с логарифмом я; (9 | х, Я).
Из (1.20) получаем
In л (9 I х, Я) = In / (х I 9, Я) + In я (9 I Я) — In p (х I Я).
(1.21)
Рассмотрим первое слагаемое
п
L(x, 9,'Я) - In f (x| 9, Н) = 2 1пр(44| в, Я). (1.21)
*) См. Линдлей [1].
26 ГЛ. 1. ЧТО ТАКОЕ ЭНТРОПИЯ?
При увеличении длины выборки п по закону больших чисел *)
будем иметь
\\т[гГ1Ь{%Щ] = Е[\пр{х\Щ. (1.22)
п-*оо
Но
Е [\np(x\Q)] ^SpixtWlnpixilQ) =%р.Ыр.. (1.23)
г г
Эта величина с точностью до знака совпадает с энтропией
распределения вероятностей, определенной в разделе 1.1.2.
Таким образом, при п -> оо максимизация In л; (9 | х, Н)
сводится к максимизации суммы энтропии (1.10) (взятой с обратным
знаком) и логарифма априорного распределения 5t(9|#).
§ 1.3. Использование концепции энтропии**)
1.3.1. Сводка различных применений. Вся остальная часть
этой книги содержит подробные примеры использования
концепции энтропии в городском и региональном моделировании.
В примере, рассмотренном в разделе 1.2.1 и в процессе более
общего обсуждения в разделе 1.2.2, было показано, что процедуру
максимизации энтропии можно использовать для получения
моделей. Это утверждение, впрочем, можно обратить: в случаях, когда
модели можно получить с помощью более традиционных средств,
часто будет полезно ввести уравнения ограничений, которые
приведут к той же модели в процедуре максимизации энтропии,
так как это часто облегчает интерпретацию. Мы увидим, что
процедуру максимизации энтропии облегчают изучение динамики
системы. Эти проблемы обсуждаются в разделах 1.3.2, 1.3.3 и 1.3.4
соответственно. В разделе 1.3.5 разработанный аппарат поможет
исследовать связь между процедурами максимизации энтропии и
статистическим анализом. Наконец, в разделе 1.3.6 будет отмечен
ряд других возможных приложений, которые в этой книге
подробно рассматриваться не будут.
1.3.2. Формирование моделей. Общее правило для
формирования моделей, которое просматривается в примерах разделов 1.2.1
и 1.2.2, можно сформулировать следующим образом. Необходимо
выделить переменные величины, определяющие интересующую
систему, и выписать известные ограничения на эти величины, после
чего определить энтропию системы либо непосредственно, как в
транспортном примере в разделе 1.2.1, либо с помощью
соответствующего распределения вероятностей, как в разделе 1.2.2. Затем
*) См. теорему 3.6.3, раздел 7.1 монографии Линдлея [1].
**) Я выражаю благодарность А. Дж. Блэкберну, принимавшему
активное участие в обсуждении рассматриваемых здесь вопросов, хотя он,
конечно, не несет никакой ответственности за позицию автора •
§ 1. 3. ИСПОЛЬЗОВАНИЕ КОНЦЕПЦИИ ЭНТРОПИИ 27
можно оценить значения переменных, максимизируя энтропию
при принятых ограничениях. Многие (если не большинство)
модели, полученные таким способом, можно получить и с помощью
более традиционных средств. Но, как будет видно из примеров,
приведенных в остальной части этой книги, процедура
максимизации энтропии по меньшей мере дает возможность последовательно
анализировать сложные ситуации.
Когда предлагаются модели или теории, часто приходится
включать в них элементы, с трудом поддающиеся непосредственной
интерпретации. Это теоретические концепции высокого уровня,
приводящие к параметрам, которые довольно трудно
непосредственно измерить. В частности, к ним относятся параметры модели,
такие как р в транспортной модели (см. уравнение (1.6)).
Предположим, что можно предложить и плодотворно использовать модель,
определяемую уравнениями (1.6) — (1.8), без процедур
максимизации энтропии. Тогда можно выписать набор ограничений,
которые приведут к той же модели (в этом примере уравнения (1.1) —
(1.3)), параметр р будет множителем Лагранжа, связанным с
ограничением (1.3), и интерпретация этого уравнения позволит нам
более четко осознать роль, которую Р играет в модели.
1.3.3. Роль энтропии в анализе динамики систем. Понятие
энтропии так хорошо известно вследствие того, что энтропия
фигурирует в следующей из многочисленных формулировок
второго закона термодинамики: энтропия всегда возрастает. Второй
закон термодинамики вытекает из уравнения
dS = \xdE + \л 21 Хк dxk, (1.24)
где dS — изменение энтропии, dE — изменение энергии системы,
Хк — внешняя сила, соответствующая внешней координате хк;
следовательно, —^X^dx^ — это работа, совершаемая извне над
системой. Таким образом, второй закон, записанный в виде
dS>0, (1.25)
означает попросту, что система не может получить энергии больше,
чем даст ей совершенная над ней внешняя работа. Следовательно,
в этом случае энтропия может объективно быть определена
уравнением (1.24).
Есть примеры социальных систем, в которых это понятие
может играть столь же полезную роль. Важно отметить, что
понятия, соответствующие энергии и работе (такие как полезность и
капиталовложения), могут быть определены и для интересующих
нас систем. Такие примеры вместе с указаниями, почему процедура
максимизации энтропии имеет преимущество перед обычным
28
ГЛ. 1. ЧТО ТАКОЕ ЭНТРОПИЯ?
статистическим анализом при построении динамических моделей,
обсуждаются в Приложении 4 *).
1.3.4. Взаимосвязь между процедурами максимизации
энтропии и статистическим анализом. Теперь необходимо и полезно
вернуться к вопросу, поставленному в разделе 1.2.3: как
согласовать решение одной и той же задачи — чисто статистическое и
энтропийное? Рассмотрим это на простом примере. Пусть х —
случайная величина с возможными значениями хи и вероятность
того, что х принимает значение xtl равна pt. Это можно записать
в виде р (xt | 9), где 9 —единственный параметр, как в примере
раздела 1.2.3. Можно предположить, что в этом примере при
максимизации энтропии имеющаяся информация о pt выражена
единственным уравнением, как в разделе 1.2.2. В качестве такого
уравнения можно принять уравнение (1.11), которое мы для
удобства запишем еще раз
2р«/(*|) = я [/<*)]. (l.ii)
г
Оценка р% по максимуму энтропии дается уравнениями (1.13)
и (1.14) и может быть записана в виде
= «РНи/ад (126)
г
откуда видно, что pt есть функция единственного параметра п..
Статистический подход допускает существование нескольких
подходящих функциональных форм для р (xt | 9). При этом
используются экспериментальные данные для получения оценки 9
по максимуму правдоподобия и можно провести испытания
гипотез. Выбирается функция р (xt | 9), которая обеспечивает
наибольшую точность и соответствующее значение 9.
При максимизации энтропии также получается оценка pt
и может быть проведена проверка результатов, получаемых с
помощью модели. Если результаты не согласуются с
действительностью, то можно изменять функциональную форму / (xt) в
уравнении (1.12) при известном среднем значении новой функции до
тех пор, пока не будет получено более приемлемое решение.
Если при максимизации энтропии в процессе проверки новых
функциональных зависимостей / (х) среднее значение в правой
части уравнения (1.12) неизвестно, то мы находимся в том же
положении, что и в случае статистического подхода. Тогда
необходимо использовать статистическую процедуру (например,
процедуру максимизации правдоподобия), чтобы оценить параметр и..
В этом случае при обоих подходах следует получить одну и ту же
наилучшую оценку как функциональной формы, так и параметра.
*) См. также Вильсон [7].
§ 1.3. ИСПОЛЬЗОВАНИЕ КОНЦЕПЦИИ ЭНТРОПИИ 29
Можно показать *), как получаются различные распределения
при различных формах ограничений. «Параметры» получающихся
распределений представляют собой множители Лагранжа (или
функции от них), связанные с ограничениями, и могут быть точно
определены в результате решения системы уравнений.
Но при максимизации энтропии имеются три потенциальных
преимущества перед статистическим подходом: во-первых,
использование ограничений в отличие от функции распределения
позволяет более последовательно анализировать сложные ситуации;
во-вторых, имеется возможность непосредственной интерпретации
ограничений, что облегчает понимание функционирования
системы; в-третьих, с помощью общих принципов системного анализа
облегчается непосредственный переход к динамической модели.
Следует указать также и на возможное затруднение. Если при
формировании моделей методом максимизации энтропии
используются ограничения, и численные значения математических
ожиданий в правых частях уравнений неизвестны, то разумные
рекомендации по их выбору отсутствуют.
1.3.5. Другие применения концепции энтропии. До сих пор
рассматривалось, в основном, использование энтропии при
построении моделей и их интерпретации, хотя и упоминалась ее
дополнительная роль при формировании законов динамики системы.
Подобные примеры построения городских и региональных моделей
более подробно рассматриваются далее **).
Следует, пожалуй, упомянуть ряд других довольно
специальных применений понятия энтропии. Во-первых, непосредственно
в теории информации «ожидаемая информация» от сообщения
представляет собой как раз то, что мы называем энтропией, и эту
меру можно объективно использовать для сравнения
информационных потоков с пропускными способностями каналов, а также
для решения отдельных задач декодирования в электротехнике ***).
Во-вторых, концепция энтропии, или ожидаемой информации,
используется для изучения информационных потерь, вызванных
определенными видами агрегирования в экономических
задачах****). Возможно аналогичное использование и для изучения
агрегирования по зонам. Кроме того, в ряде экономических
приложений особое внимание обращается на субъективную
природу средних значений и соответствующих распределений
вероятностей и показывается, как следует обращаться с энтропией при
использовании количественного анализа в
социально-экономических системах *****).
*) См. Трайбэс [1J.
**) См. также работы Вильсона [2, 6, 7]. Могриджа [1].
***) См., например, Голдман [1], Рэйзбек [11, Трайбэс [1].
****) См. Тейл [1].
*****) См. Мэрфи [1].
Глава 2
ТРАНСПОРТНЫЕ МОДЕЛИ: РАСПРЕДЕЛЕНИЕ ПОЕЗДОК,
ТИПЫ КОММУНИКАЦИЙ, МАРШРУТЫ
§ 2.1. Введение
При проектировании транспортных сетей, для того чтобы
оценить число поездок между различными пунктами, а также для
моделирования потоков по участкам транспортной сети, обычно
используется некоторая модель. Эта модель, как правило, состоит
из четырех подмоделей, которые связаны t генерацией поездок,
распределением поездок, расщеплением типов коммуникаций и
размещением сети *). В этой главе вопросы, связанные с
назначениями поездок, не рассматриваются; здесь предполагается, что
некоторые оценки в конечных пунктах поездок заранее
известны **). Некоторые результаты позволяют делать определенные
выводы по размещению, но нас в основном будут интересовать
распределение поездок и расщепление типов коммуникаций. Для
решения этих задач будут применяться методы максимизации
энтропии.
Будет показано, что главное преимущество методов
максимизации энтропии в области транспортных задач состоит в том, что они
помогают строить модели, описывающие довольно сложные
явления, а также в том, что они допускают прямую интерпретацию
уравнений. Сперва будут подробно рассмотрены вопросы,
связанные с гравитационной моделью распределения поездок (§ 2.2), что
позволит более отчетливо понять пример, рассмотренный в гл. 1.
В § 2.3 будет показано, как строить более общие модели
распределения, а в § 2.4 приведен ряд выводов, существенных для
расщепления типов коммуникаций. Обсуждение основных гипотез
(§ 2.5) приведет к альтернативной модели расщепления типов
коммуникаций (§ 2.6) и к анализу концепций составных затрат
(§ 2.7) и расщепления маршрутов (§ 2.8). Глава завершается
обсуждением полученных результатов (§ 2.9), ^~
) См., например, Мартин, Меммотт, Боун [1J, Овергаард [1J.
') Их можно получить, например, с помощью модели Вуттона, Пика [1].
§ 2.2. ГРАВИТАЦИОННАЯ МОДЕЛЬ РАСПРЕДЕЛЕНИЯ ПОЕЗДОК 31
§ 2.2. Гравитационная модель распределения поездок
2.2.1. Формирование гравитационной модели. Задача, которая
ставится перед любой моделью распределения поездок, заключается
в оценке числа поездок между каждой парой «точек». (Под «точкой»
в данном случае понимается центр зоны: предполагается, что
рассматриваемая область некоторым подходящим образом разбита
на зоны.) Для начала можно воспользоваться обозначениями,
введенными в гл. 1. Для простоты рассмотрим в качестве примера
поездки на работу. Пусть Тц — число поездок (на работу), a ctj —
затраты на передвижение из зоны i в зону ;; пусть Qt — полное
число отправлений из зоны i на работу, a fly — полное число
прибытий на работу в зону /. Модель распределения оценивает
Ttj как функцию от Qi9 Dj и ctj. Эти величины сами также могут
зависеть от других независимых переменных.
Наиболее простая модель такого типа — это так называемая
гравитационная модель, разработанная по аналогии с
ньютоновским законом, связывающим силу притяжения Ftj между двумя
массами тх и т,;, расположенными на расстоянии dtj друг от друга
m.m-
ра = У-у-> (2-1)
где у — некоторая константа. Аналогично транспортная гравита
ционная модель имеет вид
rii=A:-V-f (2.2)
где к — некоторая константа, а затраты на передвижение
выступают в качестве «расстояния». Согласно уравнению (2.2) величина
Ttj пропорциональна Qt и Dj и обратно пропорциональна квадрату
расстояния между ними. Но у этого уравнения имеется по меньшей
мере один очевидный недостаток: если удвоить заданные значения
Qt и Dj, то число поездок между этими зонами в соответствии с
(2.2) учетверится, а естественно ожидать, что оно лишь удвоится.
Или более точно: величины Ttj всегда должны удовлетворять
следующим ограничениям:
2г« = &. (2.3)
з
2^ = 0;, (2.4)
г
а уравнение (2.1) этого не обеспечивает. Это означает, что суммы по
строкам и столбцам матрицы поездок (или корреспонденции)
должны совпадать с числом отправлений из каждой зоны, и с
числом прибытий в каждую зону соответственно. Этим ограниче-
32 ГЛ. 2. ТРАНСПОРТНЫЕ МОДЕЛИ
ниям можно удовлетворить, если ввести наборы констант Аг и Bj,
связанные соответственно с зонами отправления и прибытия.
Иногда их называют балансирующими множителями. Кроме того, нет
оснований считать, что расстояние играет в уравнении (2.2) такую
же роль, что и в ньютоновской изике, поэтому вводится более
общая функция расстояния. Модифицированная гравитационная
модель имеет, таким образом, следующий вид:
Ти = АгВ#М (си), (2.5)
где
Л=[2*¥¥ЫР (2-6)
i
и
Д,= [24Ci/(*«)]~\ (2.7)
г
Уравнения для А% и Bj решаются итерационными методами, и
можно легко проверить, что они гарантируют, что величины Тц
из уравнения (2.5) удовлетворяют ограничениям (2.3) и (2.4).
Отметим также, что величины сц в такой модели могут служить
общей мерой сопротивления передвижению между i и у, в качестве
которой могут выступать географическое расстояние, время
передвижения, затраты на передвижение или, что часто бывает
более эффективным, взвешенная комбинация этих факторов,
которую иногда называют «обобщенными затратами».
Возможны и другие подходы к построению элементарных
моделей распределения. Пожалуй, наиболее популярная
альтернатива гравитационной модели — это модель конкурирующих
возможностей. Она представлена отдельно в Приложении 3.
Рассмотрим получение гравитационной модели с помощью
максимизации энтропии, используя вначале другую физическую аналогию.
Основной принцип построения модели для данного частного
случая был уже представлен в гл. 1. Было показано, что
необходимо ввести дополнительное к (2.3) и (2.4) ограничение на Ttj. Это
ограничение имеет вид
22*V« = C (2.8)
г j
Тогда наиболее вероятным распределением будет матрица {Ttj},
максимизирующая энтропию
In W({ЗД = In Г! - 22In 7V, (2.9)
г j
где Т — полное число поездок при ограничениях (2.3), (2.4), (2.8).
Если учесть, что W ({Тц}) — полное число состояний системы,
соответствующих распределению {Ttj}, то число всех состояний
§ 2.2. ГРАВИТАЦИОННАЯ МОДЕЛЬ РАСПРЕДЕЛЕНИЯ ПОЕЗДОК 33
системы можно оценить по формуле
ш = аиЧ{7«)), (2.10)
где суммирование проводится по всем Тц, удовлетворяющим
(2.3), (2.4) и (2.8). При этом оказывается, что максимальное
значение W ({Ttj}) настолько доминирует над всеми остальными
членами суммы, что распределение {Тц}, соответствующее
максимуму энтропии, является существенно наиболее вероятным
распределением.
Для получения набора Ttj, максимизирующего In W ({Тц})
из уравнения (2.9) при ограничениях (2.3), (2.4) и (2.8), следует
максимизировать лагранжиан X, равный
2 = \uW + W{Qi-^Tij)+^tlf)(Di-2Ti}) +
i J
где tip, tip и р — множители Лагранжа. Поскольку
предполагается, что Тц велики, то можно воспользоваться приближенной
формулой (1.9), согласно которой из (2.9) получим
Значения Г^«, которые доставляют максимум X и, следовательно,
являются наиболее вероятным распределением поездок,
представляют собой решение системы уравнений
-^- = 0
совместно с ограничениями (2.3), (2.4) и (2.8).
Будем иметь
Ш- = - In Гу - tip - tip - Рсц. (2.11)
ил г}
Это выражение равно нулю, когда
Ти = ехр (- \Р - tip - рс„). (2.12)
Подставляя (2.12) в (2.3) и (2.4), получим %Р и Xf>
ехр (- tf>) = Q [S ехр (- tip - рЧ)Г\ (2.13)
ехр(- Xf) = D} [2ехр(- Х[° - fo,)]"1. (2.14)
г
Чтобы представить окончательный результат в более привычном
2 А. Дж. Вильсо/
34
ГЛ. 2. ТРАНСПОРТНЫЕ МОДЕЛИ]
виде, запишем
ехр (- №)
Ai= Qi % (2.15)
и
ехр (- %f)
В>= В, • <2Л6>
Отсюда
Ти = AtBfiiD, ехр ( - $ci}), (2.17)
где в соответствии с уравнениями (2.13) — (2.16) имеем
А% = [S ВД ехр (- pCji)]"\ (2.18)
Bi = [S 4Ci ехр (- M"*- (2.19>
г
Таким образом, наиболее вероятное распределение поездок
является таким же, как в рассмотренной ранее гравитационной модели,
которая определена уравнениями (1.6) — (1.8) гл. 1 и уравнениями
(2.5) — (2.7), причем функция / была заменена на экспоненту с
отрицательным показателем степени. Этот статистический вывод
составляет новую теоретическую основу для гравитационной
модели. Отметим, что величина С в уравнении (2.8) обычно не известна,
и поэтому это уравнение на практике не решается относительно р.
Параметр р определяют обычными методами калибровки. Но если
бы величина С была известна, то (2.8) можно было бы численно
решить относительно р.
Статистическая теория таким образом утверждает, что при
заданных величинах отправлений и прибытий в каждой зоне и
однородной цели поездок, при заданных затратах на передвижение
между зонами и фиксированных полных затратах на транспорт в
регионе существует наиболее вероятное распределение поездок
между зонами, и это распределение совпадает с тем, которое
задается гравитационной моделью.
Читатели, знакомые со статистической механикой, узнают в
этом методе разновидность метода микроканонического ансамбля *)
для анализа систем частиц.
2.2.2. Интерпретация терминов. Особенность статистической
механики состоит в том, что члены, появляющиеся в уравнении,
которое описывает наиболее вероятное распределение, имеют
определенный физический смысл. То же самое справедливо и здесь.
Величины Qi, Dj и ctj были определены ранее, а выражение
ехр ( — $Cij) появляется в этой формулировке как явная форма
зависимости от расстояния, причем параметр р определяется
*) См., например, Ландау Л. Д., Лифшиц Е. Н. [2*].
§ 2.2. ГРАВИТАЦИОННАЯ МОДЕЛЬ РАСПРЕДЕЛЕНИЯ ПОЕЗДОК 3£
теоретически через уравнение (2.8). Но он имеет свою обычную
интерпретацию. Он тесно связан со средней длиной поездки: чем
больше 0, тем меньше средняя длина поездки. Этот факт очевидным
образом связан с величиной С в уравнении (2.8). Если увеличить С,
то увеличатся затраты на передвижения, и средняя длина поездки
возрастает; анализ левой части (2.8) показывает, что 0 при этом
уменьшится.
Осталось интерпретировать At и Bj. Пусть одна из величин Dj
изменяется, например, Dlt Тогда величины
Га = А^&Ог ехр ( - рса), 12.20)
характеризующие поездки из каждой зоны i в зону 1, изменятся
пропорционально. Величины Аи как следует из уравнения (2.18),
будут мало изменяться, поскольку выражение, включающее Di
в каждом А% — это только один из членов суммы. Величины Bt
возможно изменятся еще меньше, так как любое изменение в них
будет вызвано изменениями в А%.
Таким образом, роль А% заключается (предполагаем, что
величина Di увеличилась) в небольшом сокращении числа всех поездок,
которое компенсирует увеличение числа поездок в зону 1.
Следовательно, под At можно понимать некий конкурирующий член,
сокращающий большинство поездок вследствие роста
привлекательности одной зоны. Знаменатель А^ также обычно используется
как мера доступности, и можно сказать, что увеличение Dx
увеличивает доступность зоны 1 для каждого индивидуума, хотя обычно
мы будем пользоваться такой интерпретацией относительно
изменений сц. Таким образом этот анализ позволяет интерпретировать
А% в терминах конкурентной доступности. Аналогичную роль
играют величины Bj, которые связаны о основными изменениями
в Qi, а не в Dj. Изменение ctj или несколько одновременных
изменений Qi и Dj приведет к сложному процессу перестройки
At и Bj.
2.2.3. Обоснование метода. В предложенном методе есть два
дискуссионных момента. Первый из них — справедлива ли
аппроксимация (1.9) для значений Тц, которые встречаются на прак-
. n m
тике? Второй — является ли максимум величины Т\ I Д Д Тц\
достаточно острым максимумом?
На первый из вопросов можно ответить, используя аналогию
со статистической механикой, где один из методов получения
наиболее вероятных распределений основан на таком же
приближении. Существует, впрочем, и другой метод, метод Дарвина—
Фаулера, в котором проводится непосредственнее вычисление
отдельных членов суммы в уравнении (2.10) с помощью
производящей функции и интегрирования в комплексной области. Затем эти
2*
36 ГЛ.2, ТРАНСПОРТНЫЕ,МОДЕЛИ
члены ислользуются в качестве весовых коэффициентов при
вычислении средних значений всех распределений, причем
показано, что эти средние значения совпадают с наиболее вероятными
значениями, получаемыми с помощью аппроксимации (1.9) даже
в тех случаях, когда идет речь о числах столь малых, что формула
(1.9) заведомо неверна. Этот альтернативный метод приведен в
Приложении 4.
Более того, рассматриваемый в § 2.2 вывод основан лишь на
производной формулы (1.9). Производные энтропии, определенной
в уравнении (2.9) и получающейся при использовании известного
определения из теории информации, совпадают.
На второй вопрос можно ответить явным образом, если
исследовать малые изменения In W (7\7) в окрестности максимума.
В точке максимума или достаточно близко от нее линейные по dTtj
члены в разложении d [In W (Ttj)] пропадают, и
Вспомнив, что
= -1п7^, (2.22)
dlnW
получим
w*
d4uW
— -* г? •
г) «
ij
Подставив (2.22) в уравнение (2.21), будем иметь
т*™~-ъ?1%%£--±?1ЪШт* (2-23)
ИЛИ
d [In W (Г «,)] = ~ Т Z, S Р*Тф (2'24)
г j
ГДе Ptj = dTij/Tij — относительное изменение величины Г^, по
сравнению с наиболее вероятным распределением. Обозначим
р = max рц.
Тогда для (2.24) справедлива следующая оценка:
<111пУУ(Тц)]^-±.р*Т,
где Г = 2УГ^ — общее количество индивидуумов. Из этого
г j
выражения видно, что предельное значение вариации энтропии в
окрестности экстремума при одном и том же относительном откло-
§ 2.3. ОБОБЩЕННЫЕ МОДЕЛИ РАСПРЕДЕЛЕНИЯ 37
нении ее аргументов возрастает при увеличении Г. Другими
словами, максимум энтропии становится более «острым» с ростом
числа индивидуумов, участвующих в передвижениях,
следовательно, повышается точность модели.
Проведенный анализ показал, что гравитационная модель
имеет прочную основу. Но следует вспомнить, что весь анализ
проводился для одноцелевых поездок и для однородной группы
пассажиров. Люди не являются идентичными в том смысле, в
котором идентичны частицы в физике, поэтому вряд ли можно
ожидать, что какая-либо подобная теория позволит получить
точные результаты. Фактически этот анализ показал, что можно
ожидать хороших результатов, если удастся классифицировать
поездки по цели и по типу передвижений так, чтобы добиться
разумной однородности. Теперь надо выяснить, как строить
обобщенные модели, описывающие более сложные ситуации.
§ 2.3. Обобщенные модели распределения
Теперь можно сделать модель более реалистичной, введя
несколько типов пассажиров и несколько типов коммуникаций.
Выделим типы пассажиров по доступности различных наборов
коммуникаций. Например, владельцы автомобилей имеют доступ
как к автомобилям, так и к общественным видам транспорта, в то
время как остальные пользуются только общественным
транспортом. Такая классификация является минимально необходимой.
Может быть также полезно иметь в виду возможность аналогичного
разделения индивидуумов по различным уровням дохода или по
различным социальным группам. Если деление по признаку
наличия автомобиля не проводится, то скорее всего это приведет
либо к моделям, в которых пассажиры, не имеющие автомобилей,
совершают автомобильные поездки, либо заставит проводить
отдельное распределение поездок для различных групп
пассажиров, а следовательно, и прогнозировать привлекательность поездок
для каждой группы в отдельности.
Следовательно, возникает необходимость расширить принятые
обозначения: пусть Т\] обозначает число поездок между i и у,
совершаемых пассажирами r-го типа на транспортном средстве А;
пусть Q\ — число отправлений из i, совершаемых пассажирами
r-го типа; пусть сМ — цена поездки из i в у на к-ом. виде транспорта,
а все остальные переменные определяются, как и раньше. Пусть
М(г) — набор типов коммуникаций, доступных пассажирам г-го
типа; к ее М (г) — обозначает один из таких типов; 2 обозна-
кем (г)
чает суммирование по всем таким типам. Заметим, что в
действительности нам следует определить величину Мц (г), как
множество типов коммуникаций, допустимых между пунктами i и у для
38
ГЛ. 2. ТРАНСПОРТНЫЕ МОДЕЛИ
пассажиров r-го типа, но обычно предполагается, что между всеми
парами зон допустимы все типы коммуникаций.
Дальнейшее изменение обозначений связано с тем, что когда
индекс заменяется звездочкой, то это означает суммирование по
данному индексу. Например:
Г*Г V* грНг
ij — Zj * ij
кем (г)
есть полное число поездок пассажиров r-го типа между i и / (т. е.
Tfj суммируется по типам коммуникаций к).
Теперь можно записать уравнения ограничений, отражающие
наши гипотезы относительно новой ситуации. Во-первых,
необходимо сделать предположение о назначениях поездок. Обычно
классифицируют поездки, направленные в сторону проживания по типу
пассажиров, а поездки, направленные в другие стороны, по другой
характеристике зоны, такой как использование земли *). Другими
словами, можно ожидать, что Q\ будут функциями г, a Dj — нет,
так как предполагается, что различные типы пассажиров с одной и
той же целью поездки конкурируют в пределах одних и тех же зон.
Именно поэтому выше емкости пунктов отправления были
определены как Qru а емкости пунктов прибытия — как Dj. Это
представляется полезным и разумным, даже когда пассажиры делятся
только на две группы: владельцы автомобилей и лица, не имеющие
автомобилей. Тогда соотношения
S 2 TTi=Qru (2.25)
i k<BM(r)
i r feeM (г)
описывают выдвинутые гипотезы о назначениях поездок. Можно
предположить также, что различные типы пассажиров могут
позволить себе различные затраты на транспорт, а следовательно, и
различные способы передвижения, что дает стоимостное
ограничение для каждого г в виде
2S 2 ВД-С. (2.27)
г j fceM (r)
Теперь, максимизируя обычным способом
Г!
In
П Т%\
i, j, r, fcGM (r)
при ограничениях (2.25) — (2.27) получим
7f = AZBjQlD, exp (- рГс&), (2,28)
*) См. Вуттон, Пик [1J.
§ 2.3. ОБОБЩЕННЫЕ МОДЕЛИ РАСПРЕДЕЛЕНИЯ 39
где
*i = [2 2 5yDjexp(-pr4)]^ (2.29)
И
*j=[S2 2 ^1ехр(-РЧ)Г. (2.30)
i r fteM (г)
Заметим, что уравнение (2.28) описывает несколько
гравитационных моделей для каждой к — г группы. Связь между ними
осуществляется через Bj, поскольку соответствующие выражения
включают в себя все к ж г.
Например, если для описания населения достаточно одного
типа пассажиров (например, когда почти у всех есть автомобили),
то можно провести агрегирование по г для описания этой
единственной категории. Будем иметь
Til = ZtBfitD, ехр (—Р4), (2.31)
Я* 42 S ВДехр(-1Ц)Г, (2.32)
з keM(i)
*j-[S S ^ieXp(-p4)r1. (2.зз)
г fcSM(l)
Заметим, что если в свою очередь провести агрегирование и этой
модели (по к), то получим исходную гравитационную модель,
описываемую уравнениями (2.17) — (2.19).
Если провести агрегирование общей модели (2.28) — (2.30)
по к, то получим ситуацию с одним типом коммуникаций, или,
проще говоря, модель распределения поездок по типам пассажиров
T% = AZBiQriDs 2 ехр(-рг4), (2.34)
кем (г)
41=12ВД 2 ехр(-Р^)Г\ (2.35)
i кем (г)
Bj = [22^01 2 ехр(-рг4)Г. (2.36)
Отметим, что каждое суммирование по к проводится по типам
коммуникаций, доступным пассажирам типа г.
Представляется полезным в этом разделе построить еще одну
модель. Предположим, что вместо стоимостей проезда,
представленных в виде величин с*, заданы величины СТ,-, описывающие
стоимость проезда из i в /, для пассажира г-го типа. Очевидно, что
C[j составляется из с% для транспортного средства к,
доступного пассажирам г-го] типа.) Тогда, используя переменные Т\$ и
40
ГЛ. 2. ТРАНСПОРТНЫЕ МОДЕЛИ
максимизируя In lT\ j JJ Тц\\ при ограничениях
г г
v» v rn*rrfr г*
г j
получаем
где
TXi = ЛГЯ;<?Г Д; ехр (- ред (2.37)
4 = IS ВД ехр (- ргС£)Г (2.38)
^j = [SS^iexp(- Р'СТу)]-1. (2.39)
г г
Данная модель будет обсуждаться в дальнейшем.
§ 2.4. Последствия расщепления типов коммуникаций
Рассмотрим модель, описываемую уравнениями (2.31) — (2.33),
которые выделяют только типы коммуникаций. Просуммируем
уравнение (2.31) по к и разделим (2.31) на результат, что даст
уравнение расщепления типов коммуникаций в виде
, Ц ехр (-1ф
Представим это соотношение в виде
13 1+2 «p[-F(c£-q&)l '
fcVfc
Это модель с расщепленными типами коммуникаций, которая
неявно присутствует в нашей обобщенной модели распределения.
В этом уравнении может быть учтено любое число типов
коммуникаций. Далее, представляет большой интерес тот факт, что уравнение
(2.40) имеет ту же форму, что и уравнение расщепления типов
коммуникаций, получаемое вследствие применения дискриминант-
ногр анализа*), если обобщенная Гфункция затрат может быть
отождествлена с дискриминирующей функцией, используемой в
статистике. Это очевидное совпадение наводит на мысль, что
*) См. Куарнби [1].
§ 2.5. ПОВЕДЕНЧЕСКИЕ ГИПОТЕЗЫ 41
дискриминантный анализ является хорошим средством оценки
весов в обобщенной функции затрат вида
где Хг — такие величины, как стоимость проезда, время проезда,
избыточное время, что уже отмечалось ранее.
Теперь можно изучить выводы по расщеплению типов
коммуникаций в общей модели (2.28) — (2.30). С помощью процедуры,
аналогичной рассмотренной выше, можно получить расщепление
типов коммуникаций для пассажиров каждого типа в виде
"~п;~ а «р<-рч> " ( ]
кем (г)
Здесь уже суммирование типов коммуникаций проводится по
подмножеству типов коммуникаций, доступных пассажирам типа г.
Теперь следует выделить гипотезы, лежащие в основе этих моделей
и объединяющие в себе полученные особенности моделей
распределения и расщепления типов коммуникаций.
§ 2.5. Поведенческие гипотезы
Сперва заметим, что величина Сг (расходы г-го типа пассажиров
на данный класс поездок) для того, чтобы существовали величины
Tif, которые удовлетворяют ограничениям, связывающим матрицу
поездок с известными числами прибытий и отправлений, должна
превосходить некоторую минимальную величину. Действительно
n m
при |Зг-**о, 2 2 S fycS-^min,
г=1 j=l IfSM (r)
где min представляет собой минимальное значение Сг. Если Сг
превышает это минимальное значение, что характеризуется
калиброванными значениями |3Г, то это превышение представляет собой
ту сумму, которую индивидуумы согласны заплатить и которую
они действительно платят для того, чтобы, во-первых, проехать
расстояние, превышающее минимальное, а во-вторых — совершить
эту поездку с помощью более комфортного транспортного средства.
В формуле (2.41) расщепления типов коммуникаций параметр
Рг измеряет чувствительность пассажиров г-го типа к изменениям
цен на различные типы коммуникаций. Если значение рг мало, то
цены различных типов коммуникаций различаются мало, но если
оно велико, то большинство людей совершает поездки с помощью
наиболее дешевого транспортного средства. Большая величина рг
соответствует, очевидно, малой величине Сг.
42
ГЛ. 2. ТРАНСПОРТНЫЕ МОДЕЛИ
Но рг играет также и другую роль в моделях распределения,
например, в (2.28) — (2.30). Величина рг определяет среднюю
длину поездки, а следовательно, и чувствительность пассажиров к
изменению длины поездки. Если значение рг мало, то средние
длины поездок велики (Сг также велико) и наоборот.
Модель, представленная уравнениями (2.37)—(2.39), была
получена в предположении, что заданы стоимости С[; переезда
пассажиров r-го типа из i в /. Эти стоимости составляются из
стоимостей по типам коммуникаций с^. Вопрос определения формы
составных стоимостей, являющийся традиционным в построении
моделей транспортного спроса, оказывается очень важным при
анализе моделей с расщепленными типами коммуникаций.
Заметим, что модель, представленная уравнениями (2.37)—(2.39),
может быть полностью отождествлена с агрегированной
обобщенной моделью, представленной уравнениями (2.34)—(2.36), если
ехр (-?'<$) = а 2 ехр(-рг4), (2.42)
fcSM (г)
где в левой части вместо рг стоит рг, так как значения этого
параметра в двух системах уравнений могут не совпадать. Здесь а —
произвольный постоянный множитель. Это наводит на мысль, что
(2.42) можно рассматривать как функциональную связь между
величинами Стц и су.
Легко видеть, что в уравнении (2.42) величина а определяет
положение нуля на шкале, а рг — величину единицы масштаба.
Обычно удобно полагать значение а равным обратной величине
числа доступных типов коммуникаций (для всех пассажиров),
так как это гарантирует, что Сгц всегда будут положительными,
а значение рг удобно принимать равным рг, что обеспечит
равенство масштабов для Сгц и с^. В дальнейшем будут рассмотрены
также и другие выражения для функции составных затрат.
§ 2.6. Альтернативная модель
расщепления типов коммуникаций
Предыдущее обсуждение роли рг приводит к мысли, что
возможны и другие гипотезы о расщеплении типов коммуникаций. Наш
следующий шаг заключается в обсуждении этих гипотез.
Один из возможных подходов состоит в том, чтобы
постараться создать структуру модели, имеющую один набор
коэффициентов для определения средних длин поездок и второй — для
определения расщепления типов коммуникаций.
Эта модель может быть получена с помощью метода
максимизации энтропии следующим образом. Пусть существует набор
§ 2.6. АЛЬТЕРНАТИВНАЯ МОДЕЛЬ РАСЩЕПЛЕНИЯ
43
величин Clj, представляющих собой обобщенные стоимости
проезда от i к /, для пассажиров r-готипа. Предположим, что это как
раз те стоимости (независимо от способа их получения), которые
определяют распределение поездок, а следовательно, и
расстояние.
В ранее рассмотренной модели пассажиры r-го типа тратили
на эти поездки сумму Сг. Предположим теперь, что [некоторая
часть этой суммы Г^ тратится на достижение пункта назначения
(т. е. на распределение поездок), так что
S2W-rf\
* i
г r
Максимизируя энтропию (2.9) при данных ограничениях, получим
Т% = AZBiQW, exp (- prCTj), (2.43)
где А\ и Bj определяются так же, как в уравнениях (2.38) и (2.39).
Предположим теперь, что остаток г£г) = Сг — Г][г) тратится на
совершение поездок между каждой парой зон с помощью вида
транспорта, отличного от наиболее дешевого. Пусть йц —
минимальные затраты на проезд от i к /, тогда можно написать
2 (4-<*«)Г« = 3Г) С/). (2.44)
где Г^ (г, /) — та часть Г£\ которая соответствует поездке между
зонами i и /, и
S Т% = Т%. (2.45)
Теперь обычным способом проведем максимизацию
In
гг
П г*п
при ограничениях (2.44) и (2.45) обычным способом.
Получим
Ц 2 ехрНЯГЦ.-d..)] '
44
ГЛ." 2. ТРАНСПОРТНЫЕ МОДЕЛИ
ИЛИ
Т?Г ехо (- Xrcl)
(2.46)
7с<=м (г)
если предположить, что множитель Хг не зависит от i, /.
Величины d^y в это соотношение не входят. Таким образом, получена
модель с расщеплением типов коммуникаций, которая
распределяет поездки по типам пассажиров так же, как и агрегированный
вариант (2.37)—(2.39) общей модели (2.28)—(2.30), где проводится
расщепление типов коммуникаций (2.46) в той же форме, что и
в (2.41), но с другим набором коэффициентов.
§ 2.7. Альтернативные оценки составных затрат
Выше (§ 2.5) отмечалось, что имеется возможность определения
составных затрат C\j по стоимостям типов коммуникаций с*.
Один из способов ее реализации приводит к выражению (2.42).
Отсюда видно, что из обобщенной модели (2.28)—(2.30) и
соответствующего уравнения расщепления типов коммуникаций (2.41)
вытекает, что можно определить величины C\j так, чтобы была
справедлива агрегированная модель (2.34)—(2.36), а получаемые
C\j связывались с с% уравнением (2.42) при рг = рг. Но теперь
можно принять в качестве наиболее общей формулы
расщепления типов коммуникаций уравнение (2.46). Тогда видно, что при
выполнении условия (2.42) будем иметь
Рг = Г
и
1
где N — общее число типов коммуникаций.
Но так как теперь допускается, что механизм расщепления
типов коммуникаций может быть не таким как в модели
распределения, можно неявно предположить, что возможны и другие функции
составных затрат. Например, гипотеза о поведении индивидуумов
может состоять в том, что при распределении поездок они ведут
себя так, как если бы они предпочитали только минимальные
стоимости по всем доступным им типам коммуникаций. Тогда
в выражениях (2.43) и (2.46) следует положить
С[,= min (4). (2.47)
fc<=M (r)
Это может дать хорошие результаты, если рг и V оцениваются
отдельно и возможно даже не равны друг другу. Можно предположить
§ 2.7. АЛЬТЕРНАТИВНЫЕ ОЦЕНКИ СОСТАВНЫХ ЗАТРАТ 45
также и более общие формы составных затрат, например
S..44
ъ - *g sr) -» (2,48)
ftSM (r)
или
21 ^.ехр(-^4)
ехр (- р'СГ,) = J^HII) , (2.49)
S ?4
fc<=M (r)
где и;*,- — весовые коэффициенты. На самом деле, в силу
независимого характера механизма расщепления типов коммуникаций
(2.46) соотношения между числами пассажиров каждого типа в
каждой поездке становятся известными, и это позволяет оценить
пропорции всех поездок между i и /, совершаемых по к-му типу
коммуникации. В качестве весовых коэффициентов w% можно выбрать
эти пропорциональные соотношения
Перепишем это равенство в следующем виде:
2г£
i ij 2l i ij
r
Тогда, подставив значения T*f и TiJ/Tfj' из (2.43) и (2.46)
соответственно, получим
Sexp (— Wcl)
2 еХр(-Ц)^^еХР("рГ^
« S4WV*P(-p'-cr.)
г
Теперь эти выражения можно подставить в уравнение (2.48) и
(2.49) и решить любое из них относительно C\j итерационными
методами. Заметим, что решение принимает особо простую форму,
если г = 1. При этом оцениваются единственные составные
затраты на распределение по стоимостям типов коммуникаций,
так как в правой части выпадают все C\j.
Таким образом, имеется по меньшей мере четыре варианта
функциональных зависимостей для составных затрат,
определяемых (2.42), (2.47)^(2.49).
46
ГЛ. 2. ТРАНСПОРТНЫЕ МОДЕЛИ
Теперь имеет смысл подвести итог альтернативным моделям,
которые следует подвергнуть экспериментальной проверке:
, а) Обобщенная модель (2.28)—(2.30) с соответствующим
расщеплением типов коммуникаций (2.41) характеризуется
множеством коэффициентов рг для определения средних длин поездок и
расщепления корреспонденции по типам коммуникаций. Отсюда
вытекает формула составных затрат (2.42) для С\^ если она
определена. Поэтому формально эта комбинированная модель может
интерпретироваться как сочетание модели распределения типов
пассажиров (2.37)—(2.39) с коэффициентами |У и отдельного
механизма расщепления корреспонденции по типам коммуникаций
(2.46), но при Хг = Рг. Коэффициенты Сц определяются и строятся
по с§ по формуле для составных затрат (2.42).
б) При независимой модели расщепления типов коммуникаций
равенство между V и |3Г может и не выполняться, a C\j не
обязательно получаются из с* по формуле (2.42). Здесь возможны
другие альтернативы, которые представлены выражениями
(2.47)-(2.49).
Для удобства будем называть механизм расщепления типов
коммуникаций (2.46) Afl, модель распределения (2.37)—(2.39) —
D1, виды составных затрат (2.42), (2.47), (2.48), (2.49) — CI, C2,
СЗ, С А соответственно.
§ 2.8. Расщепление маршрутов
Величины cfj были определены, как стоимости проезда из i в /
с использованием типа коммуникации к; эти величины через
формулы составных затрат позволяют получить стоимости C*j. Однако
стоимости cfj связаны с реальными маршрутами, а тип
коммуникации между i и / может состоять из нескольких маршрутов.
Например, если имеются два типа коммуникаций — автомобиль и
железная дорога, то может существовать несколько дорожных и
железнодорожных маршрутов между каждой парой зон. Поэтому следует
определить у%, как стоимость проезда /г-ым маршрутом между i
и /. Такая информация доступна для измерения. Определим тип
коммуникаций, как множество маршрутов. Пусть Rtj (к) —
множество маршрутов между i и j\ которое по определению является
типом коммуникаций к, пусть h €~ Rij (к) — один^из^таких'марш-
рутов, a S означает суммирование по всем'таким маршру"
там. Полезно также определить Мtj (г), восстановив индексы i и f.
Заметим, что 25 означает суммирование по всем маршрутам,
fteR,. j (к)
доступным r-му типу пассажиров.
§ 2.8. РАСЩЕПЛЕНИЕ МАРШРУТОВ
47
Теперь можно ввести понятие расщепления маршрутов и
выяснить, как определяются cfj по у^, снова используя формулы
для составных затрат, а также исследовать взаимосвязь
расщепления маршрутов и расщепления типов коммуникаций. Понятие
расщепления маршрутов является, конечно, особенно
существенным для задачи размещения в транспортной модели. Например,
размещения или формулы расщепления маршрутов, размещающие
поездки по альтернативным маршрутам, нужны в различных
процедурах, учитывающих ограничения по пропускной
способности, которые порождают несколько маршрутов между каждой
парой точек. Поэтому результаты этого параграфа содержат
выводы, непосредственно приложимые к транспортным моделям,
а также весьма важные в силу своей связи с понятием
расщепления типов коммуникаций.
Таким образом результаты этого параграфа содержат выводы,
непосредственно приложимые к транспортным моделям, а также
весьма важные в силу своей связи с понятием расщепления типов
коммуникаций.
Пусть SiJ — число поездок между i и /, совершаемых
пассажирами типа г по ft-му маршруту между i и /. Легко видеть, что
&ij — 1 ij •
Возможны по меньшей мере два механизма, которые могут
определять расщепление маршрутов в рамках методологии модели
максимизации энтропии:
а) Пассажиры имеют информацию о стоимости маршрутов,
и формула расщепления маршрутов может быть получена по
аналогии с (2.46), но с использованием параметра, который мы
обозначим через \ir, чтобы его можно было отличить от %г. Тогда
teJF^ (К) кем. j (r)
Это уравнение расщепления корреспонденции по типам маршрутов.
б) Пассажиры имеют информацию о стоимости типов
коммуникаций, а расщепление по типам коммуникаций определяется
уравнением
Т}Г ^ вхр(-Хгс$)
Т*Г 2 е*Р(-*Ч> '
кем (г)
Тогда расщепление по типам маршрутов с учетом типов
коммуникаций определяется по формуле
№ eip(-|i'Y?h>
h^Rtf (1С)
(2.51)
48
ГЛ. 2. ТРАНСП0РТНЫЕ1М0ДЕЛИ
Для удобства будем называть формулы (2.46) и (2.51)
расщепления маршрутов R1 и R2 соответственно. Снова, как и раньше,
возникает задача об определении составных затрат. Рассмотрим
ранее полученные функциональные зависимости и применим их
к задаче определения c^j no yif
CI: exp (- lr4) = a % exp (- ji^),
fceRjjtt)
C2: c*= min (tf),
C3: A =
hg«tj(fc)
S 4еХр(-ц^)
C4: exp (— X cy) = ^ K .
h<=R. j (fr)
Сперва заметим, что если С1 имеет место в реальных ситуациях,
то можно положить \ir = Яг, а тогда формулы Д1 и R2 могут
применяться одновременно. При другом подходе можно утверждать,
что если используется С2, СЗ, С А или любая другая отличная
от Ci функциональная зависимость для оценки затрат по типам
коммуникаций, и если модель расщепления по типам
коммуникаций согласуется с действительностью, то модель R1 становится
довольно шаткой. Если данный факт имеет место, то это является
довольно сильным утверждением относительно
информированности пассажиров. Это означало бы, что пассажиры воспринимают
типы коммуникаций как нечто целое, а информация о маршруте
представляет собой в определенном смысле вторичный фактор.
Подведем итог: если оправдано применение модели Ж, то
преобладает информация о маршрутах, если оправдано применение
модели R2, то преобладает информация о типах коммуникаций,
если только в качестве соответствующей формы составных затрат
не выбрана формула С1, что привело бы к эквивалентной
информации о маршрутах и типах коммуникаций. Существует также
принципиальная возможность формирования такой
функциональной формы для составных затрат, которая допускает
выполнение R1 вместе с той частью Д2, которая связана с
расщеплением типов коммуникаций. Правда, в этом случае нельзя с
уверенностью утверждать, что R2 и R\ удовлетворяются
одновременно, так как (2.51) не выполняется.
§ 2.9. ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ И ОБСУЖДЕНИЕ 49
§ 2.9. Заключительные замечания и обсуждение
2.9.1. Простой пример. Некоторые из уже рассмотренных
вопросов могут стать яснее, если обсудить простой пример.
Предположим, что в нашей системе есть только две точки — А ж В —
и между ними существуют два маршрута, например один
шоссейный (для автомобилей) и один железнодорожный. Предположим,
что стоимость проезда по каждому из маршрутов одна и та же.
До - ПоСЛе
Рис. 2.1. Все стоимости равны в обеих ситуациях.
Расщепление транспортного движения между А и В, по
маршрутам или по типу коммуникаций, будет в отношении 1:1.
Предположим, что введен дополнительный шоссейный маршрут,
причем все стоимости сохранены и опять совпадают. Эти ситуации
изображены на рис. 2.1. Каково расщепление в новой ситуации?
Модель R1 дает расщепление маршрутов в отношении 1:1:1
(шоссе, шоссе, железная дорога), а следовательно, расщепление
типов коммуникаций (получаемое в результате суммирования
по соответствующим маршрутам без помощи каких-либо формул,
поскольку их здесь просто нет) составит 2 : 1 (шоссе, железная
дорога). Таким образом, налицо сдвиг поездок с железной дороги
в сторону шоссе (в предположении о фиксированном числе
пассажиров и отсутствии дополнительно возникающих поездок).
Но если используются формулы для затрат С2, СЗ или С4, то
модель R2 дает расщепление маршрутов в отношении 1 : 1 : 2,
а расщепление типов коммуникаций — в отношении 1 : 1. В этом
простом примере результаты применения формул для затрат С2,
СЗ и С4 совпадают. Следовательно, использование различных
моделей приводит к совершенно разным результатам. Мы должны
иметь возможность выделять реальные ситуации, которые бы
аппроксимировали такого рода примеры и позволяли нам
различать модели.
Этот пример наводит на мысль, что R2 априорно
предпочтительнее Д1, поскольку модель R1 переводит ряд
железнодорожных пассажиров на шоссе в результате появления нового
маршрута, хотя стоимости проезда не изменились. Можно предположить,
что появление нового шоссе не является существенной
альтернативой для железнодорожных пассажиров, поскольку у них и
до этого была возможность поехать по шоссе, а они ей не
воспользовались. Если бы эти рассуждения подтверждались
эмпирическими данными, то это могло бы заставить нас пересмотреть опре-
50
ГЛ. 2. ТРАНСПОРТНЫЕ МОДЕЛИ
деление типа коммуникации. Например, достаточно ли
классификации на автомобильный и общественный транспорт или следует
рассматривать скорые и пассажирские поезда, как разные типы
коммуникаций, а скоростные автострады отличать от обычных.
Этот вопрос может стать несколько яснее вследствие анализа
психологических мотиваций *).
Выбор между моделями R1 и R2 оказывает также влияние на
алгоритмы размещения при ограниченной пропускной
способности, которые распределяют транспорт между альтернативными
маршрутами. Удалось установить, что: а) алгоритмы должны
осуществлять распределение между всеми маршрутами в
совместных частно-общественных сетях, если верна модель Д1;
б) они должны осуществлять распределение между маршрутами
только на сетях для типов коммуникаций с ранее определенными
расщеплениями типов коммуникаций, если верна модель R2;
в) можно^пользоваться любым способом распределения тогда и
только тогда, когда стоимости типов коммуникаций и маршрутов
входят в составные затраты в виде С1.
2.9.2. Альтернативные функции затрат. В моделях
распределения и расщепления, рассмотренных выше, основную роль играет
показатель степени р в функции затрат, и успех предлагаемого
метода существенно зависит от того, насколько успешно на
практике выбран этот показатель, а иногда и сама функция. Но
существует возможность введения и других функций, которые в
определенных ситуациях могут оказаться предпочтительнее **).
(1) Стоимости, которые входят в модели, это наблюдаемые
стоимости, и может существовать некое преобразование,
связывающее их с непосредственно измеряемыми стоимостями. Это пре-
б* азование может привести к иному виду зависимости
наблюдаемой стоимости от непосредственно измеряемых стоимостей.
(2) Можно проводить классификацию поездок по группам,
например на длинные и короткие, в каждой из которых
наблюдается большая однородность, чем во всем множестве. Для каждой
группы можно предложить различные функции предпочтения или
различные значения параметра р при экспоненциальной функции
предпочтения.
(3) Можно показать ***), что если значения рг в
рассматриваемых моделях распределены по всей совокупности индивидуумов
в соответствии с гамма-распределением, то экспонента с
отрицательным показателем степени переходит в степенную функцию.
Для примера рассмотрим одну из этих ситуаций. Фактически
можно использовать преобразование типа (1), чтобы перевести
*) Этот вопрос рассматривался Куандтом, Баумолем [1].
**) Я благодарен Бриттону Хэррису, предложившему несколько таких
функциональных зависимостей.
***) См. Харрис [1].
wl
§ 2.9. ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ И ОБСУЖДЕНИЕ 51
показательную функцию с отрицательным показателем степени
в степенную проще, чем это предлагается в (3). Предположим,
что пассажиры располагают информацией не об истинном
значении стоимости, а о логарифме от этого значения. Такое
предположение будет оправдано, если пассажир, которому надо
проехать 200 миль, оценивает стоимость проезда 50 миль меньше, чем
пассажир, которому надо проехать всего 50 миль. Тогда удельные
затраты ctj переходят в In с^, а ехр (—$сг/) — в ехр (— р 1пс^),
т. е. в cTf. Следовательно, если модели дают лучший результат
с обратными степенными функциями, чем с показательными
функциями с отрицательным показателем степени, то это показывает,
какую информацию о стоимости имеют пассажиры. Вся остальная
техника транспортных моделей сохраняется.
2.9.3. Замечание по поводу прогноза. Если для оценки
параметров рг используется какая-либо процедура, включающая
в себя сравнение предсказаний модели с экспериментальными
данными, то модель можно использовать для прогноза при
решении задач планирования. Это приводит к необходимости делать
отдельные предположения о поведении рг в будущем. Обычно
предполагают, что рг остается постоянным. Приведем здесь для
удобства ограничение
ZsZi Za Тц су ~ С ,
г j JceM (r)
которое представляет собой основную гипотезу модели. Если
оценить рг в базовый период, то можно использовать уравнение (2.27)
для вычисления в этот период величины'' (7 — суммы, которую
пассажиры r-го типа тратят на транспорт (измеряемую, конечно,
в терминах обобщенных стоимостей). В принципе, можно оценить
скорость изменения Ст с помощью какой-нибудь независимой
пространственно агрегированной экономической модели. В этом
случае можно воспользоваться уравнением (2.27) для оценки
скорости изменения Рг *).
*) В работе Хаймена, Вильсона [1] рассматриваются следующие
предположения о поведении Рг : a) Pr = const; б) Cr = const; в) PrCr = const.
Результаты моделирования существенно зависят от принятых
предположений.
Глава 3
МЕЖРЕГИОНАЛЬНЫЕ ПОТОКИ ПРОДУКТОВ
§ 3.1. Введение
3.1.1. Круг рассматриваемых задач. В этой главе
рассматривается ряд подходов к анализу межрегиональных потоков
продуктов. Вначале обсуждается несколько существующих подходов,
каждый из которых связан с определенными аспектами проблемы.
При этом проводится систематическая оценка ньютоновской
гравитационной модели. Затем вновь рассматриваются принципы
максимизации энтропии по отношению к транспортным моделям
гл. 2, что позволяет провести более глубокое изучение
гравитационных моделей межрегиональных потоков; методы,
разработанные на основе этого подхода, будут объединены впоследствии при
выводе межрегиональной модели «затраты — выпуск».
Интересно отметить, что взятая целиком эта область
исследований находится где-то посередине между географией и
экономикой: развитие соответствующих концепций пространственного
взаимодействия связано, в основном, с географией (и с отдельными
результатами из области «социальной физики»), а развитие основ
анализа моделей «затраты — выпуск» связано прежде всего с
экономикой. Будет показана необходимость создания
интегрированной (комплексной) модели. Кроме того, подходы к моделированию
пространственного взаимодействия, которые будут развиты в этой
главе для межрегиональных потоков продуктов, очевидно, имеют
более широкое поле применений. Так как относительно небольшое
число моделей межрегиональных потоков подвергалось
экспериментальной проверке, то ни традиции, с одной стороны, ни
границы, определяемые эмпирической проверкой, с другой стороны,
не мешают исследовать формы моделей, которые могут оказаться
полезными. Поэтому открывается возможность изучить большое
разнообразие гравитационных моделей и показать, что
гравитационную модель следует рассматривать не как одну модель, а как
широкий спектр возможных моделей, причем небольшие
расхождения между ними вызваны изменением основных
предположений. Поэтому, хотя в этой главе будут рассмотрены потоки това-
§3.1. ВВЕДЕНИЕ
53
ров, возможны и другие интерпретации, что позволяет
рассматриваемые модели применять и в других областях.
Модель межрегиональных потоков продуктов имеет большое
значение для национальных плановых органов. Она позволяет
получать прогнозы влияния экономического развития на
национальную грузовую транспортную систему, а также помогает
улучшить экономические прогнозы, особенно на региональном
уровне.
3.1.2. Обозначения. Предположим, что имеется некоторое
множество регионов, i, /, А, . . ., обменивающихся
экономическими товарами, причем товары разбиты на группы г, s, р, . . .
Межрегиональную транспортную сеть можно описать с помощью
стоимостей перевозки отдельных продуктов между регионами.
Кроме того, будем предполагать, что имеется всего один тип
коммуникаций. Пусть crjj — средняя стоимость перевозки единицы
продукта типа г из пункта отправления i в пункт назначения /.,
Заметим, что сц — средняя стоимость перевозки единицы продукта
типа г из пункта отправления, находящегося в i, в пункт
назначения, также находящийся в i. Пусть хтц — полный поток продукта
типа г из региона i в регион /, измеряемый в единицах, принятых
для данной группы продуктов.
Если какой-либо индекс заменяется звездочкой, то это, как
и в гл. 2, означает результат суммирования по этому индексу.
Так, например,
< = УхХт
г* 4* Xij,
J
есть полный объем продукта г, произведенный в регионе i.
Аналогично xlj — полный объем продукта г, использованный для
производства других продуктов или потребленный в регионе /. Удобно
также обозначить через Х\ и Y\ полное производство и
потребление (понимая под «потреблением» использование всеми
секторами, в том числе и личное потребление) в регионе i. Это бывает
полезно в тех случаях, когда процедура оценки этих величин не
зависит от процедуры оценки хгц. Будет полезно также обозначить
через Хг полное производство в системе, откуда
г
и, конечно, Хг = 21 YJ, так как мы предполагаем, что система
замкнута.
54 гл. з. межрегиональные потоки пгодуктов
§ 3.2. Гравитационные модели
3.2.1. Ньютоновская гравитационная модель и некоторые
эвристические обобщения. Любой вывод гравитационной модели
обычно основывается на аналогиях между пространственным
взаимодействием в географии и пространственным
взаимодействием в классической физике, как уже было показано на примере
пассажиров и поездок в гл. 2. Поэтому в только что введенных
терминах величины Х\ и Y\ можно интерпретировать как «массы»
продукта г, связанные с отправлениями и прибытиями, в
пространственном взаимодействии между регионами i и ;. Стоимость
перевозки единицы продукта равна с?}, и эту величину можно
соотнести с «расстоянием». Строго ньютоновское взаимодействие,
возвращаясь по аналогии к рассуждениям гл. 2, сводится к
величине х\), рассчитываемой по формуле
■ггГуГ
где Кг — нормирующий множитель, обеспечивающий выполнение
равенства
* )
Это означает, что
/Г-
Заметим, что географическое пространственное взаимодействие
между потоками продуктов может управляться функцией
расстояния, отличной от закона степени (—2); тогда уравнение (3.1)
примет вид
х\1 = КгХ1Гг/(сгц), (3.2)
где f (су) — некоторая убывающая функция c\j, a kr вычисляется
по формуле
Г= ЩХЩГЫ} ' (3'3)
Следует обратить внимание, что система обозначений,
введенная выше, допускает возможность существования разных функций
для разных групп продуктов. Позднее необходимость этого станет
очевидной.
§ 3.2. ГРАВИТАЦИОННЫЕ МОДЕЛИ 55
Модель межрегиональных потоков продуктов обеспечивает
оценки xrij, а следовательно, и xru, xrj и х\ Но величины х[^
а также, возможно, и я[Ф, xij могут быть непосредственно оценены
при помощи независимых моделей (в наших обозначениях эти
оценки Хг, Х\ и Yj соответственно).
Существуют четыре возможных случая: во-первых, существует
независимая оценка Хг\ во-вторых, существует независимая
оценка XI, которая определяет Хт\ в-третьих, существует независимая
оценка Y], которая определяет Уг; в-четвертых, существуют
независимые оценки Х\ и Yj, полученные так, что они определяют Хг
по формулам2Х\ = Хг и ^Yrj = Yr* Четыре выделенных здесь
г j
случая являются наиболее интересными. Эти случаи будем
называть случай U), случай (И), случай (ш) и случай (iv) соответственно.
Теперь вернемся к дальнейшему обсуждению ньютоновской
формы гравитационной модели, представленной уравнением (3.2).
Заметим, что в уравнениях (3.2) и (3.3) Х\ следует заменить на
#£♦, а Уу — на xij, в случаях, когда их независимые оценки
отсутствуют. Так как по предположению оценка Хт существует во всех
случаях, то для оценки Кг может быть всегда использовано некое
уравнение вида (3.3). Таким образом, уравнения (3.2) и (3.3) в том
виде, в котором они записаны, представляют собой ньютоновскую
гравитационную модель для случая (iv), и легко могут быть
непосредственно решены относительно xij. Для любого из случаев
(i)—(Hi) несколько модифицированные версии уравнений (3.2) и
(3.3) приводят к труднорешаемым квадратным уравнениям
относительно x\j.
Заметим, что в каждом из случаев (i)—(iv) должны
удовлетворяться два из следующих уравнений:
2 ХЬ = 4*, (3.4)
з ,
^j х^ = x*j, W»5)
i
^2iXTij — x\, (3.6)
i
2U*-=rl- (3-7)
i
Равенства (3.4) и (3.5) должны выполняться в случае (i), равенства
(3.5) и (3.6) — в случае (И), равенства (3.4) и (3.7) — в случае
(Hi), а равенства (3.6) и (3.7) — в случае (iv). Действительно,
легко видеть, что модель, определяемая уравнениями (3.2) и (3.3)
и их вариантами, не удовлетворяет этим очевидным условиям
50 ГЛ. 3. МЕЖРЕГИОНАЛЬНЫЕ ПОТОКИ ПРОДУКТОВ
непротиворечивости ни в одном случае. Есть две точки зрения
на эту ситуацию. Во-первых, меру пригодности модели можно
оценить по степени совпадения между значениями выражений
в соответствующих уравнениях в каждом случае. Во-вторых,
можно постараться осуществить дальнейшее развитие модели,
чтобы эти уравнения вошли в качестве ограничений. Этим мы
сейчас и займемся.
Отметим, что в случаях (i)—(iv) в качестве ограничения можно
использовать только одно уравнение из пары уравнений,
соответствующих каждому случаю; при этом в случаях (i), (ii)
неиспользованное уравнение можно применить для новой «проверки»
получающейся модели. Чтобы не заниматься выписыванием
соотношений для каждого варианта, сделаем одно упрощающее
предположение. Будем предполагать, что проводится независимая оценка
лишь тех уравнений в (3.4)—(3.7), которые содержат переменные
величины в правой части (уравнения (3.6) и (3.7)). Эти уравнения
используем в качестве ограничений.
Случай (i): модель без ограничений. В условиях сделанного
упрощающего предположения ограничения отсутствуют, поэтому
уравнения (3.2) и (3.3) продолжают описывать соответствующую
модель в предположениях случая (t), хотя, строго говоря, следует
заменить Х\ и Y) на хи и xlj соответственно.
Случай (if); модель с ограничениями на производство. Здесь
уравнение (3.6) выступает в роли ограничения на полное
производство в регионе L Можно найти набор нормирующих
множителей, которые заменят единственный множитель Кг, что
обеспечит выполнение соотношения (3.6). Введем множители А\,
и уравнение (3.2) перепишем в виде
xl^AlXlxlfitij), (3.8)
где вместо Y] в уравнении (3.2) фигурирует xlj, поскольку
независимая оценка Y] в случае {И) не предполагается. Тогда по (3.6)
можно вычислить Аи если хц из (3.8) подставить в (3.6). Получим
Л—Р^П^)]"1- (3.9)
Таким образом, уравнения (3.8) и (3.9) представляют собой модель
случая (ii)j в которую уравнение (3.6) входит в качестве
ограничения.
Случай (Ш): модель с ограничением на притяжение. В этом
случае легко можно увидеть, что ограничением будет уравнение (3.7).
Эта модель называется моделью с ограничением на притяжение,
поскольку ограничение связано со всем объемом продуктов,
«притягиваемых» к региону; эта модель еще раз позволяет увидеть
сходство с пассажирскими транспортными гравитационными моде-
§ 3.2. ГРАВИТАЦИОННЫЕ МОДЕЛИ 57
лями. Множитель Кг заменяется нормирующими множителями В),
и стандартные преобразования приводят к следующим
выражениям:
4=S;*i.n/r(cy)> (3.8')
где
^ = В4./ГЮ]-1. (3.9')
г
Случай (iv): модель с ограничениями на производство и
притяжение. В качестве ограничений используются оба уравнения
(3.6) и (3.7), поэтому нужно заменить Кг двумя множителями А\В],
чтобы можно было провести соответствующую модификацию
модели. Тогда уравнение (3.2) приобретает вид
хгц=АЦВ)Х\Х]Г{с\^ (3.10)
а множители можно вычислить, подставляя хц из уравнения (3.10)
в уравнения (3.6) и (3.7) соответственно, что дает
А\ = {ЪвЖГ(с\й]-\ (3.11)
i
B^-lSAlXlfidi)]-1. (3.12)
г
Уравнения (3.11) и (3.12) можно решить итерационными методами.
Отметим, что для случаяодного продукта модель, определяемая
уравнениями (3.10) и (3.12), имеет ту же форму, что и модель
распределения, определяемая уравнениями (2.5)—(2.7) в гл. 2.
Это показывает, что последняя модель также есть не что иное,
как модель (iv) (с ограничениями на производство и
притяжение).
Отметим, что модель (iv) — единственная, которая предлагает
простые оценки хц, все остальные модели дают квадратные
уравнения относительно x\j. Рассмотрим, например, случай (и) с
ограничением на производство. При наших предположениях
ограничением является уравнение (3.6). Видны два других возможных
варианта: во-первых, в качестве ограничения можно взять (3.5)
вместо (3.6), а, во-вторых, оба уравнения (3.5) и (3.6) можно
одновременно использовать в качестве ограничений. Можно легко
увидеть, что первый из этих вариантов фактически приведется
к (ш), т. е. к случаю с ограничением на притяжение, если
заменить Y] на xlj, а второй сводится к (iv) при замене Y] на хчу
Следует рассмотреть одно из возможных обобщений.
Уравнение (3.2) отражает простую ньютоновскую гипотезу, что
величина x\j пропорциональна Х\ и Y]. Можно обобщить эту
гипотезу и предположить, что величина x\j должна быть пропорцио-
58
ГЛ. 3. МЕЖРЕГИОНАЛЬНЫЕ ПОТОКИ ПРОДУКТОВ
нальна Х\ и Уу, но возведенным в некоторую степень, например
{Х\)*г и (Yj)$r, где аг и рг — дополнительные" параметры,
подлежащие оценке. Но так как рассматривается~случай без
ограничений, то, как уже отмечено было выше, следует заменить Х\ на хи,
a Y) — на xlj. Тогда уравнения (3.2) и (3.3)" переписываются
в виде
4- = кг (хЪ)«г (xitfY (<£), (злз)
Ще Кг = — . (3.13')
S SK)ar«,)pr/r(cr.)
В модели такого типа параметры аг и рг можно оценить с помощью
регрессионных методов.
Отметим, что если требуется, чтобы величина Krf была
безразмерной, то в модель следует ввести дополнительное условие
вида
аг + рг = 1.
Аналогично можно в соответствии с определенными правилами
обобщить и другие формы гравитационных моделей,
рассмотренные выше. Правила эти заключаются в следующем: во всех
правых частях уравнений можно заменить Х\ (или хги, если
независимая оценка Х\ не проводится) на (Х[)аГ, a Y] (или xlj, если
независимая оценка Y) не проводится) можно заменить на (Yj)pr, если
только Х\ (или хи) или Y] (или xlj) в зависимости от ситуации
не появляются в ограничении, т. е. в одном из уравнений (3.4)—
(3.7) обобщенной модели.'
Сделаем одно замечание, для чего рассмотрим, например,
случай (U). В соответствии с только что сформулированными
правилами xlj можно заменить на (xlj)*r9 но Х\ нельзя заменить
на (Х*)аГ, потому что эта величина появляется в уравнении (3.6),
которое входит в данную модель. Чтобы продемонстрировать
необходимость этого условия, предположим, что Х\ в уравнениях
(3.8) и (3.9) заменяется на (Х7)аГ. Тогда, при подстановке хц
из уравнения (3.8) в уравнение (3.6), которой предшествует
подстановка А\ из (3.9) в (3.8), уравнение (3.6) принимает вид
Х\ = (ХГг)аГ, откуда следует, что надо положить аг = 1. В связи
с этим отметим, что не представляется возможным взять модель
в виде (3.13) и оценить аг и рг при ограничениях (3.6) и (3.7).
Такая процедура даст множители А\ж В), получающиеся при
вычислении множителей Лагранжа, связанных с уравнениями (3.6)
и (3.7), и аг и рг будут равны 1, как уже было показано в
рассмотренном примере относительно аг. Поэтому только члены вида
§ 3.2. ГРАВИТАЦИОННЫЕ МОДЕЛИ 59
Таблица 3.1
1 Тип модели
1. Простая
ньютоновская
2.
3.
4.
1 5. Обобщение, учи-
1 тывающее
ограничения
(ньютоновская
модель с
ограничениями)
6.
7.
8. Обобщение, при
котором «массы»
возводятся в
степень (там,
где это
возможно) в следующих
моделях:
9. (а) Простая
ньютоновская
10.
И.
12.
13. (б) Ньютоновская
модель с
ограничениями
14.
15.
16.
*) Случай (г): только
Случай*)
(0
(И)
(Ш)
(IV)
(0
(И)
(Ш)
(iv)
(0
(И)
(Ш)
(iv)
(0
(И)
(Ш)
(iv)
Уравнения в
тексте
(3.2),
(3.2),
(3.2),
(3.2),
(3.2),
| (3.8),
1 (3-8'),
(3.10),
(3.12)
(3.13),
(3.13),
(3.13),
(3.13),
независимая ои
Х^. случай (Ш): независимая оценка Y
(3.3)
(3.3)
(3.3)
(3.3)
(3.3)
(3.9)
(3.9')
(3.11)
(3.13')
(3.13')
(3.13')
(3.13')
(енка Хг;
г,; случае
**) Любое неиспользуемо? ограничение (из д
можно применить для дополнительной оценки
Используемые
ограничения**)
(3.6)
о РЛ1
(3.6), (3.7)
| Замечания
(изменения уравнений)
1хги заменяет Х\
\хт. заменяет Y-
х*. заменяет Yr.
хги заменяет Х\
Обсуждаются
различные варианты,
возникающие при
введении других
комбинаций
ограничений
хти заменяет Х\
х[. заменяет YJ
хгф. заменяет Yr-
хГф заменяет Х\
См. правило на
страницах 56—57
для изменения
моделей 5—8
случай (гг): независимая оценка
t (iv): независимые оценки ЛГ[ и Yr-.
в ух возможных в каждом случае)
модели. |
xrim и xlj (в отличие от Х\ й yj) можно возводить в
соответствующую степень.
Довольно сложные рассуждения, которые были приведены
в этом систематическом исследовании возможных ньютоновских
гравитационных моделей, целиком содержатся в табл. 3.1, которая
60
ГЛ. 3. МЕЖРЕГИОНАЛЬНЫЕ ПОТОКИ ПРОДУКТОВ
показывает, как один и тот же набор моделей (для каждого из
четырех случаев) получается при различных предположениях.
3.2.2. Экономические гравитационные модели. Существует по
меньшей мере два примера моделей гравитационного типа, которые
непосредственно используются в экономических теориях *).
Представляется полезным исследовать эти примеры и сопоставить
соответствующие модели с моделями, которые рассматривались
в предыдущем разделе.
Модель Тейла. Рассмотрим модель экономического обмена,
которая формулируется без учета «расстояния»
ъГуГ
ХГ,= -^. (3.14)
Если затраты на перевозки существенны, т. е. «расстояние» нужно
учитывать, более точные результаты дает модель следующего вида:
х*.Хг х^Хг
ч = ° (3 15)
X\Yr. ХЩ ' V ' '
где Xij, Xr, Xu Y] — известные значения переменных величин в
базовый период. Соотношение (3.15) можно переписать в виде
4 = ^Р- Я» (3.16)
где
1)Г=Д^. (3.17)
Величину Dlj можно рассматривать, как эмпирически
оцениваемую функцию «расстояния».
Модель Леонтьева и Страута. Модель Тейла записана здесь
в форме (3.16), в связи с тем, что она совпадает с формой, которая
была принята Леонтьевым и Страутом, с той лишь разницей, что
Леонтьев и Страут не предполагали наличия независимых оценок
региональных характеристик Х\ и Y].
Гравитационная модель Леонтьева—Страута имеет вид
4=^Яу- (3-18)
Предполагается, что величину ВТц можно оценить по данным
на базовый период.
*) Гравитационные модели такого типа рассматривались Тейлом [1] и
Леонтьевым и Страутом [1].
§ 3.2. ГРАВИТАЦИОННЫЕ МОДЕЛИ
61
Каждая из рассмотренных до сих пор моделей представляет
собой некий вариант простой ньютоновской гравитационной
модели, в котором функция расстояния f {c\0) заменена на
эмпирически определяемый множитель D\j. Но можно пойти дальше и
выделить ряд проблем, связанных с ньютоновской моделью *).
Во-первых, заметим, что оценка x\j в уравнении (3.15) не
удовлетворяет соотношению
г j
и для устранения этого недостатка следует вводить нормирующий
множитель. Но и при этом оценка не удовлетворяет уравнениям
(3.6) и (3.7). Поэтому предлагается заменить оценку хц на х\р
получающуюся при минимизации при ограничениях (3.6) и (3.7)
величины
г j v
которая в некотором смысле является мерой неточности
информации. Возможно лишь приближенное решение задачи
минимизации, поскольку получающиеся уравнения слишком сложны.
Об этом следует упомянуть, так как это показывает возможность
дальнейших расширений нашего применения понятия энтропии.
Все рассмотренные гравитационные модели были выписаны для
независимых потоков продуктов, но ясно, что на самом деле эти
потоки должны быть взаимосвязаны. Часть потока продукта г
из i в / может быть вызвана, например, тем, что другие
производственные секторы в / нуждаются в продукте г в качестве входной
величины. Эту трудность можно частично преодолеть, если
используемые варианты гравитационной модели включают в себя
независимые оценки Х\ и Y]. Предположим, например, что оценка
этих величин проводится с помощью регрессионного анализа.
Независимые переменные в уравнениях регрессии относительно
XI и Y] могут включать в себя характеристики производствами
потребления в регионах i и / продуктов, отличных от г.
Коэффициенты в этих уравнениях аналогичны технологическим
коэффициентам в моделях «затраты — выпуск» и эффективно связывают
между собой модели потоков для различных групп продуктов.
Но очевидно, что такая процедура не может воспроизвести все
экономические взаимозависимости, описываемые моделью
«затраты — выпуск». Этот факт косвенно подтверждает
целесообразность высказанного нами пожелания об интегрировании
географического и экономического подходов.
*) См. Тейл [1].
62 ГЛ. 3. МЕЖРЕГИОНАЛЬНЫЕ ПОТОКИ ПРОДУКТОВ
§ 3.3. Получение семейств гравитационных моделей
с помощью методов максимизации энтропии
В гл. 2 было показано, что принцип максимизации энтропии
является довольно общим. Если следует оценить набор
переменных величин, таких как потоки х%^ и если известные ограничения
на x\j записаны в виде равенств, то необходимо максимизировать
энтропию связанного с x\j распределения вероятностей, в
результате чего получится наиболее вероятная оценка x\j. Прежде чем
воспользоваться этим общим принципом для объединения
гравитационной модели и модели «затраты — выпуск», полезно
показать, как можно получить все модификации гравитационных
моделей, введенных в § 3.2. Это, помимо всего прочего, поможет
лучше разобраться и в самих гравитационных моделях.
Модель 8 из табл. 3.1 (случай (iv), ньютоновская модель с
ограничениями на производство и притяжение) была получена в гл. 2
для случая пассажирских поездок. Заменим Тц на Хф Q% на Х[,
Dj на yj, си на c\j и предположим, что на перевозку продукта г
тратится величина Сг. Тогда надо максимизировать
г з
при ограничениях (3.6) и (3.7) и с учетом стоимостного
ограничения (эквивалентного (2.8))
ij24*ij = Cr. (3.20)
г J
Решение данной задачи имеет вид
:4= А1В]Х\У] ехр (- |Л$), (3.21)
где
А\ = [2 ЩТЦ ехр (- ,*$)]-* (3.22)
и \
В] = [2 А\Х\ ехр (- (i%) ]"\ (3.22')
г
Эта модель теперь эквивалентна модели, заданной уравнениями
(3.6)—(3.12), с той лишь разницей, что общая зависимость f {сгц)
заменена на экспоненциальную функцию с отрицательным
показателем степени ехр (—|АгсГ>)- Как и в гл. 2, далее будет
использоваться только экспонента, хотя следует помнить сделанные
там замечения о возможности использования и других функций
затрат. Отметим, что в качестве параметра функции затрат в
данном случае используется параметр ц/", который по смыслу
эквивалентен Зг.
§ 3.3. ПОЛУЧЕНИЕ СЕМЕЙСТВ ГРАВИТАЦИОННЫХ МОДЕЛЕЙ 63
Точно так же можно получить случаи (и) и (Ш) ньютоновской
модели с ограничениями, повторив вывод случая (iu) и опустив
сначала ограничение (3.7), а затем (3.6). Рассмотрим, например,
случай (и). Следуя только что описанной процедуре, получим
хц = А\Х\ ехр (— уГсц), (3.23)
где
^ = [Звхр(-^)]Л (3.24)
3
Здесь отсутствует член a£j, как и в соответствующих уравнениях
(3.8) и (3.9) *). Это означает, что продукт Х\ размещается между
регионами / пропорционально «транспортной доступности» /
по отношению к i, которая характеризуется величиной
ехр (—\ircrij). Возможны и другие характеристики региона /
(отличные от «транспортной доступности»), которые делают более
выгодным для / по сравнению с любым другим регионом ввозить
продукт г. Можно ввести следующую гипотезу: пусть и] —
прибыль региона / от использования единицы продукта г по
сравнению с использованием этой же единицы продукта любым другим
регионом. Будем выбирать единицы измерения так, чтобы они были
непосредственно сопоставимы с транспортными затратами с\у
Тогда уравнения (3.23) и (3.24) переписываются в виде
щ = А\Х\ ехр (\irv^) ехр (— ц,гс£) (3.25)
и
А\ = [21 ехр Wv]) ехр (- )*Гсгц)Г\ (3.26)
j
Как оценить v*? Одно из возможных рассуждений состоит
в том, что такие величины, как и] обычно порождаются уровнем
экономики в регионе /, поэтому их можно приближенно описывать
текущим уровнем потребления продукта г в /, а это есть xlj.
Обычное предположение в такой ситуации заключается в том, что
прибыль пропорциональна логарифму единицы измерения,
поэтому
^ = аг1п*;-, (3.27)
где аг — некоторый параметр. При подстановке и) из уравнения
(3.27) уравнения (3.25) и (3.26) переходят в (3.8) и (3.9).
Случай (Ш) можно получить аналогично, введя прибыль и£,
которая пропорциональна In xu.
*) Его можно' ввести точно так же, как это сделано в работе
Вильсона [2].
64 ГЛ. 3. МЕЖРЕГИОНАЛЬНЫЕ ПОТОКИ ПРОДУКТОВ
Случай (i), записанный как модель 5 (табл. 3.1) в
ньютоновских моделях с ограничениями, практически повторяет модель 1.
Здесь есть варианты с ограничениями, но как уже было показано,
они представляют собой незначительные модификации случаев
(ii)-(iv). Поэтому при новом подходе нужно рассмотреть ту
модификацию (i), в которой в качестве ограничений выступают
уравнения (3.20) и (3.2). Это приводит к соотношению
хц = Кг ехр (■— уГсу),
где Кг — нормирующий множитель, вычисленный, как и в
уравнении (3.3), с помощью уравнения (3.1). Как и в случаях (ii)
и (ш), можно ввести члены (хи)аГ и (#Г/РГ, но здесь использование
и\ и v] уже неизбежно. Получим
4- = Kr (xl)*r (4-Гехр (- |Л$). (3.28)
Отметим, что те варианты случаев (i)—(iii) ньютоновской модели
с ограничениями, которые только что были получены,
фактически совпадают с моделями 13, 14 и 15 из табл. 3.1. Напомним,
что эти модели представляют собой ньютоновские модели с
ограничениями, в которых везде, где это возможно, «массы» возведены
в степень. Модели 5, 6 и 7 представляют собой, конечно, просто
их частные случаи, в которых аг (или рг) равны 1. Таким образом,
показано, как получить полное семейство гравитационных
моделей, используя методы максимизации энтропии.
§ 3.4. Модель «затраты — выпуск»
3.4.1. Принципы построения однорегиональной модели
«затраты — выпуск». Модель экономической базы. Полезно
рассмотреть, как модель «затраты — выпуск» для одного региона
вытекает из теории экономической базы *). Теория
экономической базы все еще широко используется для местного или
регионального экономического прогноза. Она представляет собой
наиболее простую формулировку взаимозависимости между
экономическими секторами. Определяются только два сектора
экономической активности, измерения которых обычно проводятся
в единицах занятости. Эти секторы носят названия базовой и
небазовой занятости. Предполагается, что экономическая активность
в базовом секторе направлена на производство, ориентированное
на внешние рынки (следовательно, это сектор экспорта), а
небазовый сектор производит для внутренних рынков. Пусть X означает
полную занятость, п — небазовую занятость, у — базовую
занятость. Тогда
X —п = у,
*) См., например, Артль [1].
§ 3.4. МОДЕЛЬ «ЗАТРАТЫ — ВЫПУСК» 65
что можно переписать в виде
*(»-*)-»■
Положим
п
тогда
Х = (1-а)"12/. (3.29)
В теории экономической базы обычно предполагается, что а —
константа, тогда по данной оценке базовой занятости у с помощью
уравнения (3.29) можно оценить полную занятость.
Набор оценок. Теперь вернемся к ситуации, упомянутой в
начале главы, где использовался набор групп продуктов г, s, p и т. д.
Пусть Хг — полный объем производства продукта г. Этот продукт
может потребляться другими внутренними в пределах данной
модели секторами или внешним сектором «окончательного
спроса». Пусть часть Хг, обозначаемая через Zr*>, потребляется
сектором р, а ут потребляется сектором «окончательного спроса».
Тогда эти величины можно свести в систему оценок, показанную
в табл. 3.2. Группы продуктов по отношению к модели «затраты —
выпуск» будут считаться внутренними. Все затраты записываются
в столбцы, все выпуски — в строки. Существует также внешний
сектор, для которого требуются дополнительные строка и столбец.
Таблица 3.2
Система оценок для одного региона
Выпуск
продуктов
(долговые
обязательства)
Внешний сектор
(производственные факторы,
импорт и т. д.)
i
Затраты продуктов
(платежи)
1 2 3 ... п ...
1 Z11 Z12 Zt3 ... Zln ...
2 Z21 ZP ZP ... Z2n ...
3 Z31 Z32 Z33 ... Z3*1 ...
7ml Zm2 Утз 7mn
£oi z02 203 2on.
Внешний сектор
(окончательный
спрос)
У1
У'
У3
m
У
Полный
выпуск
X*
X2
X3
3 А. Дж. Вильсон
66 ГЛ. 3. МЕЖРЕГИОНАЛЬНЫЕ ПОТОКИ ПРОДУКТОВ
Дополнительный столбец обычно называется «окончательный
спрос» и включает в себя как экспорт, так и личное потребление.
Дополнительная строка включает в себя импорт и
производственные факторы, такие как рабочая сила, причем величина этого
фактора оценивается заработной платой. Для этого сектора
используется индекс «нуль». Если здесь используются финансовые
звенья, то столбцы содержат платежи, а строки — долговые
обязательства. Добавлен также один последний столбец, который
содержит все полные выпуски, которые теперь выступают в роли
сумм по строкам. Отметим, что имеет смысл не оговаривать
специально единицы измерения. В разделе 3.1.3 отмечалось, что
объемы продуктов измеряются в характерных для этих продуктов
единицах, и это условие будет выполняться и в дальнейшем. Поэтому
любая строка в табл. 3.2 содержит величины, измеренные в одних
и тех же единицах — единицах измерения объема выпуска в
данной группе продуктов. Так как в разных строках могут
использоваться разные единицы измерения, то суммирование по строкам
не проводится. Если используются денежные единицы измерения,
то суммирование по столбцам допустимо; в каждой группе
продуктов можно приравнять платежи и долговые обязательства,
а получающееся в результате соотношение позволяет сделать ряд
выводов о ценах *). Но суммирование по строкам допустимо,
и, как легко видно, соответствующее соотношение имеет вид
S Zrp + yr = Хг. (3.30)
Однорегиональная модель «затраты —- выпуск». Равенство (3.30)
представляет собой очевидное тождество. Преобразуем его
следующим образом: заменим Zrp на (Zr^/Xp)Xp. Теперь предположим,
что
zrp
есть постоянный коэффициент, т. е. величина продукта г,
необходимая для производства единицы продукта р, есть константа.
Тогда уравнение (3.30) может быть переписано в виде
%arpXp + yr = Xr. (3.31)
р
Полагая, что г = 1, . . ., s, получим систему уравнений, откуда
X - (/ - а)~У (3.32)
*) Получение полной экономической модели на основе этих выводов
рассматривается, например, в работе Дорфмана, Самуэльсона, Солоу [1].
§ 3.4. МОДЕЛЬ «ЗАТРАТЫ — ВЫПУСК» 67
Здесь а — известная матрица технологических коэффициентов
«затраты — выпуск», / — единичная матрица.
Теперь сравним уравнение (3.32) с уравнением (3.29). Они
отличаются друг от друга тем, что в (3.29) X, а и у — скалярные
величины, а в (3.32) — векторы и матрицы. Получая уравнение
(3.32) с помощью набора оценок в табл. 3.2, легко увидеть, что
модель «затраты — выпуск» основана на более подробном
описании экономической структуры, чем то, которое неявно содержится
в модели экономической базы. Поэтому, хотя уравнение (3.32)
основано на довольно сильном предположении (постоянство агр),
следует ожидать, что оно даст более реалистическую оценку
экономической структуры города или региона, чем модель
экономической базы.
Трудности, связанные с однорееиональной моделью. Известно *),
что экспорт, который имеет большое значение в модели
экономической базы, образует лишь часть внешнего сектора в модели
«затраты — выпуск», причем не самую большую. Самую большую
часть во внешнем секторе занимает рабочая сила, и это
позволяет**) расширить внутреннюю составляющую модели «затраты —
выпуск», включив туда рабочую силу. Но при прогнозе развития
внешнего сектора по-прежнему могут возникать затруднения.
Вторая задача, связанная с моделью «затраты — выпуск»,
состоит в таком развитии модели, чтобы она смогла описывать
многорегиональную экономику. В том виде, как это было
рассмотрено выше, модель «затраты — выпуск» демонстрирует
слабость подхода, основанного на теории экономической базы, но
вряд ли можно сейчас утверждать, что она представляет собой
адекватную замену. Ее довольно трудно использовать в целях
прогноза из-за большого внешнего сектора и так как город или
регион — это всего лишь часть многорегиональной экономики, то
между регионами могут происходить сложные замены импорта
на экспорт, которые повлияют на окончательный спрос на экспорт
в любом регионе весьма сложным образом.
При развитии модели на многорегиональный случай будем
действовать по аналогии с основными результатами Леонтьева —
Страута **::).
3.4.2. Методологические основы многорегиональной модели
Леонтьева — Страута. Модель Леонтьева — Страута основана на
предположении о том, что производителей не интересует
окончательное распределение товаров, а потребителей — их
происхождение. Это означает, что все товары, производимые в регионе
i, как бы поступают в общий фонд предложения, а все
товары, потребляемые в £, предварительно извлекаются из фонда
*) См., например, Артль [1].
**) См. Артль [2].
***) См. Леонтьев, Страут [1].
3*
68
ГЛ. 3. МЕЖРЕГИОНАЛЬНЫЕ ПОТОКИ ПРОДУКТОВ
потребления. Существенные потоки в такой системе показаны на
рис. 3.1. На этом рисунке используется принятая ранее система
-обозначений для однорегиональной модели «затраты — выпуск»
с добавлением дополнительных региональных индексов.
Отметим, что при одном регионе i должно выполняться равенство
У *
L Xji
\ Фонд
rii чредления
продуктам
о регионе i
Другие
регионы
\4i(yf)
л
LXij.
Фонд
предложения
продукта?
б регионе 1
fXi* И/ )
Рис. 3.1. Потоки продукта г в модели Леонтьева — Страута.
между Х\ и Y\, но в многорегиональной системе это уже не
обязательно. Теперь я[у — это объем продукта г, производимый
в регионе i и перевозимый в фонд потребления в регионе /.
Теперь каждый регион в отдельности должен удовлетворять
соотношению «затраты — выпуск» типа (3.31). С помощью рис. 3.1
легко установить, что соответствующая система уравнений
принимает вид
V
где xli — количество продукта г, используемое в регионе i;
у\ _ потребление сектором окончательного спроса в регионе i\
^alpx?*— количество продукта г, используемое другими
секторами (в этом выражении 4Р - матрица технологических коэффици.
§ 3.5. ОБЪЕДИНЕНИЕ МОДЕЛЕЙ
69
^нтов «затраты — выпуск» в регионе i). Основными переменными
являются xlj, относительно которых следует искать решение.
Здесь принимаются более слабые допущения, чем те, которые
были рассмотрены выше: не только нельзя провести
независимой оценки хги и xlj (Х\ и Y))r но даже величину Хг нельзя
оценить независимо. Предположения гравитационного типа
допускаются, но предполагается, что (3.19) выполняется лишь при
i ф]. При этом условии системы (3.16) и (3.33) имеют столько же
уравнений, сколько неизвестных (включая, конечно,
диагональные члены хгц). Система уравнений (3.16), (3.33) нелинейна по х\^
Уравнения решаются приближенно, при помощи предположения,
что известны все потоки в некоторый базовый период; после этого
их можно решить относительно приращений потоков в следующий
период. Отсюда следует, что при заданном наборе приращений
окончательного спроса можно определить приращения потоков
с точностью до величин первого порядка малости. Такой подход
обычно используется лишь при краткосрочном прогнозе-*).
Из ранее сделанных предположений вытекает, что модель (3.13)
может быть заменена более общими гравитационными моделями.
Но теперь имеет смысл пойти дальше и показать, как, используя
методы максимизации энтропии, можно объединить
гравитационную модель и модель «затраты — выпуск».
§ 3.5. Объединение моделей
3.5.1. Введение. Каждую из ситуаций, которые были названы
случаями (г)—(iv), будем рассматривать отдельно, причем будем
применять упрощающее предположение относительно
используемых в каждом случае ограничений, а именно будут использоваться
только те ограничения, которые содержат в правой части Х[ или
или Y]. Все остальные случаи представляют собой варианты
рассматриваемых здесь четырех случаев, и при необходимости
всегда можно выписать соответствующие модели.
3.5.2. Гравитационная модель «затраты — выпуск» без
ограничений (случай (£)). При анализе случая (i) с помощью
гравитационной модели предполагалось, что существует независимая
оценка для Хг, а для Х\ и Y) такие оценки отсутствуют. Для того
чтобы определенным образом развить интегрированную модель,
предположим теперь, что и для Хг такой оценки тоже нет, что
соответствует гипотезам Леонтьева и Страута. Таким образом,
модель для случая (г), которая сейчас будет построена,
представляет собой модификацию модели Леонтьева — Страута,
получающуюся при объединении модели «затраты — выпуск» и гравита-
*) См. Леонтьев, Страут [1].
70 ГЛ. 3. МЕЖРЕГИОНАЛЬНЫЕ ПОТОКИ ПРОДУКТОВ
ционной модели с помощью методов максимизации энтропии.
Никаких дополнительных предположений делаться не будет.
Следовательно, единственным ограничением будет уравнение (3.20),
которое для удобства перепишем в виде
/I /I ХцСц = О .
i з
Теперь будем рассматривать уравнение Леонтьева — Страута
(3.33) в качестве ограничения на х\$. Его можно переписать в виде
2*&«2<4р2*6 + уГ. (3.34)
з v з
Далее следует максимизировать энтропию распределения
вероятностей, связанного с хц (здесь г — переменный индекс, как i и /).
Легко видеть, что нет нужды в нормировке хгц, дающей
распределение вероятностей, поскольку получается та же самая оценка,
если проводить максимизацию энтропии, определяемой по
формуле *)
S = — 2j 2j Zj xlj lu ХЬ
г j r
при ограничениях (3.20) и (3.34). Для решения этой задачи
построим лагранжиан
z = s + 22 уШ + 2 «4 2 А - 2 4) + 2иг (с - 2244),
г г V 3 3 г г j
где yJ и \ir — множители Лагранжа, связанные с уравнениями
(3.34) и (3.20) соответственно. Теперь получим оценку хтц, решая
систему уравнений
дх\.
= 0
совместно с уравнениями (3.20) и (3.34). Будем иметь
4* = ехр (2 yfapr — Yj — \*>rCij)> (3.35)
где единица включена в множитель у]. Величина \ir получается
*) В этом случае удобно пользоваться именно такой формой S.
Использование — In x\\ приводит к концептуальным сложностям при дробных xL.
В зтой процедуре таких трудностей нет. Легко проверяется, что эта формула
для S дает такой же результат, что и в случае использования
нормализованной формы хТ./Х'г, которая вполне корректна, если определять S как
энтропию распределения вероятностей.
§ 3.5. ОБЪЕДИНЕНИЕ МОДЕЛЕЙ 71
путем подстановки хц в уравнение (3.20) или, если величина С*
неизвестна, с;помощью обычной калибровки. Параметры Yy
можно найти, подставляя x\j из (3.35) в (3.34). Это дает
ехр (— Yi) S ехр (23 vfajpr — |ircji) —
г р
- Sо*р ехр (2V?4p) Sехр ((- vf) - |Л$) - 2/i - 0. (3.36)
р a i
Обозначим
*i = exp(2vfepr), (3.37)
р
e; = exp(-7i), (3.38)
тогда
б1=П(еГГ^. (3.39)
p=i
Следовательно, уравнение (3.36) можно записать в более
компактном виде
г\ 2 Ь] ехр (- n'cjt) - 2 4ДР 2 в? ехр (- (Л® - г/Г = 0,
i pj
откуда получаем
j/i+Sarp6f2je,?exP(-^4)
«I = Р^ ', ' r-r • (3-40)
2в£«ч>(-1*4>
j ....
Это уравнение, конечно, не может быть явно решено
относительно 8|, но вид уравнения (3.40) подсказывает удобную
итерационную процедуру: задать е[, вычислить 6\ из уравнения (3.39),
вычислить е! из уравнения (3.40) и продолжать процедуру, пока
процесс не сойдется. Затем с помощью уравнений (3.37) и (3.38)
выражение (3.35) для хц может быть переписано в виде
хц = ЬЩ ехр (— \jfcrij). (3.41)
Таким образом, с помощью метода максимизации энтропии
случай (i) в модели Леонтьева — Страута описывается уравнениями
(3.41), (3.40) и (3.39).
По поводу уравнения (3.41) можно сделать ряд замечаний.
Произведение 6jeJ обеспечивает согласованность потоков с
уравнением Леонтьева — Страута. Отметим, что из (3.40) следует,
72 ГЛ. 3. МЕЖРЕГИОНАЛЬНЫЕ ПОТОКИ ПРОДУКТОВ
что размерность этого произведения совпадает с размерностью
единицы измерения количества продукта г — это легко видеть по той
роли, которую играет поступающий извне окончательный спрос
у\ в уравнении (3.40). Заметим также, что гравитационная модель,
описываемая уравнением (3.41), является простейшей: величины
x\j пропорциональны ехр (— |лгс#).
Выше предполагалось, что независимые оценки для Х\ и Yj
отсутствуют. Но можно ввести члены (хи)*1* и (xr*j)$r,
воспользовавшись тем же приемом, который позволил получить уравнение
(3.28) в § 3.3. Это просто сделать, заменив ехр (— \irclj)
произведением (#гг*)аГ- (xlj)$r- ехр (— \irCij), a ехр (— \xrc]i) — тем же
произведением, но с переменой мест индексов i и / везде, где эти
выражения встречаются в уравнениях (3.39) — (3.41).
3.5.3. Гравитационная модель «затраты — выпуск» с
ограничением на производство (случай (И)). Предположим, чю имеются
независимые оценки для Х\ (но для Y) таких оценок
по-прежнему нет). Тогда ограничениями являются уравнения (3.8), (3.20)
п
и (3.34), но в уравнении (3.34) следует заменить 2 хц на Х\.
С учетом вышесказанного лагранжиан примет вид
г г j r г j
Экстремум его достигается при
4- = ехр (- Х[г)г - ij - |Л$). (3.42)
Значения fir получаются с помощью уравнения (3.20) или обычной
калибровкой, М1)г легко получить из уравнения (3.8), а у[-
из уравнения (3.34), но заменив предварительно 214 на -^Т-
i
Положим
ехр (- к[1)г) = AlXl,
и впредь будем пользоваться А\ вместо %{РГ. Тогда из уравнения
(3.8) получаем
Л1 = [Цехр(7^^)]"1. (3.43)
7
§ 3.5. ОБЪЕДИНЕНИЕ МОДЕЛЕЙ
73
Снова определим г\ по формуле (3.38) и тогда получим
з
после чего уравнение (3.42) переписывается в виде
xlj = А'ХЩ exp (— \ircrij). (3.44)
Таким образом, уравнения (3.44), (3.40) и (3.43) описывают
модель максимизации энтропии в случае (Hi). Отметим, что при
необходимости можно ввести в эти уравнения член (я£/)&г,
воспользовавшись приемом, приведенным в § 3.3.
3.5.4. Гравитационная модель «затраты — выпуск» с
ограничением на притяжение (случай (ш)). Легко видеть, что случай
(ш) исследуется аналогично, и результат имеет вид
^ = ОД17вхр(-|ггс^
где 6* получаются в результате решения уравнения (3.50),
записанного в виде
v
и представляющего собой систему линейных уравнений
относительно 6f в каждом регионе i. Величина Bj получается из уравнения
(3.9) по формуле
г
В этом случае при необходимости также можно ввести множитель
(#i*)ar, воспользовавшись приемом, использованным в § 3.3.
3.5.5. Гравитационная модель «затраты — выпуск» с
ограничениями на производство и притяжение (случай (iv)).
Рассмотрим, наконец, случай (iv). Теперь в роли ограничений выступают
одновременно уравнения (3.8) и (3.9) вместе с
модифицированными уравнениями (3.20) и (3.34),поэтому S xlj заменяется на Х\,
j
а 2 #у заменяется на Yj, что дает
г
П= 2 «rpXf+2/ь (3.45)
т. е. здесь имеется очень простое решение. Теперь в (3.45) хц не
входит, следовательно, наши предположения отделяют ту часть
74 ГЛ. 3. МЕЖРЕГИОНАЛЬНЫЕ ПОТОКИ ПРОДУКТОВ
модели, которая связана с моделью «затраты — выпуск», от
гравитационной части. Отсюда следует, что процедуры,
используемые для оценки Х\ и FJ, должны быть такими, чтобы
удовлетворялось уравнение (3.45)t тогда потоки a%j можно оценить с помощью
гравитационной модели случая (и;), определяемой уравнениями
(3.21) - (3.22').
3.5.6. Гибридная модель для различных типов продуктов.
Очевидно, что различные типы товаров попадают в различные
категории. Например, первичный продукт, скажем уголь, будет
скорее всего ограничен по производству; продукт, являющийся
в основном промежуточным для первичных секторов, будет
ограничен по притяжению; первичный продукт, потребляемый другими
первичными секторами, будет ограничен и по производству,
и по притяжению; существует также ряд товаров, которые не
ограничены ни по производству, ни по притяжению. Разработанные
к настоящему моменту модели (разделы 3.5.2—3.5.5) могут
применяться лишь к некоторому подмножеству продуктов;
Поэтому представляет интерес гибридная модель для
различных типов продуктов. Покажем, что и она может быть получена
с помощью методов максимизации энтропии. Сохраним
упрощающее предположение о том, что используются только те
ограничения, в правых частях которых присутствуют члены Х\ или Y]
(а не хи или xlj).
Пусть Мх — это множество продуктов, к которому применимы
предположения случая (а:). Обозначим через г ЕЕ Mt тот факт, что
продукт г находится в множестве Mt, а через 2 обозначим ^умми-
рование по всем г ЕЕ Mt. Тогда ограничения на хц приобретают
следующий вид:
S ^ = Х[, геМ2,Л/4, (3.46)
з
-5Uj=5b геЛ/в1Л/4, (3.47)
i
2244- = сг, (з.48)
» i
S 4 - S «rp S 4 - yl = о. r e Mi, (3.49)
i Pi
S 4 - a <4xf - yl = o, re м2, (3.50)
i v
И - 2 <4 S *B — 2/Г = 0, rtEMs (3.51)
P 3
и
YiSdpXf-yi^O, rEl, (3.52)
p
§ 3.5. ОБЪЕДИНЕНИЕ МОДЕЛЕЙ 75,
Соответствующий лагранжиан выглядит следующим образом:
2 = -2224in4 + 2 2 ?41)г(4-24) +
+ 2 2 *Гг(П-24) + 2иг(сг-2244) +
j reM8, М4 i г г з
+ 2 2 тР" (^ + 2424—24) +
+ 2 2 т12)гЫ+24рХ|'-24) +
+ 2 2 #гЫ + 2<424-П).
i r^M% p j
Заметим, что основное влияние наших новых предположений
заключается в том> что М1)г и Xf)г определяются на
подмножествах г, а величина, обозначенная ранее через Yi» разбилась на три
компоненты yPry yf*r и yf**, каждая из которых определена на
подмножестве г. Заметим также, что ограничение (3.52) не вошло
в лагранжиан, так как оно не содержит x\j. Решив систему
для различных множеств Mt, получим
4 = вхр (2 «гр?11)р - 7J1)r - |»Ч). г 6= Мъ
р
4- = ехр (- я,|1)г - у?)г - цг4), г е м*
4 = ехр (2 4РУ?)Р - Ь?)г - V-rdi), г €= М»
р
4 = ехр (- Xi1)r - Xf - цг4), г .<= МА.
Положим
ехр (- *41)г) = AriXru r e M„ Mt,
б£1)г = ехР(24л?)р), гел/„
3)г
ехр(2<4л?)Р), геМ3,
р
ef = ехр(-ТП
er = exp(-7f),
следовательно,
г<=мг,
г~<=Мг,
-^; = П(е11)рг*р.
?
(3.53)
76 ГЛ. 3. МЕЖРЕГИОНАЛЬНЫЕ ПОТОКИ ПРОДУКТОВ
Теперь можно получить выражения для А\, В], jir, ei1)r, ej2)r
и 6f)r, проводя подстановку в уравнения (3.46) — (3.51)
соответственно. Связь между Х\ и Y\ должна описываться
уравнением (3.52) при. rG Л/4. Но сперва выразим хц через только что
определенные переменные
хц = 6i1)rej1)r ехр (- \1%), г е Мъ (3.54)
хц = A\XW?)r ехр (- |*rcJi)f r e М2, (3.55)
4- = в|8)гД?17 ехр (— |Л$), г <= М3, (3.56)
4- = А\ХЩУ] ехр (- fir4), r ЕЕ Л/4. (3.57)
Теперь воспользуемся уравнениями (3.46) — (3.51)
совместно с уравнениями (3.54) — (3.57), откуда получим
А\ = [S efr ехр (-- li^)!"1, r e М2, (3.58)
i
i4l = IS BJ^J ехр (- ii^)]"1. г е М4, (3.59)
i
В) = [2 M3)r ехр (- li'cf,)]"1. r S M3, (3.60)
i
5j - [2 A\X\exp (- n'cf,)]-1, г <= M4, (3.61)
i
ei1)r - 2/1 + [ S «U1)rSef)pexp(- |Л$) +
psMi j
+ 2 а^х?а«4*рвхр(-|ЛГ,) +
peM2 j
+ 2 eU,)pS^P7exp(-i»4) +
рем» j
+ 2 oJPilfXf25jrj,exp(-iiMi)][2eJ*>rexp(-nr^)]-1, (3.62)
PGM* j j
«*+2<Л
e?)r=2^rJP{-^) ' (3*63)
2 arP6i3),-25prfexp(-^CP)= '
= П-!/Г- 2 a*p6i1)P2jef)pexp(-rt)-
PEMi j
- 2 ^p.4fXf2ef)Pexp(-^4)- . . .
PGM2 j
- 2 4pAfXf 2 5fy? exp (-|ip4)- (3.64)
peivi4 j
§ 3.5. ОБЪЕДИНЕНИЕ МОДЕЛЕЙ
77
Итак, гибридная модель определена уравнениями (3.54) -—
(3.64). Эту систему уравнений можно решать следующим
образом: задать начальные значения А\, б|1)г, 6*3)г, вычислить В)
по формулам (3.60) и (3.61); вычислить ef)r по формуле (3.63);
вычислить А\ по формулам (3.58) и (3.59); вычислить ei1)r по
формуле (3.62); вычислить б£1)г по формуле (3.53) и снова вычислить
8|1)г; вычислить б£3)г, решив систему линейных уравнений (3.64);
продолжать действовать таким образом, пока процесс не
сойдется. Отметим, что если член Х\ (или Ур отсутствует, то в уравнения
следует ввести члены (хиУ* (или (х^)$г) обычным образом.
В этой главе была рассмотрена система межрегиональных
потоков продуктов x\j. Было показано, что центральным вопросом
является возможность оценки величин х\+ и xlj независимо от
процедуры оценки хгц. Поскольку при различных исходных
предположениях получаются различные модели, то наиболее важный
вывод состоит в том, что включаемые в модель гипотезы должны
подвергаться всесторонней проверке.
Глава 4
МОДЕЛИ РАЗМЕЩЕНИЯ
§ 4.1. Гравитационные модели как модели размещения
В гл. 2 и 3 были предложены различные типы моделей
транспортных потоков, как для поездок, так и для потокоь* товаров.
Анализ семейства гравитационных моделей в гл. 3 неявно
использует концепцию гравитационной модели, как модели размещения.
Рассмотрим теперь этот вопрос более подробно. Пусть Ttj —
некая система потоков, и для построения ее модели применяется
метод максимизации энтропии. Если, например, Тц — это поездки
на работу при однородном населении, то соответствующие потоки
будут определяться гравитационной моделью, заданной
уравнениями (2.21) — (2.23). Обычно предполагают (и в гл. 2 это
существенно использовалось), что существуют независимые оценки
сумм Ttj по строкам и столбцам, Tt> и T*j. Они обозначались через
Qt и Dj, причем эта информация использовалась при построении
модели. Но в гл. 3 было отмечено, что возможны случаи, когда
независимые оценки для Ti0 или T>j (или и того, и другого, но это
бывает реже) нам недоступны. Пусть, например, оценка для 2\,-
отсутствует; тогда соответствующая гравитационная модель
(в гл. 3 она называлась моделью с ограничением на производство)
обеспечит оценку для Г*;. Поэтому, если Ttj представляют
взаимодействие между жителями в регионе i и магазинами в регионе /
(например, в виде денежных расходов на приобретение розничных
товаров), то модель обеспечит оценку для Г*;- полного объема
продажи в регионе /. Такая информация будет весьма полезной при
планировании деятельности торговых центров.
Следовательно, во всех случаях, когда Ttj представляют собой
взаимодействие между двумя структурами, и функционирование
хотя бы одной из этих структур ничем не ограничено, то
соответствующая модель дает оценку либо для Т{*, либо для Г*7-, т. е.
описание свободной от ограничений структуры. Но здесь следует
сделать определенные замечания: если одна из структур в модели
не ограничена просто из-за нехватки информации, то
использование модели цото^ор р од^етве модедя размещения не совсем кор-
§ 4.1 РАЗМЕЩЕНИЕ ЦЕНТРОВ ОТДЫХА
79
ректно, поскольку недостаток информации может привести к
созданию модели, которая плохо прогнозирует потоки. Этот вопрос
будет более подробно изучен на конкретных примерах:
размещение центров отдыха, торговых центров и жилого фонда.
§ 4.2. Размещение центров отдыха
Исследование в качестве первого примера определенных типов
рекреационных систем полезно по следующей причине: по крайней
мере гипотетически представляется возможным выделить для
анализа особенно простой тип таких систем, а это облегчает
возможность более глубокого анализа математических основ в
последующей гл. 7 и в Приложении 2 *).
Рассмотрим город с п жителями, каждый из которых в
определенный выходной день желает выехать в некоторый центр
отдыха. Предположим, что центры отдыха, которыми они могут
воспользоваться, предназначены исключительно для жителей этого
города, и что расходы индивидуума, пользующегося услугами
1-го центра (расходы на проезд плюс плата за пользование)
составляют е^. Будем считать, что эти расходы не зависят от места
проживания индивидуума в городе. Будем считать, что известны
все гь и средние расходы ё. Какова наилучшая оценка числа
жителей тг$, пользующихся г-ым центром?
Определим
Л = "5- • (4.1)'
Величины pi можно интерпретировать как вероятность того, что
индивидуум будет пользоваться г-ым центром. Известно, что
2 Л = 1, (4.2)
г
а также, что
SPi^i = е.
г
Эта задача в точности совпадает с задачей, рассмотренной в разделе
1.1.2, и уравнения (4.1) и (4.2) эквивалентны уравнениям (1.12)
и (1.11) соответственно, если положить / (xt) = е,-. Теперь мощно
объединить уравнения (1.13) и (1.14), исключив X, что даст в
качестве наилучшей оценки pt величину
ехр(-це.)
Pi = ^ ; — , (4.3)
*) См. Джейнс [1].
g0 ГЛ. 4. МОДЕЛИ РАЗМЕЩЕНИЯ
откуда
п ехр (- lie.)
и* = 2«р(-^) • (4'4)
г
В следующем параграфе будет показано, что это частный случай
гравитационной модели с ограничением на производство,
используемый в качестве модели размещения. Этот вопрос будет еще раз
рассмотрен в г л, 7 и в Приложении 2.
Результаты, сформулированные в уравнениях (4.3) и (4.4),
по форме своей являются, конечно, такими же, что и уравнения
расщепления типов коммуникаций в гл. 2. Следует также
отметить, что из анализа «логарифмических регрессий» *) можно
получить ту же форму распределения вероятностей.
§ 4.3. Размещение торговых центров
Для обсуждения моделей размещения торговых центров
полезно снова изменить обозначения, чтобы отметить, что имеет место
еще один частный случай. Определим следующие величины: Stj —
расходы жителей зоны i в магазинах зоны /'; et — средние расходы
жителей зоны i на покупки товаров; Рг —- население зоны i;
Wt — вес зоны г, характеризующий притяжение; ctj — «цена»
проезда из i в /.
Обычно считается, что это система с ограничением на
производство, т. е.
2j S\j = в{Рь
j
a S*j получается из модельной оценки £17-. Конечно, основная
область применения этой модели — это оценка S*j товарооборота
заданных торговых центров.
Обычно используется **) модель с ограничением на
производство, имеющая вид
Su ^Atie^Wf ехр (- рс„),
где
^i = [S^?exp(-.p^)]"1.
i
Нетрудно убедиться, что эта модель может быть легко
получена с помощью методов максимизации энтропии и действительно
представляет собой вариант модели с ограниченным производством,
рассмотренный в § 3.3 гл. 3 с соответствующими изменениями
в обозначениях.
*) См. Тейл [1], § 3. 7.
**) См., например, Лакшманан, Хансен [1].
§ 4.4. элементарные модели размещения жилого фонда 81
Теперь следует вернуться к вопросу, затронутому в § 4.1,
а именно, является ли отбрасывание ограничения (в данном случае
ограничения на притяжение) просто результатом отсутствия точной
информации или разумным поведенческим предположением.
Поведенческое предположение, в данном случае, заключается в
следующем: при заданном распределении покупательной способности
магазины должны размещаться в местах, наиболее доступных для
посещения. Это учитывается членом ехр (— рс^-), и никаких
других ограничений на S*j не существует*). В данном случае это
предположение представляется разумным; оно, кроме того,
подтверждается тем фактом, что подобные модели довольно хорошо
согласуются с существующими ситуациями. Так как
моделируемая система является системой с ограничением на производство,
то разумно воспользоваться подходом, применяемым в модели
с конкурирующими возможностями, а именно, выписать уравнения
модели с ограничением на производство. Этот подход и
некоторые связанные с ним результаты обсуждаются в Приложении 3.
В гл. 2 было показано также, что любая транспортная модель
пассажиропотоков может быть разбита по типам коммуникаций и
пассажиров и тогда в рамках модели схема потоков будет
определена как функция доступности типов коммуникаций и их
характеристик, а также структуры отношений индивидуумов к
транспортным средствам. Ранее эти положения применялись для анализа
поездок на работу, т. е. для исследования ситуации с ограниченным
производством и притяжением. Очевидно, что их можно
применить и к рассмотренной выше модели торговых центров, и это
предлагается читателю в качестве упражнения. Разукрупнение
особенно полезно, например, при анализе загородных торговых
центров, доступ к которым возможен лишь на автомобиле, в
отличие от центральных торговых центров, где имеется в наличии
общественный транспорт. Но следует отметить, что торговое
взаимодействие в транспортной модели с ограничением на производство и
притяжение измеряется в терминах поездок, а в рассмотренной
выше ситуации с ограничением на производство взаимодействие
измеряется в денежных единицах затрат. Связь между этими
моделями, вероятно, не очень проста, так как более продолжительные
поездки, очевидно, связаны с относительно большими затратами.
§ 4.4. Элементарные модели размещения жилого фонда
4.4.1, Введение. Задача модели размещения жилого фонда за
ключается в объяснении распределения людей в жилом фонде
городов или регионов. Очевидно, что люди поселяются в тех или
*) В связи с моделями торговых центров следует упомянуть и другие
работы (см. Корди-Хэйс [1]).
82
ГЛ. 4. МОДЕЛИ РАЗМЕЩЕНИЯ
иных местах в зависимости от целых комплексов причин. Здесь
есть моменты, связанные со спросом и предложением: люди
нуждаются в жилых помещениях в различных местах, а строители
и архитекторы предлагают им различные типы домов. Такая
система образует то, что обычно называется рынком жилого фонда.
Это, разумеется, несовершенный рынок, но основная задача
модели размещения жилого фонда заключается именно в таком
описании и объяснении рынка жилья. С точки зрения спроса
необходимо знать структуры предпочтений различных типов людей,
а с точки зрения предложения — надо знать цели, технологию и
управленческие возможности строителей, архитекторов и других
действующих лиц, а также влияние, оказываемое планирующими
органами. Тогда есть принципиальная возможность
моделирования рынка жилого фонда. Это остается нашей глобальной целью.
Но в первом приближении информация, необходимая для
построения истинных рыночных моделей, отсутствует, а традиционные
экономические концепции функций спроса и предложения
оказываются недостаточными для построения такой теории в
пространственно декомпозированных системах. На сегодняшний день
известен ряд более элементарных моделей. Этот раздел посвящен
применению методов максимизации энтропии к анализу этих
элементарных моделей и выявлению преимуществ, получаемых от
декомпозиции задачи.
4.4.2. Гравитационные модели размещения жилого фонда
вокруг предприятий. Простейшим из возможных предположений,
которое может быть развито в модели, является предположение
о том, что жилой фонд размещается вокруг мест приложения труда,
и в частности, что доля людей, работающих в данной местности и
живущих в данном жилом районе, уменьшается при увеличении
расстояния (или, обычно, расходов на передвижение) между этими
районами. Самая элементарная модель такого типа — это часть
модели Лоури*), относящаяся к жилому фонду. Пусть Рх —
число живущих в зоне i, a Ej — число рабочих мест в зоне у. Тогда
предположение, используемое в данной модели, выглядит
следующим образом:
^i = gStfj/foj), (4.5)
i
где / — некоторая убывающая функция расходов на
межзональные передвижения cij9 a g — константа, определяемая из условия
равенства суммы Pt общему количеству населения Р. Другими
словами, значение g определяется путем подстановки (4.5) в
следующее равенство:
%Pi = P; - (4.6).
г
*) См. Лоури [1].
§ 4.4. ЭЛЕМЕНТАРНЫЕ МОДЕЛИ РАЗМЕЩЕНИЯ ЖИЛОГО ФОНДА 83
Легко видеть, что g — величина, обратная показателю
активности *).
Разумеется, эта модель представляет собой очень простую
форму гравитационной модели. Она предполагает фактически, что
если определить Ttj, как число людей, живущих в i и работающих
в ] (тогда gTtj — это число людей, живущих в тех семьях в г,
члены которых работают в /), то из гипотезы (4.5) следует, что
Ти = E,f (c„). (4.7)
Отметим, что в любой модели, постулирующей тот или иной вид
пространственного взаимодействия, основные предположения
можно более четко понять, если взаимодействие описано явным
образом, как в уравнении (4.7), а не с помощью обобщенных
показателей типа Tt> (или Рг в уравнении (4.5)). Отсюда вытекает
возможность дальнейшего развития модели, поскольку из уравнения
(4.7) видно, что она является простой разновидностью
гравитационной модели.
Начнем с того, что выпишем ограничения, которые приведут
к (4.7) в результате, максимизации энтропии, Это облегчит также
дальнейшее развитие модели.
При выводе модели Лоури необходимо обратить особое
внимание на определение энтропии: в этом случае удобно построить
распределение вероятностей, определив
а не использовать непосредственно Ttj**). Величину ptj можно
интерпретировать, как вероятность того, что работающий в зоне ;
будет жить в зоне i. Тогда энтропию такого распределения
вероятностей можно определить по формуле
Sj = -2Pijlnpij. (4.8)
г
Как и раньше, будем максимизировать эту величину Sj при
ограничениях
Sftj = l. (4.9)
г
^PijCij^Cj, (4.10)
г
где cj — средние расходы на поездку на работу для работающих
в зоне/. Следовательно, уравнение (4.10) эквивалентно обычному
стоимостному ограничению, сформулированному относительно
*) В работе Лоури [1] был получен вид функции / на основе анализа
транспортной сети для модели Питтсбурга. ...
**) Эти два метода эквивалентны — сдо, Ридьсоц [6],
84
ГЛ. 4. МОДЕЛИ РАЗМЕЩЕНИЯ
поездок на работу только в зону ;\ Но читатель может легко уста-
новить, что при максимизации Sj при ограничениях (4.9) и (4.10)
появится коэффициент пропорциональности (так как в
ограничения входит (4.9)), который зависит от /, а в модели Лоури этого нет.
Следовательно, уравнение (4.9) из ограничений нужно исключить.
Его надо заменить ограничением вида (4.6), но переписанным в
терминах рабочих мест: это означает, что сумма по j всех Ej должна
равняться наперед заданному уровню общей занятости. Не
представляется возможным выразить это в виде ограничения на ptj
и продолжать при этом максимизировать 5у, так как такое
ограничение включит в себя величины pijy для которых /' Ф /. Это
затруднение можно обойти, определяя вместо рц = Ty/Ej величину
р.. == Ttj I (kEj) и не используя (4.9) в качестве ограничения.
Тогда очевидно, что к можно вычислить так, чтобы сумма всех Ej
равнялась заданному числу. Поэтому будем искать максимум Sj
только при условии (4.10), откуда получим
ри = ехр (— |Vu), (4.11)
где Р7* — множитель Лагранжа, соответствующий уравнению
(4.10). Величины ptj можно заменить на Ttj/(kEj) и уравнение
(4.11) перепишется в виде
Ти = кЕ3 ехр (- р;с0). (4.12)
Если теперь положить
fj (си) = к ехр (- VjCU) (4.13)
и предположить дополнительно, что Р7- не зависит от /, то /у (ctj)
перепишется в виде / (ctj). В этом случае легко видеть, что
уравнение (4.12) эквивалентно (4.7). В этой модели (см. уравнение (4.7))
п
Ttj не удовлетворяют уравнению (4.9), т. е. 2J Т^фЕу Поэтому,
г=1
если максимизировать Sj при ограничениях (4.10) и (4.9) и снова
предположить, что р7- не зависит от /, то получается
Ти = ВД ехр (- рс„), (4.14)
где
5i = [2jexp(-P^ij)]-1, (4.15)
и Bj связаны с множителем Лагранжа для уравнения (4.13)*).
*) Конечно, энтропия в форме S, получаемая при дополнительном
суммировании по / в уравнении (4.8), также может максимизироваться при
обычном стоимостном ограничении (это уравнение (4.10), просуммированное по
/) и при ограничении (4.9); тогда легко проверяется, что модель,
определяемая уравнениями (4.14) и (4.15), получается непосредственно. Этот подход
был использован исключительно для соответствия с моделью Лоури,
которая, как уже было показано, не очень легко поддается гипотезам
максимизации энтропии.
§ 4.4. ЭЛЕМЕНТАРНЫЕ МОДЕЛИ РАЗМЕЩЕНИЯ ЖИЛОГО ФОНДА 85
Распределение жителей piy разумеется, всегда можно получить,
проведя обычное суммирование. Следовательно, уравнения (4.14)
и (4.15) определяют модель размещения жилого фонда, которая
отражает сформулированную выше гипотезу: распределение
работающих по местам проживания вокруг мест приложения труда
управляется известными величинами стоимости проезда.
В рассмотренном выше анализе единственное свойство мест
проживания, которое нас интересовало, это доступность по
отношению к местам приложения труда. Следующий шаг
заключается в повторном использовании приема, предложенного в § 3.3,
чтобы ввести в модель некоторую меру относительной
привлекательности Vf проживания в зоне i. Тогда уравнения (4.14) и (4.15)
перепишутся в виде
TtJ - BjVf Ej exp (~ pc„)
и
B;=[2v?exp(-pci}j\-\
г
Член У? можно интерпретировать, как объем существующей
застройки в зоне i. Так как привлекательность проживания есть
довольно сложное понятие (более сложное, например, чем
привлекательность торгового центра), то возможно есть смысл ввести
некий обобщенный показатель. Однако есть и другая причина, по-
которой интерпретация Vf просто как объема существующей
застройки, является неудовлетворительной: такое решение сделало
бы наиболее привлекательными полностью застроенные
территории. Тогда пришлось бы вводить в модель какие-либо
ограничения по мощности. Этот вопрос будет обсуждаться ниже, в гл. 5,
но уже сейчас очевидно, что использование «объема» в качестве
меры привлекательности создает ряд проблем.
Здесь следует отметить еще один момент. С помощью модели
конкурирующих возможностей можно получить ряд
элементарных моделей. Чтобы не нарушать ход изложения, рассмотрим этот
вопрос в Приложении 3 совместно с другими приложениями модели
конкурирующих возможностей.
4.4.3. Четыре типа стратегий размещения; квазидинамика.
Введем следующие типы стратегий размещения. Пусть г
обозначает номер социальной группы. Положим:
а) г = 1: свободные индивидуумы;
б) г = 2: индивидуумы с ограничением по производству
(фиксированные места проживания);
в) г = 3: индивидуумы с ограничениями по притяжению
(фиксированные места приложения труда);
86
ГЛ. 4. МОДЕЛИ РАЗМЕЩЕНИЯ
г) г = 4: индивидуумы с ограничениями до притяжению^ и
производству (фиксированы места приложения труда и
проживания, перемещение отсутствует*)).
Пусть T\j — число индивидуумов r-го типа, живущих в i и
работающих в /, сц — стоимость проезда на работу из i в /, a g —
как и раньше величина, обратная показателю активности; Р\ —
полное число индивцдуумов типа г в зоне i, a E] — число рабочих
мест для них в зоне /. Тогда
f^ = g£ ^ /£у = I ^j.
Выше отмечалось, что в этой "формулировке неявно
присутствует ограничение по времени: тот период, в течение которого
индивидуумы 4-го типа являются статическими. Для определенности
положим, что этот период равен одному году, а время t означает
начало периода. Поскольку в модель t явно не войдет, то на данном
этапе она будет лишь квазидинамической. Если будет нужно
указать, к какому периоду относится та или иная величина, то она
будет записываться с индексом 1в скобках. Так Е] (t) — это число
рабочих мест типа г в зоне ; в течение одного года, начиная с
момента t.
' В качестве Основы построения модели предполагается наличие
следующей информации по каждой из четырех групп:
а) г = 1: Р\ (и, конечно, gE\ = Р*);
б) г = 2: Р\;
в) г = 3 : Е)\
г) г = 4 : Р\ и #J,
где, как обычно, звездочка означает суммирование. При этом
следует учесть, что
Р% = gE%. (4.16)
Существуют различные способы оценки Р\, F\f E* и Ej
независимо от модели! размещения. Модель оценки представляет
собой первую часть упомянутого ранее двухступенчатого процесса
принятия решений. Для наших целей вполне достаточно показать,
*) Здесь используется терминология, введенная в гл. 3. Индивидуумы,
входящие в 4-щ категорща^будут называться в дальнейшем, статическими.
Это. удобное сокращение". Это не означает, что индивидуумы в" этой группе
никогда не перемещаются, но если они это и делают,-то так, что их распределение
по местам работы и проживания остается фиксированным. Лучше всего
понимать это допущение так, что размещение индивидуумов 4-й категории
фиксировав^ но их поездки на работу соответствуют гравитационной модели.
Альтернативное, а иногда и более очевидное решение состоит в том, чтобы
зафиксировать данное ^значение Т\_•. При необходимости читатель дегко сможет
видоизменить рассуждения в этом.разделу что0# достроить соответствующую
модель. .-.•--:. . - .-•..-...-
§ 4.4. ЭЛЕМЕНТАРНЫЕ МОДЕЛИ РАЗМЕЩЕНИЯ ЖИЛОГО ФОНДА 87
что можно организовать разумные схемы оценки этих величин.
Одна такая схема заключается в следующем.
; Пусть X* — набор переменных, которые определяют процесс
образования новых семей и миграцию в исследуемой области.
Тогда Р% поддается оценке с помощью регрессионного анализа
посредством следующего уравнения:
к
где а\ — набор коэффициентов.
Все оставшиеся величины следует предварительно определить
для каждой зоны. Пусть 7i и Zf - наборы переменных, которые
описывают тенденцию к закреплению жилья и тенденцию к
закреплению рабочих мест в зоне i. Полное число проживающих в зоне i
с фиксированными местами проживания есть Р\ + Pf, а полное
число фиксированных рабочих мест в зоне'/есть ff + Е).
Поэтому соответствующие уравнения регрессии имеют вид:
Pi+Pl = %a}uYl (4.17)
н
£?+^-з<ад.". (4.170
где а?/4 и а«/4 — наборы коэффициентов.
Например, Y\ могут включать в себя число
муниципалитетов в i и все переменные, описывающие возрастной и
профессиональный состав населения, a Z* —* могут включать в себя
величины, описывающие профессиональный состав.
В общем случае, желательно, как уже отмечалось, чтобы
модель имела квазидинамическую рекурсивную форму и этого,
наверное, можно добиться, если взять велияины X, Y и Z, которые
относятся к более раннему"периоду времени, чем зависимые
переменные, что позволит ввести в модель задержки. Это
предоставляется проделать читателю в качестве упражнения.
Для полного разделения групп (2), (3) и (4) необходимо
определить и другие наборы коэффициентов. Положим
Р\ = уР\ (4.18)
и
E3j = zEl . (4.18')
Заметим, что у и z должны быть связаны посредством уравнения
(4.16). Для определения этой связи в явном виде просуммируем
88
ГЛ. 4. МОДЕЛИ РАЗМЕЩЕНИЯ
уравнения (4.17) и (4.18) по пространственным индексам
к
Я8* + 4 = М<^, (4.20)
к
Pi = yPl (4.21)
E%^zEl (4.22)
Исключив Р%, Е%, Pi и Я£ из уравнений (4.16) и (4.19) — (4.22),
получим
г*
к
(' + *>2<П
= £,
в качестве соотношения, связывающего у и z.
Другой и, может быть, более простой способ выделения
потенциально подвижных индивидуумов заключается в том, чтобы взять
весь объем населения и распределения по рабочим местам за
предыдущий период времени, декомпозировать эти данные, например,
по социальным группам (г') и по занятости (г*) и выразить Р\, Е*, Pf
и 2?* как функции этих данных. Оценку Р\ можно проводить, как и
ранее. Поэтому здесь нужны величины Р?' (t — 1) и Z?Jr"(£ — 1)
в качестве полного числа индивидуумов в социальной
группе г' в зоне i в период (t — 1) и полного числа рабочих мест в
группе занятости г» в период (£ — 1). Тогда можно определить
коэффициенты yl у yl, zl и z\ так, чтобы
л? = 2у»>Г>--1),
г'
г"
г'
г"
В этих равенствах коэффициенты можно оценить с помощью
регрессионного анализа.
Чтобы воспользоваться регрессионным анализом или каким-
либо другим методом, надо знать значения зависимых переменных
в левой части уравнений. Но каким образом можно измерить
Р\, Е*, Р\ и Ер Этот вопрос возникает потому, что Р? и Е) — это
§ 4.4. ЭЛЕМЕНТАРНЫЕ МОДЕЛИ РАЗМЕЩЕНИЯ ЖИЛОГО ФОНДА 89
потенциально способные к передвижению индивидуумы, т* е*
в это число входят люди, которые только подумывают о том, чтобы
поменять место жительства или работу, но не делают этого. В
нашем распоряжении имеется возможность учета лишь
действительно передвигающихся индивидуумов. Такое затруднение можно
обойти, лишь выдвинув некоторые гипотезы, а затем проверив их.
Например, простейшим возможным предположением является то,
что отношение числа непередвигающихся (из общего числа
потенциально способных к передвижению) к этому общему числу есть
константа. Эту константу можно оценить, чтобы повысить
точность модели размещения.
Если допустить существование процедуры оценки Pi, P\, E),
Pf и Efj то переменные Тгц должны удовлетворять следующим
группам ограничений:
a)r = l: 1?22П = ^> (^-23)
г j
22zfyu = Ci; (4-24)
г j
б) г = 2: g2j7y=P?, (4.25)
22*fy« = C*; (4.26)
i 3
в)г=3: ЪТ% = ЕЪ (4.27)
i
22*fy& = c; (4.28)
i j
r)r = 4: gSHj^Pl, (4.29)
i
2П=^. (4-30)
i
22^Vii = c4, (4.3i)
i i „
где Cr — полные затраты на поездки на работу индивидуумов г-го
типа. Как уже известно из гл. 2, введение Сг для каждой группы
оставляет открытой возможность существования различных
коэффициентов в функции транспортных затрат для каждого типа
индивидуумов* Можно также воспользоваться правилами § 3.3 гл. 3,
чтобы ввести, где это возможно, члены У?1 и Wf*, которые
измеряют относительную привлекательность жилой зоны i и рабочих
мест зоны / соответственно. Проблема измерения Vt обсуждалась
в разделе 4.4.2. Для Wj можно воспользоваться уровнем
заработной платы или оценкой этого уровня. Модель максимизации
энтропии, которая вытекает из ограничений (4.23) — (4.31),
90 ГЛ. 4. МОДЕЛИ РАЗМЕЩЕНИЯ
описывается группами уравнений:
. а) г = 1: Т\} = KVfWf ехр (- р»су),
где К = Pi [^SFfW^expC-p^i)]"'1;
б) г = 2: T% = £p\W?eyLV(-pCii),
где 4 = [ 2 Wf ехр (- рХ-)]"1;
в) г = 3: Г?3 = Я?7?*£? ехр (- р%),
rfle^ = [S^f'exp(-p3Cij)]_1;
г
г) г = 4: Г?,- = А\В]Р\Е) ехр (- p*Cij),
где Л} = [ S В)Е) ехр (- р*с«)] 'х и В\ = $ 4fР\ ехр (- p*c{i)]-1.
д - *
Это действительно взаимосвязанная модель, потому что пока-
затели привлекательности Vt и Wj являются общими для трех из
четырех частей модели, а каждый из них, в свою очередь, зависит
от распределения всех жилых зданий и мест приложения труда и
образуется в результате суммирования по всем четырем частям
модели. Кроме того, существует связь между Pj, Р\, Z?f, Р\ж Е).
Наконец, рассмотрим задачу связи модели размещения жилого
фонда с транспортной моделью поездок на работу. Предположим,
что период действия квазидинамической модели размещения очень
эдал. Тогда большинство людей попадет в группу 4, и,получится
Модель распределения поездок (в пределах модели распределения
жилого фонда), которая сильно напоминает модель с
ограничениями: на производство и притяжение. Поэтому при необходимости
получить оценку поездок на работу в данный момент времени для
заданных распределений населения и занятости следует
пользоваться моделью с ограничениями на производство и притяжение *).
Но в целях прогноза следует использовать рекурсивную модель
размещения жилого фонда. Поэтому при анализе городских
транспортных сетей имеет смысл использовать для прогноза поездок
на работу модель с ограничениями на производство и притяжение,
если прогноз размещения жилья является для модели внешним.
Преимущество использования рекурсивной модели для
прогноза развития и модели с двойными ограничениями для
«мгновенного» анализа транспортной системы заключается в
возможности введения различных временных запаздываний, которые ил-
*) Это еще одно обоснование определения категории 4 стратегий
размещения, как уже отмечалось в сноске на стр. 86.
§ 4.4. ЭЛЕМЕНТАРНЫЕ МОДЕЛИ РАЗМЕЩЕНИЯ ЖИЛОГО ФОНДА 91
люстрируют влияние изменений транспортной сети (фактически
изменений cijy а значит и показателей доступности). Например,
в транспортной модели можно рассмотреть практически
мгновенные изменения прибытий и маршрутов, а в модели размещения
жилого фонда могут появиться довольно длинные задержки.
4.4.4. Разукрупнение с учетом упрощающего предположения.
Для того чтобы можно было учесть хотя бы такие характеристики,
как:
а) различные группы дохода;
б) зависимость заработной платы от места проживания;
в) различные типы домов;
г) зависимость цен домов от местоположения,
необходимо провести разукрупнение элементарных моделей
размещения жилого фонда. Это можно сделать в два этапа,
Введя сперва упрощающее предположение, которое разъяснит
общие принципы. Основное упрощающее предположение заключается
в том, что в каждой семье имеется один и только один работающий.
Это предположение позволяет сконцентрировать внимание на
распределении работающих по местам проживания и местам
приложения труда, не утруждая себя сложностями анализа семейной
структуры. Наша первая задача будет заключаться в том, чтобы
провести разукрупнение модели раздела 4.4.2.
Разукрупнения можно добиться, определив Т%™ как число
индивидуумов, живущих в зоне i в доме типа к и работающих
в зоне / с заработной платой w. Предполагается, что заработная
плата является единственным источником дохода. Пусть Н\ —
число домов типа к в зоне £, a Ef — число рабочих мест в зоне ;
с заработной платой w. Параметр к характеризует размеры,
давность постройки и состояние дома, с^ — как обычно, стоимость
проезда из i в /. Тогда величины Tf° должны удовлетворять
следующим ограничениям: -
22rff==#£, (4.32)
i w
22№ = Я?, (4.33)
$22^4 = С", (4.34)
i j к
где предполагается, что типы домов и уровни заработной платы
описываются дискретными рядами чисел. Ограничения (4.32) —
(4.34) порождают серию гравитационных моделей с
ограничениями, вид которых уже сейчас можно предугадать. Заметим, что после
введения Сю транспортный параметр в модели будет аналогичен Pw,
что свяжет продолжительность поездок с доходом, а не с типом
пассажиров г. Это будет применяться всегда, когда доход будет
92
ГЛ. 4. МОДЕЛИ РАЗМЕЩЕНИЯ
входить в модель явным образом. Отметим также, что Я? и Ef —
внешние данные, необходимые для модели.
Нам потребуется еще одно ограничение. Необходимо как-то
записать то условие, что работающие будут жить в тех домах,
которые они могут себе позволить. Через р* обозначим цену дома
типа к в зоне i, а через qw — среднее значение той части дохода
(после вычета транспортных расходов), которую член социальной
группы w тратит на квартирную плату. Задача состоит в том,
чтобы связать эти величины. Было показано, что стоимостные
ограничения типа (4.34) приводят к тому, что в модели появляются
экспоненциальные распределения с отрицательным показателем
степени. Теперь необходимо ввести распределение, которое
характеризует разброс реальных расходов на проживание вокруг
среднего значения и связывает их с ценой дома р\. Так как далее
эти расходы будут сравниваться с реальными денежными
стоимостями поездок на работу, то пусть c\j — это та часть обычных
обобщенных стоимостей поездок ctj, которая связана с денежными
расходами. Наиболее простое предположение состоит в том, что
это распределение является нормальным. Это можно учесть, введя
ограничение
222 Tf [P*i -gw(w- 4)]* = *-, (4.35)
г j к
где ow2 — дисперсия нормального распределения для социальной
группы w. Определим энтропию в виде:
я = -22221п2?Л
i j к го
Для ее максимизации при ограничениях (4.32) — (4.35) запишем
лагранжиан
2 = -22221пт1Л-22^1)*(22г?Г-#?)-
г j к w г к j ю
- 22М2),° (22*17 - Ef) - 2РЮ (222Г&Ч,- - с) -
j w г к w г j к
- 2 r{222[pf-9w(«'-4)]2-^2},
w г j к
где %i1)k, Xf)wy Pw и \iw — множители Лагранжа, связанные
с уравнениями (4.32) — (4.35) соответственно. Решая систему
уравнений
дткго
совместно с системой ограничений, получим
Т%> = AfBfHfE? exp (- р%) exp {- ц" [rf - qw (w - 4)]2}, (4.36)
8 4.4. ЭЛЕМЕНТАРНЫЕ МОДЕЛИ РАЗМЕЩЕНИЯ ЖИЛОГО ФОНДА 93
где
лк_ ехр(-?^>*) exp(-bf")
Ai я? ' ">~ 1° •
Уравнения (4.32) и (4.33) позволяют явным образом выразить А\
и Б?
А\ = (S2 Wехр(- р%)ехр{- ц* [p\ -qw(w~ c^))'1
j го
И
В? = ( S 2 ^#? ехр (- р%) ехр {- \iw [p? -q™(w- Сц)]*})-\
г к
Необходимо учесть, что все стоимости и цены должны
относиться к одному и тому же периоду времени.
Если опустить последний член произведения, стоящего в
правой части (4.36), то получится разукрупненный вариант модели
размещения жилого фонда и поездок на работу с ограничениями
на производство и притяжение. Последний член обеспечивает
эффективность разукрупнения; если qw (w — с{-) — средняя
стоимость проживания — сильно отличдется (в любую сторону)
отpf, то очень небольшое число людей с доходом w, работающих в /',
будут размещаться в домах типа к ъЬ. Очевидно, что это как раз
то, что нужно, чтобы ввести в модель размещения жилого фонда
соответствующее влияние дохода. Например, если в большом
городе единственное свободное недорогое жилье размещается либо
в старом районе в центре, либо в новом районе в отдаленном
пригороде, то семьи с низким уровнем дохода будут размещаться в
соответствии с распределением этого жилья. Если модель
описывает чисто пространственное взаимодействие, то этого не
произойдет, что может привести к ошибочным результатам.
Информационные проблемы, связанные с калибровкой
моделей такого типа, очевидно, довольно сложны. Но они вряд ли
неразрешимы: с одной стороны, развитие моделей такого типа
должно дать толчок сбору соответствующих данных; с другой
стороны, даже при коротких периодах планирования для таких
показателей, как тип дома, можно построить описывающие их
величины.
4.4.5. Обобщение. Существуют по меньшей мере два способа
отказаться от основного упрощающего предположения
предыдущего раздела, которое состоит в том, что в каждой семье имеется
в точности один работающий. Но в любом случае возникают
теоретические проблемы. Альтернативы возможны в результате двух
возможных допущений: для выбора места проживания существен
доход лишь главы семьи или существен доход всей семьи.
Возможны также и «промежуточные» допущения.
94
ГЛ. 4. МОДЕЛИ РАЗМЕЩЕНИЯ
Чтобы разобраться с первым допущением, необходимо выделить
главы семейств. Следуя обозначениям предыдущего раздела,
обозначим через Тц число работающих в / за заработную плату w
и проживающих в зоне i в доме типа к. Пусть г' = 1 означает
главу семьи, а г' = 0 — члена семьи (т. е. «зависимого» работающего).
Пусть Е — среднее число работающих в семьях. Тогда уравнение
(4.32) может быть переписано в виде
(4.37)
или же в виде
-— -— -— ткт'
V W ц - н*
1j 1j 1j е -я»»
; w г'
(4.38)
Эти формулы выражают то условие, что дома распределяются
между главами семей. Все работающие распределены по рабочим
местам, поэтому уравнение (4.33) приобретает вид
222?Т' = яГ. (4.39)
г к г'
Кроме того, все платят за поездки на работу, поэтому уравнение
(4.34) переписывается в виде
2222^% = сш- (4.40)
г j к г'
Эквивалентом уравнения (4.35) является
SSSSltTV IP? - вГ (w - су)]2 = *-, (4.41)
i j к г'
где член бг1 показывает, что только глава семьи имеет отношение
к расходам на проживание.
Чтобы получить в данном случае модель максимизации
энтропии, следует выбрать, каким из уравнений (4.37) или (4.38)
воспользоваться. Кажется, что лучше выбрать уравнение (4.37),
которое обеспечивает постоянную долю «зависимых» работающих
в общем населении каждой зоны. Если выбрать (4.38), то
ограничения на число «зависимых» работающих будут отсутствовать.
Максимизация
S = -2ln7lT'!
при ограничениях (4.37) и (4.39) — (4.41) дает
Т^1 = А\Й?ЕН\Ц ехр (_ р%) ехр {- ^ [р\ - q» (w - ^)]2}
(4.42)
при г' — 1 и
Т%* = А}Ь?ЕН**Е?ехр (- р№с0) (4.43)
§ 4.4. ЭЛЕМЕНТАРНЫЕ МОДЕЛИ РАЗМЕЩЕНИЯ ЖИЛОГО ФОНДА 95
при г' = О, где
■ к _ expHM1)fc) я„ _ ехр (- Ц««)
ЕН\ ' Ef
a A-i1)fe, А,)2)ш, рш и \iw — множители Лагранжа, связанные с
уравнениями (4.37) и (4.39) — (4.41) соответственно. Значения А\
и Bj можно получить непосредственно путем подстановки
уравнений (4.42) и (4.43) в (4.37) и (4.39).
Это предлагается читателю в качестве упражнения.
Величины Р™ и \iw можно получить с помощью обычного процесса
калибровки.
Теперь обратимся к альтернативной гипотезе: весь доход семьи
участвует в расходах на проживание. Здесь необходимо решить
задачу систематической группировки индивидуальных доходов w
в семейные доходы / для семей с более, чем одним работающим.
Индекс г' можно опустить, и под Г?/° понимать число работающих
в зоне / за заработную плату w и проживающих в зоне i в домах
типа к. Будем считать, что мы знаем или можем определить
распределение п (w | /) — вероятность того, что индивидуум,
получающий заработную плату w, принадлежит семье с доходом /.
Очевидно, что теперь ограничения (4.37) и (4.39) — (4.41) можно
изменить
rpkw
Ч — //*
ЕЕ-
w
г к
i j к
£Г,1,П(ЦТГ irf-«'(/-4)1'-о»». (4.44)
г j к
Из этих четырех уравнений только последнее нуждается в
пояснениях. Величина п (w\I) Т*™ — это число работающих с
доходом w, живущих в семьях с общим доходом /, следовательно из
уравнения (4.44) вытекает, что такие работающие будут выбирать
места проживания, исходя из дохода семьи. Слабым местом этой
формулировки является то, что в уравнении (4.44) фигурируют
индивидуальные транспортные расходы, а не транспортные
расходы всей семьи или транспортные расходы главы семьи. В такой
формулировке модели нельзя выделить ни одну из этих величин.
Но сформулированный вывод из уравнения (4.44) является
разумным приближением к действительности. Если значение / велико,
96
ГЛ. 4. МОДЕЛИ РАЗМЕЩЕНИЯ
то все члены семьи обладают большой свободой передвижения и
наоборот. Получающаяся модель максимизации энтропии может
быть записана в виде
Т\? = AtBfflE? ехр (- р»Су) ехр {- ^ Щ11 [р?-?1 (/-«,)]»} ,
где р1* и \лт — множители Лагранжа, А\ и В™ определяются
через множители Лагранжа обычным образом.
4.4.6. Моделирование предложения. Рассмотренные выше
модели размещения жилого фонда в основном ориентированы на
спрос: они размещают потребителей жилых зданий на основе
показателей привлекательности жилья или на основе заданного
распределения различных типов домов Н*. Это первое указание на то,
как учесть предложение и расширить элементарные модели так,
чтобы они стали похожи на рыночные модели с взаимодействием
спроса и предложения.
Чтобы избежать неоднозначности, введем снова показатель
типа г, который будет описывать различные типы индивидуумов
по их отношению к выбору места жительства, но будем
предполагать, что в каждой семье существует один и только один
работающий, и что существует всего два типа индивидуумов по
отношению к выбору места жительства: потенциально подвижные с
фиксированными местами приложения труда (г = 1) и статические
(г = 2)*). Это позволяет построить модель, ориентированную на
предложение. Пусть T\fr — переменная, описывающая
пространственное взаимодействие. Она удовлетворяет соотношениям
2аг!Г(0 = ДЯ?(*). (4-45)
j w
22г<Г(0 = #?(<). (4.46)
j W
SS2№(*) = *?(0. (4.47)
г It r
^^^^Ttr(t)Cij(t) = Cw(t), (4.48)
г j ft г
S S а ТТ (0 {р\ (t) - qw (t) [w (t) - 4 (t)]Y = o- (t), (4.49)
г j It
где все переменные уже встречались раньше за исключением АН*
и #?. Величина АН* — это число домов, которое стало доступ-
*) См. примечание на стр. 86. Но теперь предположение, сделанное там,
является менее удовлетворительным, поскольку налицо разукрупнение по
типам домов и уровню дохода. В случае необходимости читатель легко
может получить другую модель, основанную на предположении, что заданы
(или могут быть вычислены по Т\^ (t — 1)) T*f*(t).
§ 4.4. ЭЛЕМЕНТАТНЫЕ МОДЕЛИ РАЗМЕЩЕНИЯ ЖИЛОГО ФОНДА 97
ным для потенциально подвижных за счет предложения, а Н\ —
число домов, занятых статическими индивидуумами. Для
разъяснения квазидинамической природы модели добавлен индекс £,
указывающий начало периода времени, к которому относится
соответствующая переменная. Заметим, что уравнение (4.49)
записано только для потенциально подвижных индивидуумов.
Модель максимизации энтропии, которая получается при этих
ограничениях, может быть записана следующим образом:
а) г = 1: Т}?1 (t) = Af (t) В? (t) АН\ (*) £f (t) x
X ехр (_ р«с« (0) ехр (_ ц" (rf (t) - qw (t) [w (t) - c{j (t)]}%
б) г = 2: T$*(t) = A\\t)Bf{t)H\{t)E^t)BXV [_ ?»*„(*)],
где pw и jiw — множители Лагранжа, связанные с уравнениями
(4.48) и (4.49), а-4^,4?и #}° вычисляются с помощью множителей
Лагранжа, связанных с уравнениями (4.45) — (4.47)
соответственно. Эти величины могут быть определены обычным образом.
Полный состав домов по типу и месту расположения
предполагается известным. Предположим также, что с помощью какой-
либо процедуры (см., например, раздел 4.4.3) можно оценить по
Ti™* (t — 1) значение' Г?,*2 для статических индивидуумов и
Ttf1 для потенциально подвижных. В силу упрощающего
предположения имеем
H\{t) = T\?{t).
Тогда АН* частично состоит из домов, освобождаемых
потенциально подвижными индивидуумами, а частично — из новых домов,
поступающих на рынок; некоторые из новых домов могут
появиться в результате сноса старых. Пусть АН* (1) — число домов,
которое освободится в результате переезда потенциально подвижных
индивидуумов (эту величину можно определить по Н* (t) и
известному общему числу домов); АН* (2) — число новых домов,
появившихся на свободной территории и АН* (3) — число домов,
построенных в результате сноса старых зданий. Предполагается,
конечно, что все жильцы таких домов присоединяются к
потенциально подвижным индивидуумам. Таким образом, в той части
модели, которая относится к предложению, необходимо оценить
АН* (2) и АН* (3). Взаимодействие спроса и предложения
позволяет определить цены р* в виде стоимости возведения № и
стоимости размещения I* для каждого типа зданий
Р? = № + It
Можно предположить без особой потери общности, что величины
4 А. Дж. Вильсон
98
ГЛ. 4. МОДЕЛИ РАЗМЕЩЕНИЯ
hK известны и заданы. Предположим также для простоты, что
реконструкция отсутствует.
Теперь становится понятным, как следует моделировать
рыночное поведение при различных правилах. Ниже будет
показано, что в модели такого типа вряд ли имеет смысл получать
единственный прогноз развития рынка. Например, на свободных
территориях различные архитекторы будут пользоваться одной и той
же землей для возведения различных типов домов по различным
ценам. Разрабатываемая здесь модель будет предсказывать
последствия целых наборов таких решений и может использоваться
для получения или прогноза «одтимального» общего плана или
сценария функционирования рынка, если только будет установлен
подходящий критерий оценки благосостояния. Существуют пь
меньшей мере два способа исследовать эту задачу: а) постулировато
систему, ориентированную на максимизацию коллективной
выгоды; б) постулировать систему, ориентированную в основном на
максимизацию частного благосостояния. Рассмотрим их по
очереди.
Общественное планирование в значительной степени зависит
от структуры предпочтений индивидуумов, входящих в общество
по отношению к жилью и поездкам на работу в соответствии с
доходом. Такая информация может быть сформулирована с помощью
утверждения, что в группе дохода w существует «потребность»
в различных типах жилых зданий в сочетании с различными
допустимыми длительностями поездок на работу. Тогда Pw (к, с)
будет частью социальной группы w, испытывающей «потребность»
в доме типа к и поездках на работу стоимостью с. Другими
словами, такую функцию можно использовать, чтобы представить
ранее упомянутую информацию о структуре предпочтений.
Заметим, :что
pw(k,c)= S Tfr/TT,
по i,j
таким, что
где б — константа. Если известно множество Д#ь то можно
получить оценку Т*™*, поэтому задача общественного планирования
сводится к определению последовательности A/f? в каждый
период времени, так что прогнозируемые моделью значения Pw (к, с)
будут близки к предпочитаемым значениям этих величин.
При максимизации частной выгоды ситуация меняется. Можно
предположить, что существует большое число застройщиков,
каждый из которых старается максимизировать свои собственные
прибыли, но ни один не может монополизировать рынок. Тогда
любой застройщик будет определять, какую цену он может
запросить за различные типы домов на участках земли, которые ему
принадлежат или которые он может приобрести. Если на рынке
§ 4.4. ЭЛЕМЕНТАРНЫЕ МОДЕЛИ РАЗМЕЩЕНИЯ ЖИЛОГО ФОНДА 99
конкуренция велика, то застройщик не сможет получать
«дополнительную» прибыль. Но он будет стараться выделить ту часть
рынка, которая обеспечит ему наибольшую прибыль на единицу
земельной площади. Легко видеть, что частное «решение» будет
отличаться от общественного, так как наиболее прибыльные
участки рынка будут перенасыщены застройкой.
Итак, стало более или менее ясным, как моделировать
предложение. Между двумя рассмотренными здесь крайними
случаями существует большое число промежуточных ситуаций, которые
можно подробно исследовать.
4.4.7. Дальнейшее разукрупнение. Рассмотрим уже определен-
ную выше переменную пространственного взаимодействия Тц .
Здесь г — характеристика отношения к выбору места жительства.
Мы использовали также индекс г для того, чтобы указать, является
ли индивидуум главой семьи или нет. Будем считать теперь, что
г — составной индекс вида
г =г rr'r*rm . . .,
где г — характеристика отношения к выбору места жительства,
г'указывает, является индивидуум главой семьи или «зависимым»
работающим, г" —- показатель социальной группы, rw — наличие
автомобиля и так далее. В рассмотренных моделях эта
детализация является вполне понятной: можно предположить, что имеет
место суммирование по отдельным индексам, которые выражены
неявно.
Очевидно, что имеет смысл и дальнейшее разукрупнение. Уже
отмечалась необходимость в показателе «социальная
группа/занятость», который обеспечит распределение работающих по
отведенным для них рабочим местам. На практике может оказаться
полезным даже грубое деление на синие и белые воротнички.
Необходимо также ввести разукрупнение по типам коммуникаций,
что уже отмечалось в § 4.3.
До сих пор предполагалось, что все показатели связаны с
дискретными группами. Но в некоторых случаях, например, для
дохода w, может оказаться более удобным предположить
непрерывное изменение показателя и заменить для соответствующих
переменных знак суммы на интеграл. С вопросом разукрупнения
задачи это связано следующим образом: в пространственной модели
возникают проблемы даже при относительно небольшом числе
«клеточек». Так при переменных Г?/*г, если мы имеем 50 зон, 5
типов домов, 5 социальных групп и 4 стратегии размещения, то
получается 502 X 5 X 5 X 4 = 250 000 клеточек или категорий населения.
Возможность калибровки модели можно обеспечить путем
статистических обследований, которые дали бы достаточную информацию
по каждому элементу этого массива. Здесь можно предло-
4*
100
ГЛ. 4. МОДЕЛИ РАЗМЕЩЕНИЯ
жить следующие подходы: калибровка может использовать укруп-
ненные массивы, например, Т«,- или распределение длин
поездок; можно выяснить, что многие клеточки будут нулевыми и
проводить калибровку лишь для ненулевых значений, если, конечно,
нули можно систематически выделять; наконец, некоторые
показатели, такие как доход, можно заменить непрерывными
распределениями, которые описываются одним или двумя параметрами,
так что можно будет оценивать только эти параметры.
Здесь следует отметить еще одну особенность: до сих пор
неявно предполагалось, что в каждой семье имеется по меньшей мере
один работающий. В некоторых семьях это не так, и их
стратегия размещения соответствующим образом меняется. В этом
случае есть два способа разукрупнения: ввести пятую группу
стратегий размещения или ввести дополнительную «социальную группу».
Эта группа будет получать соответствующий доход, а матрицу
ctj для нее следует изменить так, чтобы все сц были нулями, а
остальные элементы были бесконечными. Доход будет поступать
непосредственно на дом.
\ |4.4.8. Интегрированные модели. Цель этого раздела
заключается в том, чтобы отметить, что различные обобщения
элементарных моделей могут быть интегрированы. Простой пример такого
интегрирования был приведен в разделе 4.4.6, где была
рассмотрена модель с двумя типами отношения к выбору места жительства
и разукрупнением по доходу, типу домов и уровню заработной
платы. Здесь будут рассмотрены лишь общие принципы интеграции
моделей.
Выясним, например, как объединить четыре типа стратегий
размещения с разукрупнением по доходу, типу зданий и уровню
заработной платы. Наша задача будет состоять в введении в
интегрированную модель раздела 4.4.6 четырех типов стратегий
размещения вместо двух. Пусть A-Hf — число домов, доступных
индивидуумам, потенциально подвижным по местам проживания
(г = 1 и 3), a AEf —число рабочих мест, доступных
индивидуумам, потенциально подвижным по местам приложения труда
(г = 1 и 2). В последнем случае будем отличать AEf1 — рабочие
места, доступные семьям типа г = 1 (в общем случае это будут
новые или иммигрировавшие семьи с низким уровнем дохода), от
AEf* — рабочих мест, доступных семьям типа г = 2 (в общем
случае, это люди, которые ищут лучшую, а значит и более
высокооплачиваемую работу). Тогда
AEf = AEp + AEf\
и для AEf можно предположить распределение дохода,
совпадающее с распределением для Ef (фиксированные места приложения
§ 4.4. ЭЛЕМЕНТАРНЫЕ МОДЕЛИ РАЗМЕЩЕНИЯ ЖИЛОГО ФОНДА £01
тРУДа)> причем для АЕ™1 среднее значение будет ниже, чем для
AEJ2. Здесь A#f, AE™1 и AEf* будут частично состоять из новых
звеньев (что касается мест приложения труда, то здесь придется
принять во внимание изменение фактического спектра
специальностей), а частично — из звеньев, которые освободились в
результате перемещений, что уже отмечалось для жилого фонда в
разделе 4.4.6. Если через Ет обозначить средний размер г-го типа семьи,
а через г' — индекс главенства в семье, то можно записать
ограничения, которые ослабляют предположение об одном работающем
в каждой семье. Эти ограничения имеют вид
kwr
LZSt=a^ <4-50>
3 w r=i,3
У.УУ.-?—*\ («I)
j w Г=2,4
Г
аагг-дяг. (4.52)
за?1г=дяг> (4.53)
22 2 T$» = Ef, (4.54)
г ft г=з,4
2222^ = с*\ (4.55)
г j ft r
222 2 Т%V IP? - qw (w - е\})]* = a*, (4.56)
i j ft r=l,3
где член бг^ в уравнении (4.56) указывает, что жилищные расходы
финансируются главами семей. Запишем уравнения модели
максимизации энтропии только для г' = 1. Уравнения для г' = 0
выглядят так же, но в них отсутствует последняя экспонента* Модель
получается в результате максимизации
s = -22222?in
г j Jc to г
при ограничениях (4.50) — (4.56). Результат при г' = 1 можно
расположить по группам в соответствии со значениями г:
а) г = 1: iff1** AT^BfErAHfAE? exp (- 6%) х
X exp {- jiw \p\ -q«(w- el,-)]2};'
б) r = 2: flf = ATuBTErH\bEf* exp (- 6wc4i);
в) r = 3: 7f® = ApBfErbHiEf exp (- p%) x
X exp {- |i* [pf -q»(w- c'y)]*};
r) r = 4: Г*?04 = Af'4BfHfEf exp (- 6wc„),
102 ГЛ. 4. МОДЕЛИ РАЗМЕЩЕНИЯ
где
<fel/a_ exp(-M1/<)fe) л*иш_ вхр(-Я^»)
#„Д#? ' ЕВ]
г" г
рЦ?1 ахр (-*<*>-) рЦ,2 ехР(-^) рШ ехР(-^)
Здесьtf/i}\ Xf/0*, Ь$°ш, *Г°. *Г. Рши^ -множители Лагран-
жа, связанные с уравнениями (4.50) — (4.56) соответственно.
Величины А\ч\ Aff\ В™, BJ2 и Bf можно найти путем подстановки
в уравнения (4.50) — (4.56).
Этот пример показывает, как разработчик модели может
внести в элементарные модели раздела 4.4.1 все усовершенствования,
которые он сочтет необходимым, при наличии соответствующей
информации.
Глава 5
ИНФОРМАЦИОННЫЕ АСПЕКТЫ ЭНТРОПИЙНЫХ
МОДЕЛЕЙ ПОТОКОВ И РАЗМЕЩЕНИЯ
§ 5.1. Введение
В этой главе рассмотрен ряд задач, которые с первого взгляда
не имеют друг с другом ничего общего. Сходство обнаруживается
при рассмотрении связанных с этими задачами моделей
максимизации энтропии. Будут рассмотрены три задачи. Первая из них
относится к моделированию транспортных потоков в области,
имеющей внешние связи. Затем будет изучена задача моделирования
транспортных потоков в области, в некоторых зонах которой
имеются ограничения на число стоянок автотранспорта. Эти задачи
непосредственно связаны с потоками. Наконец, будет приведена
модель размещения жилого фонда в области, в которой количество
населения отдельных зон фиксировано в результате
осуществления определенной плановой стратегии развития.
§ 5.2. Внешние зоны в транспортных моделях:
гравитационная модель с неполной информацией
В рассмотренных (гл. 2 и 3) транспортных моделях исследуемая
область предполагалась замкнутой; другими словами
предполагалось, что взаимодействие между зонами внутри области и зонами
вне ее отсутствует. Очевидно, что это серьезное ограничение: во
многих случаях можно так провести границу области, что
аппроксимация будет вполне удовлетворительной, но это возможно не
всегда. Один из примеров плохой аппроксимации состоит в
следующем: предположим, что изучаемая область включает в себя
несколько маленьких городов, а за пределами области находится
большой город. Это означает, что основная цель анализа состоит в
изучении взаимодействия между маленькими городами, но важно
учитывать их взаимодействие с большим городом, не моделируя
подробно всех этих взаимосвязей, поскольку это очень осложнило
бы исследования и сделало бы анализ весьма сложным. Конечно,
эта проблема «замыкания» хорошо известна. Предлагались
различные способы ее разрешения, но они не будут здесь обсуждаться.
104 ГЛ. 5. ИНФОРМАЦИОННЫЕ АСПЕКТЫ ЭНТРОПИЙНЫХ МОДЕЛЕЙ
Нас будет интересовать в основном, что дает для решения этой
проблемы метод максимизации энтропии.
Суть метода максимизации энтропии и его применения при
построении гравитационных моделей состоит в том, что вся
информация, которой мы располагаем относительно задачи, должна быть
представлена и формализована в виде ограничений. Для
конкретности рассмотрим обычный пример с поездками на работу. Для од-
ноцелевых поездок, например поездок на работу, имеем, как и в
гл. 2, следующую информацию:
(1) количество работающих каждого типа в каждой зоне Q\
(при необходимости и для внешних зон тоже);
(2) число рабочих мест по зонам Dj как для изучаемой области,
так и для внешних зон;
3) подробная информация о сети с*,- (обобщенная стоимость
поездки из i в /) с помощью типа коммуникации к для любой пары
зон £, /, из которых хотя бы одна находится в изучаемой области.
Считаем, что подробная информация о с*,- для связей между
внешними зонами отсутствует. Это особенно важно отметить,
если внешних зон много. Это означает, что модель не должна
оценивать транспортные взаимосвязи между внешними парами зон.
Кроме того, внешние зоны часто являются довольно большими,
поэтому данные по транспортным взаимосвязям, которые можно
получить, обычно являются весьма грубыми.
Необходимо получить модель, которая наилучшим образом
использует имеющуюся информацию. Проще говоря, нужно
смоделировать все поездки на работу, которые либо начинаются, либо
оканчиваются, либо и начинаются и оканчиваются в изучаемой
области. Это будет, конечно, весьма полезным обобщением обычных
методов моделирования городских систем, которое явится
альтернативой методу введения фиктивной зоны или использованию
отдельной модели для внешней среды. Но в случае сильного
взаимодействия между изучаемой областью и внешними зонами введение
отдельной модели может оказаться единственным выходом из
положения.
Формально все это можно записать следующим образом. Пусть
S — изучаемая область или интересующий нас регион; 5" — это
область S плюс дополнительные зоны, в которые ежедневно
выезжают жители S; S" — это область S плюс дополнительные зоны,
из которых ежедневно прибывают люди, работающие в S.
Обычно S' совпадает с 5"", но здесь они разделяются, на случай,
если такое разделение может потребоваться. Например, в
частном случае может оказаться, что выезд отсутствует, и есть только
въезд, тогда S" просто совпадает с S, что упрощает вычисления.
Теперь необходимо получить такие ограничения, чтобы
суммы обычных показателей пространственного взаимодействия T\J
§ 5.2. ВНЕШНИЕ ЗОНЫ В ТРАНСПОРТНЫХ МОДЕЛЯХ Ю5
(число поездок между зонами i и / с помощью типа коммуникации
к, совершаемых пассажирами типа г) были равны Q\ nDj, которые
известны, если i и ;' находятся в пределах S. «Стоимостное»
ограничение может быть введено для всех поездок между i и /, где либо г,
либо / входит в S. Формально эта информация может быть
записана (с помощью обозначений гл. 2) следующим образом:
S S ?f = <?[ для te=S, (5.1)
jeS' кеЖ(г)
S S 2 rjT-D, для /G5, (5.2)
2 2 ^4 = cr
i<=S"l либо!, XeM(r)
ieS' J либо j
для каждого типа пассажиров г.
Здесь для каждого типа пассажиров, как обычно, выписано
свое стоимостное ограничение, поскольку это дает возможность
получить различные экспоненты для каждого типа пассажиров.
Модель максимизации энтропии может быть получена с помощью
лагранжиана X
iSS*1 либог, г fteM(r) ieS r
jeS' J либо j
x(2 2 ^-?0-Sf(SS 2 г&-л,)-
jss' feeM(r) jes iesw r fteM(r)
-2F( 2 2 t$4-<r), (5.3)
r ieS" 1 либо i, fc£M(r)
jSS"J либо;
для М1)г» hf* и Рг, ~ мноясители Лагранжа. Теперь следует
решить систему
#=° ^
для i ЕЕ £", j ЕЕ 5', где по крайней мере одна из зон i и /
принадлежит S. Самый простой способ провести подстановку из (5.3) в
(5.4), учитывая различные способы суммирования в (5.3), состоит
в том, чтобы отдельно рассмотреть три случая:
a)ieS,/£ S;
б) iGSf, i&S, j(=S;
в) tES,/GS',/^S.
106 ГЛ. 5. ИНФОГМАЦИОННЫЕ АСПЕКТЫ ЭНТГОПИЙНЫХ МОДЕЛЕЙ
Подстановка (5.3) в (5.4) для каждого из этих трех случаев дает
а) i е S,; ЕЕ S: - In Т% - М1)г - bf - Рг4' = 0, <5.5)
откуда
б) i^S",i^S,iGS: Г^ = вхр(-^2)-рг4). (5.6)
Отметим, что в этом уравнении отсутствует множитель
Это связано с тем, что он не определен для i £= £*, i ф. S.
в) ieSfjeS',j& S: Т% = ехр (- Х(?)г - р^). (5.7)
Здесь уже отсутствует второй множитель Лагранжа Xf\ Этот
множитель неопределен для / G 5", / §ё 5. Ниже будет показано,
что это связано с тем, что в каждом из уравнений (5.6) и (5.7)
опущен один из «конкурирующих» членов или множителей
балансировки.
Итак, чтобы ввести привлекательность для зоны отправлений
i в уравнении (5.6) и зоны прибытий / в уравнении (5.7), надо
переопределить соответствующие су с помощью приема,
использовавшегося в § 3.3 гл. 3, который состоит во введении в
соответствующих местах «выгоды» ut и vj9
Поэтому для iEE S", i ф S, / ЕЕ S имеем
Сц —■> Сц — Щ9
а для i e S, j e S', j&S:
Cij->Cij — Vj.
Из-за этого в уравнениях (5.6) и (5.7) появляются множители
ехр (PrKj), ехр (Prty) соответственно. Их можно отождествить с
факторами производительности Р\ и привлекательности (или
притяжения) Rrj соответственно. Они могут зависеть от г, что и
отмечено выше. Кроме того, для iG5, / €E S обозначим
ехр (- tf)r) = A\Ql
ехр (- Я^) = BjDj.
Уравнения (5.5), (5.6) и (5.7) переписываются в виде
Т% = A&jQlD, ехр (- Pr4), iEEStJEES, (5.8)
Г£ = Р\в& ехр (- pr4), iEES\i(£S,jeE S, (5.9)
Г£ в АЩЩехр(-р^), iE5,/G5', /gt A (5.10)
Значения А\ и 5^ можно получить обычным образом, подставляя
(5.8) и (5.10) в (5.1) и (5.2). Третье уравнение можно разрешить
§ 5,3. ОГРАНИЧЕНИЯ НА АВТОМОБИЛЬНЫЕ СТОЯНКИ. . ДО7
относительно Рг, но, как обычно, чаще всего значения рг будем
получать в результате процесса калибровки. Имеем
AIQI [ 2 ВЫ exp (- prC£) + S Щ exp (_ ?(%)] = Qru
В & [ 2 S itftf exp (- P'Cfo + S PI exp (- prC&)] = Dif
tes г ies'.i^ss
где в каждом уравнении введены обозначения
ехр(-р[С&)= S ехр(-рЧ),
KGM(r)
как в гл. 2 (см. уравнение (2.42)). Тогда
А\ = [ 2 ВД exp (- РГС[,) + 2 Щ exp (- Р^)]"1, (5.11)
#,• = [ 2 2 AlQlexp(- prC£) + 2 2P\exp(- prC£)]"х. (5.12)
Интуитивно ясно, что в качестве характеристик
производительности и привлекательности зон, внешних для £, надо использовать
число работающих и число рабочих мест. Тогда различные члены
в правой части уравнений (5.11)jh (5.12) будут одного и того же
типа. Но это можно слегка видоизменить, и тогда величины Р\ и
jRj» или, по крайней мере, максимальная из них, будут выступать
в качестве параметров модели. Такие, а также сходные с ними
усовершенствования, можно ввести, чтобы улучшить совпадение
модели с любой информацией по поездкам T\j или другим укрупненным
показателям для i ЕЕ £", / Е S', где либо i, либо /
принадлежат £, хотя изменения, связанные с настройкой модели, надо
проводить с соответствующими обоснованиями *).
Заметим, что величины Р\ и Rj можно интерпретировать, как
цели поездок, а приравнивать At или Bj к единице можно только,
если i или / — это внешние зоны. Тогда легко видеть, что модель,
определяемая соотношениями (5.8) — (5.10) и (5.11) — (5.12) в
вычислительном отношении аналогична обычной модели гл. 2.
§ 5.3. Ограничения на автомобильные стоянки
в транспортных моделях
Вначале предположим для простоты, что изучаемая область
замкнута, и рассмотрим обобщенную модель распределения из
% 2.3, которая €ыла получена путем максимизации
Т\
S=ln.
П Г*Г!
i, f, r, 4&t{r)
*) По аналогии с определением £>> предположим, чтоЩ записывается как
Rj и не зависит от г.
108 ГЛ« б. ИНФОРМАЦИОННЫЕ АСПЕКТЫ ЭНТРОПИЙНЫХ МОДЕЛЕЙ
при ограничениях
2 2 t$ = Qi, (5.13)
г к&М(г)
22 2 г£ = я„ (5.14)
22 2 zW = C (5.15)
г j freM(r)
откуда
Т$ - ^T^r»iZ>i exp (- рг4), (5.16)
где Л1 и Bj определяются обычным образом (см. уравнения (2.32)
и (2.33); все остальные уравнения приведены здесь просто для
удобства).
Ввести ограничения на стоянки означает определить то, что мы
обозначим через D* — число притяжений для поездок,
совершаемых по коммуникациям типа к (в данном случае автомобилем) в
зоне /. Полезно сохранить общую форму обозначений на случай,
если аналогичные ограничения возникнут и при других типах
коммуникаций (например, для пропускной способности железных
дорог). Обозначим через Р набор пар (i, к), для которых существует
какое-либо ограничение на стоянки. Это означает, что к
ограничениям (5.13) — (5.15) добавляется дополнительно условие
22Гу=Д* Для (/, ft) «= Р. (5.17)
г г
Теперь необходимо максимизировать лагранжиан 55, где
# = -222 2 1пг?'+2М(г)(#-2 2 т%) +
г j r fceM(r) г j к<=М(г)
+ 2*№~22 2 т$Г)+ 2 rfUtf-S 2 -t$) +
j j r k^M(r) 0', ft)eP г rem(fc)
+ 2Pr(cr-22 2 r?/4). (5.18)
Отметим, что в четвертом члене в правой части уравнения (5.18)
появился новый набор множителей Лагранжа (д|, которые
связаны с уравнением (5.17) для (/, к) ЕЕ Р, и суммирование по г в этом
члене проводится до множеству m (к), представляющему собой
множество тех г, для которых имеется в наличии тип
коммуникации к (множество, «обратное» М (г)). Максимум можно получить,
решив систему
™—о. (/.*)£*.
ij
-^57 = 0, и,*)еР,
у
S 5.3. ОГРАНИЧЕНИЯ НА АВТОМОБИЛЬНЫЕ СТОЯНКИ WQ
откуда получаем
Т\] = ехр (- ^(х) - \f - |Г4) (/, к) ф Р, (5.19)
Г?/ = ехр (- М(1) - Xf - tf - prc^) (/, к) s P. (5.20)
Положим, как обычно
ехр (-^(1)) = AlQl (5.21)
ехр (-Ь?>) = BjDh (5.22)
и подставим уравнения (5.19) и (5.20) в (5.13) и (5.14)
соответственно, откуда и из уравнений (5.21) и (5.22) получим
Аг{ = [% 2 ВДехр(-Рг4) +
i шм(г),
КфР
+ 2 2 Я,Я,ехр(-ц?-ргс&)]-\ (5-23)
; teM(r),
я}=[22 2 ^lexpt-p'cS)!"1, (*,*)£?,
i r keM(r)
5,= [22 2 4<?[ехр(-^-рг4)]_1, (/,*)€= P. (5.24)
i r I;6M(r)
Величины jiy можно получить, подставив (5.19) и (5.20) в
уравнение (5.17), откуда получим
вгр(-|ф-Л,*[2 2 4гда>,ехр(-.рг<$)]-1. (5.25)
i rem (ft)
Оказывается, что удобно оставить (ij в этом виде, а не
использовать преобразования типа (5.21) и (5.22), так как здесь нас больше
интересует стоимость, а не «множитель балансировки». Отметим,
кстати, что конечно, могут интерпретироваться
как стоимости.
В принципе, все параметры модели можно определить
итерационными методами. Выберем начальные значения для fx* и Z?y,
вычислим А\, вычислим Bj, вычислим |ijf и так далее. Другой
выход заключается в том, чтобы провести аппроксимацию, которая,
кстати, позволила бы получить новую интерпретацию [г*.
Отметим, что если в уравнении (5.25) \i* равны нулю, то
формально это уравнение приобретает вид
Л* = 3 S 4[(?[5Аехр(-рг4).
г r&nQt)
Это уравнение характеризует число притяжений поездок в зоне j
с помощью типа коммуникации к, которое дается моделью без
ограничений на стоянки транспорта. Это не означает, что в данном
110"1ГЛ/ 5. ИНФОРМАЦИОННЫЕ АСПЕКТЫ ЭНТРОПИЙНЫХ МОДЕЛЕЙ
случае ограничения полностью отсутствуют, а лишь то, что
единственным ограничением является ограничение на Dj в (5.14),
а ограничение (5.17) — избыточно. При увеличении (д| от нуля
значение D*, очевидно, будет меньше, чем то, которое получается в
модели без ограничений на транспортные стоянки. Это наводит на
мысль, что fly или точнее ц|/Рг можно интерпретировать как
«стоимость» введения ограничения на стоянки D). Другими словами,
получены оценки дополнительных средних затрат на стоянки,
которые необходимо израсходовать, чтобы выполнялось ограничение
на D) • В этом смысле данное понятие имеет очевидное
конструктивное значение для транспортников.
Заметим, что при решении конкретных задач знак равенства в
уравнении (5.17) надо заменить на <^. Но при работе с
подобными неравенствами возникают серьезные проблемы *). На практике
ограничения следует использовать только в зонах, относящихся
к центру города, где без их учета те величины D*, которые имеет
в виду застройщик, заведомо будут превышены. Поэтому, как
правило, можно предполагать, что во всех зонах, где используется
ограничение, имеет место знак равенства.
Предположим теперь, что таких зон сравнительно мало. Тогда
можно утверждать, что значения А\ и Bj в уравнениях (5.23) и
(5.24) при \$, равных нулю, достаточно близки к истинным
значениям. А это уже привычные для нас значения А\ и Bj, и
уравнение (5.25) может быть разрешено относительно ц* с помощью
приближенных значений А\ и Bj.
Таким образом, этот подход, требующий весьма
незначительных вычислительных усилий по сравнению с теми, которые и так
приходится затрачивать, дает вполне разумное описание
последствий введения ограничений на стоянки, которое может
использоваться в градостроительной пракаике.
Отметим, кстати, что сравнение уравнений (5.16) и (5.25)
позволяет записать уравнение (5.25) в виде
ехр (-и*) = DW,
где Г?/ — полное число поездок в зону / с помощью типа
коммуникации к при отсутствии ограничений на стоянки. Поэтому
приближенное («приближенное», так как для оценки Г*/
использовались А\ и Bh полученные в предположении, что \$ = 0)
значение затрат, на которые надо пойти, чтобы добиться выполнения
- -*-) См* Кун* Таккер [1].
§ 5.. ОГРАНИЧЕНИЯ, СВЯЗАННЫЕ С ПЛАНИРОВАНИЕМ Щ
введенных ограничений D* в зоне /, составит
что может оказаться полезным при ручных вычислениях.
§ 5.4. Ограничения, связанные^ планированием
и конечной емкостью
Третья проблема состояла в том, чтобы учесть зоны,
население которых заранее фиксировано (например, в результате
осуществления градостроительных планов). Пусть Zx — множество
зон £, население которых заранее фиксировано, aZ2 — множество
зон I, население которых должно определяться в рамках модели.
Тогда объединение этих множеств
z = z1\jz* (5.26)
и представляет собой множество всех зон. Тот факт, что величина
Pt фиксирована для i Ez Zu может быть представлен ограничением
2 *« = />«, ieZx (5.27)
jeZ
и, как обычно (см. уравнения (4.12) и (4.9))
2j2tf = #y, /eZf (5.2 8
Максимизация In \T\ l Ц Тц\\ даст модель размещения жилья, ана-
*»;
логичную модели Лоури, но несколько измененную за счет
появления уравнения (5.27) (см. раздел 4.4.2 в предыдущей главе).
Максимизируем лагранжиан X, где
Я=:1пГ!-221пГ«! + 2*^(^-2^) +
i j ieZi jez
+ 2 ?42) [Et - S tv) + P (.2 2 r«Ai).
iez iez %&>$&Z
Здесь Я|1}, Яу2) и р — это множители Лагранжа, связанные с
уравнениями (5.26), (5.27) и (5.28) соответственно. Здесь следует
решить систему
совместно с ограничениями (5.26) — (5.28). Уравнение (5.29)
112 ГЛ. 5. ИНФОРМАЦИОННЫЕ АСПЕКТЫ ЭНТРОПИЙНЫХ МОДЕЛЕЙ
дает
— In Ти - Я,Р - Ai2) - $ci} = 0 для i e Zx
и
— In TfJ — %f — $си = О для iG Z2.
Тогда
Ти = ехр (- tf> - а)2) - pcw), i e Zx (5.30)
и
7« = exp (- bf - peM), i e Za. (5.31)
Как обычно
exp(— a|j)) = AiPt, i(BZlt
exp (- Af ) = BjEj, j e Z,
и модель, описываемая уравнениями (5.30) и (5.31),
переписывается в виде
Ти - AiBjPtEj exp (- fa,), i ЕЕ Zlt
27, = ад exp (- pciy), * ЕЕ Za,
где
4 = [ 2 адехр (- Рсц)]"1 , i ЕЕ Zb
*; = [ 2 APi exp (- Pctf) + 2 exp (- p^)]-1, / e Z.
Заметим, что в каждой зоне с фиксированным населением
появляется Ai, a Bj, как обычно, входит в выражение для каждой зоны.
Этот результат можно объединить с тем, который был получен
в гл. 3, и применить к модели размещения жилого фонда из
раздела 4.4.2: для измерения и описания относительной
привлекательности зоны i вводятся величины V?
Ти = AiBjPtVfEj exp (-Pc„), i e Zlf
Ти - VfBjEj exp (-Pcw), i 6E Z2,
где
Л, = [ 2 Д/^ exp (- JJcy)]-1, JEZb
iez
i?,= [ 2 iifPiJT1 exp (- pC|i) + 2 V? exp (- ре*,)]'1, / e= Z.
Но если в качестве У? принять существующий размер зоны, то для
i e Zx можно положить Vf = 1, так как там этот эффект учтен,
а для i Ez Z2 положить V? = Р* (или какой-либо аналогичной
величине). Эти уравнения придется решать с помощью итерационных
методов, если только значения Pt, использованные вместо Vf, не
относятся к предыдущему периоду времени.
S 5.4. ОГРАНИЧЕНИЯ, СВЯЗАННЫЕ С ПЛАНИРОВАНИЕМ ИЗ
Довольно близкая проблема, как и в случае ограничений на
стоянки, это учет ограничений, связанных с конечной емкостью.
Это проблема определения количества населения, которое может
вместить каждая зона. Она нетривиальна, поскольку ограничения
имеют вид неравенств, а не равенств. Пусть Р^ — потенциальная
емкость зоны it тогда эквивалент уравнения (5.27) есть
2^<РР. (5.32)
Обычный метод учета емкостных ограничений в элементарных
моделях размещения заключается в сравнении 2^tj и Pi°\ и, если
з
неравенство (5.32) нарушено, то избыток перераспределяется
между другими зонами в соответствии с каким-либо правилом (либо
пропорционально количеству населения, либо пропорционально
темпам роста). Если и во второй раз ограничения нарушаются
(в других зонах), то процесс повторяется, и так до тех пор, пока
все емкостные ограничения не будут удовлетворены. Сложность
этого метода состоит в том, что окончательное решение не является
равновесным в том смысле, что получающиеся значения Ttj не
удовлетворяют основным уравнениям. Довольно трудно выяснить,
какие выводы о поведении индивидуумов можно сделать из такой
процедуры. Если ограничения не очень жесткие и применимы лишь
к нескольким зонам, то эти замечания практически
несущественны, а в противном случае следует воспользоваться другими
методами.
Одна из возможностей — это использование модели линейного
программирования. При этом двойственная задача обеспечит,
помимо всего прочего, «стоимости» размещения, определяемые
емкостными ограничениями *). Но здесь возникает обычное
осложнение, связанное с тем, что довольно трудно задать целевую
функцию.
Вторая возможность заключается в том, чтобы найти
применение только что полученным результатам при заранее
определенных численностях населения в ряде зон. Пусть после некоторой
итерации ограничение (5.32) нарушено для некоторых зон. Тогда,
если эта зона достигает полной мощности, то она переходит из
множества Z2 в множество Zx на следующем шаге **). Решение,
получаемое с помощью этой процедуры, будет удовлетворять всем
емкостным ограничениям и равновесным уравнениям. Кроме того,
оценка привлекательности тех зон, которые в результате не
достигают полной емкости, не будет завышена.
*) См. Стивене [1].
**) Эта процедура использовалась для моделирования в работах
Бэтти [1].
Глава 6
ИСПОЛЬЗОВАНИЕ ЭНТРОПИИ ПРИ АНАЛИЗЕ СИСТЕМ
С МАКСИМАЛЬНОЙ ПОЛЕЗНОСТЬЮ
§ 6.1. Введение
До сих пор нас, в основном, интересовали величины,
описывающие пространственное взаимодействие, такие как Ttj — число
поездок на работу из зоны i в зону ;'. Цель этой главы состоит в
изучении возможностей использования энтропии в системах другого
рода — в системах с максимальной полезностью. Это
представляет самостоятельный интерес, но кроме того, позволит установить
связь с некоторыми общими замечаниями гл. 1, а также изучить
формулировку таких систем, как транспортные (в общем случае
городские и региональные системы) в качестве систем с
максимальной полезностью.
§ 6.2. Системы с максимальной полезностью
Хороший пример системы с максимальной полезностью имеется
в теории потребительского спроса *). Обычная формулировка для
одного потребителя имеет следующий вид. Пусть хг, х2, . . .
.. ., xn **) — количества товаров 1,2,..., N, покупаемых
потребителем по ценам р19р2, - • *,Pn, исходя из общего бюджета /.
Потребитель максимизирует функцию полезности
и = и (хи х2, . . ., xN, I) (6.1)
при бюджетном ограничении
2ад-/. (6.2)
i
Определим лагранжиан X
% = и (хи Х2,..., XN, I) + А, (/— 2 Pi^i) , (6.3)
i
*) См., например, Хендерсон, Куандт [1], Самуэльсоц [1].
,**) Отметим, что в нашем анализе всегда можно считать, что,^ — это
«деньги», a xv х2> . . .э хм-г — интересующие потребителя товары.
§ 6.2. СИСТЕМЫ С МАКСИМАЛЬНОЙ ПОЛЕЗНОСТЬЮ Ц5
где X — множитель Лагранжа, связанный с уравнением (6.2).
Тогда, проводя обычным способом максимизацию, получаем,
что приобретаемое количество товара' i является решением
системы
Щ - *Л. (6.4)
Это решение может быть записано в виде
Ъ = Щ (Рх, р2, . . ., pN, I). (6.5)
Выражение (6.5) обычно называют функцией спроса товара i.
Можно показать также, что при заданном уровне полезности й
■жг| - = Xi- (6'6)
Это уравнение обычно используется для оценки влияния
изменений цен на доход потребителя*).
Эти вычисления можно повторить для всего набора
потребителей. Для потребителя к уравнения (6.1), (6.2), (6.4), (6.5) и (6.6)
переписываются в виде
«w = »«(4fc),4ft),...,4),/w),
£*?>* = /<» |^- = *<wPi, 4S) = 4k)(PbP2,...,Piv,/w)
? г
И
«Pi
= х?\ (6.7)
lu(*)=uW
где используются очевидные обозначения. Теперь можно
определить
в качестве общественного дохода, а
ft
будет совокупным спросом на товар ц при соответствующих
условиях уравнение (6.7) можно просуммировать по к. Тогда
ж-*,; (6-8)
Уравнение (6.8) по форме записи совпадает с уравнением (6.6).
Поэтому при определенных условиях уравнения (6.1)]— (6.6)
""" *) См. Вильсон, Кируан [1].
116 ГЛ. 6. АНАЛИЗ СИСТЕМ С МАКСИМАЛЬНОЙ ПОЛЕЗНОСТЬЮ
могут интерпретироваться как уравнения, описывающие одного
потребителя или группу потребителей в системе с максимальной
полезностью. Условие, при котором можно совершить переход от
одного потребителя к группе, является жестким, но сейчас это нас
не интересует. Далее под системой с максимальной полезностью
всегда будут пониматься уравнения (6.1) — (6.6), но следует иметь
в виду, что в экономическом смысле это весьма сильное упрощение
ситуации.
§ 6.3. Использование энтропии при анализе систем
с максимальной полезностью
Чтобы определить энтропию интересующей нас системы, нужно
ввести подходящие переменные величины. В гл. 1 было показано,
что понятие энтропии связано с распределением вероятностей.
Весьма поучительно вспомнить, как проводилось построение
выражения для энтропии систем в предыдущих главах. Рассмотрим
транспортную систему, где Ttj — число поездок из зоны i в зону /.
Полное число поездок
г j
всегда считается фиксированным и заданным. Энтропию можно
определить любым из следующих способов:
Я«1п(7!/Ш1г«!), (6.9)
1 i j
S =-Ъ^ТцЫТц, (6.10)
* i
^ = -SS/>iiinpi,-, (б.и)
* 3
где
т..
г]
Pi) = -JT >
и Pij могут интерпретироваться в качестве распределения
вероятностей. В этом случае было показано, что все эти способы
определения энтропии эквивалентны.
Теперь вернемся к системе с максимальной полезностью,
рассмотренной выше в § 6.2. Первая проблема состоит в том, что
величины х1у х2, . . ., xn могут измеряться в различных единицах.
Поэтому очевидные аналоги выражений (6.9) — (6.11) не могут
интерпретироваться в качестве энтропии. Даже если ввести
относительные единицы
2/i = -J-' <6-12>
§ 6.3. ИСПОЛЬЗОВАНИЕ ЭНТРОПИИ
117
где
х=%хь (6.13)
г
то отнюдь не ясно, что
S=-%yilnyi (6.14)
г
является подходящей мерой энтропии, потому что значение х не
является фиксированным.
Подходящая фиксированная величина в этом случае есть /.
Определим
х.р.
27. = -211
Уг — j »
как часть дохода потребителя, которую он тратит на товар i.
Теперь уравнение (6.14) может служить мерой энтропии. Если
принять это определение, то уже неважно, что xt измеряются в
различных единицах. Введенные таким образом величины yt имеют
некоторые общие черты с рыночным участием *).
Теперь система с максимальной полезностью может быть
описана в терминах yt следующим образом:
Функция Лагранжа имеет вид
55 = H + X(l-S»i). (6.17)
i
Дифференцирование ее по yt приводит к следующей системе
уравнений:
да =Я, i = 1,2,..., N, (6.18)
., PN, I) (6.19)
(6.20)
Легко проверяется, что уравнения (6.15)—(6.20) описывают
ту же систему, что и уравнения (6.1) — (6.6). Добавление
уравнения (6 Л 2) к бюджетному ограничению в качестве дополнительного
*) См. Блэкберн [1].
откуда
и
ду{ -"' •-i»4
Уг ^ Уг (Pit P2, • •
д! 1 __У£
dp* - Pi
118 ГЛ. 6. АНАЛИЗ СИСТЕМ С МАКСИМАЛЬНОЙ ПОЛЕЗНОСТЬЮ
ограничения и преобразование уравнения (6.13) также дает
эквивалентное описание, но оно является менее компактным.
Предположим теперь, что для анализа этой системы
используется принцип максимизации энтропии. Выделим ряд ограничений
вида
h (yv V* • • •> У*) - fot * *= 1, . . ., К, (6.21)
где для удобствавсе члены, содержащие уи входят в /fe, а все
остальные — «константы» — в ^fc, и будем максимизировать
энтропию S, определяемую уравнением (6.14) при ограничениях (6.16)
и (6.21). Это означает, что сформировав лагранжиан в виде
a = «s + ^(i-S»i)+Sii*(erk-/k).
г fe
необходимо решить систему уравнений
совместно с уравнениями (6.16) и (6.21). Имеем
-ln»l-l-X-V|ifc-^ = 0f
к *
и, вводя единицу в Я, получаем
lny^-X-^^Ж- (6'22)
* г
Предположим, что все yt, pt и I были правильно заданы и
ограничения (6.21) также были записаны корректно, т. е. yt в
уравнении (6.22) дают правильную модель, которая согласуется с
действительностью. Тогда можно заметить, что задача максимизации
энтропии формально эквивалентна максимизации функции *)
и = £ + 2Мй-/*) (6.23)
к
при ограничении (6.16); поэтому, если рассматриваемая система
является системой с максимальной полезностью, то можно считать,
что функция и, определяемая уравнением (6.23), является
функцией полезности.
*) Проверка того, что максимизация и (уи у21 . . .) из уравнения (6.23)
n
при условии 23 У\ = 1 эквивалентна максимизации и (хи х2, . . .) при усло-
г=1
N
вии У| xtPi ^ ^ предоставляется читателю в качестве упражнения.
§ 6.4. ГОРОДСКИЕ СИСТЕМЫ
119
Если же энтропия S не играет никакой роли в функции
полезности, то это выразится в следующем:
(1) параметры \ik будут столь велики по сравнению с 1, что
величиной S в уравнении (6.23) можно будет пренебречь;
(2) будет столько же ограничений (компонент функции
полезности), сколько и переменных yt; в этом случае систему уравнений
можно непосредственно разрешить относительно yt, не вводя
энтропию. Любую такую задачу можно всегда преобразовать в
задачу максимизации, если есть необходимость в построении функции
полезности *).
Итак, как и следовало ожидать, и при максимизации энтропии,
и при анализе систем с максимальной полезностью (в первом
случае вводятся ограничения и проверяются выводы, а во втором —
вводятся функции полезности и проверяются выводы) в конце
концов будет получен один и тот же ответ. Здесь максимизация
энтропии имеет те же преимущества, что и перед статистическим
подходом. Как уже отмечалось в гл. 1:
а) может иметься некоторая априорная информация об
отдельных ограничениях, накладываемых на yi9 что поможет построить
последовательную картину функции полезности; g£
б) возможна индивидуальная интерпретация ограничений,
(здесь от этого мало пользы, так как индивидуальная
интерпретация составляющих функции полезности возможна в любом
случае);
в) этот подход оказывается полезным при построении
динамических моделей.
§ 6.4, Городские системы как системы
с максимальной полезностью
Рассмотрим транспортную модель, определяемую
уравнениями (2.21) - (2.23) в гл. 2. Пользуясь записью уравнения (6.5),
представим Ttj в виде
где F обозначает фиксированные параметры, такие как Qt и Dj.
Ttj в отличие от Р не являются явными функциями дохода. Тогда
величины
Ы т
могут использоваться в процедурах оценки **).
Отметим, что каждая возможная поездка для каждой пары
(i, j) рассматривается, как отдельный товар. Далее будут
рассматриваться только «транспортные товары».
*) См. Самуэльсон [1].
**) См. Вильсон, Кируан [1].
120 ГЛ.'.б. АНАЛИЗ СИСТЕМ С МАКСИМАЛЬНОЙ ПОЛЕЗНОСТЬЮ
Возможность «покупки» поездки из i в / рассматривается здесь
как возможность покупки одного товара по цене с^. Точно таким
же образом можно рассмотреть покупку дома в зоне i по цене h%
(предполагая для простоты, что все дома в зоне i имеют одну и ту
же цену), как покупку другого товара, а получение работы в зоне
/ с заработной платой Wj можно понимать, как третий вид товара.
Функция полезности индивидуума к в этой ситуации может быть
записана в виде
и* *= ик (х19 х2, . . ., yv y2, . . ., z119 212, . . .), (6.24)
где x^yiiz принимают значения 0 или 1 (так что задача
максимизации становится задачей целочисленного программирования) и
означают соответственно покупку дома, получение работы и
совершение поездки на работу. Можно записать ряд ограничений,
связывающих эти переменные, в том числе бюджетное ограничение и
условие, что все поездки на работу совершаются из дома.
Другой способ формулировки этой проблемы состоит в том,
чтобы постулировать существование трех видов «городских»
товаров — домов, рабочих мест и поездок на работу. Тогда индивидуум/с,
приобретая эти товары в количествах A, w и с соответственно,
получает полезность
и* « и* {h, w, с), (6.25)
где условие неделимости товаров позволяет использовать стоимости
в качестве характеристик приобретенных объемов товаров. Вообще
говоря, более подходит функциональная запись вида
ик j= uk (w — h— с, h, с),
но уравнение (6.25) является достаточно общим и включает в себя
этот вариант. В этом случае наборы величин &if ^и сц можно
рассматривать как «пакеты», в пределах которых предлагаются
товары. Поэтому, если индивидуум к предпочитает жить в зоне if
а работать в зоне у, то его полезность составляет
и* >= и* (hu wj9 ci3). (6.26)
Модели, рассмотренные в этой книге, не строились специально
как модели микроэкономического поведения, хотя они и
допускают такую интерпретацию на вероятностной основе. Нас в
основном интересовало распределение жилья, распределение рабочих
мест, распределение поездок и т. д. Не забывая об этом,
постараемся найти методы объединения двух предложенных
формулировок и изучить дальнейшие взаимосвязи полезности и методов
максимизации энтропии.
Вернемся сперва к функции полезности, заданной уравнением
(6.24). Для каждого индивидуума имеется функция полезности,
определенная в пространстве товаров, которые были выделены, и
§ 6.4. ГОРОДСКИЕ СИСТЕМЫ
121
бюджетное ограничение, представляющее собой гиперплоскость в
этом пространстве. Задача максимизации полезности состоит в том,
чтобы для каждого индивидуума найти поверхность безразличия,
к которой эта гиперплоскость является касательной. Чтобы
упростить рассуждения, предположим, что все индивидуумы имеют
одинаковые бюджетные ограничения. Но при этом будем считать,
что у них различные функции полезности, которые можно записать
в следующем виде:
U ~ U (#!, #2» • • •» Vv У2» • • •> Z1V ^12» • • •» ^1» ^2» • • •/>
где а\ — параметры, которые могут принимать различные
значения для различных индивидуумов. Это эквивалентно
предположению, что функции полезности одинаково зависят от х, у и я,
а все отличия появляются из-за различных значений параметров
а£. Можно теперь обычным способом решить задачу максимизации,
что даст (например, для х{)
Xi~ Xi (hv h2J . . ., wv w2, . . ., clv c12, . . ., au a2,. . .). (6.27)
Задача состоит в определении величины
к
Ее можно определить следующим образом. Предположим, что
каждый параметр at имеет известное распределение вероятностей U (at).
Тогда для каждого значения х% в уравнении (6.27) это уравнение
определяет некоторую поверхность в пространстве параметров,
которую обозначим через А (х[). Пусть F (xi) — вероятностное
распределение xt (индекс к опущен). Тогда F можно определить
по fi следующим образом:
^(*,) = $...$ПЛ(в|)Лч. (6.28)
где интегрирование проводится по поверхности А (хг). Очевидно,
что Xt — XF (х^, где X — общий объем.
Довольно легко увидеть, что даже при достаточно простой
функции и поверхность A (xt) может быть сложной, и интеграл в
уравнении (6.28) будет трудно оценить. Это может частично
объяснить, почему трудно получать городские модели на основе
принципов максимизации полезности (особенно, если учесть, что здесь
рассматривается простейшая ситуация). Те методы максимизации
энтропии, которые рассматриваются в этой книге, накладывают
ограничения непосредственно на такие величины, как хи и
приводят к прямой оценке F (xt). В нашей ситуации эти методы
позволяют получить плотность распределения точек ца бюджетной
122 ГЛ. 6. АНАЛИЗ СИСТЕМ С МАКСИМАЛЬНОЙ ПОЛЕЗНОСТЬЮ
гиперплоскости при любых известных ограничениях на эти
распределения. На рис. 6.1 это показано для еще более простой ситуации
с двумя товарами.
Семейства кривых Sv S2, Ss, . . .,— это семейства кривых
безразличия для индивидуумов 1,2, 3, . . .; АВ — это бюджетная
В хг 8 хг
8 хг
Рис. 6.1.
прямая (везде одна и та же); Pv Р2, Р3 — точки, в которых АВ
касается кривой безразличия. Модель максимизации энтропии
непосредственно устанавливает плотность распределения точек Рг
наМ5 при известных ограничениях. В обычной ситуации, когда
информация о кривых*безразличия отсутствует, это — наилучшая
возможная процедура получения приближенного решения. Это
решение может быть уточнено с помощью методов, рассмотренных
в гл. 1.
Щ Теперь перейдем ко второй постановке задачи, в которой
постулируются функции полезности вида (6.25) и(6.26). Этот вид
функции полезности не очень сильно отличается от предыдущего. Так
как большинство переменных величин в функции (6.24) будет
равно нулю, то можно ожидать, что функциональная форма
зависимости от трех ненулевых величин будет аналогичной функции
I 6.4. ГОРОДСКЙЕ_СИСТЁМЫ 123
(6.25). Но сама форма этой зависимости подсказывает другой тип
модели максимизации энтропии и другую возможную
интерпретацию роли методов максимизации энтропии в теории систем с
максимальной полезностью. Эта альтернатива возникает следующим
образом: выберем для примера некоторую форму записи функции
полезности и предположим, что индивидуум к% предпочитающий
жить Bin работать в /, получает полезность
и и* — dx (wj —hi-- cu) + (фг + a3ciJr
или
ик *=* dihi + a2Wj +jt3ctj.
Предположим, что индивидуумы в результате совершенного ими
выбора получили некий диапазон изменения полезностей со
средним значением й. Пусть Т — полный объем населения, a Ttj- —
как обычно, число людей, живущих в зоне i и работающих в зоне /.
Тогда в качестве ограничения для модели максимизации энтропии
выступает условие
3 2 T{i {ajii + bio, + a3Cijy= Тй. (6.29)
г j
Обычная процедура максимизации энтропии приводит к
следующему выражению:
Ту _ ехр [— а (аД + a2wj + агс^)\
г j
где а - множитель Лагранжа, связанный с уравнением (6.29).
Это можно переписать в виде
Ti5 ехр (- Щ - pw. - рс^.)
т 2Sexp(-ui-^-^)'
(6.30)
г j
где Я, ц и р определены через a, av a2 и а3 *)•
Легко проверить, что модель, определяемая уравнением (6.30),
может быть получена при ограничениях
22г«л, = я, (6.31)
22?>, = ^, (6.32)
* i
22^i,- = с, (б.зз)
г j
*) Такая форма совместной модели размещения жилого $онда и распре^
вния ]
Вильсон
деления рабочих мест была предложена в более ранней работе автора (см.
аз]).
124 т&- 6. АЙАЛЙЗ СИСТЕМ С МАКСИМАЛЬНОЙ ПОЛЕЗНОСТЬЮ
где X, \i и р будут множителями Лагранжа, связанными с
уравнениями (6.31) — (6.32) соответственно. Обычно коэффициенты
av a2 и а3 в уравнении (6. 29) будут неизвестны. С другой стороны,
X, \i и р можно определить, зная Н, W и С. Эти величины можно
оценить по данным на базовый период с помощью процесса
калибровки. Для получения прогнозов целесообразно предположить,
что существует вполне определенная форма укрупненного
представления функции полезности (6.26)
u^u{H, W, С),
которая представляет собой некоторую общественную функцию
полезности относительно полных затрат на жилье Н, полной
заработной платы W и полной величины транспортных расходов С.
Рассмотренная задача допускает обобщения. Первое из них
состоит в том, что здесь могут быть применены все способы
разукрупнения, которые были предложены для моделей размещения
жилого фонда в гл. 4.
Существует еще один интересный тип разукрупнения, который
пока что в этой книге не рассматривался, и заслуживает
несколько более подробного изучения: разукрупнение территории на
основе уравнений (6.31) — (6.33). Это наиболее целесообразно при
моделировании городской территории, которая меняется довольно
медленно. Легко видеть, что территория, на которой люди живут
или работают* может приближенно выступать в качестве
характеристики таких показателей, как доход. Поэтому уравнения (6.31) —
(6.33) можно изменить в предположении, что известны затраты
Нь на проживание в зоне i» заработная плата Wj в зоне ; и
транспортные расходы Ct i-й зоны. Тогда двойные суммы превращаются
в обычные, и уравнения переписываются в виде
2Г<Ж = Яо (6.34)
i
^Tijiv^Wj, (6.35)
i
SzVtf-c*. (6.36)
i
Уравнения (6.34) и (6.35) можно упростить
Г<У = Т^. (б-37)
i
1^=5- (6.38)
i *
Максимизация энтропии при ограничениях (6.36) — (6.38) приводит
§ 6.4. ГОРОДСКИЕ СИСТЕМЫ 125
к следующему результату:
Н W
Гу = AiBj -jji- -± ехр (- ftey),
где
^=[5j-^fexp(-p«c«)]
и
i
Это уже привычная форма записи модели, но величины Qt и /)/
заменены здесь величинами Ht/hi и Wj/wj. Анализ изменения во
времени величин HJhi и Wj/wj может оказаться полезным при
построении более гибких транспортных моделей.
Кроме того, добавление еще одного ограничения вида
23 ТцСц = С$
г
приведет к модифицированной гравитационной модели *).
*) Аналогичные модели были рассмотрены в работах Эденс [1], Халдер
1], Вильсон [10].
Глава 7
ЭНТРОПИЯ И ФИЗИЧЕСКИЕ АНАЛОГИИ
В ОБЩЕСТВЕННЫХ СИСТЕМАХ
§ 7.1. Введение
До сих пор мы использовали понятие энтропии таким образом,
чтобы охватить наиболее важные проблемы городского и
регионального моделирования. Это означает, что мы определили задачи
моделирования, связанные с городскими и региональными
системами, и не полагались на использование аналогий с другими
системами. Мы имеем основания считать, что это правильный подход,
частично потому, что он наиболее продуктивен, а частично — из-за
опасности неверного использования очевидных аналогий. Но
теперь, пожалуй, имеет смысл в ретроспективе рассмотреть связь
понятий, используемых в данной книге, с так называемой
«социальной физикой». Поэтому мы рассмотрим сперва концепции
«социальной физики», а затем выясним, можно ли полагаться на аналогии,
чтобы продвинуть вперед изучение динамики систем.
§ 7.2. Социальные аналогии некоторых
физических концепций
Начнем с выявления простых аналогий между концепциями
физики и «социальной физики», чтобы воспользоваться этими
аналогиями при ответе на вопрос, на что могут быть похожи
определенные законы «социальной физики». Из анализа рассмотренных
ранее систем очевидным образом следует, что существует близкая
аналогия между стоимостью (или полезностью) и энергией. Важно
согласовать знаки. Рассмотренные примеры позволяют
отождествить стоимость и энергию, но так как транспортные расходы
представляют собой оценку минимальной полезности поездки, то знаки
могут быть произвольными. Транспортные расходы в системе есть
MepaJ[ количества денег, которое система выделяет на транспорт,
т. е. это неплохая мера энергии. В физике существует
двойственность в знаке между энергией и работой. Эти величины имеют
противоположные знаки, поскольку работа есть нечто, что совершает-
§ 7.2. СОЦИАЛЬНЫЕ АНАЛОГИИ ФИЗИЧЕСКИХ КОНЦЕПЦИЙ 127
ся над системой извне. Поэтому мы попытаемся провести
отождествления понятий
(стоимость или полезность, деньги) *= (энергия, работа). (7.1)
Физические понятия, близкие к написанным.в правой части
уравнения (7.1),— это теплота и температура. Теплота — это
специфический вид энергии, которым обмениваются системы,
находящиеся в непосредственном' соприкосновении. Температура — это
свойство равновесной системы. Две системы, находящиеся в
соприкосновении, образуют составную систему, также находящуюся в
равновесии, если температуры входящих в, нее систем совпадают.
Если з'адан набор ограйичений, каждое из которых связано со
средним значением стоимости или полезности, то всегда можно
определить аналог теплоты (расходы или поток полезности) и
соответствующую «температуру» *).
Рассмотрим обобщение системы, введенной в разделе 1.2.2
гл. 1. Известна вероятность^ того, что случайная величина
принимает значение х^ Известно также, что
2Pi = L (7.2)
г
tf[/r(*)]-SPf/r(*i) (7.3)
г
для г = 1 ,. . .,, т. Определим энтропию S в следующем виде:
г
Можно показать, что значения pif доставляющие максимум
энтропии при ограничениях (7.2) и (7.3), получаются следующим
образом (частным случаем этого способа определения pt является
метод раздела 1.2.2).
Построим функцию
Z (Хъ • • • Лт) = S <>ХР {- [ Wl (*i) + • • • + Wm (Xi)]} (7.4)
г
и тогда **)
Pi =: exp {- [Я0 + Vi (**) + • • • + Kfm (**)]}, (7.5)
*) Аналогичное обобщение понятия теплоты рассматривал Джейнс [1].
**) Если ввести функции /$, Fi такие, что
№,>-{;;
если ъ == V;
если i ф V,
т, tm v, I 1» если 7—/'
v*v»={0;
если у Ф 7 '»
и если
128 ГЛ. 7. ЭНТРОПИЯ И ФИЗИЧЕСКИЕ АНАЛОГИИ
где
Я0 = In Z, (7.6)
а остальные множители Лагранжа Ях ,. . ., Хт определяются из
ограничений (7.3), которые^ можно переписать в виде
Г
Отметим, что максимальное значение энтропии для распределения
есть
Яшах = *о + КЕ [Д (x)] + ...+lmE [fm (х)]. (7.7)
Можно изучить возможные флуктуации, используя дисперсию
распределения /г (#), которая равна
Д*/г (х) = Е Ifr (х)]* - {Е [fr {х)\У = -|L In Z.
И, наконец, функция /г может зависеть как от х, так и от других
параметров а19 а2 ,. . ., и можно легко показать, что оценки ее
производных по максимуму энтропии равны
что будет полезно при дальнейших вычислениях.
Теперь будем произвольно менять функции /г (х) так, чтобы
6/r (xt) можно было оценить независимо для всех г и i. Кроме того,
допустим независимые изменения средних значений /г, чтобы связь
между ЬЕ (fr) и Е (б/г) отсутствовала. Тогда вариация в уравнении
(7.6) может быть выражена с помощью уравнения (7.4) следующим
образом: 0
6Х0 = 6 In Z = - 3 ЬКЕ (fr) + %ГЕ (б/г), (7.8)
ъъ
то, например, уравнения (1.1) и (1.2) гл. 1 могут быть переписаны в виде
i j
который совпадает по форме с уравнением (7.3). Уравнение (1.3) уже имеет
такую форму. Теперь уравнением (7.5) можно воспользоваться для
формулировки гравитационной модели. (Подробная формулировка этого результата —
непосредственное получение гравитационной модели с помощью
математического аппарата Джейцса — содержится у Вильсона 6].)
§ 7.2. СОЦИАЛЬНЫЕ АНАЛОГИИ ФИЗИЧЕСКИХ КОНЦЕПЦИЙ 129
и воспользовавшись уравнением (7.7), получаем
6S = 2 К [ЬЕ (/г) - Е (б/г)] = 2 MGr, (7.9)
где уравнение (7.9) определяет Gr как r-ый вид теплоты. Отсюда
видно, что Хг — весовой коэффициент при r-ом виде теплоты,
являющийся, следовательно, r-ым видом температуры. Поэтому
обычно, когда среднее значение энергии Е описывается одним
уравнением, частным случаем уравнения (7.8) является уже
полученное ранее уравнение (1.24).
При любых уравнениях, описывающих средние значения
стоимости или полезности, можно определить тип теплоты и
соответствующую температуру. На примере транспортной системы
могут быть легко проиллюстрированы два типа изменений,
неявно выраженных в уравнении (7.8). Изменения в сети, т. е.
изменения ctj, есть изменения типа Е (б/г), а изменение С, связанное,
например, с общим увеличением дохода, есть изменение типа
8Е (/г). Так как изменения вызваны взаимодействием между
интересующей нас системой и некоторой другой системой, то
создается возможность теплообмена. Позже мы вернемся к этому примеру.
Чтобы получить пример, в котором возникает более одного
вида температуры, рассмотрим элементарную модель размещения
§ 6.4 гл. 6. Предположим, что средняя стоимость жилья в зоне i
есть hi, что принимается в качестве меры удобства проживания в
этом доме, а средняя заработная плата в зоне / есть Wj, и также
отражает удобства, ctj — как обычно, транспортные расходы.
Тогда можно принять
utj = aht + flwj — \icu (7.10)
в качестве полезности проживания в i и работы в у. Заметим, что
это в точности эквивалентно разбиению уравнения (6.29) на три
части для различных составляющих полезности, как отмечалось
в гл. 6, и а, Р и \х представляют собой множители, связанные с
этими частями. Тогда модель размещения принимает вид
Ти = ехр (- к + aht + fiwj - \icu), (7.11)
где hi, Wj, Си — различные типы «энергии», а а, р и \i —
соответствующие «температуры» *). В неравновесной ситуации будет
наблюдаться обмен различными типами «теплоты».
Итак, получено несколько примеров внутренних переменных
в системе, таких как расходы, полезность или население, и
рассмотрены их физические аналоги. Теперь нам понадобятся
внешние координаты, которые описывают городские системы. К этим
*) При выводе уравнения (7.11) множитель Лагранжа, связанный с
уравнением (7.10), был включен в параметры а, р и ц.
5 А. Дж. Вильсон
130 ГЛ. 7. ЭНТРОПИЯ И ФИЗИЧЕСКИЕ АНАЛОГИИ
внешним координатам скорее всего будут относиться физические
характеристики системы, а не «размер» в смысле числа компонент
системы, в том виде, в котором они были определены. Так,
например, «размер территории» (а следовательно, неявным образом,
и плотность) скорее всего будет одной внешней координатой (того
же типа, что и объем физической системы), а «капиталовложения»
в отдельные подсистемы — другой (так, например, ctj, а
следовательно, и С будут частично характеризовать капиталовложения в
транспортные системы). Для изменения значений внешних
координат необходимо затратить работу, и легко видеть, что наилучшая
интерпретация работы1— как раз «капиталовложения»,
порождающие полезность (или энергию), которая характеризуется
расходами населения (внутренними переменными).
§ 7.3. Неравновесное состояние и динамика системы
Выше уже говорилось о необходимости изучения динамики
системы. Существует также необходимость исследования
неравновесных состояний системы, и здесь могут^оказаться полезными
аналогии с физическими концепциями *).
В гл. 1 отмечалось, что одно из достоинств физических
аналогий состоит в том, что они могут оказаться полезными при
анализе динамики системы. Рассмотрим некоторые методы изучения
динамики систем с максимизацией энтропии, а следовательно,
и методы анализа неравновесных состояний.
Во-первых, что означает изучить динамику системы? Одно
из обычных определений динамической системы состоит в том, что
динамическая модель содержит явную зависимость от времени,
поэтому можно выписать уравнения движения, описывающие
изменения системы во времени. В этом случае термодинамику по сути
следовало бы назвать термостатикой, поскольку используемые
там методы больше напоминают методы сравнительной статики,
которые обычно применяются в экономике. Второй закон
термодинамики как в физике, так и при его использовании для анализа
общественных систем описывает направления изменений, т. е.
говорит об увеличении энтропии, но не выражает энтропию как
функцию времени. Именно с этого и следует начать. Физики
находятся в преимущественном положении, поскольку системы,
попадающие в неравновесное состояние, в большинстве случаев
*) Если физическая система не находится в равновесии, то различные
ее части могут иметь разную температуру. Интересно упомянуть в связи
с этим работу Харриса [1], поскольку его параметр |3 (у нас [1,ав физике —
температура) не является постоянным для всех групп населения, а
списывается гамма-распределением. Это что-то вроде температурного
неравновесного режима.
§ 7.3. НЕРАВНОВЕСНОЕ СОСТОЯНИЕ И ДИНАМИКА СИСТЕМЫ 131
довольно быстро возвращаются в равновесие, поэтому обычно им
бывает достаточно анализа старого и нового равновесных
состояний. Время, необходимое для перехода к равновесию, называется
временем релаксации, и для некоторых городских систем оно
оказывается довольно большим. Рассмотрим кратко этот вопрос,
используя лишь соображения, связанные с размерностью.
Простые соображения (см. книгу Хаара *)) позволяют
определить время релаксации физической системы в^ виде т = d/v,
где d — средняя длина свободного пробега, a v — средняя
скорость. Для гелия при нормальных условиях это величина
порядка 10~7 секунды. Если механизм возвращения в равновесное
положение в городских системах связан с распространением
информации о введенном новшестве, то нетрудно показать, что времена
релаксации в городских системах могут меняться от нескольких
часов до нескольких дней при введении нового транспортного
средства и составлять несколько лет при значительных
изменениях возможностей размещения.
Что можно извлечь из классических работ по статистической
механике относительно неравновесных состояний? В ряде работ **)
изучается развитие находящихся во взаимодействии систем. В
работах Хаара***) исследовался процесс возвращения в
равновесное состояние для квантового случая, что позволило получить
ряд результатов, необходимых при анализе классических систем.
Для нас наибольший интерес представляет тот факт, что при
изучении процесса возвращения в равновесное состояние нужно
ввести некоторую скорость, определяющую быстроту совершения
различных обменов ****).
Как может возникнуть неравновесное состояние? Короче
всего на этот вопрос можно ответить так: в результате изменения
внешней координаты системы. Возможные состояния, такие как
транспортные расходы и средние значения переменных величин,
могут быть независимо друг от друга функциями внешних
переменных; таким образом, возможны два вида изменений,
рассмотренные в предыдущем разделе. Но есть и весьма важный третий вид
изменений, с помощью которого в городскую систему может быть
введено неравновесное состояние, причем в физике такая
возможность отсутствует. Это связано с появлением нового состояния или
новых возможностей.
Для конкретности рассмотрим городские транспортные системы
и пример, связанный с появлением всех трех видов неравновесных
состояний, обусловленных изменениями стоимостей сц и средних
*) См., Хаар тер [1].
**) См., например, Толман [1], Ландау, Лифшиц [2*].
***) См. Хаар тер [1].
****) Этот же вопрос, но в другой постановке рассматривался в двух
работах Томлина [1, 2] на основе аналогий из кинетической теории.
5*
132 ГЛ. 7. ЭНТРОПИЯ И ФИЗИЧЕСКИЕ АНАЛОГИИ
транспортных расходов С в гравитационной модели. Здесь
возможны три случая:
i (1) изменение одного или нескольких значений ctj (из-за
внутригородского улучшения транспортной сети или изменения
стоимости проезда);
(2) изменение С (например, связанное с изменением уровней
дохода);
(3) между двумя ранее не связанными областями может быть
построен мост, что создаст новые возможности поездок для
пассажиров (может оказаться полезным считать, что значения с^,
которые раньше были бесконечными, сейчас стали Конечными, но это
уже вопрос математического вкуса).
Прежде чем начать более подробное обсуждение
математических проблем, связанных с изучением процессов возвращения в
равновесное состояние в каждом из упомянутых выше случаев,
следует ввести специальный тип «устойчивого» неравновесного
состояния. В этом случае достигается неравновесное состояние,
которое затем сохраняется так, что неравновесные энергетические
обмены проходят устойчиво. Такие ситуации хорошо известны
в различных физических процессах: сохраняется величина
электрического тока, вызванная разностью потенциалов, поток тепла,
вызванный разницей температур и так далее. В обычной ситуации
такие потоки описываются феноменологическими уравнениями
вида
Ji = L„Xi9 (7.12)
где Jt — ток, Хг — разность потенциалов или температур,
Si La — коэффициент. В двух приведенных физических примерах
уравнение (7.12) представляет собой соответственно закон Ома
и закон Фурье. Такие ситуации могут часто возникать в
городских или региональных системах. Например, правительство
может поддерживать разницу в заработной плате между
регионами, чтобы ввести определенные миграционные потоки. В
физике одновременно могут иметь место несколько таких эффектов,
и уравнение (7.12) обобщается
/i = 2b<Af (7.13)
и можно показать, что
L„ = Ln. (7.14)
Уравнения (7.13) и (7.14) известны как уравнения Онзагера *).
Итак, если в определенных веществах поддерживается разность
температур, то может возникнуть электрический ток —
термоэлектрический эффект. Поток «теплоты» переходит в поток по-
*) В книге Хаар тер [1] эти уравнения выводятся из первых законов
термодинамики.
§ 7.3. НЕРАВНОВЕСНОЕ СОСТОЯНИЕ И ДИНАМИКА СИСТЕМЫ 133
лезности или денег, сохранение финансового стимулирования
устанавливает вполне определенные межрегиональные потоки
товаров. Эти два эффекта скорее всего должны быть связаны через
коэффициенты L0-, причем ненулевые значения Ltj для i =й= /
возникают из-за очевидных взаимосвязей двух процессов. Тогда
эквивалент термоэлектрического эффекта будет состоять в том, что
поддержание разницы в оплате труда приведет не только к
дополнительным потокам людей, но и к потокам товаров.
Теперь попытаемся очертить круг задач математического
характера, которые возникают при описании процесса возвращения
в равновесное состояние. Проще всего начать с рассмотренных
выше изменений типа (1) и (2). Можно легко определить новые
равновесные состояния, а также изменения энтропии и других
величин. Необходимо аккуратно записать внешние координаты
системы и те изменения в значениях или средних значениях
составляющих системы, которые могут возникнуть. Все эти значения можно
определить так, что будут выполнены термодинамические законы.
Это удастся сделать, если наложить на экономические и
социальные факторы, неявно присутствующие в системе, ряд
определенных ограничений.
Рассмотрим систему размещения центров отдыха из § 4.2 гл. 4,
в которой п людей посещают центры отдыха, причем щ человек
посещает центр £, что связано с расходами г(. Известны полные
расходы на отдых пё. Тогда, используя термины щ (а не pt =
= щ/п, как в гл. 4), имеем
2»! = ». (7-15)
и максимизация
2^^ = 718, (7.16)
г
$ = —3*«1пл4 (7.17)
при ограничениях (7.15) и (7.16) дает
п. ехр (— \ie.)
11 2Jexp(-|ie.)
(7.18)
Пусть olj — внешние координаты системы. Тогда известно (см.
уравнение (П.2.21) в Приложении 2 и связанное с ним
обсуждение), что
dS = \mdl + |i S £j **/f (7-19)
где
*> = Е{щ)- (7-20)
134 ГЛ. ?• ЭЙТРОПЙЯ Й ФИЗИЧЕСКИЕ АНАЛОГИЙ
Величины Aj называются внешними «силами», соответствующими
внешним координатам. Они определены в уравнении (П.2.18)
и в последующих уравнениях Приложения 2. Если изменяется
одно из а (отметим, что 8 может меняться независимо от et), то
уравнение (7.19) позволяет определить изменение S (с помощью
уравнений (7.17), (7.18) и (7.20)). Можно определить новые равновесные
положения. Но второй закон термодинамики утверждает, что
dS > 0. (7.21)
В физике AjdoLj представляет собой количество работы,
проделанной над системой, а уравнение (7.21) выражает тот факт, что
полная энергия, потребляемая системой, не может превосходить
проделанную работу. В социально-экономической системе daj —
изменение координаты, a Aj — капиталовложения, направленные
на единичное изменение. Здесь nde — мера количества полезности,
приобретенного системой. Легко видеть, что неравенство (7.21)
может быть нарушено, если неправильно оценить работу,
проделанную над системой. Это показывает, как с помощью разумного
требования — выполнения второго закона — можно ввести
нижние границы на оценку различных видов капиталовложений. Если
провести это последовательно, то представится возможным
вычислить определенные виды неявных затрат.
И в заключение прокомментируем, как можно анализировать
процесс возвращения в равновесное состояние для изменений
такого типа *). При этом весьма существенным является, каким
образом индивидуумы узнают об изменившихся возможностях.
В физике можно постулировать скорости перехода со старого
энергетического уровня на новый. В социальной системе это не
так просто. Рассмотрим три возможных типа изменений.
(1) Пусть в примере о центрах отдыха изменилась одна
величина et. Тогда можно предположить, что через время t некая
часть населения у (t) n узнает об этом изменении и будет вести
себя соответствующим образом. Это означает, что у (t) n человек
распределяется в равновесии, как если бы были получены новые
уровни расходов, а [1 — у (t)] n — так, как если бы ничего не
происходило. Все население, следовательно, не будет в равновесии,
хотя и будет стремиться к равновесному состоянию для всех t,
больших, чем некоторая величина t0. Энтропия будет возрастать
непрерывно. Единственная трудность здесь состоит в выявлении
механизма ознакомления с новыми возможностями. Как,
например, поступить с человеком, который ничего не знает об из-
*) См. Хаар тер [1], где показано, как можно выбрать внешние
координаты а^ чтобы были справедливы уравнения Онзагера (7.13) и (7.14). Тогда
можно записать /;, X* и а; в виде явных функций времени.
§ 7.3. НЕРАВНОВЕСНОЕ СОСТОЯНИЕ И ДИНАМИКА СИСТЕМЫ 135
менении, появляется в центре отдыха, для которого изменилась
величина Bt и узнает, что цена возросла? Любопытно то, что эту
ситуацию может оказаться труднее анализировать, чем изменение
уровня дохода типа (2), где сохраняются все варианты выбора.
(2) Можно аналогично проанализировать изменение е,
скажем, связанное с увеличением дохода. Наиболее часто
встречающееся изменение этого типа больше напоминает медленное
обратимое изменение е -►■ г + del -^ е + d&t + de2, чем внезапное
необратимое изменение. Задача заключается в том, чтобы решить,
как происходит распределение dl, и как ведут себя люди,
получающие это приращение. Можно воспользоваться механизмом,
примененным для изменений типа (1), но у (t) следует определить
более сложным способом, например, как случайную величину.
(3) Весьма вероятно, что в общественных системах будет
довольно часто наблюдаться одновременное наступление изменений
типа (1), (2) и (3), поэтому важно изучить ситуацию (3). Ниже
будет показано, что почти все возможности взаимодействия между
системами связаны с появлением новых возможностей для
индивидуумов, а так как изучение законов часто лучше проводить через
изучение взаимодействия, то будут рассматриваться именно такие
примеры. Небольшой анализ показывает, что можно
воспользоваться методами, аналогичными рассмотренным для (1) и (2). В
каждый момент времени население следует разделить на тех, кто уже
знает о новых возможностях, и на тех, кто еще не знает о них.
Очевидно, что такие же методы "можно применить и для
изучения взаимодействия между системами. Также ясно, и следует
подчеркнуть еще раз, что можно постулировать и исследовать и
другие механизмы распространения информации, необходимой для
анализа неравновесных состояний, помимо того простого
механизма, который здесь использовался.
Другой важной составляющей исследований динамики систем
является изучение изолированных систем, между которыми
возникает взаимодействие. В физике такие ситуации рассматриваются,
чтобы выяснить, какую форму принимают в этих условиях
физические законы. Интерпретация этого для городских систем
представляет самостоятельный интерес. Рассмотрим два города,
которые достаточно эффективно разделены протекающей между ними
рекой и между которыми, следовательно, отсутствует всякое
взаимодействие. Теперь построим через реку мост и посмотрим, что
получится. Предположим, что до открытия моста транспортные
сети описываются величинами щ и c\f. Тогда объединенная
матрица стоимостей проезда до открытия моста записывается в виде
сц
оо
оо
г(2)
136
ГЛ. 7. ЭНТРОПИЯ И ФИЗИЧЕСКИЕ АНАЛОГИИ
После открытия моста бесконечные величины становятся
конечными
1J
Таким образом, для комбинированной системы появились новые
состояния cif) и Cif}.
Нетрудно представить себе, что если \it и ц,2 — температурные
характеристики двух изолированных систем, то температурная
характеристика комбинированной системы будет равна |л, где
Hi < И < ^2,
так как отдельные перевозки в системе с большим значением \х
(большой объем перевозок) заменяется на перевозки в системе с
меньшим значением \i (меньший объем перевозок). Это будет
одним из следствий аналога второго закона термодинамики для
городских систем. В соответствии со вторым законом произойдет
также общее увеличение энтропии.
В заключение отметим, что из-за изменений внешних
переменных могут возникнуть неравновесные состояния; определение
системы очевидно представляет собой важный момент в изучении
динамики. Интересующая нас система будет состоять из большого
числа компонент, а переменные макровеличины, такие как
стоимость и «температура», будут в той или иной форме представлять
собой укрупненные описания входящих в отдельные компоненты
переменных величин; поэтому наблюдается тесная связь между
макро- и микроописанием интересующей нас системы. Следует
также отметить, что в каждой конкретной подсистеме мы можем
рассматривать лишь подмножество переменных модели. Так, в
гл. 2 изучались только городские жители и их поведение при
поездках на работу. (Поэтому и утверждалось, что необходимым
предварительным условием построения динамической модели
совокупного поведения является построение динамической модели для
макровеличин, таких как С.) Важно также иметь в виду, что
внешние координаты интересующей нас системы могут быть
внутренними переменными в другой системе (или системах),
которые взаимодействуют между собой, поэтому проблема описания
переменных и внешних координат тесно связана с проблемой
взаимодействия подсистем. Прежде всего следует уяснить, что
если необходимо обеспечить требуемую точность при определении
переменных величин и внешних координат в городских и
региональных системах, то существующий математический аппарат,
большая часть которого продемонстрирована в этой книге, может
помочь в исследовании динамики системы,
Приложения
1. ЭНТРОПИЯ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ
Мы хотим, чтобы величина S (рг ,. . ., рп) представляла собой
«неопределенность», связанную с распределением вероятностей
Ри Pi >• • •> Рп- При этом должны быть выполнены следующие три
условия *):
(1) S — непрерывная функция pt.
(2) Если все pt равны между собой, то
Ato=s(-T-~'ir)
есть возрастающая фукция п.
(3) Пусть имеет место различная группировка исходов, и
пусть
ы>1 = Pi + Рг + • • • + Ръ
и>2 = Рн+1 + . . . + Рт и так далее.
Тогда Pi\wx, p2 I w2 ,. . . — условные вероятности исходов (х19
х2 >• • • » #к)>- • • • Требуется, чтобы выполнялся следующий закон
композиции:
S (Pi, Pi ,. . ., рп) = S (wl9 w2 ,...)+ Wi$ (Pi I Wi> p2 \wl9. . •)+
+ W2S (pfc+1 | иъ ,...) + •• •
Из условия (1) следует, что нужно определять S только для
рациональных значений ри
г
где щ — целые числа.
Можно считать, что налицо следующая ситуация: xt может
п
реализоваться щ раз при 2 п% равных возможностях. То есть
г=1
можно рассматривать наши «исходы» хх, х2 ,. . . как
составные исходы, состоящие из пъ п2 ,. . . одинаковых альтернатив.
*) См. Джейнс [1].
J 38 ПРИЛОЖЕНИЯ
Поэтому из условия (3) вытекает, что
S (Pi.ft, • • • , А.) + %PiS (Щ) = S фЙ1). (П.1.2)
В частности, можно считать, что все щ равны т, тогда уравнение
(П.1.2) приводится к виду
А (т) + А (п) = А (т/г).
Тогда можно показать *), что единственная функция,
удовлетворяющая этому соотношению и условию (2), есть
А (п) =klnnt (П.1.3)
где
&>0.
Подставляя уравнение (П.1.3) в уравнение (П.1.2), получаем с
помощью уравнения (П.1.1)
S(Pi,Pb • • • ,Рп) = *1п (ЦлЛ — к^р^пщ = — k^Pilnpi.
\ г / i г
2. ТЕОРИЯ АНСАМБЛЕЙ
П.2.1. Введение
Метод максимизации энтропии фактически приписывает
равные вероятности всем состояниям, которые не исключаются
априорной информацией. Обычные результаты статистической
механики, в частности распределение Максвелла — Больцмана,
могут быть получены, если считать, что f (х) в уравнении (1.10)
представляет собой возможные значения энергии системы. Метод
вычислений, который чаще всего используется в статистической
механике, это метод ансамблей Гиббса **). Ансамбль — это
перечисление возможных состояний системы, которым
впоследствии приписываются равные вероятности, а средние значения
переменных получаются путем усреднения по всему ансамблю.-
Теория ансамблей дополняет метод максимизации энтропии и
имеет большое значение для «социальной физики», показывая,
как можно исследовать представление различных систем теми
или иными типами ансамблей. Эти два подхода, конечно,
эквивалентны, но в ряде случаев одним из них бывает легче
пользоваться, чем другим. В физике различные ансамбли описывают
различные физические системы, и имеет смысл детально изучать
физические аналогии, чтобы понять, как строятся теории город-
*) См. Хинчин [1].
**) См., например, Гиббс [1].
2. ТЕОРИЯ АНСАМБЛЕЙ
139
ских систем. В физике, если некоторый ансамбль описывает
интересующую нас систему, то он называется представительным
ансамблем.
Вообще говоря, нас будет интересовать так называемая
классическая статистика (или статистика Больцмана), так как
компоненты, входящие в городские системы, можно считать
различимыми в отличие от атомов и молекул в физике. Это приложение
основано на работах по статистической механике Толмана и Ха-
ара *), хотя многие методы, которые в этих книгах применяются
в квантовом случае, здесь*переработаны для классического
случая и применяются для решения простой задачи из области
общественных наук. Физик может считать, что это шаг назад!
Наша основная задача будет состоять в формулировке макро-
и микроскопической точек зрения на городские системы, и в этом
разделе будут установлены определенные связи между этими
точками зрения для различных ансамблей. Физик обычно больше
интересуется макроскопической точкой зрения и связью
статистической механики с термодинамикой, а специалиста по городским
системам микрораспределения интересуют ничуть не меньше, если
не больше (соответствующие приложения рассмотрены в гл. 7).
Общая теория ансамблей связана с понятием фазового
пространства и уравнениями движения соответствующей системы.
Стоит кратко остановиться на этом. Из вышесказанного следует,
что ансамбль представляет собой множество реализаций
интересующей нас системы, причем каждая реализация соответствует
одному возможному состоянию системы. Затем этим состояниям
априорно приписываются равные вероятности. Например, пусть
система состоит из многих компонент (частицы газа в сосуде или
индивидуумы, совершающие поездки в городе). Здесь имеется
множество переменных, значения которых полностью описывают
"состояние системы. Это множество переменных обычно составляется
из подмножеств, причем каждое отдельное подмножество состоит
из переменных, связанных с некоторой компонентой. Минимальное
число переменных, необходимое для^описания состояния системы,
представляет собой число степеней свободы системы.
Пространство, связываемое с множеством таких переменных, называется
фазовым пространством (^-пространство для всей системы,
включающее в себя все переменные, или (^-пространство для переменных,
входящих лишь в одну какую-то компоненту). Таким образом,
точка в фазовом пространстве представляет собой возможное
состояние системы, а плотность точек в фазовом пространстве
можно рассматривать как вероятностную меру. Переменные,
описывающие физическую систему, обычно записываются канонически
сопряженными парами qt, рь 1 = 1, . . ., N, где N — обычно
•) См. Толман [1], Хаар тер [1].
140 приложения
большое число. Поэтому p(g,p, t) можно определить как плотность
точек в фазовом пространстве для интересующей нас системы, где
q обозначает все qb р — все ph a t — время.
Есть две причины, оправдывающие отход от основной темы,
чтобы остановиться на описании и анализе систем в классической
физике: во-первых, необходимо понять, как на определенном
этапе надо подходить к описанию соответствующей городской
системы, а, во-вторых, при использовании концепции энтропии это
описание вместе с уравнениями движения ничего не добавляет к
результатам статистической механики и термодинамики, которые
можно получить, непосредственно пользуясь энтропией. Весьма
возможно, что подобные утверждения для городских систем
справедливы, и нам не нужно непосредственно выписывать
уравнения движения, а искать какой-то другой способ построения
динамических моделей. В классической физике состояние системы
описывается набором координат частиц qi и их скоростей сА.
Энергия системы (обычно считается, что для интересующих нас
систем, а именно консервативных, она явным образом не зависит
от времени) состоит из двух частей — кинетической энергии
Т (q, q) и потенциальной эн(ергии V (q). Тогда гамильтониан
системы можно представить в виде полной энергии
Н = Т + V.
Но оказывается, что удобнее описывать систему канонически
сопряженными парами переменных qt и piy где pt заменяет сл и
определяется по формуле
дТ
Теперь можно записать Я, как функцию q и р, а вся система
записывается очень компактным образом. Уравнения движения
имеют вид
дн
Рг =
**«
И
. дН
Сл~~~ др.'
Теперь возьмем любую величину/, которая может быть выражена,
как функция р и q. Ее уравнение движения принимает вид
где {/, Н) называется скобками Пуассона и определяется
2. ТЕОРИЯ АНСАМБЛЕЙ
141
уравнением (П.2.1). Среднее значение / есть
&{f) = lf(Q,P)p(q,p)dqdp
в момент времени t, если плотность фазового пространства р
определена так, что
pdqdp = 1.
Можно показать также, что
что совпадает по форме с (П.2.1), но имеет противоположный знак.
Фактически ансамбль представляет собой перечисление
состояний системы и поэтому при непрерывном изменении определить
ансамбль означает задать форму р (которая, как уже отмечалось
ранее, является плотностью вероятности).
В физике обычно рассматриваются так называемые
стационарные ансамбли, поэтому
откуда вытекает, что р может зависеть лишь от постоянных
составляющих движения. Поэтому, если Е - энергия интересующей нас
системы, то
Р> Р (Е).
Этот вывод часто используется в качестве основы
статистической механики, и различные ансамбли определяются путем
задания вида зависимости р (Е). Применительно к городским
системам вопрос о стационарности соответствующих ансамблей остается
открытым.
Теперь стало очевидным, что удалось получить, церейдя в
область классической физики:
(1) Показано, как физическая система описывается
канонически сопряженными координатами, как с помощью
гамильтониана можно записать уравнения движения (посредством записи
энергии через q и р) и как можно исследовать поведение плотности в
фазовом пространстве. Можно исследовать эти аналогии для
городских систем и получить о них более_ четкое представление.
(2) Джейнс указал, что большая часть этого описания и
анализа для получения результатов статистической механики и
термодинамики не нужна, и можно предположить, что то же самое
справедливо и для городских систем.
Заметим также следующее:
(3) Эквивалент основных математических - выкладок для
непрерывного распределения вероятностей в точности аналогичен
142
ПРИЛОЖЕНИЯ
дискретному случаю, который использовался Джейнсом; хотя
впоследствии будут приведены результаты только для дискретных
распределений, обобщения на непрерывный случай достаточно
очевидны.
Определим энтропию р (д, р) как — \ р In p dq dp ирешим
вариационную задачу нахождения величины р, максимизирующей
S = — J p ln'p dq dp)
при ограничениях
р dpdq = 1
и
^ рЕ dp dq = E.
Это дает
р s= ехр (— Я — \iE). (П.2.2)
Отметим, что в классической физике, как уже отмечалось,
энергия играет особую роль из-за своей связи с гамильтонианом.
Используя подход теории информации, который использует в
качестве центральной концепции энтропию, а не энергию, легко
убедиться, что ситуация меняется. Это особенно полезно для
городских систем, поскольку здесь не предполагается, что энергия
будет играть такую же особую роль, что и в физике (см. гл. 7).
Теперь перейдем к последовательному обсуждению на простом
примере различных видов ансамблей с помощью дискретного
формализма.
П.2.2. Микроканонический ансамбль
Для ясности может оказаться наиболее целесообразным
определить и обсудить различные ансамбли на конкретном примере,
поэтому сперва необходимо сформулировать этот пример. Мы
будем пользоваться системой размещения центров отдыха,
рассмотренной в § 4.2. гл. 4. Система включает в себя город с п жителями,
которые в данный выходной день хотят выехать в некоторый центр
отдыха. Будем считать, что имеющиеся в их распоряжении
центры отдыха предназначены исключительно для жителей этого
города и что расходы индивидуума на пользование i-ым центром
(например, расходы на поездку плюс плата за пользование)
составляют 8^. Считается, что эти расходы не зависят от места
жительства индивидуума в городе. Известны средние расходы ё
и все ег-. Какова наилучшая оценка пи числа жителей,
выезжающих в i? В этом разделе будет построен микроканонический
ансамбль, описывающий данную систему.
2. ТЕОРИЯ АНСАМБЛЕЙ
143
Характеристика микроканонического ансамбля состоит в том,
что имеется фиксированное число индивидуумов п и
фиксированные полные расходы Е j= гсё. Это значит, что система является
изолированной, и так как п и пг — единственные
макропеременные, являющиеся к тому же постоянными, то с макропозиций об
этом ансамбле трудно что-либо сказать: все состояния в
макроансамбле имеют одинаковые макрохарактеристики. А вот с
микропозиций можно узнать уже больше, пытаясь ответить на ранее
заданный вопрос: каково наиболее вероятное распределение щ?
Так как
]8*i = ». (П.2.3)
г
то, если определить
Pi=!T> (П.2.4)
имеем
2л = 1. (П.2.5)
г
Следовательно, величиныpt ведут себя, как распределение
вероятностей. Априорная информация частично представлена
уравнением (П.2.3), а следовательно, и уравнением (П.2.5), и
частично— средними расходами в виде
2)яф = гае,
г
что можно переписать как
S/¥4 = e (П.2.6)
г
с помощью уравнения (П.2.4). Здесь pt можно понимать, как
вероятность того, что один индивидуум совершает поездку в и
Но теперь можно определить энтропию распределения
вероятностей по формуле
S = -%PilnPi (П.2.7)
г
и решить задачу ее максимизации при ограничениях (П.2.6),
(П.2.5). Уравнения (П.2.5), (П.2.6) и (П.2.7) имеют ту же форму,
что и уравнения (1.11), (1.10) и (1.12) соответственно, поэтому
наиболее вероятное распределение есть
Р,=-^- = ехр (-*,-,«,), (П.2.8)
где
ехр К = Z = 2 ехр (— ^). (П.2.9)
144 приложения
Интересно рассмотреть более традиционные рассуждения *).
Определим вектор nt как состояние системы и поставим вопрос:
какова плотность вероятности в -у-пространстве состояний
(фазовом пространстве системы)? То есть, какой объем фазового
пространства приводит к тому же самому состоянию системы, и каково
наиболее вероятное состояние? Элементы ^-пространства состоят
из произведений элементов ц-пространства (фазового
пространства подсистемы). Тогда можно легко показать, что объем 7"ПР°-
странства, соответствующий состоянию nh пропорционален
величине
^K)=TrV. (П.2.10)
i
Если так, то наиболее вероятное состояние получается в
результате максимизации In P при ограничениях (П.2.5) и (П.2.6),
записанных через nt
S^i = га,
г
г
С помощью приближенной формулы Стирлинга
In N\ *= N In N - N, (П.2.11)
справедливой для больших N, легко показать, что получается
результат, записанный уравнениями (П.2.8) и (П.2.9). Поскольку
результаты одинаковы при максимизации любых монотонных
функций, здесь для удобства максимизируется In P, а не Р. Между
In P и энтропией S, определенной выше, существует тесная связь.
Преимущества использования энтропии в качестве первичного
понятия, как в первом методе, состоит в том, что, хотя результаты
и совпадают, но первый метод не зависит от справедливости
формулы (П.2.11).
Существует и третий способ проведения вычислений, который,
пожалуй, стоит отметить. Пусть Р (щ) в уравнении (П.2.10) —
вероятность осуществления исхода щ. Тогда можно оценить
среднее значение случайной величины щ по формуле
Е (щ) = -^ .
Эту величину можно оценить с помощью интегрирования по кон-
*) См., например, Толман [1].
2. ТЕОРИЯ АНСАМБЛЕЙ
145
туру, и этот метод носит название метода Дарвина — Фаулера.
Этот метод изложен в Приложении 4, где получаются такие же
результаты. Интересно отметить, что эти методы напоминают
методы теории вероятностей, и может оказаться полезным
отождествить вычисляемые здесь средние значения со средними
значениями случайных величин в некотором стохастическом процессе.
Итак, что же удалось узнать, используя понятие
микроканонического ансамбля? С одной стороны в макросмысле он не
представляет систему, которая могла бы вызвать к себе повышенный
интерес, поскольку является полностью изолированной. Однако,
с другой стороны, если встать на позиции микроанализа, то
существуют три подходящих типа вычислений, которые приводят к
полезным и идентичным результатам.
П. 2.3. Канонический ансамбль
Теперь построим канонический ансамбль, описывающий
систему, определенную в вышеприведенном примере. Канонический
ансамбль получается из микроканонического ансамбля, если
допустить возможность изменения полных расходов в системе.
Пусть Е — полные расходы на отдых; в разделе П.2.2 следовало
полагать
Е = т = const.
Теперь же необходимо, чтобы расходы Е менялись; поэтому
перенумеруем возможные состояния полных расходов с помощью
индекса i так, чтобы величина Et представляла собой эти
возможные расходы, предполагая, конечно, что такое перечисление
возможно. (Здесь стоит отметить, что без потери общности можно
считать, что Е% — множество дискретных уровней. Было показано
ранее, что выкладки можно проводить аналогично и в непрерывном
случае.)
В этом случае возникают различные возможные
макросостояния, и, в отличие от использования р% в разделе П.2.2, определим
теперь pt как вероятность того, что вся система имеет полные
расходы Et. Будем пользоваться для микрораспределений
обозначениями, основаниями на величине Р (щ), вероятности того, что
щ индивидуумов находятся в микросостоянии U Тогда для всей
системы имеем
2л = 1. (П.2.12)
г
2iPiEi = E, (П.2.13)
г
S =-2 Pi In Рь (П.2.14)
146
ПРИЛОЖЕНИЯ
где Е — (известное) среднее значение Et. Как обычно,
максимизируя S при ограничениях (П.2.12) и (П.2.13), имеем
Pi ^=ехр(-Я- цЯ,), (П.2.15)
где
ехр X = Z = ^ехр (— fi^). (П.2.16)
Заметим, что между функциями, определяемыми уравнениями
(П.2.9) и (П.2.16), существует фундаментальная разница. Первая
из них относится к индивидуальным расходам е,-, а последняя —
к расходам всей системы. Более подробно связь между ними будет
обсуждаться ниже.
Теперь нужно провести дальнейшие исследования, чтобы
увидеть какой тип системы описывается каноническим ансамблем,
если полные расходы могут принимать значения Et с канонически
распределенными вероятностями ри определенными из уравнения
(П.2.15). Если в уравнении (П.2.15) перейти к логарифмам, то
вычисленные таким образом значения In pt можно подставить в
уравнение (П.2.14) Отсюда, если воспользоваться уравнением
(П.2.13), видно, что
S = X + уЯ.
Следовательно, максимальное значение энтропии системы завизит
от среднего значения полных расходов, величины X,
представляющей собой логарифм функции разбиения, и параметра \i.
Заметим, что в принципе \i можно найти, решив уравнение (П.2.13),
поэтому система определена, а ее поведение целиком описано
в этом каноническом ансамбле путем задания всех Е{ и их среднего
значения Е. (Эти величины связаны с микропеременными и, в
частности, с перечислением et для всех индивидуумов, но этот вопрос
будет обсуждаться позднее.) Значения этих переменных будут
определяться тем, что можно назвать ограничениями,
накладываемыми на функционирование системы (например, качество
транспортной системы, соединяющей город с зонами отдыха). Эти
ограничения описываются координатами или переменными,
которые будем называть внешними координатами (например, ширина
дорог и так далее). Обозначим эти координаты через хь тогда
Et и Е будут функциями xt, т. е. будут меняться, если меняются
внешние координаты, например, если строится новая дорога.
Можно продвинуть анализ еще дальше, изучая малые изменения
в системе. Так как уравнение (П.2.12) должно удовлетворяться,
то для малых изменений будем иметь
2. ТЕОРИЯ АНСАМБЛЕЙ
147
и, подставив значения pt из уравнения (П.2.15), имеем
S ехр (— X — \iEt) (d\ + \x dEi + Et d\\) = 0,
г
следовательно, если считать, что Et зависят от внешних
координат Х{, ТО
^ ехр (- А, - jitf,) /<& + Ехdp + р ^ ^ Й*Л = 0. (П.2.17)
Теперь определим
4 = --^, (П.2.18)
и величину Х\ будем называть обобщенной силой, действующей
на внешнюю координату хк. (Заметим, что уравнение (П.2.18)
является частным случаем уравнения (П.2.2).) Ниже станет ясно,
что это означает. Среднее значение этой величины обозначим через
Хк, и тогда уравнение (П.2.17) выражается через средние
значения
dX + Е d]x — \л 2 Хк dxk = 0. (П.2.19)
к
Отсюда получаем
dS *= dk + ix dE + E dp, (П.2.20)
и, исключив % из уравнений (П.2.19) и (П.2.20), имеем dS в виде
dS = \idE + \i^lX1(dxlt. (П.2.21)
и
Выражение (П.2.21) может служить основой для формулировки
законов поведения данной системы, представленной
каноническим ансамблем. Формулировка этих законов может быть
проведена по аналогии с законами термодинамики. Проделаем это в
самых общих чертах и в очевидной связи с обсуждением в гл. 7.
Законы термодинамики указывают на следующие свойства
сформулированной системы, ориентированной на размещение центров
отдыха.
Нулевой закон. Утверждается, что система, представленная
каноническим ансамблем, находится в равновесии, и это
равновесие характеризуется параметром \i. Можно показать, что если
осуществляется взаимодействие двух систем с одним и тем же |ы,
то составная система будет находиться в равновесии с тем же \i.
Первый закон. Этот закон показывает, что энергия системы
(в нашем случае полные расходы) увеличится, если проделать над
системой работу (в нашем случае это могут быть дополнительные
капиталовложения, изменяющие отдельные внешние координаты).
148 приложения
Здесь указывается также, что энергия может передаваться от одной
системы к другой, если они находятся во взаимодействии, и такой
поток энергии называется потоком теплоты. Так, в нашем примере,
если с существующей системой ввести во взаимодействие вторую
«систему отдыха», то некоторые индивидуумы могут перевести свои
расходы из одной системы в другую в соответствии с
относительными значениями [л, и это будет эквивалентно потоку теплоты.
Первый закон утверждает, что если принимать во внимание
теплоту, то энергия, или расходы в нашем случае, сохраняется.
Второй закон. Это наиболее известный закон термодинамики,
и он связан с изменениями. Наиболее просто он записывается в виде
dS>0, (П.2.22)
но лучше всего его можно понять, если рассмотреть ряд
примеров для нашего случая.
(1) Если система изолирована, то Е — константа, и хк не могут
измениться (так как они могут быть изменены только кем-то извне,
кто вкладывает капиталовложения или совершает работу). Тогда
из уравнения (П.2.21) следует, что
dS = О,
следовательно, в уравнении (П.2.22) имеет место знак равенства.
Энтропия стремится к некоторому максимальному значению,
связанному с величиной Ё, а потом остается постоянной.
(2) Рассмотрим очень медленное изменение. В этом случае вся
работа, совершаемая над системой (капиталовложения),
поглощается в виде энергии (люди пользуются результатами новых
капиталовложений и рассчитываются за это, увеличивая свои
расходы), следовательно
\i dE = — |л 21 Хк dxkJ
dsy о.
Конечные изменения можно свести к последовательности малых
изменений такого типа, и такое изменение называется обратимым.
(3) При более резком изменении часть работы потеряется
в виде теплоты (некоторые капиталовложения не будут
использованы и не окупятся), в этом случае изменение необратимо, и имеет
место изменение энтропии
dSyO.
(4) В качестве основы нулевого и первого законов был
использован тот факт, что если имеется взаимодействие между двумя
системами, не находящимися в равновесии (с различными \i), то
составная система не будет в равновесии. Второй закон относится
к направлениям изменения. Предположим, что две системы имеют
2. ТЕОРИЯ АНСАМБЛЕЙ
149
равновесные параметры jjlx и ц2- Тогда составная система перейдет
в равновесное состояние с промежуточным параметром |и, и будет
иметь место увеличение энтропии. Пример такого процесса
приводится и обсуждается в гл. 7.
(5) Легко показать, что система, представленная каноническим
ансамблем, находится в равновесии, и ее взаимодействие с
окружающей средой сохраняет значение \i на постоянном уровне. В
нашем примере, так как параметр \х тесно связан с общей
доступностью центров отдыха, это означает, что, если система действительно
ведет себя, как система, представленная каноническим ансамблем,
то доступность сохраняется. Этот результат менее интересен, чем
обладание аппаратом, позволяющим анализировать динамику
развития системы.
(6) В физике показывается, что величина \i обратно
пропорциональна температуре, отсюда легко видеть, что представляет собой
аналог температуры в общественных системах.
Итак, показано, что, представляя систему каноническим
ансамблем, можно исследовать ее динамику. Пока что речь шла лишь
о макроописаниях системы, а теперь следует изучить
микросвойства системы, представленной каноническим ансамблем.
Как и в разделе П.2.2, предположим, что существует nt
индивидуумов с расходами на отдых е(. Вспомним, что величина pt была
определена как вероятность состояния системы, поэтому следует
определить по этим вероятностям величины Р (nt), вероятности
того, что в точности nt индивидуумов имеют расходы Et. Поэтому
где суммирование по к проводится по всем состояниям системы,
в которых имеется щ индивидуумов в индивидуальном центре
отдыха i. Вычисления проведем ниже и увидим, что наиболее
вероятное микрораспределение оказывается в точности таким же, что и
распределение, получаемое с помощью микроканонического
ансамбля. Все выкладки проводятся в разделе П.2.5 после того, как
будут обсуждены вопросы, связанные с большим каноническим
ансамблем.
П.2.4. Большой канонический ансамбль
Для нашего примера канонический ансамбль был построен
как обобщение микроканонического ансамбля, полученное в
результате отказа от условия постоянства полных расходов.
Большой канонический ансамбль представляет собой дальнейшее
обобщение, которое получается, если дополнительно отказаться от
предположения о постоянстве общего числа индивидуумов.
Поэтому вместо фиксированного значения п будем рассматривать
150
ПРИЛОЖЕНИЯ
среднее значение п. Мы должны приписать состояниям системы
метки, соответствующие возможным значениям п. Пусть
состояние системы помечено буквой t, Nt — полное число
индивидуумов в состоянии t, Et — энергия. (Здесь используется
заглавная буква N, поскольку прописная буква отведена для меток
микросостояния. Конечно, п = N.) Тогда, если по-прежнему pt —
вероятность реализации состояния системы, то
г г г
Можно воспользоваться выкладками, приведенными в разделе
1.1.2 в уравнениях (1.10) — (1.13), чтобы показать, что наиболее
вероятное распределение есть
Pt = ехр (— X — aNt — (j,F*), (П.2.23)
где
м
expX = Z* = 5]ехр(-аЛ^-^). (П.2.24)
Как и в разделе П.2.3 воспользуемся уравнением (П.2.14), чтобы
получить максимальное значение S в виде
S = % + aff + \iE. (П.2.25)
Можно в духе раздела П.2.3 исследовать малые изменения и
обсудить законы поведения в системе, в которой может меняться общее
число индивидуумов. В физике это представление обычно
используется для изучения систем, состоящих из различных
взаимодействующих частиц. Это можно показать с помощью расширения
рассматриваемого примера.
Пусть существуют три вида центров отдыха: один предлагает
услуги А, второй—Л, а третий — комбинированные услуги
А — В. Тогда имеем три системы А, В и С (= А — В), которые
можно объединить в одну систему. Для изучения равновесных
свойств всей системы воспользуемся большим каноническим
ансамблем. Пусть Ni , N{, Ni — возможные объемы населения
подсистем, а Е{, Ef, E°i — полные расходы. Тогда в равновесии
NANB ZA(\x)ZB(\i)
Nc Zc(u) '
где
M|x)=Sexp(-|i£f)
г
есть каноническая функция разбиения подсистемы X. Это
социальный эквивалент закона действия масс, закона химической
композиции и его можно использовать для изучения последствий созда-
2. ТЕОРИЯ АНСАМБЛЕЙ
151
ния центров отдыха со смешанными видами услуг. Другое
применение больших канонических ансамблей приведено в более
ранней работе автора *).
Помимо моделирования систем со смешанным составом
структура большого канонического ансамбля иногда облегчает
вычисления и позволяет получить результаты, которые не могут быть
получены в ансамблях более низкого уровня. Это полезно для
микрораспределений, где для нашего примера по-прежнему
получаются обычные результаты, и этот вопрос будет рассмотрен более
подробно в следующем разделе П.2.5.
П.2.5. Микрораспределения в каноническом и большом
каноническом ансамблях
Рассмотрим формальный аппарат, необходимый для получения
информации на микроуровне в системах, представленных в виде
канонического или большого канонического ансамбля. Можно
задать вопрос: зачем все это нужно, если окончательные
результаты совпадают с микрораспределениями, которые проще
получаются посредством мцкроканонического ансамбля? Ответ состоит
в том, что нам никогда не удастся представить интересующую нас
динамическую систему с помощью микроканонического ансамбля.
Поэтому, когда осуществляется переход к построению
динамических макромоделей, основанных на концепциях канонического
и большого канонического ансамблей, нужен специальный
аппарат, позволяющий перейти к микрораспределениям.
Изучим микрораспределения в простой системе, которая
описывается каноническим ансамблем. Каки раньше, предположим, что
в системе центров отдыха имеются пг индивидуумов с расходами
8$. Из уравнения (П.2.15) можно определить/?^ вероятность того,
что полные расходы в системе составят Et. Нас интересует
вероятность Р (пг) того, что есть щ индивидуумов с расходами е*
РМ=ЪРи (П.2.26)
г
где суммирование проводится по всем состояниям i системы,
в которых nt индивидуумов имеют расходы st. Заметим, что
E = %niei,
г
и что имеется
*) См. Вильсон [1].
152 ПРИЛОЖЕНИЯ
областей фазового пространства (которые получаются при
перестановке различимых индивидуумов) в пределах этих расходов,
поэтому эту величину можно использовать в качестве веса при
ехр (— iiEt) при выполнении суммирования в уравнении (П.2.26).
Поэтому
ехр (— к — \ап.) п\ ж~ч 4
Р (Щ) = —} - V гг-р ехр [- \i (щв! + ...)],
*" nrfn2+^n-n. nV (П.2.28)
и тогда
Е(щ) =
Т7 п1+т£ь..==п '" 2•••• (П.2.29)
где Е (rti) — среднее значение nt. Задача состоит в том, чтобы
оценить это выражение. Чтобы это сделать, заметим, что функция
разбиения (П.2.16) может быть выражена через переменные
микроуровня с помощью весов из уравнения (П.2.27) в виде
Z = ехр X = V jfi— ехр [_ р (ад + ...)]. (П.2.3Ш
п!-ии-.-=п i *
Заметим, что
гтТГГ (— И|) ехр [— ^ (л^ + ...)]
Я In 7 tii-f-nt-|--..=n .
-tst vr—л ; (п-2-31)
г 2j гьт ехр [~ ^("181+• •,)]
сравнивая уравнения (П.2.29) и (П.2.31), получаем
ЯДО---LJ*L. (П.2.32)
Но уравнение (П.2.30) можно оценить непосредственно
Z = rSexp(-tieO]\ (П.2.33)
Поэтому подстановка в уравнение (П.2.32) дает
п ехр (- iAet)
£ <**) = "v / „ \ ' (П.2.34)
- г
Причем этот же результат получается и при использовании
микроканонического ансамбля. Отметим также, что это демонстрирует
связь с микроканонической функцией разбиения (П.2.9) и
канонической функцией разбиения (П.2.16) и (П.2.33). Если обозначить
2. ТЕОРИЯ АНСАМБЛЕЙ
153
их через ZMK и ZK соответственно, то из уравнений (П.2.9) и
(П.2.33) следует, что
ZK = (ZMK)». (П.2.35)
Представляет интерес сделать еще один шаг в изучении связи
микроканонического и канонического ансамблей: рассмотрим как
соотносятся между собой энтропия в микроканоническом ансамбле
и энтропия в каноническом ансамбле. Обозначим их через SMK и
SK соответственно:
£к= -%PilnPi = X + \iE. (П.2.36)
г
Это прямое следствие уравнения (П.2.15). Отметим, что уравнение
(П.2.36) можно также записать в виде
«S,K = lnZK — tA-^-lnZK.
Аналогично
Smk = In ZMK — ^t -g— In ZMK.
Воспользовавшись уравнением (П.2.35), легко получаем
S"K sa 7lSMK.
Кроме того, представляет интерес попытаться выразить
каноническую энтропию SK в уравнении (П.2.36) через величины, которые
назовем энтропиями уровней расходов
^--2/>г)1пР(^), (П.2.37)
ni
где Р (rti) — вероятность того, что имеется щ частиц с энергией
е^. Заметим, что
St - -EUaP(nt)].
Но легко показать, что провести соответствующие вычисления
не представляется возможным из-за условия, что полное число
частиц должно быть равно п. Эта идея более подробно будет
обсуждена ниже, когда речь пойдет о большом каноническом ансамбле,
где ограничение на полное число частиц снимается.
Есть одна общая теорема, которая позволяет установить
дальнейшую связь между результатами для микроканонического и
канонического ансамблей: любая равновесная часть изолированной
системы может быть представлена каноническим ансамблем *).
В частности, одна индивидуальная частица в системе центров
отдыха может быть представлена каноническим распределением
с теми же параметрами, что и ансамбль, представляющий всю
*) См. Хаар тер [1].
154
ПРИЛОЖЕНИЯ
систему; этот результат непосредственно доказан в уравнении
(П.2.34) в применении к примеру с центрами отдыха.
Следующий шаг анализа состоит в том, чтобы рассмотреть с
микропозиций систему, представленную большим каноническим
ансамблем, и показать, как можно преодолеть некоторые из
трудностей, которые встретились в случае канонического ансамбля.
В уравнении (П.2.23) i — метка состояния. Теперь нужно
выделить в системе щ частиц с энергией е*. Рассуждая так же, как и
при выводе уравнения (П.2.28) в каноническом анализе, получаем
ехр [- X (а + ц,е.) п.] ^ VI »1 г уч, .
\1&к)щ
(П.2.38)
Основное отличие, если отвлечься от формы распределения pt,
состоит в том, что суммирования справа проходят по всем
значениям %, а не только по тем, сумма которых равна n—nh как
в уравнении (П.2.28). Далее
оо
п-=0
и снова, точно так же как и в уравнении (П.2.32), имеем
В этом случае
" г
оо
ехрЬ = ^ •••5],тт77ехР Г—^(в + И-е»)»*] =
ОО
=ге! П У. ттехр [~ (° + ^п*ь (П-2-40>
г ni=o
Здесь изменен порядок знаков 2 и П. Отсюда
ехр А, = тг! Ц ехр {ехр [— (а + И.е4)]} =
г
- п\ ехр jSexp [ — (а + |хе{)]|. (П.2.41)
Поэтому
X = In и! + Sexp [- (а + (де{)], (П.2.42)
г
и, подставив это значение Я в уравнение (П.2.39), получим для
2. ТЕОРИЯ АНСАМБЛЕЙ
155
микр op аспр еде л ения
Е {щ) = ехр (—а — \ist).
Видно, что этот результат совпадает с ранее полученным. Здесь
а играет ту же роль, что микроканоническая функция разбиения.
Следующий шаг состоит в том, чтобы исследовать связь между
энтропией системы, определяемой уравнением (П.2.25), и энтропи-
ями, связанными с распределением вероятностей Р (nt) для
каждого индивидуального уровня затрат L Аналогичная задача
задана уравнениями (П.2.36) и (П.2.37) для случая канонического
ансамбля, но вычисления оказались слишком сложными из-за
требования постоянства количества частиц. Без этого ограничения
вычисления упрощаются. Из уравнения (П.2.38) имеем
In Р (щ) = -^(а-{- |1в0 щ + In щ\ — In щ\ -h 21 ехр [— (а + \iek)],
*^ (П.2.43)
так как по аналогии с уравнением (П.2.41)
•п1=0, н.^о . г fc^i J
* г
= ехр | — ^ехр [— (а + \тк)]}.
Теперь подставим в (П.2.43) выражение для X из уравнения
(П.2.42)
In Р (nt) = — ехр [—(а + \i£i)] — In nt\ — (а + (ге*)^.
(П.2.44)
Определим энтропию фиксированного уровня затрат
— %Р(п{)\пР(п)
и назовем ее St. Тогда St можно оценить, вычислив среднее
значение в уравнении (П.2.44),
_ St = — ah — \iEt — ехр [— (a + fie*)] — E (In щ\). (П.2.45)
Отсюда
V Si = aJV + \jlE + X — In n\ + V E (In и,!) =
г г
= X + olN + \lE-E /In jfi-\, ((П.2.46)
г
причем это выражение совпадает с S в уравнении (П.2.25) за
исключением последнего члена, который можно рассматривать, как
межуровневую энтропию.
156 ЙРЙЛО&ЕЙЙЙ
Сравнивая уравнения (П.2.45) и (П.2.46), видим, что Можно
удобно определить величину Хк по формуле
Я* = ехр [ — (а + fie*)] (П.2.47)
и
ехр Х1с = Zk.
Следовательно, Zfe можно назвать функцией разбиения к-то уровня.
Все выкладки в этом разделе проводились для индивидуумов,
различных в классическом смысле, что вытекает из системы весов
л'/Пгсг в уравнении (П.2.40). Можно допустить и большую
г
общность, а именно: начнем с уравнений (П.2.23) и (П.2.24) и
запишем Р (nt) в виде
Р (щ) = ехр(— X — ащ— ^8:п^21ехР (21 — aflfc — V4nk) > (П.2.48)
г kj±i
что эквивалентно
Р {щ) = ехр [- %ь - (а + |ie,)n,l, (П.2.49)
где
exp^ = Z*-: 21 ехр[—(а +М^.)%]. (П.2.50)
Отметим, что
Z* = П2*' (П.2.51)
к
где Zfc — снова функция разбиения на А:-ом уровне.
В классическом случае для различимых объектов (хотя и
неявно, в уравнении (П.2.38))
Z* = £ £ • • • j^y ехр [- (а + ^ч) /1{] (П.2.52)
г
и можно определить
Z* = У] ТТ ехР I"" (а + ^8fr) %]•
пк
Заметим, что множитель п\ в уравнении (П.2.52) нельзя
«распределить» между уравнениями, поэтому общее соотношение
(П.2.51) не будет выполняться для объектов, различимых в
классическом смысле. Вместо этого,
Z* = n\HZ*>
к
причем это соотношение неявно присутствует в уравнениях
(П.2.42) и (П.2.47).
2. ТЕОРИЯ АНСАМБЛЕЙ 157
Заметим также, что
Z*= 2 ^ехр(-аЛг0,
где Zt — каноническая функция разбиения, причем а играет роль
микроканонической функции разбиения, хотя и чисто формально.
Общие результаты, приведенные в уравнениях (П.2.23),
(П.2.24) и (П.2.48) — (П.2.51) будут полезны, если возникнет
необходимость в получении модели объектов, которые не являются
различимыми. Здесь есть два основных случая: статистика
Ферми — Дирака, где щ могут принимать лишь значения 0 или 1,
и статистика Бозе — Эйнштейна, где пк могут принимать любое
положительное целое значение. Возможный пример применения
первой статистики— пк означает размещение знания на
определенной территории, например, 0 означает, что территория не
занята зданием, а 1 — что занята.
П.2.6. Выводы: виды вероятностных распределений
в различных типах ансамблей
Ансамбль — множество реализаций интересующей нас
многообъектной системы. Формулировки ансамблей должны позволять
строить множества реализаций так, чтобы они представляли
интересующие нас системы, и чтобы средние значения переменных,
взятые по ансамблю, представляли собой средние значения
переменных в системе. Следовательно, ансамбли представляют
механизмы вычисления средних значений. Изложенный выше основной
аппарат канонического распределения применялся к трем типам
ансамблей: микроканоническому, каноническому и большому
каноническому.
Переменные величины представляют собой либо свойства
системы (макровеличины), либо свойства объектов системы
(микровеличины). Было показано, что эти три вида ансамблей имеют
различные макросвойства и, следовательно, описывают различные
системы, хотя канонический ансамбль является обобщением
микроканонического, а большой канонический — обобщением
канонического. Результаты, которые можно обосновать для ансамбля
более низкого уровня, можно обосновать и для ансамбля более
высокого уровня, хотя обратное может быть и не верно. Было
показано также, что результаты для микровеличин во всех трех видах
ансамблей совпадают, хотя на более высоких уровнях
определенные выкладки проводить легче.
Стоит кратко вернуться к вероятностным распределениям на
макро- и микроуровнях, которые можно пострить в различных
видах ансамблей:
158 ПРИЛОЖЕНИЯ
(1) Микроканонический: на макроуровне нет вероятностных
распределений, потому что все макровеличины фиксированы.
На микроуровне мы имеем наиболее вероятное распределение
числа щ, которое оказывается экспоненциальным с отрицательным
показателем степени. Величина
п.
Pi = —
ведет себя как вероятностное распределение и может
интерпретироваться как вероятность того, что один объект попадает в
состояние i.
(2) Канонический: на макроуровне мы имеем вероятность pt
того, что система будет иметь полные расходы Et, т. е. находиться
в i-ом состоянии системы. На микроуровне мы не проводим
непосредственно вычисления nt, а получаем вероятностное
распределение Р (rii), как вероятность того, что имеется в точности щ
индивидуумов с расходами ег. Здесь есть вычислительные трудности,
особенно в связи с энтропией распределения Р (щ), которые возникают
потому, что максимальное значение щ есть п.
(3) Большой канонический: здесь мы сталкиваемся с
ситуацией, аналогичной каноническому ансамблю, если не считать того,
что щ в распределении Р (щ) могут принимать любые значения,
причем этот факт облегчает выкладки.
3. МОДЕЛЬ КОНКУРИРУЮЩИХ ВОЗМОЖНОСТЕЙ
И НЕКОТОРЫЕ ЕЕ ВАРИАНТЫ
П.3.1. Введение
Второй подход к распределению поездок использует модель
конкурирующих возможностей. В эту модель межзональные
затраты явным образом не входят, но зоны, в которые можно
выехать из зоны I, ранжируются по увеличению затрат на
передвижение из зоны i. Чтобы уточнить это, нам потребуются новые
обозначения. Пусть /jx (i) — (li-я зона прибытия из зоны i в этом ряду;
если будет ясно, какая зона i имеется в виду, то будем писать
просто /jx вместо /jx (г). Модель конкурирующих возможностей впервые
была предложена Стауффлером *) в довольно простой форме,
причем предполагалось, что число поездок из зоны отправления
в зону прибытия прямо пропорционально числу возможностей
в зоне прибытия и обратно пропорционально числу
конкурирующих возможностей. Основное допущение этой модели состоит
в том, что каждый человек, совершающий проездку, поочередно
*) См. Стауффлер. [1].
3. МОДЕЛЬ КОНКУРИРУЮЩИХ ВОЗМОЖНОСТЕЙ
159
рассматривает каждую возможность по прибытии в зону, и имеется
положительная вероятность того, что его потребности будут
удовлетворены *). Чтобы понять, как работает основное допущение,
рассмотрим ситуацию, в которой зоны прибытия ранжированы по
отношению к зоне отправления. Пусть Utj есть вероятность того,
что один пассажир поедет за пределы |ы-й зоны от i. Предположим,
что существует вероятность L того, что некая возможность
удовлетворит этого пассажира, если ему ее предложить. Тогда, с
точностью до условий первого порядка по L
Uiu = 1 - LDhl
где Djt — число возможностей в ближайшей к i зоне /1в Умножим
последовательно значения вероятностей
Uih=Uih(l-LDjt),
U,h = Uiit{i-LDi)
и так далее. В общем случае
Это уравнение можно переписать в виде
\ ^--LD^ (П.3.1)
Пусть Aj^ — число возможностей, которые оказались
пропущенными, включая зону /д. Тогда
^=^-%,' <п-3-2)
и уравнение (П.3.2) переписывается в виде
В дифференциальной форме это уравнение можно представить
в виде
-jj- = — La А,
что дает после интегрирования
In U = — LA + const,
откуда
Ua^k^xpi-LA^), (П.3.3)
*) Мы выведем уравнения модели, следуя Шнейдеру [1]. Его работа была
посвящена анализу транспортной сети в Чикаго.
160 ПРИЛОЖЕНИЯ
где kt — константа. Но
где Ttj — число поездок из зоны i в \х-ю зону прибытия из i при
полном числе отправлений из i, равном Qt. Подставляя (П.3.3)
в (П.3.4), получаем
Гц-д = *i<?i [ехр (- ЬА^г) - ехр (- LAQ\, (П.3.5)
что является обычной формулой для модели конкурирующих
возможностей.
Отметим, что kt можно выбрать так, чтобы получающаяся
матрица Ttj удовлетворяла ограничению (1.1)
ЗГ1; = № [1 - ехр (- AJN)] = Qb
j
где N — полное число зон. Так как величина ехр (— LAjN) будет
очень малой, то kt будет весьма близко к 1 для всех L В рамках
структуры модели ограничение (1.12) на полное число
притяжений выполнено быть не может, но если известны истинные значе- j
ния Dj, то матрицу можно перестроить с помощью того же самого j
процесса балансировки, как и в уравнениях (1.7) и (1.8). j
В общем случае, если имеется матрица У*, и ее нужно
преобразовать в матрицу Ttj, в которой суммы по столбцам и по строкам
равны Qi и Dj, то это можно осуществить по формулам
Ttj = AtBjTij,
где
j
В) = Dj {^А^Тц) \
i
а в гравитационной модели эти уравнения очевидным образом
сводятся к уравнениям (1.7) и (1.8). На практике этот процесс
осуществляется поочередным умножением строк и столбцов на Dj/Df
и QilQ*, где Df — суммы по столбцам, a Q* — суммы по строкам
для матрицы, полученной на предыдущем шаге. Это и есть процесс
балансировки, который при необходимости можно применить
к матрице поездок в модели конкурирующих возможностей. В
следующем разделе будет показано, как можно получить модель
конкурирующих возможностей, исходя из принципов максимизации
энтропии.
3. МОДЕЛЬ КОНКУРИРУЮЩИХ ВОЗМОЖНОСТЕЙ
161
П.3.2. Вывод на основе максимума энтропии
Во введении модель конкурирующих возможностей была
получена довольно традиционным образом, причем оказалось, что ее
основным уравнением является уравнение (П.3.5). Представляет
интерес попытаться получить то же самое с помощью энтропийной
методологии, поскольку, если это нам удастся, гравитационная
модель и модель конкурирующих возможностей будут иметь общую
основу и появиться возможность с новых позиций анализировать
взаимосвязь между ними.
Используя переменные, введенные в разделе (П.3.1), можно
определить дополнительно величину
как число поездок из i, продолжающихся за пределы jji-й по
отношению к i зоны. Отметим, что поскольку
Tijp = и/ц,-! — 8ц^ (П.3.6)
то величины Sи определяют новую систему, как возможную
альтернативу Ttj . Чтобы получить модель конкурирующих
возможностей, применим новый метод к переменным Stj *). Поэтому, если
S — полное число состояний для данного распределения {Stj },
то следует максимизировать
Теперь нужно ввести соответствующие ограничения. Как уже
было показано, в модели конкурирующих возможностей нет
ограничения на притяжения в виде (1.2), но появляется ограничение на
отправления в виде (1.1). Для величин Stj ограничением, строго
эквивалентным уравнению (1.1), будет неравенство
так как общее число поездок, продолжающихся за пределами зон,
ранжированных по i, не может превышать общего числа
отправлений из U Если их просуммировать по /д, чтобы получить
ограничение типа уравнения (1.1), то окончательным уравнением будет
2 S^ = kiQb (П.3.7)
n=i
*) Во всем последующем изложении неявно предполагается, что Бц „—
независимые переменные. Ричард Элсон указал мне, что они вряд ли будут
независимыми, если независимы T{j. Однако представляется полезным
рассмотреть эту выкладку, поскольку она может стимулировать дальнейшие
исследования даже при своей математической некорректности.
$ А. Дж. Вильсон
162
ПРИЛОЖЕНИЯ
где к\ — некоторая константа и 1 ^ kt <^ N, где N — полное
число зон. Наконец, нам понадобится ограничение, аналогичное
стоимостному ограничению (1.3) в гравитационной модели.
Основным допущением в модели конкурирующих возможностей
является предположение, что число поездок между i и /
определяется числом возможностей в / и обратно пропорционально числу
конкурирующих возможностей. Это дает нам ключ к стоимостному
ограничению: надо воспользоваться конкурирующими
возможностями как оценкой стоимостей. Поэтому, если Stj поездок
совершается за пределы зоны /р,, то это связано с большими затратами,
чем при поездках в более близкие зоны. Предположим теперь, что
для поездок из зоны i число пропущенных возможностей
принимается в качестве меры стоимости того, что пришлось заехать
столь далеко. Поэтому минимальная цена оставшихся поездок за
пределы /р, есть Aj Stj . Если провести суммирование по /д, а
затем по зонам отправления i, то получим функцию, которая в
отдельных случаях ведет себя аналогично функции полных затрат,
а соответствующее ограничение будет иметь вид
224*4 = с. (п-3-8)
г ц *
Так как из уравнения (П.3.2) вытекает, что
4д=2^У.
v=i
а из определения Stj следует, что
<%= 21 Tijv, (П.3.9)
где N — полное число зон, то легко видеть, что коэффициент при
Tij^ после суммирования в уравнении (П.3.8) (подставить
значения Stj^ из уравнения (П.3.9)) будет равен
Ох - l)Dft + (jx - 2) Z)7, + . . . + DVl, (П.3.10)
поэтому пропущенные возможности вносят свой вклад в стоимость,
связанную с данным элементом матрицы поездок, причем данная
величина умножается на число случаев, когда эти возможности
были «пропущены» или «конкурировали».
Теперь, максимизируя
s
П S„ !
?'М<
при ограничениях (П.3.7) и (П.3.8) и вводя для этих ограничений
множители Лагранжа Я|х) и L, получаем, что наиболее вероятное
3. МОДЕЛЬ КОНКУРИРУЮЩИХ ВОЗМОЖНОСТЕЙ
163
распределение имеет место, когда
откуда
In SUll - LAiyL - *£> = О,
SUlL = exp (- LAivk - А$1}). (П.3.11)
Значения Х^ получаем обычным образом, подставив (П.3.11)
в (П.3.7)
ех]>(-Х&)=1Г
2exp(-L^)
поэтому, вводя величины
2 ехр(-£Л,)
и используя уравнение (П.3.6), имеем
Тщ = *i& [exp (- LA^) - exp (- L^)],
что совпадает с уравнением (П.3.5). Таким образом, новый метод
позволяет получить основное уравнение модели конкурирующих
возможностей.
Эти преобразования удалось проделать за счет того, что
использовалось стоимостное ограничение в виде (П.3.8) и
предполагалось, что стоимость проезда из i в j^ определяется уравнением
(П.3.10). Может быть, именно этот факт и заставляет предпочесть
гравитационную модель модели конкурирующих возможностей.
П.3.3. Модель распределения гравитационного типа,
использующая конкурирующие возможности как меру затрат
В качестве последнего примера применения нового метода
рассмотрим модель распределения, которая получается, если в
качестве меры затраты использовать конкурирующие возможности, но
не проводить взвешивание, как в (П.3.10). Это может оказаться
более приемлемым допущением.
Отметим, что первоначально величины /V были определены как
функции t, поэтому правильнее писать /^ (i). Наше допущение
состоит в том, что
си = A^i). (П.3.12)
Эту стоимость теперь можно подставить в любую из двух гравита-
6*
164
приложения
ционных моделей, полученных выше: так называемую обычную
модель, представленную уравнениями (1.6) — (1.8), или в так
называемую модель с одним конкурирующим членом,
представленную уравнением (3.8), где / (сц) = ехр (— $ctj). Поэтому,
подставляя ctj из уравнения (П.3.12), получаем комбинированную
модель вида
т^ = аК<?&ь ехР (- Р4Д (i))t
di = IS 6iAexp(" Р^цО")!"1»
bi = [S^iexp(-Mi|iw)]-1.
Для балансирующих множителей используются строчные буквы
а и ft, чтобы отличать их от Aj .
Модель с одним конкурирующим членом имеет вид
Г% = Д^,^ ехр (- РЛ;> (1)), (П.3.16)
«I = [ Я % ехр (- М^ (I))]"'. (П.3.17)
Если можно утверждать, что уравнение (П.3.12) дает лучшую
оценку стоимостей, чем уравнение (П.3.10), то модели,
представленные уравнениями (П.3.13) — (П.3.15) и уравнениями (П.3.16)—
(П.3.17), могут привести к лучшим ответам, чем обычная модель
конкурирующих возможностей. Следует приветствовать
экспериментальную проверку этих новых моделей.
4. ПРИМЕНЕНИЕ МЕТОДА ДАРВИНА - ФАУЛЕРА
ДЛЯ ВЫВОДА ГРАВИТАЦИОННОЙ МОДЕЛИ
В разделе 1.2 настоящей книги гравитационная модель была
получена с помощью метода максимизации энтропии. В этом
методе проводится максимизация величины In m / IjH ir) при опре-
деленных ограничениях на переменные {Т^}. В одной из ранних
работ автора *) было высказано предположение, что можно
воспользоваться аналогом метода Дарвина — Фаулера в
статистической механике **), что позволит определить средние значения Ttj
величины Ttjy а не наиболее вероятные. Этот метод не зависит от
каких-либо аппроксимаций и приводит к тому же самому ответу.
Цель этого приложения состоит в том, чтобы применить эти ре-
(П.3.13)
Щ.3.14)
(П.3.15)
*) См. Вильсон [2].
**) Описание метода изложено в работе Хаар тер [1].
4. Применение метода даг вййа — фаулера 165
зультаты для стандартной транспортной гравитационной модели.
На практике наиболее удобным методом получения моделей кон-
кретных систем является метод максимизации энтропии из
раздела 1.2.1.
Основное допущение раздела 1.2.1 состоит в том, что
вероятность осуществления состояния TiS пропорциональна W ({Т^}),
причем эта величина, если опустить множитель Г!, может быть
записана ь виде
ИЧта) = 1Ь(7о), (П.4.1)
где
Т(7у) = -^т. (П.4.2)
В обычной ситуации матрица Тц должна удовлетворять
ограничениям (1.1) — (1.3), которые для удобства мы здесь повторим
ЪТц = 0и (П.4.3)
з
2Ta = D}, (П.4.4)
г
ЪЪТцЧ = С (П.4.5)
г j
Теперь, вместо того чтобы искать значения Ttj, максимизирующие
W ({Tij}), определим средние значения Т' ц
%TaW(T)
f..= Z
гд £W (Г) '
г
где W (Т) (сокращение для W ({Тц})) есть вероятность состояния
{Tij}, a Ttj — (г, /)-элемент матрицы в этом состоянии, 21 обозна-
г
чает суммирование по всем состояниям {Ttj}, которые
удовлетворяют ограничениям (П.4.3) — (П.4.5), a W (Т) определяется
уравнениями (П.4.1) и (П.4.2). В более общем виде
%ЦТ«тп\¥(Т)
Tf>Tqmn = ^-^г^; • (п-4-6)
Метод Дарвина — Фаулера позволяет явным образом оценить эти
величины.
166 йгнлоЯшния
Определим производящую функцию
F{xuy., z\ с^) =
= 2 W{T)U& ГЬ/ *• i . (пал)
по всем {3\j} i ;==1
Теперь для оценки %W (T), где суммирование проходит по всем
г
{Tij}, удовлетворяющим ограничениям (П.4.3) — (П.4.5), следует
выбирать слагаемые в сумме, определенной уравнением (П.4.7),
так, чтобы степень при xt была равна Qt, степень при yj была равна
Dj, а степень z была равна С. Это можно сделать с помощью
интегрирования в комплексной области: поочередно применяя к
каждой переменной теорему Коши, получим
X П*~iQrlПy^rh-c-iF(ж,, у., z; ev), (ПАЯ)
г j
где N — число зон.
В более общем виде можно оценить сумму (П.4.6) по формуле
42iV+l г Г f TT -Q-1
X
^Г?ПпИ^(Г) = (^) + §dx1...$)dy1...j)dzT[x:QrlX
г
П ^^-с-'(т^ ^(тгпс-)'"«*• »<■s; '"'• (ПЖ9)
Г
X
Все интегрирования проводятся по замкнутому контуру вокруг
начала координат по часовой стрелке на комплексных плоскостях
хи yj и z. Таким образом, определены подынтегральные
выражения с особенностями в хи yj&z кратностей Qt, Dj и С.
Теперь заметим, что F можно записать в виде
F(xu у., z; сц) = П/(*ь 2/;>2И (П.4.10)
где
оо
/(1)=Ит(")Чп = Л (ПАИ)
Здесь использована функция у, определенная в уравнении (П.4.2).
Позднее нам будет полезно иметь производящую функцию в этом
виде.
Чтобы оценить интегралы, положим
F(xu yv z) c^)xiQrl = exp [Qig^Xi)]. ЩАА2)
4. ПРИМЕНЕНИЕ МЕТОДА ДАРВИНА — ФАУЛЕРА 167
В этом выражении опеределена функция gi7 и можно положить
Ti № = Ш Ф dXi eXP ^igi ^*)1"
Известно, что
где х\ удовлетворяет условию
дх. и'
или, в терминах F,
xl-^r-(Qi + i)F = 0. (П.4.14)
i
Легко видеть, что второй множитель в уравнении (П.4.13)
намного меньше первого (порядка N по сравнению с exp N, что
можно установить явным образом с помощью уравнений (П.4.10),
(П.4.11) и (П.4.12)), а так как нам в конце концов придется
пользоваться величиной In Fj а значит и In Iiy то этим множителем можно
пренебречь. Кроме того, в уравнении (П.4.14) можно пренебречь
единицей по сравнению с Qt. Поэтому
/, (хг) = exp [Qig. (аф] = F (*}, yv z\ eu) (xfQr\
где х\ есть корень уравнения
г
Точно так же оценивается каждый интеграл, и подстановка в
уравнение (П.4.8) дает
ЪМ(Т) = II(aJ)'QrlII(»J)"Di"V^iF(^f A z°; <*), (П.4.16)
i i
где #? удовлетворяет уравнению (П.4.15) и аналогично #? и z°
удовлетворяют уравнениям
^ = ВД (П.4.17)
*-§Г = С/?- (П.4.18)
Аналогично можно показать, что интегральное уравнение (П.4.9)
есть
-Q.-1-
i }
X (fif*4r)'(nr?S^)V<**• »?• * <*>• (П-4.19)
168 ПРИЛОЖЕНИЯ
Поэтому, подставляя уравнения (П.4.16) и (П.4.19) в уравнение
(П.4.6), имеем
ТУП,- ±Qn,)~foy(£.)qFto, у, z; с,).
Легко видеть, что для F из уравнений (П.4.10) и (П.4.И) это
выражение равно нулю, если только не выполнены условия: либо
/? = 0, либо q = 0. Поэтому наиболее общий результат имеет вид
Tft = ±Qnz)->JL.F
0Cij
^-тгпгттгг- (п-4-2°)
и, в частности, когда /7 — 1,
: / In z ~дс,
Выражения (П.4.10) и (П.4.11) показывают, что
Р = Пехр(ад/{0. (П.4.21)
Поэтому, замечая, что если F (с) = ехр [/ (с)], а / (с) = Azc, то
-0— = ехр (Azc) Azc In z,
и можно переписать уравнение (П.4.20) в виде
У« = ^(2°)Ч (П.4.22)
где х\, у) и 2°, как легко видеть, удовлетворяют уравнениям
(П.4.15), (П.4.17) и (П.4.22) соответственно. Исследуем эти
уравнения более подробно.
В уравнении (П.4.21) величина F явно выражена через х, у и z.
Отметим, что
* з
(Заметим, что здесь и впоследствии мы пользуемся лишь
величиной In F, а не F.) Отсюда
дх. ~~ t дх. — 2j'^'Z '
г г *^
поэтому подстановка в уравнение (П.4.15) дает
(П.4.23)
4. ПРИМЕНЕНИЕ МЕТОДА ДАРВИНА — ФАУЛЕГА j(5'J
Аналогично,
у. = ^-— (П.4.24)
3 2«?<*>в"
и
4- = £с«*ЭД(*°)е*Г1- (П.4.25)
Уравнение (П.4.25) аналогично стоимостному ограничению в
ранее рассмотренных моделях и, как обычно, не может быть
разрешено относительно z°. Мы можем определить величину р так, чтобы
ехр (- рс„) = (г»)Ч (П.4.26)
(т. е. р = — In z°). Запишем, наконец,
4 = 4г<?ь (П.4.27)
у\ = BjD} (П.4.28)
(определенные таким образом величины At и Bj заменяют х\ и у").
Теперь можно объединить уравнения (П.4.22), (П.4.23), (П.4.24) и
(П.4.26) с уравнениями (П.4.27) (и (П.4.28), что даст
?у = 44ВД^ехр(-рс{3),
4= [2 ДЛ ехр (-to)]"1,
i
i
Это уже знакомые уравнения, которые были получены впервые
в разделе 1.1 (уравнения (1.6) — (1.8)). Поэтому среднее значение
Ttj совпадает с наиболее вероятным. (Теперь становится
очевидным, что дифференциальные уравнения (П.4.15), (П.4.17) и
(П.4.18), решения которых описываются уравнениями (П.4.23) —
(П.4.25), представляют собой просто переформулировку обычных
ограничений.) Это завершает вывод гравитационной модели с
помощью метода Дарвина — Фаулера.
Дополнение
МОДЕЛИРОВАНИЕ СТОХАСТИЧЕСКИХ
КОММУНИКАЦИОННЫХ СИСТЕМ
Ш. С. Имелъбаев, Б. Л. Шмулъян
Введение
В книге Вильсона [В] *) дан ряд примеров применения идеи
статистической физики в анализе далеких, на первый взгляд, от
нее явлений, причем этот ряд можно продолжить. Наличие этих
примеров позволяет сделать вывод о существовании определенной
разновидности систем, для изучения которых применимы методы
статистической физики. Выявление таких систем, очевидно,
позволит более полно и систематизированно использовать эти методы
на практике. Попытка описать такие системы предпринималась
и в отечественной литературе **), где было введено обобщенное
понятие «ресурса», обмен и распределение которого считаются
происходящими по законам, аналогичным закону распределения
энергии в замкнутой системе механических частиц. Однако
процесс «потребления ресурса» рассматривался в отрыве от
порождающих его причин, а также последствий, которыми сопровождается
такое потребление.
В настоящей работе потребление связано с передвижением
элементов системы в некотором абстрактном пространстве.
Естественно, что такие передвижения сопровождаются постоянными
взаимодействиями элементов, приводящими к случайным
перераспределениям ресурсов между ними. Механизм такого
взаимодействия можно описать, используя предположение о существовании
небольших промежутков времени, в течение которых не
происходит ни одного взаимодействия. Тогда траектории движения
элементов системы можно разделить на группы в зависимости от
«направления» и величины потребляемых при этом ресурсов.
Такие группы назовем коммуникациями. Если в начальный и конеч-
*) Здесь и далее со ссылкой [В] цитируется русский перевод монографии
Вильсона, помещенный в настоящем издании.
**) См. Л.И.Розоноэр [1*].
@ Главная редакция
физико-математической литературы
издательства «Наука», 1978
§ 1. ПОНЯТИЕ КОММУНИКАЦИОННОЙ СИСТЕМЫ 171
ный моменты указанного выше промежутка разбить
рассматриваемое пространство на пронумерованные небольшие объемы, то
направление этих коммуникаций определяется парой индексов
(/, £), первый из которых (/) будет указывать на номер «объема»
в начальный момент времени, а второй (i) — в конечный. Заметим,
что ресурсы, потребляемые элементами, и сами элементы могут
иметь совершенно разную природу. Так, в физической системе —
газе такими элементами являются атомы или молекулы, а
ресурсом — энергия рассматриваемой системы. В системе передачи
информации элементы — это коды различных символов, имею
щие различные длины, а ресурс — общая длина передаваемого
сообщения. В экономической системе при решении транспортных
задач элементами являются количества некоторого продукта, а
ресурсом — стоимость его доставки от пунктов производства до
пунктов потребления.
Ниже понятие «ресурса» связано с наличием некоторого
множества коммуникаций, соединяющих элементы системы, и с
характеристиками этих коммуникаций. Введенная затем классификация
включает в себя модели, рассмотренные в [В], и позволяет
сконструировать модели, обладающие новыми свойствами и имеющие
другие области применения.
§ 1. Понятие коммуникационной системы
Рассмотрим некоторую систему, состоящую из достаточно
большого числа однотипных компонент. Имея в виду многочисленность
этих компонент, будем впредь называть их частицами. Очевидно,
что для получения хотя бы минимальной информации об
изучаемой системе, необходимо прежде всего научиться отличать друг
от друга ее компоненты (частицы). Пусть за каждой частицей
можно закрепить один или несколько детерминированных признаков,
по каждому из которых все множество частиц можно разбить на
непересекающиеся группы.
Пусть, например, система (и ее компоненты) определена в
некотором конечномерном пространстве и принадлежит подмножеству
последнего. Разделим это подмножество на более мелкие части и
перенумеруем их (или укажем хараюерные координаты); тогда
принадлежность частиц той или иной части пространства служит
одним из их отличительных признаков. Назовем этот признак
пространственным распределением частиц. Другими
отличительными признаками частиц могут быть их химический состав, вес,
форма, заряд и т. д. Группы, образованные одним, например,
r-м признаком, назовем группами r-го признака. В данной работе
будут рассмотрены системы, включающие частицы с тремя
отличительными признаками. Определим каждый из этих признаков.
172 ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
Выделим среди всех возможных систем такие, в которых первые
два признака отличия частиц относятся к началу и концу
некоторого заранее выбранного промежутка времени. Выбор величины
этого промежутка определяется обычно цикличностью,
свойственной многим процессам в природе, или другими факторами.
Например, в экономике он может определяться продолжительностью
производственного цикла; в физике — длиной свободного пробега и
скоростью молекул, временем релаксации (промежутком времени,
в течение которого должен обязательно произойти переход к
статистическому равновесию). Заметим, что введенные выше первые
два признака могут быть совершенно разной природы. Например,
первый признак может быть химическим составом вещества, а
второй пространственным распределением частиц. И даже в том
случае, когда они являюася одинаковыми по природе, признаки могут
не совпадать друг с другом, поскольку рассматриваются в
различные моменты времени. Векторы, определяющие количество частиц
в группах первых двух указанных признаков, назовем
соответственно начальным и конечным распределениями, а сами группы
вместе с их номерами, координатами и тому подобными
характеристиками — соответственно начальным и конечным состояниями.
Естественно предположить, что в описанной схеме обязательно
существует хотя бы одна частица, которая за рассматриваемый
промежуток времени совершила переход между двумя отличными друг
от друга группами разных признаков. В общем же случае в
передвижениях могут участвовать все частицы. Пусть данные
передвижения осуществляются по специальным каналам связи групп
первого и второго признака (коммуникациям). Предположим, что
каждому каналу связи можно поставить в соответствие определенную
величину, называемую характеристикой канала.
Характеристиками могут быть, например, длина канала или время,
затрачиваемое на его преодоление. Отметим, что каналы связи, так же как и
частицы, могут быть интерпретированы как элементы
коммуникационных систем. Тогда характеристика канала связи будет его
отличительным признаком. Разница же между каналами и
частицами заключается в том, что частицы «выбирают» каналы связи,
а не наоборот. Естественно, что вместе с «выбором» канала частица
«выбирает» и его характеристику. Поэтому сумму характеристик
каналов, поставленных в соответствие каждой частице, можно
рассматривать как некоторый ресурс, потребляемый частицами.
Таким образом, характеристика канала становится и
характеристикой частицы. Будем называть эту характеристику третьим
отличительным признаком частиц.
1.1. Примеры.
1.1.1. Транспортная задача. В экономике при решении
транспортной задачи частицами являются некоторые доли
распределяемого продукта. Первым отличительным признаком этих частиц
§ 1. ПОНЯТИЕ КОММУНИКАЦИОННОЙ СИСТЕМЫ 173
или начальным состоянием системы является принадлежность
этого продукта тому или иному пункту производства, вторым
отличительным признаком или конечным состоянием — его
распределение по пунктам потребления. Коммуникациями будут
являться маршруты перевозок между этими пунктами, а их
характеристиками — стоимость перевозок.
1.1.2. Миграция населения. В процессе миграции населения
в городах [В, гл. 2] однотипные элементы — люди, их
отличительные признаки — принадлежность тому или иному
пространственному району расселения и работы (обслуживания).
Коммуникации будут определяться транспортной сетью города и
представляют собой марштуты движения людей; их характеристики —
обобщенная стоимость маршрутов.
1.1.3. Масс-спектрометрия. Рассмотрим процесс масс-спектро-
метрии в физике. Известно, что заряженные частицы, влетающие
в однородное магнитное поле перпендикулярно линиям индукции
под действием силы Лоренца, направленной перпендикулярно
вектору скорости, приобретают нормальное ускорение и начинают
описывать окружности в плоскости, перпендикулярной
направлению поля. При этом ионы с различными отношениями массы
к заряду описывают окружности разных радиусов, регистрация
величины которых производится на специальном экране,
позволяющем одновременно с радиусом определять и интенсивности
соответствующих потоков ионов. Полученная таким образом
информация позволяет судить о качественном и количественном составе
исследуемого вещества. В этом примере в качестве первого
отличительного признака служит качественный состав исследуемого
вещества (ионы с одним и тем же отношением массы к заряду могут
образовываться при ионизации молекул разного вида), вторым
признаком — распределение ионов на экране в зависимости от
отношения массы иона к его заряду. Коммуникациями в данной схеме
будут окружности, описываемые различными ионами, начальное
распределение будет определяться составом исследуемого
вещества, а конечное — полученной спектрограммой.
1.1.4. Механическая система. Обратимся вновь к физике *).
В замкнутой механической системе (не взаимодействующей с
окружающим пространством) выделим подсистему, имеющую s
степеней свободы. Состояние этой подсистемы в каждый момент
определяется точкой в 25-мерном фазовом пространстве, с
координатами qt и qt, i = 1, . . ., s. Вместо того, чтобы наблюдать за одной
подсистемой в течение длительного промежутка времени, выделим
достаточно большое число аналогичных подсистем и будем
наблюдать за ними в течение небольших промежутков времени, когда
квазизамкнутые (энергия взаимодействия подсистем значительно
*) См. монографию Л. Д. Ландау и Е. М. Лифшпца [2 *].
174 ДОПОЛНЕНИЕ (ЛГ. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
меньше их внутренней энергии) подсистемы можно с достаточной
точностью считать замкнутыми. Тогда движение
соответствующих фазовых точек можно рассматривать как течение некоторого
«газа» в 25-мерном пространстве (в статистической механике
данным приемом пользуются для получения теоремы Лиувилля).
Состояние системы теперь будет характеризоваться не вектором
размерности 25, а матрицей размерности 2s X N, где N —
рассматриваемое число подсистем. Однако данный способ
представления информации неудобен, поскольку s и N по определению
очень большие числа. Воспользуемся тем, что многие из N точек
в рассматриваемом фазовом пространстве будут иметь
неразличимые при заданной точности измерений координаты. Разобьем ту
область фазового пространства, которая охватывает все N
рассматриваемых точек, на объемы, определяемые точностью измерения
по каждой координате. Перенумеруем их в определенном порядке.
Пусть при этом получилось М различных объемов.
Определим вектор р = {pt, i = 1, . . ., М), каждая
компонента которого равна числу точек, входящих в соответствующий объем.
Этот вектор представляет собой дискретную функцию
статистического распределения.
Таким образом, полученные точки можно рассматривать как
множество частиц, для которых отличительным признаком
служит их распределение в 25-мерном пространстве. Рассматривая
такие распределения в начале и конце описанного выше
промежутка времени, вновь получаем понятия начального и конечного
состояния или распределения. Коммуникациями при этом будут
группы траектории, начало и конец которых находится в
полученных ранее объемах с одинаковыми номерами.
1.2. Общие определения. Системы, включающие большое число
однотипных элементов {частиц), в которых переход из одного
состояния в другое осуществляется перемещением элементов
(частиц) по определенным каналам связи, назовем
коммуникационными системами. На рис. Д. 1.1 в качестве примера приведена
коммуникационная система, характеризующаяся тремя группами
начального состояния с распределением Q = {3,3,6} и шестью
конечного с распределением Р = {2,1,1,2,2,1}.
Остановимся подробнее на процессе передачи частиц. В
простейшем случае каналы связи (коммуникации) могут быть
построены так, что все оказавшиеся в канале частицы без потерь
переходят в конечное состояние. Такие системы будем называть
коммуникационными системами с жесткими границами. Их
примером может служить транспортная задача 1.1.1, модель
миграций населения в городах 1.1.2. В более сложных ситуациях
возможны всякого рода потери в каналах или каналы могут вооб-.
ще отсутствовать. В последнем случае коммуникациями можно
условно считать группы траектории отдельных частиц, объеди-
§ 1.ПОНЯТИЕ КОММУНИКАЦИОННОЙ СИСТЕМЫ 175
ненных по какому-либо признаку. Системы такого вида будем
называть коммуникационными системами с размытыми
границами. Их примером может служить процесс масс-спектрометрии
1.1.3.
При реализации перемещений частиц в коммуникационных
системах обоих видов возможны два случая. Первый, когда
конкретные частицы, передвигающиеся по тому или иному каналу
связи, строго фиксированы, и второй, когда частицы случайно
Рис. Д. 1.1. Пример коммуникационной системы.
оказываются в том или ином канале. В первом случае
коммуникационные системы будем называть детерминированными.
Примером таких систем может быть транспортная задача 1.1.1 с
единственным решением. Во втором случае — стохастическими.
Примерами являются модели миграций населения в городах 1.1.2,
процессы масс-спектрометрии 1.1.3, система механических частиц
1.1.4.
Заметим, что детерминированные коммуникационные
системы можно всегда рассматривать как предельный частный
случай стохастических систем. Действительно, если единственным
желанием пассажиров в городе являются минимальные затраты
времени на поездки, то модель миграций населения 1.1.2
перестает быть стохастической, так же как и процесс
масс-спектрометрии 1.1.3 при исключении всех флуктуации, возможных при
ионизации молекул и движении ионов к экрану. Поэтому в настоящей
работе будут рассматриваться более общие стохастические ком-
муникационные системы.
Природа сиЛ) вызывающих перемещения частиц в этих
системах такова, что количество частиц, передвигающихся по каналам,
зависит от их характеристик таким образом, что данная
зависимость складывается из множества случайных «выборов» частицами
того или иного канала. Следует отметить, что в коммуникационных
\
176 ДОПОЛНЕНИЕ (Iff. С. ИМЕЛЬБАЕВ,Б. Л. ШМУЛЬЯН)
системах с размытыми границами описанный процесс «выбора»
происходит непрерывно во времени, поскольку «негерметичность»
или полное отсутствие каналов связи делает возможным
перераспределение частиц по коммуникациям в процессе их
перемещения.
В коммуникационных же системах с жесткими границами
новое распределение частиц по коммуникациям соответствует
новой реализации перемещений. Эти обстоятельства упрощают
описание второй из указанных систем, вызывая одновременно
значительные трудности при изучении первой системы. Однако во многих
случаях эти трудности легко преодолимы, если системы с
размытыми границами можно свести к системам с жесткими
границами. Возможность такого перехода позволяет при изучении
коммуникационных систем ограничиваться рассмотрением их
разновидности с жесткими границами.
Пусть перемещения частиц в такой системе происходят
многократно. При каждой реализации перемещений в общем
случае через коммуникации может проходить разное количество
частиц.
Назовем такие распределения частиц по коммуникациям
промежуточным состоянием или просто состоянием системы в отличие
от начального и конечного. Каждое такое состояние, очевидно,
может быть достигнуто определенным числом способов при
различных сочетаниях частиц в коммуникациях. Отсюда, полагая все
способы независимыми друг от друга и рассматривая отношение
этого числа к общему числу способов, которыми систему можно
перевести из начального состояния в конечное, естественно ввести
вероятность реализации каждого допустимого состояния.
Наконец, для каждого промежуточного состояния можно
определить специальную характеристику, связанную с
вероятностью его реализации и аналогичную, в некотором смысле,
энтропии физической системы.
Как известно, одним из свойств замкнутой физической системы
является достижение ею со временем устойчивого состояния,
соответствующего максимальному значению ее энтропии. Это
свойство подтверждено экспериментально и сформулировано в виде
второго закона термодинамики.
Настоящая работа посвящена изучению промежуточных
состояний стохастических коммуникационных систем, обладающих
аналогичным свойством.
В заключение следует отметить, что введенное здесь понятие
коммуникационной системы является абстрактным. И только в том
случае, если элементам системы придать соответствующий смысл
и учесть естественные ограничения, налагаемые на начальное,
конечное и промежуточные состояния, предлагаемые ниже модели
приобретают реальный смысл.
§ 2. МОДЕЛИ КОММУНИКАЦИОННЫХ СИСТЕМ 177
§ 2. Модели стохастических коммуникационных систем
Пусть работа коммуникационной системы состоит в
перемещении частиц из п групп начального состояния (будем их в
дальнейшем называть истоками) в т групп конечного состояния (стоков).
Построенные модели должны определять промежуточные
состояния, т. е. потоки xtj, i = 1,. . ., т\ j = 1,. . ., п из истоков в
стоки. Очевидно, что возможности определения Хц зависят от
имеющейся информации и именно по этому признаку модели систем
могут быть классифицированы.
2.1. Вероятностная схема. Предположим, что все истоки/, / =
= 1,. . ., п и стоки г, i = 1,. . ., т связаны между собой
коммуникациями. Пока будем считать, что такая связь для каждой
пары (i, /) единственная и для нее известна ее характеристика Htj.
Примерами таких характеристик могут служить стоимость
перевозок Ctj, время передвижения ttj и т. д.
Как уже отмечалось, в стохастической системе каждая
частица «случайно» избирает ту или иную пару «исток — сток» и,
следовательно, величину характеристики коммуникации Htj.
Многократные повторения (или хотя бы возможности) этого выбора
можно интерпретировать как эксперименты над случайной величиной
Ж, в каждом из которых реализуется некоторое ее значение
h = Нц, причем существует вероятность каждой реализации v^
(об определении vtj см. ниже). Иными словами, существует
плотность распределения / {К) случайной величины Ж (во всяком
случае, в классе обобщенных функций), относительно которой
возможны различные степени информированности.
Предположим теперь, что в рассматриваемой системе
перемещается N частиц, причем в каждой реализации промежуточного
состояния эти частицы размещаются в тп коммуникациях с
вероятностями vtj соответственно, образуя при этом матрицу
потоков X = {xtj}. Такая схема полностью идентична известной схеме
полиномиального распределения, в соответствии с которой
вероятность реализации произвольной матрицы X = {х^} есть
МХ)=-ггЦ-П^. (2.1)
Логарифмируя это выражение и используя аппроксимацию
факториалов (см. [В (1.9)]), получаем
Ф(Х) = ]пр(Х) « V Xtfln-Ji- + C\ (2.2)
V i}
отличающуюся от аналогичного выражения [В, § 2.2.1] наличием
параметров v^. Основная гипотеза, используемая далее, состоит
в том, что устойчивое промежуточное состояние, т. е. матрица
178 ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
X = {xtj} коммуникационной системы, соответствует
максимизации Ф (X) — «энтропии» системы.
2.2. Принципы классификации. Как уже отмечалось,
элементы коммуникационной системы характеризуются тремя
признаками: истоками, стоками и коммуникациями, причем для
каждого из этих признаков существует распределение частиц по
заранее заданным группам. Введем классификацию информации по
распределениям. Здесь возможны следующие варианты.
2.2.1. Отсутствие информации. Для истоков и стоков этот
вариант означает отсутствие ограничений, для коммуникаций —
что априорное распределение/ (h) неизвестно, появление ни одной
из реализаций Htj случайной величины Ж нельзя предпочесть
другой, и, следовательно, должно быть принято vtj = l/mn =
= const. При этом функция (2.2) приобретает вид
<b(X) = -%xiSlnxi} + C1, (2.3)
v
совпадающий с [В, § 2.2.1]. Заметим, что это выражение было
получено в [В] именно исходя из гипотезы непредпочтимого друг
другу выбора частицей той или иной пары (i, /).
2.2.2. Известно среднее значение некоторых характеристик
элементов. Для истоков это означает, что для каждого из них
известна характеристика L), / = 1,. . ., п, а также среднее значе-
т
ние. Заметим, что из каждого истока выходит х1 = ^ х^ частиц,
г=1
что можно интерпретировать как вероятность qi выхода частицы
именно из этого источника, равную qi = (l/N)xK Следовательно,
при максимизации (2.2) надо учитывать ограничение
Г, *м=-f ZL? I>=^ Z Цх«=Llp- (2А)
Аналогичные рассуждения для стоков приводят в этом случае к
необходимости учета ограничения
Для коммуникаций этот вариант информации означает, что
должно быть учтено ограничение, накладываемое на матрицу
потоков X, т. е. среднее значение некоторой функции от
характеристики коммуникации Нц должно удовлетворять соотношению
■^г^ф^О^^Фср- (2-6)
Простейшие варианты ф {Нц) рассмотрены в [В]. В дальнейшем
§ 2. модели коммуникационных chcteW i79
будем считать ср (Htj) = Htj и, следовательно, ограничение этого
типа записывать в виде
что нисколько не уменьшает общности результатов.
Значения vtj здесь также должны быть приняты постоянными,
что приводит к максимизации (2.3).
2.2.3. Известно распределение. Для истоков этот вариант
означает, что для каждого из них известна qj — вероятность выхода
частицы именно из этого источника, и, следовательно, матрица
потоков X должна удовлетворять ограничениям
4-£,*»i = fl> -/ = !,...,«, (2.8)
i
или, в более привычном виде,
2Uj = <?j, / = 1,..., я, (2.9)
г
где под Qj = Nqj можно понимать заданный «объем» источника,
измеренный в частицах. Аналогично, для стоков имеем
ограничение
S*w = ^i. * = 1,...,/л, (2.Ю)
i
где Pt — «объем» стока.
Учет известного распределения по характеристикам
коммуникаций f(h) более сложен. Здесь уже нельзя полагать vtj =
= const, а необходимо определить их значения, соответствующие
априорно заданной / (К).
Предварительно заметим, что при достаточно большом числе
коммуникаций многие из реализаций характеристик Ни с
точностью до Ah неразличимы. Разобьем ось h между значениями от
min Htj до max Нц на I примыкающих друг к другу отрезков
ij ij
Дк, внутри которых будем считать характеристики Htj
неразличимыми. Введем характеристические функции множеств Дл
(1, h^Ak,
Используя это определение, можно построить п (К) — функцию
числа коммуникаций, попадающих в тот или иной отрезок Д^.
Эта функция постоянна внутри отрезка Ак и равна там
»* = 2Л*(#ц). (2-12)
ij
180 ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
Следовательно,
{0, к<С,тп\аН^; /&^>max#;j,
ч У (2.12а)
пк, h^Ak.
На границах интервалов определение п (h) произвольно.
Обратимся теперь вновь к априорному распределению / (h). Наличие
информации о нем означает, что для Х° — реальной матрицы
потоков коммуникационной системы были определены
F* = S4Mtf«) (2.13)
jj
— количества частиц, передвигающихся по коммуникациям с
неразличимыми характеристиками Н^ ЕЕ А*. При достаточно
большом числе коммуникаций / (К) задается, как правило, в виде
непрерывной гладкой кривой и поэтому, очевидно,
4г = -|4т $ nh)dh> (2Л4)
где | Ak| — длина отрезка Afc, Fic — априорная вероятность
выбора частицами группы коммуникаций с характеристиками Н^ е
ЕЕ А;с. Предположим теперь, что внутри каждого отрезка Ак
выбор той или иной коммуникации равновероятен. Следовательно,
искомая вероятность выбора одной коммуникации
vi/==i при Я^еДк, (2.15)
которая и должна быть использована в (2.2).
Замечание 1. Число связей щ = 0 означает, что нет ни одной
связи с характеристикой Htj GAfcH потому соответствующий
выбор пар (г, /) не осуществляется (т. е. следует положить v(j = 0).
Если при этом Fk =?=■ 0, это означает несогласованность двух родов
априорной информации: о связях и о распределении их
характеристик.
Замечание 2. Идея о введении априорного распределения для
определения вероятностей связей, в сущности (под другим
названием) использовалась, например, в широко распространенных
гравитационных моделях *). В этом случае полагалось
viy = a/(^y)«a-^.. (2.16)
Существенным отличием предложенного подхода **) является
*) Эти модели описаны в большом количестве работ, в частности, можно
указать обзор Ю. А. Дубова и др. [1*].
**) Видимо, впервые этот подход описан в статье Ш. С. Имелъбаева,
Б. Л. Шмульяна [1*].
§ 2. МОДЕЛИ КОММУНИКАЦИОННЫХ СИСТЕМ
181
учет распределения числа связей п (h). Очевидно, что определение
вероятностей vtj (2.15) и (2.16) совпадают (^точностью до
постоянного множителя) лишь при п (К) = const, т. е. при равномерном
распределении числа связей по коммуникациям. В противном
случае значения vtj и, разумеется, результаты моделирования будут
различаться (см. ниже § 3).
Замечание 3. Другой вариант учета априорной информации о
функции / (К) изложен в § 3.
2.3. Примеры моделей и решений соответствующих задач.
Таким образом, модель стохастической коммуникационной системы
можно описать тройкой {а$у}, где a, (J, у могут принимать
значения 1,2,3 и определяют вариант информации по коммуникациям,
истокам и стокам соответственно.
Как уже отмечалось, устойчивое переходное состояние системы
должно обеспечивать максимум оценочной функции (2.2). Учет
априорной информации формально сводит задачу определения
{xtj} к отысканию условного экстремума (2.2) при сохранении
ограничений 2ixa = ^> #i/>0 и каждой модели соответствует своя
задача. В дальнейшем вместо термина «задача, соответствующая
модели {afty}», будем употреблять термин «задача {офу}*-
2.3.1. Примеры, а) В модели {123} нет информации о
распределении потоков по коммуникациям; задана средняя величина
характеристики истоков LcP; задано распределение по стокам Pt.
Следовательно, модели {123} соответствует следующая задача:
Найти xtj, обеспечивающие
max/— 21 хц\пхЛ
при условиях
£±XijLjj = УУ/>ср»
ij
^хи = Pi9 i = 1,... ,m,
i
xu > 0.
б) Модель {222} сводится к задаче:
max /— 2J xtj In x{j\ ,
xij \ У /
i
У
%xl} = N, xi}>0.
ij
182 ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
в) Наконец, модель {333} соответствует задаче:
тах2^1п^/.г^)>
xij Ч
2^ = Л> i = 1, ...,m,
з
2j-ZiJ = (?j> / = 1,. .. ,/г,
г
причем v^- определяются по формуле (2.15). Заметим, что в моделях
{123} и {333} условие 21 х%j = N эквивалентно условию ^Pi = N
ij г
и потому опущено. В моделях {аЗЗ} априорная информация по
стокам и истокам должна быть согласована, т. е. «объемы» Pt и
Qj связаны соотношением 21 Р% = 21 Qj = N.
г j
2.3.2. Определение потоков xtj. Всем моделям стохастических
коммуникационных систем соответствуют задачи
математического программирования с переменными — величинами потоков xtj.
Общая формулировка всех задач следующая:
max Ф (xtj) = 21 я»ln (Vij/*ij)> (2.17)
ij ij
2о|>и = 6г; r=l,...,s, (2.18)
^ij > 0; i = l,.. ., m; j = 1,. . ., n, (2.19)
где ftr, a\j — коэффициенты, определяемые типом задачи; в
моделях {lPy} и {2Ру} параметры vi;- = 1 для всех г, у.
Для изучения общих свойств решения задачи (2.17) — (2.19)
предварительно предположим, что все v^- > 0, и воспользуемся
следующими утверждениями.
Утверждение 2.1*). Функция (2.17) строго выпукла вверх при
xtj > 0.
Действительно, градиент Ф (xtj) представляет собой вектор
длиной тп
УФ (хи) = {In (Vij/xtj) — 1}, i = 1,. . ., m; у = 1,. . ., тг,
(2.20)
а матрица вторых производных (размером тп X тп) — диаго-
нальна
V2<D (*„) = diag {- vtj/ztj). (2.21)
Следовательно, при любых х1} матрица вторых производных
максимизируемой функции отрицательно определена, что эквивалентно
ее выпуклости вверх.
*) См. монографию С. Кульбака [1*].
§. 2. МОДЕЛИ КОММУНИКАЦИОННЫХ СИСТЕМ
183
Ограничения (2.18), (2.19) — линейные равенства и
неравенства, и, следовательно, экстремум функции Ф (хц) в области,
определяемой этими ограничениями, единственный. Для определения
этого экстремума формально надо воспользоваться условиями
теоремы Куна — Таккера. Однако в рассматриваемой задаче
условия экстремума оказываются более простыми.
Утверждение 2.2. Решение задачи (2.17) с условиями (2.18)
всегда удовлетворяет условиям (2.19).
Для доказательства найдем общий вид решения задачи (2.17),
(2.18).
Составим функцию Лагранжа
S
L (*, X) = Y, х« 1п 1Г7 + У, ^ (У, <***« ~ *) ' <2'22)
ij lj r=l ^ ij '
где %r — множители Лагранжа, соответствующие ограничениям
(2.18). В соответствии с теоремой Лагранжа хц,
максимизирующие Ф (xtj) при ограничениях (2.18), максимизируют также и
L (х, X) и определяются из уравнений
i^L-ln-TiL-l +£*Ч = 0. (2.23)
г=1
Отсюда, общий вид решения
xd = vi5 exp (- 1 + Д Xrar^j , (2.24)
где Хг определяются из системы уравнений, получаемых
подстановкой (2.24) в (2.18). Поскольку ег ;> 0 при любых
действительных значениях z, то из (2.24) следует, что хц > 0, т. е. условия
(2.19) удовлетворяются автоматически и могут не учитываться
в алгоритмах потоков.
Замечание. Случай, когда некоторые vtj равны нулю, означает,
что имеются коммуникации между парами (г, /), априорная
вероятность выбора которых нулевая. Следовательно, потоки хц
по этим коммуникациям равны нулю и задача (2.17) максимизации
функции Ф (Xij) должна рассматриваться в пространстве
меньшей размерности.
2.3.3. Примеры определения потоков.
а) Модель {123}. В соответствии с формулировкой задачи
2.3.1а имеем s = т + 1 ограничение с коэффициентами: для г =
= 1,. . ., т
"Но, 1фг, / = !.-.»• * = *,
184 Дополнение ал. с. имельеаев, б. л. шмульят
для г = т + 1
a%+1 = Lqh i = l,...fmf b™ = NL%.
Обозначая а = — Xm+1, получаем решение задачи в виде
хи = ехр (— 1 + X1 - аЦ). (2.25)
Подставляя (2.25) в ограничения, имеем
ехр (- 1 + tf) Sexp ( — аЦ) = Ph i = 1,..., т. (2.26)
i
Откуда, вводя обозначения Л = 2ехР(-~ аЦ)> можно исключить
Xх из (2.25), т. е. окончательно
*ii= ~±e ~"Ч (2.27)
где множитель Лагранжа а определяется как результат решения
одного трансцендентного уравнения
^ЦР^ ^NALqcp. (2.28)
v
б) Модель {222}. Здесь 4 ограничения (см. 2.3.16)
а}, = Ь?, / = 1,...,тг, b1 = NL%V;
а% = Ц, i = 1,.. ., m, 62 = iVL^pj
4 = Я„, b*==NHc»;
Вводя обозначения а = — А,1, Р = — А,2, А = — Я3, |и = А4,
имеем решение в виде
xtJ = ехр (- 1 - аЦ - pL/ - АЯ0- - \i). (2.29)
Подставляя (2.29) в последнее ограничение, получаем следующее
уравнение:
ехр (- 1 - \i) S ехр (- aLf - PL? - %H{j) = TV, (2.30)
которое можно использовать для исключения из (2.29) постоянного
множителя ехр (— 1 — \л). Окончательно
хц=4" ехр (-*я** -aL^ - pl?)' <2-31>
где
А = S ехр (- ХЯ^ - aLf - PL?).
§ 2. МОДЕЛИ КОММУНИКАЦИОННЫХ СИСТЕМ 185
Величины a, Р, у должны быть определены в результате решения
системы трех трансцендентных уравнений, получаемых
подстановкой (2.31) в первые три ограничения.
в) Модель {333}. Здесь 2 группы ограничений (см. 2.3.1в).
В первой из них для г — 1,. . ., т
Во второй для г --= m + 1,. . ., пг + п,
ЬГ = Qr-m.
Вводя обозначения:
а* = — Я*, i = 1,. . ., т; Р; = — Xj+m, j = 1,. . ., гс,
получаем
я*7- = va ехр (— 1 — at — р,) = v^ty, (2.32)
где
г* = ехр (— 1 — <Х|), s* = ехр (—fa).
Коэффициенты rt, Sj должны быть определены в результате
решения системы нелинейных уравнений
(2.33)
S]%Vijri = Qj, / = 1, ...,П.
г
2.4. Таблицы моделей. В таблицах Д.2.1, Д.2.2, Д.2.3
представлены все модели, соответствующие введенной классификации,
и их решения. Анализируя эти таблицы, можно установить, что
каждая информация типа «2» вызывает необходимость решения
одного трансцендентного уравнения.
При информации типа «3» множители Лагранжа могут быть
определены в явном виде (за исключением задач {233} и {333}).
Таким образом, число трансцендентных уравнений в каждой
задаче определяется количеством символов «2» в ее индексе.
Особое место занимают задачи {233} и {333}, поскольку они
сводятся к решению системы нелинейных уравнений типа (2.33),
как правило, очень высокого порядка. Однако эти системы весьма
специфичны и для их решения употребляются специальные
алгоритмы (см. ниже § 5).
186 ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
ТАБЛИЦА Д.2.1
Модели {111} —{133}
Виды информации
1
2
3
ij
ij
i
/ = 1, . . .,/г
Решение
Статистическая сумма
Уравнения для
определения параметров
решения
Решение
Статистическая сумма
Уравнения для
определения параметров
решения
Решение
Статистическая сумма
Уравнения для
определения параметров
решения
1 1
*__ N
i» "ТГП7
тп
—
—
* /V -XL?
Л = 3е^
j
11
J m
—
~~
§ 2. МОДЕЛИ КОММУНИКАЦИОННЫХ СИСТЕМ 187
1 2
1 *'
*_N -XLf
1 *
"x2j г ср
г
* JV e-aLf-pL?
a£ = —L e^^i
* A
г
NA Zj ;Zj г ср
j г
3 |
j 1
**-P*
—
—
l> N
—
—
)
I
Таблица Д.2.2
Мо;ели {211} —{233}
Вид информации
1
2
3
2V7«V
2J
г
/ = !,..., л
Решение
Статистическая сумма
Уравнения для олреде-
ления параметров
решения
Решение
Статистическая сумма
Уравнения для
определения параметов
решения
Решение
Статистическая сумма
Уравнения для
определения параметров
решения
1
2*« = *
ij
" А
~aIj " cp
1
Л=2^ГР^
ij
* Q> -Ш„ 1
*«- Лу '
i
1 V Qj x
i
1 °
«, -X.H,j-aLP
■xl, ^ cp
1 np-»H p
T 2-1 { ~ °p
| »J
3 л
—2j ij cp
— 2-1 } cp i
ij 1
i 1
3
x , = : e
1 J !
г *г*
3
N LJ A. Lj v °P
i г j
г г j
—
—- ~M?ij
sj2jrie =<?я / = i,...,1»
i I
190 ДОПОЛНЕНИЕ (ЯГ. С. ИМЕЛЬВАЕВ, В. Л. ШМУЛЬЯН)
Таблица Д.2.3
Модели {311ЫЗЗЗ} (v
Вид информации
1
2
3
1
2 *« = <?*
i
/ = !,..., л
Решение
Статистическая сумма
Уравнения для
определения параметров
решения
Решение
Статистическая сумма
Уравнения для
определения параметров
решения
Решение
Статистическая сумма
Уравнения для
определения параметров
решения
1 1
2Ь = лг
ij
х*. =Nv.-
ij г]
—
—
j г
г
—
—
§ 2. МОДЕЛИ КОММУНИКАЦИОННЫХ СИСТЕМ
191
а
Vf-^p*
%*ij=pi> * = 1
ч A 'J
-XL*'
-T^f-^^Vy-LS,
ЛГ -Obf-flL?
^-TW
-«lP-PL?
J.V.fv,e-<-^ = LcPp
4-E^
A
■5>*
iV*/1*1-!
cp
a:*=O.V.. *
-XLf
" '":§*«
-XL?
1_ yi IfQprf ' = Lp
-V
ij 2ji
-XL?
cp
,* _ pv i
-XL?
Svf
-XL?
-XL**
1
i
192 ДОПОЛНЕНИЕ (ЯГ. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
§ 3. Модели, сохраняющие априорную информацию
Модели, сформулированные в § 2, позволяют определить
потоки xti в коммуникационной системе. Проанализируем модели
{3 $у]. Как уже отмечалось, в них используется / (К) —
априорное распределение случайной величины Ж- Получив в результате
расчетов потоки х^, можно по ним вычислить функцию г|> (К)
распределения частиц по характеристикам коммуникаций для
потоков xtj, полученных из модели. Аналогично определению (2.13)
будем вычислять функцию, постоянную на интервалах Afc и равную
на них
1>* = 2*|А(Л**)- (3.1)
ч
Интерпретируя расчет по определению потоков xtj как «опыт» над
моделью, будем называть набор %, к = 1,. . ., I апостериорным
распределением случайной величины Ж- Однако физического
опыта над системой при расчете, разумеется, не производится, и
никакая информация к уже имеющейся не добавляется.
Следовательно, одним из показателей соответствия модели физической
системе должно явиться совпадение (или близость) априорного и
апостериорного распределений.
Ниже это свойство проанализировано для моделей {ЗРу} и
сформулированы новые модели.
3.1. Сравнение способов определения вероятностей выбора
коммуникаций. Как уже отмечалось выше, для моделей {3(fy}
предложено определение вероятностей vtj вида (2.15)
F
Vii-дтГ, я«еА*» * = l,...,Zf (*)
К
где щ — число коммуникаций с характеристиками Htj €E Afc;
Fk — априорно заданное число частиц, перемещающихся по этим
коммуникациям.
Сравним результат расчета для определения viy- (2.15) с
употреблявшимся ранее определением (2.16)
р
^ = а1\Г» Я«еАь (**)
где a — нормирующий множитель, обеспечивающий выполнение
условия 2vii = 1-
В общем случае такое сравнение затруднительно, поэтому
ниже рассмотрены два примера моделей при следующем
предположении.
I. Априорное распределение / (К) — равномерное; интервалы
Д/>. одинаковы. Следовательно,
F» = -f. (3.2)
§ 3. МОДЕЛИ, СОХРАНЯЮЩИЕ АПРИОРНУЮ ИНФ01 МАЦНЮ J93
Ниже вычислены значения потоков xtj и апостериорного
распределения % для определений (*) и (**).
3.1.1. Модель {311}.
а) Определение (*). В этом случае (см. (3.2))
v* = —, tf^Afe. (3.3)
r* = NVii = ^Lf я„едк. (3.4)
Общий вид решения (см. табл. 2.3)
Л
In
Апостериорное распределение (см. (3.1))
** = У,-ЕГА*(Я">- (3-5)
В силу свойств функции Лк (•) при фиксированном «&» в
правой части (3.5) отлично от нуля «щу> слагаемых (см.
определение щ (2.12)), причем все эти слагаемые по определению (3.3)
постоянны.
Следовательно,
**=т-' <3-6>
что совпадает с априорным распределением (3.2).
б) Определение (**). Здесь
v** = ^ = -L = const, (3.7)
поскольку из условий нормировки а = 1/тп. Следовательно,
4*=: — = const, (3.8)
4 тп N '
*" = ££**<*«> = -£-»», (3-9)
т. е. апостериорное распределение совпадает с точностью до
постоянного множителя с распределением частоты связей щ и,
очевидно, соответствует априорному распределению только для
случая щ = const.
3.1.2. Модель {333}. Введем здесь еще два упрощающих
предположения.
П. Число истоков и стоков одинаково и равно т; их объемы
также одинаковы, т. е.
Pi = Qj = Nlm = const. (3.10)
7 А. Дж. Вильсон
194
ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБАМВ, Б.Л.ШМУЛЬЯН)
III. Матрица характеристик коммуникаций H%i такова, что
распределения п\ числа коммуникаций для каждой ее строки или
Щ — для каждого столбца по интервалам Ак одинаковы и
пропорциональны такому распределению для всей матрицы. Иными
словами, наборы
п\
2.л,(яи), / = i,
,т,
,т,
(3.11)
к=1,...,1
обладают свойством
п1 = п\ = щ/т, к = 1,. . ., Z.
Примером матрицы {#„}, обладающей свойством III, является
такая, строки которой представляют собой все циклические
перестановки набора из любых «т» чисел, т. е.
{#«} =
m
h.
""m-i
m-i
|*l *• ... hm hi u
Другой пример можно получить, если совмещенные попарно
истоки и стоки разместить равномерно по окружности, а в
качестве значения характеристики
коммуникации принять геометрическое
расстояние между элементами
системы (см. рис. Д.3.1). Потоки xih
соответствующие этой модели,
определяются формулами (2.32), (2.33).
а) Определение (*).
Покажем, что в предположениях II, III
решение задачи имеет вид
Xtf = r*5*V
•у, (3.12)
е. параметры решения не зависят
Рис. Д. 3.1. Пример
симметричной коммуникационной
системы.
от i и ; и rt = г*
го подставим (3.12) в
(2.33). Первая группа
приобретает вид
Sj = 5*. Для это-
уравнения
уравнений
C!fl V—L — N - _
, 771.
Каждое слагаемое в сумме слева зависит от Htj. Разобьем эти
слагаемые на группы, каждая из которых объединит значения Hi}
§ 3. МОДЕЛИ, СОХРАНЯЮЩИЕ АПРИОРНУЮ ИНФОРМАЦИЮ 195
из одного интервала Ак. Очевидно, что таких групп «Z», все
слагаемые в них постоянны, число слагаемых в каждой группе — тг£
(см. 3.11). Следовательно,
т I
> = > п\ = — = const
,=1 к fc=i
для любой строки «i».
Аналогичные рассуждения применимы ко второй группе урав-
ний, и, следовательно, решение действительно имеет вид
4 = -^-, Я^бД, (3.12а)
Это решение совпадает с (3.4) и для него также справедлив вывод
о совпадении априорного и апостериорного распределений.
б) Определение (**). При использованных здесь
предположениях модель {333} совпадает с моделью {311} и ее решение
определяется (3.8), и, следовательно, априорное и апостериорное
распределения в общем случае не совпадают.
3.2. Модели точного воспроизведения априорного и
апостериорного распределений. В приведенных выше примерах
показано, что в некоторых случаях модели {ЗРу} не искажают априорной
информации. К сожалению, в общем случае это не так, хотя
эксперименты, описанные в § 7, дают близкие значения
апостериорного и априорного распределений. Вместе с тем имеются примеры
(возможно, достаточно экзотические), когда использование
определения (&) для vtj дает существенное расхождение между этими
распределениями. Видимо, основная причина большего или
меньшего расхождения заключается в степени правомерности
гипотезы о равномерном распределении вероятностей выбора отдельной
коммуникации в пределах группы коммуникаций из одного
интервала Дл.
3.2.1. Определение модели. Припишем к индексам
коммуникаций (i, j) третий индекс «Ь>, указывающий, какому интервалу
Дк принадлежит значение характеристики и определим трехин-
дексную матрицу характеристик
{■" ij» Hi) ^ Д&>
ТТ Т= А (3.13)
не определено, Н^ f= Д*.
Рассуждая так же как в § 2, можно построить вероятностную
схему случайного выбора частицами той или иной тройки (/, /, к)
с априорными вероятностями
v»*k = f iVnfr (3.13a)
О, #„ёД;
*•
.7*
196
ДОПОЛНЕНИЕ (ДГ. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
Тьким образом, при фиксированном (i, j) лишь один элемент
„ГТЛ^ °ТЛИЧеН °Т НУЛЯ (СМ- РИС- Д-3-2>- а ПРИ
Фиксированном «Ь все эти элементы одинаковы. Промежуточное состояние
стохастической коммуникационной системы теперь определяется
Рис. Д.3.2. Пример трехиндекснои матрицы {V|ft) (в заштрихованных
объемах viJfc>0).
трехиндекснои матрицей потоков X = {хт}, вероятность
реализации которой по аналогии с (2.1) есть у^лиал
р(Х) =
(3.14)
Гипотеза об эквивалентности устойчивого промежуточного
состояния и максимизации «энтропии» системы приводит к
определению матрицы {хт}, максимизирующей
Ф (*)=£*«* In-^
(3.15)
Введение индекса «Ь> в рассматриваемой модели дает теперь
возможность наложить на потоки хт (а в сущности, хи)
дополнительные ограничения с целью обеспечения совпадения
априорного Fk и апостериорного % распределений
S**ik = Ffc, & = !,...,/.
(3.16)
В таблице Д.3.1 приведены модели {4)3y}, отличающиеся между
собой информацией об истоках и стоках, аналогично
рассмотренной в § 2.2. Разумеется, условия, налагаемые на
максимизируемую функцию, дополняются суммированием по индексу «Ь.
§ 3. МОДЕЛИ, СОХРАНЯЮЩИЕ АПРИОРНУЮ ИНФОРМАЦИЮ J97
Например, ограничения модели {433} имеют вид
2лх№ — Qv 1 — 1» • • •» и,
(3.17)
Ij^iife = Ри * = 1,... ,т,
к
дополненные, разумеется, (3.16).
3.2.2. Определение потоков Xijk. Общее решение задач типа «4»
в принципе не отличается от предыдущих. Однако,
вычислительные трудности здесь значительно увеличиваются в связи с
необходимостью решения в задачах с символом «3» систем нелинейных
уравнений. Особая трудность возникает в задаче {433} в связи
с необходимостью решения в ней системы из трех групп
нелинейных уравнений. Ниже будет дан алгоритм ее решения и показана
его сходимость.
3.2.3. Анализ определений вероятностей выбора коммуникаций.
Выше было показано, что разные определения вероятностей Vjj
в моделях типа «3» дают разные значения потоков в
коммуникационных системах (и различные апостериорные распределения ty (&)).
Для моделей {4ру} справедливо следующее
Утверждение 3.1. При использовании в моделях {4ру}
определений вероятностей
(*) V^' = W^' Я^Д*>
Fk
(**) vtj = a -jf-, НХ)<=Ик
потоки, максимизирующие (3.15), одинаковы, т. е. х*к = я**-
Доказательство проведем отдельно для случаев а) р, у = 1,2
и б) р = 3 или у = 3.
а) Общий вид решения в этом случае (см. табл. 3.1, модель
{422})
*т = 4^ vtfk ехр (- Щ - рЦ), (3.18)
где
4t = 25 vuk ехр (- KLf - \iL% (3.18а)
Ъ'
причем более простые модели можно получить, полагая Х*= 0 или
li = 0.
Очевидно, что при переходе к определению (*) все v**,
принадлежащие одному слою «Ь>, умножаются на одно и то же число
а/пк, т. е.
At = (а/щ) At*,
198 ДОПОЛНЕНИЕ (Iff. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
Таблица Д.3.1
Модели {411}—{433} (S xijk = Fk, к = 1,..., l\
1 Вид информации
1
2
3
ij
г
/ = 1, . . . , n
Решение
Статистическая сумма
Уравнения для
определения параметров
решения
Решение
Статистическая сумма
Уравнения для
определения параметров
решения
Решение
Статистическая сумма
Уравнения для
определения параметров
решения
1 |
* Fk
ХЦЪ- Ак viik
ij
—
j ik K
*
^ijfc — vijkrjsk
—
ik
/=1,..., n
§ 3. МОДЕЛИ, СОХРАНЯЮЩИЕ АПРИОРНУЮ ИНФОРМАЦИЮ
199
1 2
$*Л"^
-XLf
* Fke
' ijk i;k' л
* \
ij
i jfc
* ^fc -aLf-PL?
ij
к К ij
/с ij
жЪ'к = л;икГ;5/се
—
iK
I sk2jvijkrie =^k. *=•!,.••, 1
ijk
3 |
2ж.у = Р., i = l,..., m
i 1
*
Xijk — VijkriSK
—
—
riSv«kV '=J>i' i = l,...,m
Jk
^Sw/ J=iv л = 1 l
ij
ijk
x*k = vijkrisjfb
—
jk
siSvii7rriffc = Qi' 7=1,-... л
ik 1
1 ij
200 ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБАЕВ, Б.Л. ШМУЛЬЯН)
и, наконец, подставляя (3.19) в (3.18), непосредственно убеждаемся
в справедливости утверждения 3.1.
б) Для решения всех задач при J3 = 3 или у = 3 необходимо
решить систему нелинейных уравнений с неизвестными, в
частности, параметрами $к. Общий вид решения здесь
Пусть для определения (**) решение задачи равно #** с
параметром $**. Учитывая (3.19), положим s* = 5** щ/а, а остальные
параметры сохраним, откуда непосредственно следует
утверждение 3.1.
§ 4. Обобщения моделей
4.1. Модели типа «2». Во всех приведенных выше таблицах
моделей под информацией типа «2» понималось, что известен
лишь один параметр распределения. Очевидным является обобщение
для случая нескольких известных параметров.
Для истоков или стоков это означает, что заданы несколько
наборов их характеристик Lfr(i = 1, . . ., т; г — 1, . . ., R),
L% {j = 1, . . ., п; s = 1, . . ., S) и соответствующие им средние
значения L?, £§•
Для коммуникаций аналогично можно ввести несколько
функций % (fftj) (см. (2.6)) и средние значения Ф, (t = 1, . . ., Т).
Естественным здесь является задание моментов распределения, т. е.
ф, (z) — zl. Еще одна интерпретация задания параметров
распределения по коммуникациям может быть получена в задаче
прогноза. Здесь разумно предположить, что для существующих
систем рассматриваемые распределения могут быть получены в
результате экспериментов, а для проектируемых (в измененных
условиях) некоторые параметры распределений могут быть
прогнозированы. Формально это обобщение сводится к появлению
нескольких новых трансцендентных уравнений для определения
параметров (множителей Лагранжа), связанных с вводимыми
ограничениями.
4.2. Модели типа «3». Выше предполагалось, что в пределах)
одной группы коммуникаций (с характеристиками Htj ее Ак
выбор частицами любой коммуникации равновероятен и не зависит
от пары (i, j) исток — сток. В некоторых задачах может появиться
информация о различных распределениях частиц для
отдельных групп истоков или стоков.
4.2.1. Группы истоков. Пусть истоки /', / = 1, . . ., п разбиты
на непересекающиеся группы Js, s = 1, . . ., 5, т. е.
§ 4. ОБОБЩЕНИЯ МОДЕЛЕЙ 201
и для каждой такой группы известно нормированное распределен
оо
ние f(h), ^ f(h)dh = 1,а также значения ^ — общего числа
— оо
частиц передвигающихся из истоков / е Js (У}№ = N\ .
Аналогично § 2.2.3 разобьем ось h на интервалы Aft, к = 1, . . ., I и
определим функции п* (h) (s = 1, . . ., S), постоянные на этих
интервалах и равные п\ — числу коммуникаций с характеристиками
HtJ £4i = l,...,w,/E Js, т. е.
я* = 2 S Ак(Яи). (4.2>
Определим также величины
/* = J /'(*)«» (4.3)
— условные вероятности выбора частицей группы коммуникации
с характеристиками Htj ЕЕ Afc при фиксированной группе
истоков /s. Заметим, что /£ (Ne/N) полная вероятность этого выбора.
Предполагая теперь равновероятность выбора частицей любой
коммуникации внутри интервала Ак при выходе из истоков ; е J\
получаем следующее окончательное выражение для v^ —
вероятности выбора одной коммуникации:
fNs
Vij=-T7T» Ht^^ /ЕЛ i = l,...,m. (4.4),
пк1У/
Эти значения vtj и должны быть использованы в моделях {ЗРу}.
В моделях {ЗЗу} значения Ns должны быть согласованы с*
распределением по истокам Qj, j = 1, . . ., тг, т. е.
2 Qj = Ns, 5=1,...,5. (4.5)
В моделях {31у} и {32-у} появляются S дополнительных
ограничений
S S хц = Я\ 8 = 1,...,S (4.6)
вместо одного ограничения 2 2 xij = N. Множители Лангранжа
* з
при этих ограничениях выписываются в явном виде.
Например, решение в модели {321} приобретает вид
4 = 4*-*„«-"?, /еЛ * = l,...,m, (4.7).
202 ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБАЕВ, Б.Л. ШМУЛЬЯН)
где
Лз= 2 *"XL?2vfJ (4.7а)
и А- должно быть определено из уравнения
Заметим, что модели {311} и {331} распадаются на s параллельных
моделей, и потоки в них могут быть определены независимо друг
ют друга.
4.2.2. Группы стоков. При наличии информации о
распределениях fu (h) и общем числе частиц Nu для непересекающихся групп
•стоков Iu, u — 1, . . ., U все результаты аналогичны полученным
в 4.2.1.
4.2.3. Корреспондирующие группы истоков и стоков. Пусть
для непересекающихся групп истоков /s, 5=1, . . ., S и
стоков 7й, и = l,...f U известны распределения f8U(h),
относящиеся к парам коммуникаций (г, ;'), i ЕЕ /u, / ЕЕ /% а также
корреспонденции между этими группами Nsu.
Аналогично моделям с группами истоков (см. 4.2.1) эти модели
при р Ф 2 и у Ф 2 распадаются на SU параллельных моделей,
и их решения определяются независимо. Разумеется, при
заданных распределениях по истокам или стокам значения Nsu и Pt (Qj)
должны быть согласованы, т. е.
S
2 Pi= 2^su, и = !,...,[/, (4.8)
и (или)
i<=lU 5=1
2 <?;= 2^su, * = i,...,s. (4.9)
г*=1
Для моделей {Зру} при |3 = 2 или 7 = 2, что соответствует
фиксированной связи между всеми потоками, следует ввести nsu (h) —
функции распределения числа коммуникаций с
характеристиками Htj, i e= Iй, / e= /s, постоянные на интервалах Ак и равные
там
п?= 2 2 Ак(Я„). (4.10)
Значения v^- — вероятностей выбора частицами отдельной
коммуникации могут быть получены аналогично выводу формулы (4.4),
§ 4. ОБОБЩЕНИЯ МОДЕЛЕЙ
203
т. е.
vii = -Qir#iieAb геЛ s<=J*. (4.H)
Ограничения рассматриваемых моделей дополняются равенствами
2 2*ij = Wtt, s = l,...,S; и = 1,...,£/, (412)
множители Лангранжа, при которых также выписываются в явном
виде. Например, решение модели {322} имеет вид
*«j = -ЯртЧе4*1-*4, 'e/tt, /ЕЛ (4.13)
где
Asu= 2 S v^-aLi-Pb', (4.13а)
а а и р должны удовлетворять системе уравнений, аналогичных
(4.76).
4.3. Модели типа «4».
4.3.1. Наличие нескольких коммуникаций для пар (i, /). Выше
предполагалось (§ 2.1), что все пары (£, /) связаны одной
коммуникацией с характеристикой Htj и, выбирая пару (г, /), частица
тем самым однозначно выбирает коммуникацию. Пусть теперь
природа стохастической коммуникационной системы такова, что
между некоторыми парами возможны Rtj коммуникаций с
характеристиками Hlj, г = 1, . . ., Rtj соответственно.
Примером рассматриваемой ситуации является транспортная
пассажирская система в городе, когда частицы — пассажиры могут
выбирать не только пункты отправления и прибытия, но и пути
следования между ними.
В этом случае вероятностная схема § 2.1 должна быть
дополнена правилом выбора коммуникаций. Рассмотрим несколько
вариантов таких правил.
а) Частицы независимо друг от друга избирают коммуникацию
с характеристикой Н\? r = l,..., R^ и тем самым пару (£, ;').
Следовательно, при наличии информации о распределении f(h)
можно в развитие (3.13) определить трехиндексную матрицу
характеристик
Hijk = HriJ9 ДГ,-е=Д*. (4.14)
В одну «ячейку» (i, /, к) здесь могут попасть щ^ коммуникаций,
причем пцъ = 0 означает, что Н^к неопределено.
Трехиндексная матрица v№ здесь определяется выражением
vijk = akniiki
(4.15)
204 ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
где ofy — нормировочный множитель, определяемый из условия
^Vjjk = Fk/N. Таким образом, в отличие от модели § 3.2, здесь при
v
фиксированной паре (i, ]) несколько элементов vljfe не равны нулюг
а при фиксированном «к» vZJt пропорциональны щ^ (при
применяемом для решения задачи вычислительном методе балансировки
(§ 5) МОЖНО ПОЛОЖИТЬ Vijx = riijb).
Максимизируемая функция и ограничения модели остаются
такими же (см. (3.15), (3.16)). Таким образом, полученные в результате
решения потоки ж*к согласуются с априорным распределением F^
Можно получить потоки по отдельным коммуникациям
4 = -^-, Я&еД» (4.16)
и между парами (г, /)
i
х*;= 23 xtjk- (4.17)
б) Частицы независимо друг от друга избирают пару (i, j)r
т. е. существуют вероятности такого выбора vi;-. При
фиксированной паре (г, /) частицы избирают ту или иную коммуникацию
с вероятностью v^-д, где индекс «к» соответствует
характеристикам коммуникаций H\j Е= Afc. Следовательно, вероятность выбора
частицами всех коммуникаций для пары (г, /)
г ^ i
v«i = S ЧфПцк = 2j viikf (4.18)
где тг^ — по-прежнему число коммуникаций в группе с
характеристиками H\j ЕЕ Дь Vjjfc — вероятность выбора такой группы
(при пт = 0 vlife = 0).
Введем теперь предложение: значения v^ подчиняются
зависимости
Vijk = avyZ (Л — Л^), (4.19)
где ktj — номер интервала Дк, соответствующего минимальному
значению H\j при фиксированной паре (г, /); Z (г) —
неотрицательная функция целочисленного аргумента г, равная нулю при
г<^0 и монотонно убывающая от значения Z(0) при г^>0.
Например, эта функция может иметь вид
ГО, г<Г0,
Нормирующий множитель а определяется из условия (4.18),
§ 4. ОБОБЩАНИЯ МОДЕЛЕЙ 205
т. е.
a2U(ft-A„)Sg(i»Uk) = l, (4.20)
* JO, (x<0
Исходя из предположения о независимом выборе частицами пар
(i, ]) определим вероятность этого выбора в соответствии с (2.16),
т. е. Vtf = -д£-, где к — кц соответствует min #[,.
Таким образом, полученные в результате решения задачи
{4ру} потокиxijk будут соответствовать априорным вероятностям v^,
учитывающим «разложение» потока хт между группами
коммуникаций (см. (4.17)). Потоки по отдельным коммуникациям можно
получить, предполагая равномерность разложения по ним в группе
(i, 7, к), т. е. в соответствии с (4.16).
Разумеется, эти потоки будут соответствовать априорному
распределению / (h), поскольку они удовлетворяют
соответствующим ограничениям (3.16).
4.3.2. Несколько видов частиц. Модели вида «4» могут быть
применены в ситуации, когда в системе из каждого истока j в каждый
-сток i могут перемещаться R различных видов частиц, причем
известно их общее количество в системе Nr, а также характеристики
коммуникаций для каждого вида Н\^ г *= 1,. . ., R. В этом случае
трехиндексная матрица характеристик приобретает вид
Нф = Hrij9 i = 1, . . ., m, j = 1, . . ., п, г = 1, . . ., R. (4.21)
Значения v^r определяются в зависимости от наличия информации
о распределениях fr(h) частиц разного вида по характеристикам
своих коммуникаций.
При неизвестном распределении
При известных НТ — параметрах распределений — v^r определяются
по формуле (4.22), и, кроме того, добавляются ограничения вида
2*«/г#«г = ад. (4.23)
V
Наконец, при известных распределениях f (h) значения V|j> могут
определяться по моделям вида «3», т. е.
v«>=-fV' ^eAh (4.24)
206 ДОПОЛНЕНИЕ (ДГ. С. ИМЕЛЬБАЕВ. Б. Л. ШМУЛЬЯН)
где jf£ и щ — априорное значение числа частиц и число
характеристик коммуникаций типа «г» в интервалах Afe соответственно.
В этих же моделях можно точно воспроизводить априорные*
распределения /r (h). Для этого следует ввести четвертый индекс «к»
или задать пределы изменения третьего индекса г от 1 до Ш
(отводя I слоев на каждый вид частиц).
Разумеется, во всех этих моделях сохраняются ограничения
типа (3.16), т. е.
2*iir = tfr. г = 1,...,Я. (4.25>
ь
Описанные обобщения моделей типа «4» могут быть объединены^
§ 5. Алгоритмы определения потоков ,
в коммуникационных системах
Моделирование стохастических коммуникационных систем
сводится, как уже отмечалось в §§ 2, 3, в конечном счете, к
условной максимизации функции, зависящей от потоков хц (xtjk).
Некоторые из этих задач разрешимы в явном виде, некоторые-
сводятся к решению нескольких трансцендентных уравнений, и,,
наконец, особо выделяются задачи, для решения которых
необходимо определить значения неизвестных из системы
нелинейных уравнений высокого порядка.
Предварительно заметим, что методы решения систем
уравнений сравнительно небольшого порядка достаточно хорошо
разработаны *).
Вернемся к задаче решения систем нелинейных уравненийт
к которым сводится задача определения потоков в стохастических
коммуникационных системах.
Общий их вид относительно переменных а^, . . . ., а*
следующий:
U h ir r (5.1>
<*ir 22 ■ • - 23 viA...4 a?1ai2. . . air^ = 0lr.
it H V-l
Здесь индексы il9 i2, . . ., ir меняются от 1 до nx, n2, . . ., nr
соответственно как при суммировании, так и в группах уравнений-
Напомним, что в моделях {333}, {431}, {432}, {413}, {423} — две
) См., например, А. М. Островский [1*].
I 5. АЛГОРИТМЫ ОПРЕДЕЛЕНИЯ ПОТОКОВ 20Т
группы уравнений (г = 2), в модели {433} — три группы {г =-. 3}.
В обобщениях модели «4» (см. § 4) возможно г ^> 3. Рассмотрим
общие алгоритмы решения таких систем, которые носят название
алгоритмов балансировки.
5.1. Анализ алгоритмов балансировки.
5.1.1. Двумерная балансировка. Рассмотрим вначале задачу
{333} (г = 2). Решение ее имеет вид
*и = aibjvij, i = 1, . . ., т; j = 1, . . ., тг, (*)
причем xtj должно удовлетворять уравнениям
2лхи = Qv ] — l,...?w,
г
4J^iJ == ^г» I = 1, . . . ,7И.
Ясно, что произвольная матрица X = {xtj} не удовлетворяет
уравнениям (**). Алгоритм балансировки представляет собой
двухэтапный итерационный процесс, в котором, начиная с
определенной начальной матрицы Д ;> 0, на каждом этапе
происходит попеременная нормировка («балансировка») строк и
столбцов. То есть, для каждого шага алгоритма вычисляются
Й = 4-^Т-, (5.2>
j
*Т = У°«^Г7-> (5-3>
г
и затем процесс повторяется до достижения необходимой точности.
Таким образом, рассматриваемый процесс можно представить,
в виде
Xs+l = CXs^ (5 Лу
где С = В А — оператор, действующий в пространстве Етп и:
состоящий из последовательного применения операторов А и
В, определяемых формулами (5.2) и (5.3) соответственно.
Следующие свойства оператора С можно сформулировать в виде
утверждений.
Утверждение 5.1. Матрица X = {£*;•}, удовлетворяющая
уравнениям (**), является стационарной точкой оператора С, т. е.
X = С (X). (5.5)>
Утверждение проверяется непосредственной подстановкой (**)•
в (5.2) и (5.3).
208 ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
Утверждение 5.2. Начальные матрицы xlj и х% = gtx\j (gt > 0)
порождают совпадающие итерационные процессы (начиная с s = 1).
Иными словами, начальная матрица может быть построчно
умножена на положительные числа. Если организовать
итерационный процесс так, чтобы вначале происходила балансировка
по столбцам, а затем по строкам, то один и тот же итерационный
процесс порождают начальные матрицы x°j и х% = hjxlj (hj ^> 0).
Кажется очевидным, что итерационный процесс (5.2) — (5.3)
всегда сходится к некоторой стационарной точке оператора С.
Однако можно указать начальные матрицы, при которых
сходимость не имеет места. Например, если т = п, х% = diag (at)
и хотя бы для одного i Pt Ф Qt, то порождаемый этой начальной
матрицей итерационный процесс будет циклическим. Разумеется,
если x^j = 0, то x\j = 0 для всех s.
Укажем общую теорему о сходимости процесса. Обозначим
через Уг подпространство Ешп, определяемое (**), и через F2 —
подпространство Етп, образованное координатами (х^), для
которых vtj = 0.
Утверждение 5.3. Если V = Vx f] V2 не пусто, то
итерационный процесс (5.2), (5.3) с начальной матрицей х% = v0- сходится
к стационарной точке ж*, доставляющей максимум функции
2 Xij 111 {Vij/Xij) При УСЛОВИЯХ (**)•
г?
Доказательство этого утверждения *) достаточно громоздко
и приводиться здесь не будет. I
Из утверждений 5.2 и 5.3 следует, что значения v*y могут
задаваться с точностью до постоянного множителя.
Вернемся теперь к нелинейным уравнениям типа (5.1).
Поскольку на каждом шаге итерационного процесса (5.2) — (5.3)
происходит умножение каждых строки и столбца предыдущей
матрицы x]j на ^некоторые числа, то
*5Р = аГРГЧ'. (5.6)
Следовательно.
х^ — аг bj хц, (o.ba)
где af+1 = alaf ... a?+1; bj = p}pj ... p*+1 и итерационный процесс
можно переписать для переменных at и bj
af+1 = Pi/^itfvij, i = 1,..., m,
(5.7)
г
*) Доказательство принадлежит Л. М. Брэгману [1*].
§5. АЛГОРИТМЫ ОПРЕДЕЛЕНИЯ ПОТОКОВ 209
сходящийся в условиях утверждения 5.3 к аг, 6,,
соответствующим искомым потокам
Xij = dijbjVij. (5.8)
Очевидно, что начальная точка процесса (5.7) есть Ь° = Ь = const.
Разные значения Ъ порождают разные последовательности а8 и
bs, но при этом их произведения asbs, а, следовательно, и потоки
x\j одинаковы.
Замечание. Теоретически процессы (5.2), (5.3) и (5.7)
эквивалентны. Однако при реализации их на ЭВМ при большой раз*
мерности матрицы {х^} процесс (5.7) очевидно предпочтительнее
по требуемой памяти. Действительно, процесс (5.2), (5.3)
производит работу с тп элементами памяти ЭВМ, а процесс (5.7) —
лишь с т + п элементами.
5.1.2. Алгоритмы многомерной балансировки. В модели {433}
и ряде обобщений модели «4» появляется необходимость в решение
систем уравнений типа (5.1) при г]>2. Используем для этого
процесс, аналогичный (5.7), т. е. (для г = 3)
1) положим b°j = 6, с\ = с.
2) для каждого шага s определим
аг?+1 = Pi/% vijkb-c8k, i = 1,..:, m,
b?1 = £j/2 ^аГ4 / = 1,..., /г, (5.9)
ik
4+1 = Fk/% vy^rV1. A=»i J.
ij
Процесс (5.9) также сходится к значениям af, bj, с&,
соответствующим решению задачи условий максимизации #*& = afbf x
X c*Vift. Доказательство этого утверждения *) вынесено в § 8.
5.2. Принципы реализации алгоритма балансировки на ЭВМ.
Рассмотрим алгоритм трехмерной балансировки (5.9). Для
достаточно больших значений т, п, I матрица v^ft не может быть
полностью размещена в оперативной памяти ЭВМ и для
проведения расчетов ее приходится считывать с внешних носителей
небольшими блоками. В качестве носителей обычно используются,
магнитные ленты (МЛ) или диски (МД). Основная задача
программирования при этом заключается в том, чтобы проводить
каждый цикл балансировки за минимальное число проходов
магнитной ленты (обращений к диску).
*) Сходимость процессов общего вида доказана С. М. Мовшовичем [1*];
для процесса (5.9) доказательство дано Н. И. Грачевым, А. В. Покровским».
Ш. С. Имельбаевым и Н. Я. Кругляк.
!/гЗ А. Дж. Вильсон
"210 ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБАЕВ, П.Л. ШМУЛЬЯН)
Непосредственная реализация алгоритма (5.9), очевидно,
требует трёх проходов матрицы v^, причем если МЛ допускает
■считывание только при прямом ходе ленты, то к этим проходам
еадо добавить три перемотки назад.
Изложим способ, позволяющий реализовать алгоритм (5.9)
-за один проход МЛ и МД.
Пусть размерность матрицы {vw, i = 1, . . ., т; j = 1, . . .
. . ., щ к = 1, . . ., /} такова, что из чисел т, п, I можно выбрать
шару чисел (назовем их X и \i) таких, что величина X\i + X + \х +
+ е (е — оставшееся из т, п, I число), оказывается меньше
оперативной памяти ЭВМ (в единицах памяти на один элемент
матрицы vw). Если такой пары не существует, то рассматриваемый
алгоритм оказывается непригодным, но практически это
случается редко. Если же таких комбинаций существует несколько, то
для выбора лучшей из них следует привлечь дополнительные
-соображения. Без потери общности можно считать X = т, \i = Z,
-в = п> поскольку соответствующей перестановкой индексов этого
ясегда можно добиться.
После этого матрица {v^} записывается на МЛ (МД) блоками
размером ml чисел. Очевидно, таких блоков будет п и во время
расчетов каждый из них будет последовательно считываться в
■оперативную память ЭВМ.
На практике вместо матрицы {v17k} часто задают матрицу {Htjk}
и по ней определяют первую, используя заданную функцию
-v = / (К). При этом Ник бывают известны лишь с некоторой
точностью б, поэтому матрица {Н^ъ} может быть представлена
в единицах 6 в виде целых чисел длиной в полуслово, которые
имеют вдвое меньшую длину, чем вещественные числа. В этом
случае вместо матрицы {v^} на МЛ аналогичным образом
записывается матрица #гд. Далее выбирается диапазон (min Нг^,
шах Hi ft), производится дискретизация функции / (К) с точностью
до S по аргументу, и полученная функция дискретного аргумента
j (к) = / (/г/б) используется для определения v^. Минимизация
количества проходов МЛ достигается за счет введения
дополнительного массива u (i, к). При считывании каждого блока
*Vijk или Hijk для соответствующего / можно реализовать второе
соотношение (5.9)
гк
Параллельно вычисляется массив и (i, к) по формуле
и (i, к) = 2jviifc6,-+1; i = 1,..., т\ к = 1,. .., Z,
i
каждое слагаемое которой определяемся прд очередном считы-
S 6. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ И ИНТЕРПРЕТАЦИИ 21 f
вании блока /. Тогда после перебора всех / и«™ ftobjie Одного-
прохода МЛ для каждого к можно подсчитать суммы
ij г
и определить
ij
Используя c^+1 и массив и (г, к), теперь можно реализовать
оставшееся из соотношений (5.9)
«Г1 = Pi I2 Ъ№#\ i = 1, • • - и*,
используя тождество
jk к
Таким образом, все три группы действий (5.9) выполнены за»
один проход МЛ (МД).
§ 6. Некоторые приложения и интерпретации
6.1. Некорректные транспортные задачи и их регуляризация»
Во многих практических задачах, в том числе и в тех, которые-
могут быть сформулированы в терминах коммуникационных
систем, исходная информация носит приближенный характер. Те-
йз задач, в которых незначительные искажения исходной
информации ведут к грубым изменениям решения, принято называть-
некорректными *). При их решении возникает проблема
уменьшения влияния погрешностей.
6.1.1. Формализация задачи. Транспортные задачи являются,
одними из наиболее распространенных в экономике задач
линейного программирования. К ним сводятся задачи о перевозках,
о распределении изделий, сырья между предприятиями,
разнообразные задачи о транспортных сетях. Причем транспортным
задачам в большей степени, чем каким-либо другим видам задач'
линейного программирования свойственна некорректность. Даже^
если рассматривать только целочисленные решения задачи, то*
может существовать целое семейство решений, каждое из которых
дает значение целевой функции не большее, чем любое другое
решение, не входящее в это семейство.
Рассмотрим транспортную задачу**);
ттС(Х) = Зс|Я^ (6.1)
v
*) По поводу проблемы некорректных задач и алгоритмов их решения см»
работу А. Н. Тихонова [1*].
**) См., например, Е. Г. Голыптейн, Д. Б. Юдин [1*],
8*
"212 ДОПОЛНЕНИЕ (ДГ. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
при ограничениях
%Хц = Ри 1 = 1,.. ,,/№,
(6.2)
2zij = (?j, ; = 1, ...,п,
i
я*7 > 0 для всех J, /*
где X = {#j;} — неизвестная матрица перевозок, С = {сц ]> 0} —
заданная матрица цен, Р = {Plf . . ., Pw} — заданная
потребность в некоторой продукции, Q = {Qly . . ., Qn} — наличие
продукции в пунктах отправления, 2 Л = 2)Qj = N; единицу из-
мерения количества продукции выберем так, чтобы N^>mn.
Для любого б^>0 введем в рассмотрение множество Х& =я
= {X: X — решение задачи (6.1) — (6.2) для всех Р, Q, С таких,
что || Р - Р ||<б, || (?-<? ||< би||С - С||<6}. Если для сколь
угодно малого б элементы Хъ сильно отличаются друг от друга,
то задача является некорректной.
Приведем некоторые результаты анализа некорректных
задач линейного программирования *). Решение Х° называется
нормальным, если для него справедливо || Х° — Х° || <; || X — Х° \\$
где X — произвольное решение рассматриваемой задачи, Х° —
точка, относительно которой строится нормальное решение. Лю-
<бая задача линейного программирования имеет единственное
нормальное решение. Для его построения применяется регуляри-
зирующий алгоритм (РА)
min Ml [X, Л, 5, С] = || Ах - Ь ||2 + а (С2 (X) + Ш (X))
X
при Х-+0, а-* 0, (6.3)
где С (X) — целевая функция рассматриваемой задачи
линейного программирования с ограничениями Ах = Ь,
Q (X) = || X - Х° ||2. (6.4)
Полученные результаты остаются в силе, если вместо Q (X)
использовать любую другую функцию ф (X), обладающую тем
свойством, что множество {X: ф (X) <^ к), где к — произвольное
число — компактно и ф (X) > 0. При этом необходимо лишь
соответствующим образом изменить нормальное решение.
Обратимся вновь к транспортной задаче. Аналогично
моделям коммуникационных систем множество стоимостей перевозок
*ij будем интерпретировать как реализации случайной величины.
*) См. работу А. Н. Тихонова [1*].
% 6. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ И ИНТЕРПРЕТАЦИИ 213
Если произвольно выбирать решения из множества Х^,
построенного для произвольной некорректной задачи и произвольного
достаточно малого б, то можно заметить:
1) С увеличением ctj «вероятность» попадания
соответствующего элемента в базис решения уменьшается.
2) Пусть X* — одно из решений транспортной задачи при
6=0. Тогда чем больше С (X) по сравнению с С (X*) при X ЕЕ
е Х$, тем менее вероятно, что ненулевые элементы X образуют
базис решения X*.
Таким образом, для вероятности связи между пунктами i
и / должна существовать некоторая убывающая функция ctj и
С (X). Предположим, что она имеет вид
vtj = ехр (_ $сиС (X)). (6.5)
Если погрешности входной информации таковы, что S^i =>
е= ^2&j = N, то вероятность того, что реализуется произвольная
матрица X в соответствии с (2Ч |) будет иметь вид
ij
Логарифмируя это выражение, используя аппроксимацию \т\ ж
ж z in z — z и подставляя значения vu из формулы (6.5),
получим
Ф (X) = - -L In р (X) - С2 (X) + X £ хц In жу + Си (6.6)
ij
где К = 1/р. Сравнивая (6.3) и (6.6), замечаем, что в качестве
регуляризирующей добавки можно использовать
ф(Х) = ^jXijlnxij. (6.7)
ij
Докажем, что ф (X) обладает необходимыми для этого свойствами.
Утверждение 6.1. Множество {X: ф (X) < к), где к —
произвольное число, — компактно,
Для доказательства достаточно показать, что ф (X) является
сильно выпуклой функцией на множестве хц > 0.
В оспользуемся следующим условием сильной выпуклости
(V"q> (Х)у, у)>т\\у ||2, т > 0.
Легко получить (см. (2.21))
V^(X) = diag{^-}.
214 Дополнение (ш. с. ймельваев, в л. шмульяю
Поскольку V2<p (X) — диагональная матрица, то ее собственные
числа Xr = i/xtj, г = if, i = 1, . . ., т; j = 1, . . ., п и
положительны для всех хц > 0. Поскольку
(УуЮу, у) >ь II у II2,
где А, — наименьшее собственное число матрицы V2q> (X), то
утверждение 6.1 справедливо.
Утверждение 6.2. ср (X) > 0 при всех X, удовлетворяющих
условиям xtj > 0, ^jXij^mn.
Пусть число ненулевых элементов такой матрицы X равно &.
Докажем, что минимум функции го (X) достигается в этом случае
при х% = Nik для всех ненулевых элементов.
Рассмотрим f (х) = х In я, # > 0 и доопределим
/ (0) = lim х In x = 0.
Функция / (ж) — выпуклая (f (х) > 0, а: > 0), поэтому для нее
справедливо
Суммирование здесь ведется по всем i, /, поскольку для нулевых
элементов / (0) =;0. Отсюда, так как -г- /#ij = "Г-э
ij
N - N 1 V4
X1п Т ^ Т" 2ji *ijln *iif
ЛГ In 4 = Ф (*•)< £ хц In ж,, = Ф (X),
причем очевидно ф (Х°) > 0, если N ^> к. Если рассматривать
Ф (X) на множестве оптимальных планов невырожденной
транспортной задачи, то к<тп. Следовательно, при N^mn^>k
обеспечена положительность ф (X).
Нормальным решением задачи (6.1) — (6.2) теперь назовем
такую точку X, которая минимизирует функцию ф (X) на
множестве Х& при б -> 0.
Таким образом, для решения некорректной транспортной
задачи применим регуляризирующий алгоритм
minAft[X, P,Q,C] = Z(%хц - Pi)2 +
+ %{%*ц-(2з)2 + <1{С2(Х) + К<р{Х)) при Х-*0, <x-*0. (6.8)
2 г
т. е.
* 6. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ И ИНТЕРПРЕТАЦИИ 215
Здесь М? — штрафная функция дли задачи минимизации функции
(6.6) на множестве, определяемом соотношениями (6.2).
Приведенные рассуждения позволяют сделать вывод, что
транспортную задачу можно рассматривать как предельный случай
определенным образом построенной модели стохастической
коммуникационной системы.
6.1.2. Применение алгоритма балансировки, В некоторых
частных случаях для решения некорректных транспортных задач
можно использовать рассмотренный выше метод балансировки. Будем
рассматривать двухиндексные транспортные задачи при точном
задании ограничений. Как следует из предыдущего параграфа,
нормальное решение такой некорректной задачи может быть
найдено минимизацией функции (6.6) при ограничениях (6.2)
и Р->-оо. Но функция (6.6) получена подстановкой v^ из (6.5),
а максимизация функции (6.7) при ограничениях (6.2)
представляет собой не что иное как задачу {333}. Таким образом, решая
последовательность таких задач при р ->• оо и v^, определяемом
в соответствии с (6.5), можно получить последовательность Х$,
которая в пределе дает нормальное решение рассматриваемой
некорректной транспортной задачи.
Для каждой из задач {333} исходными данными являются
вероятности v^ (6.5), зависящие, в свою очередь, от решения
этой задачи С (X).
Следовательно, необходимо организовать «внутренний цикл»
для решения уравнения С (Х$ (С (Хр))) = С (Ар).
Последовательность действий в этом цикле следующая:
1) Выбрать произвольно С8.
2) В соответствии с (6.5) получить матрицу {vf^} и произвести
ее балансировку (5.2) — (5.3).
3) Для полученной матрицы Xs определить С (Xs) и, если
\ С (Xs) — С8 | <^ 8, положить Х$ = Xs; в противном случае
принять Cs+1 = С (Xs) и перейти к пункту 2 (здесь s — номер
внутренней итерации).
6.1.3. Пример. Даны три пункта производства и три пункта
потребления однородного продукта с объемами производства
<?, = 7, Q2 = 2, <?а = 5, спроса Р1 = 4, Р2 = 6, Р3 = 4. Заданы
транспортные издержки (табл. Д.6.1). Необходимо найти
матрицу перевозок X = {xtj}, которая минимизирует общие
транспортные издержки.
Данная задача имеет бесконечное множество решений,
лежащих на отрезке IX1, X2] (X1 — (табл. Д.6.2), X2 — (табл.
Д.6.3)).
Любое такое решение может быть записано как X = \iXx +
-4- (1 — \х)Х2, где 0 < \i < 1. Заметим, что при р, = 0,5
возможно еще одно целочисленное решение задачи (табл. Д.6.4).
21$ ДОПОЛНЕНИЕ ilff. С. ИМЕЛЬВАЕВ. В. Л. ШМУЛЬЯН)
Таблица Д.6.1 Таблица Д.6.2 Таблица Д.6.3 Таблица Д.6.4
1 IT» (у, = 0,5) 1
0
5
2
1
1
0
3 1
0 |
2 1
Таблица Д.6.5
h
\с(Х)
X
! o,oooi
41,8
1,99
3,01
2,00
0,57
0,86
0,57
1,43
2,13
1,43
0,001
41,6
1,94
3,06
1,99
0,58
0,88
0,55
1,48
!2,06
1,46
0,01
39,6
1,47
3,58
1,94
0,62
1,01
0,37
1,90
1,41
1,69
0,1
35,1
0,10
4,82
2,07
0,81
1,17
0,02
3,09
0,00
1,91
В таблице Д.6.5 приведена последовательность pfc,
к = 1, 2,... и соответствующие ей решения, полученные в результате
использования описанного алгоритма. Решение, полученное дли
Р = 0,1, уже достаточно близко к искомому нормальному решению*
лежащему на отрезке [X1, X2] (\i = 0,45) со значением целевой
функции С (X) = 35. Аналогичные расчеты были проведены с
матрицами цен {С^}, в которые были внесены случайные ошибки,
равные 20 и 40% от первоначальной величины. Полученные при
этом решения оказались близкими к нормальному решению,
полученному при нулевой ошибке 6=0.
6.2. Связь с моделями статистической физики. Рассмотрим
некоторые модели статистической физики *). Традиционно они
носят названия «распределений», чем подчеркнут основной
результат — распределение некоторых частиц по определенным
группам. Ниже показано, что эти «распределения»
соответствуют моделям стохастических коммуникационных систем. В основе
этого соответствия лежат, разумеется, общие для тех и других
моделей предположения (см. §§ 1, 2).
6.2.1. Распределение Больцмана. В этой модели
рассматривается идеальный газ, причем N частиц (молекул), имеющих
суммарную энергию Е, случайно распределяются по «т» энерге-
. *) См, Л. Д. Ландау, К. М. Лифшиц [2*].
4
2
4
С
3
2
5
2
3
3
ХХ
0
6
1
(и =
2
0
0
1)
2
0
3
X2
0
4
3
(Ц =
0
2
0
0)
4
0
1
§ 6. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ И ИНТЕРПРЕТАЦИИ
217
тическим ячейкам, в каждой из которых одна частица имеет
энергию ег. Требуется найти устойчивое распределение частиц,
максимизирующее энтропию системы при условиях ^х^ — Е,
г
21 ^г = N. Таким образом, эта задача сводится к модели {112} при
г
п = 1 (один источник), Lf — &t, iVXcp =E и потоки в этой модели
(см. табл. 2.1)
xi = -£exp(—Kei),
где индекс j опущен, А = 2ехР(~~ ^80 представляет собой ста-
г
тистическую сумму (это же название для А использовано и в
таблицах моделей), X — является решением уравнения
2в{вхр(— %Ei) = AE/N.
г
Обозначая X = 1/Г, где Г — абсолютная температура газа,
получаем классическую формулу для распределения Больцмана.
6.2.2. Распределение Гиббса. В этой модели вместо отдельных
молекул рассматриваются их коллективы, являющиеся
относительно малыми, но в то же время макроскопическими объектами.
Поэтому вместо числа коллективов в энергетической ячейке
пользуются понятием вероятности попадания каждого коллектива в него
о)г^-^- = -3-ехр(— ЬеО,
где X — решение уравнения 2 ъ% вхр (— Хг{) = АЕ. Используя те же
г
обозначения, что и в предыдущей модели, получаем стандартную
форму распределения Гиббса.
6.2.3. Распределение Гиббса с переменным числом частиц.
Пусть теперь в системе существует несколько видов коллективов
/ = 1, . . ., п с Ц частицами в коллективе каждого вида.
Введем обозначения: LjJp — среднее число частиц в этих
коллективах, N — общее число коллективов в системе, xtj — число
коллективов вида /, находящихся в энергетической ячейке е*;
Lf = et — величина энергии, соответствующая энергетической
ячейке i; NLlv = E —- общая энергия системы.
При^этих обозначениях закон сохранения энергии для данной
системы можно записать *в виде
2jXi$L\ =fciVLCp.
9 А. Дж. Вильсон
218 ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
Общее число частиц в системе удовлетворяет равенству
ц
Условие замкнутости системы имеет вид
ij
Таким образом, равновесное состояние системы может быть
найдено как решение задачи {122}
х% = -£ ехр (— aLf — )3LJ),
где А = S ехр (-— aLf -^fiLj).
Используя физические обозначения переменных Ц = п, х% =
а = 1/Г, Р = — \i/T,
получим выражение, совпадающее с большим каноническим
распределением Гиббса
in
Интересно отметить, что величина Т = 1/а, где а — параметр
в решении задачи {122}, в физике носит название абсолютной
температуры; \i = — р/а, где аир параметры решения задачи
{122}, 'называется химическим потенциалом, (oin — представляет
собой вероятность того, что коллектив содержит п частиц и
находится при этом в i-ж энергетической ячейке.
6.3. Теория информации. В настоящее время принято
отождествление термодинамического и информационного понятия энтропии
и даже более того, если рассматривать лишь первую
вариационную задачу теории информации и задачу, решение которой
приводит к распределению Больцмана в статистической механике,
то обе теории считаются «изоморфными» друг другу *). В таком
случае модели коммуникационных систем, которые по сути дела
являются обобщениями моделей статистической физики, должны
быть, по-видимому, как-то связаны и с теорией информации.
Напомним, что количество информации, которое можно
записать или передать, определяется логарифмом числа различных
реализаций записи или передачи. Оборудование, осуществляющее
передачу или хранение этой информации, накладывает опреде-
ехр
*) См. Р. Л. Стратанович [!*]•
§ 6. НЕКОТОРЫЕ ПРИЛОЖЕНИЯ И ИНТЕРПРЕТАЦИИ
219
ленные требования к реализациям записей или передач, так что
не все реализации могут быть переданы или записаны даже при
отсутствии помех. Параметры оборудования, позволяющие
выделить множество допустимых реализаций, называются
характеристиками канала передачи информации без помех. Подсчет
числа допустимых реализаций во многих случаях оказывается
невозможным, поэтому на практике пользуются лишь
определенной оценкой этой величины. Такой оценкой можно, например,
считать максимальное значение энтропии, подсчитанной для всех
допустимых распределений. Это максимальное значение
называется пропускной способностью канала без помех.
Обратимся к модели {112}. Пусть соответствующая система
содержит всего один исток, когда величины хц/N (/ = 1) можно
рассматривать как значения некоторой дискретной функции р (у)9
определенной на множестве стоков (а поскольку / = 1, то и
коммуникаций) системы. Аналогично характеристики стоков Lf могут
быть рассмотрены как некоторая другая функция с (у),
определенная на том же дискретном множестве Y. Пусть ^ —
дискретная случайная величина, а р (у), удовлетворяющая условию
2 Р(У) = 1 — дискретное распределение этой случайной величи-
ны. Тогда для любого заданного распределения р (у) можно
определить среднюю величину функции с (у). Если на это среднее
значение наложено ограничение
S P(y)c(y) = L%v>
то ему будет соответствовать определенное допустимое множество
реализаций случайной величины р (у). Теперь, если множеству У,
величинам с (у) и L£p придать информационный смысл, то в
соответствии с приведенным выше определением они будут
характеризовать дискретный канал без помех, а максимальное значение
энтропии Н (р (у)) = — % р(у)1пр (у) по всем допустимым р (у) —
ее пропускную способность. Другими словами, получена задача,
max[— S Р(У)1пр(У)]>
Ну) у6^
(6.9)
называемая в теории информации первой вариационной задачей.
С учетом ранее принятых обозначений
Р (У) = {Xij/N, 7 = 1» « = 1,..., т>,
c(y) = {L%f * = 1,...,лг}
9*
220 " ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБАЕд, Б. Л. ШМУЛЬЯН) i""***,
данная задача будет иметь вид ^j* *
max [— 4" XlXij ln Xii + ln ^]' ft * *
2^ = лг, ЪъД^пьъ
cp-
*v *
Таким образом, с точностью до постоянных множителя UN и •
слагаемого In N в максимизируемой функции получена модель \ •
{112}, которая аналогична первой вариационной задаче теории
информации.
В заключение отметим, что множество Y можно
рассматривать, например, как множество различных символов в сообщениях, *
каждое значение с (у) — как длину кодового слова каждого сим- *
вола или энергию, затрачиваемую на его передачу (запись),
а каждую из величин Np (у) — как частоту, с которой может
встретиться в сообщении каждый символ, если N — общее число С; (|
символов в сообщении. Теперь, если длина закодированного^;^
сообщения или количество энергии, затрачиваемое на его пере-ж\*
дачу (запись), ограничены величиной iVX£p, то решение первой35^'
вариационной задачи дает ответ на вопрос, какое максимальное
количество (больцмановской) информации может быть передано
или записано данным устройством и какая при этом должна быть
частота встречи каждого символа в сообщении. Если, например,
в поступившем сообщении частоты символов отличаются от
оптимального распределения, то это значит, что при передаче или
записи этого сообщения будет использована не вся пропускная
способность рассматриваемого устройства.
§ 7. Моделирование и анализ процессов миграции
населения в городах
Характерной чертой современности является быстрый рост
городов. Это порождает целый ряд проблем, связанных с
управлением городами. Одна из них — это проблема развития
транспорта в городе. Если бы города были совершенно
симметричными и однородными, то, по-видимому, их транспортная
сеть обладала бы этим же свойством и рост городов привел бы
лишь к физическому увеличению количества стандартных
участков транспортной сети. На самом деле, с одной стороны, рельеф
той местности, где располагаются города, и история их развития,
а с другой — необходимость концентрации населения для
производственной деятельности на небольших и неравномерно
распределенных по территории города участках, чрезвычайно
усложняет как вопросы проектирования транспортной системы городов,
так и вопросы размещения в них новых предприятий. Ошибочное
§ 7. МОДЕЛИРОВАНИЕ И АНАЛИЗ ПРОЦЕССОВ МИГРАЦИИ 221
решение этих вопросов может привести к перегрузкам
транспортной системы в самых неожиданных ее участках, поскольку каждый
новый участок сети и новое предприятие связано с изменением
пассажирских потоков на всей территории города. Одним из
способов, позволяющих оценивать правильность таких решений,
является моделирование миграции населения в городах.
7.1. Модели миграции населения как частный случай моделей
коммуникационных систем. В § 1 было уже отмечено, что при
моделировании миграции населения в городах большое
распространение получили энтропийные модели. Необходимым
условием использования этих моделей является наличие большого
количества изучаемых объектов независимо от их природы. Именно
это условие достаточно хорошо выполняется в больших городах.
Обратимся к моделям коммуникационных систем, предполагая,
что частицами в них являются пассажиры, коммуникациями —
транспортная сеть, а стоками и истоками — пункты, через которые
город связан с транспортной сетью.
7.1.1. Модели {111} — {133}. Здесь предполагается, что
распределение частиц по коммуникациям не зависит от
характеристик последних. Это предположение вряд ли можно оправдать
для реального поведения пассажиров, поскольку им
небезразлично время или другие характеристики поездки.
Следовательно, модели типа «1» не нашли и вряд ли найдут
свое применение в практических расчетах.
7.1.2. Модели {211} — {233}. Здесь используется информация
о средней величине характеристик коммуникаций. В
транспортных системах средней величиной характеристик является
среднее время (или стоимость) поездок по городу, которое в течение
длительного времени остается слабо меняющимся показателем
транспортной системы каждого города. При использовании такой
информации общие затраты времени (денег) всех пассажиров
оказываются уже ограниченными, поэтому время любой поездки
не может выбираться произвольно.
Предположим, что планируется построить новый город, в
котором известны районы расселения, приложения труда и задана
транспортная сеть. Если предположить, что среднее время
поездок в этом городе, через несколько лет после его заселения будет
таким же, как и у аналогичных городов, то наиболее
правдоподобные распределения жителей по районам расселения, рабочих
мест — по местам приложения труда, а также значения
пассажирских потоков на сети можно получить при использовании
модели {211}.
Аналогичную задачу можно решить при необходимости
обеспечения средней удаленности районов расселения от центра
города. При этом, если средняя удаленность предприятий
неизвестна, то для решения задачи используется схема модели {221}.
<
222 ДОПОЛНЕНИЕ (ЯГ. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
Заметим, что под средней удаленностью здесь понимается
2 «А 2 «Л
ще £^. — население .района, a Lj — удаление района / от центра.
В противоположной ситуации, когда задана средняя
удаленность предприятий от некоторого центра, а средняя удаленность
районов расселения безразлична, решение может быть получено
при помощи модели {212} и, наконец, если задана и та и другая
величина, то при помощи модели {222}.
Рассмотрим теперь город, в котором предстоит построить
несколько предприятий. В этом случае распределение жителей
по различным районам уже известно. Распределение же рабочих
мест по предприятиям может быть получено при помощи модели
{231}, если средняя удаленность предприятий не прогнозируема,
и при помощи модели {232}, когда эта величина задана. В
противоположной ситуации, когда известно распределение рабочих
мест по предприятиям, а жилые районы еще не застроены, следует
пользоваться моделями {213} и {223}.
Наконец, модель {233} представляет собой широко известную
в градостроительстве модель максимизации энтропии, которая
позволяет рассчитывать пассажирские потоки в городе при
заданном пассажирообороте пунктов прибытия и отправления, а также
заданном среднем времени поездок (см. многочисленные модели [В]).
7.1.3. Модели {311} — {333}. Эти модели отличаются от
предыдущих тем, что вместо средней величины характеристик
коммуникаций в них используется вероятность связи между районами
в виде матрицы {v*7}. Такая матрица определяется по времени
(или обобщенной стоимости [В]) сообщения между районами
согласно заданной функции / (t). В транспортных системах
возможно использование двух типов перехода от / (t) к v^ в
соответствии с определениями (2.15) и (2.16).
Если в моделях {211} — {233} функция / (t) получается в
результате решения задачи и поэтому при линейном ограничении
является всегда экспоненциальной, что не всегда соответствует
результатам экспериментов, то в моделях {311} — {333} она
может быть согласована с экспериментальными данными.
Заметим, что модель {333} уже давно используется на практике для
расчета пассажирских потоков в городах и носит название
метода балансировки взаимных корреспонденции (см. § 5) с другим
определением v^.
7.1.4. Модели {411} — {433}. Эти модели являются
совершенно новыми. Разработка их вызвана тем, что модели {311} — {333}
искажают априорное распределение / (t) (см. § 3).
§ 7. МОДЕЛИРОВАНИЕ И АНАЛИЗ ПРОЦЕССОВ МИГРАЦИИ
Кроме возможности точного воспроизведения априорной
информации, модели типа «4» могут использоваться при наличии
нескольких маршрутов между районами города, нескольких
видов транспорта и т. д. (см. § 4).
7.2. Реализация комплексной модели пассажиропотоков.
7.2.1. Описание модели. Рассмотрим методику использования
описанных обобщений для прогнозирования пассажирских
потоков на массовом (общественном) и индивидуальном транспорте.
Пусть территория города разбита на районы, для которых
получены прогнозы относительно количества пассажиров,
прибывающих и убывающих в каждый район. Предположим, что эти
районы соединены проектируемой сетью массового и
индивидуального транспорта с заданным объемом перевозок. Данному объему
информации, очевидно, соответствует обобщение модели {433}
(см. 4.2.3), в которой ограничения (3.16) заменены двумя
ограничениями на объемы перевозок каждым видом транспорта (4.25).
Характерной особенностью информации в задаче прогноза
является то, что распределения пассажиров по времени для
обоих видов транспорта не могут быть заданы точно. Однако
можно прогнозировать их форму, а также параметры — в
частности, среднее время.
Следовательно, применение модели {433} в полном объеме
для точного воспроизведения априорного распределения
нецелесообразно. Здесь естественно использовать эту модель с двумя
слоями по индексу «к» (соответственно двум видам транспорта),
а в каждом из них определять значения вероятностей v^ в
соответствии с моделью типа «3».
Таким образом, модель задачи здесь следующая:
max > хцк In г*к ,
2j%ijk == *ii 1 = 1,..., 771,
Jfc
S*ij* = #j. 7=1,..., П. С7'1)
2**Л = ЛГ* A = 1.2,
v
где Pi9 Qj соответственно — суммарные количества въезжающих
в район и выезжающих из него пассажиров; N-ц — общие
количества пассажиров в городе, передвигающихся на массовом (к = 1)
и индивидуальном (к = 2) транспортах. Значения v^-fe здесь
определяются в соответствии с обобщениями § 4 (см. (4.24))
224 ДОПОЛНЕНИЕ (ЯГ. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
где F{ — априорное число пассажиров, передвигающихся по
маршрутам со временем ttjk из интервала Д£, пк — число
соответствующих маршрутов, I = 1, . , ., Lk — номера интервалов
на осях времени для обоих видов транспорта.
7.2.2. Учет информации о параметрах распределений.
Информацию о прогнозируемых значениях 1к — средних времен
передвижения пассажиров на разных видах транспорта можно учесть
различными способами. Все они используют априорное
распределение пассажиров по времени в виде непрерывных
нормированных кривых fk (£, Pi, . . ., pr, 7fe), причем
'max
*fc = § t-fkih, Рь- • .>Pr» tk)dt.
о
1°. Первый способ состоите добавлении к задаче (7.1) условий
2*ij/^ij/c=--Wfc7fr (7.2)
ij
соответствующего определению среднего времени по потокам xijk.
Решение задачи (7.1) — (7.2) имеет вид
*№ = а1Ь№ vo*fc exp (Mi*). (7.3)
где аи bj, ^—коэффициенты балансировки по ограничениям
(7.1), Хк — множители Лагранжа при ограничениях (7.2).
Для определения параметров решения (7.3) можно организовать
итерационный процесс по переменным Хк, на каждом шаге
которого методом балансировки (см. §|5) определять коэффициенты
аи Ьу, ск. Полученное решение можно интерпретировать как
соответствующее модели {433} при
vw = vw exp (XktiJk). (7.4)
Иными словами, для обеспечения заданного среднего времени
вводится экспоненциальная поправка к априорному
распределению. Разумеется, такой конкретный вид поправки вряд ли
всегда может быть оправдан. Кроме того, остается открытым
вопрос о назначении параметров рь . . ., рг в априорном
распределении. <
2°. Второй способ заключается в отказе от использования
ограничения (7.2). При этом потоки определяются в стандартном
виде7#гд = CLibjCbVift, и поскольку vtjk зависит от рь . . ., рг,
то и Xtjk = xijk (Pi, . . ., рг). Следовательно, при фиксированных
значениях параметров распределения можно вычислить
h (Ръ • • • > Рг) = jf /, bijhxHk (Ръ • • •» Рг)
§ 7. МОДЕЛИРОВАНИЕ И АНАЛИЗ ПРОЦЕССОВ МИГРАЦИИ 225
и организовать итерационный процесс для минимизации
расхождения между |к и I, т, е. найти
min 2('*(Рь-.-.М-7*>». (7.5)
Pit .-, Pr fr=l
Особенно просто эта процедура реализуется при двух
неизвестных параметрах (по числу ограничений в последней группе (7.1)).
Здесь она сводится к решению системы уравнений
h (Pi, Р2) = 1ь (7.6)
h (Рь Рг) = *2-
Такая система может быть решена, например, обобщенным
методом хорд *).
7.2.3. Исходные данные к расчету. Для реализации расчета
помимо информации об объемах районов по въездам и выездам
(Piy Qj), а также JVk, необходима информация о t^ — времени связи
между всеми районами на общественном и индивидуальном
транспорте.
Эта последняя информация может быть получена, если
задана транспортная сеть города, т. е. точки на плане города,
соединяющие их ребра и время передвижения по ребрам. Кроме
того, необходимо некоторое предположение о маршрутах
передвижения пассажиров между районами. Практически
общепризнанным является предположение, что пассажиры передвигаются
по кратчайшим в смысле времени маршрутам. Это предположение,
видимо, близко к истинному для массового транспорта, однако
для передвижений индивидуальным транспортом может
показаться спорным. Во всяком случае, его реализация на ЭВМ
сравнительно проста, что и служит решающим доводом к принятию
такого предположения.
Наличие информации о транспортной сети города позволяет
решить основную для градостроителей задачу: определить
нагрузки на отдельные участки сети, т. е. суммировать потоки между
районами, маршруты между которыми проходят через
рассматриваемые ребра. Именно этот результат (а также ряд обобщенных
характеристик сети) предъявляется проектировщикам и служит
основанием для оценки вариантов построения сети.
7*2.4. Некоторые характеристики комплекса программ,
реализующего модель миграции. Для реализации изложенной
модели был создан комплекс программ. Работа производилась по
*) См. А. М. Островский [1*].
226 ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБЛЕВ, Б. Л. ШМУЛЬЯН)
заказу НИПИГенплана г. Москвы и при активном участии его
сотрудников *). Основные блоки его следующие:
1) Ввод исходной информации о транспортной сети.
2) Проверка информации на грубые ошибки и организация
тестов.
3) Расчет матрицы кратчайших путей.
4) Балансировка матрицы корреспонденции.
5) Наложение корреспонденции на транспортную сеть.
6) Расчет характеристик транспортной системы.
Рис. Д. 7.1. Типичные кривые гамма-распределения.
Следует особо выделить блок 3, в котором используется
оригинальный алгоритм расчета дерева кратчайших путей **),
позволяющий уменьшить время расчета почти на порядок по сравнению
с классическими алгоритмами.
В блоке 4 использовалась прогнозная информация о средних
временах передвижения пассажиров ?fc. Был принят второй
способ учета информации о 7fc (см. 7.2.2, п. 2°). При этом
распределение пассажиров по времени принято в виде гамма-распределения
/k(*.Pk,a*)=-f^j-'e*'"1«'V-
Это несимметричное распределение со средним значением 1к =
= cifc/Pfc и смещением моды относительно среднего на l/pfe влево.
Типичные кривые показаны на рис. Д.7.1.
*) Со стороны НИПИГенплана в работе принимала участие группа
мастерской транспорта и дорог (рук. Ю. К. Б о лбот) под руководством Ю. В. Ко-
роткова, И. С. Пахомовой, Л. М. Шапир. Программное обеспечение
разработали под руководством Б. Л. Шмульяна сотрудники ВНИИ системных
исследований А. Р. Битман, Е.А.Диниц, Ш. С. Имельбаев, А. В. Карзанов, -
Г. М. Кирсанова.
**) См. М. Ф. Филлер [1*].
§ 7. МОДЕЛИРОВАНИЕ И АНАЛИЗ ПРОЦЕССОВ МИГРАЦИИ 227
Количественные характеристики расчета следующие (г.
Москва, расчетный срок Генерального плана): — 750 районов,
— 4100 точек на транспортном графе, —14000 ребер.
7.3. Некоторые результаты. Были исследованы распределения
пассажирских потоков в городе, отличающиеся целями
передвижений пассажиров (трудовые и культурно-бытовые), а также
значениями \. На рис. Д.7.2 показаны полученные кривые
Рис. Д. 7.2. Распределения поездок.
распределения поездок на массовом транспорте (2 — для
трудовых поездок, 2 — культурно-бытовых поездок, а также 3 —
распределение числа связей; по оси абсцисс — время в мин).
Интересно отметить взаимное расположение этих кривых.
После загрузки сети оказалось, что культурно-бытовые поездки
(среднее время поездок на транспорте — 38 мин) больше всего
загружают проектируемые хордовые линии метро, а трудовые
поездки- (среднее время ~ 35 мин) — радиальные линии метро
и существующую кольцевую линию. Это объясняется тем, что
большинство кратчайших путей, имеющих время > 38 мин,
проходят через хордовые линии, в то время как пути, имеющие
время —35 мин, проходят чаще по радиальным и кольцевой линии
метро. Таким образом, заданием для общественного
транспорта при культурно-бытовых поездках 7г = 38 мин заранее была
обеспечена преимущественная нагрузка на хордовые линии по
сравнению с остальными, а при трудовых поездках (1г = 35 мин) —
228 ДОПОЛНЕНИЕ (ЯГ. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
на радиальные и кольцевую линии. Аналогично, выделяя на
сети группу кратчайших путей с одинаковыми временами и меняя
Рис. Д. 7.3.
соответствующее среднее время поездок, можно значительно
изменять нагрузку на эту группу путей, добиваясь тем самым
совпадения с реальными или прогнозируемыми величинами, если
они известны.
§ 7. МОДЕЛИРОВАНИЕ И АНАЛИЗ ПРОЦЕССОВ МИГРАЦИИ
Как уже отмечалось, важным отличием данной модели от
ранее существовавших является учет естественной частоты,
с которой встречаются пути разной протяженности, т. е.
использование кривой распределения времени связей. Для сравнения
предлагаемого и существующего метода были проведены^допол-
нительные эксперименты с культурно-бытовыми поездками.
10 20 W W 50 60 Т,мин
Ънс. Д. 7.4. Распределения для поездок на массовом транспорте при
равномерном априорном распределении.
В первом эксперименте для расчетов без учета частоты
связей были выбраны те же значения параметров рх и р2» чт0 и в
основном расчете. На рис. Д.7.3, а, и Д.7.3, б приведены
полученные при этом кривые распределения времени поездок
соответственно для общественного и индивидуального транспорта.
Здесь: 1 — априорное распределение (гамма-распределение
с параметрами: 1г = 38 мин, рх = 0,06, 12 = 32 мин, р2 ^ 0»09);
2 — распределение числа связей; 3 — апостериорное
распределение времени поездок с учетом распределения числа связей;
4 — то же без учета этого распределения.
Заметим, что априорное распределение для индивидуального
транспорта несогласовано с информацией о связях, так как в
интервалах времени 0 — 15 мин и свыше 55 мин в рассматриваемой
сети нет ни одной связи (см. замечание 1, § 2.2.3). Следовательно,
априорное распределение должно быть обнулено в этих
интервалах и пропорционально увеличено в остальных. При этом
априорное и апостериорное распределения (с учетом
распределения числа связей) практически совпадают. В последних двух
экспериментах в качестве исходной функции распределения
230 ДОПОЛНЕНИЕ (Ш. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯН)
времени поездок выбиралось равномерное распределение, а не
гамма-функция. Расчеты были проведены с учетом и без учета
частоты связей. На рис. Д.7.4 отражены результаты, полученные
для массового транспорта: 1 — распределение числа связей;
2 — апостериорное распределение времени поездок с учетом
распределения числа связей; 3 — то же без учета этого
распределения. Даже с учетом частоты распределения связей расхождение
между априорным и апостериорным распределениями достаточно
велико. Здесь, видимо, необходимо применение модели «4» в
полном объеме.
§ 8. Доказательство сходимости трехмерной балансировки
В § 5 было показано, что существуют две эквивалентные формы
проведения процесса балансировки — в /rmZ-мерном пространстве переменных
х\зк и в (m + п + Z)~MePH0M пространстве параметров a*, bjy c^.
Доказательство сходимости удобнее производить в этом последнем пространстве, точнее
в пространстве множителей Лагранжа а,- == —In щ — 1, fij = —In bj,
Yfr = —In Cfc. Введем обозначения
£ = {5l>- • •» %т+п+к} = (al»- * •' a™» Pl>» • •> Pm Yl>- • м Yl)i~
Доказательство сходимости процесса трехмерной балансировки в этом
пространстве можно свести к доказательству его эквивалентности методу
покоординатного спуска при безусловной минимизации определенным образом
построенной функции Н (g). При этом, если бы функция Я (|) была строго
выпуклой, то из сходимости метода покоординатного спуска, применяемого
для строго выпуклых функций, следовала бы сходимость метода
балансировки. Однако в действительности функция Н (£) не является строго выпуклой,
и метод покоординатного спуска может гарантировать лишь сходимость
проекций вектора £ на ортогональное дополнение к области вырождения функции
Н (£). Но множество всех точек, проекции которых на это ортогональное
дополнение дают единственную точку, в пространстве переменных X
оказывается определяет также единственную точку, удовлетворяющую условиям
экстремума задачи (4331. Таким образом, сходимость проекций точек g на
ортогональное дополнение к области вырождения #"(£) в пространстве
Ет+п+г, обеспечивает сходимость переменных X к решению задачи /433},
если в предельной точке удовлетворяются ограничения задачи. Перейдем к
дока зате л ьству.
1. Построим функцию*// (£). Функция Лагранжа в задаче {433} имеет вид
(см. (3.15)-(3.17))
L (X, а, р, у)]= ^ хцх In -jig. + S ai (Pi "" Ij *ij*) +
ijk г jk
+Yj pi (<?j - Yj х^)+Yj t* (f k ~ Xxuk) ■ (8л)
j ik к г}
Решение задачи, получаемое из условия dL/dxjfy = 0, представимо в виде
«U* = vo'ft ехр (-1 — as — Pj - ук). (8.2)
Исключим хф из (8.1), используя (8.2), и перейдем, таким образом, только
§ 8. СХОДИМОСТЬ ТРЕХМЕРНОЙ БАЛАНСИРОВКИ 2Э1
к переменным а, р, у
#(а, Р, у) =21 v*ifcexP (- 1 - <Ч - р,- - yfe) X
X In (vjjfc/(Vijk (exp (_ i _ oj - p,- - vk))) + 2 сцР* -
i
- Saiv«'fc exP (- * - «i-pj - Yfe)+ S P#i- S Р^*Л exP (-1-at- pi—Yft)+
+ 2 ?*** "" S VfcViifc exp (_ l — ai — pj — Yfc). (8.3)
fe ijfc
Используя обозначение вектора £, после сокращений получим
Я (« «= S Viife 6XP (- f - ^i - *m+j ~ ^m+n+fe) +
+2 *Л + 2!m+A- + 2 U+*ft- (8-4)
J У fc
2. Докажем, что функция Я (£) выпуклая.
Для доказательства этого фактора достаточно показать, что V2# (£) —
гессиан Я (|), является неотрицательно определенной матрицей.
Учитывая, что Н (£) = Ф (|) + V (£), где
ф «) = S viifc exP (- * - 5i - U* - $m+n+*)> (8.5)
ijk
а ^F (g) — линейная функция от £, исследуем матрицу У2Ф (£). Обозначая
«Pijfc (I) = ^й exp (-1 — & — |m+i - im+n+fc), имеем Ф (5) = 2<PiikK),
ijk
отсюда
ijfe
Легко видеть, что Vtyift (!) = Фол (I) ^ijfe» где Ацк — матрица,
заполненная нулями везде, кроме девяти элементов, равных 1 и соответствующих
пересечению столбцов и строк i, m + /, m+ra + fc.
Следовательно, для любого вектора у е #m+n+l
(ТО* «) У, У) =■ 2 (2//V2(Piife «) У) = 2 Wk К) (*i + *m+i + 2/m+n+k)2 > О,
ijfc fjk
причем знак равенства имеет место только при условии
У{ + Ут+} + Ут+п+1с = ° V *, /, Л. (8.6)
Последнее равенство возможно лишь в случае, когда
»iafl. 2/m+i = &» 2/m+n+fc = c и a + & + <?=0.
Обозначим через S* подпространство пространства Em+n+, соответствующее-
(8.6). Сравним теперь векторы
* = {xijk (*i» *m+j' *m+n+k)'
232 ДОПОЛНЕНИЕ (ЯГ. С. ИМЕЛЬБАЕВ, Б. Л. ШМУЛЬЯЩ
Имеем
xih &i + а> Zm+j + Ъ, Zm+n+k + с) =;viik ехр (- 1 - 5j + а - ^+. - Ь -
— Ът+пЩ~~~ с) = vij& ехР (~*~ * ~~ 5* — %m+j ~~ 5m+n+fc) = xijh ^*' ^m+j' ^m+n+k)
в силу (8.6).
Таким образом, двум векторам gx и £2, представимым в виде fc1 = £2 + #,
где # е £*, соответствуют одинаковые векторы X1 и X2.
3. Докажем, что процесс балансировки (5.9) действительно является
методом покоординатного спуска при минимизации функции Н (£).
Предположим, что координаты £т+1> . . ., £m+T4.z вектора g являются
постоянными, а функция Н (|) минимизируется по оставшимся координатам
ii» • • •> Im- Тогда их экстремальные значения могут быть получены из
условий
дН V4
-щ^ = Pi - ехр (- 1 - у 2.J ехР (- Sm+j - ^m+n+k) = 0. (8.7)
Используя обозначения 6* =■ ехр (~^+;), с£ = ехр (— £™+n+fc) Для пост°-
янных координат и а|+1 = ехр (—1 — £|) для переменных на s-ом шаге
координат, получаем первое из соотношений (5.9). Аналогично могут быть
получены и другие соотношения.
4. Пусть {|8} — последовательность точек, образуемых на каждом шаге
минимизации Н (£) описанным методом спуска по группам координат.
Известно, что для выпуклых функций такой метод обеспечивает слабую сходимость
псходимость по функционалу Н (£8) -» Н (£*)) или, иначе говоря, сходимость
роекций точек |8 на ортогональное дополнение к подпространству
вырождения S* функции Н (|). Но в п. 2 доказано, что множеству всех точек,
проектирующихся в проекции £8 на ортогональное дополнение к 5*, соответствует
единственная точка X, которую обозначим Xs. Следовательно,
последовательность {Xs} сходится к некоторой точке X*.
5. Докажем, что Xs сходится к решению задачи {433} и что это решение
X* — единственное.
а) Поскольку связь между Is и Xs осуществляется через соотношение
(8.2), то условия экстремума задачи {433} выполняются на каждом шаге s,
в том числе и в предельной точке X*.
б) Если множество решений задачи {433} не пусто, то в предельной точке
X* выполняются, кроме того, и ограничения типа (8.7). Действительно,
в предельной точке
дН
-щ = 0, i = 1, . . ., т + п + I,
т. е. справедливы соотношения
д\. "~ Рг "~~ 2-А V*# 6ХР ^~~ * "" ^ ~" ^т+?"" ^т+п+^'
дН \У
Ж— = Qj - 2j Viife 6ХР (~~ 1 ~ *i~ ^m+i ~~ *»№»*>»
'т+> Ж
i = l, . . ., то,
/ = !,..., «,
(8.8)
ая
§ 8. СХОДИМОСТЬ ТРЕХМЕРНОЙ БАЛАНСИРОВКИ 233
Но с учетом (8.2) эти соотношения представляют собой не что иное, как
ограничения задачи {433}. Пусть Vx — подпространство X, образованное
координатами x\jfa для которых V|j> = 0; V2 — множество векторов X,
удовлетворяющих ограничениям задачи {433}. Тогда, если пересечение Уг f] V2
не пусто, то в предельной точке справедливы соотношения (8.8). Заметим, что
в силу (8.2) функция
не зависит от тех координат, где v^ = О» поэтому ее достаточно
рассматривать лишь на подпространстве отличных от нуля x\fc
в) Единственность решения X* следует из сильной вогнутости (8.9) при
яЦк > 0 (см- утверждение 6.1).
В заключение доказательства отметим, что скорость сходимости
процесса, так же как и метода покоординатного спуска *), определяется
соотношением
||Х08-Х*Р<Лехр(~а*), где а>0.
*) См., например, книгу В. Г. Кармаиова [1*].
ЛИТЕРАТУРА
А б р а м о в и ч Э. Г., ЛившицВ.В.
1.* Определение функции тяготения и проверка гравитационной модели
трудового расселения на материале натурных обследований городов,—
В кн.: В помощь проектировщику-градостроителю, Киев: Будивель-
ник, 1972, с. 48—54.
А р т л ь (Artie R.)
1. On some methods and problems in the study of metropolitan
economics.— Pap. Reg. Sci. Ass., 1961, 8, p. 71—87.
2. Studies in the structure of the Stockholm economy. University of
Columbia Press, New York; 1965.
Белинский А. Ю.
1*. Прогнозирование межселенных пассажиропотоков к центру
агломерации.— В кн.: В помощь проектировщику-градостроителю, Киев:
Будивельник, 1971, вып. 4, с. 21—25.
Берри (Berry В. J. L.)
1. Cities as systems within systems of cities,— Pap. Reg. Sci. Ass., 1964,
13, p. 147-163.
2. Geography of market centers and retail distribution. Prentice Hall, En-
glewood Cliffs, N. J., 1967.
Блэкберн (Blackburn A. J.)
1. On a class of market share functions.— Working Paper number 27, Center
for Environmental Studies, London, 1969.
Брановицкая СВ.
1*. Алгоритм определения перспективных перевозок городского
пассажирского потока.— В кн.: Математические методы исследования и
оптимизации систем, Киев: Будивельник, 1970, вып. 3, с, 59—63.
Брановицкая СВ., Заболоцкий Г. А.
1*. Применение математических методов и ЭВМ для расчета перспективных
пассажиропотоков городов.— Труды семинара «Применение
математических методов в экономическом исследовании и планировании»,
Киев, Ин-т кибернетики АН УССР, 1968, вып. 2, с. 12—17.
БрэгманЛ.М.
1*. Доказательство сходимости метода Шелейховского для задачи с
транспортными ограничениями,— ЖВМ и МФ, 1967, № 1, с. 147—156.
Буланже ле, Лиссараж (le Boulanger H., Lissarague P.)
1. Lemodele d'equilibrepreferential.— SyntheseetFormation, 1966, number
27, Direction Scientifique de la SEMA, Paris.
Бэтти (Batty M.)
1. Some problems of calibrating the Lowry model.—Environment and
Planning, 1970, 2, p. 93—114.
В а нд Л. Э.
1*. Динамическая модель процесса расселения в развивающемся городе.—
В кн.: Математические методы в градостроительстве, Киев:
Будивельник, 1966, с. 22—31.
ЛИТЕРАТУРА 235
Вильсон (Wilson A. J.)
1. Gravity models in the physical and social sciences, I: Some
comparisons.— Unpublished Note, MAU—N—13, Ministry of Transport, London,
1966.
2. A statistical theory of spatial distribution models.— Transp. Res., 1967,
1, p. 253—269.
3. Towards] comprehensive; planning models.— Unpublished note, MAU—
N—72, Ministry of Transport, London, 1967.
4. Use of the Darwin—Fowler method for the derivation of the gravity
model.— Unpublished note, MAU—N—81, Ministry of Transport, London,
1967.
5. Modelling and systems "analysis in urban planning.— Nature, London,
1968, 220, p. 963—966.
6. Entropy maximising models in the theory of trip distributions, mode
split and route split.— J. Transp. Econ. Policy, 1969, 3, p. 108—126.
7. Notes on some concepts in social physics,— Pap. Reg. Sci. Ass., 1969,
22, p. 159—193.
8. The use of analogies in geography.— Geogr. Analysis, 1969, 1,
p. 225-233.
9. Developments of some elementary residential location models.— J. Reg.
Sci., 1969, 9, p. 377—385.
10. Advances and problems in distribution modelleing.— Transp. Res., 1970,
4, p. 1-18.
Вильсон, Кируан (Wilson A. G., Kirwan R. M.)
1. Measures of benefits in the evaluating of urban transport improvements.—
Working Paper number 43, Center Environmental studies, London,
1969.
Вильсон, Хаукинс, Хил л, Вэйгон (Wilson A. J., Hawkins
A. F., Hill G., Wagon D. J.)
1. Calibrating and testing the SELNEC transport model.— Reg. Studies,
1969, 3, p. 337-350.
Вольденберг, Берри (Woldenberg M. J., Berry B. J. L)
1. River and central places: analogous systems.— J. Reg. Sci., 1967, 7,
p 129 139.
Вуттон,Пик (Wootton H. J., Pick G. W.)
1. A. model for trips generated by households.— J. Transp.rEcon. Policy,
1967, 1, p. 137—153.
Гиб б с (Gibbs J. W.)
1. Elementary principles in statistical mechanics,— Yale University Press,
New Haven, 1902.
ГогоберидзеА. К.
1*. Математическое моделирование задачи расселения в городе.— Авто-
реф. канд. дис, Тбилиси: Грузинский политехнический ин-т, 1971.
Г о л д м а н (Goldman S.)
1. Information theory.—Prentice Hall, Englewood Cliffs, N. J., 1902.
ГольштейнЕ.Г., ЮдинД.Б.
1*. Задачи линейного программирования транспортного типа.— М.:
Наука, 1969. ,у .- 4 <*
Давидович В. Г.
1*. Количественные закономерности расселения относительно мест
работы.— В кн.: Расселение в городах, М.: Мысль, 1968, с. 43—47.
Д а й е т е р (Dieter К.)
1. Distribution of work trips in Toronto.—rLProc. Am. Soc. Civ. Engrs., 1962.
88, p. 9—28.
Д ж е й н с (Jaynes E. T.)
1. Information theory and statistical mechanics.— Phys. Rev., 1957, 106, p.
620—630.
236 ЛИТЕРАТУРА
I
Дорфман, Самуэльсон, Солоу (Dorfman R., Samuelson P. A.,
Solow R.) |
1. Linear programming and economic analysis,— McGraw-Hill, New York.
1958.
Д у б о в Ю. А., И к о е в а Н. В., И м е л ь б а е в Ш. С,
Кабаков А. Б, К о в а л ь ч у к С. Г., К о п е й к и н А. В., П о п-
к о в Ю. С.,Р язанцев А.Н., ШмульянБ. Л.
1*. Развитие городов и теория управления (обзор и задачи исследования).—
Автоматика и телемеханика, 1975, № 11, с. 93—127.
Заболоцкий Г. А.
1*. Применение ЭВМ для определения перевозок пассажирского
транспорта при перспективном планировании городов.— В кн.:
Математические методы в градостроительстве, Киев: Будивельник, 1966, с.
52—60.
3 а к о в А. И.
1*. О применении марковских цепей в моделировании
внутригородского передвижения.— В кн.: Автоматизация процессов
градостроительного проектирования, Тр./ЦНИИП градостроительства, 1973, с.
28—38.
Имельбаев Ш.С., Ш м у л ь я н Б. Л.
1*. Анализ стохастических коммуникационных систем С применением
термодинамического подхода. — Автоматика и телемеханика: 1977,
№5.
Карманов В. Г.
1*. Математическое программирование.— М.: Наука, 1975.
К а р р и (Curry L.)
1. The random spatial economy : an exploration in settlement theory.— Ann.
Ass. Am. Geographers, 1964, 54, p* 138—146.
К а яр и Ю. Я.
1*. О прогнозировании трудовых корреспонденции. В помощь
проектировщику-градостроителю.— В кн.: Применение мат. методов в
градостроительстве, Киев: Будивельник, 1972, вып. 4, с. 18—21.
К лаф (Clough D. J.)
1. Application of the principle of maximising entropy in the formulation of
hypotheses.— Can. Op. Res. Soc. J., 1964, 2, p. 53—70.
Клир, Валах (Klir J., Valach M.)
1. Cybernetic modelling,—Cliffe Books, London, 1967.
Корди-Хейс (Cordey-Hayes M.)
1. Retail-location model,— Working Paper number 16, Center for Envirom-
mental Studies, London, 1967.
Куандт, Баумоль (Quandt R. E., Baumol W. G.)
1. The demand for abstract transport modes: theory and measurement,—
J. Reg. Sci., 1966, 6, p. 13—26.
К у а р м б и (Quarmby D. A.).
1. Choice of travel mode for the journey to work: some findings.— J. Transp.
Econ. Policy, 1967, 3, p. 273—314.
Кульбак С.
1*. Теория информации и статистика.— М.: Наука, 1967.
Кун, Таккер (Kuhn H. W., Tucker A. W.)
1. Linear inequalities and related systems,— Princeton University Press,
Princeton, 1956.
Лакшманан, Хансен (Laksmanan Т. R., Hansen W; G.)
1. A retail market potential model,— J.Am. Inst. Planners, 1965, 31, p.
134—143.
Ландау Л. Д.," Л и ф ш и ц Е. М.
1*. Механика,— М.: Наука, 1965.
2*. Статистическая физика.— М.: Наука, 1964.
ЛИТЕРАТУРА
237
Леонтьев, Страут (Leontief W., Strout A.)
1. Multi-regional input-output analysis.—In: Structural
Interdependence and Economic Development/Ed. Т. Ваша, Macmillan, London,
1963.
Лившиц В. В.
1*. Математическая модель случайно-детерминированного выбора и ее
применение для расчета трудовых корреспонденции.— В кн.:
Автоматизация процессов градостроительного проектирования, Тр./ЦНИИП
градостроительства, 1973, с. 28—38.
2*. Метод математического моделирования динамики городского
расселения.— В кн.: Применение математических методов и вычислительной
техники в градостроительных задачах, Тр./ЦНИИП
градостроительства, 1971, с. 39—57.
Линдлей4 (Lindley D. V.)
1. Introduction to probability and statistics from a Bayesian view-point,—
Cambridge Univ. Press, London, 1965.
Л о у б а л (Loubal P.)
1. A mathematical model for Traffic forecasting,— Ph. D. Thesis, Univ. of
California, Berkeley, 1968.
Л о у р и (Lowry^I. S.)
1. Location parameters in the Pittsburg model.— Pap. Reg. Sci. Ass., 1963,
11, p. 145-165.
2. A model of metropolis.— RM—4125—RC, Rand corporation, Santa Monica,
1964.
Малишевский А. В.
1*. Натуральные системы.— Автоматика' и телемеханика, 1973, № 3,
с. 97-109.
Map т"и н, Меммотт, Боун (Martin В. V., Memmott F. W.,
Bone A.J.)
1. Principles and ^techniques of predicting future demand for urban area
transportation.— Res. Report number 38, Mass» Inst, of Technology,
Cambridge, Mass., 1961.
Мартынов В. А.
1*. Закономерности распределения культурно-бытовых передвижений по
затратам времени.— В кн.: В помощь проектировщику-градостроителю,
Киев,: Будивельник, 1971, вып. 4, с. 15—21.
Мерчланд (Murchland J. D.)
1, Some remarks on the gravity model of trip distribution and an
equivalent maximising procedure.— mimeo., LSE—TNT—38, London School
of Economics, London, 1966.
Мовшович CM.
1*. Последовательное проектирование и покоординатная минимизация при
решении задач выпуклого программирования.— Экономика и
математические методы, 1976, т. 12, вып. 3, с. 551—557.
М о г р и д ж (Mogridge M. G. Н.)
1. Some factors influencing the income distribution of households within a
city region.— Studies in Regional Sciences (Ed. A. J. Scott, Pion),
London, 1969.
Мэрфи (Murphy R. E.)
1. Adaptive processes in economic systems.— Academic Press, New York,
1965.
Нейдеркорн, Бехдолт (Niedercom J. A., Bechdolt B. V.)
1. An economic derivation of the «gravity law» of spatial interaction.—
J. Reg. Sci., 1969, 9, p. 273—282.
Нейман ф о н Дж., МоргенштернО.
1*. Теория игр и экономическое поведение.— М.: Наука, 1970,
238
ЛИТЕРАТУРА
Овергаард (Overgaard К. R.)l
1. Traffic estimation in urban transportation planning.— Civil Engineering
and Construction Series number 37, Acta Polytechnica Scandinavia,
Copenhagen, 1966.
Ольсон (Olson G.)
1. Central place systems, spatial interaction and stochastic processes,— Pap.
Reg. Sci. Ass., 1967, 18, p. 13—45.
Островский А. М.
1*. Решение уравнений и систем уравнений,— М.: Физматгиз, 1963.
Питтель Б. Г.
1*. Одна простейшая вероятностная модель коллективного поведения.—
Проблемы передачи информации, 1967, т. 3, № 3, с. 37—52.
Райзбек (Raisbeck G.)
1. Information theory.— MIT Press, Cambridge, Mass., 1963.
РикбергГ. В.
1*. Динамические модели пассажиропотоков.— В кн.: В помощь
проектировщику-градостроителю, Киев: Будивельник, 1971, вып. 4, с.
26-30.
Роговин А. Е.
1*. О расчетах пассажирских корреспонденции в городах.^ В кн.: В
помощь проектировщику-градостроителю, Киев: Будивельник, 1972,
вып. 3, с. 35—40.
РозоноэрЛ. И.
1*. Обмен и распределение ресурсов (обобщенный термодинамический
подход), I, II, III.—Автоматика и телемеханика, 1973, № 5, с. 115—
133, № 6, с. 65—80, № 8, с. 82—104.
Самуэльсон (Samuelson P. А.)
1. Foundation of economic analysis,—Harvard Univ. Press, Cambridge;
Mass., 1947.
С а с а к и (Sasaki Т.)
1. Probabilistic models for trip distribution.— Paper presented to the
Fourth International Symposium on Road Traffic Plan, Karlsruhe,
1968.
Сахарович (Sakarovitch M.)
1. The shortest chains on a graph,— Transp. Res., 1968, 2, p. 1—11.
Спуркланд (Spurkland M.)
1. Mathematical tools for urban studies.— mimeo., Paper presented to
Directorate for Scientific Affaires, О. Е. С D., Paris, 1966.
Стауффлер (Stouffler S. A.)
1. Intervening opportunities: a theory relating mobility and distance.— Am.
Soc. Rev., 1940, 5, N 6, p. 845—867.
Стивене (Stevens В. Н.)
1. Linear programming and location rent,— J. Reg. Sci., 1961, 3, p. 15—26.
Стратонович Р. Л.
1*. Теория информации.— М.: Советское радио, 1975.
Т е й л (Theil! H.)
1. Economics and information theory.— North-Holland, Amsterdam, 1967.
Тихонов А. Н.
1*. О некорректных задачах оптимального планирования.— ЖВМ и МФг
1966, т. 6, №1, с. 81—81.
Толма'н (Tolman R. С.)
1. The principles of statistical mechanics.— Oxford Univ. Press, Oxford, 1938.
Томлин, Томлин (Tomlin J. A., Tomlin S. G.)
1. Traffic distribution and entropy.— Nature, London, 1968, 220, p. 97—99.
Томлин (Tomlin J. A.)
1. Mathematical programming models for traffic network problems.— Ph. D.
Thesis, Univ. of Adelaid, 1967.
ЛИТЕРАТУРА
Т о м л и н (Tomlin S. G.)
1. A kinetic theory of traffic distribution and similar
problems—Environment and Planning, 1969, 1, p. 221—227.
2. Time dependent traffic distributions.—Transp. Res., 1970, 4, p. 77—86.
T p а й б э с (Tribus M.)
1. National descriptions, decisions and design.— Pergamon Press, Oxford,
1969.
Трайбэс, Эванс, Креллин (Tribus M., Evans R., Crellin C.)
1. The use of entropy in hypothesis' testing,— mimeo. paper presented to
the Tenth National Symposium on Reliability and Control, 1964.
Филлер М. Ф.
1*. Один алгоритм нахождения кратчайших путей.— В кн.: Исследования
по дискретной оптимизации, М.: Наука, 1976.
Форстер фон (von Foerster H.)
1. On self-organising systems and their environments.— In: Self-organising
systems/Eds. С. С. Yovitts, S. Cameron, Pergamon Press, Oxford, 1960.
Ф у р е н В. М.
1*. Трансформация транспортной сети города при максимальных
нагрузках.— В кн.: Математические методы в градостроительстве, Киев:
Будивельник, 1970, с. 19—28.
X а а р тер (ter Haar D.)
1. Elements of statistical mecinanics.— Constable, London, 1954.
X а й м э н (Hyman G. M.)
1. The calibration of trip distribution models,— Environment and Planning,
1969, 1, p. 105-112.
Хаймэн, Вильсон (Hyman G. M., Wilson A. G.)
1. The effects of changes in tra4el costs on trip distribution and modal
split.— J. High Speed Ground Transp., 1969, 3, p. 79—85.
Халдер (Haider A. K.)
1. An alternative approach to trip distribution.— Transp. Res., 1970, 4,
p. 63-69.
X a p p и с (Harris В.)
1. A note on the probability of interaction at a distance.— J. Reg. Sci.,
1964, 5, p. 31-35.
Хендерсон, Куандт (Henderson J. M., Quandt R. E.)
1. Microeconomic theory.— McGraw-Hill, New York, 1958.
X и н ч и н (Kinchin A. I.)
1. Mathematical foundations of information theory,— Dover Publications,
New York, 1957.
X о м я к Л. В.
1*. Проектирование оптимальных сетей автомобильных дорог.— М:
Транспорт, 1969.
Хотеллинг (Hotelling A.)
1. Stability in competition.— Econ. J., 1929, 39, p. 41—57.
X э д л и Дж.
1. Нелинейное и динамическое программирование,— М.: Мир, 1967.
Ч и з х о л м (Chisholm M.)
1. General systems theory and geography,—Trans. Inst. Br. Geographers,
1967, 42, p. 45—52.
Шацкий Ю. A.
1*. Методы расчета расселения в генеральном плане города.— В кн.:
В помощь проектировщику-градостроителю, Киев: Будивельник, 1970,
вып. 3, с. 71—84.
Шелейховский Г. В.
1*. Композиция городского плана как проблема транспорта.— М.,
1946.
240 ЛИТЕРАТУРА
Шеннон, Уивер (Scannon С, Weaver W.)
1. The mathematical theory of communication.— Univ. of Illinois Press,
1949.
Шиллинг Г.
1. Статистическая физика в примерах.— М.: Мир, 1976.
Ш н е й д е р (Schneider M.)
1. Direct estimation of traffic volume at a point,— Highw. Res. rec, 1967,
165, p. 108—116.
Э д е н с (Edens H. J.)
1. Analysis of a modified gravity model.— Transp. Res., 1970, 4, p. 51—62.
Яковлев Л. А.
1*. Сравнение вариантов трассировки линий скоростного транспорта
в крупных городах с помощью ЭВМ.— В кн.: Применение
математических методов и вычислительной техники в градостроительных задачах,
Тр./ЦНИИП градостроительства, 1971, с. 180—196.
Дополнительная литература
(работы, опубликованные после 1970 года)
А р у м и (Arumi F. N.)
1. Demodynamics—a statistical theory of demographic
equilibrium.—Environmental Design Research/Ed. Preiser W. F. E., Dowden, Hutchinson
and Ross Inc., Strousburg, Pennsylvania; 1973, 1, p. 334—344.
2. Enthropy and demography.— Nature, 1973, 243, p. 497—499.
Б а к с т е р (Baxter R.)
1. Entropy maximising models of spatial interaction.— Computer
Applications, 1973, 1, p. 57—83.
Б е к м а н н (Beckmann M. J.)
1. On the metaphysical foundations of traffic theory.—Traffic Flow and
Transportation, Proceedings of the 5th International Symposium on the
theory of traffic flow and transportation, Elsevier, New York.
2. Entropy, gravity and utility in transportation modelling,— In:
Information, inference and decision/Ed. Menges G., Reidel, Boston, 1974,
p. 155—163.
Блэк, Солтер (Black J. E., Salter R. J.)
1. A statistical evaluation of the accuracy of a family of gravity models. —
Proceedings of the Institute of Civil Engineers, 1975, Part 2, 59, p. 1—20.
Буссьер, Сникарс (Bussiere R., Snickars F.)
1. Derivation of the negative exponential model by an entropy maximising
method,—Environment and Planning, 1970, p. 295—301.
Бэтти (Batty M.)
1. Models and projections of the space economy.— Town Planning Review,
1970, 41, p. 121—147.
2. An activity allocation model for the Nottinghamshire—Derbyshire subre-
gion.— Regional Studies, 1970, 4, p. 307—332.
3. Models and projections of the space economy: a subregional study in North
West England.— Town Planning Review, 1970, 41, p. 121—148.
4. Recent developments in land use modelling: a review of British research,—
Urban Studies, 1971, 9, 151—177.
5. Exploratory calibration of a retail location model using search by golden
section.— Environment and Planning, 1971, 3, p. 411—432.
6. Entropy and spatial geometry.— Area, 1972, 4, p. 230—236.
7. An experimental model of urban dynamics.— Town Planning Review, 1972,
43, p. 166-186.
8. Urban density and entropy functions.— Journal of Cybernetics, 1974,
4, p. 41-55.
ЛИТЕРАТУРА
9. A comment on the paper «A comparison of the Shannon and Kullback
information measures».— Journal of Statistical Physics, 1974, 11, p. 523—
524.
10. Urban modelling.— Cambridge University Press, London, 1975.
11. Entropy in spatial aggregation.—Geographical Analysis, 1976, 8, p. 1—21»
Бэтти, Макки (Batty M., Mackie S.)
1. The calibration of gravity, entropy and related models of spatial
interaction.— Environment and Planning, 1972, 4, p. 205—234.
Бэтти, Марч (Batty M., March L.)
1. The method of residues in urban modelling.— Environment and Planning,
1976, 8, p. 189—214.
В е б б e p (Webber M. J.)
1. Elementary entropy maximising models.—Economic Geography, 1976,
52, p. 218—227.
2. Entropy — maximising models for the distribution of expedintures.—
Papers, Regional Science Association, 1976, 37, p. 185—200.
Вейдеман, Стир (Weidemann M. L., Stear E. B.)
1. Entropy analysis of estimating systems.— Institute of Electrical and
Electronic Engineering, Transactions on Information Theory, 1970, 11—16, p.
24—270.
Вильсон (Wilson A. G.)
1. Generalising the Lowry model.— In: Urban and Regional Planning/Ed.
Wilson A. G. Pion, London, p. 121—133. Reprinted in: Papers in urban and
regional analysis, p. 58—70.
2. On some problems in urban and regional modelling.— In: Chisholm M.,
Frey A. E., Haggett P. (eds.), Regional forecasting, Butterworth,
London; 1971, p. 179—220. Reprinted in: Papers in urban and regional
analysis, p. 91—132.
3. A family of spatial interaction models and associated developments.
Environment and Planning, 1974, 3, p. 1—32. Reprinted in: Papers in
urban and regional analysis, p. 170—201.
4. Recent developments in macro-economic approaches to modelling
households behaviour with particular reference to spatiotemporal
organisation, presented to the Centre for Environmental Studies Conference on
urban economies,— Keele, 1971. Reprinted in: Papers in urban and
regional analysis, p. 216—236.
5. Further developments of entropy maximising transport models.—
Transportation Planning and Technology, 1973, 1, p. 183—193.
6. Towards system models for water resource management.— Journal of
Environmental Managemeht, 1973, 1, p. 36—52.
7. Travel demand forecasting: achievments and problems.— In: Special
Report 143 / Ed. Brand D., Highway Research Board, Washington, D. C,
1973, p. 283—306.
8. Urban and regional models in geography and planning.— John Wiley,
London and New York, 1974.
9. A maximisation problem associated with Drew's institutionalised divvy
economy.— Research Memorandus, RM—74—5, International_Institute
for Applied Systems Analysis, Laxenburg, Austria, 1974.
10. Some methods for building dynamic models in urban and regional
analysis.—In: Dynamis allocation of urban space/Eds. Karlqvist A., Lundq-
vist L., Snickars F., / Saxon House, Farnborough, 1974, p. 15—40.
11. Some new forms of spatial interaction models: a review.—
Transportation Research, 1975, 9, p. 167—179. Щ
12. Urban and regional models: some organising concepts to describe the
state of art,—In: Urban development models/Eds. Baxter R.,
Echenique M., Owers J. The Construction Press, Lancaster, 1975, p.
41-60.
242 ЛИТЕРАТУРА
13. Retailers' profits and consumers' welfare in a spatial interaction
shopping model.— In: Theory and practice in regional science/Ed. Masserl.,
Pion, London, 1976, p. 42—59.
Вильсон, Паунол (Wilson A. G., Pownall С. Е.)
1. A new representation of the urban system for modelling and for the
study of micro-level interdependence,— Area, 1967, 8, p. 246—254.
Вильсон, Сениор (Wilson A. G., Senior M. L.)
1. Some relationships between entropy maximising models, mathematical
programming' models and their duals.— Journal of Regional Science,
1974, 14, p. 207—215.
Вильяме (Williams H. С W. L.)
1. Travel demand models: duality relations and user benefit analysis.—
Journal of Regional Science, 1976, 16, p. 147—166.
2. On the formation of travel demand models and economic evaluation
measures of user benefit.— Environment and Planning, 1977, A, 9, p. 285—
344.
Г о л д н е р (Goldner W.)
1. The Lowry model heritage.— Journal of the American Institute of
Planners, 1971, 37, p. 100—110.
Г у л д (Gould P.)
1. Pedagogig review.— Entropy in urban and regional modelling, Annals,
American Association of Geographers, 1972, 62, p. 689—700.
Динкель, Кошенбергер, Сеппала (Dinkel J. J.,
Kochenberger G. A., Seppala Y.)
1. On the solution of regional planning models via geometric programming,—
Environment and planning, 1973, 5, p. 397—408.
Динкель, Кошенбергер, Вон (Dinkel J. J., Kochenberger G. A.,
Wong S.— N.)
1. Sensitivity analysis of regional planning models.— Environment and
Planning, 1977, A, 9, p. 85—98.
2. Entropy maximisation and geometric programming.— Environment and
Planning, 1977, A, 9, p. 419—427.
Дэйси, Норклифф (Dacey M. P., Norcliffe A.)
1. New entropy models in the social sciences. 1: elementary residential
location models,— Environment and Planning, 1976, A, 9, p. 299—311.
К а д а с (Kadas S. A.)
1. An application of geometric programming to regional economics.— Papers
of the Regional Science Association, 1975, 34, p. 95—106.
Кадас, Клафски (Kadas S. A., Klafszky E.)
1. Estimation of the parameters in the gravity models for trip distribution:
a new method and solution algorithm.—Regional Science And Urban
Economics, 1976, 6, p. 439—457.
К а р р и (Curry L.)
1. Spatial entropy,— In: International geography /Eds. Adams W. P., Hel-
leiner F. M., University of Toronto Press, Toronto and Buffalo, 1972.
К е м п (Kemp A. W.)
1. Plausibility and second-order entropy, with particular reference to family
composition.—In: Random counts in scientific work/Ed. Patel G. P., Penn
State University Press, 1970.
К и р б и (Kirby H. R.)
1. Normalising factors for the gravity model: an
interpretation.—Transportation Research, 1970, 4, p. 37—50. -
2. Theoretical requirements for calibrating gravity models.—
Transportation Research, 1974, 8, p. 97—104.
Колю, Вильсон (Coelho J. D., Wilson A. G.)
1. The optimum location and size of shopping centres,— Regional Studies,
1976, 10, p. 413-421.
ЛИТЕРАТУРА 243
2. Some equivalence theorems to integrate entropy maximising submodels
within overall mathematical programming frameworks.— Geographical
Analysis, 1977, 9, p. 160-173.
Корди-Хэйс, Вильсон (Cordey-Hayes M., Wilson A. G.)
1. Spatial interaction,— Socio-Economic Planning Sciences, 1971, 5,
p. 73-95.
Криппс, Кэйтер (Cripps E. L., Cater E. A.)
1. The empirical development of a disaggregated residential location model:
some preliminary results.— In: Patterns and processes in urban and
regional system/Ed. Wilson A. G., Pion, London, 1972.
Криппс, Макджилл, Вильсон (Cripps E. L., Macgill S. M.,
Wilson A. G.)
1. Energy and materials flows in the urban space economy.—
Transportation Research, 1974, 8, p. 293—305.
Макджилл (Macgill S. M.)
1. Theoretical properties of biproportional matrix adjustments,—
Environment and Planning, 1977, A, 9, p. 687—701.
2. The Lowry model as an input-output model and its extensions to
incorporate full inter-activity relations,— Regional Studies, 1977, 11, p. 337—
354.
3. Rectangular input-output tables multiplier analysis and entropy
maximising principles: a new methodology.— Regional Science and Urban
Economics, 1978.
M a p ч, (March L.)
1. Urban systems: a generalised distribution function.—London Papers in
Regional Science, 1961, 2, p. 157—170.
Марч, Бэтти (March L., Batty M.)
1. Generalised measures of information, Bayes' likelihood ratio and Jaynes'
formalism.— Environment and Planning, 1975, B, 2, p. 99—105.
M a p ч е н д (Marchend B.)
1. Information theory and geography.— Geographical Analysis, 1972, 4,
p. 234—257.
Медведков (Medvedkov Y.)
1. Entropy: an assesment of potentialities in geography,—Economic
Geography, 1970, 46, supplement.
Мера (Мега К.)
1. An evaluation of gravity and linear programming transportation models
for predicting interregional commodity flows.— Appendix A in:
Techniques of transport planning/Eds. Meyer J. R., Strasheim R., 1, Pricing and
Project Evaluation, Brookings Institution, 1971.
M о р ф е т (Morphet R.)
1. A note on the calculation and calibration of doubly constrained trip
distribution models.— Transportation Research, 1975, 4, p. 43—53.
M э с с е р (Masser I.)
1. A comparative analysis] of spatial representation in doubly,,
constrained interaction models.— Environment and Planning, 1977, A, p.
749-769.
Мэссер, Браун (Masser I., Brown P. J. B.)
1. Hierarchical aggregation procedures for interaction data.— Environment
and Planning, 1975, A, 7, p. 509—523.
Никамп (Nijkamp P.)
1. Reflections on gravity and entropy models.— Regional Science andJJr-
ban Economics, 1975, 5, p. 203—225.
Никам п, Палинк (Nijkamp P., Paelinck J. H. P.)
1. A dual interpretation and generalisation of entropy maximising models
in regional science.— Papers, Regional Science Association, 1973, 33,
p. 14-31.
244 ЛИТЕРАТУРА
2. Geometric programming and entropy maximising models.— Bulletin de
Statistique, Recherche Operationelle et Informatique, 1974, 2.
О д е н ш о у (Openshaw S.)
1. An empirical study of some spatial interaction models.— Environment
and Planning, A, 8, p. 23—41.
2. Optimal zoning system for spatial interaction models.— Environment and
Planning, 1977, A, 9, p. 169—184.
Путман (Putman S. H.)
1. Calibrating a residential location model for nineteenth century
Philadelphia,— Environment and Planning, 1977, A, 9, p. 449—460.
С е н и о p (Senior M. L.)
1. Approaches to residential location modelling 1: urban ecological and
spatial interaction models (a review).— Environment and Planning, 1973,
5, p. 165—197.
2. Approaches to residential location modelling 2: urban economic models
and some recent developments.— Environment and Planning, 1974, A, 6,
p. 369-409.
Сениор, Вильсон (Senior M. L., Wilson A. G.)
1. Disaggregated residential location models: some tests and further
theoretical developments.—In: Space-time concepts in regional science/Ed.
Cripps E. L., Pion, London, 1972, p. 141—172.
2. Explorations and syntheses of linear programming and spatial interaction
models of residential location.— Georgaphical Analysis, 1973, 6, p. 209—
238.
Скотт (Scott A. J.)
1. A model of nodal entropy in a transportation network with congestion
costs,— Transportation Science, 1971, 5, p. 204—211.
2. A. theoretical model of pedestrian flow.— Socio-Economic Planning
Sciences, 1974, 8, p. 317—322.
Скотт, Джефферсон, (Scott С. H., Jefferson Т. R.)
1. Entropy maximising models of residential location via geometric
programming,— Geographical Analysis, 1977, 9, p. 181—187.
Стетцер (Stetzer F.)
1, Parameter estimation for the constrained gravity model : a comparison
of six methods.— Environment and Planning, 1976, A, 8, p. 673—684.
Томас (Thomas R. W.)
1. An interpretation of the journey-to-work on Merseyside using entropy-
maximising methods,— Environment and Planning, 1977, A, 9. p. 817—835.
Томлинсон, Баллок, Диккенс, Стедмен, Тейлор
(Tomlinson J., Bullock N., Dickens P., Steadman P., Taylor E.)
1. A model of students daily activity patterns.— Environment and
Planning, 1973, 5, p. 231—266.
Уолш, Веббер (Walsh J. A., Webber M. J.)
1. Information theory: some concepts and measures.— Environment and
Planning, 1977, A, 9, p. 395—419.
Филлипс, Уайт^Хэйнс (Phillips F., White G., Haynes К. Е.)
1. Extremal approaches to estimating spatial interaction.— Geographical
Analysis, 1976, 8, p. 185—200.
Фиск, Браун (Fisk С, Brown G. R.)
1. A note on the entropy formulation of distribution models.— Operations
Research Quarterly, 1975, 26, p. 755.
Фиш (Fish О.)
1. On the utility of entropy maximising.— Geographical Analysis, 1976, 9,
p. 79—73.
Хансен (Hansen S.)
1. Utility, accessibility and entropy in spatial modelling,— The Swedish
Journal of Economics, 1972, 74.
ЛИТЕРАТУРА 245
2. Entropy and utility in traffic modelling.— In: Transportation and traffic
theory/Ed. Buckley A. H., Reed A. W., 1973, p. 435—452.
X a p т в и к (Hartwick J. M.)
1. The gravity hypothesis and transportation cost minimisation,— Regional
and Urban Economics, 1972, 2, p. 297—308.
Хобсон, Чен (Hobson A., Cneng В. К.)
1. A comparison of the Shannon and Кullback information measures.—
Journal of Statistical Physics, 1973, 7, p. 301—310.
Хэйнс, Эндерс (Haynes К. E., Enders W. T.)
1. Distance, direction and entropy in the evolution of a settlement pattern.—
Economic Geography, 1975, 51, p. 357—365.
X э т э у э й (Hathaway P. J.)
1. Trip distribution and aggregation.— Environment and Planning, 1975,
7, p. 71-97.
Чампернаун, Вильяме, Колхо (Champernowne A. F.,
Williams H. C. W. L., Coelho J. D.)
1. Some comments on urban travel demand analysis, model calibration and
the economic evaluation of transportation plans.— Journal of Transport
Economics and Policy, 1976, 10, p. 267—285.
Чарнз, Райке, Беттинджер (Charnes A., Raike W., Bettin-
ger С. О.)
1. An extremal and information theoretical characterisation of some
interzonal transfer models.— Socio-Economic Planning Sciences, 1972, 6,
p. 531-537.
Ч е з а р и о (Cesario F. J.)
1. A generalised trip distribution model,— Journal of Regional Science,
1975, 13, p. 233—247.
2. A note on the entropy model of trip distribution.— Transportation
Research, 1973, 7, p. 331—333.
3. A primer on entropy modelling,— American Institute of Planners Journal,
1975, p. 40—48.
Чилтон, Поэт (Chilton R., Poet R. R. W.)
1. An entropy maximising approach to the recovery of detailed migration
patterns from aggregate census data,— Environment and Planning, 1973,
5, p. 135—146.
Ч у к р а у н (Choukroun J. M.)
1. A general framework for the development of gravity-type trip distribution
models.— Regional Science and Urban Economics, 1975, 5, p. 177—202.
Ч э п м е н (Chapman G. P.)
1. The application of information theory to the analysis of population
distributions in space.— Economic Geography Supplement, 1970, p. 317—
331.
Э в а н с (Evans A. W.)
1. Some properties of trip distribution methods.— Transportation Research,
1970, 4, p. 19—36.
2. The calibration of trip distribution models with exponential or similar
cost functions.— Transportation Research, 1975, 5, p. 15—38.
Э в а не (Evans S. P.)
1. A relationship between the gravity model for trip distribution and the
transportation problem in linear programming.— Transportation
Research, 1973, 7, p. 39—61.
2. Derivation and analysis of some models for combining trip distribution
and assignement.— Transportation Research, 1976, 10, p. 37—57.
Эванс, Кирби (Evans S. P., Kirby H. P.).
1. A three-dimensional Furness procedure for calibrating gravity models.—
Transportation Research, 1976, 8, p. 105—122.
246 ЛИТЕРАТУРА
Эдварде (Edwards J. L.)
1. Use of a Lowry-type spatial allocation model in an urban transportation
energy study.— Transportation Research, 1977, 71, p. 117—126.
Э й н а с (Anas A.)
1. A dynamic disequilibrium model of residential location,— Environment
and Planning, 1973, 5, p. 633—647.
Энджел, Хаймэн (Angel S., Hyman G. M.)
1. Urban velocity fields,— Environment and Planning, 1970, 2, p. 211—224.
2. Urban spatial interaction.— Environment and Planning, 1972, 4, p. 99—
118.
3. Urban fields.— Pion, London, 1976.
Эрландер (Erlander S.)
1. Accessibility, entropy, and the distribution and assignement of traffic-
Transportation Research, 1977, 11, p. 149—154.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Ансамбль 138, 157
— канонический 145, 158
большой 149, 150, 158
— микроканонический 143, 158
— представительный 139
— стационарный 141
Балансировка двумерная 207
— многомерная 209
Больцмана распределение 216
Величина случайная 25
Выборка случайная 25
Гиббса распределение 217
Дарвина — Фаулера метод 35
Задача вариационная первая 219
Закон термодинамики второй 27
Затраты обобщенные 32
Исток 177
Канал связи 172
Коммуникация 170, 173
Леонтьева — Страута модель 69
Лоури модель 82
Метод ансамблей Гиббса 138
— Дарвина — Фаулера 35
Модель конкурирующих
возможностей 158
— Леонтьева — Страута 69
— Лоури 82
— экономической базы 64
Неопределенность 21, 22
«Ожидаемая информация» 29
Онзагера уравнения 132
Описание макросостояния 19
— микросостояния 19
Пространство фазовое 139
Распределение 18, 19
— апостериорное 192
— Больцмана 216
— Гиббса 217
— пространственное 171
конечное 172
начальное 172
Расщепление маршрутов 47
Ресурс 170—172
Решение нормальное некорректной
транспортной задачи 214
Система коммуникационная 174
детерминированная 175
— — с жесткими границами 174
с размытыми границами 175
— — стохастическая 175
— с максимальной полезностью
114
Состояние системы 17—19, 176
конечное 172
начальное 172
промежуточное 176
Способность пропускная канала без
помех 219
Сток 177
Теория экономической базы 64
Уравнения Онзагера 132
Характеристика канала передачи
информации без помех 219
связи 172
Частица 171
А. Дж. Вильсон
Энтропийные методы моделирования
сложных систем
М., 1978 г., 248 стр. с илл.
Редактор В. А. Романов
Технический редактор Е.В. Морозова
Корректор Я. Д. Дорохова
ИБ № 11041
Сдано в набор 07.07.78.
Подписано к печати 10.11.78.
Бумага бОхСО'/и, тип. № 1.
Обыкновенная гарнитура. Высокая печать.
Условн. печ. л. 15,5. Уч.-изд. л. 15,01.
Тираж 55С0 экз. Заказ № 804. Цена книги 1 р. 30 ь
Издательство «Наука»
Главная редакция
физико-математической литературы
117071, Москва, В-71, Ленинский проспект, 15
2-я типография иэд-ва «Наука».
1210Б9, Москва, Г-99, Шубинский пер., 10