Text
                    Дж. Кингман
Пуассоновские процессы


OXFORD STUDIES IN PROBABILITY—3 Poisson Processes J. F.C.Kingman University of Bristol Clarendon Press Oxford 1993
Дж. Кингман Пуассоновские процессы Перевод е английского Н.ВМилевич Под редакцией А.М.Вершика Москва Издательство МЦНМО 2007
УДК 519.216 Издание осуществлено при поддержке РФФИ ББК 22.171 (Издательский проект № 07-01-07036) К41 Кингман Дж. К41 Пуассоновские процессы / Под ред. А. М. Вершика. — М.: МЦНМО, 2007. — 136 с. ISBN 978-5-94057-318-0 Книга признанного мирового специалиста в области теории вероятностей, математической статистики и их приложений Дж. Кингмана представляет собой систематическое изложение классической теории пуассоновских процессов в произвольных пространствах. Книга предназначена как для начинающих изучение теории случайных процессов, так и для специалистов, поскольку сочетает ясное и красивое изложение основ теории с представлением новых идей, связанных прежде всего с разнообразными приложениями пуассоновских процессов к геометрии, теории массового обслуживания, экологии, генетике, астрономии и др. ББК 22.171 Poisson Processes OSR was originally published in 1992. This translation is published by arrangement with Oxford University Press. Книга «Пуассоновские процессы» была опубликована в 1992 г. Данный перевод публикуется с разрешения издательства Oxford University Press. ISBN 0-19-853693-3 (англ.) © J.PC.Kingman, 1993. ISBN 978-5-94057-318-0 © МЦНМО, перевод на русск. яз., 2007.
Оглавление Предисловие редактора перевода 7 Предисловие 10 Глава 1. Стохастические модели для случайных множеств точек 12 §1.1. Пуассоновские модели 12 §1.2. Распределение Пуассона 15 §1.3. Вероятностные пространства для задания пуассоновских процессов 19 §1.4. Неизбежность распределения Пуассона 21 Глава 2. Пуассоновские процессы в произвольных пространствах 23 §2.1. Определение и основные свойства 23 §2.2. Теорема о суперпозиции 27 §2.3. Теорема об отображении 31 §2.4. Процесс Бернулли 36 §2.5. Теорема существования 37 Глава 3. Суммирование по пуассоновским процессам 40 §3.1. Математические ожидания, дисперсии и распределения . ... 40 §3.2. Теорема Кэмпбелла 43 §3.3. Характеристический функционал 47 §3.4. Теорема Реньи 50 Глава 4. Пуассоновские процессы на прямой 55 §4.1. Приращения однородного процесса 55 §4.2. Закон больших чисел 59 §4.3. Системы массового обслуживания 62 §4.4. Теорема Бартлетта 66 §4.5. Неоднородные процессы 69 Глава 5. Маркированные пуассоновские процессы 72 §5.1. Раскраски 72 §5.2. Теорема о маркировке 74 §5.3. Снова теорема Кэмпбелла 77 §5.4. Широкая автомагистраль 79 §5.5. Приложения к экологии 81 §5.6. Кольцевая автомагистраль 83
6 Оглавление Глава 6. Процессы Кокса 86 §6.1. Определения и основные свойства 86 §6.2. Процессы Кокса в экологии 87 §6.3. Распределение Бореля—Таннера 90 §6.4. Процессы Кокса и процессы восстановления 93 Глава 7. Стохастическая геометрия 95 §7.1. Пуассоновские процессы геометрической природы 95 §7.2. Пуассоновские поля прямых 97 §7.3. Поля прямых Кокса 100 §7.4. Более общие геометрические объекты 101 Глава 8. Случайные меры с независимыми значениями 103 §8.1. Каноническое представление 103 §8.2. Построение случайной меры с независимыми значениями по пуассоновскому процессу 107 §8.3. Доказательство Блэкуэлла 1Q9 §8.4. Субординаторы 113 Глава 9. Распределение Пуассона—Дириаде 116 §9.1. Распределение Дирихле , , 116 §9.2. Процесс Дирихле . . . , 118 §9.3. Распределение Пуассонам-Дирихле ,119 §9.4. Субордицатор Морана 122 §9.5. Формула выборок Юв.етеа . , . . , 124 §9.6. Стохастическая сортировка 126 Литература 128 Предметный указатель 132
Предисловие редактора перевода Перед Вами небольшая книжка известного английского математика сэра Джона Кингмана, автора замечательных работ по теории вероятностей и разнообразным ее приложениям. По существу это мастерски написанное введение в одну из областей теории случайных процессов — теорию пуассоновских процессов и их обобщений. Сэр Джон Кингман широко известен своими результатами (один из самых известных его результатов — субаддитивная эргодическая теорема, имеющая огромное число применений) и книгами по теории очередей, математической генетике, процессам восстановления и др. Несколько усиливая совершенно справедливое замечание автора, можно сказать, что лишь два класса случайных процессов имеют фундаментальное естественнонаучное значение, а именно процессы винеров- ского (диффузионного) и пуассоновского (точечного) типов, ^олее того, в последние годы стало ясно, что для многих разделов математики (комбинаторика, вероятностные проблемы алгебры, теория представлений) процессы точечного типа и связанные с ними меры (в первую очередь меры Пуассона—Дирихле) играют столь же фундаментальную роль, какую гауссовы и близкие к ним меры играют в анализе, математической физике и их применениях. Факты, включенные автором в книгу, отобраны с большим вкусом, и хотя часть из них (первые четыре главы) относится к основным понятиям теории, а остальные (за исключением последних двух глав) в основном элементарны, они не столь широко известны, как того заслуживают. Автор старается обходить темы, требующие тяжелых обоснований с точки зрения общей теории меры или функционального анализа, и лишь намечает дальнейшее развитие затронутых тем. Поэтому книгу можно смело рекомендовать читателю, только начинающему изучение случайных процессов. Но и более продвинутый читатель найдет в ней немало интересного. В гл.8 (§8.1—8.3) описывается естественный прием, принадлежащий автору и отчасти изученный Блэкуэллом, сводящий изучение широкого класса процессов с независимыми значениями (т. е. подкласса процессов Леви) к изучению пуассоновских процессов в полуполосе или маркированных пуассоновских процессов. Этот прием позволяет сильно упростить часть теории процессов Леви. Но особенно интересна и перспективна тематика последней, девятой главы; она связана с распределениями Пуассона—Дирихле, на кото-
8 Предисловие редактора перевода рых здесь уместно остановиться чуть подробнее. Распределения Пуассона—Дирихле W(X) — это однопараметрическое семейство распределений (или вероятностных мер), зависящих от положительного параметра λ, на бесконечномерном симплексе положительных рядов с единичной суммой и невозрастающими членами. С одной стороны, это семейство появляется как предел распределений Дирихле на конечномерных симплексах (см. §9.1), когда размерность η симплекса стремится к бесконечности, а все параметры распределения Дирихле равны Х/п. Наиболее важный частный случай — мера VD(\), соответствующая значению λ = 1. С другой стороны, VD(\) есть распределение упорядоченных по убыванию нормированных скачков случайного процесса, называемого гамма-процессом (автор называет его субординатором Морана) с параметром λ. Взаимоотношения этих двух естественных способов задания мер Пуассона—Дирихле в основном и обсуждаются в гл. 9. Но причины интереса к этим распределениям лежат совсем в другом. Случайные положительные ряды с единичной суммой, распределенные в соответствии с этими мерами, почти таинственным образом возникают в совершенно различных математических ситуациях, что заставляет нас относиться к мерам Пуассона—Дирихле как к универсальным распределениям, подобным гауссовым мерам, возникающим в классических предельных законах теории вероятностей. Только ситуации, в которых появляются меры Пуассона—Дирихле, — совсем иные, нежели те, в которых возникают гауссовы меры, они больше связаны с алгебраическими и комбинаторными задачами. Можно предположить, что ряды, распределенные в соответствии с этими мерами, являются «наиболее случайными», или, по-другому, эти распределения имеют «максимально возможную энтропию» в классе всех мер на бесконечномерном симплексе. Вот несколько наиболее ярких и неочевидных примеров появления этих мер. 1. Рассмотрим разложение натурального числа т на простые множители: т — р\ - р2 · · ·. · Pk> Р\ ^ Р2 ^ · · · ^ Pk- Выберем случайное число т в соответствии с равномерным распределением на множестве натуральных чисел от 1 до N и рассмотрим вероятностный вектор υ = (ιΔ£ΐ ί!£2 1"ρΛ т \ \r\rn ' \r\rn ' '''' \r\rn J ' Оказывается, при N —► оо распределение полученных случайных векторов слабо сходится к мере VV(\) ([1*, 6*, 14*] и др.; см. также литературу в [14*]) п. !) Здесь и далее ссылки со звездочками относятся к списку литературы, добавленной при переводе.
Предисловие редактора перевода 9 2. Пусть &п—симметрическая группа степени п. Будем рассматривать векторы упорядоченных по убыванию нормированных длин циклов подстановок g £ &п. Зададим вероятностное распределение на симметрической группе формулой Prob(g) = Xl^/c\, где 1(g)— число циклов в подстановке g е &Пу а с χ — нормировочная константа (при λ = 1 это есть равномерное распределение на &п). Тогда индуцированное распределение векторов нормированных длин циклов также слабо стремится к мере VV(\) при η -> оо ([3*, 12*]). Ряд подобных примеров можно продолжить, некоторые дополнительные факты содержатся в примечаниях редактора перевода к гл. 9. Работы самого Дж. Кингмана о когерентных семействах случайных разбиений (т. н. «partition structures») и их приложениях к популяционной генетике ([8*, 9*, 10*, 11*]) также имеют прямое отношение к мерам Пуассона— Дирихле. В последние годы интенсивно изучаются глубокие связи мер Пуассона—Дирихле с бесселевыми и гамма-процессами (см., например, [13*]) и их родственниками — σ-конечными мерами Лебега в бесконечномерных пространствах и др. ([2*, 15*]). В недавней литературе читатель сможет найти развитие и связи этих тем; в частности, к настоящему времени накопилась серия замечательных характеризаций мер Пуассона—Дирихле (см., например, [2*, 4*, 5*, 7*, 15*]). Постановка многих из этих вопросов берет свое начало с почти элементарных классических фактов о пуассоновских процессах, излагаемых в этой книге. А.Вершик 2007 г.
Предисловие В теории случайных процессов есть два процесса, которые имеют фундаментальное значение и возникают все в новых и новых контекстах, подчас совершенно удивительным образом. В некотором (вполне реальном) смысле самые глубокие результаты теории касаются взаимодействия между этими процессами. Одному из них, модели Башелье—Винера броуновского движения, посвящено огромное количество книг. Другой же, пуассоновский процесс, на первый взгляд менее значителен и достоин изучения сам по себе. Он упоминается почти в каждой книге, но большинство авторов торопятся сразу же перейти к более общим точечным процессам или марковским цепям. Такое пренебрежительное отношение к пуассоновскому процессу несправедливо и происходит от недостаточного понимания его истинной роли. Это недопонимание, в свою очередь, частично объясняется тем, что пуассоновские процессы часто рассматривают лишь в размерности один, в то время как в более общем контексте теория становится гораздо более естественной и мощной, В этой книге предпринята скромная попытка восстановить справедливость. Она отражает мою давнюю очарованность красотой и широтой применимости одномерных и многомерных пуассоновских процессов, усилившуюся в ходе бесед со многими друзьями на протяжении многих лет. Я использовал их идеи, не приводя явных ссылок, и надеюсь, что им будет приятно читать книгу, которая никогда не была бы написана без их невольной помощи. Я особенно благодарен Дэвиду Олдосу, покойному Ролло Дэвидсону, Уоррену Ювенсу, Фрэнку Келли, Дэвиду Кендаллу, Деннису Линдли, Бобу Лойнсу, покойному Пэту Морану, Джеффу Уо- терсону, Питеру Уиттлу и Дэвиду Уильямсу. Я не пытался запротоколировать историческое развитие теории пуассоновских процессов; список литературы содержит лишь ссылки на необходимые результаты, а также приглашения к дальнейшему чтению. При скрупулезном описании истории следовало бы упомянуть многочисленные случаи переоткрытия основных свойств пуассоновского процесса, которые стали широко известны только спустя много десятков лет после того, как были открыты. Даже сейчас широко распространены некоторые заблуждения, которые, я надеюсь, данная книга поможет рассеять. Автор, пишущий о вероятности, всегда стоит перед сложным выбором, поскольку основания теории вероятностей относятся к туманной
Предисловие 11 области абстрактной теории меры, малопривлекательной для потенциального читателя. Я попытался решить эту проблему, ограничив использование теории меры несколькими доказательствами, где она необходима, но основную часть материала изложив в менее педантичном стиле. При желании читатель может считать все факты, относящиеся к теории меры, само собой разумеющимися, однако следует помнить, что некоторые очевидные результаты требуют вполне нетривиальных доказательств. На протяжении всей книги используются некоторые стандартные обозначения; например, символы Ρ и Ε обозначают вероятность и математическое ожидание соответственно, К^ — евклидово пространство размерности dy a # — число элементов множества. Рукописными заглавными буквами обозначаются стандартные распределения (наиболее часто используется пуассоновское распределение V). Такие термины, как «положительный» или «возрастающий», без наречия «строго» используются в слабом смысле. Бристоль, апрель 1992 г. ДжЖингман
Глава 1 Стохастические модели для случайных множеств точек §1.1. Пуассоновские модели Рисунок 1.1 мог бы изображать позиции видимых звезд на участке небосклона, местоположения деревьев в лесистой местности (вид сверху) или места стоянок древнего человека. Четкого рисунка нет, точки разбросаны беспорядочно, не видно ни какой-либо регулярности, ни выделенных направлений. Подобная картина может возникнуть в трехмерном или одномерном пространстве и даже в более сложной геометрии. Например, если мы будем рассматривать весь небосклон, то нам будет казаться, что звезды распределены по поверхности сферы. Пуассоновские процессы — это математические модели таких явлений, позволяющие описывать подобного рода крайне случайное поведение при помощи теории вероятностей. Характерной особенностью пуассоновских процессов является свойство статистической независимости. Чтобы пояснить, что имеется в виду, предположим, что в пространстве, изображенном на рис. 1.1, выделены некоторые «тестовые множества» А\,А2> .·., причем их положение и форма заданы независимо от случайных точек (рис. 1.2). Обозначим через N(A) число точек, попавших в множество А. Тогда N(Ai) суть целочисленные случайные величины. χ X X Рис. 1.1. Двумерный пуассоновский процесс
§1.1. Пуассоновские модели 13 ЩА{) = 2 N(A2) = 1 N(A3) = 3 Рис. 1.2. Тестовые множества Мы предполагаем, что если множества А\,А2,... не накладываются друг на друга, то эти случайные величины статистически независимы. Разумеется, на практике, если это предположение и выполнено, то только приблизительно. Могут наблюдаться тонкие эффекты, в силу которых наличие точек в одной области будет влиять на наличие точек в другой области. Могут существовать ограничения, не дающие точкам находиться слишком близко друг от друга. Могут проявляться неожиданные геометрические закономерности (например, «лей-линии» в археологии). Обычно пуассоновский процесс дает простейший и в некотором смысле наиболее случайный способ описания любого конкретного явления. Термин «пуассоновский» происходит от одноименного вероятностного распределения, которое играет ключевую роль во всей теории. Это распределение в свою очередь является предельным случаем биномиального распределения и таким образом восходит к работам самого С.-Д. Пуассона [36]. Так, если независимо η раз бросить монету с одной и той же вероятностью ρ выпадения «орла» при каждом бросании, то вероятность того, что выпадет г «орлов» и η — г «решек», равна Ь{п,р;г) = ($)р'{\-р)Л-'. (1.1) Если η увеличивается, а р уменьшается, причем среднее число «орлов» μ = пр остается постоянным, то выражение (1.1) имеет предел π г (μ) lim bin, -; г),
14 Глава 1. Стохастические модели для случайных множеств точек который, как легко видеть, равен Мм) = ^7Г", г>0; (1.2) распределение (1.2) называется распределением Пуассона с параметром μ. Мы будем обозначать его через V{p), а биномиальное распределение (1.1) — через В(п, р). Собственно пуассоновский процесс изначально рассматривался в одномерной ситуации, в которой вещественная прямая играла роль оси времени. Одномерный вариант рис. 1.1 изображен на рис. 1.3; теперь отмеченные точки могли бы изображать случайную последовательность событий во времени. Физики используют пуассоновские процессы для описания эмиссии радиоактивных частиц, а инженеры-телефонисты раньше применяли их для описания времени поступления вызовов на телефонную станцию. ——к—■—х- —-— к χ х- -х > время Рис» 1.3. Одномерный пуассоновский процесс Это естественно, если считать, что наступление рассматриваемых событий вызвано разными атомами (в первом случае) или абонентами (во втором случае), независимыми друг от друга. Вероятность того, что каждый конкретный атом испустит частицу в данный интервал времени, очень мала, но таких атомов много, поэтому велика вероятность, что несколько событий все-таки наступит. Это именно та ситуация, в которой биномиальное распределение (1Л) хорошо аппроксимируется пуассоновским пределом (1.2). Итак, мы будем предполагать не только, что считающие функции N(A) независимы для непересекающихся множеств Л, но и что каждая из них имеет распределение Пуассона V{p) для подходящего выбора μ. Эти предположения совместимы (в смысле, который мы уточним позже), и, более того, предположение о независимости почти неизбежно приводит к распределению Пуассона (см. § 1.4). Наша цель — развить теорию, подходящую для широкого круга разнообразных приложений, поэтому мы будем делать лишь минимальные предположения относительно пространства, в котором расположены случайные точки (К2 на рис. 1.1, R на рис. 1.3). Может показаться, что одномерный случай проще, но в действительности специфические свойства вещественной прямой (прежде всего возможность перенумеровать случайные точки по порядку) могут лишь завуалировать простоту и строй-
§ 1.2. Распределение Пуассона 15 ность общей теории. Мы настоятельно рекомендуем читателю при изучении общей теории представлять себе не одномерную картинку, как на рис. 1.3, а двумерную наподобие рис. 1.1. § 1.2. Распределение Пуассона Случайная величина X имеет распределение Пуассона Ρ(μ), если ее возможные значения суть неотрицательные целые числа и Р{* = п} = πη(μ) = *^jA n > 0. (1.3) Параметр μ может принимать произвольное положительное значение, и из тождества оо Υ^ηπη{μ)^μ (1.4) следует, что μ есть среднее значение случайной величины с распределением Пуассона Ρ(μ): Ε(Χ) = μ. (1.5) Иногда бывает полезно расширить определение распределения Ρ (μ), включив в него предельные значения параметра 0 и оо. Соответственно, мы будем обозначать через Р(0) распределение, сосредоточенное в точке 0: Р{* = 0}= 1, (1.6) а через Р(оо) — распределение, сосредоточенное в бесконечности: Р{* = оо}= 1. (1.7) Для произвольного вещественного или комплексного числа ζ, удовлетворяющего условию \ζ\ < 1, случайная величина ζχ ограничена и Ε(ζχ) = Σ*η{μ)ζη = «r"£ ^Г = ^'^ d'8) < л=0 л=0 при 0 ^ μ < оо. Выражения для моментов случайной величины X можно получить отсюда дифференцированием с последующей подстановкой ζ = 1 (или непосредственным суммированием): Ε{*} = μ, Ε{*(Χ-1)} = μ2, ЕДО- 1)(*-2)} = μ3,
16 Глава 1. Стохастические модели для случайных множеств точек откуда следует, что Ε{Χ2} = μ + μ2, Β{Χ} = μ, (1.9) а также Ε{*3} = μ + 3μ2 + μ3 (1.10) и т.д. Дифференцируя πη по μ (и полагая π_ι = 0), получаем ^=πη-ΐ-π„. (1.11) Следовательно, а А Интегрируя от 0 до μ, получаем полезное тождество η μ $>*М=1-$тгя(А)£/А. (1.12) fc=0 0 Важнейшим свойством распределения Пуассона является его аддитивность. Если X и Υ — независимые случайные величины с распределениями Пуассона V{\) и Ρ(μ) соответственно, то при г, s > 0 мы имеем Р{* = r9Y = s} = p{x = Γ}ψ{γ = s) = ΪΙ—illJL. (1ЛЗ) Суммируя равенства (1.13) по всем значениям г и 5 с фиксированной суммой г + 5, мы можем найти распределение случайной величины Χ + Υ: F{X + Y = n} = J2v{X = r,Y = n-r} = J2 AV C-er7 -(λ+μ) " , ν —E(r)*v-- = г=0 Таким образом, случайная величина Хл- Υ имеет распределение ν(\-\-μ). По индукции это утверждение обобщается на сумму произвольного конечного числа независимых случайных величин. Однако нам понадобится еще более сильный результат, который охватывает случай бесконечных рядов и дает условия их сходимости.
§ 1.2. Распределение Пуассона 17 Теорема о счетной аддитивности. Пусть Х-п j = 1,2,..., — независимые случайные величины, причем Xj имеет распределение V(pj) при любом /. Если ряд оо σ = 5>, (1.14) /=ι сходится, то ряд оо « = Σχ/ (1Л5) /=1 сходится с вероятностью единица и случайная величина S имеет распределение V(a). Если же ряд (1.14) расходится, то ряд S расходится с вероятностью единица. Доказательство. Индукцией по η получаем, что случайная величина Sn = J2xi имеет распределение V(an), где η Таким образом, при любом г выполняется равенство г При фиксированном г события {Sn < г} убывают с ростом п, причем их пересечение равно {S < г}. Следовательно, г P{S < г} = lim Р{5„ < г} = lim Τ"π*(σ„). /2—>00 П—>00 ^—' Если последовательность ση сходится к конечному пределу σ, то из непрерывности функций щ получаем равенство г из которого следует, что F{S = r} = 7tr(a),
18 Глава 1. Стохастические модели для случайных множеств точек т. е. S — конечная случайная величина с распределением V(a). Однако если ση —> оо, то откуда следует, что Р{5>г}= 1. Так как это равенство выполнено при любом г, случайный ряд 5 расходится с вероятностью единица. Теорема доказана. D Заметим, что эта теорема демонстрирует естественность наших соглашений относительно 7^(0) и Р(оо). С учетом этих соглашений она утверждает, что если каждая из независимых случайных величин Xj имеет распределение ν{μ·}), то их сумма имеет распределение ν(Σμ/), причем это верно как для конечного, так и для бесконечного числа слагаемых, и даже если некоторые из μ7· равны 0 или сю. Пусть Х\, Χ%, ·. ·, Хп — независимые случайные величины, причем Х-} имеет распределение ν{μ·}). Тогда их сумма 5 = Х\ -f... Л-Хп имеет распределение V{a)y где σ = Σ)μ/. Таким образом, если г\ +Г2 + .. .4-гл = s, то Ρ {Χ , = г!, Χ2 = Г2, . . . , Χη = Гη | 5 = 5} = Д -^-ρ- / Цг = Правая часть этой формулы задает вероятности мультиномиального распределения M(s; р\,..., /?л), где р} = μ//σ. В частном случае я = 2 этот результат сводится к следующему: если X и Υ — независимые пуассоновские величины, то условное распределение случайной величины X при условии, что X -f У = пу есть #(я, р), где ^ Е(*)+Е(У) Таким образом, биномиальное и мультиномиальное распределения можно получить как условные распределения подходящего распределения Пуассона. Это утверждение можно частично обратить, что иногда оказывается полезным. Пусть N — пуассоновская величина со средним μ, и пусть при данном N случайная величина Μ имеет распределение B(Ny p) с фиксированной константой р. Имеется в виду, что при 0^/ <5 выполняется
§1.3, Вероятностные пространства для задания пуассоновских процессов 19 равенство F{M = t \N=s) = b(s,p\t). (1,17) Тогда при т, k ^ 0 мы получаем ¥{М = m, Ν - Μ = &} = Ρ{Ν = m + Л} Р{М = т|уУ = т-Ьй} = (m + 6)! V m Г v r/ m! 6! Таким образом, М и Ν — Μ — независимые пуассоновские величины со средними μ ρ и μ(1 — ρ) соответственно. § 1.3. Вероятностные пространства для задания пуассоновских процессов Этот параграф предназначен для пуристов, которые справедливо требуют, чтобы случайные величины и вероятности были определены ссылками на подходящие вероятностные пространства и были соблюдены все тонкости, связанные с теорией меры. Менее серьезно настроенный читатель может пропустить его без существенного ущерба для понимания. Согласно общепринятым основам теории вероятностей (см. [4, 6, 9, 14, 30, 37]), мы должны прежде всего задать вероятностное пространство, т, е. тройку (Ω, Т, Р), где Ω — множество («элементарных событий»), Τ — σ-алгебра подмножеств множества Ω («событий»), а Р — вероятностная мера, приписывающая каждому событию из Τ число из отрезка [0, 1]. Вещественнозначная случайная величина — это функция X из Ω в К, которая является измеримой, что означает, что множество {α;: Χ(ω) < χ} принадлежит σ-алгебре Τ при любом х. Аналогичным образом, комплексная случайная величина — это измеримая функция из Ω в С, случайный я-вектор — это измеримая функция из Ω в 1л, а случайный слон — измеримая функция из Ω в подходящее пространство слонов. Всякий раз условие измеримости гарантирует, что интересующие нас подмножества пространства Ω принадлежат σ-алгебре Τ и, следовательно, имеют вероятности. Случайные массивы точек наподобие того, который изображен на рис. 1.1, — это случайные конечные или, возможно, счетные подмножества базового пространства 5, которое называется пространством состояний. Таким образом, пуассоновский процесс с пространством состояний S, заданный на вероятностном пространстве (Ω, Τ, Ρ),— это функция Π из Ω в множество 5°° всех счетных подмножеств пространства S.
20 Глава 1. Стохастические модели для случайных множеств точек Теперь нам необходимо выделить из подмножеств пространства 5 те, которые мы хотим использовать в качестве «тестовых множеств», как на рис. 1.2. Число точек процесса П, попавших в такое множество Л, равно Ν(Α) = #{Π(ω)ηΑ), (1.18) где символом # обозначается число элементов множества (которое равно 0, если множество пусто, и оо, если множество бесконечно). Так как правая часть зависит от ω, мы видим, что Ν(Α) есть функция Ν(Α): Ω-+{0, 1,2, ...,οο}, (1.19) и требуем, чтобы эта функция была измерима для любого тестового множества А. Таким образом, мы предполагаем, что для любого тестового множества А и для любого η выполняется условие {ω:Ν(Α) = η}βΤ. (1.20) Тогда функции Ν(Α) являются случайными величинами, и мы можем рассматривать условия на их распределения и совместные распределения. Обычно нет необходимости проявлять особую щепетильность при выборе подмножеств пространства 5, которые рассматриваются в качестве тестовых множеств. Дело в том, что мы всегда можем построить более сложные множества из более простых при помощи операций, относительно которых функция N ведет себя очевидным образом. Например, если 5 — вещественная прямая R (рис. 1.3), достаточно, чтобы условие (1.20) выполнялось, если А — открытый интервал (а,Ь). Любое открытое множество G есть счетное объединение непересекающихся открытых интервалов Л/, а значит, если все N(Af) — случайные величины, то и N(G) = ΣΝ(Α·}) — случайная величина. Любое замкнутое множество F есть пересечение убывающей последовательности открытых множеств С/, и N(F) есть предел убывающей последовательности N(Gi). Таким образом можно показать, что N(A) является случайной величиной для любого множества Л, которое может нас заинтересовать (на самом деле, для любого борелевского множества). То же самое верно в случае S = R2 (рис. 1.1), если только условие (1.20) выполняется для любого открытого прямоугольника Л. Имеются соответствующие результаты для Rd и для более сложных геометрий, но мы не будем углубляться в них, поскольку при том подходе к проблеме существования, который принят в следующей главе, в этом нет необходимости. Однако, похожие вопросы в несколько ином контексте возникнут в §3.4. В §2.1 мы дадим формальное определение пуассоновского процесса как случайного счетного подмножества Π пространства S, для которого случайные величины Ν(Α), подсчитывающие количество точек из П,
§ 1.4. Неизбежность распределения Пуассона 21 попавших в тестовые множества Л, обладают двумя свойствами. Одно из них — это свойство независимости, описанное в § 1.1. Другое состоит в том, что N(A) имеет распределение ν(μ), где параметр μ зависит от множества Л. Зависимость μ от Л не произвольна; на самом деле функция множества μ(·) должна быть неатомической мерой на 5. Наоборот, предположим, что μ — неатомическая мера на 5. Можем ли мы быть уверены, что существует пуассоновский процесс, для которого Ν(Α) имеет распределение Ρ(μ(Α)) при любом Л? Из общих теорем существования для случайных процессов следует, что существуют семейства случайных величин Ν(Α) с правильными совместными распределениями, но гораздо труднее показать (см. [24]), что они получаются из некоторого случайного множества Π по формуле (1.18). Значительно проще предъявить явную конструкцию, что и сделано в §2.5 при очень слабых предположениях относительно 5 и μ. Эти предположения очевидно выполняются во всех известных приложениях, так что в итоге мы получаем теорию огромной общности и широкой применимости. Но прежде чем приступить к ее описанию, в следующем параграфе мы покажем, что такая простая теория может быть построена только для пуассоновских процессов. § 1.4. Неизбежность распределения Пуассона Рассмотрим в качестве тестового множества At круг радиуса t на двумерной плоскости (с тем же успехом мы могли бы взять квадрат со стороной t). Положим pn(t)=F{N(At) = n}y (1.21) qn(t)=V{N(At)<n}. (1.22) Так как N(At) возрастает по t, функция qn(t) убывает, поэтому функции qn и рп имеют разрывы только первого рода и дифференцируемы почти всюду. Мы приведем эвристический вывод дифференциального уравнения, которому удовлетворяет функция рп. Случайная величина N(At) совершает скачок от η к я+1 в тот момент, когда расширяющаяся граница множества Л/ находит на одну из случайных точек. Вероятность того, что это произойдет в интервале между t и t + /ζ, есть вероятность наличия точки в кольце между At и Л/+д, и мы предполагаем, что она мала при малом h. Если пренебречь вероятностью того, что в кольце окажется более одной точки, эта вероятность (при фиксированном числе точек в множестве At) равна μ(ί + К) — μ(ί)9 где МО = Ε {ад)}. (L23)
22 Глава 1. Стохастические модели для случайных множеств точек Если эта величина не зависит от числа точек в Л/, то при малых h мы имеем Qn(t) - qn{t + h) = ρη(ί){μ(ί + A) - μ{ί)}. Устремляя h к нулю, получаем _dqn_ _ άμ π 24) Так как рп = qn — ^-ь отсюда следует, что Первое из этих уравнений показывает, что — (In ро + μ) = О, и, поскольку /?о(0) = 1, μ(0) = 0, мы получаем, что In ро + μ = О и, следовательно, р0(/) = *-/*«> (1.26) при любом /. Второе уравнение в (1.25) можно записать в виде откуда, поскольку рп(0) — 0 при η ^ 1, следует, что pn(t)=e-^{pn^(s)e^^ds. (1.27) о Индукцией по η с базой (1.26) получаем, что Pn(t) = пГ , (1.28) т.е. М(Л/) имеет распределение Ρ(μ(ί)). Это рассуждение очевидным образом опиралось на несколько неявных предположений, но тем не менее оно наводит на мысль, что распределение Пуассона есть неизбежное следствие «полной случайности», содержащейся в наших предположениях о независимости. Мы вернемся к этому вопросу более систематически в гл. 8.
Глава 2 Пуассоновские процессы в произвольных пространствах §2.1. Определение и основные свойства Пространство состояний S, в котором лежат точки пуассоновского процесса, обычно является евклидовым пространством некоторой размерности d или, в более общей ситуации (см. гл. 7), многообразием, локально эквивалентным Rd. Однако теория пуассоновских процессов не использует специальные свойства евклидовых пространств; нам необходимо лишь наличие подходящего семейства подмножеств для использования в качестве тестовых множеств, т.е. нам необходимы множества, для которых считающая функция ад = #{ппл} (2.1) есть корректно определенная случайная величина. Естественный способ добиться этого — предположить, что 5 является измеримым пространством. Иными словами, мы предполагаем, что некоторые подмножества пространства S называются измеримыми и что измеримые множества образуют σ-алгебру, т.е. • пустое множество измеримо, • дополнение измеримого множества измеримо, • объединение счетного числа измеримых множеств измеримо. Нам необходимо также гарантировать, что измеримых множеств будет достаточно много, а именно, что они будут разделять точки. Это можно сделать, приняв слабое предположение, что диагональ D = {(xyy):x=y) (2.2) измерима в пространстве SxS. Выполнение этого условия автоматически означает, что каждое одноточечное множество {х} измеримо. В дальнейшем мы всегда предполагаем, что эти условия выполнены, не делая специальных оговорок. В случае 5 = Rd в качестве измеримых множеств всегда рассматриваются борелевские множества, т.е. элементы наименьшей σ-алгебры, содержащей все открытые множества. Условие
24 Глава 2. Пуассоновские процессы в произвольных пространствах на диагональ, очевидно, выполнено, поскольку множество D замкнуто в пространстве IR2rf l\ Пуассоновским процессом на пространстве состояний S называется случайное счетное подмножество2) Π в S, такое, что (1) для любых непересекающихся измеримых подмножеств А ь Α<χ,..., Ап в S случайные величины Ν(Α\), Ν(Α2), · · ·, Ν(Αη) независимы и (2) N (А) имеет распределение Пуассона Τ(μ), где μ = μ(Α) удовлетворяет условию 0 < μ < оо. Таким образом, если значение μ(Α) конечно, то с вероятностью единица ППЛ есть конечное множество, пустое в случае μ(Α) = 0. При μ(Α) = оо с вероятностью единица множество ПпЛ бесконечно и счетно. В силу равенства (1.5) мы получаем μ(Α)=Ε{Ν(Α)}. (2.3) Если множества А\, Α<ι,..., Ап не пересекаются и их объединение равно Л, то оо откуда, переходя к математическим ожиданиям, получаем оо μ(Α) = ^μ{Αη). (2.4) я=1 ^Для целей этой книги, как и в значительной части всей теории случайных процессов естественно предполагать, что пространство состояний S есть стандартное борелевское пространство, т. е. пространство, в котором задана счетно порожденная σ-алгебра подмножеств, разделяющих точки. Если такое пространство недискретно, как это предполагается далее, то оно борелевски изоморфно отрезку [0, 1] со стандартной борелевской структурой. Если на σ-алгебре задана вероятностная мера, то естественно и достаточно для всех приложений считать, что получившееся пространство с мерой изоморфно в смысле теории меры (т. е. по модулю множеств меры нуль) тому же отрезку с мерой Лебега. Если же мера неотрицательна и лишь σ-конечна, но не конечна, такое пространство изоморфно в том же смысле прямой с мерой Лебега. Структура таких пространств с вероятностной мерой аксиоматизирована Дж. фон Нейманом, а позднее более экономно — В. А. Рохлиным, который предложил называть их пространствами Лебега. — Прим. ред. 2)Автор последовательно придерживается точки зрения, более распространенной среди специалистов по теории вероятностей, что случайное множество есть функция, заданная на некотором не определяемом пространстве с вероятностной мерой, со значениями в счетных подмножествах пространства состояний. Другая (эквивалентная в существенном) точка зрения состоит в данном контексте в том, что случайное множество есть вероятностная мера на пространстве счетных подмножеств пространства состояний. Полезно использовать обе интерпретации. — Прим. ред.
§2.1. Определение и основные свойства 25 Таким образом, μ— мера на пространстве состояний S, которую мы будем называть мерой интенсивности пуассоновского процесса Π (общепринятого стандартного термина нет). Зная меру интенсивности и используя свойства (1) и (2), мы можем найти совместные распределения считающих функций Ν(Α) для различных множеств Л. Чтобы убедиться в этом, предположим, что множества А\у A2f..., Ап измеримы, но, возможно, пересекаются. Рассмотрим все множества вида В = А*Г)А2Г)...Г)А*ПУ где каждое Л у есть либо Л/, либо его дополнение. Всего таких множеств 2", и все они не пересекаются. Перенумеруем их в произвольном порядке: В\у В2у..., В2п\ т0ГДа А; = U β" '€7/ где 7/ есть подмножество в {1, 2,..., 2п). Следовательно, N{A,) = YiN{Bl), (2.5) причем все Ν(Βι) независимы и имеют известные пуассоновские распределения ν(μ(Βι)). Отсюда мы можем найти вероятность любого события, определяемого в терминах случайных величин Ν(Α\), N(A2)f ..., Ν(Αη). Например, при η — 2 перенумеруем множества так, чтобы выполнялись равенства Л, =fl, U£2, A2 = BlUB3; тогда ЩА{) = ЩВ,) + N(B2), N(A2) = ВД) + N(B3). Предположим, например, что нам нужно вычислить ковариацию случайных величин N(A\) и Ν(Α2). Мы имеем Ε{Ν(Αι)Ν(Α2)}=Ε{Ν(Βι)4Ν(Β{)Ν(Β3) + Ν(Β2)Ν(Βι) + Ν(Β2)Ν(Β3)} = = {μ(Βι)2 + μ(Βι)} + μ(Βι)μ(ΒΖ)+μ(Β2)μ(Βι)+μ(Β2)μ(Β3) = = μ(Αι)μ(Α2)+μ(Β{). Поскольку В\ — А\ Г)А2у отсюда следует, что Μν{Ν(Αι),Ν(Α2)) = μ(Αι ПА2). (2.6) Не любая мера может быть мерой интенсивности пуассоновского процесса. Предположим, что мера μ на пространстве S имеет атом в
26 Глава 2. Пуассоновские процессы в произвольных пространствах точке х, т. е. μ приписывает ненулевую меру одноточечному множеству {х}\ т — μ({χ}) > 0. Тогда из условия (2) при А = {х} следует, что для пуассоновского процесса с мерой интенсивности μ выполняется условие Ρ{Ν({χ}) ^ 2} = 1 - е~т - те~т > 0, что очевидным образом противоречит определению считающей функции (2.1). Значит, μ не может быть мерой интенсивности пуассоновского процесса. Таким образом, мера интенсивности должна быть неатомической, т. е. удовлетворять условию β({χ}) — 0 Для любого χ £ S. (2.7) (Некоторые авторы используют этот термин в более сильном смысле, но нам это не понадобится.) Замечательно то, что выполнения этого условия почти достаточно для существования пуассоновского процесса. В §2.5 мы покажем, что при очень слабом условии конечности любая неатомическая мера является мерой интенсивности некоторого пуассоновского процесса. Таким образом, варьируя меру μ, мы получаем широкое разнообразие пуассоновских процессов на данном пространстве состояний S. При S = M.d в наиболее интересных случаях мера интенсивности задается при помощи плотности интенсивности. Это положительная измеримая функция λ на S, такая, что мера μ задается как интеграл от λ по d-мерной мере Лебега: μ(Α) = $\(χ)άχ (2.8) А (где dx обозначает dx\dx2.. .dxa). Если функция λ непрерывна в точке х, то из равенства (2.8) следует, что для маленьких окрестностей А точки χ выполняется соотношение μ(χ) ~ \(х)\А\, (2.9) где \А\ —лебегова мера (длина при d = 1, площадь при d = 2, объем при d — 3 и т.д.) множества А. Таким образом, величина А(*)|Л| приближенно равна вероятности того, что точка из Π попадет в маленькое множество Л, и эта вероятность выше в тех областях, где значения функции λ велики, и ниже в тех областях, где значения функции λ малы. В частном случае, когда плотность λ постоянна, так что μ(Α) = \\Α\, (2.10) говорят об однородном пуассоновском процессе. Стохастические свойства такого случайного множества не меняются при параллельных переносах и вращениях пространства S, и это единственный пуассоновский
§2.2. Теорема о суперпозиции 27 процесс (конечный на ограниченных множествах), обладающий этим свойством. Однако мы не предполагали, что интеграл в формуле (2.8) сходится, даже на ограниченных множествах. В большинстве задач это условие выполнено (хотя в гл.9 мы рассмотрим одно очень важное исключение), так что μ(Α) и, следовательно, Ν(Α) конечны на ограниченных множествах. В этом случае с вероятностью единица множество Π локально конечно и не имеет конечных предельных точек. Рассмотрим теперь случай S = К. и предположим, что мера μ(Α) конечна на ограниченных множествах А (но необязательно задается плотностью λ). Тогда мера μ однозначно определятся своими значениями на интервалах (а, Ь]. Положим Αί(/)=/ ΜΟ,^Ε^Ο,/]}, />0, v; \-M/,0] = -E{yV(/,0]}, /<0; V * ; ясно, что М — возрастающая функция и μ(α, b] = Λί(ft) - Λί(α), α < b. (2.12) Тогда мера μ однозначно определяется функцией Μ и называется мерой Стилтьеса, отвечающей возрастающей функции М. Мера μ является неатомической тогда и только тогда, когда функция Μ непрерывна. Она может иметь или не иметь представление в виде интеграла с переменным верхним пределом t M(t)=^X(x)dxy (2.13) о и если такое представление существует, то μ задается формулой (2.8). В частности, однородный пуассоновский процесс интенсивности λ соответствует функции Λί(0 = λ/, (2.14) где λ — константа. §2.2. Теорема о суперпозиции Пуассоновские процессы обладают рядом специальных свойств, благодаря которым применять их и вычислять соответствующие вероятности зачастую оказывается на удивление просто. Важнейшие их них сформулированы в теореме о суперпозиции, которой посвящен этот параграф, теореме об отображении, которая будет доказана в § 2.3, и различных
28 Глава 2. Пуассоновские процессы в произвольных пространствах теоремах о выборе, раскраске и маркировке, которые будут рассмотрены в полной общности в гл. 5. Теорема о суперпозиции почти напрямую следует из теоремы о счетной аддитивности, с точностью до одной технической проблемы, которая решается в следующей лемме. Лемма о дизъюнктности. Пусть Πι и Н2— независимые^ пуассоновские процессы на пространстве состояний S, и пусть А — измеримое множество, для которого значения μ\(Λ) и μ2(Α) конечны. Тогда с вероятностью единица П\ и Т12 дизъюнктны на множестве А: Ρ {Πι ПП2ПЛ =0}= 1. (2.15) Доказательство. Обозначим через Αϊ множество всех конечных подмножеств Λ в Л. Превратим А? в измеримое пространство, рассматривая наименьшее семейство измеримых множеств, относительно которого функция А^#(АГ)В) (2.16) измерима для любого измеримого множества В С Л. Тогда Πι Π Л есть случайный элемент пространства Л^, и его распределение есть некоторая вероятностная мера Р\. Аналогичным образом, случайное множество П2 Π Л имеет распределение Р2 на Л^, причем, поскольку процессы Πι и П2 независимы, совместное распределение множеств Πι Π Л и П2 Π Л есть мера Р\ χ Р2 на Л^ χ AL Зададим отображение η: А^ χ Л^ —> (Л χ A)f формулой τ?(Λι,Λ2) = А, хА2. Покажем сначала, что отображение η измеримо; для этого достаточно показать, что множество ту-1 {Λ: #(Λ Π С) = п} измеримо в Л^ χ Л^ для любого измеримого множества С С Л χ Л. Это верно для множеств вида С = В\ χ В2у поскольку утверждение, что #fa(AlfA2)n(fli xB2)} = ny эквивалентно утверждению, что #(A,nflO = ib #(A2n B2) = n2 !)В формулировке леммы используется понятие независимости пуассоновских процессов, которое не определялось заранее; фактически определение неявно содержится в доказательстве, где упоминается «совместное распределение» и чуть ниже определяется нужная алгебра измеримых множеств. В соответствии с данным определением, под независимостью двух процессов автор понимает независимость соответствующих функций на некотором пространстве с вероятностной мерой, принимающих значения в множестве счетных подмножеств пространства S.— Прим. ред.
§2.2. Теорема о суперпозиции 29 для некоторых П\, я2, удовлетворяющих условию ti\ti2 — п. Более того, класс всех множеств С такого вида замкнут относительно дизъюнктных объединений и монотонных пределов и поэтому (см., например, теорему 1.5 из [30]) содержит все измеримые множества С в А х Л. В частности, поскольку диагональ D измерима в SxS, ее ограничение Da = D Π (Л χ Л) измеримо в Л χ Л, так что множество У=7?-,{Л:#(ЛпОл) = 0} измеримо в Af χ АК Утверждение (2.15) эквивалентно тому, что (Р\ χ х P2W) — 1, и по теореме Фубини оно выполнено, если для всех Ль лежащих вне множества нулевой Pi-меры, выполняется равенство Р2{Л2:(Л,,Л2)€/}=1. Но это в точности равносильно утверждению, что P2{W2(A,) = 0}=1, которое выполнено, поскольку множество А\ конечно, так что μ2(Λι) = 0 для всех Aj. Лемма доказана. . D Этот результат естественно обобщается на множества Л, являющиеся счетными объединениями множеств, на которых обе меры μι и μ2 конечны. В частности, он верен для А = S, если меры μ\ и μ2 являются σ-конечными. Заметим, что какое-то условие конечности необходимо, как демонстрирует следующий пример. Предположим, что Π — однородный процесс единичной интенсивности на IR2 (правда, нам еще предстоит доказать его существование). Пусть φ — проекция φ(χ, у) = х\ тогда множество <р(П) = {х:(хуу)еП} (2.17) есть случайное счетное подмножество в R. Его считающие функции имеют сильно вырожденные распределения: для борелевского множества Л величина #ЫП)ПЛ} = #{ПП(ЛхМ)} имеет распределение Пуассона со средним 55 dxdy, AxR которое равно 0 или оо в зависимости от того, равна или не равна нулю мера |Л|. Следовательно, случайная величина #{<^(П)ПЛ} с вероятностью единица равна либо 0, либо оо, так что в любом случае она имеет распределение Τ(μ), где μ — 0 или оо. По определению φ(Π) — пуассоновский
30 Глава 2. Пуассоновские процессы в произвольных пространствах процесс на К с мерой интенсивности |0. еслиИ| = 0, PV ; \оо, если \А\ >0. v ; Пусть теперь Πι = Пг = <^(П). Считающие функции Ν\(Α\) и Л^гИг) процессов Πι и Пг вырождены и, следовательно, тривиальным образом не зависят друг от друга. Поэтому Πι и Пг — независимые пуассоновские процессы, но утверждение (2.15) ложно при \А\ > 0. Можно возразить, что «на самом деле» процессы Πι и И2 не являются независимыми, что они лишь кажутся таковыми, потому что мы описываем их в терминах считающих процессов. Если бы мы снабдили S°° более богатой структурой измеримых множеств, мы смогли бы обнаружить, что Πι и Пг являются копиями одного и того же случайного множества <^(П). Читателя, которого интересуют подобные рискованные вопросы, мы отсылаем к работе [24]. Но, как это часто бывает, все эти сложности не мешают нам достичь главной цели, для которой нужна лемма о дизъюнктности, а именно доказать следующую теорему. Теорема о суперпозиции. Пусть ПьПг,...—счетный набор независимых пуассоновских процессов на пространстве состояний S, и пусть μη—мера интенсивности процесса Пп. Тогда суперпозиция1^ этих процессов оо U=[jUn (2.19) есть пуассоновский процесс с мерой интенсивности оо μ = 5>«· (2.20) Доказательство. Пусть Νη(Α) — число точек процесса Нп в измеримом множестве А. Если μη(Α) < оо при любом пу то по лемме случайные множества Ип не пересекаются внутри множества Л, так что число точек процесса ПвЛ равно оо Ν(Α) = ΣΝη(Α). (2.21) По теореме о счетной аддитивности Ν(Α) имеет распределение V(p)y где μ = μ(Α) задается формулой (2.20). С другой стороны, если μη(Α) = оо ^Суперпозиции пуассоновских процессов в смысле формулы (2.19) отвечает то, что называется сверткой мер, соответствующих этим процессам.—Прим. ред.
§2.3. Теорема об отображении 31 при некотором я, то Nn(A) = N(A) = 00 и равенство (2.21) выполняется тривиальным образом. Для завершения доказательства нам осталось показать, что случайные величины N(A\),N(A2),...iN(Ak) независимы, если множества А-} не пересекаются. Но это очевидно, поскольку в двумерном массиве случайных величин Nn(A;l /1=1,2,..., / = 1,2,...,*, все элементы независимы, а каждое из N(Aj) определяется в терминах подмножества этих величин, причем эти подмножества не пересекаются при разных /. D Для полноты общности теорема была сформулирована для бесконечных счетных суперпозиций; в качестве очевидного следствия она содержит соответствующий результат для конечных суперпозиций. В завершение этого параграфа мы сформулируем еще один результат, который едва ли этого заслуживает, так как доказывается элементарной проверкой по определению. Однако этот результат используется так часто, что имеет смысл сделать достоянием общественности его явную формулировку. Теорема об ограничении. Пусть Π — пуассоновский процесс с мерой интенсивности μ на пространстве состояний S, и пусть S\ — измеримое подмножество в S. Тогда случайное счетное множество Πι =nnSi (2.22) можно рассматривать либо как пуассоновский процесс на S с мерой интенсивности μι(Α)=μ(Αη8{), (2.23) либо как пуассоновский процесс на Si, мера интенсивности которого есть ограничение меры μ на множество S\. §2.3. Теорема об отображении Второе важнейшее свойство пуассоновских процессов состоит в том, что при отображении пространства состояний в другое пространство образы случайных точек вновь образуют пуассоновский процесс. Неприятности могут возникнуть, только если отображение склеит несколько точек в одну, причем эту опасность легко обнаружить, посмотрев на то, как преобразуется мера интенсивности. Это простое свойство имеет глубокие следствия.
32 Глава 2. Пуассоновские процессы в произвольных пространствах Итак, пусть Π — пуассоновский процесс на пространстве состояний S с мерой интенсивности μ, и пусть / — функция из 5 в другое (или то же самое) пространство Т. Мы предполагаем, что Τ', как и 5, есть измеримое пространство, удовлетворяющее условиям §2.1, и что функция / измерима, т. е. множество rl(B) = {xeS:f(x)eB} измеримо в S для любого измеримого множества В С Т. Точки /(х), где χ е П, образуют случайное счетное множество /(П) С Г, и мы хотим доказать, что это пуассоновский процесс в Т. Для этого рассмотрим число Ы*(В) = ШЩГ)В} (2.24) точек случайного множества /(П) в В. Если все точки f(x)y χ е Π, различны, то Ν*(Β) = #{х е П: /(*) е В} = Л^Г1^)) (2.25) и, следовательно, Ν*(Β) имеет распределение Ρ(μ*), где μ*=μ·(Β)=μ(Γ1(Β)). (2.26) Более того, если множества £ι, ^2,..., ^ не пересекаются, то их прообразы также не пересекаются, поэтому случайные величины Ν*(Β·}) независимы. Таким образом, /(П) есть пуассоновский процесс в Г, если только все точки f(x), χ е П, различны. Мера интенсивности μ* этого процесса задается формулой (2.26), т.е. является образом меры μ под действием функции /. Однако условие, что все точки /(Π), χ е П, должны быть различны, существенно, в чем легко убедиться, взяв в качестве / постоянную функцию, которая отображает все пространство 5 и, следовательно, все множество Π в одну точку пространства Т. Более общим образом, если μ и / таковы, что индуцированная мера имеет атом в точке t е 7\ то множество А = f~{(t) имеет ненулевую меру т = μ(Α) = μ*({/}), поэтому с ненулевой вероятностью 1 - е~т — те~т в Π имеются хотя бы две точки, которые попадают в Л, а значит, отображаются в одну и ту же точку t. Таким образом, нам как минимум необходимо предположить, что мера μ* неатомическая. Нам также необходимо какое-то условие конечности. Оказывается, достаточно предположить, что мера μ является σ-конечной, т. е. пространство S можно представить в виде счетного объединения измеримых множеств S„, для которых μ(5π) < оо. Предполагать, что мера μ* является σ-конечной, не обязательно, так что теорема достаточно сильна, чтобы охватить, например, процесс φ(Π) из предыдущего параграфа.
§2.3. Теорема об отображении 33 Теорема об отображении. Пусть Π — пуассоновский процесс на пространстве состояний S с σ-конечной мерой интенсивности μ, и пусть /: 5 —► Τ — такая измеримая функция, что индуцированная мера (2.26) не имеет атомов. Тогда /(П) — пуассоновский процесс на пространстве Τ и его мера интенсивности есть индуцированная мера μ*. Доказательство. Предположим сначала, что p(S) < оо. Пусть А — произвольное измеримое множество, и пусть Ас — его дополнение. Обозначим через Πι и Щ ограничения процесса Π на А и Лс соответственно; тогда Πι и Ώ.2 — независимые пуассоновские процессы. Применяя рассуждения, приведенные в доказательстве леммы о дизъюнктности, к случайному множеству /(П))х/(П2)СГхГ, получаем, что /(Πι) и /(Щ) не пересекаются с вероятностью единица. Обозначим через Μ меру на пространстве SxSf заданную следующим правилом: Μ (С) (где С С S x S) есть математическое ожидание числа пар (х, у) е С, для которых χ е п, yen, f(x) = f(y). Тогда из дизъюнктности множеств /(Πι) и /(П2) следует, что М(Л χ Ас) = 0 (2.27) при любом А. Для любых АУВ С S множество А х В может быть представлено в виде объединения множества (АГ)В) χ (АГ)В) и множеств, лежащих либо в Л χ Асу либо в В χ Всу так что М(А хВ) = т(А Π β), (2.28) где т(А) = М(А χ А). Полагая В = S в формуле (2.28), получаем т(А) = Μ (Α χ S), откуда следует, что т — мера. Пусть М\—мера на диагонали D С S χ 5, являющаяся образом меры т при отображении χ ι—> (ху χ). Тогда Μι(Α хВ) = т(АГ)В)у откуда получаем, что Λίι(>ί χΒ)=Μ(ΑΓ)Β) для любых Л, В. По единственности продолжения меры имеем М\ — М; в частности, мера Μ сосредоточена на D. Следовательно, с вероятностью единица не существует таких различных точек χ е П, у е П, что
34 Глава 2. Пуассоновские процессы в произвольных пространствах f(x) = f(y). Отсюда следует равенство (2.25), и утверждение теоремы доказано. Теперь отбросим условие μ(5) < оо и рассмотрим общий случай σ-конечной меры μ. Таким образом, мы предполагаем, что существуют такие непересекающиеся множества S/, что оо S = (J S„, μ(δ„) < оо. (2.29) Пусть Tin—ограничение процесса Π на Sn\ тогда П^ — независимые пуассоновские процессы с мерами интенсивности μη. Отсюда следует, что f(Un) — независимые пуассоновские процессы с мерами интенсивности μη (Β) == μη(ί~χ(Β)) и суперпозиция (оо \ оо (J П„ = (J /(П„) п-\ / л=1 есть пуассоновский процесс с мерой интенсивности оо μ*(β)=^μ:(β) = μ(Γ1(β)). Теорема доказана. D Чтобы проиллюстрировать применение теоремы об отображении, предположим, что Π — пуассоновский процесс в MD с плотностью интенсивности λ(*ι, *2> · -·,*θ)· Возьмем в качестве функции /: RD —> Rd, где d ^ Dy проекцию f(xu *2, · · ·, *о) = (*ь *2,. · ·, Xd). (2.30) Для измеримого множества В СШ° мы имеем μ*(Β)= $···$ X(xiyx2,...,XD)dxidx2...dxD = BxRD~d = С· · -§A*(jt|,*2, · · ·» *</)d*i ^2 ·· · dxd, в где λ*(*ι,*2, .·-,*<*) = $···$Α(λγι,j:2, ...,α:ο)^+ι^+2 ··· dxD. (2.31) Ясно, что μ — σ-конечная мера, а μ* — неатомическая, так что теорема о суперпозиции применима и мы получаем, что в случае, когда интеграл (2.31) сходится, ДП) есть пуассоновский процесс на Rd с плотностью интенсивности А*. Таким образом, проекция многомерного пуас- соновского процесса есть пуассоновский процесс, причем его плотность
§2.3. Теорема об отображении 35 интенсивности получается интегрированием исходной плотности интенсивности по лишним переменным. В качестве еще одного примера рассмотрим однородный процесс Π интенсивности λ на плоскости и перейдем от декартовых координат (х, у) к полярным координатам (г, Θ). Тогда функция / задается формулой f(x,y) = ((x2 + y2)i/2, arctgfo/*)) И μ*(Β)= $$ Xdxdy = §\rdrd9. /-ΐ(β) Β Таким образом, точки (г, Θ) образуют пуассоновский процесс в полосе {(/\0): г>0> О^0<2тг} (2.32) с плотностью интенсивности А*(г,0)=Аг. (2.33) Если не обращать внимания на углы 0, то значения г образуют пуассоновский процесс на (0, оо) с плотностью интенсивности А**(г) = $ А*(г> θ)άθ - 2πλΛ (2·34) о Это позволяет делать выводы о расстояниях от точек процесса Π до начала координат. Например, нетрудно показать, что расстояние от ближайшей точки до начала координат имеет плотность распределения 2пХге~Хжг\ г>0. (2.35) В качестве последнего примера рассмотрим неоднородный пуассоновский процесс Π на Е, задаваемый функцией (2.11), где Μ — непрерывная возрастающая функция и μ(α> b) = M(b) - М(а). (2.36) Возьмем в качестве / саму функцию М, которая монотонно отображает ЕвЕ. Если / > 0 и χ = Λί(/), то μ*(0> χ] = μ*(0> M{t)\ = μ(0, /] = M(t) = χ; аналогичное рассуждение показывает, что μ*(—χ, 0] = χ. Таким образом, Μ(Τΐ) — однородный пуассоновский процесс единичной интенсивности на (конечном или бесконечном) интервале (Λί (—оо), Λί(оо)). Отсюда следует, что любой одномерный пуассоновский процесс можно преобразовать в процесс с постоянной интенсивностью при помощи непрерывной монотонной функции. Это означает, что в размерности один
36 Глава 2. Пуассоновские процессы в произвольных пространствах ключевую роль играет однородный пуассоновский процесс (см. гл. 4) и свойства наиболее общего локально конечного процесса могут быть выведены из свойств однородного процесса. §2.4. Процесс Бернулли Пусть Π — пуассоновский процесс на пространстве состояний 5 с мерой интенсивности μ, и предположим,что ^(S) < оо. Тогда Π почти наверняка есть конечное подмножество в S, причем общее количество точек N(S) имеет пуассоновское распределение Ρ(μ(5)). Что будет, если рассмотреть условное распределение процесса Π при фиксированном значении N(S)? Обозначим через Р„ условную вероятностную меру P„{-} = P{-|W(S) = /i}. (2.37) Пусть А\у Ач,..., Ak — непересекающиеся подмножества в 5. Тогда Fn{N(Al) = nl,N(A2)=n2y...,N(Ak) = nk} = = ¥n{N(A0) = nQ,N(A{) = nl,...fN(Ak)=nk}/F{N(S) = n} = k β-*Αι)μ(Αρη' /£>-^5V(S)" V A g-^'V(V»/ ,t /=0 '' riQ\nx\...nk\\ /x(S) ) \ /x(S) ) "Λ~μϊβ) *! (μ{Λο)_Υ0(ίάίάύ)η[ .. ίί^Μ)η\ k где по — η — Σ nj и ^о есть дополнение множества А \ U А2 U ... U Ak. Случайное конечное множество Π С S, для которого #П = η и п\ /ιοί/ΐι!.. ./ι*! ^(^о)"0/^^!)"1 . - - Р(>1*)я*· (2.38) называется процессом Бернулли. Его мера интенсивности есть E{N(A)} = np(a)y (2.39) так что ρ — вероятностная мера на 5. Используя эту терминологию, можно сказать, что при переходе к условному распределению при фиксированном значении N(S) = η пуассоновский процесс с конечной мерой интенсивности μ превращается в процесс Бернулли с параметрами η и Р(-) = g- (2.40)
§2.5. Теорема существования 37 Имеется гораздо более простой способ построения процесса Бернул- ли. Пусть ΛΊ, ^2,..., Хп — независимые случайные величины, распределенные на пространстве 5 в соответствии с вероятностной мерой р. Если мера ρ не имеет атомов, то значения Хг различны с вероятностью единица (формальное доказательство этого факта есть упрощенная версия доказательства леммы о дизъюнктности), поэтому {Х\, Jfe,..., Хп) — случайное множество из η элементов. Простая выкладка с использованием мультиномиальных коэффициентов показывает, что считающие функции N(A) = #{r:XreA} (2.41) удовлетворяют равенству (2.38). Таким образом, при фиксированном N(S) точки конечного пуассонов- ского процесса выглядят в точности как N(S) независимых случайных величин с одинаковым распределением (2.40). Этот факт имеет несколько следствий, важнейшее из которых описано в следующем параграфе. Вот другое следствие. Рассмотрим случайную величину Ζ = Ζ(Π), определенную в терминах пуассоновского процесса П, и предположим, что мы можем вычислить ее математическое ожидание Ε(Ζ) в терминах меры интенсивности μ, которая предполагается конечной. Положим μ(·) = μρ(-), где ρ — фиксированная вероятностная мера, а μ = p(S) может варьироваться. Тогда E(Z) есть функция от μ: скажем, Ε(Ζ) = ψ(μ). Мы можем записать равенство оо E(Z) = 5>„ME„(Z), (2.42) где E„(Z) = E(Z I E(S) = η) — соответствующее математическое ожидание для процесса Бернул- ли (2.38), которое не зависит от μ. Следовательно, '°° η ψ(μ)β» = Σ^Έ.η(Ζ). (2.43) л=0 Раскладывая ψ(μ)βμ в ряд по степеням μ и рассматривая коэффициенты чтого разложения, мы можем найти Εη(Ζ). Пример подобного вычисления подробно рассмотрен в §4.3. §2.5. Теорема существования Теперь мы можем обратить рассуждения предыдущего параграфа и доказать существование пуассоновского процесса с заданной мерой ин-
38 Глава 2. Пуассоновские процессы в произвольных пространствах тенсивности. Разумеется, мы должны предположить, что заданная мера является неатомической; кроме того, мы требуем, чтобы она удовлетворяла некоторому слабому условию конечности. Условие σ-конечнос- ти является достаточным, но не необходимым, поэтому имеет смысл несколько ослабить его, чтобы включить в рассмотрение меры вида (2.18). Теорема существования. Пусть μ— неатомическая мера на пространстве состояний S, представимая в виде оо μ = Σμη, μ«(5)<οο. (2.44) п-\ Тогда существует пуассоновский процесс на S с мерой интенсивности μ. Докааательство. Не умаляя общности, предположим, что μη(5) > О при всех п. На подходящем вероятностном пространстве построим такие независимые случайные величины Nn, Xnry пуг^ 1,2,3,..., что Νη имеет распределение Vfan(S))y а Хпг имеет распределение />«(·) = ■£#· (2-45) Положим Пусть MS)' Пл = {ХяЬХя2,...,ад (2.46) со n=|Jnn. (2.47) Nn(A) = #{TlnA}. Для непересекающихся множеств Л\у Л2, ·..,/U обозначим через А$ дополнение их объединения. Тогда V{Nn(Ai) = mu Nn(A2) = m2y ..., Nn{Ak)^mk \ Nn = m) = ml т$\т\\ ... т&! Pn{Ao)mPn{A\)Mi...Pn{Ak)m>,
§2.5. Теорема существования 39 где то = т — т\ — m<i — ... — тк. Следовательно, V{Nn(Ax) = mi, Νη{Α2) = m2,..., Nn{Ak) = тк) = oo k k = ]Г π«-Σ ηΐ;(μη(Λο))Υ[τΓηιι(μη(Λ;)) = П^Д/хя(>4у)). «=2«/ /=° /=° Таким образом, Nn(Aj) — независимые случайные величины с распределениями ν(μη(Α})), так что Τίη — независимые пуассоновские процессы с мерами интенсивности μη. По теореме о суперпозиции формула (2,47) задает пуассоновский процесс с мерой интенсивности μ. Теорема доказана. D
Глава 3 Суммирование по пуассоновским процессам §3.1. Математические ожидания, дисперсии и распределения Эта глава посвящена суммам вида Σ = £/(*), (3-1) хеп где / — вещественнозначная функция на пространстве состояний пуас- соновского процесса П. Имеется ряд простых, но очень важных результатов, которые дают условия (абсолютной) сходимости таких сумм и выражения для математического ожидания, дисперсии и характеристической функции случайной величины Σ. В этом параграфе мы получим общий вид этих формул, отложив строгие доказательства до следующего параграфа. Суммы вида (3.1) встречаются во многих приложениях пуассонов- ских процессов. Одно из самых первых приложений связано с так называемым дробовым эффектом, когда событие, представленное точкой некоторого пуассоновского процесса на прямой (играющей роль оси времени), создает эффект, действие которого продолжается еще некоторое время после наступления события. Предположим, например, что радиоактивное вещество испускает частицы в моменты времени О < Т\ < 72 < ..., образующие пуассоновский процесс на (0, оо). Предположим, что эти частицы фиксируются прибором, реакция которого в момент времени t на частицу, выпущенную в,момент времени 7), описывается измеримой величиной вида φ(ί — 7)), где φ — некоторая функция. Если в приборе эти величины суммируются, то показанием прибора будет величина / которая при фиксированном / имеет вид (3.1). В качестве примера в пространстве большей размерности рассмотрим следующую модель. Предположим, что звезды в некоторой части вселен-
§3.1. Математические ожидания, дисперсии и распределения 41 ной распределены в соответствии с пуассоновским процессом π и что мы хотим вычислить результирующее гравитационное поле. Если все звезды имеют одинаковую массу (ср. §5.3), то гравитационный потенциал в точке χ имеет вид (3.1), где f(x) = \х — Х\~{. Метод нахождения распределения случайной величины Σ состоит в следующем: сначала нужно найти искомое распределение для простых функций /, а затем распространить результат на более сложные функции при помощи стандартных приемов теории интегрирования. Рассмотрим сначала функцию /: S —> Е, которая принимает лишь конечное число ненулевых значений /ι, /2, ···,/> и равна нулю вне множества конечной меры μ, где μ — мера интенсивности процесса П. Тогда множество Al = {x:f{x) = fi) (3.2) измеримо, причем Ш] = μ{Α'}) < оо (3.3) и при различных / множества А-} не пересекаются. Таким образом, Ν, = ЩА,) (3.4) — независимые случайные величины с распределениями V{m}), и k ς = ς/(*) = Σ№ <3·5> хеи /=ι Это равенство позволяет найти распределение случайной величины Σ; удобнее всего использовать для этого характеристическую функцию (производящую функцию моментов). Для любого вещественного или комплексного θ мы имеем k k Ε(βΘΣ) = Y[E(e9f'Ni) = Y[exp{(e9f* - l)m}} = = exp| Σ $ (ee[{x) - 1)μ(άχ) > = exp / \(eBf^ - 1)μ(άχ)\, γ.ίκ как / = 0 вне объединения множеств Aj. Полученное равенство Щеет>) = exp i\(eef{x) - 1)μ(άχ)\ (3.6) сч"п> ключевое тождество, из которого следует все остальное.
42 Глава 3. Суммирование по пуассоновским процессам Если функция / принимает как положительные, так и отрицательные значения, то лучше всего взять в качестве θ чисто мнимое число; тогда равенство (3.6) примет вид Е(е'7Е) = ехр / $(е'7/(х) - \) μ(άχ)\, (37) где / — вещественное число. Левая часть этого равенства есть характеристическая функция случайной величины Σ, знание которой при всех вещественных / однозначно задает распределение величины Σ. В следующем параграфе мы покажем, что для произвольной измеримой функции / ряд (3.1) абсолютно сходится с вероятностью единица тогда и только тогда, когда интеграл в формуле (3.7) абсолютно сходится (для некоторого и, следовательно, для всех вещественных / φ 0), и что в этом случае имеет место равенство (3.7). Если функция / принимает только положительные значения, то удобнее брать вещественные отрицательные Θ, так что равенство (3.6) принимает вид Ε(έΤ"Σ) = ехр | - $(1 - e~af{x)) μ(άχ)\ (3.8) для любого и ^ 0. В такой форме оно верно всегда; если интеграл расходится, то Σ = оо с вероятностью единица и равенство (3.8) превращается в тривиальное тождество 0 = 0. Раскладывая обе части равенства (3.6) в ряд по степеням θ и приравнивая коэффициенты при θ и θ2, мы получаем простые тождества Ε(Σ) = J/(Jc)M(rfjc) (3.9) Β(Σ) = $/(χ)2μ(έ/χ). (3.10) 5 Если /ι и /г — две вещественнозначные функции, то, заменяя Of на 01/i -l· ^2/2 в формуле (3.6), мы получаем равенство Ще^+ЬЬ) = ехр | \(е*ЬМ+ЬШ _ ]) μ{άχ)Λ (3.11) которое задает совместное распределение случайных величин Et = £/,(*), Σ2 = Σ Maxell хеп Результат очевидным образом обобщается на три и более функции.
§3.2. Теорема Кэмпбелла 43 Раскладывая обе части равенства (ЗЛ1) в степенной ряд и рассматривая коэффициент при Θ\θ2, получаем E(EiE2) = S/1rf/x$/2rfAi + 5/i/2^; (3-12) таким образом, второе слагаемое в правой части есть ковариация случайных величин Σι и Σ2. Иногда полезно записать левую часть в виде Е( Σ fi(Xx)h(X2)\=E(Yffl(X)f2{X)\+E( Σ /ι(*ι)/2(*2)\ \^ιΛ€Π J \ΧςΠ J \X^X2 J Первое слагаемое в правой части равно § /ι /2 άμ, так что из формулы (3.12) следует, что Ε/ Σ fi(Xi)h(X2)\ =Е( Σ M*i)W Σ №*)Χ (ЗЛЗ) Х\,х2еи Ι \Xien ) \x2eu \ Χ\φΧ<ι / Это тождество обобщается на произведение произвольного числа функций: η ε/ ς мхшх2)...Шп)\= ПЕ(ΣΜχι)\ (ЗЛ4> Ι *ι.*2 **еп 1 /=i \x,eu J \ Xf раал / Все эти результаты восходят к пионерским работам Н. Кэмпбелла [7, 8], и их частные случаи известны в литературе как теорема Кэмпбелла. Мы докажем их все под этим названием в следующем параграфе. Эти результаты дают простой способ вычисления многих распределений, связанных с пуассоновскими процессами. В большинстве приложений мера μ имеет плотность λ относительно меры Лебега на пространстве S, так что интегралы по мере μ имеют вид §... μ(άχ) = §. *.\(x)dx, s s как в §2.1. Обсуждаемые результаты являются еще более общими, чем кажется па первый взгляд. В гл.5 мы увидим, что они немедленно обобщаются на ситуации, подобные рассмотренному выше примеру со звездами, в случае, когда массы звезд не равны, а являются независимыми случайными неличинами. §3.2. Теорема Кэмпбелла Формальные вычисления из предыдущего параграфа можно обоспо- иать, начав с равенства (3.6) для простых функций / и продолжив его на
44 Глава 3. Суммирование по пуассоновским процессам более общие функции при помощи теории интегрирования. Получаемые результаты собраны в следующей теореме. Теорема Кэмпбелла. Пусть Π — пуассоновский процесс на пространстве состояний S с мерой интенсивности μ, и пусть /: S —* —> Ε — измеримая функция. Тогда ряд Σ=Σ/№ (3.15) хеи абсолютно сходится с вероятностью единица в том и только том случае, если $min(|/(x)|, 1)μ(άχ) < оо. (3.16) 5 Если это условие выполнено, то Ε(βΘΈ) = ехр / $(έ?*Λχ) - 1)μ(άχ)\ (3.17) для любого комплексного числа Θ, для которого интеграл в правой части сходится, в частности для любого чисто мнимого Θ. Кроме того, имеет место равенство Ε(Σ) = ^(χ)μ(άχ), (3.18) 5 которое следует понимать следующим образом: математическое ожидание существует тогда и только тогда, когда интеграл сходится, и в этом случае они равны. Если интеграл (3.18) сходится, то дисперсия (конечная или бесконечная) случайной величины Σ может быть вычислена по формуле Β(Σ) = $ ϊ{χ)2μ{άχ). (3.19) 5 Доказательство. Мы уже знаем, что равенство (3.17) выполняется для всех комплексных чисел Θ, если / — функция, принимающая конечное число значений и равная нулю вне множества конечной μ-меры. Назовем такие функции простыми. Любую положительную измеримую функцию / можно представить как предел возрастающей последовательности {/,·} простых функций. Таким образом, рассматривая вещественное отрицательное число θ = — и и полагая Σ, = J] fj(X), по теореме о монотонной сходимости получаем, что при и > 0 выполняется равенство Е(е""Е) = lim Ε(έΤ"Σ') = lim ехр{-^(1 - е~и^х))μ(άχ)\ = = βχρ{-$(1-β-"Λ*))μ(<ί*)}.
§3.2. Теорема Кэмпбелла 45 Если выполнено условие (3.16), то последний интеграл сходится и стремится к нулю при и —> 0, откуда следует, что Σ — конечная случайная величина. Но обе части равенства (3.17) — аналитические функции переменной θ в области Re# ^ 0, так что это равенство выполнено при Re(9^0. С другой стороны, если условие (3.16) не выполнено, то последний интеграл расходится при любом и > О, так что Е(е~ив) = О, откуда следует, что Σ = оо с вероятностью единица. Формулы (3.18) и (3.19) доказываются полностью аналогично. Таким образом, теорема доказана в случае / ^ 0. Чтобы завершить доказательство, применим теорему к положительным функциям /+ = max (/, 0), /" = max (-/, 0). Ряд (3.15) сходится абсолютно тогда и только тогда, когда сходятся ряды ς+ = ς ϊ+(χ) = Σ λ*) хеи хеи+ и Σ- = ΣΓ(Χ) = - Σ Λ*). хеи xeii- где П+ и П_ суть ограничения процесса Π на множества S+ = {/>0}, S_={/<0}. Отсюда следует, что (3.16) — необходимое и достаточное условие для сходимости. Если это условие выполнено и θ — чисто мнимое число, то Ε(βΘΈ) = Ε(βΘΈ+-ΘΊ:-) = Ε(βΘΈ+)Ε(β-ΘΈ-) = = ехр{5(^+ - 1)^}ехр{$(£Г*г - \)άμ} = = ехр{$(е*'+ +е'°г -2)άμ} =ехр{$(е*'- 1)άμ} (мы использовали тот факт, что П+ и П_ — независимые пуассоновские процессы, как ограничения процесса Π на непересекающиеся множества). Таким образом, равенство (3.17) выполнено по крайней мере для чисто мнимых 0; при помощи аналитического продолжения оно обобщается на все комплексные значения 0, для которых интеграл сходится. Равенства (3.18) и (3.19) доказываются аналогично. D Следствие 3.1. Если /ι, /2, · · ·» /л — функции, удовлетворяющие условию (3.16), так что ряд Σ/ = Σ W) <3·20)
46 Глава 3. Суммирование по пуассоновским процессам сходится с вероятностью единица, то Ε(βι71Ε1+ι72Ε2 + ...+«7βΣιι) = £χρ Г ^βι7ι/,(χ)+...+ι7ιι/ιι(χ) _ \)μ(άχ)\. (3.21) Если функции fj удовлетворяют условию \fj(xfp(dx) <oo, (3.22) 5 то cov(E,·, Σ*) = $ fj{x)fk{x)p{dx). (3.23) s Доказательство. Заменим / на t\f\ -f ... -f tnfn в равенствах (3.17) c0 = /, (3.18) и (3.19). D Полезно выразить условие сходимости (3.16) в терминах функции 7(a)=p{xeS:\f(x)\^al (3.24) Нетрудно проверить, что условие (3.16) равносильно тому, что функция 7(a) конечна при всех а > О и ι ^(a)da < оо. (3.25) о Наконец, стоит отметить, что интеграл (3.19) может быть конечным, даже если интеграл (3.18) не сходится. Действительно, легко построить примеры, в которых нарушается даже условие (3.16), так что ряд Σ абсолютно не сходится, но интеграл в правой части равенства (3.19) конечен. Это наводит на мысль, что можно придать сумме (3.15) некий обобщенный смысл и получить случайную величину с конечной дисперсией. Один из способов сделать это состоит в следующем. Предположим, что {j f2dp < оо и что S есть объединение возрастающей последовательности подмножеств Sny таких, что (например, из соображений симметрии) ξ !(χ)μ(άχ) = 0. (3.26) Положим Σ„= Ε WO: (3.27) xeunSn тогда Ση — конечная случайная величина с нулевым средним и конечной дисперсией. Легко показать, что Ε{(Σ,„ - Ση)2} -> 0 при т, η -* оо. Отсюда следует, что существует случайная величина Σ, являющаяся пределом Ση в смысле среднего квадратичного: Ε{(Σ„-Σ)2}-*0 при п -> оо. (3.28)
§3.3. Характеристический функционал 47 Эта случайная величина имеет нулевое среднее и конечную дисперсию, задаваемую формулой (3.19). Приложение этого рассуждения к физической задаче встретится нам в §5.3. §3.3. Характеристический функционал Рассмотрим теорему Кэмпбелла в случае / ^ 0 и положим θ = — 1; тогда равенство (3.17) примет вид Ε(*ΤΣ>) = ехр / - 5(1 - β-ηχ))μ(άχ)ν (3.29) где Σ/ = Σ Λ*)· (3.30) хеп Величина, стоящая в левой части равенства (3.29), рассматриваемая как функция произвольной функции /, — пример того, что называют характеристическим функционалом1) случайного процесса. Это название подразумевает, что равенство (3.29) в каком-то смысле характеризует пуассоновский процесс. Предположим, что Π — произвольное случайное счетное подмножество в S, и определим случайную величину Σ/ < оо для произвольной функции /: S —> [0, оо) формулой (3.30). Предположим, что для некоторой меры μ равенство (3.29) выполняется для некоторого класса Τ функций. Если класс Τ достаточно широк, а именно содержит все функции, принимающие лишь конечное число различных значений /ь /г» ·'·» /л» то из равенства (3.29) следует равенство Е(е-2') = ехр J - £(1 " е~и)Щ |. (3-31) где ηί = μ(Αι), Aj = {x:f{x) = fl} и Полагая Zj — e~h> получаем E(z?M,)zfM)... zNk{Ak)) = [Jem**-4 (3.32) !)Или преобразованием Лапласа. — Прим. ред.
48 Плава 3. Суммирование по пуассоновским процессам Поскольку это равенство выполняется при 0 < zf < 1, случайные величины N(Af) независимы и имеют распределения Пуассона V(m}) (с очевидными соглашениями при rrij = оо). Следовательно, Π — пуассонов- ский процесс с мерой интенсивности μ. Таким образом, для того чтобы доказать, что случайное счетное множество является пуассоновским процессом, достаточно установить равенство (3.29) для достаточно широкого класса функций. Замечательная характеризация однородного пуассоновского процесса в размерности один была доказана Реньи в работе [38]. Он показал, что если случайное подмножество вещественной прямой Ε обладает тем свойством, что для любого множества Л, являющегося конечным объединением интервалов, считающая функция Ν(Α) имеет распределение Пуассона со средним А|Л|, то это случайное множество есть пуассонов- ский процесс постоянной интенсивности λ. Этот результат удивителен, поскольку в нем не делается предположения о независимости считающих функций Ν(Α) для непересекающихся множеств Aj\ независимость возникает как следствие пуассоновости. С другой стороны, как показывает контрпример, принадлежащий Мора- ну (см. [33]), условие, что считающие функции имеют распределения Пуассона для объединений интервалов, существенно. Моран построил непуассоновский процесс, такой, что N(A) имеет распределение Р(А|Л|) для любого интервала А. Нетрудно видеть, что в рамках подхода, использующего метод характеристических функционалов, результат Реньи кажется весьма правдоподобным, хотя этот метод, по-видимому, и не дает полного доказательства. Действительно, чтобы показать, что случайное подмножество в Ε есть пуассоновский процесс постоянной интенсивности λ, достаточно доказать частный случай равенства (3.29), а именно, что Е(е~Е0 = expj- J (1 - e-f{x))\dx\ (3.33) для всех положительных ступенчатых функций /, т. е. для всех функций, имеющих лишь конечное число разрывов, постоянных в интервалах между соседними разрывами и равных нулю вне ограниченного множества. Предположение о том, что N(A) имеет распределение Пуассона Р(А|Л|) для всех конечных объединений интервалов, равносильно предположению о том, что равенство (3.33) выполнено для всех ступенчатых функций, принимающих лишь два значения. Поэтому смысл результата Реньи состоит в том, что равенство (3.33) можно распространить со ступенчатых функций, принимающих два различных значения, на произвольные ступенчатые функции.
§3.3. Характеристический функционал 49 На первый взгляд это утверждение кажется маловероятным, но оно становится более правдоподобным, если заметить, что с точки зрения теории интегрирования произвольные ступенчатые функции аппроксимируются ступенчатыми функциями, принимающими лишь два различных значения. Действительно, пусть / — положительная ступенчатая функция. Рассмотрим интервал (а, Ь), на котором функция / постоянна: f(x) = /, а < χ < Ь. Взяв произвольную константу Μ > /, разобьем интервал (а, Ь) на подынтервалы /ι, /2,..., /2л, где интервалы с нечетными номерами имеют длину (Ь — а)(М — f)/Mn, а интервалы с четными номерами имеют длину (b — a)f/Mn. Пусть gn —двузначная ступенчатая функция на (а, Ь)у равная 0 на нечетных интервалах и Μ на четных интервалах. Элементарная проверка показывает, что для любой непрерывной функции φ выполняется равенство lim \φ(χ)gn(x)dx = \ip(x)f(x)dx. a a Если Μ больше глобального максимума ступенчатой функции /, то функции gn, построенные на разных интервалах, можно склеить в одну и получить функцию gn, принимающую два различных значения и такую, что оо оо lim \ if{x)gn{x)dx = \ φ(χ)Ηχ)άχ (3.34) η—>оо J J — оо —оо для любой непрерывной функции φ. В этом слабом смысле функции, принимающие лишь два различных значения, образуют плотное подмножество в множестве всех ступенчатых функций. Накладывая на случайное множество подходящие условия, мы можем добиться, чтобы левая часть равенства (3.33) была непрерывна по / в смысле (3.34), но как получить доказательство в общем случае, неясно. В следующем параграфе теорема Реньи будет доказана совершенно другим способом и в гораздо более общей постановке, но читатель сможет уловить в приведенном там доказательстве слабое эхо описанного штроксимационного метода. Прежде чем закончить обсуждение формулы (3.29), стоит упомянуть одну ее переформулировку, которая иногда оказывается полезной. Если положить F(x) = e~^x\ то равенство (3.29) примет вид Е{П^)} =ехр{ -$[1 -Ρ(χ)]μ(άχ)\, (3.35)
50 Плава 3. Суммирование по пуассоновским процессам где произведение в левой части берется по всем точкам X случайного множества и понимается как обычное бесконечное произведение. Переход от / к F позволяет установить равенство (3.35) для функций F, удовлетворяющих условию 0 < F < 1. Однако, повторяя рассуждения предыдущего параграфа, можно доказать, что равенство (3.35) выполнено и без этого ограничения, если только интеграл в правой части абсолютно сходится. Иногда полезно использовать его в случае, когда функция F равна нулю или принимает отрицательные значения. §3.4. Теорема Реньи Исходный результат Реньи — это характеризация однородного пуас- соновского процесса в размерности один, но его можно обобщить несколькими способами. Во-первых, мера интенсивности не обязана быть кратной мере Лебега, а пространство состояний может иметь более сложную структуру, чем R. Мы не будем стремиться к максимальной общности и ограничимся доказательством результата для случайного подмножества в Erf, конечного на ограниченных множествах. Более интересное направление для обобщений предложено в работе Кендалла [24]. В ходе построения весьма общей теории случайных множеств он показал, что большое количество информации содержится в функции уклонения а(А) = F{N(A) = 0} = Р{ПП А = 0}. (3.36) Для пуассоновского процесса с мерой интенсивности μ она имеет вид а(А) = β-μ{Α). (3.37) Оказывается, не обязательно предполагать, что считающая функция Ν(Α) имеет распределение Пуассона, — достаточно, чтобы она имела правильные нуль-вероятности (3.37) для некоторой меры μ. Итак, мы имеем следующую общую версию теоремы Реньи. Она формулируется в терминах параллелепипедов в Rd\ под параллелепипедами мы понимаем подмножества вида (a, b] ={х = (x\,...,Xd): Щ < xt < &,·, / = 1,2, ...,d}, (3.38) где α, b e Rd и щ < bt при любом /. Теорема Реньи. Пусть μ — неатомическая мера на Rd, конечная на ограниченных множествах. Предположим, что Π — такое случайное счетное подмножество в Rdy что для любого конечного
§3.4. Теорема Реньи 51 объединения параллелепипедов А выполняется равенство Р{ПпЛ = 0} = β-μ{Α). (3.39) Тогда Π — пуассоновский процесс с мерой интенсивности μ. Прежде чем доказывать эту теорему, заметим, что применять ее можно двумя различными способами. Эта двойственность свидетельствует о тонких взаимоотношениях между распределением Пуассона и независимостью. В первом случае мы начинаем со случайного счетного подмножества П, такого, что для любого конечного объединения А параллелепипедов считающая функция Ν(Α) имеет распределение Пуассона с конечным средним. Никакого предположения о независимости не делается. Тогда, как показывают рассуждения, приведенные в §2.1, функция множества μ(Α)=Έ{Ν(α)} (3.40) есть неатомическая мера на Rrf, конечная на ограниченных множествах. Так как Л/(Л) имеет распределение V(p(A))f выполнено равенство (3.39), и из теоремы Реньи следует, что Π — пуассоновский процесс. Однако можно действовать и совершенно иным образом, вовсе не упоминая распределения Пуассона. Предположим, что Π — случайное счетное множество и что функция уклонения удовлетворяет условию а(А) > 0, если А ограничено. (3.41) Предположим также, что если А и В — непересекающиеся множества, являющиеся конечными объединениями параллелепипедов, то события {ППЛ = 0}, {Πηβ = 0} независимы. Тогда а(А U В) = Р{П Π А = Π П В = 0} = а(А)а(В), (3.42) так что функция множества μ(Α) = -Ιηα(Α) (3.43) конечно-аддитивна. Если нам удастся показать, что она счетно-аддитивна и не имеет атомов, то можно будет применить теорему и заключить, что Π — пуассоновский процесс. (Это усиление замечания о неизбежности пуассоновского процесса из § 1.4.) Легко показать, что конечно-аддитивная мера μ не имеет атомов, если 1\ϊτ\μ(Αη) — 0 для любой убывающей последовательности {Ап} параллелепипедов, длины сторон которых стремятся к нулю (так что их пересечение либо пусто, либо состоит из единственной точки). Поэтому
52 Плава 3. Суммирование по пуассоновским процессам единственное дополнительное условие, которое необходимо наложить, состоит в том, что для любой такой последовательности Нта(Ля)= 1. (3.44) Подобное условие необходимо, чтобы исключить множества П, имеющие неподвижные точки, т. е. такие точки х, что Р{*еП}>0. (3.45) Тривиальный пример: если Π — случайное множество, которое либо пусто (с вероятностью 1/2), либо равно {0} (с вероятностью 1/2), то функция fi, о^л, а(А) = 1 ι Ц, ОеЛ, удовлетворяет условиям (3.41) и (3.42), но не удовлетворяет условию (3.44), и случайное множество П, разумеется, не является пуассоновским процессом. Доказательство теоремы Реньи. Назовем k-кубом параллелепипед (а, Ь]у такой, что а/ = 1//2-*, bi = (ι// + 1)2"*, 1 ζ / ζ d, (3.46) где Vi — целые числа. Для любого k множество &-кубов образует разбиение пространства Rd. Для произвольного &-куба С обозначим через Е(С) = {Π Π С = 0} событие, состоящее в том, что С не содержит точек случайного множества П. Зафиксируем k и предположим, что С\, Сг,. ·., С η — различные и, следовательно, непересекающиеся k- кубы. Тогда Ρ J p| E(Cr) \ = Р{П ПСг = 0,г=1,2 /ι}= Ρ{π Π ((J Сг) =0\ = = а(иСг)=ехр{-м(иСг)} = П^ад· г=1 Следовательно, события £(С) для различных &-кубов С независимы, и ¥{Е(С)} = е~^сК (3.47) Мы используем этот факт, чтобы найти распределение случайной величины N(G) = #{П Π С} (3.48)
§3.4. Теорема Реньи 53 для произвольного открытого множества С. Каждая точка множества С лежит в некотором &-кубе, содержащемся в G, для достаточно большого к. Более того, любые две различные точки множества G лежат и различных А-кубах для достаточно большого к. Следовательно, N(G) = lim Nk(G), (3.49) k—юо где Nk{G)—число А-кубов С С G, для которых событие Е(С) не имеет места. Заметим, что функция Nk(G) возрастает по к. Поскольку события Е(С) независимы, производящая функция вероятностей для Nk(G) равна E(zN{G)) = JJ{P[£(C)] + (1 - ¥[E(C)])z} = Ц{е~^С) + (1 - e~^C))z}y N<1, где произведение берется по всем £-кубам С С G. В частности, при О < ζ < 1 из соотношения (3.49) и монотонной сходимости следует, что E(zN{G)) = lim JJ{z + (1 - z)e-»{C)}, (3.50) где мы полагаем z°° = 0. Если ζ принадлежит рассматриваемому промежутку и μ ^ 0, то ζ + (1 -ζ)ί?-μ >έ?_(1-ζ)μ. (3.51) Следовательно, Щг^)) £ lim ГТе-С-^Ю ;> е-(1-*)м(0)> (3.52) /г—>оо ХА поскольку &-кубы С С С не пересекаются. Устремляя ζ к единице, мы иидим, что случайная величина N(G) почти наверное конечна. Чтобы оценить предел в формуле (3.50), нужно использовать тот факт, что для &-кубов С, лежащих в ограниченной области, мера /г(С) равномерно стремится к нулю при к —> оо. Это есть более или менее известное следствие отсутствия атомов у меры μ, и проще всего доказать ого от противного. Достаточно показать, что оно выполнено для подмножеств фиксированного 0-куба Со. Если это не так, то существует такое Л* > 0, что для всех значений к существуют такие к-кубы С С Со, что //.(С) > δ. Назовем к-куб С плохим, если для любого / > k он содержит глкой /-куб С, что μ{0') > δ. По предположению 0-куб Со плохой. Отсюда следует, что среди 2d 1-кубов, содержащихся в Со, имеется хотя бы один плохой; назовем его С\. Продолжая рассуждать аналогичным образом, мы получим последовательность Со D С\ э C<i D ..., где С& — плохой k-куб. Плохой &-куб С содержит куб С, для которого /г(С) > δ,
54 Плава 3. Суммирование по пуассоновским процессам поэтому μ(0) > δ. Следовательно, μ(€^ > δ при любом к. Но Ck — k-куб со стороной 2~k, поэтому пересечение всех кубов Ck либо пусто, либо состоит из единственной точки, но при этом его мера не меньше δ. Мы получили противоречие. Итак, возвращаясь к множеству G, мы можем использовать тот факт, что μ(0) ^ δ для всех А-кубов, лежащих в G, с достаточно большим к. Если μ ^ δ и ζ фиксировано, то 6-(\-ζ)μ ^ z + (j _ ήΘ-μ ^ 6-(1-«)μ? где φ (δ) —> 1 при δ —> 0. Следовательно, 6-{\-ζ)μ{0) ^ Ε(Ζ*«Ϊ)) ^ г(1-г)#)м(С)? откуда при <$ —» 0 получаем Е(г^(С)) = в-(1-г)/2(С). (3.53) Это равенство выполняется для всех ζ в промежутке 0 ^ ζ < 1, так что N(G) имеет распределение Пуассона со средним μ(ΰ). Пусть теперь G\, C2,.,., Gm — непересекающиеся ограниченные открытые множества. Никакой к-куб не может содержаться более чем в одном G/, поэтому случайные величины Nk(Gx), Nk(G2), ...,Nk(Gm) независимы при фиксированном к. Устремляя к к бесконечности, мы видим, что случайные величины W(Gi), W(G2) W(Gm) независимы. Для завершения доказательства нужно распространить эти результаты с ограниченных открытых множеств на произвольные борелевские множества. Для начала заметим, что они верны для параллелепипедов (3.38), поскольку любой параллелепипед можно представить как пересечение последовательности открытых множеств. Поэтому равенство (3.29) выполняется для любой функции /, являющейся линейной комбинацией функций χΓ, каждая из которых равна единице на некотором параллелепипеде и нулю вне его. Любая положительная измеримая функция является пределом возрастающей последовательности таких линейных комбинаций и, следовательно, удовлетворяет равенству (3.29). Этого достаточно, чтобы доказать, что Π — пуассоновский процесс с мерой интенсивности μ.
Глава 4 Пуассоновские процессы на прямой §4.1. Приращения однородного процесса До сих пор мы старательно избегали рассмотрения наиболее важного примера, когда пространство состояний S есть вся вещественная прямая Ε или ее подынтервал. Этим мы хотели подчеркнуть, что большинство общих результатов никак не связаны со специальной структурой вещественной прямой и равно приложимы к пуассоновским процессам на плоскости, в трехмерном пространстве или в более общих пространствах S, как, например, те, которые встретятся нам в гл.7. Теперь пришло время связать эту общую теорию с конкретными свойствами вещественной прямой, в первую очередь с ее порядковой структурой. Мы подробно рассмотрим случай однородного процесса, поскольку, как было отмечено в §2.1, почти любой неоднородный процесс можно превратить в однородный простым преобразованием (ср. §4.5). Итак, пусть Π — пуассоновский процесс в Е, мера интенсивности которого есть мера Лебега, умноженная на λ; число точек процесса П, лежащих в борелевском множестве Л, имеет распределение Пуассона Р(А|Л|). В частности, математическое ожидание числа N(ay b) точек процесса Π в интервале (а, Ь) равно Х(Ь — а). Мы называем Π (однородным) пуассоновским процессом постоянной интенсивности λ. Таким образом, число точек процесса Π в любом ограниченном множестве конечно с вероятностью единица, и Π не имеет конечных предельных точек. С другой стороны, в множестве (0, оо) содержится бесконечно много точек процесса П, поэтому их можно упорядочить следующим образом: 0<*, <Х2 <Хз< .·· (4.1) Аналогичным образом можно упорядочить точки, лежащие в (—оо, 0): ...<*_з<*_2<*-1 <0. (4.2) Объединение этих двух последовательностей исчерпывает все точки случайного множества П, поскольку Р{0 е П} = 0. Важный, хотя и почти очевидный факт состоит в том, что Хп — случайные величины. Например, при η ^ 1 утверждение, что Хп < χ (для
56 Глава 4. Пуассоновские процессы на прямой произвольного χ > 0), равносильно тому, что N(0, χ] ^ п. В обозначениях § 1.3 мы имеем {ω: Χη{ω) ζ χ} = {ω: N(0y χ] ^ η} e Τ, (4.3) откуда следует, что Χη —случайная величина. Аналогичное рассуждение показывает, что Х-п также случайная величина. Поскольку П={...Д_2Д_ь^Д2,...}, (4.4) из свойств случайной последовательности {Хп}п^о можно вывести свойства случайного множества П. Так как точки множеств Π Π (—оо, 0) и Π Π (0, оо) образуют независимые пуассоновские процессы на (—оо, 0) и (0, оо) соответственно, последовательности {Хп}п^-\ и {Хп}п^\ независимы. Применяя теорему об отображении с функцией f(x) = —χ, мы видим, что совместные распределения последовательности {—Д-я}/1=1,2,... совпадают с совместными распределениями последовательности №ι}η=1,2,...· Таким образом, чтобы получить случайное множество (4.4), нужно взять две независимые копии случайной последовательности (4.1) и обратить одну из них так, чтобы она лежала в (—оо, 0). Поэтому достаточно рассматривать только последовательность (4.1), что обычно и делают. Кроме того, разумеется, во многих приложениях, особенно в тех, где Ε играет роль оси времени, случайные величины в принципе могут принимать лишь положительные значения. Но надо отметить, что столь явная вы- деленность начала координат снижает значимость одного из важнейших свойств однородного процесса — его инвариантности относительно параллельных переносов. Структура случайной последовательности (4.1) очень хорошо известна и чрезвычайно проста. Следующее утверждение могло бы претендовать на роль фундаментальной теоремы теории пуассоновских процессов, если бы оно имело естественный аналог в случае пространства состояний S более высокой размерности. Теорема о приращениях. Пусть Π — пуассоновский процесс постоянной интенсивности X на (0, оо). Запишем точки процесса Π в возрастающем порядке, как в формуле (4.1). Тогда случайные величины Υι=Χι, Υη=Χη-Χη-\, η>2, (4.5)
§4.1. Приращения однородного процесса 57 независимы, причем каждая из них имеет плотность распределения g(y) = \е~хУ, у>0. (4.6) Доказательство. Возможный, но трудный и неблагодарный путь состоит в использовании формулы (4.3) для вычисления совместного распределения случайных величин Х\, Χ<χ, ..., Хп при каждом п. Более удачное доказательство использует один из вариантов «сильного марковского свойства», которое заключается в том, что если перенести начало координат в случайную точку Х\, то точки процесса П, лежащие справа от Х\у будут образовывать пуассоновский процесс, не зависящий от Х\. Точнее, рассмотрим случайное подмножество в (0, сю), задаваемое формулой П' = {*2-*1,*3-*1,*4-*1, .·.}. (4.7) Мы хотим доказать, что Х\ и П7 независимы и что П' — пуассоновский процесс постоянной интенсивности λ. Для этого, как в §3.3, мы используем характеристический функционал. Пусть / — непрерывная функция на (0, сю), равная нулю вне ограниченного множества и удовлетворяющая условию /(0) = 0. Рассмотрим ряд оо Σ' = £/(*„-*,). (4.8) /2=2 Если мы докажем, что при любом выборе функции /, удовлетворяющей указанным условиям, случайные величины Х\ и Σ' независимы и Σ' имеет то же распределение, что оо ς = Σ та> <4·9) /2=1 то из этого будет следовать, что случайное множество П7 не зависит от Х\ и имеет ту же стохастическую структуру, что и П. Обозначим через ξ/г наименьшее целое кратное числа 2~k, большее Х\. Тогда ^ — случайная величина, убывающая к Х\ при k —> сю, так что оо Σ' = lim Σ*, Σ* = Υ] f(Xa - ξ*), (4.10) *^°° 7=ί где мы полагаем f(x) = 0 при χ < 0. Для произвольных г, χ выполняется равенство оо Ρ{Σ* < ζ, Χι < χ} = ^Ρ{Σ* ^ ζ, Χι < χ, & = / · 2-*}. (4.11) ι=ι
58 Глава 4. Пуассоновские процессы на прямой При ξ^ = / · 2~к точки ХПу лежащие в интервале (/ · 2~ky оо), образуют пуассоновский процесс на этом интервале, который не зависит от Х\ < I - 2~к. Следовательно, случайная величина оо Σ* = £/(*„-/-2-*) /2=2 имеет то же распределение, что и Σ, и Ρ{Σ* ^ г, Х{ ζ ху ik = / · 2~к) = Ρ{Σ < ζ)ψ{Χχ < jc, & = / · 2"*}. Подставляя это равенство в формулу (4.11), получаем Ρ{Σ* < г, Хх < χ} = Ρ{Σ < г}Р№ < *} = Ρ{Σ < z}P{W(0, χ] ^ 1} = = Ρ{Σ<ζ}(1 -β~λ0. Устремляя k к бесконечности, получаем * Ρ{Σ'<ζ, Хх ^х} = Ρ{Σ<ζ}$λέΤλ^, о откуда следует, что Σ' не зависит от Х\ и имеет то же распределение, что и Σ, и что случайная величина ΛΊ (= Y\) имеет плотность распределения (4.6). Повторяя это рассуждение, по индукции получаем, что при любом т случайные величины Υ\, Υ2, · · ·, Ym и Пт, где Π = \Хт+1 -~ лт, Хт+2 — Хщу · · ·}, независимы и что Yr имеет плотность распределения (4.6). Теорема доказана. D В доказательстве теоремы мы существенно использовали порядковую структуру вещественной прямой Е. Например, для двустороннего пуас- соновского процесса (4.4) точки Хп-Хи пф\, уже не образуют пуассоновский процесс. Действительно, в противном случае случайная величина L = Х{ — Х-\ имела бы плотность распределения (4.6), а на самом деле L, т.е. длина интервала, содержащего начало координат, имеет ту же плотность, что Л^, а именно В2(У) = $вШ(у - u)du = \2уе~хУ. (4.12) о Это пример парадокса времени ожидания. Для любой точки χ расстояние от χ до ближайшей к ней справа точки процесса Π и расстояние
§4.2. Закон больших чисел 59 от χ до ближайшей к ней слева точки процесса Π независимы и имеют плотность (4.6). Но их сумма, т.е. длина Lx интервала, содержащего точку ху имеет другую плотность (4.12). Дело в том, что нельзя сказать, что этот интервал выбирается из интервалов процесса Π «случайным образом». Вероятность выбрать длинные интервалы больше, чем вероятность выбрать короткие интервалы, и это смещение вероятностей в точности выражается формулой 82{У)=№(У). (4.13) Равенство (4.13) — частный пример очень общего результата теории точечных процессов; см., например, [11, §5.4]. §4.2. Закон больших чисел По теореме о приращениях п-я точка Хп однородного пуассоновского процесса на (0, оо) представима в виде суммы Χη = Υι + Υ2 + -. + Υη (4.14) независимых случайных величин, каждая из которых имеет показательное распределение (4.6). Таким образом, применима классическая теория сумм независимых случайных величин, которая позволяет получить как точную, так и асимптотическую информацию относительно Хп. Нетрудно вычислить распределение случайной величины Хп. При χ > О, используя равенство (1,12), получаем ОО χ Ψ{Χη ζ x} = F{N(0,x] > η} = ^πΓ(λ*) = $λπΛ_,(λ«)Λ/. г=п 0 Следовательно, Хп имеет плотность распределения χπ η-\ —Χχ gn (χ) = λπ„_ ι (λχ) = {η_ (4.15) (это также легко доказать индукцией по ή). Отсюда немедленно следует, что Е(Хп) = п\~\ ЩХп) = ηλ~2. (4.16) По усиленному закону больших чисел с вероятностью единица выполняется равенство я—>οο П Λ Поскольку /V(0, t] -+ оо при / —► оо,
60 Глава 4. Пуассоновские процессы на прямой мы получаем, что t^oN(0yt] " λ* Так как отсюда следует, что с вероятностью единица выполняется равенство Г / =! t^oN(0J] λ* Таким образом, мы получаем усиленный закон больших чисел для однородного пуассоновского процесса в следующей форме: с вероятностью единица выполняется соотношение hm —-—- = λ. /—оо t Этот простой результат имеет огромное значение не только для однородных, но, как мы увидим в §4.5, и для неоднородных пуассоновских процессов. Поэтому стоит привести его прямое доказательство, не использующее теорему о приращениях. Закон больших чисел. Пусть Π — пуассоновский процесс постоянной интенсивности λ на (0, оо). Число N(0, t] точек процесса Π в интервале (0, t] с вероятностью единица удовлетворяет соотношению ПтМ=А. (4.18) /—►ОО t Доказательство. Случайная величина jV(0, /] имеет распределение V(Xt)y поэтому E{yV(0, /]} = λ/, D{yV(0, /]} = Xt. (4.19) По неравенству Чебышёва при любом ε > 0 мы имеем λ р{ ~ Л Полагая 4 = k2, из неравенства (4.20) получаем |>V(0, fe2] >ε[<37· (4·2°) Λ=1 -λ ^ ε > < οο. По лемме Бореля—Кантелли отсюда следует, что с вероятностью единица неравенство УУ(0, k2] >ε
§4.2. Закон больших чисел 61 выполнено не более чем для конечного числа целых значений k. Поскольку число ε > О произвольно, с вероятностью единица выполнено соотношение hm v:2 J =A. (4.21) k—>·οο ffz Чтобы перейти от соотношения (4.21) к (4.18), возьмем &, равное целой части числа /1//2. Тогда при t > 1 имеем N{0yk2] ^N(0J] <W(0, (k+\f] Поскольку k2 ^t <(*+ 1) (*+i)2 4l *2 доказательство завершено. D Одно из преимуществ этого метода доказательства заключается в том, что оно немедленно распространяется на пуассоновские процессы в более общих пространствах, где нет теоремы о приращениях. Пусть, например, Π—пуассоновский процесс постоянной интенсивности λ в Жа. Обозначим через Ak сферу радиуса k с центром в начале координат. Математическое ожидание и дисперсия случайной величины N(Ak) равны jkdy где 7 = Ηι| — константа, зависящая только от d. При d ^ 2 из леммы Бореля—Кантелли следует, что с вероятностью единица выполняется равенство Hm Щт4- = А. (4.22) *-оо \Ak\ V ' Для произвольного ограниченного множества В обозначим через k(B) наибольшее целое число, для которого Л* С S, и пусть К(В) — наименьшее целое число, для которого В С. Ak- Тогда N{Am) < N(B) < N(Am), \Ak(B)\<\B\^\Am\, откуда следует, что с вероятностью единица выполняется равенство Hm β = λ (4.23) при условии, что А(Я)-оо, щ-1· (4.24)
62 Глава 4. Пуассоновские процессы на прямой Точнее, с вероятностью единица для любого ε > О существуют такие числа Ν, δ, что для любого множества β, удовлетворяющего условиям k(B)>N9 g<l+i, (4.25) выполнено неравенство \N(B) \В\ - А < ε. (4.26) §4.3. Системы массового обслуживания Мы уже отмечали, что во многих приложениях теории одномерных пуассоновских процессов точки процесса Π представляют случайные моменты времени, например моменты, когда радиоактивное вещество испускает частицу, регистрируемую счетчиком Гейгера. Другой пример такого рода — моменты обращений к какой-либо сервисной службе. Отправной точкой для создания теории массового обслуживания, важнейшего инструмента теории исследования операций, было наблюдение инженеров телефонной связи (прежде всего, А. К. Эрланга из Копенгагена), что моменты времени, когда на телефонный узел поступают вызовы, хорошо описываются пуассоновским процессом постоянной или медленно меняющейся интенсивности. Мы не ставим перед собой цель описать теорию массового обслуживания во всей ее полноте. Заинтересованный читатель может обратиться к элементарному учебнику [12] или блестящему современному изложению [2]. Мы же хотим лишь проиллюстрировать, как общая теория пуассоновских процессов применяется в анализе простых моделей массового обслуживания. Для начала рассмотрим, систему массового обслуживания, традиционно обозначаемую Λί/Λί/l. Это система с одним обслуживающим устройством, вызовы в которую поступают в соответствии с пуассоновским процессом Па постоянной интенсивности а. Они становятся в очередь и обслуживаются в порядке поступления, причем времена обслуживания различных вызовов независимы и имеют плотность распределения ββ'β\ *>0. (4.27) Выбор этого конкретного распределения очень упрощает вычисления, поскольку позволяет представить времена обслуживания в виде второго, независимого пуассоновского процесса. А именно, пусть Tip — пуас- соновский процесс постоянной интенсивности /?, не зависящий от Па,
§4.3. Системы массового обслуживания 63 и пусть обслуживающее устройство действует следующим образом: оно обслуживает вызов, стоящий в очереди первым, до наступления очередного момента процесса П/?; в этот момент обслуживание текущего вызова прекращается и устройство переходит к обслуживанию следующего по очереди вызова (если таковой имеется). Из теоремы о приращениях немедленно следует, что результирующие времена обслуживания действительно независимы и имеют плотность распределения (4.27). Точки процесса ΤΙβ называются потенциальными моментами обслуживания. Каждый момент времени, в который завершается обслуживание очередного вызова, является точкой процесса Ц#, но не наоборот; если точка процесса Щ попадает в интервал времени, когда очередь пуста, эта точка не будет реальным моментом обслуживания. Традиционный метод анализа системы М/М/1 состоит в следующем: процесс, описывающий длину очереди, представляют в виде марковского процесса с непрерывным временем, после чего выписывают и решают прямые дифференциальные уравнения Колмогорова. Итак, обозначим через pn(t) вероятность того, что'в момент времени t очередь состоит из η вызовов. Переходя от pn(t) к pn(t+h) при малом А > 0, мы должны учесть, что вероятность поступления1 нового вызова в интервале времени (t,t+h) равна аА + о(А), а вероятность окончания обслуживания вызова в этом интервале (при η ^ 1) равна fth -f o(h). Таким образом, pn(t + А) = Рп(Щ\ - αΛ - /?А +o(h)) + + pn-x(t)(ah + o(A)) + pn+i (t)(Ph + o(h)) + o(A), откуда при А —► 0 мы получаем дифференциальное уравнение ^ = -(α + β)ρη(ή + apn-{(t) + βρη+ι(О, η > 1. (4.28) При η = О то же рассуждение приводит к уравнению ^ = -apo(t) + PPl(t). (4.29) Проще всего решить эту систему дифференциальных уравнений, применяя преобразование Лапласа. Для определенности предположим, что в момент времени t = 0 очередь пуста, так что Ря(0)=5л0. (4.30) Положим оо r«W = $ pn(t)e-x'dt; (4.31) о из формул (4.28) и (4.30) следует, что при η ^ 1 выполняется равенство Аг„(А) = -(a + /3)r„(A) + ar„_,(A) + /3r„+1(A).
64 Глава 4. Пуассоновские процессы на прямой Таким образом, при фиксированном λ значение гп есть линейная комбинация ξη и т/\ где ξ и η — корни квадратного уравнения βχ2 - (а + β + λ)* + а = 0. (4.32) Легко убедиться, что в точности один из корней (скажем, ξ) лежит в круге |*| < 1, и, поскольку последовательность {гп} ограничена, гп должно быть кратно ξη. Так как оо оо оо оо /ϊ=0 0 rt=0 0 мы получаем, что Γι,(λ) = λ-1(1-Οξ", (4-33) где £ = £(λ) = ^{α + /? + λ-[<α + /? + λ)2-4α/?]^}. (4.34) В частности, преобразование Лапласа функции po(t) равно 'ο(λ) = ^{β - α - λ + [(а + /? + λ)2 - 4α/?]1/2}, (4.35) откуда с помощью стандартных (но сложных и малоинформативных) вычислений можно получить выражение для po(t) через функции Бесселя. Однако значительно больший интерес представляет следующая формула для po(t) в терминах пуассоновских вероятностей: р°м= Σ 5;^|'^Η)π5(/?ο· (4.36) Проверить это равенство можно, вычисляя преобразование Лапласа г(Х) правой части формулы (4.36) и сравнивая его с выражением (4.35) для го (λ). Таким образом, -г+1 (л 4- (s-r+l)(r + s)! αΓβ8 r\ (5 + 1)! (α + 0 + λ)'+*+|· = Σ Положим α _ /3 α + β + У ϋ~α + β + λ'
§4.3. Системы массового обслуживания 65 Тогда χ /лч /ι ч V^ (S - Г + 1)(Г+ S)! г s Xr(X) = (l-u-v) ^ rUs + W Вычисляя и упрощая коэффициент при urus в правой части, можно убедиться, что он не равен нулю, только если г = 5 = 0 (в этом случае он равен 1) или 5 = г — 1; в последнем случае он равен (2г - 2)! (г- 1)!гГ Таким Аг(А) : образом, = 1 - ОО Σ (2г -2)! 1)!г! wV"1 = 1-JL{1 -(1 -4uv){/2} = = 1 - ξ = Аго(А), откуда следует равенство (4.36). Равенство (4.36) напрашивается на интерпретацию в терминах бер- нуллиевского процесса поступления вызовов. Так как оно выполняется при всех а, коэффициент при πΓ(αί) есть вероятность того, что в момент времени / очередь пуста, в ситуации, когда вызовы образуют не пуас- соновский процесс, а процесс Бернулли (см. §2.4), а именно, ровно г вызовов поступают в систему независимо друг от друга в соответствии с равномерным распределением на интервале (0, /): оо />o^o = E£riJr7rs(/?i)· (4·37) s—r Повторяя это рассуждение, получаем, что коэффициент при π5(βί) есть вероятность того, что в момент времени / очередь пуста, в ситуации, когда 5 потенциальных моментов обслуживания образуют процесс Бернулли на интервале (0, t): p0(r, s; t) = s ~r+-\ l, r<s. (4.38) Теперь речь идет о чисто комбинаторном результате. Если г моментов поступления вызовов и 5 потенциальных моментов обслуживания независимы и равномерно распределены на интервале (длина которого теперь не имеет значения), то вероятность того, что в конце интервала необслуженных вызовов нет, задается формулой (4.38). Это пример теоремы о баллотировке. Изучению связи подобных результатов с теорией массового обслуживания посвящено много работ; см., в частности, книгу
66 Глава 4. Пуассоновские процессы на прямой Такача [40]. Наше рассуждение можно обратить; если найти прямое комбинаторное доказательство формулы (4.38) (а Такач показывает, как это можно сделать), то равенство (4.36) можно доказать без использования дифференциальных уравнений и преобразования Лапласа. §4.4. Теорема Бартлетта Система М/М/1 — это лишь простейшая из множества подобных систем, некоторые из которых чрезвычайно сложны, и рассуждения, приводящие к уравнению (4.28), можно значительно обобщить. Например, система M/M/k отличается от рассмотренной выше только наличием k обслуживающих устройств. Вызов может быть обслужен любым из них; освободившись, устройство переходит к обслуживанию первого из еще не обслуженных вызовов. Легко видеть, что в этом случае уравнения (4.28) и (4.29) следует заменить на уравнения -22L = _(α + pk)pn + αρη-ι + βΙιρη+\, η ^ *, f· (4.39) -2± = -(α + βή)ρη+αρη-χ +β{η+ 1)ρ„+ι, η < k. Общее решение этих уравнений имеет довольно сложный вид, но во многих случаях можно считать, что система находится в статистическом равновесии, так что вероятность рп — pn{t) не зависит от t, В этом случае уравнения (4.39) принимают вид (a + PnAk)pn = apn-i + β(η + l)Akpn+u где через η Λ k обозначено меньшее из чисел η и k. Таким образом, арп - β(η + 1) Λ kpn+{ = арп-{ - βη Λ kpn, откуда следует, что apn-i - βηΜιρη — константа, которая обязана быть равной нулю, поскольку рп —► 0 при η —> ос. Следовательно, Ρη/Ρη-\ =α/(/ιΛ*)/?, откуда получаем, что Рп = Ро(ъ) ТГг п^к>
§4.4. Теорема Бартлетта 67 где ро определяется из уравнения ОО ( k ОО я ι 1 '-Σ»-*Σ(|)ά+Σ ЙдЫ· <«.) Это рассуждение работает, если ряд в уравнении (4.41) сходится, т.е. при а < pk. В противном случае система уравнений (4.39) не имеет стационарного решения и рассматриваемая модель неустойчива; можно показать, что в этом случае при любых начальных условиях решение системы (4.39) удовлетворяет соотношению pn(t) -* 0 При /-+00 при любом п. (Интересное упражнение: вывести этот факт для k = 1 непосредственно из формулы (4.37),) Теперь предположим, что k = оо, так что имеется бесконечно много обслуживающих устройств. Из равенств (4.40) следует, что <а\п 1 Га\п 1 и из формулы (4.41) мы получаем, что ро = £~а///3. Таким образом, в состоянии равновесия число обслуживаемых вызовов имеет распределение Пуассона Ρ(α/β). В действительности верно даже более сильное утверждение. Уравнения (4.39) при k = оо принимают вид ^ = -(α + βη)ρη + αρα-{ +/?(я+ 1)ря+ь (4.42) и эта система уравнений имеет целое семейство решений вида V{p(t)). Подставляя pn(t) = πη(μ(ή) в (4.42), получаем равенство ^fai-i - π„) = -ажп - βμπη-\ + απη-\ + βμπ,,, которое выполнено при любом п, если t-a-ft*. (4.43) Общее решение этого уравнения имеет вид μ(ί) = 2+ (μ(0)-£)<>-*. (4.44) Таким образом, если число вызовов в очереди в момент времени t — О имеет распределение Пуассона, то оно имеет распределение Пуассона в любой момент времени / > 0, причем его среднее задается формулой (4.44).
68 Глава 4. Пуассоновские процессы на прямой Это поразительный результат, который требует вероятностного объяснения. Такое объяснение было дано Бартлеттом в работе [3]; оно показывает, что устойчивость распределения Пуассона связана со следующими свойствами системы М/М/оо\ моменты поступления вызовов образуют пуассоновский процесс, и вызовы не взаимодействуют друг с другом внутри системы (например, соперничая за ограниченное число обслуживающих устройств). Мы сформулируем результат Бартлетта в терминах «вызовов», поступающих в «систему», но эти слова — не более чем ярлыки. Роль вызовов могут играть машины, выходящие из строя и образующие «очередь» на ремонт, или радиоактивные частицы, попадающие в счетчик, или семена, падающие с дерева и проходящие последовательные биологические фазы. Теорема Бартлетта. Предположим, что вызовы поступают в систему в соответствии с пуассоновским процессом с плотностью интенсивности a(t), а затем случайным образом перемещаются внутри системы так, что их траектории независимы друг от друга. Пусть вероятность того, что вызов, поступивший в момент времени s, в более поздний момент времени t будет находиться в некотором фиксированном подмножестве Ε системы, равна p(s, t). Тогда число вызовов, находящихся в множестве Ε в момент времени t, имеет распределение Пуассона со средним t μ(ί)= $ a{s)p(s,t)ds. (4.45) — oo Нетрудно доказать этот результат непосредственно, но он почти тривиально следует из теоремы, которая будет доказана в следующей главе. Поэтому мы отложим его доказательство до §5.2, а сейчас отметим лишь связь между формулами (4.44) и (4.45). Для простоты предположим, что вызовы начинают поступать в момент времени 0, так что a{t) = О, t < 0, a(t) = a, t > 0. (4.46) Ясно, что p(s,t)=q(t-s), (4.47) где q(t) есть вероятность того, что время, проведенное вызовом в очереди, больше t. Тогда равенство (4.45) принимает вид t t μ(ή — § aq(t - s)ds = α § q(u) du. (4.48) о о
§4.5. Неоднородные процессы 69 Поскольку оо t равенство (4.48) принимает вид μ(0 = ]|(1-β""'). (4.49) совпадающий с (4.45) при μ(0) = 0. Более общим образом, система М/М/оо, в которой время обслуживания имеет произвольное распределение с функцией распределения B(s)y удовлетворяет равенству (4.48) с q(t) — 1 - B(t), так что t μ(*)=α${1 -B(u)}du. (4.50) о §4.5. Неоднородные процессы В одномерном случае мы сосредоточили внимание на однородных процессах. Оправданием этому служит тот факт, что неоднородный процесс можно превратить в однородный при помощи монотонного преобразования. Точнее, рассмотрим пуассоновский процесс Π на вещественной прямой R, мера интенсивности μ которого конечна на ограниченных интервалах. Тогда функция M(t), задаваемая формулой (2.11), является непрерывной и монотонно возрастающей и μ(α,6] =М{Ь)-М{а) (4.51) при а <Ь. Функция Μ однозначно определяет меру μ. В §2.3 мы показали, что случайное множество П! = Af (П) - {М(Х): X в П} (4.52) есть пуассоновский процесс единичной интенсивности на (конечном или бесконечном) интервале (Λί(-οο),Λί(οο)), (4.53) где Л*(±оо) = lim M(t). t—*±oo К процессу Πι применимы все теоремы этой главы. Таким образом, обращая функцию Λί, мы можем получить свойства процесса П. Неоднозначность при обращении может возникнуть, только если функция Μ имеет
70 Глава 4. Пуассоновские процессы на прямой плоские участки, на которых М~[(у) есть интервал, а не точка; но это может случиться для не более чем счетного числа точек #, и вероятность того, что П} содержит такую точку, равна нулю, К сожалению, некоторые из наиболее полезных свойств однородного процесса при этом нелинейном преобразовании не сохраняются, В частности, хотя приращения процесса Πι независимы, для Π это уже не так. Поэтому обычно имеет смысл сначала свести процесс к однородному, а потом уже проводить какой-либо серьезный анализ. Рассмотрим конкретный пример. Пусть ΙΤ.2 — пуассоновский процесс постоянной интенсивности λ на плоскости, и пусть Π — множество расстояний от точек процесса U2 до начала координат. В § 2.3 было показано, что Π — пуассоновский процесс с плотностью интенсивности Х(х) = 2πλχ на (0, ос), так что М(х) = 7гАл;2, χ > 0. Отсюда следует, что удобнее рассматривать не сами расстояния, а квадраты расстояний, которые образуют пуассоновский процесс постоянной интенсивности πλ. Нетрудно переформулировать усиленный закон больших чисел для случая неоднородных процессов. Предположим, что Λί(οο) = оо, так что точки М(Х\ X е П, X > 0, образуют пуассоновский процесс единичной интенсивности на (0, оо). Перенумеруем точки по возрастанию: 0 < Κι < Υ<χ < ... . Из соотношения (4.17) следует, что с вероятностью единица выполняется равенство Km — = 1. (4.54) п—юо Ιί Число jV(0, /] точек процесса П в интервале (0, /] равно числу точек Уп в интервале (0, M(t)]t откуда в силу равенства (4.54) следует, что lim ^М = 1. (4.55) /-к» Λί(0 ν ; Таким образом, точки процесса Π на интервале (0, оо) образуют бесконечную последовательность, не имеющую конечных предельных точек, асимптотическое поведение которой с вероятностью единица описывается формулой (4.55). Аналогичный результат верен для интервала (—оо, 0), если Λί(—оо) = = —оо. Если же значение М(—оо) конечно, то слева от начала координат находится лишь конечное число точек процесса П. Не все представляющие интерес процессы обладают тем свойством, что мера μ конечна на ограниченных интервалах. Например, в гл. 8 и 9
§ 4.5. Неоднородные процессы 71 нам встретится пуассоновский процесс с плотностью интенсивности Х(х), для которой оо оо § \(x)dx = оо, § \{x)dx < оо, / > 0. (4.56) о / В этом случае вместо функции Μ естественно рассматривать функцию L, задаваемую формулой оо L(0= ^4x)dx. (4.57) Функция L непрерывна и убывает на (0, оо), причем L(G) = оо, Цоо) = 0. (4.58) Те же рассуждения, что в §2.3, показывают, что функция L переводит Π в пуассоновский процесс Πι единичной интенсивности на (0, оо). Процесс Πι содержит бесконечно много точек и не имеет конечных предельных точек. Применяя обратное преобразование, мы получаем, что процесс Π содержит бесконечно много точек в окрестности начала координат и лишь конечное число точек справа от любого / > 0. В этом случае закон больших чисел позволяет получить информацию о накапливании точек процесса Π вблизи начала координат. Число N(t уоо) точек процесса Π справа от / равно числу точек процесса Πι = ЦП) слева от L(t). Следовательно, с вероятностью единица выполняется равенство лаЛйг* - ■· <"9> Этот малопонятный на первый взгляд результат имеет приложения в самых различных областях — от популяционной генетики до проектирования водохранилищ.
Глава 5 Маркированные пуассоновские процессы §5.1. Раскраски В §1.2 было отмечено характеристическое свойство распределения Пуассона, связанное с биномиальным распределением. Если случайная величина N имеет распределение ν{μ), а условное распределение случайной величины Μ при фиксированном N -имеет вид B(Ny ρ), то Μ и N—Μ — независимые пуассоновские величины со средними ρ μ и (1 — ρ)μ соответственно. Этот факт имеет прямое и неожиданное следствие для пуассоновских процессов. Пусть Π — пуассоновский процесс с мерой интенсивности μ на произвольном пространстве состояний S. Раскрасим точки процесса Π случайным образом в красный или зеленый цвет так, что цвета различных точек независимы и вероятности покрасить точку в красный и зеленый цвет равны ρ и q — 1 — ρ соответственно. Для произвольного подмножества ACS обозначим через N(A), NK(A) и N3(A) соответственно общее число точек из П, попавших в множество Л, число красных точек, попавших в Л,чи число зеленых точек, попавших в А. Тогда случайная величина N(A) имеет распределение Ρ(μ(Α)), а условное распределение величины ΝΚ(Α) при фиксированном Ν(Α) есть Β(Ν(Α), ρ). Следовательно, случайные величины ΝΚ(Α) и Ν(Α) — ΝΚ(Α) = Ν3(Α) независимы и имеют распределения Ρ(ρμ(Α)) и ν(ημ(Α)) соответственно. Более того, если А\, Α<χ,..., Ап — непересекающиеся множества в S, то тройки случайных величин (NiAfrNtiAjlNMj)), / = 1,2 я, независимы. Следовательно, 2п случайных величин NK(A;)y N3(Aj), / = 1,2,..., я, независимы. Отсюда следует, что множество красных точек и множество зеленых точек образуют независимые пуассоновские процессы с мерами интенсивности ρμ и ημ соответственно. Индукцией по к этот результат обобщается на раскраски в произвольное число k цветов, и мы получаем следующую теорему.
§5.1. Раскраски 73 Теорема о раскраске. Пусть Π — пуассоновский процесс на пространстве S с мерой интенсивности μ. Раскрасим точки процесса Π случайным образом в k цветов так, что вероятность покрасить точку в i-й цвет равна pi и цвета различных точек независимы {друг от друга и от положения точек). Пусть П;—множество точек i-го цвета. Тогда П,- — независимые пуассоновские процессы с мерами интенсивности Pi = pi μ. (5.1) Заметим, что этот результат согласуется с теоремой о суперпозиции, поскольку Π — суперпозиция независимых процессов П; и k k μ = ]Гр;/г = ]Г/^. i = l /=1 Когда дело доходит до применения этой теоремы, быстро становится ясно, что ее условия слишком ограничительны. Попытки обобщить ее приводят к теории маркированных пуассоновских процессов, которой посвящена данная глава. Чтобы понять, какого рода обобщение следует искать, рассмотрим простой пример. Представим себе длинный участок дороги, по которому движутся автомобили. Если представить дорогу вещественной прямой R, а автомобили — точками, то моментальный снимок дороги в момент времени / будет являть собой подмножество в К. (из соображений безопасности оно не должно иметь конечных предельных точек). Вполне разумно в качестве модели этой ситуации использовать пуассоновский процесс. Распределение автомобилей будет меняться со временем, поскольку они движутся с разными скоростями. Можно задаться следующим вопросом: предположим, что в момент времени t = 0 автомобили образуют пуассоновский процесс; будет ли это верно в более поздний момент времени t? На этот вопрос легко ответить, если скорости автомобилей суть случайные величины, не зависящие друг от друга и от положения автомобилей на дороге, если они не меняются со временем (в частности нет ограничений на обгоны) и принимают лишь конечное число значений. Если возможные скорости суть и\у ζ/2, · · ·, Vk и П/ обозначает множество автомобилей, имеющих скорость v-t в момент времени t — О, то из теоремы о раскраске следует, что П/ — независимые пуассоновские процессы. В более поздний момент времени положения этих автомобилей образуют пуассоновский процесс П/ -f vit, полученный параллельным переносом
74 Глава 5. Маркированные пуассоновские процессы процесса П/ на υ it (по теореме об отображении). Таким образом, положения автомобилей в момент времени / описываются суперпозицией k П(0 = и(И + »Д (5.2) ί = 1 которая, согласно теореме о суперпозиции, снова является пуассонов- ским процессом. Нетрудно вычислить меру интенсивности процесса П(/). Для простоты предположим, что Π имеет плотность интенсивности \(х). Обозначим через pi вероятность того, что автомобиль имеет скорость v-t. Тогда процесс П/ имеет плотность интенсивности ρ/λ(χ), а процесс П, -f υ it имеет плотность интенсивности Pi\(x — v-J). Отсюда следует, что П(/) имеет плотность интенсивности k Ai(x) = X)piA(jc-t/l-/). (5.3) ί = 1 В частности, если Х(х) = X— константа, то из равенства (5.3) следует, что Xt(x) = λ для всех / > 0; (5.4) если в момент времени t — 0 автомобили образуют однородный пуассо- новский процесс, то это свойство сохраняется и в дальнейшем. Этот подкупающе простой результат был, однако, доказан при очень ограничительных предположениях. От требования конечности числа возможных значений скоростей можно избавиться при помощи аппроксима- ционного рассуждения. Гораздо более серьезным является предположение, что распределение скоростей не зависит от положения автомобилей на дороге и что скорости автомобилей остаются постоянными. Чтобы обойти это препятствие, нужно «пометить» каждую точку так, чтобы метки не зависели друг от друга, но могли зависеть от положения помечаемых точек. Имеется мощное обобщение теоремы о раскраске, которое позволяет легко расправляться с подобными задачами для меток самого общего вида. § 5.2. Теорема о маркировке Суть идеи очень проста, но ее точная формулировка требует некоторой аккуратности. Пусть Π — пуассоновский процесс на пространстве S с мерой интенсивности μ. Предположим, что каждой точке X случайного множества Π мы сопоставили случайную величину т% (ее метку),
§ 5.2. Теорема о маркировке 75 принимающую значения в некотором пространстве Μ Распределение случайной величины тх может зависеть от Ху но не от других точек процесса П, и величины ηΐχ для разных точек X независимы друг от друга. Тогда пару (Xtmx) можно рассматривать как случайную точку X* в пространстве S χ Μ. Все точки X* вместе взятые образуют случайное счетное подмножество ТГ = {(Х,тх):ХеП} (5.5) в S χ Μ. Фундаментальный результат, из которого следует все остальное, состоит в том, что П* — пуассоновский процесс в пространстве S χ Μ. Формальное определение состоит в следующем. Измеримые пространства 5 и Μ удовлетворяют условиям, описанным в §2.1. Мы начинаем с пуассоновского процесса Π на пространстве S с мерой интенсивности μ и вероятностного распределения р{хг -) на Мг зависящего от точки χ е S таким образом, что для произвольного подмножества В С Μ функция /?(·, В) измерима на S. Маркировкой процесса Π называется случайное подмножество (5.5) в 5 χ Μ, такое, что его проекция на 5 совпадает с П, а при фиксированном Π случайные величины тх независимы и имеют распределение р(Х, *). Теорема о маркировке. Случайное подмножество И* является пуассоновским процессом на S χ Λί с мерой интенсивности μ*, задаваемой формулой μ*(0= $$ p(dx)p(x,dm). (5.6) Доказательство. Проще всего доказать теорему, используя характеристический функционал. Для произвольной измеримой функции / на S χ Μ положим Е* = £/(Х,тЛ). (5.7) При фиксированном Π случайная величина Σ* есть сумма независимых случайных величин f(X, mx)y так что Е{<ГЕ* | Π} = JI Eie-nx*"** I Π} = J] $ e-f{X>m)p{X, dm), xen xenM Применяя к пуассоновскому процессу П формулу (3.29) с заменой функции / на U(x) =* - In $ е~тм)р(х, dm), м
76 Глава 5. Маркированные пуассоновские процессы получаем Е{е~^} = ехр | - $(1 - e~fM))p(dx)\ = - ехр ( - ξ 5(1 - β-^ηι))μ(άχ)ρ(χ, dm)\ = = expf- $ (1-*-')*μ*\, L SxM > откуда следует, что П* — пуассоновский процесс с мерой интенсивности μ*. D Эта теорема имеет ряд простых, но полезных следствий. Например, поскольку точки (X, тх) образуют пуассоновский процесс на S χ Μ, из теоремы об отображении следует, что метки тх образуют пуассоновский процесс на М. Мера интенсивности рт этого процесса получается из формулы (5.6) при С = S χ В: pm(B) = ^p(dx)p(xydm). (5.8) SB Если метки принимают лишь к различных значений, из доказанной теоремы следует, что точки с /-й меткой образуют пуассоновский процесс П/ с мерой интенсивности μι{Α) = ^μ(άχ)ρ(χΑ^}) (5.9) л и что процессы П/, i = 1, 2,..., &, независимы. Это обобщение теоремы о раскраске, поскольку вероятности цветов р\ — р(х,{т,[}) могут зависеть от положения точки х. В частности, мы немедленно получаем обещанное доказательство теоремы Бартлетта. Используя терминологию §4.4, назовем вызов, поступивший в момент времени s, красным, если в более поздний момент времени / он находится в множестве Е. Цвета различных вызовов не зависят друг от друга, причем вероятность того, что вызов, поступивший в момент времени s, будет красным, равна p(s, t). Следовательно, моменты поступления красных вызовов образуют пуассоновский процесс на (—оо, t) с мерой интенсивности μ(Α) = $a(s)p(s, t)ds. А В частности, общее число красных вызовов имеет распределение Пуассона со средним t μ(—оо, t) = {j a(s)p(s,t)ds, — оо что и утверждалось.
§5.3. Снова теорема Кэмпбелла 77 В некоторых приложениях естественно начинать с произведения пространств, и это позволяет иногда добиваться несколько большей общности. В качестве простого примера рассмотрим плоский тротуар (представленный плоскостью М2) в момент начала дождя. Сначала дождевые капли образуют отдельные круги воды на тротуаре, но с течением времени появляются все новые и новые капли, и круги начинают перекрываться, образуя обширные мокрые области неправильной формы. В качестве модели этого явления можно взять пуассоновский процесс в пространстве Ε2 χ (0, оо); точка (Ху ίχ) обозначает каплю, упавшую в точку X в момент времени tx. Точки Ху для которых ίχ < t, образуют пуассоновский процесс П(/) на IR2, причем случайное множество П(/) возрастает с ростом /. Например, если процесс однороден в пространстве и во времени, так что его мера интенсивности имеет постоянную плотность λ на R2 χ (0, оо), то Щ/)—однородный пуассоновский процесс на R2 с плотностью λί. Процесс, состоящий из всех точек X, не представляет интереса, поскольку он бесконечен на всех множествах положительной меры; интересным объектом является возрастающее семейство пуассоновских процессов ГОД. Процесс П(/) описывает положения центров мокрых кругов в момент времени /. Разумно предположить, что радиусы этих кругов — независимые случайные величины; тем самым мы получаем маркировку процесса П(/) радиусами τχ. Тогда точки (Χ, ίχ, г χ) образуют пуассоновский процесс в четырехмерном пространстве Μ2 χ (0, оо) χ (0, оо). §5.3. Снова теорема Кэмпбелла Теорема Кэмпбелла описывает распределение суммы T,f(X) по точкам X пуассоновского процесса. Но иногда суммируемая величина зависит от точки X не детерминированным, а случайным образом, независимо для разных точек. Иными словами, нас может интересовать распределение суммы Σ/ηχ, где ΥΠχ — маркировка процесса П. Для таких сумм теорема Кэмпбелла по-прежнему применима, поскольку метки гпх образуют пуассоновский процесс на М. Так, например, если ΥΠχ — положительные случайные величины, то E{e-£m*} = expj- $(1 - e-m^m{dm)\ - = exp [ - \\(\ - β~ηι)μ{άχ)ρ(χ, dm)\. (5.10)
78 Глава 5. Маркированные пуассоновские процессы Это равенство — прямое обобщение формулы (3.29), к которой оно сводится в случае, когда гпх = f(X) — неслучайная функция от X. Эту линию рассуждения можно продолжить. Для иллюстрации возникающих на этом пути возможностей рассмотрим очень простую классическую модель вселенной. Будем считать, что галактики — это точечные массы, образующие в трехмерном пространстве пуассоновский процесс (переменной) интенсивности \{х). Предположим, что массы галактик — независимые случайные величины, причем масса тх галактики, находящейся в точке Ху имеет плотность распределения р(Хут), т > О Тогда точки (X, тх) образуют пуассоновский процесс П* в пространстве Μ3 χ (0, оо) с плотностью интенсивности λ* (ху т) — Х(х)р(ху т). (5.11) Рассмотрим теперь гравитационное поле в фиксированной точке, например в начале координат. Оно задается трехмерным вектором (F\9 /^, Fz), где с - У" GmxXi /5 19\ а С — гравитационная постоянная. Применяя к процессу ГГ формулу (3.21), получаем E{^.Fl+^2-b/№} = expJ J ^(eiGm«Mx»-\)X(x)p(x, m)dxdm\, (5.13) U3 о J где φ (χ) — вектор-функция с компонентами ф}{х) =- (х? +*| +х|Г3>*х/, (5.14) а через (/, ф(х)) обозначено скалярное произведение. Эта формула верна, если выполнено условие (3.16), которое эквивалентно тому, что § т\ф(х)\Х(х)р(х, т) dx dm < оо. (5.15) R3 Если обозначить через т(х) = §гар(х, т) dm математическое ожидание массы галактики, находящейся в точке ху это условие примет вид Если выполнено условие (5.16), то формула (5.13) в принципе задает совместное распределение случайных величин F\, F$y F3. Математические
§5.4. Широкая автомагистраль 79 ожидания, дисперсии и ковариации этих величин могут быть найдены из формулы (ЗЛ8): E{Fj) = ^Gmil>j(x)\(x)p(x, m)dxdm = G\ rh(x)ipj(x)\{x)dx (5.17) к3 и cov{/7/·, Fk) — ^Grmpj(x)Gtmpk(x)Mx)p(x> m)dx dm — = G2 $ m2(x)tl>j(x)il>k(x)4x)dx, (5.18) ж3 где oo m<i(x) — ^ rn2p(x, m)dm. (5.19) о Если вселенная однородна, в том смысле, что т(х) и Х(х) — ненулевые константы, то условие (5Л6) не выполнено, так что с вероятностью единица ряд (5.12) абсолютно не сходится. Это гравитационная версия парадокса Ольберса, Ряд (5Л7) тоже не сходится, но любопытно, что ряд (5.18) сходится, если исключить из рассмотрения окрестность начала координат. Это позволяет изучать дисперсии и ковариации формально, используя формулу (5.18) и игнорируя расходимость ряда (5.12). Подобные «ренормализационные» процедуры рассматриваются в теоретической физике. §5.4. Широкая автомагистраль Вернемся теперь к примеру из §5.1, связанному с дорожным движением. Предположим, что в момент времени t = О автомобили образуют пуассоновский процесс Π на R с плотностью интенсивности λ(*). Мы хотим описать расположение автомобилей в более поздний момент времени t > 0 при минимальных предположениях относительно их движения между моментами 0 и /. На самом деле необходимо предположить только, что движения различных автомобилей независимы друг от друга. На практике это предположение выполняется только на широких магистралях, где разрешены обгоны; отсюда название данного параграфа. В этом случае из теорем о маркировке и отображении немедленно вытекает, что автомобили образуют пуассоновский процесс П(/) в любой более поздний момент времени t. Чтобы привести более точную формулировку, обозначим через Yt(X) положение в момент времени t автомобиля, который находился в точке X
80 Плава 5. Маркированные пуассоновские процессы в момент времени t = 0. Если при различных X величины Yt(X) независимы, то они образуют маркировку процесса П. По теореме о маркировке точки (X, Yt(X)) образуют пуассоновский процесс П* на Е2. По теореме об отображении точки Yt(X) образуют пуассоновский процесс П(/) на Е, что и утверждалось. Важно отметить, что в этом рассуждении мы предполагали, что / фиксировано. Мы не утверждаем, например, что при различных / процессы П(/) независимы, и в реальности они зависят друг от друга довольно сложным образом. Если необходимо исследовать совместные распределения процессов П(/) для нескольких различных моментов времени t, проще всего сделать это, выведя из теоремы о маркировке с Μ = Ε", что множество точек {(X, Ytl(X), Ytl(X),...,Yt„(X)): X€U} (5.20) образует пуассоновский процесс в Е"+1 при любых t\, h,...,tn, или, с более дальним прицелом, что множество точек {{Х,У{Х)):ХеЩ (5.21) образует пуассоновский процесс на Ε χ Λί, где пространство меток Μ есть подходящее функциональное пространство возможных траекторий. Нетрудно вычислить меру интенсивности процесса П(/). Для простоты предположим, что условное распределение случайной величины Yt(X) при фиксированном X имеет, плотность pt(X, ·)· Тогда из формулы (5.5) следует, что плотность интенсивности процесса П* на Е2 равна X(x)pt(x,y). Следовательно, оо \1(у)= ς X(x)Pt(x,y)dx. (5.22) — ОО Предположим, например, что автомобили движутся с постоянными скоростями, которые выбраны независимо друг от друга и имеют плотность распределения g(v). Тогда Pt(x,y) = t-lg(^Zl), (5.23) так что равенство (5.22) принимает вид оо ЫУ)= <sX(y-vt)g(v)dv. (5.24) о Заметим, что если λ(χ) = λ, то Xt(y) — X при любом t\ при независимых скоростях пуассоновский процесс сохраняет однородность. Однако этот
§5.5. Приложения к экологии 81 простой вывод использует специальный вид плотности (5.23) и неверен в общем случае плотности (5.22). Важно подчеркнуть, что эти простые результаты существенным образом опираются на предположение, что автомобили движутся независимо. Как только они начинают оказывать влияние друг на друга, пуассоно- вость теряется. Автомобили образуют плотные группы, из которых более быстрый автомобиль может вырваться только при появлении возможности для обгона; после чего он догоняет следующую группу, и печальная история повторяется. §5.5. Приложения к экологии Анализ, проведенный в предыдущем параграфе, не использовал никаких специфических свойств одномерного пространства, и в некоторых приложениях уместно рассматривать пространства состояний более высокой размерности. Поэтому стоит переформулировать некоторые из полученных результатов для этого более общего контекста. Теорема о смещении. Пусть Π — пуассоновский процесс в Жа с плотностью интенсивности Х(х). Предположим, что точки множества Π смещаются случайным образом так, что распределение нового положения точки X — χ имеет плотность р(х, ·). Тогда смещенные точки образуют пуассоновский процесс П' с плотностью интенсивности У, задаваемой формулой λ'(</)= $\(x)p(x,y)dx. (5.25) В частности, если Х(х) = λ — константа и функция р(х,у) зависит только от разности у — х, то \'{у) — X при всех у. Доказательство. Из предположений теоремы следует, что новые положения Υχ точек X задают маркировку процесса П. По теореме о маркировке множество П* = {(X,YX):X еП} есть пуассоновский процесс в R2d, а по теореме об отображении множество П' = {Ъ:*еП} есть пуассоновский процесс в Rd. Мера интенсивности процесса П* имеет плотность Х(х)р(х, у), поэтому мера интенсивности процесса П' имеет плотность (5.25). (Предположение о существовании плотностей было сделано лишь для простоты изложения.)
82 Плава 5. Маркированные пуассоновские процессы Если Х(х) = λ и р(ху у) = g(y — х)у то λ'(У) = λ 5 £^ -· *) d* = λ § g(x) dx = λ §p(0, χ) dx = λ. D Благодаря этому свойству устойчивости однородный пуассоновский процесс привлекателен в качестве модели в приложениях, где фигурируют случайные смещения. В частности, он использовался в биологических исследованиях при изучении пространственных распределений популяций животных или растений. Животные мигрируют по своей воле; смещение растительных популяций обычно происходит между поколениями, так как семена рассеиваются вокруг материнского растения. Однако, как было отмечено Фельзенштейном (см. [16]), чрезмерное увлечение пуассоновскими процессами может привести к противоречиям. Рассмотрим, например, следующую модель. Будем обозначать представителей растительной популяции точками на плоскости. Предположим, что растения рассеивают семена, из которых вырастает следующее поколение, после чего погибают. Тогда потомки каждого конкретного растения будут разбросаны вокруг него. Если бы каждое растение имело не более одного потомка, то, как следует из теоремы о смещении, при очень общих условиях однородный пуассоновский процесс материнских растений порождал бы однородный пуассоновский процесс дочерних растений. Но если, как это обычно происходит, некоторые растения производят большое потомство, это заключение неверно. А именно, обычно предполагают, что число Nx потомков растения, находящегося в точке х, имеет распределение Пуассона со средним φ(χ) и что эти потомки расположены в точках х + Д, / = 1,2,· ■■,#*, (5.26) где Д —независимые случайные величины с плотностью распределения g(x, ·) на R2. При этих предположениях нетрудно убедиться (используя по существу те же вычисления, что и в доказательстве теоремы единственности из §2.5), что точки Д образуют пуассоновский процесс с плотностью интенсивности Хх(у) = <р(х)ц(х, у - х). (5.27) Теперь предположим, что потомства различных растений независимы, т. е. дочернее поколение является суперпозицией независимых пуассо- новских процессов. Теорема о суперпозиции утверждает, что дочернее поколение представляет собой пуассоновский процесс П' с плотностью
§5.6. Кольцевая автомагистраль 83 интенсивности λ'Μ = Σφ(χ)§(χ^-χ), (5.28) где сумма берется по всем положениям χ родительских растений. Однако все эти рассуждения проводились в предположении, что положения родительских растений χ фиксированы (поэтому они и обозначались строчными буквами). Если предположить, что родительские растения находились в точках X случайного множества Π (пуассоновского или нет), то проведенный анализ показывает, что условное распределение процесса П' при фиксированном Π есть распределение пуассоновского процесса, плотность интенсивности которого А'(Г) = ^2<р(Х)д(Х,у-Х) (5.29) сама подвержена случайным вариациям. Безусловное распределение процесса П' будет пуассоновским только в тривиальных случаях, так что поспешное предположение, что все поколения могут описываться пуассоновскими процессами, не согласуется с биологией. Мы вернемся к этому вопросу в §6.2. §5.6. Кольцевая автомагистраль Рассмотрим еще одну задачу о дорогах, еще более упрощенную, чем в § 5.4. Городские власти решили окружить зону застройки автомагистралью, которую в первом приближении можно считать окружностью (британские читатели могут представить себе шоссе М25 вокруг Лондона). Существующие радиальные дороги из центра города возникали стихийно на протяжении многих лет и пересекают новую дорогу в случайном наборе точек. Какие-то из более быстрых дорог, вероятно, останутся в употреблении й после строительства новой дороги. Другие, более медленные, перестанут использоваться, если новая дорога окажется достаточно быстрой, чтобы позволить сократить время в пути. Сколько радиальных дорог останется в употреблении? Предположим, что радиальные дороги пересекают кольцевую в точках, образующих пуассоновский процесс. Положения точек на окружности можно задавать угловой координатой Θ. Предположим, что рассматриваемый процесс имеет постоянную интенсивность λ на отрезке О ίζ θ < 2π. Предположим также, что время в пути от центра до точки θ есть случайная величина tq, причем величины tq независимы при различных θ и имеют плотность распределения /(/), t ^ 0. Тогда случайные величины tq задают маркировку процесса П, а точки (0, tq) образуют
84 Плава 5. Маркированные пуассоновские процессы пуассоновский процесс П* в прямоугольнике [0, 2π) χ (0, оо) с плотностью интенсивности Л(0, т) = λ/(τ). (5.30) Теперь предположим, что движение по новой автомагистрали происходит с постоянной угловой скоростью ω, так что полный круг по ней можно совершить за время 2π/ω. Тогда дорога, пересекающая магистраль в точке θ с те = т, жизнеспособна, если не существует дороги (#', т'), для которой τ'+ω-ιά(θ,θ')<τ, (5.31) где ά(θ, θ') = min (|0 - 0'|, 2π-\θ- θ'\) (5.32) — угловое расстояние между θ и θ'. Следовательно, вероятность υ(θ,τ) того, что точка (0, т) е П* жизнеспособна, есть вероятность того, что в множестве С, задаваемом неравенством (5.31), нет точек (0', т') е П*: υ(θ, τ) = exp |-SSA/(r,)d0,dr,|> или z/(0, г) = exp j -2λ $ min [ω(τ -ί),π] f{t) dt j. (5.33) Но это задача о раскраске: каждая точка (0, т) е П* окрашена с вероятностью у(0, г). Однако мы не можем заключить, что окрашенные точки образуют пуассоновский процесс с плотностью интенсивности Л(0, т)и(0, г), поскольку точки окрашиваются не независимо друг от друга. Тем не менее, можно вывести отсюда, что ожидаемое число V жизнеспособных дорог равно 2π оо V = $ S Л(0, τ)ι/(0, τ)άθάτ. (5.34) о о Проще всего увидеть это, переходя к условным распределениям при фиксированном общем числе N точек процесса П*, которое имеет распределение Τ(2πλ). При фиксированном N точки (0„,тя), п= 1,2 Л^, процесса П* независимы и имеют плотность распределения /(τ)/(2π). Таким образом, условное ожидание числа окрашенных точек при фиксированном N равно 2ποο ,, , Ν ^ 5 ^υ(θ,τ)άθάτ, 0 0
§5.6. Кольцевая автомагистраль 85 откуда получаем равенство 2ποο ρ, ν ν = 2π\ $ $ ^ν(θ,τ)άθάτ, οο которое совпадает с (5.34). Подставляя в равенство (5.34) формулу для υ и упрощая, получаем выражение V = 2πλ J /(г) ехр|-2λ J min [ω(г - /), π] /(/) Λ |, (5.35) которое в принципе можно вычислить для любой конкретной плотности /. В частности, при большом λ значение V может быть значительно меньше, чем ожидаемое полное число 2πλ дорог. Точное поведение величины V при λ —► оо зависит от поведения функции / вблизи левого конца ее носителя. Например, если функция / непрерывна при t — 0 и /(0) > 0, то нетрудно убедиться, что V ~ 2π3/2/(0)1/2λ1/2 при λ -> оо. (5.36)
Глава 6 Процессы Кокса §6.1. Определения и основные свойства В §5.5 нам встретилось случайное множество, которое не являлось пуассоновским процессом, но превращалось в него при переходе к условным распределениям. Такие процессы были введены Коксом (см. [10]) под названием дважды стохастических пуассоновских процессов, но теперь их обычно называют по имени первооткрывателя. Итак, пусть S — пространство состояний, удовлетворяющее предположениям, описанным в §2.1, μ— случайная неатомическая мера на S, а П — случайное счетное подмножество в S. Тогда Π называется процессом Кокса, ассоциированным со случайной мерой μ, если условное распределение случайного множества Π при фиксированной мере μ есть распределение пуассоновского процесса с мерой интенсивности μ. Таким образом, определение процесса Кокса представляет собой набор предположений относительно условных совместных распределений считающих функций Ν(Α) процесса Π при фиксированной мере μ. Требуется, чтобы для любых непересекающихся множеств Α\,Α2,··.,Αη выполнялось соотношение η ¥{N(A{) = ruN(A2) = r2, ..., Ν(Αη) = Γη\μ} = Υ[πΜΑΐ')). (6.1) k=\ Тогда безусловные совместные распределения считающих функций N(A) можно найти, рассматривая математические ожидания. В большинстве приложений случайная мера задается плотностью Л: μ(Α) = $Α(χ)άχ. (6.2) А При этом А(х) есть вещественнозначный случайный процесс на пространстве S. Необходимо предположить, что он измерим (по совокупности переменных χ и ω, где ω — элемент базового вероятностного пространства), так что формула (6.2) задает корректно определенную случайную величину. Тогда совместные распределения и математические ожидания считающих функций Ν(Α) можно выразить в терминах
§6.2. Процессы Кокса в экологии 87 совместных распределений процесса Л. Например, Ε{Ν(Α)} = Ε{Ε[Ν(Α) \μ]} = Ε$Α(χ)άχ, А откуда следует, что Е{ЩА)} = ^Е{А(х)}ах. (6.3) А Иногда значения процесса Л соответствуют «реальным» характеристикам модели, например задают уровень рождаемости или уровень активности; в остальных случаях это чисто математическая конструкция. Выбирая в качестве Л различные процессы, можно построить много непуассоновских случайных множеств. Таким образом, процессы Кокса — очень гибкое средство получения общих случайных множеств, поддающихся относительно несложному анализу. Однако не каждое случайное множество представимо в виде процесса Кокса. В частности, моменты второго порядка процессов Кокса удовлетворяют неравенству, которое не выполняется для произвольных случайных множеств. Чтобы убедиться в этом, вычислим Ε{Ν(Α)2} = Ε{Ε[Ν(Α)2 \μ]} = Έ{μ(Α) + μ{Α)2} = = Ε{μ(Α)} + [Ε{μ(Α)}]2+Β{μ(Α)}; отсюда следует, что Β{Ν(Α)) = Ε{Ν(Α)} + Ό{μ(Α)}. (6.4) В частности, Ό{Ν(Α)}^Ε{Ν(Α)}, (6.5) причем равенство достигается в том и только в том случае, если μ(Α) — вырожденная случайная величина. В этом смысле все процессы Кокса «слишком дисперсны». Считающая функция Ν(Α) процесса Кокса имеет большую дисперсию, чем пуассоновская случайная величина с тем же средним. Полное изложение теории процессов Кокса может быть найдено в книге [18], к которой мы отсылаем заинтересованного читателя. Здесь же мы ограничимся двумя примерами очень разного характера. Первый продолжает анализ, начатый в §5.5, а второй дает представление (в одномерном случае) о том, насколько процессы Кокса специальны. §6.2. Процессы Кокса в экологии В §5.5 мы рассматривали случайное счетное подмножество плоскости, описывающее расположение представителей биологической популя-
88 Глава 6. Процессы Кокса ции. Естественно предположить, что уровень рождаемости или привлекательность для жизни неодинаковы в разных частях ареала, и отразить эти колебания, рассматривая неоднородную плотность интенсивности Х(х)у принимающую большие значения в более плодородных областях. Если мы в состоянии явно измерить все эти переменные характеристики, то можно принять предположение о том, что представители популяции образуют неоднородный пуассоновский процесс π с плотностью интенсивности \(х), которую можно считать известной. При этом можно проигнорировать тот факт, что значение Х(х) могло быть обусловлено случайными факторами. С другой стороны, если мы не можем непосредственно наблюдать функцию Х(х)у мы должны ее тоже промоделировать с помощью случайного процесса А(х). Хотя при фиксированном Л процесс Π пуассоновский, его безусловная структура есть структура процесса Кокса. Даже если различий в уровне рождаемости нет, репродуктивный механизм популяции может привести к процессу Кокса, а не к пуассо- новскому процессу, как демонстрирует пример Фельзенштейна из § 5.5. Предположим, что φ(Χ) и g(X, ·) не зависят от X. Как было показано, в этом случае дочернее поколение образует процесс Кокса с плотностью интенсивности Α(χ) = φΣΒ(χ-Χ), (6.6) зависящей от положений X материнских растений. Поскольку эта функция зависит от случайных величин X, для дочернего поколения неравенство (6.5) всегда будет строгим. Таким образом, если родительское поколение не было абсолютно детерминированным, дочерний процесс не будет пуассоновским. Если проследить за развитием популяции на протяжении нескольких поколений, мы увидим последовательность непуассоновских процессов Кокса. В принципе, распределения этих процессов Кокса можно вычислить, последовательно находя случайные плотности интенсивности Λ для различных поколений. Аналог формулы (6.6) для внучатого поколения имеет вид Л'(*)=¥>5>(*-П (6.7) где X* — положения дочерних растений. При фиксированном Λ точки X1 образуют пуассоновский процесс, так что распределение случайной величины №{х) и совместные распределения этих величин для различных значений χ можно вычислить по теореме Кэмпбелла. Таким образом, плотности интенсивности Λ для последовательных поколений образуют марковскую цепь, переходные вероятности которой в принципе известны.
§6.2. Процессы Кокса в экологии 89 Эти вычисления слишком сложны, чтобы провести их здесь в явном виде. Тем не менее, любопытно рассмотреть моменты первого и второго порядка. По формуле (3.9) мы имеем Е{А,М|А}= $<pg{x-y)A(y)dy. R2 Таким образом, Έ{Λ'(*)} = φ $ g(x-y)E{A(y)}dyy (6.8) R2 откуда следует, что если Е{А(х)} = \ (6.9) — константа, то Ε{Α'(χ)} = \φ. В частности, при φ = 1 равенство (6.9) выполнено для всех поколений. Поэтому предположим, что φ — 1 и что выполнено равенство (6.9). Тогда из формулы (3.12) следует, что Е{А'(х)А'(у)\А} = = $*(*- ζ)Α(ζ)άζ $ gQf ~ ν)Α(η)άη + $ g(x - Оё{У - ξ)Α(ξ)άξ^ R2 R2 R2 откуда мы получаем равенство Е{А'(х)А'(у)} =$$*(*" Оё{У ~ η)Ε№)Α{η))άξάη + R2R2 + A$gi*-Ogfo-0di. (6.Ю) R2 В частности, если Л — стационарный второго порядка случайный процесс с автоковариационной функцией, задаваемой формулой Е{А(х)А(у)} = Х2 + а(у-х), (6.11) то Л7 тоже является стационарным второго порядка случайным процессом и его автоковариационная функция σ' удовлетворяет равенству Х2 + а'(у-х) = = S $ g(* - Оё(У - »?){λ2 + σ(η - ξ)}άξάη + \$g(x- ξ)§(ΰ - ζ)άξ. κ2 κ2 κ2 Полагая -T(x)=$g(y)g(y-x)dy, (6.12) R2
90 Глава 6. Процессы Кокса мы можем упростить это выражение следующим образом: σ'(χ) = $ σ(* - уЫу) dy + λΊ(χ). (6.13) R2 Это позволяет рекурсивно вычислять автоковариационные функции для последовательных поколений. Используя общую теорию случайных блужданий, можно показать, что если случайная величина с плотностью распределения g имеет конечную дисперсию, то значение σ(0) = Ρ{Λ(χ)} неограниченно возрастает с каждым следующим поколением. Это особенность двумерного (или одномерного) пространства; в размерности три и более возможна ситуация, когда в равенстве (6.13) σ' = σ. §6.3. Распределение Бореля—Таннера В этом параграфе мы несколько отклонимся от основной темы, хотя в некотором смысле в нем продолжаются обсуждения, начатые в §5.5 и §6.2, а также просматриваются любопытные связи и с другими аспектами теории пуассоновских процессов. Мы видели, что популяция, которая воспроизводит себя из поколения в поколение пуассоновским образом, демонстрирует тенденцию к образованию все более плотных скоплений, хотя ее средняя плотность может при этом оставаться постоянной. Частичное объяснение этого явления содержится в свойствах последовательных поколений потомков одного и того же предка. Итак, не будем обращать внимание на пространственное распределение членов популяции; тогда последовательные поколения описываются простым ветвящимся процессом (процессом Гальтона—Ватсона), в котором размер семьи имеет распределение ν(φ). Если φ < 1, то из общей теории ветвящихся процессов следует, что каждый член популяции будет иметь лишь конечное число потомков. Таким образом, даже в критическом случае φ = 1 п-е поколение при большом η будет состоять из потомков лишь небольшой доли представителей исходного поколения. Нетрудно вычислить распределение общего числа потомков одного предка. Рассмотрим сначала процесс Гальтона—Ватсона (см. [21]), в котором размер семьи имеет произвольное распределение с производящей функцией F(z). Каждый член популяции имеет N детей, где E(zN) = F{z)\ (6.14) каждый из них в свою очередь производит потомство в соответствии с тем же распределением, и т. д.; при этом размеры различных семей независимы друг от друга. Если средний размер семьи F'(\) удовлетво-
§6.3. Распределение Бореля—Таннера 91 ряет неравенству f'UK 1, (6.15) то число непустых поколений конечно, так что общее число Μ потомков исходного предка (включая его самого) конечно с вероятностью единица. Ясно, что Λί = 1 + Λί ι + Л*2 + ·.. + Afyv, где Mk — общее число потомков &-го из N детей рассматриваемого предка. Случайные величины М^ независимы и имеют то же распределение, что М. Таким образом, функция G(z) = Έ(ζΜ) удовлетворяет уравнению G(z) = Ε{Ε(ζΜ Ι Ν)} = E{zG(zf} = zF{(G(z))}. Это функциональное уравнение G = zF(G) (6.16) относительно функции С можно решить при помощи разложения Лаг- ранжа (см. [42, §7.32]). При этом решение уравнения (6.16) выражается в виде степенного ряда по ζ: /2=1 Более общим образом, для подходящих функций / мы имеем f(G(z)) = /(0) + Y^^±—[F(xff\x)]x^ и, в частности, при г ^ 1 выполняется равенство G(ZY = Σ^έ^τΗ^^Ί-ο· (6Л8) /2=1 Так как G(z)r — производящая функция для полного числа потомков г «сестер» (обозначим это число Л4(г)), мы получаем, что Ρ {Af М = „} = L g± [F(x)nxr-1 ]χ=0. (6.19) Но F(x)n — производящая функция для суммарного размера η различных семей (обозначим его Sn), а правая часть формулы (6.19) — ее коэффициент при хп~г с некоторым числовым множителем. Поэтому из ргжем- ства (6.19) следует, что P{Af(r) = η} = -P{S„ = η - г}, η > г. (6.20)
92 Плава 6. Процессы Кокса В частности, ψ{Μ = п}= -F{Sn = η - 1}. (6.21) Эти результаты имеют множество различных приложений, например в теории массового обслуживания, где М^ есть число вызовов, обслуженных за период занятости системы, в начале которого длина очереди была равна г. Полученные уравнения имеют комбинаторную интерпретацию, тесно связанную с теоремами о баллотировке, упоминавшимися в §4.3. Теперь сосредоточим внимание на случае, рассмотренном в предыдущем параграфе, когда размер семьи имеет распределение V(<p) при φ ^ 1. Тогда Sn имеет распределение ν{ηφ), так что равенства (6.20) и (6.21) принимают вид Ψ{Μ{Γ) = η}= -πη-Γ(ηφ), (6.22) Ρ{Λί = л} = -тгя_,(/1<р). (6.23) Даже тот факт, что эти формулы задают вероятностные распределения, с аналитической точки зрения неочевиден. Из формулы (6.22) следует, что при всех г ^ 1 и t < 1 выполняется равенство оо γ^Έϋζΐρ. = 1_ (6.24) η—г Подробно расписав эту формулу в частном случае г = 1, мы получаем ^ п\ или EV"(te"/),, = '· /<L (6·25) Иными словами, функция ^)=EV· (6·26) п=\ задаваемая этим сходящимся (по формуле Стирлинга) рядом при \х\ <е-1, удовлетворяет уравнению V>(fe-') = / (6.27)
§6.4. Процессы Кокса и процессы восстановления 93 при 0 < t < 1. Полагая t = ip(s), мы видим, что она является решением в этой области функционального уравнения te'* = 5. (6.28) Разумеется, мы получили бы тот же ответ непосредственным применением разложения Лагранжа, так что на самом деле тождество (6.24) содержит частный случай результата Лагранжа. Распределение (6.22) было выведено Борелем и обобщено на случай (6.23) Таннером в работе [41]; поэтому в литературе по теории массового обслуживания оно известно как распределение Бореля—Таннера. §6.4. Процессы Кокса и процессы восстановления Вернемся к процессам Кокса и сосредоточим внимание на одномерном случае S — R. Этот случай выделен, так как произвольный неоднородный процесс может быть получен из однородного при помощи монотонного преобразования. Точнее, пусть λ — положительная функция, такая, что О оо $ λ(χ)άχ = $ X(x)dx = оо. (6.29) -оо О К. — единственная непрерывная справа функция, такая, 5 X(x)dx=y. (6.30) о Пусть Π — пуассоновский процесс (постоянной) единичной интенсивности на R. Тогда (см. §4.5) точки ψ(Χ), X £ Π, образуют пуассоновский процесс с плотностью интенсивности Х(х). Чтобы получить процесс Кокса, заменим функцию λ (измеримым) случайным процессом Λ, не зависящим от П. Тогда формула (6.30) задает непрерывный справа возрастающий процесс Φ и случайное множество {Ъ(Х):Х ЕП} (6.31) есть процесс Кокса, соответствующий процессу Λ. Эту конструкцию можно понимать двояко. С одной стороны, процесс Φ используется для преобразования однородного пуассоновского процесса П. С другой стороны, осуществляется выборка из процесса Φ в пуассоновские моменты времени X £ П. Вторая точка зрения имеет важное значение, поскольку при пуассоновской выборке не теряется Пусть ψ: что
94 Глава 6. Процессы Кокса информация о совместных распределениях. Зная совместные распределения точек процесса (6.31), мы можем найти совместные распределения процесса Ψ, а от них перейти к совместным распределениям процесса Л. Это совсем не очевидно, и заинтересованного читателя мы отсылаем к работе [26], где этот результат применяется к изучению вопроса о том, какие процессы восстановления представимы в виде процессов Кокса. Под процессом восстановления понимается такое случайное подмножество О < Х{ < Х2 < ... (6.32) в (0, оо), что случайные величины Х\, Х%-Х\, Хъ-Х2, ··· (6.33) независимы, причем все они, кроме, быть может, первой, имеют одно и то же распределение «продолжительности жизни». Оказывается, для того чтобы процесс (6.32) был процессом Кокса, распределение продолжительности жизни должно иметь очень специальный вид — оно должно иметь плотность, которую можно записать в виде λρ(0, (6.34) где λ > 0, а р является р-функцией (см. [27]), т.е. функцией вида p(t) = Ϋ{ξ(ή = О | ξ(0) = 0} (6.35) для некоторого марковского процесса ξ с р(О-Ь) = 1. Соответствующий процесс, задающий интенсивности, имеет вид Λ(ί) [А, если «0 = 0, [0 иначе. Для нас важно, что этот результат подчеркивает специальный характер процессов Кокса и предохраняет от наивного заблуждения, что «большинство» интересных случайных счетных множеств являются если не пуассоновскими процессами, то уж по крайней мере процессами Кокса.
Глава 7 Стохастическая геометрия §7.1. Пуассоновские процессы геометрической природы До сих пор мы имели дело со случайными счетными подмножествами пространств S, которые были подмножествами пространств Rd той или иной размерности d. Однако теория пуассоновских процессов является гораздо более общей и приложима к случайным структурам, которые выглядят совершенно иначе, нежели нерегулярный массив точек, изображенный на рис. 1.1. Предположим, например, что мы рассматриваем в микроскоп лист бумаги. То, что мы видим, напоминает рис. 7.1; линии изображают волокна материала. При построении соответствующей модели можно считать, что волокна — это бесконечные прямые линии; в более сложной модели можно учитывать толщину волокон, конечность их длин или отклонения от прямизны. Можно считать, что прямые расположены на плоскости или, если это оправдано толщиной материала, в трехмерном пространстве. Такого рода приложения показывают, что необходимо иметь модели для представления случайных наборов прямых в М2 или IR3. Аналогич- Рис. 7.1. Случайные прямые на плоскости
96 Плава 7. Стохастическая геометрия ным образом можно рассматривать наборы плоскостей в М3 или аффинные подпространства большей размерности в Rd при больших d. При этом интерес представляют не только линейные подмножества; задачу о мокром тротуаре из §5.2 можно рассматривать как задачу о случайном наборе дисков в IR2. Подобные случайные наборы геометрических объектов являются предметом изучения стохастической геометрии; этот термин в общих чертах эквивалентен терминам геометрическая теория вероятностей и интегральная геометрия, хотя различия в этих названиях соответствуют некоторым нюансам в акцентах. Ключевой факт состоит в том, что в большинстве важных случаев рассматриваемые геометрические объекты образуют множество S достаточно простой структуры, так что случайный набор таких объектов можно рассматривать как случайное подмножество в S, после чего может быть задействован весь аппарат теории пуассоновских процессов. Предположим, например, что мы хотим построить модель ситуации, изображенной на рис. 7.1, как случайного набора бесконечных (неориентированных) прямых линий в R2. Множество S таких прямых есть двумерное многообразие (пространство, локально эквивалентное М2), поскольку прямая на плоскости задается двумя параметрами. Таким образом, каждая прямая есть «точка» в 5, а случайный набор прямых есть случайное подмножество в 5. Более подробно мы рассмотрим эту ситуацию в следующем параграфе, где увидим, что подмножество в S, у которого, как на рис. 7.1, в любое ограниченное поле зрения попадает лишь конечное число прямых, обладает тем свойством, что его пересечение с любым компактным подмножеством в S конечно. Один из способов получить такие случайные подмножества состоит в том, чтобы применить теорему существования, начав с неатомической и конечной на компактных подмножествах меры интенсивности. Каждой такой мере μ на S соответствует пуассоновское поле прямых, т. е. пуассоновский процесс Π на множестве S прямых. Аналогичным образом можно определить пуассоновское поле прямых в М3, взяв в качестве S четырехмерное многообразие прямых в IR3. Точно так же можно интересоваться случайным набором плоскостей в IR3 — в этом случае многообразие S трехмерно. Более общим образом, случайный набор rf-мерных аффинных подпространств в Rn можно представить в виде пуассоновского процесса на многообразии размерности (d + l)(/i-d). Рассматриваемые геометрические объекты не обязательно должны быть линейными. Для задания дисков в Ш2 (капель дождя на тротуаре)
§7.2. Пуассоновские поля прямых 97 требуется три параметра. Они образуют множество, которое формально не является трехмерным многообразием, потому что содержит границу, соответствующую нулевому радиусу. Однако это препятствие не существенно, поскольку при интегрировании подобные аномалии игнорируются. Аналогичным образом можно поступать с наборами кривых и поверхностей в IR2 и IR3, если они описываются конечным числом параметров. Предметом данной книги являются пуассоновские процессы, а не стохастическая геометрия, поэтому мы дадим лишь общее представление об этой богатейшей теории. Следующие два параграфа посвящены полям прямых на плоскости, а в заключительном параграфе мы ненадолго вернемся к более общим вопросам. Для читателя, желающего более подробно познакомиться с этой тематикой, могут оказаться полезными библиографические комментарии в конце главы. §7.2. Пуассоновские поля прямых В этом и следующем параграфах S обозначает множество бесконечных неориентированных прямых линий в R2. Случайный набор прямых есть просто случайное подмножество в S, которое будет называться полем прямых. Если это случайное подмножество является пуассоновским процессом, то мы будем называть его пуассоновским полем прямых. Мера интенсивности μ пуассоновского поля прямых есть мера на S, и для того чтобы проводить вычисления с этой мерой, нужно ввести в S систему координат. Есть разные способы сделать это, но для наших целей удобно ввести систему координат следующим образом. Пусть / — произвольная прямая в М2; существует единственная прямая /х, проходящая через начало координат О перпендикулярно к /. Пусть L — точка пересечения / и /х, и пусть ρ —расстояние OL, взятое со знаком плюс, если L лежит в верхней полуплоскости {(х, у): у > 0} или на положительном луче {(χ,Ο): χ > 0} оси х, и со знаком минус в противном случае. Пусть θ — угол, образуемый прямой /х с осью х, взятый в интервале 0 < θ < π. Функция / η-» (ρ, θ) взаимно однозначно отображает множество S на полосу § = {(ρ, Θ): - оо < ρ < оо, 0 < θ < π} (7.1) (рекомендуем читателю нарисовать соответствующую картинку). Таким образом, любая мера на множестве S индуцирует меру на полосе S, и наоборот; допуская удобную вольность речи, мы не будем различать эти две меры.
98 Глава 7. Стохастическая геометрия Пусть Dr = {(xyy):x2+y2^r2} — диск радиуса г с центром в начале координат О. Тогда прямая / пересекается с Dr в том и только в том случае, если \р\ < г. Отсюда легко следует, что подмножество А в S обладает тем свойством, что с любым ограниченным множеством пересекается лишь конечное число прямых из Л, тогда и только тогда, когда А отображается в подмножество Л полосы 5, которое является локально конечным (т. е. его пересечение с любым ограниченным множеством конечно). В частности, если μ— неатомическая мера на S, конечная на ограниченных множествах, то из теоремы существования следует, что существует пуассоновское поле прямых с мерой интенсивности μ и что с вероятностью единица любое ограниченное множество в IR2 будет пересекаться лишь с конечным числом случайных прямых. Один очевидный пример такой меры — это лебегова мера (площадь) на S: μι(Α) = ^άράθ, (7.2) А или, более общим образом, μχ = λμ\. (7.3) Пуассоновское поле прямых с мерой интенсивности μχ называется однородным пуассоновским полем прямых интенсивности λ. Оправданием термину «однородный» служит очень важное свойство инвариантности меры μχ, из которого следует стохастическая инвариантность самого процесса. Произвольное евклидово движение плоскости, т.е. отображение, сохраняющее расстояния между точками, можно представить в виде композиции параллельных переносов, поворотов вокруг начала координат О и отражений. Каждое из этих отображений переводит прямые в прямые, индуцируя тем самым отображения S —» S и S —► S, каждое из которых оставляет меру μχ инвариантной. Чтобы убедиться в этом, рассмотрим сначала параллельный перенос, переводящий начало координат О в точку (ξ, η). Нетрудно проверить, что при этом прямая с координатами (ρ, Θ) переходит в прямую с координатами (р+ ξ cos θ Λ-η sin (9, θ). (7.4) Это неоднородный.сдвиг в S, который очевидным образом сохраняет площадь.
§7.2. Пуассоновские поля прямых 99 Поворот на угол а вокруг начала координат О переводит прямую (/?, Θ) в прямую ((-l)*/M + a-ft7r)f (7.5) где k — такое целое число, что 0^θ + α-1ζπ<π. Увидеть, что это преобразование сохраняет площадь, немного сложнее, поскольку k зависит от Θ. Однако при фиксированном а число k принимает не более двух значений, так что любое множество можно разбить на два подмножества, каждое из которых под действием этого преобразования совершает поворот. Поэтому преобразование (7.5) тоже сохраняет площадь, а значит, и меру μχ. Мы оставляем читателю проверку того, что мера μχ сохраняется и при отражениях, так что она инвариантна относительно всех евклидовых движений. Таким образом, если поле прямых П' получено из однородного пуассоновского поля прямых Π евклидовым движением плоскости, то по теореме об отображении П' — однородное пуассоновское поле прямых той же интенсивности. Нетрудно показать, что меры μχ при А ^ 0 — единственные меры, удовлетворяющие этому свойству инвариантности; мы еще вернемся к этому факту в §7.4. Некоторые вычисления для однородных пуассоновских полей почти очевидным образом следуют из определения. Предположим, например, что нас интересует число N прямых из случайного набора П, которые пересекаются с Д-· Это есть число «точек», попадающих в соответствующее подмножество А множества S, поэтому оно имеет распределение Пуассона со средним μχ{Α), Так как А — {(ρ,θ): \ρ\ < г}, отсюда следует, что μ\(Α) === 2Аг, так что N имеет распределение V(2Xr). Более общим образом, число N прямых, пересекающих ограниченное множество В с R2, имеет распределение ν{μ), где μ = \§άράθ (7.6) и интеграл берется по всем (р, 0), для которых соответствующая прямая пересекается с В. Это рассуждение можно обобщить; например, число прямых, пересекающих каждое из двух ограниченных множеств, имеет распределение ν(μ), где μ задается формулой (7.6) для подходящей области интегрирования. Вся трудность заключается в вычислении интеграла (7.6) и, таким образом, носит геометрический, а не вероятностный характер. Значительно более трудны вопросы, связанные с геометрией двух и более прямых из случайного набора. Например, точки пересечения всех пар прямых из Π заведомо не образуют пуассоновского процесса
100 Плава 7. Стохастическая геометрия (действительно, пуассоновский процесс в Ш2 с вероятностью единица не содержит трех точек, лежащих на одной прямой). Стохастическая структура этого точечного процесса очень сложна, но есть еще более тонкие геометрические вопросы, связанные со случайным набором прямых. Например, прямые однородного пуассоновского поля Π разбивают плоскость на непересекающиеся многоугольники; какую долю из них составляют треугольники, четырехугольники, пятиугольники и так далее? На эти вопросы имеются ответы, и прежде всего здесь следует отметить работы Майлза [31]. Чтобы заинтриговать читателя, приведем только один результат: среднее число сторон этих случайных многоугольников равно 4. § 7.3. Поля прямых Кокса Как и в случае точечных процессов, имеются более общие модели процессов на пространствах прямых, чем пуассоновские. Один из наиболее полезных классов — это процессы Кокса, которые определяются точно так же, как в гл. 6. Таким образом, Π — поле прямых Кокса, если существует такая случайная мера μ на множестве S прямых, что при фиксированной мере μ случайное множество Π есть пуассоновское поле с мерой интенсивности μ. В важной серии работ (которые собраны в [20]), написанных незадолго до своей ранней кончины, Ролло Дэвидсон исследовал свойства пуассоновских и коксовских полей прямых, инвариантных относительно всех параллельных переносов плоскости. При построении инвариантных полей, не являющихся полями Кокса, он столкнулся с неожиданными трудностями, и те примеры, которые ему удалось построить, были либо патологическими, либо вырожденными в том смысле, что с положительной вероятностью поля содержали пары параллельных прямых. Ясно, что поля прямых Кокса гораздо ближе к тому, чтобы исчерпывать все (инвариантные) поля прямых, чем в случае точечных процессов. Дэвидсон высказал гипотезу, что любое инвариантное поле прямых с конечным средним квадратом (считающих функций на ограниченных множествах), не содержащее параллельных прямых, является полем Кокса. Эта гипотеза неверна, но для ее опровержения потребовалась очень хитроумная конструкция Калленберга (см. [23]), причем сама эта конструкция является вырожденной в некотором более тонком смысле. Таким образом, в этом вопросе еще остается загадка, которая, по всей видимости, любопытным образом связана с понятиями транзитивности для различных групп преобразований. Возможно, читателю будет
§7.4. Более общие геометрические объекты 101 интересно ознакомиться со статьей Калленберга и цитируемой в ней литературой. §7.4. Более общие геометрические объекты Из рассмотрения частного случая прямых на плоскости ясно, что построение общей теории геометрических пуассоновских процессов должно включать ряд последовательных шагов. Сначала мы должны описать множество S интересующих нас объектов. Если они могут быть описаны гладким образом при помощи конечного числа параметров, то S будет многообразием некоторой размерности Z), не обязательно совпадающей с размерностью пространства, в котором находятся объекты. Параметризация может иметь разрывы, связанные с топологическими свойствами множества S, а многообразие может иметь границу, но эти особенности скажутся на вероятностных вычислениях, только если они затрагивают множество положительной меры. Затем пуассоновское поле объектов множества S определяется как случайное подмножество Π в S, удовлетворяющее свойствам независимости и пуассоновости распределений, сформулированным в §2.1. Такое поле полностью задается своей мерой интенсивности μ, так что нам нужны удобные средства для работы с мерами μ на многообразии S. Типичные вероятности будут получаться из выкладок с пуассоновскими распределениями, и для проведения этих выкладок нужно уметь вычислять средние значения μ(Α) для множеств Л, соответствующих различным геометрическим свойствам. Таким образом, мы должны уметь формулировать интересные геометрические свойства в терминах параметризации многообразия S, а затем вычислять полученные интегралы. Однако иногда можно избежать явного вычисления интегралов, например, применяя соображения симметрии, и тем самым обойтись без использования параметризации. Эти вопросы являются предметом интегральной геометрии, или геометрической теории вероятностей. Были разработаны (прежде всего Морганом Крофтоном) искусные приемы, позволяющие избежать вычисления сложных кратных интегралов, и это привело к удивительным и красивым результатам. Центральным понятием здесь является понятие инвариантности относительно группы преобразований базового пространства. Эти преобразования индуцируют преобразования многообразия S, которые в свою очередь образуют группу G, действующую на S. В типичных случаях G является топологической группой, транзитивно действующей на S (что
102 Глава 7. Стохастическая геометрия означает, что любую точку множества S можно отобразить в любую другую точку при помощи некоторого элемента группы G), т.е. S является однородным пространством для G. При этих условиях имеются очень общие теоремы, гарантирующие существование проективно инвариантной меры на S, т. е. меры μ, которая под действием произвольного элемента g группы G переходит в меру c(g)μy кратную μ. Такая мера μ определена однозначно с точностью до постоянного множителя, и тем самым она является естественной мерой на S, если мы рассматриваем группу преобразований G. В общем случае неверно, что эта мера инвариантна (т. е. c(g) = 1 для всех g). Например, если S = Rd и группа G состоит из всех несингулярных аффинных преобразований, то μ есть мера Лебега и коэффициент c(g) равен определителю преобразования g~l. В этом случае может не быть непустого пуассоновского процесса, инвариантного относительно G. Это признак того, что группа G слишком велика, и более естественной группой преобразований может оказаться подгруппа {geG:c(g) = \}. Если мера μ инвариантна, то пуассоновское поле, мера интенсивности которого кратна μ, инвариантно относительно G и может быть названо однородным пуассоновским полем объектов из S. Крофтоновские приемы для вычисления μ(Α) особенно действенны, когда мера μ инвариантна относительно подходящей группы. Читатель, желающий углубиться в эти вопросы, найдет изложение общей теории в книгах [34] или [39]; последняя содержит больше примеров. Более доступное изложение простых случаев может быть найдено в книге [25]. Рекомендуем также прочитать статью Крофтона «Вероятность» в девятом издании Британской энциклопедии.
Глава 8 Случайные меры с независимыми значениями §8.1. Каноническое представление Если Π — пуассоновский процесс на пространстве S, то считающая функция ЩА) = Ф{ППА) (8.1) есть случайная мера на S, так как для непересекающихся множеств Aj С S выполняется равенство (оо \ оо / = 1 / /=1 Кроме того, эта мера обладает очень специальным дополнительным свойством: случайные слагаемые в правой части формулы (8.2) — независимые случайные величины. Это наводит на мысль ввести понятие случайной меры с независимыми значениями. Случайная мера с независимыми значениями на пространстве S есть случайная функция Ф, отображающая измеримые подмножества пространства S в [0, оо], такая, что для любого набора непересекающихся измеримых множеств А\, Л2, Л3,... случайные величины Ф(Л/) независимы и (оо \ оо Во избежание патологий мы будем предполагать, что выполнены стандартные условия: диагональ (2.2) измерима и Ф(0) = 0. Считающая функция пуассоновского процесса является случайной мерой с независимыми значениями, которая обладает дополнительным свойством: ее значения — целые числа. Отбрасывая это дополнительное условие, можно получить гораздо более широкое разнообразие случайных мер с независимыми значениями, но, оказывается, в некотором смысле, который будет уточнен позже, все они происходят из пуассоыов- ских процессов.
104 Глава 8. Случайные меры с независимыми значениями Для начала заметим, что для любой случайной меры Φ с независимыми значениями можно повторить рассуждения, приведенные после формулы (2.4) в §2.1. Следовательно, если известны распределения случайных величин Ф(А) для всех А С S, то тем самым заданы совместные распределения случайных величин Ф(Л7), / = 1,2,..., л, где множества Af могут пересекаться. Удобно описывать эти распределения при помощи функции А/И) = -1пЕ{е-/ФИ)}, (8.4) заданной при t > 0. Ясно, что 0 < А/(Л) < оо и (для некоторого и, следовательно, для всех t > 0) \t(Л) = 0 тогда и только тогда, когда Р{Ф(Л) = 0} = 1, (8.5) Xt(А) = оо тогда и только тогда, когда Р{Ф(Л) = оо} = 1. (8.6) Если множества Af не пересекаются, то из равенства (8.3) и независимости следует, что :Е<ехр -'Е*И/> /=1 оо = ЕЩ ехр[-/Ф(Л7·)] \ = Ц ехр{-А,(Л,·)}, откуда мы получаем равенство (оо \ оо /=1 / / = 1 Так как λ/(0) = 0, функция λ/ является мерой на S при любом £ > 0. В силу условия (8.5) меры Xt взаимно абсолютно непрерывны, а из условия (8.6) следует, что все меры λ/ конечны или бесконечны одновременно. •Наложим теперь еще одно ограничение, потребовав, чтобы мера Xt (для некоторого и, следовательно, для всех t > 0) была σ-конечной. Ввиду условия (8.6) это условие означает наличие такого счетного разбиения U ^ /=1
§8.1. Каноническое представление 105 пространства S, что случайная величина <J>(S7·) конечна с положительной вероятностью. Это условие не эквивалентно σ-конечности меры Φ с вероятностью единица. Если оно выполнено, мы будем говорить, что случайная мера Φ является Σ-конечной. Если мера Φ является Σ-конечной, то все меры Xt имеют одни и те же атомы, которые называются неподвижными атомами случайной меры Ф. Таким образом, точка χ является неподвижным атомом случайной меры Φ с независимыми значениями тогда и только тогда, когда Р{Ф({*})>0}>0. (8.8) Неподвижные атомы образуют не более чем счетное подмножество {αϊ, α2,...}; обозначим через So его дополнение в S. Нетрудно убедиться, что ограничение Фо меры Φ на So есть случайная мера с независимыми значениями без неподвижных атомов, причем она не зависит от независимых случайных величин Ф({а,·}), / = 1,2,.... Таким образом, от неподвижных атомов легко избавиться, и предположение о том, что Σ-конечная случайная мера с независимыми значениями не имеет неподвижных атомов и. следовательно, все меры λ/ являются неатомическими, не ведет к потере общности. Пусть А с S и / = Х\(А) < оо. Известный результат (частный случай теоремы Ляпунова, см. [19, с. 174]) гарантирует существование такого разбиения Anh / = 1,2 η, множества Л, что Х\(Ап/) = 1/п. Таким образом, Е{е-ф{Л"1)] =е~1/пу откуда следует, что при любом с > 0 выполняется неравенство 1 - е-Чп Р{ФИя/)^К \_е-с , причем выражение в правой части стремится к нулю равномерно по / при η —► оо. Поскольку η Ф(Л) = ^Ф(ЛЛ/) и слагаемые в этой сумме независимы, случайная величина Ф(Л) безгранично делима (см. [14]).
106 Глава 8. Случайные меры с независимыми значениями В случае положительных величин типа Ф(А) представление Леви— Хинчина для безгранично делимых величин имеет специальный вид Е{е-*ф{Л)} = ехр /- β(Α)ί + $ (1 - e~tz)j(Ay dz)\, t > 0, (8.9) Ι (Ο,οο] J где β ^ 0 и η(Α, ·) — меРа на (Ο,οο], для которой интеграл в правой части формулы (8.9) сходится. Следовательно, λ/И) = β(Α)ί + $ (1 - e-'zhH, <fe), (8.10) (Ο,οο] причем формула (8.10) однозначно определяет β(Α) и η(Α, ·) в терминах мер λ/(Л), t > 0. Подставляя выражение (8.10) для λ/ в равенство (8.7) и пользуясь единственностью представления (8.10), мы видим, что (оо \ со 7Щ^· =Σ^·)· (8Л2> Таким образом, мы получаем формулы для распределений наиболее общей Σ-конечной случайной меры с независимыми значениями без неподвижных атомов; эти распределения задаются формулами (8.9) и (8.10), где β — мера на пространстве S, а η — функция двух множеств, такая, что 1) при фиксированном А С S функция множества η(Α, ·) есть мера на (0, оо], 2) при фиксированном В С (0, оо] функция множества 7(·, В) есть мера на S. Обе меры β и η должны быть неатомическими на S; кроме того, мера 7 должна быть такой, чтобы интеграл в формуле (8.10) сходился для некоторого и, следовательно, для всех / > 0, по крайней мере на множествах S/. Для полноты картины нам необходим обратный результат, показывающий, как построить случайную меру с независимыми значениями по β и 7- Эта конструкция, демонстрирующая тесную связь между случайными мерами с независимыми значениями и пуассоновскими процессами, будет предъявлена в следующем параграфе.
§8.2. Построение случайной меры с независимыми значениями 107 §8.2. Построение случайной меры с независимыми значениями по пуассоновскому процессу Имеется очевидное сходство между равенством (8.9) и теоремой Кэм- пбелла, особенно в той ее версии, которая приведена в §5.3, и это сходство является ключом к построению случайной меры с независимыми значениями по параметрам β и 7, удовлетворяющим условиям, описанным в предыдущем параграфе. Забудем на минуту про β и сосредоточимся на 7, функции двух множеств А С S и В С (0, со], которая является мерой по каждому из аргументов, если фиксировать другой аргумент. Предположим для начала, что мера, заданная на пространстве S формулой /х(Л)=7И,(0,оо]), (8.13) σ-конечна. При ζ > 0 мера μζ(Α)=Ί(Α,(0,ζ}) (8.14) абсолютно непрерывна относительно меры μ и, следовательно, имеет производную Радона—Никодима F(x, ζ) по этой мере: μζ(Α) = ^(χ,ζ)μ(άχ). (8.15) л Важно помнить, что формула (8.15) задает функцию F(-, z) только почти всюду для каждого фиксированного г; стандартное рассуждение (см. [14]) показывает, что можно выбрать версию этой функции для каждого рационального г, а затем продолжить ее на произвольные значения ζ по непрерывности справа так, чтобы при каждом χ функция F(xy z) являлась функцией распределения случайной величины со значениями в (0, со]. Теперь мы можем задать меру на пространстве S* =Sx (Ο,οο] (8.16) формулой μ*(А*) = §dF(x, ζ)μ(άχ), (8.17) Λ* где dF обозначает меру Стилтьеса относительно ζ. Если Л* = А х В, эта формула принимает вид μ*{Α χ В) = ^dF(x9 ζ)μ(άχ) = \άη{Α, (0, ζ]) = Ί(Α, Β). ΛΒ Β В общем случае мера (8.13) не будет σ-конечной; однако мера η должна удовлетворять условию $(i-<Tzft(S/,dz)<oo,
108 Глава 8. Случайные меры с независимыми значениями откуда следует, что 7(5/, (ε, сю]) < сю для любого ε > 0. Следовательно, мера >№-O4iTT-i]) является σ-конечной, и оо Применяя то же рассуждение к мере μ^ и суммируя по &, мы видим, что в общем случае существует такая мера μ* на S*, что μ*(Α хв)=7(ДА) (8.18) для любых А С S, θ С (0, сю]. Пусть теперь П* — пуассоновский процесс на пространстве S* с мерой интенсивности μ*; положим Ф(Л) = ]Г{г: (х,г)еТГ, χ е А}. (8.19) Тогда Φ является чисто атомической мерой на S, атомы которой соответствуют точкам процесса П*: если (χ,ζ)—точка из П*, то Φ имеет атом веса ζ в точке х. Ясно, что значения меры Φ на непересекающихся множествах независимы, так что Φ — случайная мера с независимыми значениями. Ее распределения легко вычислить по теореме Кэмпбелла; при t > 0 мы имеем E{e-^iA)} = expi-^ $ 0 " β~ίζ)μ*(άχάζ) Ι Α (Ο,οο] = exp/- 5 (1 -е-и)ч(А,аг)\. (8.20) Ι (Ο,οο] J Сравнивая формулы (8.20) и (8.9), мы видим, что случайная величина Ф(А) имеет то же распределение, что β (А) + Ф(Л). Иными словами, описанная конструкция позволяет построить наиболее общую Σ-конечную случайную меру с независимыми значениями без неподвижных атомов в виде суммы детерминированной меры β и чисто атомической меры Ф, полученной при помощи формулы (8.19) из пуассоновского процесса на пространстве S*. Добавляя исключенные из рассмотрения атомы, мы видим, что любая Σ-конечная случайная мера с независимыми значениями имеет такую же стохастическую структуру, как сумма детерминированной и чисто атомической меры. Описанная конструкция меры Φ показывает, что случайная мера с независимыми значениями по существу получается из маркированного ■
§ 8.3. Доказательство Блэкуэлла 109 пуассоновского процесса. Но это не совсем так, потому что проекция μ меры μ* на пространство S не обязана быть σ-конечной. В следующей главе нам встретится очень важная Σ-конечная случайная мера с независимыми значениями, у которой μ(Α) = оо для всех множеств А положительной меры. §8.3. Доказательство Блэкуэлла В предыдущем параграфе мы обнаружили замечательное свойство (Σ-конечных) случайных мер с независимыми значениями: с точностью до детерминированной компоненты β такая мера имеет то же распределение, что и некоторая чисто атомическая мера Ф. Однако мы не доказали, что при β — 0 мера Φ является чисто атомической с вероятностью единица. Это гораздо более глубокий вопрос, который в частном случае (а именно, в случае гамма-процесса, рассмотренном в гл. 9) был исследован Блэкуэллом в работе [5]. Доказательство Блэкуэлла можно распространить на достаточно широкий класс случайных мер с независимыми значениями. Блэкуэлл предполагает (ср. §3.4), что множество S является бо- релевским подмножеством некоторого полного сепарабельного метрического пространства. Это более сильное предположение, чем в §2.1, но оно выполнено для всех встречавшихся нам пространств, в частности для геометрических многообразий из гл. 7. Смысл этого предположения в том, что из него следует существование последовательности В\, f$2, Β$,... измеримых подмножеств в S, которая является разделяющей, что означает, что для любых различных Х\,Х2 € S существует такое значение я, что множество Вп содержит ровно одну из точек х\, χ<χ. Таким образом, каждую точку χ е S можно отождествить с последовательностью (ξι, ξ2,.. .)> где ίΐ, если χ еВп, ξη = ξη(χ) = L· 10 иначе. Более формально, функция ξ:*~(ξ,(*),ξ2(*),...) (8.21) есть инъекция множества S в пространство {0, 1}°° бесконечных последовательностей из нулей и единиц. Мы будем отождествлять χ и ξ(χ) и обозначать через *л = (ξι (*),&(*),...,&(*)) (8.22)
110 Глава 8. Случайные меры с независимыми значениями начальный отрезок последовательности ξ. Для любой конечной последовательности нулей и единиц σ = (ει,ε2,...,εη) (8.23) обозначим через (σ) подмножество (a) = {xeS:xn=a}. (8.24) Пусть теперь Φ — случайная мера на S, для которой Р{Ф(5)<оо}< 1. (8.25) Блэкуэлл говорит, что точка χ £ S согласована с Φ на уровне η -f l, если ξη+ι(χ) = 1 тогда и только тогда, когда Ф{хп\) >Ф(х«0) (8.26) (здесь через хп\ обозначена последовательность длины п+ 1, полученная добавлением единицы в конец последовательности хп, а скобки после Φ опущены для ясности); точка χ предельно согласована с Ф, если она согласована с Φ на всех уровнях за исключением конечного числа. Очевидно, что для любой случайной меры Φ множество точек, предельно согласованных с Ф, есть счетное случайное множество А. Если удастся доказать, что Р{Ф(Л) = Ф(5)}= 1, (8.27) то из этого будет следовать, что Φ — чисто атомическая мера, все атомы которой лежат в множестве А. Чтобы доказать равенство (8.27), предположим, что X—случайная величина со значениями в S, условное распределение которой при фиксированном Φ есть Ф(-)/Ф(5). Тогда равенство (8.27) равносильно равенству Р{* еА}= 1, (8.28) означающему, что почти наверняка X предельно согласована с Ф. Условная вероятность того, что X не согласована с Φ на уровне η + 1, при фиксированных Хп и Φ равна wn = min < .Λ /, .Λ / >. (8.29) Ι Φ(χη) Φ{χη) ) Безусловная вероятность этого события равна E{wn}f и, следовательно, равенство (8.28) следует из леммы Бореля—Кантелли, если оо ^Е{ау„}<оо. (8.30) п=0
§ 8.3. Доказательство Блэкуэлла 111 Но E{wn) = E| £ ^min [^, ^J | = = Ε J ]T min [φ(σ1>> Φ(σ0)]/Φ(5)1, (8.31) где сумма берется по всем последовательностям (8.23) длины п. В частном случае, который рассматривал Блэкуэлл, можно было оценить выражение (8.31) при помощи явных вычислений и вывести неравенство (8.30). Для более общих случайных мер Φ удобнее действовать несколько иначе. Предположим, что Φ — случайная мера с независимыми значениями, для которой детерминированная компонента β равна нулю, и усилим предположение (8.25) следующим образом: Е{Ф(5) <оо}. (8.32) Лемма Бореля—Кантелли будет по-прежнему применима (за исключением случая Ф(Б) = 0, когда результат тривиален), если удастся доказать, что оо 5^Е{шяФ(5)}<оо. (8.33) /2=1 Из равенства (8.31) следует, что Ε{^Φ(5)} = Ε|^Γηίη[Φ(σ1),Φ(σ0)]\. (8.34) Конструкция из §8.2 позволяет построить по пуассоновскому процессу П* на пространстве S* чисто атомическую меру Ф, такую, что Φ и Φ имеют одинаковые совместные распределения. Применяя эту конструкцию дважды, мы можем построить две независимые чисто атомические меры Φι и Ф2, имеющие те же распределения, что и Ф. Поскольку случайные величины Φ(σ1) и Φ(σΟ) независимы, E{min [Φ(σ1), Φ(σΟ)]} = E{min [Φι(σΐ), Φ2(σ0)]} ^ ^Е{ггпп[Ф,(а),Ф2(а)]}. Следовательно, Ε{^Φ(5)}<Ε|^Γηίη[Φ,(σ),Φ2(σ)]|. (8.35) Правую часть этого неравенства можно интерпретировать следующим образом. Пусть мы хотим вычислить Τ = ΦιΛΦ2, (8.36)
112 Глава 8. Случайные меры с независимыми значениями наибольшую меру на S, не превосходящую Φι и Фг. Это можно сделать так. Рассмотрим ограничения мер Φι и Фг на конечную σ-алгебру ВПу порожденную множествами В\, Β<ι,..., Вп, и будем брать меньшее из значений Φι и Фг на элементарных множествах этой σ-алгебры. Это даст меру ТПу которая убывает к Τ при η —* оо. Элементарные множества, порожденные множествами В\, £2, · · ·, Вп,— это в точности множества (σ), так что Tn(S) = 5Zmin[*1<a>f*2(a>]. σ Таким образом, из неравенства (8.35) следует, что E{^(S)KE{T„(S)}, (8.37) причем правая часть убывает по η к предельному значению E{T(S)}. Однако меры Φι и Φ 2 строятся по независимым пуассоновским процессам П* и Щу и множества их атомов образуют независимые пуас- соновские процессы на S. По лемме о дизъюнктности эти множества с вероятностью единица не пересекаются, поэтому никакая ненулевая мера не может быть меньше Φι и Ф2 одновременно. Таким образом, T(S) = 0 почти наверное, и из неравенства (8.37) следует, что Е{и;яФ(5)}->0. (8.38) Осталось выяснить единственный вопрос: достаточно ли эта сходимость быстрая, чтобы обеспечить выполнение неравенства (8.33)? Вычисления, необходимые для доказательства неравенства (8.33), по- видимому, сложны и требуют наложения дополнительных условий на распределения случайной меры Ф. Например, мы можем использовать неравенство Ε{Γηίη[Φι(σ),Φ2(σ)]} < Ε{Φι(σ)1/2Φ2(σ)1/2} = {Ε[Φ(σ)1/2]}2 и оценку Ε[Φ(σ)1/2] = ε[]Γ{ζ: (χ, ζ) е Π*, χ е (σ)}] ^ < < Ε^Ιζ'/2: (χ, ζ) е Π*, χ е (σ)}] = ^27((a)y dz), при условии, что мера р(А)= $ ζ^Α,άζ) (8.39) (Ο,οο) конечна на S. В этом случае левая часть формулы (8.38) не превосходит Σρ(σ)\ (8.40)
§8.4. Субординаторы 113 т.е. квадратической вариации меры ρ на Вп. Эта квадратическая вариация всегда стремится к нулю, причем достаточно быстро, если выбрать множества Вп подходящим образом. Лучше всего разбить пространство S на множества равной меры р; в этом случае ρ(σ) = p(S)/2n для всех последовательностей σ длины η и квадратическая вариация (8.40) равна 2"я, так что доказательство Блэкуэлла работает. Следует отметить, что приведенные достаточные условия, по всей видимости, далеки от необходимых и, возможно, существуют гораздо более мощные методы доказательства того, что большие семейства случайных мер с независимыми значениями (с β = 0) являются чисто атомическими с вероятностью единица. §8.4. Субординаторы Теперь мы посмотрим, как можно уточнить общую теорию в одномерном случае. Случайная мера Φ с независимыми значениями на Е, конечная на ограниченных множествах, задает случайный процесс в обычном смысле, т.е. случайную функцию φ: Ε —* Ε, определяемую формулой *№ = { *ίΜ· '*°· (8.41) Ясно, что функция φ возрастает и непрерывна справа и что она однозначно определяет случайную меру Ф. Из независимости значений меры Φ на конечных множествах следует, что процесс φ имеет независимые приращения, т.е. при t\ < t2 < .. · < tn приращения p(fr+i)-p(/r), г= 1,2 я- 1, (8.42) суть независимые случайные величины. Кроме того, они положительны, так что теория случайных мер с независимыми значениями па R (комеч ных на ограниченных множествах) тесно связана с теорией случ.шпы.ч процессов с положительными независимыми приращениями. В частности, мы немедленно получаем, что каждый τ,ίκοιΊ ιιμηικτι представим в виде суммы трех таких процессов, один n.t κηιημι.ιχ uiwm ется детерминированной возрастающей функцией, тором сен. iviyiiiiliimi функция, возрастающая лишь в некоторых фиксиромлпмы.ч ючкп.н |им рыва, а третий (представляющий интерес) получ.кчш и ι nym гиншн кит процесса на полуплоскости S* = {(χ, ζ): ζ > 0} по формула У"{z: (xyz)eU\ 0-- .ν /}, t - О, φ(ί)={ ~ (Μ-Μ) -V{z: (χ, ζ) G II*, / - λ * ()}. / - 0
114 Глава 8. Случайные меры с независимыми значениями Наиболее важен случай, когда распределение типичного приращения <p(t)-<p(s), s<t> зависит только от разности t - s. Процесс с положительными независимыми приращениями, обладающий этим свойством, называется субординатором; такие процессы встречаются во многих областях теории вероятностей и ее приложений. Субординатор не может иметь неподвижных точек разрыва, поскольку множество точек разрыва счетно и, следовательно, не может быть инвариантным относительно сдвигов. По аналогичным соображениям детерминированная компонента субординатора может быть только функцией, кратной t с постоянным множителем. Таким образом, при t ^ О субординатор можно представить в виде φν) = βί + Σ{ζ: (χ,ζ)€ΐΓ, 0 <*</}, (8.44) где β — константа, а П* — пуассоновский процесс на S*, который в этом случае должен быть инвариантным относительно сдвигов, параллельных оси х. Поэтому мера интенсивности μ* процесса П* должна иметь вид μ*(άχάζ) = dx-y{dz), (8.45) где 7 — мера на (0, оо), такая, что 5(1 - e~z)j(dz) < оо. (8.46) В частности, из формулы (8.9) следует, что E{e-eMO-*<s)]} = expi_f βθ+ I (\-e-ezh(dz) (Ο,οο) (8.47) Атомы случайной меры Φ соответствуют скачкам функции φ. Эти скачки функция совершает в точках проекции Π процесса П* на ось ху которые (по теорему об отображении) образуют пуассоновский процесс постоянной интенсивности 7(0, оо). Заметим, однако, что условие (8.46) не исключает возможности, что значение 7(0, оо) бесконечно, и в этом случае скачки процесса Π образуют плотное множество. Но если рассматривать только скачки, высота которых больше, чем некоторое δ > 0, то они образуют однородный пуассоновский процесс постоянной интенсивности 7(<S, оо). Одна из самых важных задач, приводящих к субординаторам, связана с теорией броуновского движения и более общих диффузионных процессов. Пусть, например, W{t), t > 0,
§8.4. Субординаторы 115 — простое броуновское движение, т. е. процесс с независимыми (положительными и отрицательными) приращениями, для которого случайная величина W(t) — W(s) при s < t имеет нормальное распределение с нулевым средним и дисперсией t — s. Можно выбрать (и мы это сделаем) версию этого процесса, которая является непрерывной функцией от t. Множество нулей С = {t^ 0: W(t) = Щ0) = 0} (8.48) есть случайное замкнутое множество очень сложной структуры. С вероятностью единица оно несчетно, но имеет нулевую меру, так что нельзя говорить ни о «числе посещений начала координат», ни о «полном времени, проведенном процессом в начале координат». Однако оказывается, что существует процесс L(t), который в некотором обобщенном смысле измеряет время, проводимое процессом W «в окрестности» начала координат вплоть до момента времени t. Функция L, как функция от t, является возрастающей, но она возрастает только на множестве £. Точнее, функция L постоянна на каждом из интервалов, которые составляют дополнение замкнутого множества £. Эти интервалы можно рассматривать как экскурсии процесса W. Функция L непрерывна и стремится к бесконечности при t —> оо, поэтому у нее существует непрерывная справа обратная функция φ. Оказывается, φ является субординатором, и С есть замыкание множества его значений. Экскурсии процесса W соответствуют скачкам функции φ. Поскольку эти скачки в свою очередь соответствуют точкам процесса П*, вся структура множества С может быть описана в терминах субординатора φ и, следовательно, процесса П*. Оказывается, мера η задается формулой Ί{άζ) = z-V2dzy (8.49) с точностью до произвольной константы в определении локального времени L. Заметим, что 7(0, оо) = оо. Доказательства утверждений последних нескольких параграфов и многие другие факты могут быть найдены в книгах [43] или [22]. Приведенное рассуждение применимо не только к броуновскому движению, но также (с разными мерами 7) ко многим марковским процессам с непрерывным временем. Локальное время может быть восстановлено по £ и 7 при помощи простой процедуры, нетривиальным образом использующей усиленный закон больших чисел из §4.5 (см. [28]).
Глава 9 Распределение Пуассона—Дирихле § 9.1. Распределение Дирихле Часто приходится рассматривать случайные векторы Ρ = (Ρι, Ρ2,---,Ρη), (9.1) которые образуют дискретное вероятностное распределение, т. е. удовлетворяют соотношениям η ρ,^Ο, / = 1,2,..., л, Σ>/ = 1. (9.2) /=1 Например, р} может задавать долю /-го из η возможных видов в биологической популяции. Случайные вероятностные векторы этого типа также часто возникают при байесовском подходе к статистике. Простейшим нетривиальным примером вероятностного распределения на симплексе Ап векторов, удовлетворяющих условиям (9.2), является распределение Дирихле Т>(а\у аг» · ··, <*п), плотность которого (относительно (п— 1)-мерной лебеговой меры на Ап) задается формулой ΚΡι'Ρ* Pn)= Γ(α,>Γ(α2)...ΓΜΡ' P* PS ■ (9-3) Параметры af могут принимать любые строго положительные значения, причем характер распределения существенно зависит от этих параметров. Если а} = 1 при всех /, то мы имеем равномерное распределение на симплексе Ап. При больших значениях а} распределение (9.3) сосредоточено далеко от границ симплекса, что соответствует более или менее равномерным дискретным распределениям р. С другой стороны, при малых значениях а} распределение Дирихле сосредоточено вблизи от границ симплекса, что соответствует крайне неравномерным распределениям р, у которых несколько р} велики, а остальные малы. В частности, если все af равны некоторому малому значению а, то из соображений симметрии все pf будут иметь одинаковое математическое ожидание 1/я, однако велика вероятность того, что по крайней мере одно из pj будет значительно больше среднего; для какого или каких
§9.1. Распределение Дирихле 117 именно / значение pj будут велико — исключительно дело случая. В §9.3 мы докажем предельный результат, который придаст этому утверждению точный смысл. Пользоваться непосредственно формулой (9.3) трудно из-за линейной зависимости компонент pj. Давно известно, что гораздо удобнее описывать распределение Дирихле в терминах независимых гамма-величин. Пусть ^ι, ^2, ..., К„ — независимые положительные случайные величины, причем Yj имеет плотность распределения иа-\ -у g*{y) = 4u~' у>0' (9·4) где а = аг Пусть Υ — Υ\ + ^2 + · ·. + Υ η, нетрудно убедиться, что вектор ρ с компонентами Р1 = Ц (9.5) имеет распределение Т>(а\, с*2, · · ·, <хп) и не зависит от Υ. Доказательство состоит в прямом вычислении с использованием замены переменных, осуществляемой при помощи функции, действующей из W1 в Шп и задаваемой формулой (У1.У2 ^л) ~ (Κ,ρ,,^,.-.,^-ι); подробности мы оставляем читателю. Как следствие этого вычисления мы получаем, что случайная величина Υ тоже имеет распределение (9.4) с параметром а = αϊ + α2 + ... + ап. Другой способ доказать это состоит в использовании преобразования Лапласа оо . SSa(y)e-eydy = jr^, θ>-1, (9.6) которое показывает также, что гамма-распределение G(a), задаваемое формулой (9.4), безгранично делимо и имеет представление Леви—Хин- чина ^^ =ехр|-аf(l -β-θ*)ζ-ιβ-4ζ}. (9.7) Представлению (9.7) соответствует субординатор, известный как гамма- процесс Морана; он использовался Мораном в его пионерских работах по теории водохранилищ (см. [32]) 1\ Этот процесс задается конструкцией из §8.4 с параметрами /3-0, i(dz)=z-xe-*dz\ (9.8) ^Подробнее о гамма-процессе см. в прим. ред. в §9.4. — Прим ред.
118 Плава 9. Распределение Пуассона—Дирихле при этом приращение φ(ί) — <р(5) имеет распределение Q(t —s). Заметим, что оо 7(0, оо) = ^ z~xe~zdz — оо, о так что скачки процесса φ всюду плотны. При αϊ, OL2,.. ·, ot-n > 0 положим t0 -0, t} =а\ +α2 + ... + α7·, 1</<я. (9.9) Тогда случайная величина Y} = (p(tj)—(p(tj-\) имеет распределение Я(а}), причем все величины Υ·{ независимы. Так как Y = Yl+Y2 + .-. + Yn=<p(tn), мы видим, что формула (9.1), в которой задает случайный вектор из Ап с распределением Т>(а\у а^,..., ап). Как мы увидим в §9.3, это представление является мощным инструментом для изучения распределения Дирихле Т>(а\у (*2,..., ап) и вычислений с ним в случае, когда η велико, a af малы. §9.2. Процесс Дирихле Согласно результатам § 8.4, гамма-процесс Морана соответствует случайной мере Φ с независимыми значениями на М, обладающей тем свойством, что случайная величина Ф(А) имеет гамма-распределение G{a), где а — длина (мера Лебега) множества А. Такая формулировка позволяет немедленно обобщить понятие гамма-процесса на более или менее произвольные пространства. Пусть μ — мера на пространстве 5 (произвольном с точностью до выполнения условий из §2.1); применим конструкцию из §8.2 с мерой Ί(Α,Β)=μ(Α)$ζ-ιβ-4ζ. (9.11) в Мы получим пуассоновский процесс П* на S* = S χ (0, оо) с мерой интенсивности, равной произведению меры μ и меры (9.8); при этом формула Ф(А) = 2Jz: (х, г) е Π*, χ е А} (9.12) Σ задает случайную меру Φ с независимыми значениями, для которой Е{е-/ф(Л»} = ехр|- ^μ(Α)(\ - e-tz)z~xe~zdz\ = (1 + 0-μΜ).
§9.3. Распределение Пуассона—Дирихле 119 Таким образом, случайная величина Ф(А) имеет гамма-распределение 0(μ(Α)) для любого множества А конечной меры μ(Α). Пусть А\,А2,...,Ап — непересекающиеся множества, объединение которых равно Л, причем а} = μ(Α}) < оо. (9.13) Тогда случайные величины Υ, = Φ(Α,) (9.14) независимы и имеют распределения G(otj)\ при этом γ = у, + у2 + ... + γη = ф(А). Следовательно, формула (9.5) задает случайный вектор ρ е Ап с распределением Т>(а\, «2» · · ·» ап)- В частности, если мера μ вполне конечна,!) то значение <&(S) конечно с вероятностью единица и формула Т(Л) = Щ (9.15) задает случайную вероятностную меру на S, такую, что для любого разбиения А\, А<±, . ·., Ап множества S совместное распределение случайных величин Т(Л,),Т(Л2),...,Т(Л,) (9.16) есть распределение Дирихле Т>(а\у α<χ,..., ап)у где а} — μ{Α}). Разумеется, элементы последовательности (9.16) не являются независимыми, так что процесс Τ не является случайной мерой с независимыми значениями. Он называется процессом Дирихле, соответствующим мере μ. Доказательство Блэкуэлла, приведенное в §8.3, исходно предназначалось для процесса Дирихле, точнее, для его близкой родственницы— случайной меры с независимыми значениями, задаваемой формулой (9.11). Подробное изложение теории процессов Дирихле и их приложений к байесовской статистике можно найти в работе [17]. §9.3. Распределение Пуассона—Дирихле После экскурса в пространства общего вида вернемся к одномерному случаю, описанному в §9.1. Пусть ρ е Ап — случайный вектор с распределением Т)(а\, #2, · · ·, &п)\ пусть для определенности все а} равны 1)то есть μ(5) < оо.— Прим. перев.
120 Глава 9. Распределение Пуассона—Дирихле некоторому числу а. Из соображений симметрии E(/>y) = i, (9.17) так что при больших η каждая из компонент pj с большой вероятностью мала. Это верно при любом значении а, но при малых а с большой вероятностью значения pf сильно различаются по величине. Вполне может случиться, что некоторые из φ·{ не малы (хотя ясно, что таких значений может быть лишь несколько). Итак, пусть Р{\) > Р{2) > ··· ^ Р(п) (9.18) — компоненты р]у упорядоченные по убыванию. Можно ли что-нибудь сказать о поведении случайной величины р^, или, более общим образом, случайной величины р^, или, еще более общим образом, случайного вектора (р(\), рр), ···, P(k)) с фиксированным k при η —» оо и а —* 0? Ответ на этот вопрос положителен, если только па сходится к некоторому конечному ненулевому пределу λ. Более общим образом, предположим, что формула (9.18) задает упорядоченные по убыванию элементы случайного вектора р^ с распределением Дирихле Т>(а\п\ а^\ ..., а^). Предположим, что при η —* оо тах(а(1л),4л),...,аЙ,>)->0 (9.19) и А<л> = а\п) + af + ... + а{пп) - λ. (9.20) Тогда имеются результаты о предельном поведении величин pW при фиксированном k и η —» оо. Чтобы понять, какими должны быть эти результаты, рассмотрим гамма-процесс φ из §9.1 и положим ρι - ^щ ■ (9·21) Тогда при любом η вектор р^п) = (ру\ · · ·, рп ) имеет то же распределение Дирихле, что и р^п\ а совместное распределение величин р^1 совпадает с аналогичным распределением для pW. Но при условиях (9.19) и (9.20) величины ρ fjl имеют обычный предел при η —* оо для любой реализации гамма-процесса. Пусть J\ ^ fo ^ h ^ · · · — величины скачков процесса φ на отрезке [0, λ], упорядоченные по убыванию. Нетрудно доказать элементарными средствами вещественного анализа, что при
§9.3. Распределение Пуассона—Дирихле 121 ¥>(А(я))/$-W*. (9.22) Отсюда следует, что при каждом k совместное распределение величин ϋ(η) =(п) -(л) Р{1), р{2у ···» P(k) сходится к распределению случайных величин ξι, &» · · ·» ξ*» гДе ь = wv (9·23) и, следовательно, то же верно для величин An) [η) (η) P(\)>P(2)>--->P(k)- Поскольку функция φ возрастает только скачками, оо А=1 откуда следует, что ξι^ξ2^..·, £ξ* = 1. (9.25) Распределение бесконечной случайной последовательности ξ= (ξι, ξ2, ■ · ·)» удовлетворяющей условиям (9.25), зависит только от λ и называется распределением Пуассона—Дирихле VV(X). Итак, мы можем подытожить результат наших рассуждений следующим образом: если η велико, значения aj равномерно малы и сумма а\ -f а2 -f ... + ап близка к λ, то порядковые статистики распределения Дирихле Т>(а\, а2у..., о,,) аппроксимируют порядковые статистики распределения Пуассона—Дирихле VT>(\). Оказывается, что этот результат чрезвычайно важен для ра:шоо6 разных приложений, особенно в популяционной генетике и экологии, Распределение Дирихле является равновесным распределением для ряди эволюционных моделей, причем ситуация, когда значения параметром <\/ малы, а п велико, для этих моделей типична. Рекомендуем .чапитерееп ванному читателю работу [29] 1\ ^Дополнительное исследование показало (см. [3*]), что с порой пик· ι ыо сдпшпш \\о мере Пуассона—Дирихле VV(X) члены ряда убывают кик юомофтитклн провинтим »'<ι знаменателем е~х. Это обстоятельство, в частности, долгим См»лоо тминным шмсчмшн· о неравномерности слагаемых в векторах, распределенных но моро Дирихле (»'м %\\ \) величины членов типичного ряда сильно различаются между соСюп. О арумург nikiix
122 Глава 9. Распределение Пуассона—Дирихле §9.4. Субординатор Морана Распределение Пуассона—Дирихле есть распределение бесконечной последовательности ξ = (ξι, ξ2, · · ·)> удовлетворяющей условиям оо ξΐ >ξ2>ξ3>··., Σ&=1· <9·26) Последовательность с таким распределением можно генерировать при помощи формулы 6 = £$. (9-27) где Jk(^)—размер &-го по величине скачка процесса Морана1) φ на отрезке [0, λ]. Но положения и величины этих скачков образуют пуассо- новский процесс П* на плоскости с мерой интенсивности μ*(άχάζ) = z-]e~zdxdz, z > 0. (9.28) Следовательно, по теореме об отображении величины скачков субординатора Морана на отрезке [0, λ] образуют пуассоновский процесс Щ на (0, оо) с плотностью интенсивности Xz~le~z. (9.29) случайных рядов можно сказать много больше: вычислены совместные распределения членов ряда и, в частности, распределение максимального члена (распределение Дикма- на—Гончарова [1*]) и изучены их свойства, известны распределения отношений соседних членов, центральная предельная теорема и др. Наиболее глубокий факт связывает эти случайные ряды с некоторой однородной марковской цепью, свойства которой и определяют структуру рядов. Многие вопросы здесь еще ждут своего разрешения. —Прим. ред. ^Процесс, который автор называет субординатором Морана, более известен в литературе как гамма-процесс. Это процесс Леви, отвечающий гамма-распределению и обладающий замечательными свойствами. При этом, как следует из описанной конструкции, его свойства определяют свойства мер Пуассона—Дирихле и определяются ими. Наиболее важное из этих свойств — квазиинвариантность меры, отвечающей гамма-процессу, относительно умножения последовательности скачков на положительные функции с конечным интегралом от логарифма (см. [15*, 2*]). Это свойство обобщает классическую харак- теризацию обычного гамма-распределения, данную Лукасом. Пересказ этого свойства в терминах мер Пуассона—Дирихле позволяет получить новые свойства этих мер ([2*]). Но особенно интересно, что существует σ-конечная мера, эквивалентная мере гамма- процесса, которая уже инвариантна относительно тех же операторов. Она была названа лебеговой мерой в бесконечномерном пространстве, и ее существование есть характеристическое свойство мер, отвечающих гамма-процессам ([15*]). Этой σ-конечной мере соответствует мера, родственная VT>(\), которая сосредоточена на конусе сходящихся положительных монотонных рядов с конечной, но не обязательно единичной суммой; эта мера есть произведение меры Пуассона—Дирихле на лебегову меру на положительной полупрямой.—Прим. ред.
§9.4. Субординатор Морана 123 Так как эта плотность не интегрируема в окрестности точки ζ = О, процесс содержит бесконечно много точек с предельной точкой 0. Величины Jk(X) суть точки процесса Ид, упорядоченные по убыванию, и оо <p(X)^Y^Jk(\)<oc. (9.30) k=\ Обращая это рассуждение, мы получаем явное описание распределения Пуассона—Дирихле VV(\) в терминах пуассоновского процесса Πλ с плотностью интенсивности (9.29). Если η\ ^ щ ^ % ^ ··· — точки такого процесса, то (по теореме Кэмпбелла) оо k=\ и формула ί* = ~ (9.32) задает последовательность ξ с распределением W(X). Для облегчения вычислений полезно заметить* что случайные величины ξ и σ независимы, что является прямым следствием независимости величин ρ и У, упоминавшейся в §9.1 (этот факт легко доказать и непосредственно). Из формулы (9.31) следует, что величины ць должны стремиться к нулю достаточно быстро, но усиленный закон больших чисел из §4.5 позволяет получить более точный результат. Применяя соотношение (4.59) к процессу Пд, мы видим, что с вероятностью единица выполняется равенство Нт*{*-%>'> = 1, (9.33) f-*0 L{t) где L(t) = \Xz-{e~zdz ~ -λ In/ при / -> 0. (9.34) Поэтому #{k: щ > t) ~ -A In / при t -> 0, откуда следует, что k - \х\щ ~ τ при k —* оо (9.35) Λ с вероятностью единица. Таким образом, величины щ убывают с экспоненциальной скоростью, как и величины ξ^. в силу равенства (9.32) мы . получаем, что -1п&~£. (9.36)
124 Плава 9. Распределение Пуассона—Дирихле §9.5. Формула выборок Ювенса Поскольку распределение Пуассона—Дирихле W(X) получается из распределения Дирихле, оно часто возникает в моделях, которые описывают разделение большой популяции на большое число различных видов или типов. Бесконечный случайный вектор ξ = (ξι, ξ2, ...) с распределением VV{\) описывает структуру популяции, в которой доля особей k-vo по величине типа равна ξ^. Чтобы проиллюстрировать применение распределения Пуассона— Дирихле, предположим, что из большой популяции произведена случайная выборка размера п. Какова вероятность того, что все элементы выборки имеют один и тот же тип? При фиксированном ξ эта вероятность оо равна Σ ££» так что безусловная вероятность задается формулой Ля = е{х;#|. (9.37) Используя формулу (9.32) и независимость случайных величин ξ и σ, мы получаем, что Ε{έ^}=Ε{σ"£^} =Ε{σ"}Α„. Но случайная величина σ имеет распределение <?(λ), поэтому Е{ап} = ^Щр-, (9.38) откуда по теореме Кэмпбелла следует, что - ^znXz-le-zdz = \(n- 1)!. Таким образом, _ АГ(А)(я-1)! (п-\)\ Г(п + \) (1 + λ)(2 + λ)... (η + λ - 1) * Κυ'°υ} Это очень специальный случай заслуженно знаменитого результата, известного как формула выборок Ювенса. Если выборка размера η не однородна, она может содержать а\ уникальных элементов (т.е. элементов, являющихся единственными представителями своего типа в выборке), α<χ пар элементов одного типа (таких, что выборка не содержит других элементов того же типа), аз троек, а\ четверок и т.д. Набор чисел а\у α<χ,..., удовлетворяющих условиям αϊ, Я2, · · ·, Дл ^ 0, а\ + 2а2 -f ... -f nan = я, (9.40)
§9.5. Формула выборок Ювенса 125 дает наиболее удобный способ описания выборки в случае, если нас не интересует, какие конкретно типы представлены в выборке. Этот набор можно записать в виде разбиения а= \а]2аК..па" (9.41) числа η (размера выборки). Таким образом, а есть случайное разбиение, и можно вычислить его распределение по мере Пуассона—Дирихле W(X). Если обозначить через Рп(а) вероятность того, что структура выборки задается разбиением а, то формула (9.39) описывает эту вероятность в частном случае Рп(п1). Формула Ювенса дает соответствующее выражение для произвольного разбиения а. Чтобы вычислить Рп(&), заметим, что вероятность получить разбиение а при фиксированных частотах ξ^ (которые теперь для удобства будут обозначаться через £(&)) равна где суммирование производится по всем различным ki}, / = 1,2, ...,n; j = 1, 2, ..., α/. Следовательно, Ецхг1р"(а) = πΐΤ^^Σ^11* · · · *ь*мы2 · · ·}. В §3.2 объяснялось, как вычислять математические ожидания сумм подобного рода; из равенства (3.28) следует, что математическое ожидание в правой части равно η ( оо \αι η (оо }αί η Це\ 5>(/0' ^ = Ili S ^λζ-ιβ'4ζ \ = Ц{\и - 1)!}*'. Подставляя это выражение в формулу для вероятности и упрощая, мы получаем равенство '.о-^П(г^)· <»·«> Эта формула была впервые предложена Ювенсом в работе [15]; с тех пор ее справедливость была установлена для многих моделей; подробности см. в [29]. В других контекстах она появлялась и раньше; так, еще
126 Глава 9. Распределение Пуассона—Дирихле Коши показал, что цикловое разбиение случайной перестановки имеет распределение (9.42) с λ = 1]). Заметим, что формулу (9.42) можно записать в терминах пуассонов- ских вероятностей: η Рп(а) = С(пуХ)Цка1(Х/1). (9,43) /=» Таким образом, совместное распределение величин а/ совпадает с условным совместным распределением независимых случайных величин с распределениями V(X/j) при условии (9.40), Необходимость переходить к условным распределениям затрудняет вычисления, но роль этих условий уменьшается с ростом п. Так, в работе [1] было показано, что если случайные величины Z\(n), Ζ<ι(γ\)Ύ..., Ζη(η) имеют совместное распределение (9.42), то при фиксированном N совместное распределение величин Ζ ι (я), Z^(n)t .,., Ζ/ν (я) сходится при η —» ос к совместному распределению независимых случайных величин £ь &,«· ·, &ν с распределениями V(\/j). § 9.6. Стохастическая сортировка Вычисления из последнего параграфа показывают, что с распределением ТЩХ) не слишком-то приятно иметь дело. Поэтому стоит упомянуть другое распределение, более простого вида, из которого можно получить'TRV(X). Эта идея восходит к работе [35}; см. также [13]. Пусть случайный вероятностный вектор Р = (Р\,Р2,.-,Рп) (9.44) имеет симметричное распределение Дирихле Ρ(α, α, ..., а). Пусть ν — случайная величина, принимающая значения 1,2, ...,# и такая, что P{i/ = r | р} = рг, 1<г<а. (9.45) Стандартные вычисления показывают, что вектор р' = {ри, pi,..., /?„_!, /Vh,..., рп) (9.46) ^Элементарная формула Коши описывает число подстановок данного циклового типа, т. е. число подстановок в данном классе сопряженности, и, следовательно, вероятности классов сопряженности относительно равномерной меры (меры Хаара) на симметрической группе. Для общего λ формула (9.42) дает вероятности классов сопряженности относительно т. н. меры Ювенса на симметрической группе, задаваемой следующим образом: вероятность подстановки g пропорциональна λ^, где 1(g)— число циклов в g. — Прим. ред.
§9.6. Стохастическая сортировка 127 имеет распределение Ρ(α+ Ι,α, ...,α). (9.47) Отсюда следует, что вектор (р^, 1 — ρ„) имеет распределение Дирихле Р(а+1, (л- 1)а)т так что случайная величина р^ имеет плотность распределения Г^в+О -α/, _ ^(л-1)а-1 /94оч Г(а+1)Г(ла-а)Р ( Р) ' (*'Щ При фиксированном ρ условное совместное распределение оставшихся компонент вектора ρ совпадает с распределением вектора (1 — ри)р^\ где (п — 1)-вектор р^ имеет симметричное распределение Дирихле £>(a, a, ..., a). Будем говорить, что вектор pv получен из вектора ρ стохастической сортировкой. Теперь тот же процесс можно применить к вектору р*1* и получить компоненту с распределением, задаваемым формулой (9.48) (в которой η заменено на η — 1), и (п — 2)-вектор р(2) с распределением £>(а, а,..., а). Продолжая этот процесс, мы видим, что компоненты вектора ρ можно переупорядочить так, что компоненты полученного вектора q представляются в виде <7i=*>i, <72 = (1-ui)*>2, <7з = (1 - υχ)(\ - υ2)υ^ ... . (9.49) Случайные величины V\, щ, . ■ ·, νη-\ независимы, причем иг имеет плотность, задаваемую формулой (9.48) с заменой η на η — г + 1. Пусть теперь а —► 0 и η —» оо так, что Αία —► λ. В этом пределе выражение (9.48) сходится к λ(1 -ρ)*-1. (9.50) Таким образом, если определить последовательность q\y q^, #з.... формулой (9.49), где случайные величины vf независимы и имеют плотность (9.50), и обозначить через pk k-н по величине член последовательности Qj, то последовательность (Pi.P2.P3,.·.) (9.51) имеет распределение Пуассона—Дирихле VV(X).
Литература [I] R.Arratia, A. D. Barbour, S. Tavare. Poisson process approximations for the Ewens sampling formula // Ann. Appl. Probab. 1992. 2. P. 519-535. [2] S. Asmussen. Applied Probability and Queues. New York: Wiley, 1987. [3] M. S. Bartlett. Some evolutionary stochastic processes // J. Roy. Statist. Soc. B. 1949. 11. R 211-229. [4] P.Billingsley. Probability and Measure. New York: Wiley, 1979. [5] D. Blackwell. Discreteness of Ferguson selections // Ann. Statist. 1973. 1. P. 365-358. [6] LBreiman. Probability. Reading, MA: Addison-Wesley, 1968. [7] N. R. Campbell. The study of discontinuous phenomena // Proc. Cambridge Philos. Soc. 1909. 15. Ρ 117—136. [8] N. R. Campbell. Discontinuities in light emission // Proc. Cambridge Philos. Soc. 1910. 15. P.310-328. [9] K. L. Chung. A Course in Probability Theory. New York: Harcourt, Brace & World, 1968. [10] D.R.Cox. Some statistical models related with series of events // J. Roy. Statist. Soc. B. 1955. 17. P. 129—164. [II] D.R.Cox. Renewal Theory. London: Methuen, 1962. [Имеется перевод: Д.Р.Кокс, В.Л.Смит. Теория восстановления. М.: Советское радио, 1967.] [12] D.R.Cox, W.L.Smith. Queues. London: Methuen, 1961. [Имеется перевод: Д.Р.Кокс, У.Л.Смит. Теория очередей. М.: Мир, 1966.] [13] P.Donnelly. Partition structures, Polya urns, the Ewens sampling formula, and the age of alleles // Theoret. Popul. Biol. 1986. 30. P. 271—288. [14] J.L.Doob. Stochastic Processes. New York: Wiley, 1953. [Имеется перевод: Дж.Л.Дуб. Вероятностные процессы. Μ.: ИЛ, 1956.] [15] W.J. Ewens. The sampling theory of selectively neutral alleles // Theoret. Popul. Biol. 1972. 3. P. 87-112.
Литература 129 [16] J.Felsenstein. A pain in the torus: some difficulties with models of isolation by distance // Amer. Naturalist. 1975. 109. P. 359-368. [17] T.S. Ferguson. A Bayesian analysis of some nonparametric problems//Ann. Statist. 1973. 1. P. 209-230. [18] J.Grandell. Doubly Stochastic Poisson Processes. Berlin: Springer- Verlag, 1976. [19] P.Halmos. Measure Theory. Princeton, NJ: Van Nostrand, 1950. [Имеется перевод: П.Халмош. Теория меры. Μ.: ИЛ, 1953.] [20] E.F.Harding, D.G.Kendall (eds.) Stochastic Geometry. New York: Wiley, 1974. [21] Т.Е. Harris. The Theory of Branching Processes. Berlin: Springer- Verlag, 1963. [Имеется перевод: Т.Харрис. Теория ветвящихся процессов. М.: Мир, 1966.] [22] K.Ito, H.P.McKean. Diffusion Processes and Their Sample Paths. Berlin: Springer-Verlag, 1965. [Имеется перевод: К.Ито, Г. Маккии. Диффузионные процессы и их траектории. М.: Мир, 1968.] [23] O.Kallenberg. A counterexample to R. Davidson's conjecture on line processes// Proc. Cambridge Philos. Soc. 1977. 82. P.301-307. [24] D. G. Kendall. Foundations of a theory of random sets // Stochastic Geometry / Eds. E. F. Harding and D. G. Kendall. New York: Wiley, 1974. [25] D.G.Kendall, P.A.P.Moran. Geometric Probability. London: Griffin, 1963. [Имеется перевод: М.Кендалл, П.Моран. Геометрические вероятности. М.: Наука, 1972.] [26] J. F.C.Kingman. On doubly stochastic Poisson processes // Proc. Cambridge Philos. Soc. 1964. 60. P. 923-930. [27] J.F.C. Kingman. Regenerative Phenomena. New York: Wiley, 1972. [28] J. F. C. Kingman. An intrinsic description of local time // J. London Math. Soc. 1973. 6. P. 725-731. [29] J.F.C.Kingman. Mathematics of Genetic Diversity. Philadelphia, PA: SIAM, 1980. [30] J.F. C.Kingman, S.J. Taylor. Introduction to Measure and Probability. Cambridge: Cambridge Univ. Press, 1966. [31] R.E. Miles. Poisson flats in Euclidean space // Adv. in Appl. Probab. 1969. 1. P.211-237; 1971. 3. P. 1-43.
130 Литература [32] P.A.P.Moran. The Theory of Storage. London: Methuen, 1959. [33] P.A.P.Moran. A non-Markovian quasi-Poisson process // Studia Sci. Math. Hungar. 1967. 2. P. 425-429. [34] L.Nachbin. The Haar Integral. Princeton, NJ: Van Nostrand, 1965. [35] G. P. Patil, C. Taillie. Diversity as a concept and its implications for random environments // Bull. Intemat. Statist. Inst. 1977. 47. P. 497-515. [36] S.-D. Poisson. Recherches sur la Probability des Jugements en Matiere Criminelle et en Matiere Civile. Paris: Bachelier, 1837. [37] A.Renyi. Foundations of Probability. San Francisco, CA: Holden- Day, 1970. [38] A.Renyi. Remarks on the Poisson process // Studia Sci. Math. Hungar. 1970. 2. P. 119-123. [39] L.A.Santalo. Integral Geometry and Geometric Probability. Reading, MA: Addison-Wesley, 1976. [Имеется перевод: Л. Сантало. Интегральная геометрия и геометрические вероятности. М.: Наука, 1983.] [40] L. Takacs. Combinatorial Methods in the Theory of Stochastic Processes. New York: Wiley, 1967. [Имеется перевод: Л. Такач. Комбинаторные методы в теории случайных процессов. М.: Мир,, 1971.] [41] LC. Tanner. A problem of interference between two queues // Bio- metrika. 1953. 40. P. 58—69. [42] E.T. Whittaker, G.N. Watson. A Course of Modern Analysis. Cambridge: Cambridge Univ. Press, 1902. [Имеется перевод: Э. Т.Уитек- керу Дж.Н.Ватсон. Курс современного анализа. Л.; М.: ГТТИ, 1933, 1934.] [43) L. Williams. Diffusions, Markov Processes and Martingales. New York: Wiley, 1979. Литература, добавленная при переводе [1*] А.М.Вершик. Асимптотическое распределение разложений натуральных чисел на простые делители//Докл. АН СССР. 1986. 289, вып. 2. С.269—272. [2*} А. М. Вершик, Существует ли лебегова мера в бесконечномерном пространстве? // Труды МИАН. 2007. 259.
Литература 131 [3*] А.М.Вершик, А.А.Шмидт. Предельные меры, возникающие в асимптотической теории симметрических групп. I, II // Теор. веро- ятн. и ее примен. 1977. 22. С. 72—88; 1978. 23. С. 42—54. [4*] Н.В.Цилевич. Стационарные случайные разбиения натурального ряда // Теор. вероятн. и ее примен. 1999. 44. С. 55—73. [5*] R.Arratia, A.D.Barbour, and S.Tavare. Logarithmic Combinatorial Structures: a Probabilistic Approach // EMS Monographs in Mathematics. Zurich: European Math. Soc, 2003. [6*J P. Billingsley. On the distribution of large prime divisors // Period. Math. Hungar. 1972. 2. P. 283-289. [7*) P. Diaconis, E. Mayer-Wolf, O. Zeitouni, and M. P. W. Zerner. The Poisson—Dirichlet law is the unique invariant distribution for uniform split-merge transformations // Ann. Probab. 2004. 32, № IB. P. 915-938. [8*] J. F. С Kingman. Random discrete distributions // J. Roy. Statist. Soc. 1975. 37. R 1-22. [9*] Л/\ С. Kingman. Random partitions in population genetics // Proc. R. Soc. Lond. Ser. A. 1978. 361. P. 1-20. [10*] J. F.C.Kingman. The representation of partition structures//J. London Math. Soc. (2) 1978. 18. R 374-380. [11*] J.F.C.Kingman. The coalescent// Stochastic Process. Appl. 1982. 13. R 235-248. [12*] LA.Skepp, S.P.Lloyd. Ordered cycle lengths in a random permutation // Trans. Amen Math, Soc. 1966. 12L P.340-357. [13*] J. Pitman, M. Yor. The two-parameter Poisson—Dirichlet distribution derived from a stable subordinator // Ann. Prob. 1997. 25. P. 855-900. [14*] G.Tenenbaum. Introduction to Analytic and Probabilistc Number Theory. Cambridge; Cambridge Univ. Press, 1995. [15*] N. V.Tsileuich, A.M. Vershik, M. Yor. An infinite-dimensional analogue of the Lebesgue measure and distinguished properties of the gamma process // J. Funct. Anal. 2001. 185, № 1. P. 274-296.
Предметный указатель σ-алгебра 23 ρ-функция 94 Атом 25 — неподвижный 105 Броуновское движение 114 Гамма-величина 117 гамма-процесс Морана 117 гамма-распределение 117 геометрическая теория вероятностей 96, 101 геометрия интегральная 96, 101 — стохастическая 96 Диагональ 23 дробовой эффект 40 Закон больших чисел для неоднородных процессов 70 — для однородных процессов 60 Инвариантность 27, 98—101 Лемма о дизъюнктности 28 локальное время 115 Маркировка 75 марковское свойство 57 мера Σ-конечная 105 — σ-конечная 32 — инвариантная 102 — интенсивности 25 — неатомическая 26 — проективно инвариантная 102 — случайная, с независимыми значениями 103 — Стилтьеса 27 метка 74 множество борелевское 23 — измеримое 23 . Парадокс времени ожидания 58 — Ольберса 79 плотность интенсивности 26 поле прямых 97 Кокса 100 пуассоновское 96, 97 однородное 98 — пуассоновское произвольных геометрических объектов 101, 102 потенциальный момент обслуживания 63 пространство вероятностное 19 — измеримое 23 — однородное 102 — состояний 19 — элементарных событий 19 процесс Бернулли 36 — ветвящийся 90 — восстановления 94 — Гальтона—Ватсона 90 — Дирихле 119 — Кокса 86 — пуассоновский 24 дважды стохастический 86 маркированный 75 однородный 26, 27, 29, 35, 36,48, 55,61, 70 Разбиение 125 раскраска 72
Предметный указатель 133 распределение биномиальное 13, 14, 18, 72 — Бореля—Таннера 93 — Дирихле 116 — мультиномиальное 18 — показательное 59 — Пуассона 13—15 аддитивность 16 — Пуассона—Дирихле 8, 9, 121 Система массового обслуживания М/М/Х 62 — М/М/оо 67-69 — M/M/k 66 случайная величина 19 стохастическая сортировка 127 субординатор 114 — Морана 117, 122 Теорема Бартлетта 68, 76 — Кэмпбелла 43, 44, 77, 107 — о баллотировке 65, 92 — о маркировке 75 — о приращениях 56 — о раскраске 73 — о смещении 81 — о суперпозиции 30 — о счетной аддитивности 17 — об ограничении 31 — об отображении 33 — Реньи 49, 50, 52 — существования 38 теория массового обслуживания 62,92 Формула выборок Ювенса 124 функция измеримая 19 — простая 44 — считающая 23 — уклонения 50 — характеристическая 41 Характеристический функционал 47 Цикловое разбиение 126 Экология 81, 87, 121 экскурсии процесса 115
ПУАССОНОВСКИЕ ПРОЦЕССЫ Кингман Джон Франк Чарльз Подписано в печать 7.11.2007 г. Формат 60 χ 90 yi6. Бумага офсетная № 1. Печать офсетная. Печ. л. 8,5. Тираж 1000 экз. Заказ №454-07 Издательство Московского центра непрерывного математического образования 119002, Москва, Большой Власьевский пер., 11. Тел. (495)-241-74-83. Книги издательства МЦНМО можно приобрести в магазине «Математическая книга», Большой Власьевский пер., д. 11. Тел. (495) 241-72-85. E-mail: bibliofimccme.ru
Дж. Кингман ПУАССОНОВСКИЕ ПРОЦЕССЫ