Text
                    МАРКОВСКИЕ
В.Н. ТУРЧИН
Е.В. ТУРЧИН

В.Н. ТУРЧИН, Е.В. ТУРЧИН МАРКОВСКИЕ ЦЕПИ основные понятия, примеры, задачи Учебное пособие для студентов высших учебных заведений Рекомендовано Министерством образования и науки, молодежи и спорта Украины Дыпропетровськ. LizunoffPress. 2016
УДК 519.21 ББК 22.17я73 Т89 Рецензенты: Ю.В. Козаченко, д-р физ.-мат. наук, проф. (Киевский национальный университет имени Тараса Шевченко), В.В. Булдыгин, д-р физ.-мат. наук, проф. (Националь- ный технический университет Украины «КПИ»). Рекомендовано Министерством образования и науки, молодежи и спорта Украины в качестве учебного пособия для студентов высших учебных заведений (письмо № 1/11 — 857 от 30.01.13). Навчальний посябник е елементарним вступом до Teopii’ марковських ланцюпв — облает! сучасноТ Teopii’ ймов!рностей !з широкою сферою застосу- вань. Викладено основш поняття i факти Teopii’ марковських ланцюпв. Теоретичш положения проыюстровано численними прикладами. До кожно’Г глави наведено na6ip завдань для самостшно’Г роботи. Для читання книги досить знань Teopii’ ймов!рностей у обсяз! дискретно’1 модел! та вищо’1 матема- тики в обсяз! стандартного курсу вищих навчальних заклад!в. Для студенев вищих навчальних заклад!в. Турчин В.Н., Турчин Е.В. Т89 Марковские цепи: Основные понятия, примеры, задачи: Учеб, пособ. для студентов вузов. — Днепропетровск: ЛизуновПресс, 2016. — 192 с. ISBN 978-966-2575-61-3 Учебное пособие представляет собой элементарное введение в теорию марковских цепей — широко используемую в приложениях область современ- ной теории вероятностей. Изложены основные понятия и факты теории марковских цепей. Теоретические положения проиллюстрированы многочис- ленными примерами. К каждой главе приведен набор задач для самостоятель- ной работы. Для чтения книги достаточно знания теории вероятностей в объеме дискретной модели и высшей математики в объеме стандартного курса высших учебных заведений. Для студентов высших учебных заведений. УДК 519.21 ББК 22.17я73 В оформлении обложки использована работа Клода Моне «Розовая тропинка, Живерни». ISBN 978-966-2575-61-3 © Турчин в м- Турчин е в- 2016 © Ткаченко К.Д., обкладинка, титул. 2016
Предисловие Настоящее учебное пособие является элементарным введени- ем в теорию случайных процессов, которая является содержа- тельной, широко используемой в приложениях областью совре- менной теории вероятностей. Оно написано на основе лекций, читаемых авторами в Днепропетровском национальном универ- ситете имени Олеся Гончара. Марковские цепи представляют собой простейший тип слу- чайных процессов, для которых характерно “отсутствие памя- ти”. Книга охватывает традиционную тематику курса “Марков- ские цепи”: матрицы переходных вероятностей и задание мар- ковской цепи, возвратность, классификация состояний, классы эквивалентности, эргодическая теорема, эргодические и стацио- нарные распределения, предельное поведение марковской цепи, марковская цепь, описывающая очередь, задача о разорении иг- рока, марковские цепи с непрерывным временем, пуассоновский процесс, процессы рождения и гибели, обратные и прямые урав- нения Колмогорова, эргодическая теорема для процесса рожде- ния и гибели, обслуживание с ожиданием, дифференцируемость переходных вероятностей и время пребывания в состоянии. Изложение материала иллюстрируется многочисленными примерами и задачами, в частности, из теории массового об- служивания. Учебным пособием могут пользоваться как студенты механи- ко-математических факультетов, факультетов прикладной ма- тематики и кибернетики университетов, так и технических, пе- дагогических, экономических высших учебных заведений. Авторы будут признательны всем, кто в той или иной фор- ме выскажет свои пожелания, замечания и предложения отно- сительно содержания книги. Предложения и пожелания про- сим присылать по адресу: Украина, 49010, Днепропетровск-10, пр. Гагарина, 72, Днепропетровский национальный университет имени Олеся Гончара, механико-математический факультет, ка- федра статистики и теории вероятностей, В. Н. Турчину или по адресу vnturchyn@gmail.com

Глава 1 Цепи Маркова — основные понятия и факты Детерминированные и стохастически детерминиро- ванные системы. В различных областях естествознания, на- уки и техники мы имеем дело с системами, состояние которых в данный момент определяет их дальнейшую эволюцию. Такие системы называют детерминированными. Естественным обоб- щением детерминированных систем являются стохастически де- терминированные системы. Они эволюционируют случайным об- разом, но состояние системы в данный момент времени опреде- ляет ее распределение (вероятности пребывания в состояниях) во все последующие моменты времени. Такие системы называ- ются марковскими. Мы будем изучать марковские системы, множество возмож- ных состояний X которых — фазовое пространство — конечно либо счетно (будем считать X множеством целых чисел или его частью). Математическими моделями марковских систем, у которых переходы из одного состояния в другое осуществляются в цело- численные моменты времени t = 0,1,2,... являются цепи Мар- кова с дискретным временем, а моделями систем, у которых пе- реходы могут происходить в любой момент времени t 6 [0, +схз), являются цепи Маркова с непрерывным временем.
6 Глава 1. Цепи Маркова — основные понятия и факты 1.1 Определение цепи Маркова. Простейшие свойства Далее множество состояний цепи — фазовое пространство X — множество целых чисел или его часть. Определение. Последовательность {£&} целочисленных случайных величин таких, что P{£k+i — 4+1 |£о = 4ь£1 = й, = ч} = = -Pfe+i = 4+ilCfe = 4} (l-1-1) для каждого к > 0 и любых $o,$i> •••> ^fc+i из фазового прост- ранства X будем называть цепью Маркова (марковской цепью). Предполагается, что все условные вероятности, участвую- щие в определении марковской цепи, определены. Равенство (1.1.1) называют марковским свойством. Так что марковская цепь — это последовательность цело- численных случайных величин, для которой имеет место мар- ковское свойство. Случайную величину будем называть состоянием систе- мы в момент времени t = к, к = 0,1,..., вероятность Р{£к — i 6 X, — вероятностью пребывания системы (цепи) в состоя- нии г, а вероятностное распределение Р{£к = i},i Е X, будем называть распределением цепи в момент t = к, к = 0,1,... Переходные вероятности марковской цепи. Условную вероятность Р{^+1 = j\£k — 0 называют одношаговой переход- ной вероятностью из состояния i в состояние j и обозначают Pij(k, к + 1) : Р{£к+1 = JlCfc = г} = к + !)• Условную вероятность P{^k+n = j\£k = г} называют п-ша- говой переходной вероятностью из состояния i в состояние j и обозначают Pij(k, к + п), т. е. = — Pij(k) к + п). В общем случае переходные вероятности зависят не только от начального i и конечного j состояний цепи, но и от к (момента перехода). Определение. Марковскую цепь будем называть стаци- онарной, если ее переходные вероятности Рц(к, к + п) не зависят
1.1. Определение цепи Маркова. Простейшие свойства 7 от к. В этом случае переходные вероятности называют стацио- нарными и обозначают Pij(k,k + n) = Pij(ri), Pij(n) еще называют вероятностью перехода цепи из i в j за п шагов (n-шаговой переходной вероятностью). По определению Ри(0) = 1, Р^(0) = О, Одношаговые стационарные переходные вероятности обознача- ют через Pij, т. е. P{£k+i — JlCfc — 0 — Pi?- Вероятность Р^ еще называют вероятностью перехода цепи из i в j за один шаг. Далее мы будем рассматривать только стационарные мар- ковские цепи. Если = г, £&+1 = j, то мы будем говорить, что цепь за один шаг переходит из состояния i в состояние j. Если = г, £&+п = J, то будем говорить, что цепь за п шагов переходит из состояния i в состояние j. Матрицы переходных вероятностей. Пусть {£&} — мар- ковская цепь с фазовым пространством X = {0,1,...}. Мат- рицу, составленную из элементов Р^-(п), называют матрицей n-шаговых переходных вероятностей и обозначают Р(п) = [Рц(п)] = Роо(п) Pw(n) Р(л(п) Рц(п) Pinin') Рц(п) В частности, если п = 1, то матрицу Р(1) = Р, составленную из элементов Р?Д1) = P?j, называют матрицей одношаговых пере- ходных вероятностей и обозначают " Poo Poi Рю Рц Р = [Pij] = Р?о Р?1
8 Глава 1. Цепи Маркова — основные понятия и факты Матрица n-шаговых переходных вероятностей (в частности, матрица одношаговых переходных вероятностей) обладает свой- ствами: 1° Pij(n) >0, г,j = 0,1,..., 2° 'T'Pijt.n) = 1, i = 0,1,... 3 Свойство 1° очевидно (поскольку Pij(n) являются вероят- ностями). Свойство 2° следует из свойства счетной аддитивности ве- роятности — достаточно заметить, что условная вероятность Р(-/{£о — 0) относительно события {£о — 0 является веро- ятностью, а О = = fc} П Кп = 1} = 0, к + I. 3 Тогда 1 = р(п| Ro = о) = Е =№> = о = Е р^- j j Свойства 1°,2° обозначают, что каждая строка матрицы n-шаговых переходных вероятностей является вероятностным распределением на фазовом пространстве цепи. Определение. Матрица [Р^], элементы которой удовле- творяют условиям Pij > о, ij е х, Е^ = 1,^Х, j называется стохастической. Следующее утверждение является непосредственным след- ствием марковского свойства. Теорема 1.1.1 (уравнение Колмогорова-Чепмена). В мар- ковской цепи для любых i,j из фазового пространства X и лю- бых целых положительных целых чисел г, s Pij(r + s) = Е Pik(r)Pkj(s) (1.1.2) kex или в матричном виде: Р(г + $) = Р(г)Р($).
1.1. Определение цепи Маркова. Простейшие свойства 9 Доказательство. Очевидно {£г+$ — 7?£о — 0 — |^{£о — — j}i k причем события в правой части несовместны. Отсюда, учиты- вая, что для {£п} имеет место марковское свойство, получаем P{£r+s — Л£о — 0 — P{£r+s — — &|£о — 0 — k Е-^Ч^г+s — £o — 0 _ к P{^ = i} ~ _ V-^ P{£r+s — j\£>r — — Q _ ~k m = o = £ P{£r+S = j\£r = k}P{£r = fcko = 4 = E Pik^Pkj^- к к Так что Py(r + s) = ^Pik^Pkj^, i,j e X. к Совокупность этих равенств можно записать в матричном виде так: Р(г + s) = P(r)P(s). Из уравнения Колмогорова-Чепмена следует, что по матрице одношаговых переходных вероятностей всегда можно выписать матрицу n-шаговых переходных вероятностей. Следствие 1. Матрица n-шаговых переходных вероятнос- тей равна п-й степени матрицы одношаговых переходных ве- роятностей: Р(п) = (Р)п. Доказательство. В силу теоремы Р(г + s) = P(r)P(s). В частности, P(n) = РР(п - 1) = Р(РР(п - 2)) = (Р)2Р(п - 2) = ... = (Р)п.
10 Глава 1. Цепи Маркова — основные понятия и факты Следствие 2. Матрица n-шаговых переходных вероятнос- тей марковской цепи является стохастической. Доказательство. Из следствия 1 имеем Р(п) = (Р)п. Убедимся, что матрица (Р)п стохастическая. Достаточно убедиться, что если Р — стохастическая матрица, то и (Р)2 также стохастическая матрица. Элементы матрицы (Р)2 имеют вид PjkPkj ч Ъ-)Э £ X. к Отсюда, во-первых, следует, что они неотрицательны, и, во-вторых, сумма элементов г-строки, i 6 X, У? (У? PikPkj^ — У2 У2 PikPkj = j к к j — Рik Pkj — Pik — 1? X. к j к Следствие 3. Ру (г + s) > Pik(r)Pkj(s), к е X. Следствие 4. Для любых i,j 6 X и целых положитель- ных г, s, t Pij(r + s + t)= ^2 Pik(r)Pku(s)Puj(t) . k,uex или в матричном виде P(r + s + f) = P(r)P(s)P(f). Следствие 5. Pij(r + s + t) > Pik(r)Pku(^)Puj(t), k.ue X. Примеры марковских цепей. К приведенным примерам марковских цепей мы будем неоднократно возвращаться.
1.1. Определение цепи Маркова. Простейшие свойства 11 Пример1.1.1 (одномерное случайное блуждание). Частица движется по целочисленной решетке ..., —2, —1,0,1,2,..., ме- няя свое положение в целочисленные моменты времени. Обо- значим через £п, п = 0,1,2,..., положение (координату) части- цы в момент времени п. За единицу времени (за один шаг) частица перемещается из точки с координатой i в точку с координатой (i - 1) с вероятностью Qi, в точку (i + 1) — с ве- роятностью Pi, либо остается в точке i с вероятностью (Pi + Qi + = 1) — будем говорить, что частица принимает участие в одномерном случайном блуждании по целочисленной решетке. Последовательность случайных величин {£п} еще на- зывают одномерным случайным блужданием. Убедимся, что {£п} образует марковскую цепь и найдем ее матрицу одношаговых переходных вероятностей. Покажем, что последовательность {£п} обладает марковским свойством. Для этого выпишем Р{Сп+1 — ДСп — Сп—1 — ^п—1> • • • >Со = ^о}> Р{Сп+1 — ДСп — О- По определению случайного блуждания по одномерной целочис- ленной решетке, Р{£п+1 — j\£n = = in-i, • • • ,£о = М = А, П, если j = i + 1; если j = i — 1; если j = i’, P{£n+1 — j\£n — 0 — Pi, если j = i + 1; qi, если j = i — 1; Vi, если j = i. (1.1.3) Так что P{£n+i — JlCn — i^n-i — in—1> • • • Co — ^0} — P{Cn+i — JlCn — O’ т. e. для последовательности случайных величин {Си} имеет мес- то марковское свойство и, следовательно, {£п} является марков- ской цепью. Равенства (1.1.3) задают элементы матрицы одношаговых переходных вероятностей Р = [Р^-]. Подробнее: Р{Сп+1 — + 1 |Сп = 0 = P?,«+i = Рь P{Cn+l — i ~ 1 |Сп — 0 = Pi,i—l = Qi’>
12 Глава 1. Цепи Маркова — основные понятия и факты ^{Cn+l — ^ICn — 0 — Pi,i — Tiy где Pi > О, qi > О, Ti > О, Pi + qi + n = 1, i = ..., -1,0,1,... Если фазовым пространством X марковской цепи является множество целых неотрицательных чисел, то матрица переход- ных вероятностей случайного блуждания, очевидно, имеет вид го ро 0 0 qi ri pi 0 о Q2 Г2 Р2 (1-1-4) Ясно, что ро + го — 1- Если при этом ро = 1 (а значит го = 0), то нулевое состояние обладает свойством отражающего экра- на (в нуле находится упругая стенка). Если р0 = 0, го = 1, то состояние нуль ведет себя как поглощающий экран — попав в состояние нуль, частица остается в нем навсегда. Если ро > 0, го > 0, то состояние нуль — частично отражающий экран. Если фазовое пространство случайного блуждания ограни- чено, например, X = {0,1,..., 7И}, то матрица переходных ве- роятностей имеет вид To Po 0 0 0 0 0 <11 Г1 Pl 0 0 0 0 0 Q2 Г2 P2 0 0 0 p = . (1.1.5) 6 0 6 6 QM-1 ГМ-1 PM-1 . 0 0 0 0 0 дм TM . Состояния 0 и М могут быть экранами перечисленных выше типов. Заметим, что для случайного блуждания {£п} имеет место представление &+1 — £>к “Ь & — 0,2,..., или, что то же, к+1 &+1 = £о + Vi, к = 0,1,2,..., г=1 где случайные величины vk независимы и каждая имеет распре- деление P{vk = -1} = qk, P{vk = 0} = rk, P{vk = 1} = pk, pk+qk+rk = 1.
1.1. Определение цепи Маркова. Простейшие свойства 13 Пример 1.1.2 (азартная игра). Игрок Gm (с капиталом т) играет в азартную игру с игроком Gm (с капиталом М), участ- вуя в серии последовательных партий игры. В результате каж- дой партии капитал игрока Gm с вероятностью р увеличива- ется на 1 (за счет игрока Gm) с вероятностью q = 1 — р уменьшается на 1 (в пользу игрока Gm)- Результат каждой партии не зависит от результатов предыдущих партий. Обозначим через капитал игрока Gm после k-й партии, через п суммарный капитал игроков Gm и Gm - п = т + М. Ес- ли = 0 или = п, то игра прекращается. Событие {£& = 0} означает разорение игрока Gm, событие {£& = п} — разорение игрока Gm- Покажем, что последовательность {£&} образует марков- скую цепь, найдем ее матрицу переходных вероятностей. Решение. Обозначим через Vk результат k-й партии — из- менение капитала игрока Gm в результате k-й партии, и к — слу- чайная величина с распределением P{vk = 1} = р, P{vk = -1} = я, р > 0, q > 0, p+q = 1, к = 1,2,... Случайные величины Vi,... независимы. Очевидно, &+1 = & + ^+1, к = 0,1,..., £о = т или, что то же, Ан-1 tk+1 = to + ^ к = 0,1,2,...; to = т. г=1 Убедимся, что для последовательности {£&} имеет место мар- ковское свойство. Для этого выпишем P{tk+i = j\£k = = ik-i,- ,ti = Ч,£о = т), p{^k+i=jkfc = О- Имеем: ^{Cfe+1 = = i,tk-l = ik-l, , tl = 4, to = m} = _ P{tk+1 = j,tk = i,tk-l = ik-l, ••• ,£1 = 4,to = m} _ P{tk = i,£k-i = ik-l, • • • >6 = ii,to = m}
14 Глава 1. Цепи Маркова — основные понятия и факты _ P{£k + ^fc+l = j; Cfe = 4 Cfc-1 = 4-1; ; Cl = 4, Co = TO} _ P{£k = iAk-l = ik-1,- • • >C1 = 4,Co = m} = P{i + Vfc+1 = J;Cfc = 4Cfc-l = 4-1; ,£1 = 4,Co = TO} = P{£k = iAk-l = ik-1, - • • ; Cl = 4; Co = m} = P{Vk+l = j - i}P{£k = 4Cfe-l = 4-1 ;C1 = 4; Co = = P{£k = iAk-l = ik-1, - • • ; Cl = 4; Co = m} = P{vk+1 =j-i}, воспользовались независимостью событий {Ш1 = j - {£k = = Ч-ь • • • ,£i = *i,£o = m}- Аналогично получаем P{Cfc+i = JlCfc = 0 = P{yk+1 =j-i} (чтобы сумма £&+1 = была равна j, при условии, что £& = г, слагаемое vj^+i должно быть равно j — г). Поэтому последовательность случайных величин {£&} обла- дает марковским свойством, и, следовательно, является марков- ской цепью. Элементы ее матрицы переходных вероятностей Pij = Р{£к+1 = j\£k = 0 = P{vk+1 = j - i = 1,2,..., n — 1, j = 0,1,..., n. Если i = 0, to Ш+1 = 0|Cfc = 0} = i, если i = n, to P{£k+1 = n|& = n} = 1. Цепь стационарная, поскольку переходные вероятности Pij = P{Vk+l = j - i} не зависят от к (случайные величины к = 1,2,..., одинаково распределены). Подробнее элементы матрицы переходных вероятностей за- пишутся так Роо = Р{&+1 = о|& = 0} = 1, Рпп — Р{&+1 — — Ц Р?,?+1 — Р{£&+! — - + 1|£/с — 0 — Рч Ъ' — 1> 2, . . . , П — 1,
1.1. Определение цепи Маркова. Простейшие свойства 15 Рi,i—1 — Р{£/с+1 — 1 — 0 — 0.1 — 1,2,. . . ,П 1, все неперечисленные P^j равны нулю. Сама матрица переход- ных вероятностей цепи {£&} имеет вид р = ’1000...000' q 0 р 0 ... 0 0 0 0 q 0 р ... 0 0 0 0 0 0 0 ... q 0 р 0000...001 Заметим, что состояния 0 и п являются поглощающими экрана- ми. Если капитал игрока Gm неограничен (М = оо), матрица переходных вероятностей цепи {£&} имеет вид (1.1.6) (состояние 0 является поглощающим экраном). Марковская цепь, описанная в примере 1.1.2, является част- ным случаем случайного блуждания (см. пример 1.1.1). Пример 1.1.3 (сумма независимых случайных величин как марковская цепь). Пусть £i,£2, • • • ~ независимые неот- рицательные целочисленные случайные величины, каждая с рас- пределением P{^k = l}=Pi, / = 0,1,2,... Рассмотрим последовательность случайных величин п % = п= 1,2,... fe=l Покажем, что последовательность {г]п} образует марковскую цепь и найдем ее матрицу переходных вероятностей. Решение. Аналогично тому, как мы это делали в примере 1.1.2, получаем P{rin+i = j\f]n = г, Vn-i = in-i, = г’1} = -P{Cn+i = j - 0,
16 Глава 1. Цепи Маркова — основные понятия и факты Р{т]п+1 = j\r)n = г} = Р{6г+1 =3 - г} (чтобы сумма r/k+i = % + £&+1 была равна j при условии, что т/k = i, слагаемое ^+1 должно быть равно j — г). Из двух последних равенств следует, что, во-первых, {т)п} — марковская цепь (для {т)п} выполняется марковское свойство), а во-вторых, матрица переходных вероятностей {т/п} имеет вид Р = [-Ру] = [Р{%+1 = = г}] = [Р{£п+1 = j - г}], г, j = 1,2,.. Подробнее Р = [Pij] = РО Pl Р2 РЗ о Ро Pl Р2 о о Ро Pi О 0 0 ро Замечание. Сумма независимых целочисленных случай- ных величин будет марковской цепью и без предположения об их неотрицательности. Задание марковской цепи. Случайная величина £ задает- ся своим распределением Р^, случайный вектор (£о>£1> • • • >£п) — совместным распределением P^0,Ci,...,Cn случайных величин Со>С1> • • • >Сп> бесконечная последовательность случайных вели- чин 4о>С1> • • • >Сп> • • • (в частности, марковская цепь) задана, ес- ли для каждого п (п = 0,1,...) известно распределение слу- чайного вектора (£о>£1> • • • >£п) — известны конечномерные рас- пределения последовательности £о>£1> • • • >£п> • • • Но оказывает- ся, чтобы задать марковскую цепь — бесконечную последова- тельность случайных величин, для которой имеет место мар- ковское свойство, достаточно задать распределение начального состояния £о цепи и матрицу [Pjj] одношаговых переходных ве- роятностей. Теорема 1.1.2. Марковская цепь задается матрицей одно- шаговых переходных вероятностей [Pjj] и своим распределени- ем в начальный момент времени. Доказательство. Достаточно показать, что для марков- ской цепи {£п} конечномерные распределения P^0,<i,...,£n вычис- ляются по ее одношаговым переходным вероятностям Pjj и рас- пределению {pk} случайной величины £о: Р{& = k} = Pk, к = 0,1,...
1.1. Определение цепи Маркова. Простейшие свойства 17 Пользуясь марковским свойством, имеем = -Р{Со = 4,6. = Ч, • Лп-1 = 4-1, Cn = in} = = Р{£п = 4|£о = 4,6 = ii,... ,£n-i = 4-1}х xP{Co = 4,6 = ii, • • • ,£n-i = 4-1} = = P{£n = 4|6— 1 = in—1}-Р{6 = 4,6 = *1,- • • , Cn—1 = in—1} = = Pin-^inP^o = 4,6 = 6, • • ,6-1 = 4-1} = • • • • = PioPioh Piii2 ’ ’ ’ ^in-iin ’ Так что ^1>••• > Ъг) = Pio-Pioii-Piii2 • • • Pin-iin' Замечание. Поскольку одношаговые переходные вероятнос- ти Pij = P{£k+1 = 3\£к = 0 = P{£k+1 = ЗЛк = i}/P{t,k = то для задания марковской цепи достаточно знать только ее дву- мерные распределения Р{^+1 = j,£k = 0’ ^3 = 0,1,2,, одномерные распределения выражаются через двумерные: m = o = = = s> S Определение. При каждом фиксированном си последова- тельность 4о(^)>С1(<^)> • • • Лк(ш})... будем называть траектори- ей марковской цепи {£п}- Соотношение (1-1.7) задает вероятность того, что марков- ская цепь в моменты времени 0,1,..., п пройдет соответственно через точки го, zi,..., гп-1, гп.
18 Глава 1. Цепи Маркова — основные понятия и факты Теорема 1.1.3. Распределение Pttn = j}, j е х, марковской цепи {£п} в момент времени t = п задается ее рас- пределением Pi = Р{Со = г}, « € X, в момент времени t = 0 и матрицей п-шаговых переходных вероятностей: Р{^п = j} = ^PiPij(n), j е х. (1.1.8) iex Доказательство. Поскольку события {£о = i}, i Е X, образуют полную группу: Q = |J {£0 = {Со = к} П {£о = 1} = 0, k / I, iex то согласно формуле полной вероятности Р{$П = j} = £^{^0 = г}Р{Сп = ЛСо = 0 = iex iex Следствие. Из равенства (1.1.8) следует, что предельное поведение распределения QnO) = P{Cn=j}, jtX, марковской цепи при п —> оо определяется предельным поведе- нием n-шаговых переходных вероятностей цепи (и, возможно, ее начальным распределением Р{& = i} = pj, i Е X). Теорема 1.1.4. Каждая стохастическая матрица задает марковскую цепь, другими словами, для данной стохастиче- ской матрицы найдется марковская цепь, матрица переход- ных вероятностей которой совпадает с данной стохастиче- ской матрицей. Доказательство. Пусть [Pjj] — стохастическая матрица, {рЦ — вероятностное распределение на {0,1,2,...}. Определим на множестве {0,1,2,...} семейство вероятностных распределе- ний Р(го, 21,..., in) — для каждого п и любых го,i\,..., in поло- жим Р(го, 21, ... , 2n) = Pin_1inPin_2in-1 • • • Pi^PioiiPio- (1.1.9)
1.1. Определение цепи Маркова. Простейшие свойства 19 Непосредственной проверкой убеждаемся, что • • • -^l«2-^0hP«0 = I’ in,in — lr-^O Последовательность случайных величин £о>£1> • • • определим так, чтобы её конечномерные распределения, т. е. распределения векторов (Со>С1> • • • >Сп)> ПРИ каждом п совпадали с распределе- ниями (1.1.9): Р{& = *0,6. = й, • • • ,£п-1 = ^п-1Лп = in} = = ,Сп(^0> • • • yin) — Pin-iinPin_2in-i • • • PhhPiohPio (такая последовательность случайных величин £о>£1> • • • всегда существует). Убедимся, что последовательность случайных величин £о, С1> • • обладает марковским свойством. Имеем ^{£п+1 = 3' I Cn = iy^n-i = in-iy • • • ,£i = й,£о = 2о} = _ P{£n+i = j,t,n = iy^n-i = in-iy • • • ,£1 = 2i,gp = 2p} _ P{£n = iy^n-i = in-1, • • • ,£i = ii,^o = } _ PjjPin-liPin-2in-i • • • Pj^PipiiPio _ p Pin-iiPin-2in-i • • • Piii2pioiiPio pje a I e n P{£n+1 — ЗЛп — 0 />(«„« = JI «„=.) = —p{£n=i}— = 52 -Р{£п+1 = j,£n = i,£n-l = in-1, • • • ,C1 = *l,€o = *0} in-i,in-2,,io _ * 52 E -P{Cn = i,£n-i = in-1, • • • ,Ci = = *o} in-i,in-2,,io 52 RjPin-liPin-zin-i ‘ • • ^iih^ioiiPio = »n-Mn-2,-,8Q______________________________ =P fl I 10) E Pin liPi„ 2in 1 • • • PilhPioilPio l3' { ' 3 in-i,in-2,---,io Так что для последовательности случайных величин {^} имеет место марковское свойство и, следовательно, {^} является мар- ковской цепью, причем ее матрица переходных вероятностей [Жг+1 = 3 Кп = г}]> i,j =0,1,2,...
20 Глава 1. Цепи Маркова — основные понятия и факты совпадает с данной стохастической матрицей [Р^], т. с. Р{£n+i = J I Сп = 0 = Fiji j — 0,1,2,... (см. равенство (1.1.10)). Итак, стохастическая матрица [Pjj] равенством (1.1.9) всег- да задаст на множестве {0,1,2,...} семейство распределений, а вместе с ним и последовательность случайных величин £о> £1> • • • с конечномерными распределениями (1.1.9). Такой вид конечно- мерных распределений случайных величин £о>£1> • • • гарантиру- ет выполнение для них марковского свойства, поэтому последо- вательность £о>£1> • • • является марковской цепью. Пример 1.1.4. Марковская цепь с фазовым пространством X = {1,2,3} описывается матрицей одношаговых переходных вероятностей Г 1/2 О L 1/2 Р = 1/2 0 ‘ 1/2 1/2 О 1/2 Найти вероятность того, что: 1° цепь, стартовав из состояния 1, через два шага окажет- ся в состоянии 3; 2° цепь, стартовав из состояния 2, через три шага ока- жется в состоянии 3. Найти распределение цепи в момент t = 2 (через два шага после старта), если в момент t = 0 цепь с равными вероят- ностями находится в одном из своих состояний. Решение. Ясно, что необходимо найти Р{& = 3|£о = 1} = Р1,з(2). Р{Сз = ЗКо = 2} = Р2,з(3), или, что то же, элемент Р\^(2) матрицы Р(2) и элемент Р2д(3) матрицы Р(3). Матрицы Р(2) и Р(3) находим по матрице Р од- ношаговых переходных вероятностей: Р(2) = (Р)2, Р(3) = (Р)3. Распределение цепи в момент t = 2 (распределение случай- ной величины £2) получим по известному начальному распреде- лению 1 2 3 \ 1/3 1/3 1/3 J цепи и матрице Р(2) двухшаговых переходных вероятностей, воспользовавшись равенством (1.1.8).
1.2. Возвратность 21 Ответы: 1° Р{& = 3 |Со = 1} = 1/4; 2° Р{£3 = 3 |Со = 2} = 3/8. Распределение цепи в момент t = 2: Р{& = 1} = 1/3, Р{& = 2} = 1/3, Р{& = 3} = 1/3. 1.2 Возвратность Каждое состояние марковской цепи характеризуется време- нем первого возвращения. Представим множество Ко — О в виде объединения следую- щих непересекающихся подмножеств: Ко = Л £1 = Ко = Л £р 7^ Л ^ = 1,2,...}, Ко = ^Кп = ^Кр / z/= 1,2,..., п — 1}, п = 2,3,..., Определим случайную величину т = так: на множестве Ко — ^£1 — 0 она принимает значение 1, на множестве Ко — Л£п — *,£р / — 1,2,... ,п — 1} (п > 2) — значе- ние п, на множестве Ко = ^, £р у — 1,2,...} — значение -4-схэ (на дополнении к Ко — 0 случайную величину т будем считать равной 0). Из определения т = т(о>) следует, что {-г = 1} = {Со = г,С1 = о, {г = оо} = {£о = i, & / г, ^ = 1,2,...}, {т = п} = Ко = ^, £n = ^, £р / v — 1,2, • • •, п — 1}, п = 2,3,... Случайная величина т называется временем первого возвра- щения в состояние i. Обозначим fu(n) = Р{т = п|£0 = 4, П = 1,2,..., значение /«(0) положим равным 0 (по определению). Вероят- ностное распределение Р{т = п|£0 = г} = Лг(п), п = 0,1,...,
22 Глава 1. Цепи Маркова — основные понятия и факты будем называть распределением времени первого возвращения в состояние i. По отношению ко времени первого возвращения все состоя- ния делятся на возвратные и невозвратные. Определение. Состояние i будем называть возвратным, если Р{т < оо|£о = г} = 1 и невозвратным, если Р{т < оо|£о = г} < 1- Другими словами, состояние i возвратно, если Р{т = оо|£0 = г} = О, и невозвратно, если Р{т = оо|£о = г} > О- Вероятность Р{т < оо|£о — 0 называют вероятностью пер- вого возвращения в состояние i. Так как оо {т<оо}= U{r = n}, п=0 то вероятность первого возвращения можно записать в виде оо оо Р{т < оо|£о = г} = У2 р{т = п1£° = 0 = 52 п=0 п=0 её обычно обозначают через /г*: оо /й = 52/й(п)- п=0 В терминах состояние i возвратно, если fii = 1 и невозвратно, если fit < 1-
1.2. Возвратность 23 Среднее время возвращения Мт = УпЩп) п=0 у возвратного состояния может быть как конечным, так и бес- конечным. У невозвратного состояния среднее время возвращения рав- но бесконечности. Производящие функции. Напомним теорему о произве- дении абсолютно сходящихся степенных рядов. Теорема 1.2.1. Если степенные ряды A(s) = |s| < 1, и B(s) = |s| < 1, к=о 1=0 абсолютно сходятся, то абсолютно сходится и ряд оо C(S) = ’£cnSn, Н<1, п=0 где сп = аоЬп + aibn-i + • • • + апЬ0, = 0,1,2,..., и имеет место равенство A(s)B(s) = C(s). (1.2.1) Ряд C(s) называется произведением рядов A(s) и B(s). Определение. Сумму оо Л(з) = И < 1, к=0 оо абсолютно сходящегося степенного ряда ак8^ будем называть к=0 производящей функцией последовательности В частности, оо оо Pa(s) = ургг(к)зк, |а| < 1, Fa(s) = |з| < 1, к=0 к=0
24 Глава 1. Цепи Маркова — основные понятия и факты — производящие функции соответственно последовательностей {Рц(к}} и Производящие функции Рц(з) и Fu(s) определены, т. к. при И<1 ОО ОО 1 < D»i‘= тттл. t=0 4.0 11 ОО ОО 1 Ei/..ms‘i<£|S|‘ = —у. k=0 k=0 1 |s| Нам понадобится следующая лемма Абеля, оо Лемм а 1.2.1 (лемма Абеля). 1° Если ряд ак$к, И < 1? об’- к=е оо солютно сходится в точке s = 1, то существует lim V аьзк ^1-0 к=о и оо оо Л“о 52 акзк = 52 ак' (L2-2) fe=0 k=0 оо 2° Пусть > 0, к = 0,1,... Если существует lim aksk s->l-0fc=0 (конечный или бесконечный), то Л%5>*? = ^ак- к=0 к=0 Доказательство. Сначала докажем утверждение 1°. оо Из абсолютной сходимости ряда aksk в точке s = 1, оче- к=0 оо видно, следует абсолютная сходимость ряда ак§к ПРИ И < 1- к=о Для доказательства равенства (1.2.2) оценим разность оо оо ^к^ &к к=0 к=0 в окрестности точки s = 1. Очевидно, оо оо ^к^ &к к=0 к=0 оо Ем^-i) k=0
1.2. Возвратность 25 N ^ak(sk - 1) k=0 ak(sk - 1) k=N+l выберем далее). Сначала оценим сверху оо Запишем в терминах остатков Аь = + . ряда аГ- 1=0 &к = Лк ~ ^/с+1- Имеем оо оо £ ak(sk - 1) = £ (Ак — Ak+1)(sk — 1) = k=N+l k=N+l оо оо = £ A(sfc-i)- £ Xfc+1(sfe -1) = k=N+l k=N+l оо оо = Лу+1(Л+1-1)+ £ Afc(s*-1)- 52 Afe+1(sfc - 1) = k=N+2 fc=N+l oo oo = Алг+1(Л+1 - 1) + £ Afc(sfc-1)- 52 Afc(sfe-1 - 1) = k=N+2 k=N+2 oo = An+1(sn+1 - 1) + 52 k=N+2 oo Поскольку Ak — остаток сходящегося ряда lad> т0 Для Дан- 1=0 ного e > 0 найдется такое что для всех к > N имеют место неравенства |А&| < е. Поэтому оо X k=N-^-l ak(sk - 1) ОО < 1АЛГ+11КЛ+1 - 1)1+ 52 |A/j||sfc — sfc-1| < k=N+2
26 Глава 1. Цепи Маркова — основные понятия и факты ОО <£|Л+1-1|+£ lsfe-1Hs-1l< k=N+2 < 2£ + e|s|N+1|s- = 1 - И = 2s + e|s|;v+1(l — s) ——— < 2s + s = 3e. 1 — s N Осталось заметить, что &k(sk ~ 1) —> 0 при s —> 1 (в силу k=o N непрерывности функции ak(sk — 1))- k=o Убедимся теперь в справедливости утверждения 2° теоремы, оо Пусть > 0, к = 0,1,..., и существует lim ак$к- Рас- s—>1—О k=Q смотрим два случая: оо оо a) lim a^sk = +сю, b) lim У^ a^sk < сю. ~ k=o s-> ” к=0 а) Из оо lim > агзк = +сю к=о и неравенства оо оо ^к^ — &к к=0 к=0 оо (при 0 < s < 1) следует, что ак — +оо, поэтому к=о оо оо к=0 к=0 Ь) Пусть оо lim У2 ак§к = а < оо. ~ k=0
1.2. Возвратность 27 Переходя в неравенстве п оо Еaksk - Еaksk k=0 к=0 к пределу сначала при s —> 1 — 0, а потом при п сю, получаем оо оо Еа^ Л^Е а^зк = а < сю. k=o s-> - к=о оо Так что ряд ак абсолютно сходится, и в силу утверждения 1° к=0 леммы оо оо lim YW = У2ак- s^-1—О2-—' к=0 к=0 Лемма доказана. Необходимые и достаточные условия возвратности состояния. Далее мы получим условия невозвратности и воз- вратности состояния i в терминах сходимости и расходимости ряда ^2 Рц(п). п Теорема 1.2.2 (необходимое и достаточное условие возврат- ности состояния). Для того, чтобы состояние i было возврат- 00 ным, необходимо и достаточно, чтобы ряд Рй(п) расходил- п=0 ся. Доказательство. Сначала докажем, что производящие функции Pu(s), Fa(s) последовательностей {Рц(п)}, {fu(n)} свя- заны соотношением 1 L V lsl < L t1-2-3) 1 - Fii(s) Для этого установим, что последовательности {РДп)}, {fu(n)} связаны соотношением п Рц(п) = 52 fii(k)Pii(n -k), п = 1,2,..., (1-2-4) k=o (при п = 0 равенство не имеет места).
28 Глава 1. Цепи Маркова — основные понятия и факты Представим событие {£п = г,£о — О в виде объединения непересекающихся событий Е1 = {£п = ; Ek = == ~ £>к ~ ^ч^и ^ч V ~ 1,2,. . . , /и 1}, к = 2,3,..., п (событие Ек состоит в том, что в моменты 0 и п цепь находится в состоянии г, и первое возвращение в состояние i происходит на к-м шаге): п {£п ~ £о = 0 = |^J Ек- к=1 Отсюда Р{^п = г|€о = 0 = Е = 0- (1-2.5) к=\ И поскольку Р{£*|Со = 0 = _ Р{£п = i,^o = i,^k = i,^¥:'>',y='i-,2,...,k-l} _ Р{&> = О = P{£n = z|$t = i, Со = i, kv / г, v = 1,2,..., к - 1} х x-P{Cfc = «,Со = Л Ср И iy v = 1,2,... ,к - 1}/Р{Со = г} = = р{£п = *ICfe = 0 * * х xP{Cfc = г,Со = я,Ср И Л = 1,2,- ,к — 1|Со = г} = = Рц(п- k)fn(k), к = 2,3,... ,п, равенство (1.2.5) перепишется так: Put™) = /гг(к)Рц(п - к), fe=i или, учитывая что /й(0) = 0, так: Рц(п) = ^2 fii(k)Pii(n - к) k=0
1.2. Возвратность 29 для всех п = 1,2,... (при п = 0 последнее равенство не имеет места). Далее, рассмотрим произведение абсолютно сходящихся при |s| < 1 степенных рядов (см. теорему 1.2.1) оо оо Fii^ = ^fn^k и Рц(з) = ^Рц(Г)81. к=0 1=0 оо / п \ Fii^Pii^ = £ £ fu(k)Pa(n -k)\sn = п=0 \к=0 / (О \ оо / п \ 52 - м Ь°+Е Е - м Ьп = к=0 / п=1 \/с=0 / оо оо = е Pa («х = Е р^$п+p^s° - p^s° = n=l n=l оо = E^(n)s”-l = P«(s)-l. n=0 Отсюда и получаем, что оо Далее, ряд fa(.n) — fii сходится абсолютно (/^* < 1), по- п=0 этому в силу леммы Абеля (см. лемму 1.2.1), во-первых, суще- ствует предел lim fii(n)sn = lim Рц(з) 7 5^i-o nv 7 n=0 oo и, во-вторых, этот предел равен fa(n) — fii> T- e- n=0 Um Д(5) = /* s—>1—0
30 Глава 1. Цепи Маркова — основные понятия и факты (для возвратного состояния i значение = 1, для невозврат- ного /* < 1). Из существования lim Fa(s) = f*. и равенства s—>1—О (1.2.3) следует, что при s —> 1 — О существует lim Pais') = lim Pa(ri)sn, n=0 (бесконечный, если = 1, и конечный, если < 1), а из леммы Абеля следует, что оо оо п=0 п=0 Так что если /г* = 1 (г возвратно), то оо У2-Ргг(п) = ОО, п=0 если /г* < 1 (г невозвратно), то оо У2-Ргг(п) < °0- п=0 Следствие. Для того чтобы состояние i было невозврат- 00 но, необходимо и достаточно, чтобы ряд ^2 -Ргг(п) сходился. п=0 Ненулевые состояния; нулевые состояния, нулевые возвратные и нулевые невозвратные состояния. Состо- яние i называется ненулевым, если Рц(п) не стремится к нулю при п сю. Ненулевое состояние i всегда возвратно, поскольку для него оо ряд -Ргг(п) расходится. п=0 Состояние i называется нулевым, если при п —> оо Рд(п) 0. Нулевое состояние i может быть как возвратным, так и оо невозвратным — ряд -Ри(п) с общим членом Рц(п), стремя- п=0 щимся к нулю, может как сходиться, так и расходиться.
1.3, Существенные состояния. Классы эквивалентности 31 Заметим, что возвратное состояние i может быть как ну- оо левым, так и ненулевым — у расходящегося ряда ^и(п) °б- п=0 щий член Рц(п) может как стремиться к нулю, так и не стре- миться. Невозвратное состояние i является нулевым, поскольку для оо невозвратного состояния i ряд ^и(п) сходится. п=0 1.3 Существенные состояния. Классы эквивалентности Определение. Будем говорить, что состояние j дости- жимо из состояния i (обозначение i j), если найдется такое п > 0, что Pij(n) > 0, другими словами, j достижимо из i, если из i можно попасть в j (с ненулевой вероятностью). Поскольку Ри(0) = 1, то г всегда достижимо из i. Транзитивность свойства достижимости: если j достижимо из i, а к достижимо из j, то к достижимо из i. Действительно, из уравнения Колмогорова—Чепмена (след- ствие 2) имеем Pik(n + т) > Pij{n)Pjk(m). И так как г —> 7, а 7 —> fc, то найдутся такие п > 0 и т > 0, что РгДп) > 0, Pjk(m) > 0, поэтому Pik(n + т) > Pij(n)Pjk(m) > 0. Неравенство Pik(n + m) > 0 обозначает, что к достижимо из г. Определение. Состояния i и j будем называть сообщаю- щимися, если i достижимо из j, и j достижимо из г. Тот факт, что состояния i и j сообщающиеся, будем обозна- чать так: i j. Из определения следует, что если состояния i и j не явля- ются сообщающимися, то либо Рц(п) = 0 для всех п > 0, либо Pji(m) = 0 для всех т > 0. Из транзитивности свойства достижимости следует транзи- тивность свойства сообщаемости: если i j и j к, то ivk.
32 Глава 1. Цепи Маркова — основные понятия и факты Опр еделение. Состояние i называется существенным, ес- ли для каждого состояния j, достижимого из i, состояние i дос- тижимо из j. Состояние i существенное, если, стартовав из г, в i всегда можно вернуться. Определение. Состояние i называется несущественным, если найдется состояние j, достижимое из i, из которого i не достижимо. Состояние i несущественное, если найдется состояние j, в ко- торое из i можно попасть, но обратно в i вернуться невозможно. Несущественное состояние i является невозвратным и, как следствие, нулевым. В самом деле, если i — несущественное состояние, то най- дется состояние j, достижимое из г с ненулевой вероятностью р такое, что состояние i не достижимо из j. Поэтому вероятность Р{т = +оо|£о — 0 не меньше р и, следовательно, Р{т < оо|£о = г} < 1, т. е. i — невозвратное состояние. Классы эквивалентности. Множество всех состояний мар- ковской цепи “распадается” на несущественные состояния и су- щественные, последние, в свою очередь, образуют непересекаю- щиеся между собой классы существенных сообщающихся состо- яний. Теорема 1.3.1. Множество всех существенных состояний марковской цепи представимо в виде объединения непересекаю- щиеся классов, каждый из которых состоит из сообщающихся между собой состояний. Доказательство. Для каждого существенного состояния i рассмотрим класс состояний Si, включающий в себя состояние i и все существенные состояния, с ним сообщающиеся. Так опре- деленные классы либо не пересекаются, либо совпадают. Если Si и Sj пересекаются, то они совпадают. В самом деле, пусть k 6 Si П Sj. Тогда для любого состояния I 6 Si имеем: l^i^k^j,T. е. l^j. Последнее обозначает, что I е Sj. И так как I произвольное из класса Si, то Si С Sj. Аналогично имеем Sj С Si, поэтому Si = Sj. Определение. Класс всех существенных сообщающихся между собой состояний марковской цепи называется классом эк- вивалентности. Классы эквивалентности мы, как правило, будем обозначать буквой С, возможно с индексами. Определение. Марковская цепь, все состояния которой образуют один класс существенных сообщающихся состояний,
1.3, Существенные состояния. Классы эквивалентности 33 называется неприводимой или неразложимой марковской це- пью. Если марковская цепь содержит несущественные состояния или более одного класса существенных сообщающихся состоя- ний (или и то, и другое), то ее называют приводимой (разложи- мой) марковской цепью. В неприводимой марковской цепи каждое состояние дости- жимо из каждого. Если в матрице одношаговых переходных вероятностей вы- черкнуть строки и столбцы, соответствующие состояниям, не входящим в данный класс эквивалентности, то полученная мат- рица будет стохастической. Марковская цепь, попав в класс эквивалентности, покинуть его не может. Марковскую цепь, полученную из данной цепи сужением ее фазового пространства X до класса эквивалентности С (С С X), также будем называть классом эквивалентности. Мат- рица переходных вероятностей этой цепи получается из матри- цы переходных вероятностей [Рц] данной цепи и имеет вид [Р^], г, j € С. Определение. Пусть Мг — множество положительных чи- сел т, для которых Рц(т) > 0. Наибольший общий делитель d(i) совокупности Mj будем называть периодом состояния i. Ес- ли Mj = то по определению полагаем d(i) = 0. Если d(i) = 1, то состояние i будем называть непериодическим. Из того, что состояние i периодично с периодом с?, не следует, что Pu(d) > 0. Пример. Марковская цепь с фазовым пространством X = = {1,2,...,7} и матрицей переходных вероятностей г0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1/2 1/2 0 0 р = 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 . имеет период 2, но Рц(2) = о, i = 1,2,... ,7. Теорема 1.3.2 (солидарности). В неприводимой марковской цепи все состояния принадлежат одному типу: 1) если одно возвратно, то все возвратны; 2) если одно нулевое, то все ну- левые; 3) если одно периодично с периодом d, то все периодичны с периодом d.
34 Глава 1. Цепи Маркова — основные понятия и факты Доказательство. Пусть i и j — различные состояния. Для любых n, s, m Рц(п + s + m)> Pij(n)Pjj(s)Pji(m) (в силу следствия 4 из уравнение Колмогорова-Чепмена). Так как цепь неприводимая, то найдутся числа пит (зафиксируем их), такие что Pij(n) = a > 0, Pji(m) = /3 > О, поэтому Рц(п + s + m) > a/3Pjj(s). (1.3.1) Аналогично Pjj(m + г + п)> а/ЗРц(г). (1.3.2) Поскольку г и s произвольны, то можно выбрать г так, чтобы т + г + п = s. Тогда последнее неравенство перепишется так: Pjj(s) > a/3Pa(s - (n + m)). (1.3.3) Из неравенств (1.3.1) и (1.3.3) имеем af3Pu(s - (n + m)) < Pjj(s) < -^Pa(s + + m))- Отсюда следует, что асимптотические свойства Рц(к) и Pjj(k) одинаковы: если Рц(к) 0 (состояние i нулевое), то ясно, что и Pjj(k) 0 (состояние j нулевое); если ^Рц(к) = оо к (состояние i возвратное), то и = °° к (состояние j возвратное). Установим, что с?(г) = d(f) — все состояния имеют один и тот же период. В силу неприводимости цепи найдется г такое, что Рц(г) > О,
1.3, Существенные состояния. Классы эквивалентности 35 и такие пит, что Pjj(m + г + п) > а/ЗРц(г) > О, а вместе с ними и Pjj(m + 2г + п) > ос/ЗРц(2г) > а/ЗРц(г)Рц(г) > О (см. (1.3.2)), т. е. Pjj(m + 2г + п) > О и Pjj(m + г + п) > 0. Из определения периода d(J) состояния j следует, что d(J) — делитель чисел (т + г + п) и (т + 2г + п), а, следовательно, и числа (т + 2г + п) — (т + г + п) = г. Так что d(J) — делитель чисел г > 0, для которых Рц(г) > 0, а с?(г), как период г, — наибольший общий делитель таких чисел, поэтому d(J) < d(i). Аналогично с?(г) < c?(j), следовательно с?(г) = d(j). Тем самым теорема доказана. Из теоремы солидарности следует корректность таких опре- делений. Определение. Неприводимую марковскую цепь будем на- зывать ненулевой, если хотя бы одно ее состояние ненулевое, ну- левой, если хотя бы одно ее состояние нулевое, возвратной, если хотя бы одно ее состояние возвратное, периодической с перио- дом d, если хотя бы одно ее состояние периодическое с перио- дом d, и т. д. Аналогично класс эквивалентности будем называть ненуле- вым, если хотя бы одно его состояние ненулевое, нулевым, если хотя бы одно его состояние нулевое, возвратным, если хотя бы одно его состояние возвратное, и т. д. Теорема 1.3.3. В нулевом классе эквивалентности для лю- бых i,j Pij(m) -> 0 при т -4- +сю. Доказательство. Действительно Pjj(n + т) > Pji(n)Pij(m). (1.3.4) Поскольку i,j принадлежат одному и тому же классу эквива- лентности, найдется п, что Pji(n) > 0. Поэтому из неравенства (1.3.4), учитывая, что Pjj(n + m) 0 при т —> +схз, получаем, что и Pjj(m) -4- 0 при т -4- +сю.
36 Глава 1. Цепи Маркова — основные понятия и факты Теорема 1.3.4 (асимптотика нулевой цепи). Неприводимая нулевая марковская цепь {£п} с фазовым пространством X = {0,1,2,...} при п +оо сходится по вероятности к +оо : для любого М > 0 при п сю Р{£п >м}^1. Доказательство. Для произвольного фиксированного М оценим Р{£п < М}, воспользовавшись (1.1.8): М М оо Р{£п < ЛО = Е = 0 = Е = ?=0 ?=0 к=0 оо М КМ оо М = ^Рк Pki(jl) = ^Pk Pki(jl) + Р^(п) < k=0 ?=0 к=0 ?=0 к=К+1 ?=0 КМ оо <Е^Ер^и + Е рк- к=0 ?=0 к=К+1 Последнее слагаемое можно сделать меньше данного е за счет выбора К, а первое слагаемое за счет выбора п — в неприводи- мой нулевой марковской цепи для любых /с, i при п —> +оо •PfciW -> °- Тем самым теорема доказана. Следствие. Невозвратная неприводимая марковская цепь {£п} с фазовым пространством X = {0,1,2,...} при п +оо сходится по вероятности к +оо : для любого М > 0 при п оо Р{£п > М} -> 1. Доказательство. Невозвратная марковская цепь являет- ся нулевой. Замечание. Теорема и следствие имеют место и для мар- ковской цепи с фазовым пространством X = {...,—1,0,1,2,...}. Пример 1.3.1. Марковская цепь с фазовым пространством X = {1,2,3} описывается матрицей одношаговых переходных вероятностей ’ 0 1 0 ' О 1/2 1/2 . О 1/2 1/2
1.3, Существенные состояния. Классы эквивалентности 37 Классифицировать состояния цепи (указать существенные, несущественные, периодические, непериодические состояния). Решение. Состояние 1 имеет период, равный нулю. Состояние i заведомо непериодическое, если с ненулевой ве- роятностью из i можно вернуться в г за один шаг. Поэтому со- стояния 2 и 3 — непериодические. Состояние 2 достижимо из состояния 1. Состояние 1 недо- стижимо ни из 2, ни из 3. Состояние 1 несущественное, состо- яния 2 и 3 — существенные. Состояния 2 и 3 сообщающиеся, 1 и 2 — несообщающиеся. Цепь приводима, поскольку в ней имеются несущественные состояния. Пр им ер 1.3.2. Классифицировать состояния марковской цепи, описывающей азартную игру, см. пример 1.1.2 (с. 13). Решение. Если капитал игрока Gm конечен (равен М), то состояния 0 и п (п = т + М) являются поглощающими экра- нами; состояния 1,2, ...,п — 1 являются несущественными, а, следовательно, и невозвратными. Если капитал игрока Gm бесконечен, то состояние 0 являет- ся поглощающим экраном; состояния 1,2,..., являются несуще- ственными и невозвратными. Пример 1.3.3 (одномерное случайное блуждание, продол- жение). Рассмотрим одномерное случайное блуждание по це- лочисленной решетке — марковскую цепь, описывающую дви- жение частицы, которая за единицу времени перемещается с вероятностью р на единицу вправо и с вероятностью q на единицу влево (р + q = 1); состояние цепи — координата частицы в момент времени п (см. также пример 1.1.1). Исследовать на возвратность состояния описанной мар- ковской цепи. Решение. Поскольку цепь неприводимая, достаточно ис- следовать на возвратность, например, состояние 0. Необходи- мым и достаточным условием возвратности состояния 0 являет- оо ся расходимость ряда Лю(^)- Исследуем этот ряд на сходи- п=0 мость. Очевидно, Роо(2п +1) = 0. Поэтому оо оо £РОоИ = Ррр(2п). п=0 п=0 Выпишем подробнее выражение для Ррр(2п). Вероятность того, что цепь, стартовав из состояния 0 (Р{£о — 0} — Ро — 1),
38 Глава 1. Цепи Маркова — основные понятия и факты вернется в состояние 0, пройдя по данному пути {£о = 0,£1 = Ч, • • • ,£2п-1 = ^2п-1,^2п = 0}, равна Р{& = 0,£1 = й, • • • ,£гп = О|£о = 0} = poFoiiFhi2 • • • ^2n-i0 — — ^0?1 Piii2 • • • -^22n-10 (см. (1.1.7)). При этом число перемещений вправо равно числу перемещений влево. Поэтому в последнем произведении п со- множителей равно р и п сомножителей — q. Само произведение Foil• • • Fi2n_i0 равно pnqn. Путь из 0 в 0 длиной 2п опре- деляется словом длиной 2п, составленным из двух букв: П — вправо и Л — влево. Число всех таких слов, а вместе с ними и путей из 0 в 0, равно С^. И, следовательно, Poo(2n) = C?„pV = ^pV. Далее, воспользовавшись формулой Стирлинга: n\ ~ nne nV2irn при п оо, получим, что при п —> оо Р00(2п) = ^-pnqn n\n\ (2n)2ne 2»х/2^ _ _ (4pg)n (ппе-пу2тт)2 у/кп у/тгп т. е. Poo(2n) ~ (1.3.5) у/ТГП Поэтому оба ряда оо У2-Роо(2п) и п=0 сходятся или оба являются расходящимися.
1.3, Существенные состояния. Классы эквивалентности 39 Рассмотрим общий член ' ряда V . Произведе- V7rn n=o V7ГП ние pq (0 < р < 1, 0 < q < 1) принимает наибольшее значение, равное 1/4, при р = q = 1/2, что следует из равенств pq = р(1 - р) = р - р2, 0 < р < 1. Поэтому 0 < 4pg < 1, и 4pg = 1 только при р = q = 1/2. Следовательно, при р = q = 1/2 (4pg)n = 1 у/тт у/тт^ а ряд с таким общим членом расходится. Если р Q, то 4рд = с < 1. Ряд с общим членом сп/у/тт (с < 1) является сходящимся. Итак, при р = q = 1/2 марковская цепь возвратна, а при р q невозвратна (заключение о возвратности или невозврат- ности цепи мы делаем по возвратности или невозвратности со- стояния 0, поскольку цепь неприводимая). Конечные цепи Маркова. Далее посмотрим, что можно сказать о состояниях марковской цепи, если цепь конечна — ко- нечно ее фазовое пространство. Теорема 1.3.5. Конечная неприводимая цепь Маркова яв- ляется ненулевой. Доказательство. Пусть М — число состояний конечной неприводимой цепи. Стартуя из состояния г, за п шагов цепь с вероятностью 1 окажется в одном из своих возможных состоя- ний, поэтому м = (L3-6) J=1 Если предположить, что цепь нулевая, то для любых г, j из фа- зового пространства А?(П) О при п —> оо (см. теорему 1.3.3). Переходя в равенстве (1.3.6) к пределу при п —> оо, получаем противоречие: 0=1. Так что в конечной цепи все состояния ненулевые. Следствие!. Конечная неприводимая марковская цепь воз- вратна. Поскольку в конечной неприводимой марковской цепи каж- дое состояние i ненулевое — Рц(п) при п —> оо не стремится к
40 Глава 1. Цепи Маркова — основные понятия и факты нулю, то ряд ^Рц(п) расходится, и, следовательно, состояние i возвратно. Следствие 2. Невозвратный класс эквивалентности не может быть конечным. Теорема. В конечной марковской цепи хотя бы одно сос- тояние существенное. Доказательство. Обозначим через X = {1,2,..., М} фа- зовое пространство конечной марковской цепи. Предположим, что все состояния цепи несущественные. Пусть в начальный мо- мент цепь находится в состоянии i\. Так как — несуществен- ное, то найдется состояние 22, в которое из можно попасть с ненулевой вероятностью, но вернуться из в невозмож- но. Состояние 22 также несущественное, поэтому найдется со- стояние 2з, в которое из 22 можно попасть, но вернуться в 22 невозможно, невозможно из 23 попасть и в 21, так как тогда из 22 можно было бы вернуться в 21 (через 23), что невозможно, и так далее. За М или меньшее число шагов мы окажемся в некотором состоянии im (т < М), из которого нельзя попасть в 21,22, • •2m-i по построению, а в другие (если такие еще оста- нутся) нельзя попасть, в силу их недостижимости из im. По- этому цепь с вероятностью 1 остается в состоянии 2Ш, т. е. за каждый последующий шаг она переходит с вероятностью 1 из im в im- Последнее обозначает, что im — существенное состояние. Полученное противоречие и доказывает утверждение. Возвратные и невозвратные классы. Понятие возврат- ности состояния введено безотносительно к другим состояниям цепи. Здесь мы рассмотрим возвратные и невозвратные классы состояний. Пусть j i. Введем обозначения ЛДА:) = Р{Со = г, 4 = ± j, и = 1,2,... ,k - 1|Со = г}, к = 2,3,..., для к = 0 и 1 положим /о(0) = О, ЛД1) = Р{£о = г,6 = Жо = г}; fij(k) — вероятность первого достижения состояния j из состо- яния 2 на к-м шаге. Обозначим вероятность достижения j из i (j 2) через /*-, ясно, что оо к=0
1.3, Существенные состояния. Классы эквивалентности 41 Мы часто будем пользоваться приведенными далее соотно- шениями между и , когда г, j принадлежат данному классу эквивалентности. Уравнения для f*j и для Для гД из одного класса эквивалентности при каждом п (п = 1,2,...) ^ = Ру(п)+ £ PMfkj. (1.3.7) kex\{j} Для состояний i из данного класса эквивалентности при каждом п (п = 1,2,...) /^ = рй(п)+ £ Pik(n)f*ki. (1.3.8) kex\{i} Далее через Pij(s) будем обозначать производящую функ- цию последовательности {Р^(п)}: оо p0(s) = £p0(fc)s\ и < I, k=Q а через Fij(s) — производящую функцию последовательности ОО Рг^ = ^Ык)8к, |в|<1. к=0 Аналогично тому, как было получено соотношение (1.2.4), получаем Pij(n) = 52 fij^P3i(n п- °> 3 И i- (1-3.9) k=0 Из теоремы о произведении степенных рядов (теорема 1.2.1) и равенства (1.3.9), аналогично тому как было получено соотно- шение (1.2.3) между производящими функциями Рц(з) и Fu(s), получаем Pij(s) — Fij(s)Pjj(s)) Н < 1. (1.3.10)
42 Глава 1. Цепи Маркова — основные понятия и факты Теорема 1.3.6 (необходимые и достаточные условия невоз- вратности состояния в классе). Пусть i,j принадлежат одному классу эквивалентности. Для того, чтобы состояние j было оо невозвратным, необходимо и достаточно, чтобы ряд Pij (п) п=0 сходился. оо Доказательство. Поскольку /*• = < 1, то в д=о силу леммы Абеля всегда существует lim^F^(s) и оо JiniQFy(s) = S k=Q оо Если j — невозвратное состояние, то ряд Pjj^J1) сходится, п=0 и в силу леммы Абеля оо п=0 Поэтому при <s —> 1 — О существует конечный предел правой части равенства Pij(s) = Pij(s)Pjj(s) , а, следовательно, и левой, и в силу леммы Абеля оо п=0 оо Так что если j невозвратно, ряд Рц(п) сходится. п=0 оо Установим, что из сходимости ряда Piji™) следует невоз- п=0 вратность состояния j. Из равенства (1.3.10) имеем Pjj(s) — Pij^/Fij^. (1.3.11)
1.3, Существенные состояния. Классы эквивалентности 43 Из сходимости рядов Ргз(п) и 12 fij(k) следует существо- n=0 к=0 вание конечных пределов lim Рц(з) и lim Рц(з) (см. лем- $->1-0 J $—>1—0 J му Абеля), а вместе с ними существование конечного предела lim Pjj(s) (см. равенство (1.3.11)). Поэтому в силу леммы Абе- оо ля ряд сходится, а, следовательно, состояние j невоз- п=0 вратно. Следствие 1. Пусть i, j принадлежат одному классу эк- вивалентности. Для того, чтобы состояние j было возврат- но ным, необходимо и достаточно, чтобы ряд расходил- п=0 ся. Следствие 2. Для любых i,j из невозвратного класса эк- вивалентности При П СЮ О- оо Коль скоро состояние j невозвратное, то ряд Fiji™) схо- п=0 дится и, следовательно, Pij(n) 0. Теорема 1.3.7 (/^ в невозвратном классе). В невозврат- ной неприводимой марковской цепи для каждого i из фазового пространства X найдется состояние j Е X, j i такое, что f* < 1 Доказательство. Из равенства (1.3.8) при п = 1 имеем fii = Pa+ Е Pikf*ki. kex\{i} Если предположить, что в невозвратной цепи = 1 для всех к 6 X \ {г}, то последнее равенство можно переписать так: fu = Pu+ Е р* kex\{i} или так: /й = Ер^- кех Отсюда имеем
44 Глава 1. Цепи Маркова — основные понятия и факты fii = 1, что противоречит невозвратности цепи. Следствие. Если в неприводимой марковской цепи най- дется состояние i такое, что для любого j / i значение f*i = 1, то цепь возвратна. Доказательство. В невозвратной цепи для каждого i найдется j, такое, что < 1. Теорема 1.3.8 (/^ в возвратном классе). В возвратной не- приводимой марковской цепи для каждой пары j,i из фазового пространства X значения f*. = 1 Доказательство. Для каждого п (п = 1,2,...) & = Рц(п) + £ PMfki kex\{i} (см. равенство (1.3.8)), а поскольку цепь возвратна, т. е. = 1, то для каждого п (п = 1,2,...) Рц(п) + 52 Pik(n)fki = l. (1.3.12) kex\{i} С другой стороны, для каждого п (п = 1,2,...) Рц(п)+ 52 Pik(n) = l. (1.3.13) kex\{i} Вычитая последовательно из равенства (1.3.13) равенство (1.3.12) получим 52 Pffc(n)(l - fki) = 0. (1.3.14) kex\{i} для всех п = 1,2,... Если предположить, что найдется пара j, i U 7^ я), у которой < 1, то из равенства (1.3.14) следует, что для всех п = 1,2,... значения Ptj(ri) должны быть равны нулю. Но цепь неприводима, поэтому найдется хотя бы одно п, для которого Pij(n) > 0. Полученное противоречие и доказывает теорему.
1.3, Существенные состояния. Классы эквивалентности 45 Так что в возвратном классе эквивалентности для любых j, i значение f* = 1. Следствие. Если в классе эквивалентности найдется па- ра состояний i,j таких, что f*j < 1, то класс является невоз- вратным. В самом деле, в возвратном классе /* = 1 для любых i,j. Теорема (о вероятности посещения состояния). Марков- ская цепь с вероятностью 1 посещает возвратное состояние бесконечно много раз, а невозвратное с вероятностью 1 посе- щает конечное число раз. Доказательство. Введем обозначения = {цепь посещает состояние i бесконечно много раз}, = {цепь посещает состояние i не менее N раз}. Ясно, что <«> С Л™, ОО Л-, = П 4 4 || 4 4 ' N=1 в справедливости равенства убеждаемся непосредственной про- веркой. Вычислим P(A*J£o — 0- Воспользуемся свойством непре- рывности вероятности: Р(Л*^о = 0 = limP(4JV)|eo = г). Обозначим Q(y = Ко = *)• Очевидно, QT = N = 2,3,... Отсюда Qu =(fii)N, tv = 2,3,... leo = i) = UmQW = lim(/*r
46 Глава 1. Цепи Маркова — основные понятия и факты Поэтому если состояние i возвратно, т. е. = 1, то = 0 = 1, а если состояние i невозвратно, т. е. < 1, то Р(^Ко = г) = 0. Тем самым теорема доказана. Резюме. Состояния марковской цепи делятся на несуще- ственные и существенные. Множество существенных состояний распадается на непе- ресекающиеся классы существенных сообщающихся между со- бой состояний — классы эквивалентности. Каждый класс эквивалентности является нулевым или ненулевым. Нулевой класс эквивалентности может быть как возврат- ным, так и невозвратным. Периодические цепи. Пусть {£&} — марковская цепь. Для данного фиксированного целого t > 0 определим последователь- ность случайных величин {£&}: Ck = £kt, к = 0,1,2,... Последовательность {£&} образует марковскую цепь — для {£&} выполняется марковское свойство. Пусть Р = [Pij] — матрица переходных вероятностей марков- ской цепи {£&}: — -Р{£а;+1 — jI'Oc = a Q = [Qij] — матрица переходных вероятностей марковской цепи {CJ: Qij = -^{Cfc+l = 31Ск = Из определения цепи {£&} имеем Qij = -^{C/c+l — j\Ck — 0 — P{£(k+l)t = JlCfct = i} = = P{£kt+t — JlCfct = i} = t. e. Qij = Pijti), i,3
1.3, Существенные состояния. Классы эквивалентности 47 или в матричной форме Q = P(f) = (Р/. Для любого целого s > О = -^{Gh-s = j\Ck — 0 — = i} = = P{£kt+st = JlCfct = /} = P^st), т. e. Qij(s) = Pij(st), i,j € X, (1.3.15) или в матричной форме Q(s) = P(sf). Марковскую цепь с матрицей переходных вероятностей Р бу- дем называть Р-цепью. Из определения Р-цепи {£&}, Q-цепи {£&} и равенства = X, следует, что состояние j достижимо из i в Q-цепи за s шагов тогда и только тогда, когда в P-цепи j достижимо из i за st шагов. Теорема 1.3.9 (о структуре периодической марковской це- пи). 1° В неприводимой периодической с периодом t марковской P-цепи фазовое пространство G представимо в виде объеди- нения t непересекающихся классов G$,G\,... ,Gt-\, P-цепь за один шаг из класса Gy переходит в класс Gy+\ (и = 0,1,... ... Д - 2), из класса Gt-\ в класс Go; за st (s = 1,2,...) шагов P-цепь из класса Gy переходит в класс Gy. 2° В Q-цепи (Q = P(t)) каждый из классов Go,Gi,... ,Gt-i является непериодическим классом эквивалентности. 3° Если P-цепь возвратна, то каждый из классов эквива- лентности Go, Gi,..., Gt-i в Q-цепи является возвратным. Доказательство. Сначала докажем, что для периодиче- ской с периодом t марковской цепи имеет место следующее свой- ство: Лемма. Если состояние i достижимо из состояния j за и за П2 шагов (P^(ni) > 0, P^(ri2) > 0), то ni и П2 предста- вимы в виде
48 Глава 1. Цепи Маркова — основные понятия и факты П1 = V + Sit, П2 = v + S2t, 0 < и < t — 1, (1.3.16) причем и определяется единственным образом. Из следствия 2 теоремы 1.1.1 (уравнение Колмогорова-Чеп- мена) имеем Pjj(ni + т) > Р^(щ)Р^(т), Pjj(n2 + m) > Pji(n2)Pij(m). Из неприводимости цепи следует существование хотя бы одно- го т, для которого Р^-(т) > 0, далее т минимальное из таких чисел (оно единственно). Поэтому Pjj (rii + т) > О, Pjj(n2 + m) > 0. Отсюда, поскольку цепь периодична с периодом t, следуют пред- ставления ni + т = s'it, п2 + т = s2t, или ni = s'it — т, П2 = s2t — т. или ni = (s'it — st) + (st — т) = sit + z/, П2 = (s2t — st) + (st — m) = S2t + z/, где v = st — m. Выбрав s так, чтобы и лежало между 0 и t — 1 (та- кое и определяется единственным образом), получим требуемое представление. Тем самым лемма доказана. Представление п = v + st, 0 < I/ < t — 1, для числа п шагов, за которое в периодической с периодом t цепи состояние i достижимо из состояния j, дает возможность разбить фазовое пространство G марковской цепи на t непересе- кающихся классов следующим образом. Поскольку цепь непри- водима, то каждое состояние достижимо из состояния 1, причем в силу леммы только за число шагов вида п = v + st, 0 < 1у < t — 1.
1.3, Существенные состояния. Классы эквивалентности 49 Отнесем в класс Go все состояния марковской цепи, достижимые из состояния 1 за п = 0 + st шагов. В класс Gi отнесем все состояния, достижимые из 1 за п = 1 + st шагов, и т. д., в класс Gy отнесем все состояния, достижимые из 1 за п = у + st шагов (0 < у < t — 1).А поскольку у в представлении п = у + st единственно, то классы Gy, у = 0,1,..., t — 1, не пересекаются. Далее, пусть цепь находится в состоянии i из класса Gy (у = 0,1,... , t — 2), т. е. состояние i достижимо из состояния 1 за st + у шагов. За один шаг из состояния г класса Gy цепь пе- рейдет в некоторое состояние j. Состояние j достижимо из 1 за (s£ + z/) + l = s£ + (i/+l) шагов, поэтому j принадлежит классу 6^+1. Таким образом, P-цепь из класса Gy за один шаг перехо- дит в класс G^i, а из класса Gt-i за один шаг цепь переходит в класс Go- Пусть i 6 Gy, т. е. i достижимо из состояния 1 за y+s't шагов, и пусть сделано st шагов, при этом цепь оказалась в некотором состоянии 7, которое достижимо из состояния 1 за у + s't + st = = у + (s' + s)t шагов. Поэтому j 6 Gy. Так что за st шагов цепь переходит из класса Gy в класс Gy. Убедимся, что в Q-цепи каждый из классов Gy является классом эквивалентности. В самом деле, все состояния из класса Gy сообщаются в P-цепи, причем только за число шагов вида st, т. е. для дан- ных г, j найдутся числа и S2, что Pjj(sit) > 0, Pjj(s2t) > О или, что то же Qij(si) > 0, Qji(s2) > 0. Два последних нера- венства обозначают, что каждые два состояния i,j из класса Gy сообщаются в Q-цепи. Далее, в Q-цепи состояния из класса Gy сообщаются только с состояниями из Gy. Действительно, пусть i е Gy и i j, т. е. существует такое s, что Qij(s) > 0, а, следовательно, и Pij(st) > 0. Но из состояния i е Gy в P-цепи за st шагов можно попасть только в состояние из класса Gy, поэтому j е Gy. Убедимся, что класс эквивалентности Gy в Q-цепи неперио- дический. Предположим обратное. И пусть j е Gy и н. о. д. тех чисел и, для которых Qjj(u) > 0 равен d > 1, т. е. числа и имеют вид и = vd. Переход из j в j в P-цепи возможен только за число шагов вида ut, при этом 0 < Qjj(u) = Qjj(vd) = Pjj((vd)t) = Pjj(v(dt)).
50 Глава 1. Цепи Маркова — основные понятия и факты Отсюда следует, что период состояния j в P-цепи не менее dt, причем dt > t. Но период P-цепи равен t. Это противоречие и доказывает, что Q-цепь является непериодической. Осталось проверить, что если P-цепь возвратна, то каждый из классов Gy в Q-цепи возвратен. Пусть i 6 Gy. Состояние i воз- вратно в P-цепи, что равносильно расходимости ряда ^Рц(п). Но в P-цепи из состояния i класса Gy в состояние i можно вер- нуться только за st шагов, поэтому ^Piiin) = 'Y^Pu(st') = y^Q tils') n s s (воспользовались (1.3.15)). Так что ряд Qu(s) является расхо- s дящимся и, следовательно, i — возвратное состояние в Q-цепи. Теорема доказана. Замечание Если в периодической с периодом t марков- ской цепи состояние i достижимо из j 6 Gf за п шагов, то п = у + st, 0 < у < t — 1, при этом за первые у шагов цепь, последовательно переходя из класса в класс, перейдет в класс Gf+y, а затем за каждые последующие t шагов будет переходить из класса Gf+y в класс Gf+y, пока не окажется в состоянии i. Пример 1.3.4 (Q-цепь для случайного блуждания). Рас- смотрим одномерное случайное блуждание по целочисленной решетке с вероятностью р перехода на единицу вправо и с ве- роятностью q перехода на единицу влево (р + д=1, 0<р<1), см. также пример 1.1.1. P-цепь неприводима и имеет период 2. А потому матрица переходных вероятностей (Q-цепи Q = (Р)2. Фазовое пространство Z представимо в виде объединение двух непересекающихся классов Go и G\, а именно Go = {..., -2п,..., -2,0,2,..., 2п,...}, Gi = {..., -(2n + 1),..., -3, -1,1,3,..., 2п + 1,...}. При этом мы за один шаг в P-цепи переходим из класса Go в класс Gi, а из Gi в Go. В Q-цепи Go и Gi являются неперио- дическими классами эквивалентности.
1.3, Существенные состояния. Классы эквивалентности 51 Пример 1.3.5. Марковская цепь с фазовым пространством {1,2,3,4} задана матрицей одношаговых переходных вероятнос- тей "О 01/2 1/2 ' р_ о 0 1 О 1 О О О • 1/2 1/2 О О Классифицировать состояния марковской цепи. Убедиться, что цепь периодична. Пусть t — период цепи, представить фазовое пространство в виде: G = Go U Gi U ... U Gt—\. В Q-цепи (Q = P(t)) найти матрицу переходных вероятностей для классов эквивалентности Go,Gi, • • • , G*-i. Классифициро- вать состояния в классах эквивалентности Gy, и = 0,1,... ...,t- 1. Решение. Цепь неприводимая. Из состояния 1 в состояние 1 можно попасть только за четное число шагов: 2,4,6,... Поэтому состояние 1, а вместе с ним и цепь, периодична с периодом 2. Фазовое пространство G (согласно теореме 1.3.9) представи- мо в виде G = G0UGi = {1,2} U {3,4}. Класс Go образуют состояния, в которые из состояния 1 можно попасть 3ast + 0 = s- 2 + 0 шагов, такими состояниями являют- ся {1,2}. Класс Gi образуют состояния, в которые из 1 можно попасть 3ast+l = s- 2+ l шаг, такими состояниями являются {3,4}- Каждый из классов Gq и Gi в Q = Р(2)-цепи является неперио дическим возвратным классом эквивалентности. Матрица переходных вероятностей Q-цепи Q = Р(2) = (Р)2 = 0 0 1 1/2 0 0 о 1/2 1/2 1/2 I Г 0 1 0 0 0 0 1 ’ 3/4 1/4 0 1 о о 0 0 1/2 0 0 3/4 0 1/2 1/2 0 1 о ООО 1/2 0 0 0 ' 0 1/2 • 1/4 J
52 Глава 1. Цепи Маркова — основные понятия и факты Матрица переходных вероятностей <Qo класса эквивалентнос- ти Gq: 3/4 1/4 1 О Матрица переходных вероятностей <Q*i класса эквивалентнос- ти Gp. ’ 1/2 1/2 ‘ 3/4 1/4 ’ 1.4 Примеры и задачи Примеры Пример 1.4.1. Матрица переходных вероятностей марков- ской цепи с фазовым пространством X = {1,2,3} имеет вид Р = ’ 0,1 0,5 0,4 ‘ 0,6 0,2 0,2 0,3 0,4 0,3 Распределение цепи (по состояниям) в момент t = 0, другими словами, распределение случайной величины имеет вид / 1 о 3 \ ( 0,7 0,2 0,1 )• Найти: 1° распределение цепи в момент t = 2; 2° вероятность того, что в моменты t = 0, 1, 2, 3 цепь бу- дет находиться соответственно в состояниях 1, 3, 3, 2, т. е. найти Р{£о = 1, £i = 3, £2 = 3, £з = 2}. Решение. 1° Воспользуемся равенством (1.1.8) при п = 2, X = {1,2,3}: з P{^=j} = ^PiPij^, / = 1,2,3. i=l 2° В силу теоремы 1.1.2 (см. (1.1.7)) искомая вероятность выражается через начальное распределение цепи и одношаговые переходные вероятности: Р{£о = 1, £1 = з, & = 3, 6 = 2} = = Р{£0 = 1}Р1зРззРз2 = 0,0336.
1.4. Примеры и задачи 53 Пример 1.4.2. Марковская цепь с фазовым пространством X = {1,2,3,4,5} задается матрицей одношаговых переходных вероятностей p = [Pij] = Г 0 1/3 1/3 1/3 0 0 0 0 1/2 0 0 1/2 .000 0 1/3 1/2 1/2 0 1/3 ] 1/3 0 0 1 J Классифицировать состояния цепи. Решение. Состояния 1 и 2 — несущественные, так как из 1 и из 2 можно с ненулевой вероятностью попасть в 5, но вернуться из состояния 5 невозможно (цепь приводима). Состояния 3 и 4 — существенные, 5 — существенное. Состояния 3 и 4 образуют класс эквивалентности (конеч- ный), поэтому состояния 3 и 4 ненулевые и возвратные (см. тео- рему 1.3.5). Состояние 5 образует класс эквивалентности, 5 ненулевое, возвратное состояние. Состояния 3,4,5 — непериодические. Пример 1.4.3. Симметричную игральную кость подбрасы- вают независимым образом неограниченное число раз. Пусть — число выпавших очков при к-м подбрасывании кости, к = = 1,2,... Рассмотрим последовательность случайных величин Т)п = max{£i,£2,---,&i}, п= 1,2,... Показать, что последовательность {г?п} образует марковскую цепь, найти ее матрицу переходных вероятностей, классифи- цировать состояния цепи. Решение. Заметив, что T]n+1 = max{£i,£2, • • • ,Сп,Сп+1} = max{r?n,£n+i}, получим P{Vn+i =j\nn = г,бп-1 = = Й} = = -Pfa+1 = j,^?n =n} = P{rin = = in-i,... ,771 =zi} _ P{max{^n+i = j,r)n = j, = tn-i,..., тд = ?i} _ Р{Пп =i,r]n-i =ii}
54 Глава 1. Цепи Маркова — основные понятия и факты _ -P{max{gn+i,z} = j,pn = i,T]n-i = in-i, = zj _ P{fln = -,rn= Z1} = P{max{£n+1,z} = j}P{r/n = г,рп-1 = zn t... ,771 = zi} = P{z?n = z,z/n-i = . .,m= 71} = P{max{£n+1, z} = j}. Воспользовались независимостью событий {max{Cn+i,z} = j}, {т)п = i,... ,тц = zj. Аналогично получаем P{rh+1 = j\rin = z} = P{max{£n+1, z} = j}- Откуда и следует, что для последовательности случайных ве- личин {рп} имеет место марковское свойство и, следовательно, последовательность {т/п} является марковской цепью, причем стационарной. Матрица одношаговых переходных вероятностей цепи Pij = Р{т]п+1 = j\r]n = г} = -P{max{£n+i,z} = /}, z,j = 1,2,...6, подробнее Г 1/6 1/6 1/6 1/6 1/6 1/61 0 2/6 1/6 1/6 1/6 1/6 II II 0 0 3/6 1/6 1/6 1/6 0 0 0 4/6 1/6 1/6 0 0 0 0 5/6 1/6 0 0 0 0 0 1 J Состояния 1,2,..., 5 несущественные. Состояние 6 существен- ное, оно образует класс эквивалентности и является возврат- ным, непериодическим. Пример 1.4.4. Монету, вероятность выпадения герба ко- торой равна р (0 < р < 1), подбрасывают независимым образом неограниченное число раз. Пусть ~ число выпавших гербов при k-м подбрасывании монеты, к = 1,2,... Рассмотрим по- следовательность случайных величин Z?n+1 = (z?n + 1)/{1}(Сп+1), % = о, п = 0,1,2,... Показать, что последовательность {??„} образует марковскую цепь, найти ее матрицу переходных вероятностей, классифи- цировать состояния цепи.
1.4. Примеры и задачи 55 Решение. В том, что последовательность образует марков- скую цепь, убеждаемся аналогично тому, как это делалось в при- мере 1.4.3. Элементы матрицы одношаговых переходных вероятностей цепи г, f -| q P{fln+1 = j, Т)п = О P(,„+1=*„=.} = —5— = = Р{(т)п + l)J{i}(gn+i) = j,rin = г} = Р{т1п = г} _ Р{(г + l)J{i}(gn+i) = j,r)n = г} _ Р{т1п = г} = Р{(.г + 1)/{1}(Сп+1) = э}Р{т)п = г} = Р{т>п = 0 = Р{(г + 1)/{1}($п+1) = j}, Pij = P{(i + 1)-^{1}(£п+1) = € X. Матрица переходных вероятностей цепи q р О О О q 0 р О О q 0 0 р О Цепь неприводима, непериодична. Убедимся, что цепь возвратна. Для этого проверим, что со- стояния 0 возвратно (см. теорему солидарности). Достаточным условием возвратности состояния 0 является расходимость ряда оо У>о,о(п) П=1 (см. терему 1.2.2). Непосредственной проверкой последовательно получаем, что Fo,o(l) = <7, Род(2) = <7, Род(3) = <7,..., Род(п) = q,...
56 Глава 1. Цепи Маркова — основные понятия и факты — для того чтобы найти Ро,о(^ + 1) достаточно знать только первый столбец матрицы Р(п), поскольку P(n+ 1) = РР(п), п = 1,2,..., а первый столбец матрицы Р(п) имеет вид (q Ч Ч <1 •••)'• Поэтому оо оо 52n,ow = 52 = с». П=1 П=1 Другое доказательство возвратности состояния 0: оо Р{т < <х>\т)0 = 0} = 52 р{т = «Ь» = 0} П=1 = Р(Р) + Р(ГР) + Р(ГГР) + ... = = q+pq + p2q + ... = + р + р2 + ...) = = 1 1 -Р (буква Г обозначает выпадение герба, буква Р — выпадение ре- шетки) . Замечание. Марковская цепь {т/п} описывает длину серии успехов в последовательности независимых испытаний с вероят- ностью успеха р в одном испытании. Каждая новая серия начи- нается после неудачи. Пример 1.4.5 (случайное блуждание по двумерной решет- ке). Рассмотрим симметричное случайное блуждание по дву- мерной целочисленной решетке: вероятности смещения на еди- ницу вправо, влево, вверх, вниз равны по 1/4. Исследовать на возвратность состояние 0(0; 0) — начало координат. Решение. Возвращение из 0(0;0) в 0(0;0) обеспечивают траектории (пути), состоящие из i перемещений влево, i переме- щений вправо, j перемещений вверх, j перемещений вниз (всего перемещений 2г + 2j = 2п). Каждая такая траектория опреде- ляется словом длиной 2п, составленным из i букв П (вправо), i букв Л (влево), j букв В (вверх), j букв Н (вниз). Вероятность частице пройти из 0(0; 0) в 0(0; 0) по данной траектории длиной 2п равна (1/4)2п, по траектории длиной 2п,
1.4. Примеры и задачи 57 состоящей из i перемещений влево, i перемещений вправо, j пе- ремещений вверх, j перемещений вниз равна (2п)! /1\2” коэффициент при (1/4)2" равен числу слов длиной 2п, состав- ленных из букв П, Л, В, Н соответственно в количестве г, г, j, j. А вероятность Роо(2п) возвращения из 0(0; 0) в 0(0; 0) равна Р00(2п) = (2п)! (i,iJJ):2i+2j=2n /1\2п ул (2п)!п!п! _ /1\2п (2п)! ул п!п! \4/ п\п\ ihljlj! (W,j)'-i+j=n / -] \ 2п п / \ 2п ___ / 1 I z^n \ __ I 1 । гуп гуп “ y4y ~ \4/ C2nC2n’ воспользовались тождеством n Era s~ii ______ s^n — ^2n i=0 Используя формулу Стирлинга (см. пример 1.3.3), получим Ряд с общим членом 1 /(тгп) расходится, поэтому состояние 0(0; 0), а вместе с ним и марковская цепь возвратная. Установим использованное в доказательстве тождество п Es'iks'ik __ гуп — ^2п- к=0
58 Глава 1. Цепи Маркова — основные понятия и факты Число кратчайших путей из точки 0(0; 0) в точку А(п;п) равно Каждый такой путь проходит через одну и толь- ко одну из точек АЦк;п — к), 0 < к < п (точки А^ лежат на отрезке, соединяющем точки (0;п) и (п;0)). Число путей из точки 0(0;0) в точку АЦк\п — к) равно С^+(п_^ = С^, поэто- му число путей из точки 0(0; 0) в точку А(п;п), проходящих через АЦк\п — к) равно (в силу правила умножения). Сложив количество путей, проходящих через каждую из точек АЦк,п — к), к = 0,1,...,п, получим общее количество путей из 0(0; 0) в точку А(п;п), т. е. (%(%. Тем самым тождество к=о доказано. Замечание. Отметим, что в отличие от симметричного случайного блуждания по одномерной целочисленной решетке и по двумерной, симметричное случайное блуждание по трехмер- ной целочисленной решетке является невозвратным. На нефор- мальном языке это означает, что человек, злоупотребляющий спиртным, случайно блуждая по городу с вероятностью 1 всегда вернется домой, а вот хлебнувший лишнего воробей, возвраща- ясь домой (все еще в трехмерном пространстве — не пешком) рискует домой не вернуться. Задачи Задача 1.1. Марковская цепь с фазовым пространством X = {1,2,3} описывается матрицей одношаговых переходных вероятностей ’ 1/3 2/3 О 1/3 1/3 о о 2/3 2/3 Найти вероятность того, что: 1° цепь, стартовав из состояния 2, через два шага окажется в состоянии 1; 2° цепь, стартовав из состояния 3, через три шага вернется в состояние 3. Найти распределение цепи через три шага после старта (в момент t = 3), если начальным распределением цепи (рас- пределением в момент t = 0) является 12 3 1/3 1/3 1/3 Ответы: 1° Р{& = 1\^ = 2} = Р21(2)=2/Э-
1.4. Примеры и задачи 59 2° Р{& = 31 £0 = 3} = Рзз(З) = 12/27. Распределение цепи через 3 шага после старта: 1 2 3 \ 20/81 19/81 42/81 ) Задача 1.2. Матрица одношаговых переходных вероятно- стей марковской цепи имеет вид Р = 0,1 0,8 0,1 ‘ 0,4 0,4 0,2 0,5 0,5 0 Распределение цепи в момент t = 0 величины £о) имеет вид (распределение случайной / 1 о Ч \ ( 0,7 0,2 0,1 )• Найти: 1° распределение цепи в момент t = 2; 2° вероятность того, что в моменты t = 0, 1, 2, 3 цепь будет находиться соответственно в состояниях 2, 3, 1, 2; 3° вероятность того, что в моменты t = 0, 1, 2, 3, 4 цепь бу- дет находиться соответственно в состояниях 3, 2, 1, 1, 3. Ответы: 1° Распределение цепи в момент t = 2: / 1 2 3 \ t 0,351 0,491 0,158 ) 2° 0,016; 3° 0,0002. Задача 1.3 (существенные и несущественные состоя- ния). 1° Могут ли все состояния марковской цепи быть сущест- венными? у конечной марковской цепи? у бесконечной? (привес- ти примеры). О т в е т. У случайного блуждания по целочисленной решетке (см. 1.3.3) все состояния существенные. У конечной неприводимой марковской цепи все состояния существенные. 2° Могут ли все состояния марковской цепи быть несущест- венными? (привести примеры). Ответ: в бесконечной марковской цепи все состояния могут быть несущественными, в конечной — нет. Примером марковской цепи, все состояния которой несущест- венные, может быть, например, марковская цепь с матрицей пе- реходных вероятностей
60 Глава 1. Цепи Маркова — основные понятия и факты 1/2 1/22 0 1/2 О О 1/23 1/22 1/2 1/24 1/25 1/23 1/24 1/22 1/23 3° Могут ли в марковской цепи быть как существенные, так и несущественные состояния? (привести примеры). Ответ: да, например, в марковской цепи с матрицей пере- ходных вероятностей 1/3 1/3 ‘ 1/2 1/2 1/2 1/2 4° Могут ли несущественные состояния марковской цепи быть сообщающимися? (привести пример). Ответ: да, см. пример 1.3.2, состояния 1,2,... ,п — 1 несу- щественные сообщающиеся. 5° Могут ли несущественные и существенные состояния мар- ковской цепи быть сообщающимися? Ответ. Нет, не могут. Пусть i — несущественное состояние, тогда найдется к такое, что i к, но i не достижимо из к. Пусть j — существенное состояние и j о г, тогда j i к. Но j — существенное состояние, поэтому fc —> 7, а, следовательно, и fc —> 7 —> г, т. е. г достижимо из к — противоречие. 6° Могут ли существенные состояния марковской цепи быть несообщающимися? (привести примеры). Ответ: да, если марковская цепь содержит больше одного класса эквивалентности, см. пример 1.3.2 (с. 37), состояния 0 и п существенные, но несообщающиеся. 7° Каждая марковская цепь имеет хотя бы один класс экви- валентности. Справедливо ли это утверждение? Ответ: да для конечной марковской цепи, для бесконечной — нет (см. 2° в задаче 1.3). Задача 1.4 (нулевые, ненулевые состояния). 1° Могут ли все состояния неприводимой марковской цепи быть нулевы- ми? (привести примеры). Ответ: Да — в бесконечной марковской цепи, см. пример 1.3.3 (с. 37) и пример 1.4.5 (с. 56). Нет — в конечной марковской цепи, см. теорему 1.3.5. 2° Могут ли в конечной марковской цепи быть нулевые со- стояния? (привести примеры).
1.4. Примеры и задачи 61 Ответ: да. 3° Могут ли все состояния конечной марковской цепи быть нулевыми? Ответ: нет (см. теорему 1.3.5). 4° Могут ли в конечной марковской цепи все состояния быть ненулевыми? Если да, то что необходимо потребовать от такой цепи? Ответ: да, цепь не должна иметь несущественных состоя- ний. Задача 1.5 (нулевые и возвратные состояния). Может ли неприводимая нулевая марковская цепь быть 1° возвратной; 2° невозвратной? Решение. Заметим, что в конечной неприводимой марков- ской цепи все состояния ненулевые, поэтому неприводимую ну- левую марковскую цепь надо искать среди бесконечных цепей. Случайное блуждание по целочисленной решетке является примером неприводимой нулевой марковской цепи, поскольку Р»о(2„) ~ ЙС. у/1ГП При этом цепь может быть как возвратной (при р = q = 1/2), так и невозвратной (при р / q). 3° Может ли неприводимая марковская цепь, сходясь по ве- роятности к ex?, с вероятностью 1 возвращаться в каждое свое состояние бесконечно много раз? Если да — привести примеры. Ответ: да, например, случайное блуждание по целочислен- ной решетке, когда р = q = 1/2 — с одной стороны, случайное блуждание, как нулевая марковская цепь, сходится по вероят- ности к бесконечности, а с другой стороны, при р = q = 1/2 оно возвратно. 4° Доказать, что несущественное состояние является невоз- вратным. 5° Доказать, что несущественное состояние является нуле- вым. Задача 1.6. Доказать, что неприводимая конечная марков- ская цепь возвратная. Указание. Достаточно доказать, что такая цепь ненулевая. Задача 1.7. 1° Доказать, что в невозвратной неприводимой марковской цепи с фазовым пространством X = {...,-2,-1,0,1,2,...}
62 Глава 1. Цепи Маркова — основные понятия и факты для любого К Р{ |£п | > К} 1 при п сю. Другими словами, неприводимая невозвратная марковская цепь с фазовым пространством X = {..., —2, — 1,0,1,2,...} при п сю “уходит в бесконечность” (по вероятности). Указание. Невозвратная марковская цепь является нуле- вой. Задача 1.8. Конечная неприводимая марковская цепь яв- ляется ненулевой, а может ли неприводимая бесконечная мар- ковская цепь быть ненулевой? (если да, то привести примеры). Решение. Марковская цепь с фазовым пространством X = = {1,2,...} и матрицей переходных вероятностей является неприводимой ненулевой. У матрицы Р(2) первый столбец имеет вид (100 ...)', а, сле- довательно, такой же вид имеет и столбец у матрицы Р(2п), п = 1,2,.... Так что Рц(2п) = 1, п = 1,2,..., поэтому цепь ненулевая. Задача 1.9. Привести пример неприводимой возвратной мар- ковской цепи, которая была бы нулевой. Какое может быть чис- ло состояний этой цепи: 1) только конечное, 2) только бесконеч- ное, 3) может быть как конечным, так и бесконечным? Ответ: случайное блуждание по одномерной целочисленной решетке при р = q = 1/2 является возвратным. При этом цепь нулевая, так как РМ(2„) ~ х/КП при п —> оо (см. (1.3.5)). Неприводимая возвратная нулевая цепь может быть только бесконечной. Задача 1.10. Доказать, что п Pij(n) = У “ fc)> П = °’ 1’ • • • k=0
1.4. Примеры и задачи 63 Воспользовавшись последним равенством, установить, что (см. также (1.3.9), (1.3.10)). Указание. См. в теореме 1.2.2 доказательство равенства Рц(п) = fii(k)Pii(n - к). k=0 Задача 1.11. Симметричную игральную кость подбрасыва- ют независимым образом неограниченное число раз. Пусть — число очков, выпавших при к-м подбрасывании кости, к = = 1,2,... Рассмотрим последовательности случайных величин 1) Cn = min{£i,£2, • • • Лп}, П= 1,2, 2) т;п+1 = min{77n + 1,^п}, % =Сь п= 1,2,...; 3) #п+1 = min{0n + 2,£п}> #1 = 6, п = 1,2,... 4)т„+1 = тах{тп,£п}, П = Ci, п = 1,2,...; 5)<Лг+1 = max{(y>n - 2)+, £п}, уч = £1; п = 1,2,..., где х+ = тах{0,х} — положительная часть числа х; бИп+i =тах{(^„ - 1),Сп}, ^1=6, «= 1,2,... Показать, что перечисленные последовательности образуют марковские цепи, найти их матрицы переходных вероятностей, классифицировать состояния этих цепей. Ответ. В том, что последовательности образуют марков- ские цепи, убеждаемся аналогично тому, как мы это делали в примере 1.4.3. 1) Матрица одношаговых переходных вероятностей цепи {Сп}: Р = [-Ру] = [P{min{i,^„} = j}], i,j = 1,2, ...6, подробнее г 1 0 0 0 0 0 1/6 5/6 0 0 0 0 II а? II 1/6 1/6 4/6 0 0 0 1/6 1/6 1/6 3/6 0 0 1/6 1/6 1/6 1/6 2/6 0 L i/е 1/6 1/6 1/6 1/6 1/6 Состояния 1,2,..., 6 не сообщаются, состояния 2,3,..., 6 несу- щественные. Состояние 1 образует возвратный непериодический класс эквивалентности.
64 Глава 1. Цепи Маркова — основные понятия и факты 2) Матрица одношаговых переходных вероятностей цепи {т/п}: Р = [Ру] = [P{rnin{z + l,£n} = j}], i,j = 1,2, ...6, подробнее Г 1/6 5/6 0 0 0 0 1 1/6 1/6 4/6 0 0 0 II II 1/6 1/6 1/6 3/6 0 0 1/6 1/6 1/6 1/6 2/6 0 1/6 1/6 1/6 1/6 1/6 1/6 L i/е 1/6 1/6 1/6 1/6 1/6 J Цепь {г/п} неприводимая, возвратная, непериодическая. 3) Матрица одношаговых переходных вероятностей цепи {#п}: Р = [Ру] = [P{min{z + 2,Cn} = J}], i,j = 1,2,... 6. Г 1/6 1/6 4/6 0 0 0 1 1/6 i/е 1/6 3/6 0 0 II II 1/6 1/6 1/6 1/6 2/6 0 1/6 1/6 1/6 1/6 1/6 1/6 1/6 i/е 1/6 1/6 1/6 1/6 L i/б 1/6 1/6 1/6 1/6 1/6 J Цепь {0П} неприводимая, возвратная, непериодическая. 4) Матрица переходных вероятностей цепи {тп} Р = {pij} = [P{max{z,^n} = j}], i,j = 1,2, подробнее ’ 1/6 1/6 1/6 1/6 1/6 1/6 ‘ О 2/6 1/6 1/6 1/6 1/6 О 0 3/6 1/6 1/6 1/6 О 0 0 4/6 1/6 1/6 0 0 0 0 5/6 1/6 0 0 0 0 0 1 Состояния 1,2,..., 5 — несущественные, состояние 1 образу- ет класс эквивалентности. 5) Матрица переходных вероятностей цепи {</?п} Р = {Ру} = [P{max{(z — 2)+,£n) = J}] , i,j = 1,2,... ,6, подробнее
1.4. Примеры и задачи 65 Г 1/6 1/6 1/6 1/6 1/6 1/6 I 1/6 1/6 1/6 1/6 1/6 1/6 1/6 1/6 1/6 1/6 1/6 1/6 О 2/6 1/6 1/6 1/6 1/6 О О 3/6 1/6 1/6 1/6 О О 0 4/6 1/6 1/6 Цепь неприводимая, возвратная, непериодическая. 6) Матрица переходных вероятностей цепи {V’n} Р = {Рц} = [P{max{(i-l)+,e„}=j}], i, j = 1,2,... 6, подробнее Г 1/6 1/6 1/6 1/6 1/6 1/6 I 1/6 1/6 1/6 1/6 1/6 1/6 р_ 0 2/6 1/6 1/6 1/6 1/6 1Г_ 0 0 3/6 1/6 1/6 1/6 ' О 0 0 4/6 1/6 1/6 . 0 0 0 0 5/6 1/6 . Цепь неприводимая, возвратная, непериодическая. Задача 1.12. Симметричную игральную кость подбрасыва- ют независимым образом неограниченное число раз. Пусть £& — число выпавших очков при к-м подбрасывании кости, к = = 1,2,... Рассмотрим последовательности случайных величин п 1) Лп = 52п = 1,2,...; 2) С„+1 = (с„ - 1)+ + С1 = 6, п = 1,2,...; 3) 0п+1 = (0п ~ 2)+ + Сп, 01 = £1, п = 1,2,...; Показать, что последовательности {ту™}, {Сп}> {#п} образу- ют марковские цепи. Найти матрицы переходных вероятностей, классифицировать состояния цепей. Ответ. В том, что {т?™}, {Сп}> {#п} образуют марковские це- пи, убеждаемся аналогично тому, как мы это делали в примере 1.4.3. 1) Матрица переходных вероятностей цепи {т/п}: Р = [-Ру] = [Р{* + Сп = /}], i,j = 1,2,..., подробнее ’0 1/6 1/6 1/6 1/6 1/6 1/6 0 о ... р= 0 0 1/6 1/6 1/6 1/6 1/6 1/6 0 ...
66 Глава 1. Цепи Маркова — основные понятия и факты Все состояния марковской цепи {т/п} несущественные. 2) Матрица переходных вероятностей цепи {Сп}: Р = [Ру] = [P{(i - 1)+ + Cn = Л] , i, j = 1,2,..., подробнее ’ 1/6 1/6 1/6 1/6 1/6 1/6 0 0 0 ... ' р = 0 1/6 1/6 1/6 1/6 1/6 1/6 о о ... Все состояния марковской цепи несущественные. 3) Матрица переходных вероятностей цепи {#п}: Р = [Ру] = [Р{(г - 2)+ + Сп = Л] , i, j = 1,2,..., подробнее ’ 1/6 1/6 1/6 1/6 1/6 1/6 0 0 0.. 1/6 1/6 1/6 1/6 1/6 1/6 0 0 0.. р = 0 1/6 1/6 1/6 1/6 1/6 1/6 о о .. 0 0 1/6 1/6 1/6 1/6 1/6 1/6 0.. Цепь неприводимая, непериодическая. Задача 1.13. Монету, вероятность выпадения герба кото- рой равна р (0 < р < 1), подбрасывают независимым образом неограниченное число раз. Пусть — число выпавших гербов при fc-м подбрасывании монеты, к = 1,2,... Рассмотрим после- довательности случайных величин 1) 77n+i = max{7?n,£n}, щ = £1; п= 1,2,...; 2) Сп+1 = max{«n - l)+,Cn}, С1 =6, п = 1,2,...; 3) 0n+i =min{0n,£n}, #1 =С1, п= 1,2,...; 4) </?п+1 = min{^n + 1,£п}> <Р1 = €1, « = 1,2,... п 5) V’n = n = 1,2,... k=i Показать, что последовательности {рп}, {Си}, {#п}> {<Рп}> Ш образуют марковские цепи, найти их матрицы переходных вероятностей, классифицировать состояния.
1.4. Примеры и задачи 67 Ответ. В том, что {г/п}, {Сп}, {<?„}, {<^п}> {Фп} образуют марковские цепи, убеждаемся аналогично тому, как это дела- лось в примере 1.4.3. 1) Матрица переходных вероятностей цепи {ту™}- Р = {Ру} = [Р{тах{г,£п} = Л], i,j = 0,1, подробнее Г 1-Р Р1 [О 1 ]• 2) Матрица переходных вероятностей цепи {£п}: Р = {ptj} = [Р{тах{(г - 1)+, £„} = Л] , i, j = 0,1, подробнее Г 1-Р Р1 L 1-Р РJ ' 3) Матрица переходных вероятностей цепи {0П}: Р = {Ру} = [P{min{z,£п} = j}], i,j = 0,1, подробнее Г 1 о 1 L1-р р J ’ 4) Матрица переходных вероятностей цепи {<рп}: Р = {Ру} = [^’{пйп{г + 1,£п} = Л], i,j = 0,1, подробнее Г 1-Р Р1 L 1-Р РJ ’ 5) Матрица переходных вероятностей цепи {V’n} Р = {Ру} = [Р{* + U = Л], Ф J = 1,2, • • •, подробнее 1 -Р О О Р = р ООО 1 — р р 0 0 0 1 — р р о
68 Глава 1. Цепи Маркова — основные понятия и факты Все состояния марковской цепи {^п} несущественные. Задача 1.14. Марковская цепь с фазовым пространством {1,2,3,4} задана матрицей одношаговых переходных вероятнос- тей "О 01/2 1/2 ' р_ 0 0 0 1 1 0 0 0 _ 1/2 1/2 0 0 Классифицировать состояния марковской цепи. Убедиться, что цепь периодична. Пусть t — период цепи. Представить фазовое пространство в виде: G = Go U Gi U ... U Gt—i- В Q-цепи (Q = P(t)) найти матрицу переходных вероятностей для каждого из классов эквивалентности Go, Gi,..., Gt-i. Клас- сифицировать состояния в классах эквивалентности Gy, v = = 0,1,. ..,f-l. Задача 1.15. Марковская цепь с фазовым пространством {1,2,3,4,5} задана матрицей одношаговых переходных вероят- ностей р = Г 0 0 1 0 0 0 0 10 0 1/4 1/2 0 0 1/4 0 0 0 0 1 0 0 1/2 1/2 0 Классифицировать состояния марковской цепи. Убедиться, что цепь периодична. Пусть t — период цепи. Представить фазовое пространство в виде: G = G0UGiU...UGt_i. В Q-цепи (Q = P(t)) найти матрицу переходных вероятностей для каждого из классов эквивалентности Go, Gi,..., Gt-i- Клас- сифицировать состояния в классах эквивалентности G^, v = = 0,1,. ..,f-l. Задача 1.16. Монету, вероятность выпадения герба кото- рой р, подбрасывают независимым образом неограниченное чис- ло раз. Пусть £п — разность между числом выпавших гербов и решеток после n-го подбрасывания. Убедиться, что последовательность £п образует марковскую цепь, найти ее матрицу переходных вероятностей.
1.4. Примеры и задачи 69 Указание. Пусть £п = i — разность между числом выпав- ших гербов и решеток. Если в (п + 1)-м подбрасывании выпал герб, то число выпавших гербов увеличивается на 1, число ре- шеток остается тем же, и, следовательно, £n+i = г + 1, а Р{Сп+1 — ^ + l|£n = i} = р Если выпала решетка, то •PRn+1 = г - 1|£п = г} = 1 - р. Задача 1.17. В двух урнах находится 2N шаров (по N в каждой), среди них N белых и N черных. Из каждой урны на- удачу выбирают по шару и перекладывают из одной урны в другую. Пусть £п — число белых шаров в первой урне после n-го перекладывания (в момент п). Убедиться, что последовательность £п образует марковскую цепь, найти ее матрицу переходных вероятностей. Указание. Пусть £п = к (1 < к < N — 1). Значение £n+i = = к+1, если из первой урны выбран черный шар, а из второй — белый, вероятность этого события равна (7V — к)2/N2. Значение £п+1 = к — 1, если из первой урны выбран белый шар, а из второй — черный, вероятность этого события равна к2/N2. Значение £п+1 — к, если из первой и второй урны выбраны шары одно- го цвета, вероятность этого события равна 2fc(7V — k)/N2. Если = 0, то £п+1 = 1; если = N, то £n+i = N-1. Для 0 < к < N Ал+1 = (^ - tf/N2, Рк,к-1 = k2/N2, Рк,к = 2k(N - k)/N2, Род = 1, Pn,N-1 = 1- Для остальных пар i,j значения P^j = 0. Очевидно, что состояние £п+1 системы — число белых шаров в первой урне после (п + 1)-го перекладывания — определяется состоянием £п системы в момент п и не зависит от того, сколько белых шаров было в первой урне до момента п. Поэтому после- довательность {£п} образует марковскую цепь. Задача 1.18. Организм в конце своей жизни производит случайное число £ потомков. Распределение случайной величи- ны Р{£ = к} = ак, к = 0,1,2,... (1.4.1) Каждый из потомков в конце своей жизни независимо от дру- гих потомков производит потомство, численность которого име- ет распределение (1.4.1). (Мы будем предполагать, что продол- жительность жизни одинакова для всех организмов.)
70 Глава 1. Цепи Маркова — основные понятия и факты Обозначим через £п численность популяции в n-м поколении, п = 1,2,... Убедиться, что последовательность {£п} образует марков- скую цепь, найти ее матрицу переходных вероятностей (после- довательность {Сп} известна под названием ветвящегося процес- са). Указание. Пусть численность популяции в n-м поколении равна г, т. е. £n = i. Каждый из i членов популяции произво- дит £ потомков, в результате чего численность £п+1 популяции в (п + 1)-м поколении становится равной £i + £2 + • • • + £?• Непосредственной проверкой убеждаемся, что = PRn+1 — j\Cn — 0 — Р{£1 + £2 + • • • + £? — j}- Эта вероятность равна значению в точке j распределения суммы £1 + £2 + • • • + 6 независимых случайных величин £1, & > • • • > &> распределение каж дой из которых определяется равенством (1.4.1). Задача 1.19. Доказать, что равенство (1.1.9) при каждом фиксированном п задает вероятностное распределение на мно- жестве последовательностей $оД1,... ,in целых неотрицатель- ных чисел.
Глава 2 Предельные теоремы для марковских цепей 2.1 Эргодическая теорема Дискретное уравнение восстановления. Ключевым в ана- лизе предельного поведения марковской цепи является следую- щий результат. Теорема 2.1.1 (уравнение восстановления). Пусть 1) F — вероятностное распределение, сосредоточенное на множестве целых неотрицательных чисел такое, что н.о.д. тех к, для которых F({k}) =ak >0, k = 0,l,..., равен 1; оо 2) bk — сходящийся ряд с неотрицательными членами. к=о Если уравнение восстановления п Un ^к^п—к = ^п> — 0, 1, . . . , (2.1.1) к=0 имеет ограниченное решение и = (uq, и\,.. .): sup \ип\ < М, п
72 Глава 2. Предельные теоремы для марковских цепей то оно имеет и предел, причем оо / оо limtzn = ^bk / ^kak, (2-1.2) " fc=O I k=o OO если kak < oo, и k=0 limun = 0, n oo если kak — oo. k=Q Доказательство. Мы докажем теорему в предположе- нии, что ai > 0, но она имеет место и в приведенной выше фор- мулировке. В условиях теоремы решение уравнения восстановления неот- рицательно. Действительно, из ai > 0 следует 0 < 1 — ао- Пола- гая в (2.1.1) последовательно п = 0,1,2 ..., получаем: при п = 0 ио — aouo = bo, t4o(l — &o) = bo, и так как 0 < 1 — ao, bo > 0, то uq > 0; при п = 1 их - (ao^i + ai^o) = bi, ?zi(1 — ао) = i>i + aiuo, и так как bi > 0, ai > 0, uq > 0, то и ui > 0. И так далее (по индукции) получаем, что ип > 0 для всех п = 0,1,2,... Для доказательства теоремы установим, что оо если kak < оо, и k=Q 0 < lim ип < lim ип < 0 оо если ^ак — оо. к=0 Обозначим ц = lim ип, Л = lim ип
2.1. Эргодическая теорема 73 Далее нам понадобится следующее вспомогательное утвер- ждение. Если {пП;.} — подпоследовательность последовательности {пп}, для которой limun. = Л = limnn, nj 3 то и limuni_d = А (2-1-4) nj для каждого натурального d. ________ Заметим, что поскольку Л = limnn, то для данного е > О, начиная с некоторого по (п > по) ип < А + е. (2.1.5) Сначала покажем, что limnn._i = А. п7- 3 Предположим противное, т. е. unj_\ не сходится к А. Тогда най- дется А' < А (найдется окрестность (А',+оо) точки А), что для бесконечного числа значений индекса nj — А < А. Для этих индексов оценим unj сверху, воспользовавшись тем, что unj удовлетворяют равенствам Tlj ^nj = > ^k^nj—k “Ь bnj k=0 (см. (2.1.1)) или N rtj Un3 = > akunj—k + alunj — 1 + akunj—k + k=O,k^l k=N+l (TV выберем далее). Оценим каждое слагаемое в правой части последнего равенства.
74 Глава 2. Предельные теоремы для марковских цепей Поскольку unj-i < Л', то < «1А'- При достаточно больших nj значение brij _ £> оо поскольку ряд bk сходится. к=0 оо Из сходимости ряда ак и ограниченности последователь- но ности {?in} следует, что найдется такое 2V, что Tlj ОО 'Г, akunj-k <м ^2 ak<M ^2 ak<^, k=N+l k=N+l k=N+l зафиксируем это N. И, наконец, в силу (2.1.5), при достаточно больших nj (nj > no,nj > TV) с учетом того, что к < N, имеем N N ^k^rij—k < (А + s) Ofc < к=О,к^1 к=О,к^1 <(A + s) а/* = (А + г)(1 — ai). к=0, /с/1 “Собирая” все оценки, получим tinj < (A+s)(l— 6ii)+6ii Az+s+s = А(1—cii)+s(l — cii)“H&iA'+2s < А — Аб&1 + A 6Z-1 + 3s — А — 611 (А — А ) + 3s. В частности, если 3 s = - 6Zi (А — А7), то для бесконечного числа индексов nj имеем unj < А — —611 (А — А ), J 2
2.1. Эргодическая теорема 75 т. е. бесконечное число элементов последовательности {unj}, схо- дящейся к Л, не принадлежит окрестности точки Л. Из получен- ного противоречия и следует, что если unj А, то и unj_\ Л. Повторяя те же рассуждения применительно к unj-i, убеж- даемся, что Unj-2 сходится к Л и т. д. Так что, если последовательность {unj} сходится к X, то и последовательность {unj-d} также сходится к X для каждого целого d > 0. Аналогичное утверждение имеет место для ц = lim к. Если подпоследовательность {unj} последовательности сходится к ц: limun. = ц = lim Un, то и limun—d = ц = limun (2.1.6) nj для каждого натурального d. Далее нам понадобится запись уравнения восстановления п ^k^n—k ~ ^п> а — 0,1,..., к=0 в терминах остатков: Гп — ^п+1 + ^п+2 + • • • , П = 0, 1, . . . , ряда ^2 ак. k=o Очевидно, го = ai + в2 + аз + ... = 1 - ао. ап = гп-г -гп, п = 1,2,..., ао = 1 - г0. При п = 0 из уравнения восстановления (см. (2.1.1)) имеем ио — ново = Ьо или, в терминах остатков, гоио = Ьо, (2-1.7)
76 Глава 2. Предельные теоремы для марковских цепей при n > 1 из (2.1.1) имеем un - (aoun + aiUn-i + • • • + an-iui + anuo) = bn, в терминах остатков — t4n(l-ao)-((ro-ri)t4n_i + (ri-r2)t4n-2 + - • • + (rn-i - rn)u0) = bn или “Ь ^l^n—1 + ... + (^O^n—1 + ... + 'f'n—1^0) = bn- Обозначив roun + riun-i + ... + rnuo = An, n = 0,1,2,..., перепишем уравнение восстановления так: A^ An-i — bn у n — 1,2,..., при n = 0 Ao = &o (см. равенство (2.1.7)). И, наконец, так: An = bfc, n = 0,1,..., k=o или, подробнее, п roun + HUn-i + ... + rnuo = bk, П = 0,1,... (2.1.8) k=o (уравнение восстановления в терминах остатков). На следующем этапе доказательства, используя запись урав- нения восстановления в терминах остатков, предельным перехо- дом по п получим, что lim и„ = ц = X = limun. Пусть {nj} — последовательность индексов, для которых limtu. = Л, „ J
2.1. Эргодическая теорема 77 а, следовательно, и lim uni-d = А nj J для каждого d. Положив в (2.1.8) п = получим nj rounj+r1unj_1 + . . .+rNUnj_N+rN+lUnj_^N+^ + . . .+rnjU0 = ^bk. k=0 Отсюда nj rounj + ViUrij-l + • • • + nv Unj-N < bk. k=Q Переходя к пределу при nj —> оо в правой и левой частях по- следнего неравенства, имеем оо А(го + И + ... + rN) < 52 k=o отсюда оо / N А < ^bk / ^rk. k=0 I k=0 Далее рассмотрим отдельно два случая: (2.1.9) ОО 52= +оо; к=0 < сю оо оо (заметим, что гк — 12 как)- к=0 к=0 оо Если гк — +оо, то переходя в неравенстве (2.1.9) к пре- к=0 делу при 7V —> сю, получаем А < О, что с вместе с неравенствами 0 < р, < А < 0 доказывает теорему.
78 Глава 2. Предельные теоремы для марковских цепей ОО Если rk < °0, то из (2.1.9) имеем k=o оо / оо А <52^ / ^гк. к=0 / к=0 Установим, что имеет место и неравенство оо / оо 52/ ^гк < р. к=0 / к=0 Пусть rij — последовательность индексов, для которых [1 = limtu., nj 3 а, следовательно, и lim un d = у, nj 3 для каждого d > 0. Для этих значений индексов из (2.1.8) имеем + П^п7--1 + • • • + rN Unj-N + nj +(r/v+i (jv+i) + • • • + rn.uo) = bk. k=Q Отсюда, учитывая что sup?i^ < M, получаем неравенство к nj TOUnj + HUnj-l + • • • + rN Unj-N + M(rN+i + ... + rnj) > ^2 bk • k=0 Переходя к пределу при nj оо в правой и левой частях этого неравенства, имеем оо оо р(.го + п + ... + rN) + М ^2 rk У k=N+l к=0 далее, переходя к пределу при 7V —> оо и учитывая, что оо lim N—>оо 52 Гк k=N+l = 0
2.1. Эргодическая теорема 79 ОО (рад rk сходится), получаем &=0 оо оо P^rk > к=0 к=0 ИЛИ оо / оо 52Ьк / 52Гк - к=0 / к=0 Что вместе с ранее полученным неравенством оо / оо а < ^2Ьк / 52Гк к=0 / к=0 и доказывает теорему. Эргодическая теорема для непериодических цепей. Напомним, что Putty = 1, Рц(п) = Р{£п = i|£0 = 0> п = 1,2, • • •, /и(0) = О, ЛД1) = = г|£0 = 0 = Рц(1), = Р{£>п = Со = 7^ V = 1, 2, . . . , 71 — 1|£о = О’ п = 2,3,..., Рц(п) = 52 ~кУ п = 1,2, . . . , к=0 Tj — момент первого возвращения в состояние г, его математи- ческое ожидание Mri = ^kfu(k). к=0 Теорема2.1.2 (эргодическая). В неприводимой возвратной непериодической марковской цепи для любых состояний i,j су- ществуют limРц(п), limP^(n) и limPjJn) = lim Рц(п), п J п
80 Глава 2. Предельные теоремы для марковских цепей причем, если Mrj < сю, то “»тР”(п) = Ж’ если = оо, то limPjj(n) = 0. п Доказательство. Равенства Ри(0) = 1, Рц(п) - Г fii(k)Pn(n - fc) = 0, n = 1,2,..., fe=0 обозначают, что последовательность Un = Рц(п), n = 0, 1 . . . , является ограниченным решением уравнения восстановления п ^k^n—k — — 0, 1, ... , к=0 у которого = fatty, к = 0,1,2,..., bo = 1, Ьп = 0, n = 1,2,... При этом, во-первых, = fatty, к = 0,1,2,..., — вероятност- ное распределение на множестве {0,1,2,...} — поскольку цепь возвратна, то оо k=0 и, во-вторых, цепь непериодична, т. е. наибольший общий дели- тель тех к, для которых Patty > 0 равен 1 (не нарушая общ- ности будем считать, что /«(1) = Patty > 0). Поэтому согласно теореме 2.1.1 ограниченное решение {Р^(п)} уравнения восста- новления имеет предел, причем lim Рц(п) = —----- ” Е кШк) k=o 1 Ж’
2.1. Эргодическая теорема 81 если Мтг < оо, и limPjj(n) = О, п если Мтг = сю. Установим ещё, что lim Рц(п) = limPn(n). п J п Имеет место следующее легко проверяемое соотношение: п Pji(n) = У fji(k)Pii(n ~k), п = 0,1,2, ... , fc=0 которое в обозначениях Pji(n) = уп, Рц(п) = хп, fji(k) = перепишем так: п Уп = bfoXn—кч 72 = 0, 1, 2, ... , к=0 причем, поскольку цепь возвратная, то оо оо к=0 к=0 см. теорему 1.3.8. Покажем, что если хп с при п сю (|xn| < 1 и |с| < 1), то уп с при п сю. Действительно, п п оо Уп ~ с bfcXn—k — С = bfcXn—k — С bfc = к=0 п=0 к=0 п оо — Ък(хп—к — с) — С bfc = к=0 /с=п+1 N п оо — Ь^^хп—к — с) + Ьь(хп—к — с) — с bfc. к=0 k=N+l &=п+1
82 Глава 2. Предельные теоремы для марковских цепей Отсюда N п оо \Уп - с| < ^bk\xn_k - с| + ^2 bfel^n-fc - с| + С ^2 bk- k=0 k=N+l k=n+l Будем оценивать правую часть, начиная со второй суммы. Пусть е > 0. Выберем N так, чтобы п п оо bk\%n—k ~ с| — 2 < 2 bfc < £ fc=N+l k=N+l fc=N+l и зафиксируем. Далее, поскольку последовательность {xi} схо- дится к с, то при достаточно больших п N bk\^n—k ~ с| — к=0 Третья сумма как остаток сходящегося ряда меньше е. Поэтому при достаточно больших п \уп - с| < 3s. Тем самым теорема доказана. Следствие 1. В ненулевой неприводимой непериодической марковской цепи для любых состояний i, j существуют lim Рц(п), п limP7Jn) и п J limPn(n) = lim Рц(п), п п среднее время возвращения оо Мгг = k=Q конечно и ПтРй(п) = —. п MTi Доказательство. Так как цепь ненулевая, то она воз- вратна, и в силу эргодической теоремы существуют и равны limРц(п\ lim Рц(п). п п J
2.1. Эргодическая теорема 83 Далее, среднее время возвращения Мтг в состояние i ко- нечно — если бы Мтг = оо, то в силу эргодической теоремы limРц(п) = 0, но последовательность Рц(п) не стремится к ну- п лю (цепь ненулевая). В силу эргодической теоремы limPii(n) = -г^-. п MTj Замечание. В силу теоремы 1.3.1 множество существен- ных состояний марковской цепи распадается на непересекаю- щиеся классы сообщающихся между собой состояний (классы эквивалентности). Для тех из классов, которые являются воз- вратными непериодическими, имеет место эргодическая теоре- ма. Эргодическое распределение. Пусть С — возвратный не- периодический класс. Вероятностное распределение {тгД, задан- ное на классе С равенствами 7Tj = lim Pjj (n), j 6 C, называется эргодическим. Если при этом хотя бы для одного i значение тг^ > 0, то класс С называется возвратным ненулевым (эргодическим), если хотя бы для одного к значение = 0, то класс называется возвратным нулевым (слабо эргодическим). Определение эргодического распределения, возвратного нену- левого и возвратного нулевого классов корректно. Из оо 52 = 1 j=0 N имеем ^ij(n) < 1- Переходя в последнем неравенстве к пре- j=o делу сначала по п, а затем по 7V, получим оо т. е. {тг^} является вероятностным распределением (собствен- ным1 или несобственным). Распределение {тг7-} называют собственным вероятностным распреде- лю оо лением, если = 1 и несобственным, если 71 з < 1- J=0 j=0
84 Глава 2. Предельные теоремы для марковских цепей Далее, для любых i,j € С Pjj(n + s + m)> Pji(n)Pu(s)Pij(m) (2.1.10) (см. следствие 3 из уравнения Колмогорова — Чепмена). В си- лу неприводимости класса С числа пит можно выбрать так, что Pji(n) > 0, Рц(т) > 0. Переходя в неравенстве (2.1.10) к пределу при s оо, получаем 7Г7- > Pji (n)7ViPij(m). Поэтому, если для некоторого i значение тгг > 0, то 7Vj > 0 и для каждого другого j 6 С; если для некоторого j значение тг7 = 0, то для всех i 6 С значение тгг = 0. Заметим, что у нулевого класса эквивалентности С эргоди- ческое распределение всегда существует, поскольку для каждого состояния j из нулевого класса С hmPjj(n) = 0. Теорема 2.1.3 (о предельном распределении марковской цепи). Распределение неприводимой возвратной непериодической марковской цепи сходится к ее эргодическому распределению {тг^}: lim Р{£п = k} = тг&, к = 0,1,... п Доказательство. Обозначим Р{£п = к} через Qn{{k}). В силу (1.1.8) Qn({k}) можно представить в виде оо Qn({^}) — Р{£п — к} = pjPёДн). ?=0 Отсюда \Qn({k}) - 7Гк\ = оо ^PiPikM - 7Гк 1=0 оо оо -ТГк^Рг ?=0 ?=0 оо - TTfc) i=0
2.1. Эргодическая теорема 85 N оо < ^Pi \Pik(n) — TTfcl + ^2 Pi\Pik(.n) -як\< ?=0 i=N+l N oo < "£2Pi\Pik(n) — TTfcl + 2£ Pi. ?=0 i=N+l oo Выберем N так, чтобы 2 Pi < e и зафиксируем. Далее, по- i=N+l скольку 7i> при n —> оо, то при достаточно больших п N &1ВД - 7rfe| < е, г=0 а, следовательно, l<2n(W) - TTfel < Зе. Тем самым теорема доказана. Стационарное распределение марковской цепи. Ста- ционарным распределением марковской цепи с матрицей пере- ходных вероятностей Р = [Рц] называется вероятностное рас- пределение {vfc} (собственное или несобственное), для которого при каждом п ^ViPij(n) =Vj, j = 0,1,..., (2.1.11) г=0 или, в матричном виде, P'(n)v = V, где v = (vo, vi, V2,.. Пусть {v^} — начальное распределение марковской цепи {£п}: Р{£о = i} = Vi, i = 0,1,..., тогда для любого п 52 = Р{£п = k}, к = 0,1,...
86 Глава 2. Предельные теоремы для марковских цепей Если начальное распределение {г^} цепи является ее стационар- ным распределением, то из последнего равенства и определения стационарного распределения цепи следует Р{£п = k} = vk, к = 0,1,..., т. е. при каждом п распределение Р{£п = к}, к = 0,1,..., цепи совпадает с ее стационарным распределением {v^} — с течением времени распределение цепи не меняется. Далее мы будем пользоваться следующим утверждением. Для того, чтобы вероятностное распределение {и^} мар- ковской цепи с матрицей переходных вероятностей Р = [Р^] было стационарным, достаточно, чтобы ^ViPik = vk,k = 0,l,..., (2.1.12) ?=0 или, в матричном виде, P'v = V. В самом деле, умножив правую и левую часть равенства оо ViPik = ^кч к = 0, 1, . . . , ?=0 на Pkj и просуммировав по всем к, получим оо оо оо PikPkj = VkPkj ч i=0 k=0 к=0 ИЛИ У2ViPij(2) =Vj, j = 0,1,... i=0 Повторив эту операцию п раз, получим (2.1.11). Распределение {v&}, для которого имеет место (2.1.12), так- же называют стационарным.
2.1. Эргодическая теорема 87 Теорема 2.1.4 (о стационарном и эргодическом распреде- лениях). Эргодическое распределение неприводимой ненулевой непериодической цепи является ее собственным стационарным распределением, и наоборот: собственное стационарное распре- деление неприводимой возвратной непериодической цепи явля- ется ее эргодическим распределением. Доказательство. Заметим, что ненулевая цепь заведомо возвратная, поэтому у неё существует эргодическое распределе- ние. Сначала покажем, что любое эргодическое распределение це- пи {тг^} (ttj = limPjjfji)) является ее стационарным распределе- нием, т. е. оо =^j, j =0, 1,... г=0 Из уравнения Колмогорова—Чепмена для любых п имеем оо N Pjj(n +1)= > У^ к=0 к=0 N произвольное. Переходя в этом неравенстве к пределу при п —> оо, получаем N itj > У^ ^k^kj-) к=0 ат. к. N произвольно, то и оо j =0,1,... (2.1.13) к=0 На самом деле все нестрогие неравенства (2.1.13) являются ра- венствами. Если предположить, что хотя бы одно из неравенств (2.1.13) строгое и просуммировать все неравенства (2.1.13), то получим противоречие: оо оо / оо \ оо оо оо У? Kj > У? I У? ^kPkj j = У27Гк У? = У?7г/с- j=0 j=0 \к=0 / к=0 j=0 к=0 Откуда следует, что для всех j = 0,1,... оо У? ^kPkj = Kj. к=0
88 Глава 2. Предельные теоремы для марковских цепей Так что эргодическое распределение всегда является стаци- онарным. Убедимся, что в ненулевой (неприводимой) цепи эргодиче- ское распределение {тч} является собственным стационарным распределением. Эргодическое распределение {тгД всегда является стацио- нарным: для любого п оо ^2^П/п) = тг,, j = 0,1,2,... (2.1.14) k=0 Переходя в последнем равенстве к пределу при п сю, причем в левой части под знаком суммы (если такой предельный переход возможен), получим оо УТ ^k^j — Яр k=0 Отсюда, поскольку класс ненулевой и, следовательно tvj 0, имеем оо 12 к=0 т. е. эргодическое распределение в ненулевом классе является собственным. Убедимся, что в левой части равенства (2.1.14) можно перей- ти к пределу при п —> сю под знаком суммы. Для этого оценим сверху разность оо -TTj . k=0 Имеем оо -7TJ k=0 оо оо уТ^р^и - УТ7^ к=0 к=0 N ^7Vk(Pkj(n) ~7Vj) k=0 k=N+l N oo < ^27r*:i-p^(n) -141+2 ^2 ^k- k=Q k=N+l
2.1. Эргодическая теорема 89 Второе слагаемое, как это остаток сходящегося ряда, можно сде- лать меньше данного е за счет выбора N. При фиксированном N первое слагаемое меньше е для достаточно больших п. Так что для любого данного е > 0 при достаточно больших п оо ^2^kPkj(.n) - TTj k=0 < 2г. Последнее неравенство и доказывает справедливость (2.1.14). Пусть теперь {^} — собственное стационарное распределе- ние неприводимой возвратной непериодической цепи: для каж- дого п = 1,2,... оо оо ^2ViPij(п) =Vj, j = 0,1,..., = 1. ?=0 j=0 Убедимся, что {vj} является эргодическим распределением. Как и в первой части теоремы, переходя в равенстве оо ^ViPij^n) = Vj i=0 к пределу под знаком суммы при п оо, получим оо =Vj, j = 0,1,..., i=0 (существование пределов lim Рц(п) гарантировано возвратнос- тью и непериодичностью неприводимой цепи). И поскольку рас- оо пределение {г^} собственное, т. е. = 1, то ?=о Vj j =0,1,... Замечание. В теореме в явном виде непериодичностью мы не пользуемся. Непериодичность вместе с возвратностью обес- печивает существование эргодического распределения. Резюме. Если класс С нулевой, то все предельные зна- чения для Pij(n) известны — они равны нулю (независимо от того класс возвратный или нет, периодический или нет). Если
90 Глава 2. Предельные теоремы для марковских цепей же класс С ненулевой (как следствие он возвратный) и непери- одический (требование непериодичности цепи не принципиаль- но), то в силу эргодической теоремы существуют предельные (эргодические) значения для Pij(n): lim (п) = 7Vj, j 6 C, заведомо отличные от нуля (класс ненулевой). Эргодическое распределение {тг?} ненулевого класса эквива- лентности совпадает с его собственным стационарным рас- пределением и поэтому эргодическое распределение можно по- лучить как решение системы линейных уравнений Р'тГ = 7Г, ^2^2 = 1. iec Пример 2.1.1. Рассматривается марковская цепь с фазо- вым пространством X = {1,2,3}, заданная матрицей одноша- говых переходных вероятностей ’ 4/5 1/5 0 ‘ 3/5 1/5 1/5 О 4/5 1/5 1° Существует ли limРц(п), i = 1,2,3? п 2° Если limРц(п), существует, найти его. п 3° Вычислить среднее Mri времени первого возвращения ъ в состояние i, i = 1,2,3. Решение. Марковская цепь, описываемая матрицей пере- ходных вероятностей Р, неприводимая и непериодическая. По- скольку цепь конечна, то она ненулевая и, как следствие, воз- вратная. Поэтому согласно эргодической теореме существует limРц(п) = 7Vj, i = 1,2,3. п Далее, в неприводимой ненулевой непериодической марков- ской цепи эргодическое распределение совпадает с собственным стационарным распределением, т. е. удовлетворяет системе Р'7Г = 7Г, 3 Е^ = 1-
2.1. Эргодическая теорема 91 или, что то же, с истеме Г 4 5%1 + 3 -я2 + 0тг3 = 7Г1, < 1 5"1 + 1 5"2 + 4 5"3 = 7Г2, Otti + 1 5"2 + 1 5"3 = 7ГЗ, , 7Г1 + 7Г2 + 7Г3 = 1. Решая эту систему, получим 12 4 1 = 17’ = 17’ Согласно эргодической теореме среднее время возвращения Mri = 1/тгг, i = 1,2,3. Эргодическая теорема для периодической цепи. Ис- следование асимптотического поведения переходных вероятнос- тей Pij(n) при п ч ос в периодической цепи сводится к их ис- следованию в непериодической цепи. Теорема 2.1.5 (эргодическая теорема для периодических t-i цепей). Пусть G = |J Gy — фазовое пространство неприво- У = в Зимой возвратной периодической с периодом t марковской це- пи с матрицей переходных вероятностей Р = [Рц], матрица [Qol — Q — Р(0- Для каждого i Е Gy (z/ = 0,1, ...,£— 1) / ч ( Qi — lirnQi^n), если lim (nt) = п h п J [0, если , ч ( Qi = limQiJn), если ИтРДк + nt) = < 3 n n [0, если j е Gy, 3 i Gy, j 6 Gy+k^ j Gy+k, к = 1,2,. ..,t- 1. Доказательство. Согласно теореме о структуре периоди- ческой цепи (см. теорему 1.3.9) в Q-цепи каждый класс эквива- лентности Gy является неприводимой возвратной непериодиче- ской цепью, поэтому для гД 6 Gy в силу эргодической теоремы
92 Глава 2. Предельные теоремы для марковских цепей существует lim Qjj (п) и lim Qjj (n) = lim Qjj (n) = qj. А поскольку Pij(nt) = Qijfa) (cm. 1.3.15), to lim Pjj (nt) = lim (n) = qj для i,j e Gy. Если j Gy, to Pjj(nt) = 0 (за nt шагов из i 6 Gy можно перейти только в класс Gy), а значит lim Рц (nt) = 0. п Пусть теперь i е Gy, j е Gy+k (k = 1,2,..., t — 1). Убедимся в справедливости равенства lim Рц(к + nt) =qj- (2.1.15) Из класса Gy P-цепь за первые к шагов перейдет в класс Gy+k (см. теорему 1.3.9), поэтому в силу уравнения Колмогорова- Чепмена Py(fc + nt)= Pis(k)PSj(nt). (2.1.16) За последующие nt шагов P-цепь из класса Gy+k переходит толь- ко в класс Gy+k (см. теорему 1.3.9). При п —> оо правая часть равенства (2.1.16) имеет предел, равный qj. Убедимся в этом. Для этого оценим сверху разность Имеем ^2 Pis^Psjint') - qj ^2 PiS(k)Psj(nt) -qj S(zGv+k
2.1. Эргодическая теорема 93 52 Pis(k')PSj(nt') - 52 Pis(k)qj < s^Gv+k seelie < ^2 Pis^ ~ + 12 Pis^ \psj(nt) - < sEM s€.G и+к\М < 52 P™№) \Psj(nt) - qj\ + 2 52 Pis(k). stM s^Gly^-ic\M Для данного s > О, выбрав конечное подмножество М С Gy^ так, чтобы 52 Pis(k) £’ sEGu+^\M а затем (при фиксированном М) п настолько большим, чтобы 52 Pisik') \PSj(nt) -qj\<£, seM получаем, что при достаточно больших п Pis(k)PSj(nt) qj sZGv+k < £. Так что правая часть равенства (2.1.16), а вместе с ней и веро- ятность Pij(к + nt), при п —> оо имеет предел, равный qj. Если j Gy+k, то Pij(к + nt) = 0 и, следовательно, ]ш1Рц(к + nt) = 0. 'П J Пример 2.1.2. Найти предельные значения Рг](п) при п <х> (если они существуют) для марковской цепи, заданной матрицей переходных вероятностей ’О 01/2 1/2 ' О 0 3/4 1/4 1/2 1/2 О О 1/2 1/2 О О
94 Глава 2. Предельные теоремы для марковских цепей Решение. Марковская цепь периодична с периодом 2. Со- гласно теореме о структуре марковской цепи фазовое простран- ство G цепи представимо в виде объединения непересекающиеся классов Go и Gi, причем за 2 шага P-цепь переходит из класса Gy в класс Gy, v = 0,1. Матрица переходных вероятностей Q = Р(2) = (р; )2, подробнее 0 0 1/2 1/2 ‘ ’ 0 0 1/2 1/2 ‘ (Л) — ТП) . ТП)— 0 0 3/4 1/4 0 0 3/4 1/4 О’ — 1г • 1г — 1/2 1 /2 0 0 1/2 1/2 0 0 1/2 1 /2 0 0 L 1/2 1/2 0 0 ’ 1/2 1/2 0 0 ‘ 1/2 1/2 0 0 0 0 5/8 3/8 0 0 5/8 3/8 Матрица переходных вероятностей класса эквивалентности Go = {1,2} имеет вид Qo = 1/2 1/2 1/2 1/2 ’ класса эквивалентности Gi = {3,4} — Qi = 5/8 3/8 5/8 3/8 Далее воспользуемся эргодической теоремой для периодичес- кой цепи (теорема 2.1.5). Для непериодического возвратного класса Go = {1,2} с мат- рицей одношаговых переходных вероятностей Qo = 1/2 1/2 1/2 1/2 найдем эргодическое распределение {<Zi, #2}, оно совпадает с соб- ственным стационарным распределением цепи, т. е. является ре- шением системы f Qotf = ъ [ <71 + <72 = 1,
2.1. Эргодическая теорема 95 где q = (qi,Q2)z- Подробнее: qi/2 + Q2/2 qi/2 + Q2/2 qi + <72 qi, Q2, 1. Решением этой системы является 1 1 = 2’ 92 = 2 Аналогично находим эргодическое распределение {#3, q^} непе- риодического возвратного класса Gi = {3,4} с матрицей одно- шаговых переходных вероятностей Qi = 5/8 3/8 5/8 3/8 как решение системы (5/8)93 + (5/8)q4 = q3, (3/8)93 + (3/8)<?4 = 94, ?з+?4 = 1, где q = (Q3, </4)'. Имеем 5 3 93 = 8 ’ 94 = 8’ Поэтому согласно эргодической теореме для периодических це- пей имеем: для i 6 {1,2} lim Pjj (2ri) = Qj = limQjj(n), j G {1,2}; 0, ” j € {3,4}; r, 7O f 9j = limQjj(n), je{3,4}; limP,j(2n +1) = | 0 je{i 2}; для i € {3,4} limPy(2n) = qj = limQjj(n), j G {3,4}; 0, ” j G {1,2};
96 Глава 2. Предельные теоремы для марковских цепей 1,тРу(2„+1)=| 0_ п Вероятности поглощения. Следующая далее теорема опи- сывает предельное поведение Pij(n) при п сю, когда i — несу- щественное состояние, а состояние j принадлежит некоторому классу эквивалентности С. Класс С будем считать непериоди- ческим (исследование периодической цепи сводится к исследо- ванию непериодической). Далее через тгДС) будем обозначать вероятность того, что цепь, стартовав из несущественного состояния г, достигнет воз- вратного класса С. Теор е м а 2.1.6 (о вероятностях поглощения). Если i — несу- щественное состояние, состояние j принадлежит возвратно- му непериодическому классу С, то lim Рц(п) = 7Ti(C)7rj, п—^оо где 7Vj = lim Pjj(n). Доказательство. Оценим разность |Рц(п) —тц(C)irj|. Обо- значим через тг^ (С) вероятность того, что цепь, стартовав из невозвратного состояния г, войдет в класс С через состояние к на 1/-м шаге (заметим, что цепь, попав в класс С, из него не выйдет, поскольку С — класс эквивалентности). Тогда для тгj(C) имеет место представление оо i2=i кес а для Рц (п) — представление 12=1 кес — цепь, стартовав из состояния г, входит в класс С (через одно из его состояний к) на некотором шаге v (1 < и < п), а затем за оставшиеся п — и шагов из состояния к попадает в состояние j. Используя приведенные представления для тгДС) и Р^-(п), оценим разность |Р0(п) -^^((7)1
2.1. Эргодическая теорема 97 (далее Cf — конечное подмножество С): |Ру(п)-7Г,7гДС')| = п оо 52 52 52 52 y=i kec у=1кес п оо 5252^)(cxp^(n-i/)-7rJ>-7г.? 52 52 ^ (°) У=1кес у=п+1кес 52 52 ^(ik^pki<n - - ъ)+ у=1кеС' +52 52 7rifc)(c')(p^(n-z/)-7rj) v=lкеС\С’ оо *з 52 52 y=n+i kec N < 52 52 7rifc)(c')ipfej(n - о - ^1+ у=1 кеС' + 52 52 7r^)(c')ipfc/n - - ^1+ l/=n+i кес' п оо +52 52 7rifc)(c)ipfe/n-i/)-7rJ+7rJ 52 52 y=ikec\c' v=n+ikec < 52 52 7rife)(c')ipfej(n -р) - ^1+ у=1 кеС' +2 Ё Е ++)+ р=лг+1 кес' п оо +2Е Е <’(0) + ^ Е Е+’(с)- y=ikec\c' v=n+ikec Пусть е > 0 произвольное фиксированное. Выберем N так, что- бы вторая сумма, как остаток сходящегося ряда, была меньше е (и зафиксируем N). Выберем конечное С' так, чтобы третья
98 Глава 2. Предельные теоремы для марковских цепей сумма, как остаток сходящегося ряда, была меньше е (и зафик- сируем С')- Четвертая сумма при достаточно больших п мень- ше е (как остаток сходящегося ряда). И, наконец, первая сумма при достаточно больших п, как конечное число “малых” слагае- мых, меньше е — каждое слагаемое мало при больших п в силу эргодической теоремы. Так что при достаточно больших п \Pij(n) - 7Г,7ГДС)| < 4е, откуда и следует утверждение теоремы. Пример 2.1.3. Пусть марковская цепь задана матрицей одношаговых переходных вероятностей р = Г 1/3 1/3 1/3 0 0 3 2/3 1/6 1/6 0 0 1/2 1/4 1/4 0 0 0 0 0 1 0 . 0 1/3 0 1/3 1/3 . Найти limPjj(п) для всех пар (i, j). Решение. Состояние {5} — несущественное, классы эквива- лентности Ci = {1,2,3} и С2 = {4} являются ненулевыми непе- риодическими. Поэтому для вычисления lim Pjj(n), i,j = 1,2,3, можно воспользоваться теоремой о стационарном и эргодиче- ском распределениях (см. теорему 2.1.4), limP44(n), очевидно, равен 1. Далее, Р^(п) = 0 для i = 1,2,3 и P4j(n) = 0 для j = 1,2,3, поскольку состояние 4 и состояния 1,2,3 принадлежат разным классам эквивалентности. Значения limP^n) = 0, i = 1,2,3, и limP^n) = 0 т. к. состояния {1,2,3}, {4} образуют классы эквивалентности, кото- рым состояние {5} не принадлежит. Для вычисления lim Р^(п), j = 1,2,3,4 воспользуемся тео- ремой о вероятностях поглощения (см. теорему 2.1.6): йтРзДп) = 7T5(Ci)7Tj, j = 1,2,3; limP54(n) = 7Г5(С2)7Г4. n Легко видеть, что /z-, ч 1 1 1 1 7Г5(С1)-3 + 9 + 27 + ---"2;
2.1. Эргодическая теорема 99 , 1 1 1 1 7Г5(С2)-§ + 9 + 27 + "'“ 2' Поэтому limP5j(n) = 7г5(С1)7г^ = Kj/2, j = 1,2,3; limP54(n) = 7Г5(С2)7Г4 = 1/2. п Вероятности ttj, j = 1,2,3, находим, пользуясь теоремой о ста- ционарном и эргодическом распределении (см. теорему 2.1.4): 7П = 7/15, 7Г1 = 4/15, 7Г1 = 4/15. О предельном поведении марковской цепи. Как из- вестно, множество всех состояний марковской цепи — фазовое пространство — распадается на несущественные состояния и не- пересекающиеся классы существенных состояний — классы эк- вивалентности (некоторые классы эквивалентности могут состо- ять из одного состояния). Мы исследовали предельное поведение Pij(n) при п —> оо для всех возможных пар г, j : 1° Для несущественного состояния j lim Pjj (ri) = О, вне зависимости от того, каким является состояние i — су- щественным или несущественным. 2° Если состояния i и j принадлежат разным классам эк- вивалентности, то lim Р^ (n) = О, поскольку Pij(n) = 0 для всех п. 3° Состояния j и i принадлежат одному классу эквива- лентности. Если класс эквивалентности нулевой, то lim Р^ (ri) = 0. Если класс эквивалентности ненулевой, то lim Р^ (n) = 7Tj, j e C, — в силу эргодической теоремы. Из приведенных результатов о поведении Pij(ri) при п —> оо следует, что при п —> оо распределение Qn({fc}) = Р{£п = к}, к е х,
100 Глава 2. Предельные теоремы для марковских цепей марковской цепи всегда сходится к некоторому предельному рас- пределению: 1° В нулевом классе эквивалентности С для любого N > О при п сю Ж1 > N} -+ 1 — “цепь уходит в бесконечность** (см. теорему 1.3.4). Если класс С нулевой возвратный, то цепь, уходя в беско- нечность из данного состояния j, с вероятностью 1 возвраща- ется в него бесконечное число раз, если же класс С нулевой невозвратный, то цепь с вероятностью 1 возвращается в со- стояние i конечное число раз. 2° В ненулевом классе эквивалентности существует соб- ственное предельное распределение цепи, совпадающее с эргоди- ческим: limQn({fc}) = limР{£п = к} = тг&, к 6 С. 3° Цепь, стартующая из несущественного состояния i, “по- глощается” классом (классами) эквивалентности. При этом цепь, будучи поглощенной нулевым классом, уходит в беско- нечность, если же цепь поглощается ненулевым классом эк- вивалентности, то ее распределение сходится к собственному эргодическому распределению. Критерии возвратности и невозвратности марковской цепи. Далее приводятся необходимые и достаточные условия невозвратности марковской цепи в терминах существования ре- шения некоторой системы линейных уравнений и достаточные условия возвратности цепи в терминах существования решения некоторой системы линейных неравенств. Теорема 2.1.7 (критерий невозвратности цепи). Пусть В — неприводимая марковская цепь с фазовым пространством X = {0,1,...} и матрицей переходных вероятностей Р = [Р^-]. Для того, чтобы марковская цепь В была невозвратной, необ- ходимо и достаточно, чтобы система уравнений У> = Т^УЬ г = 1,2,..., (2.1.17) j=0 имела ограниченное отличное от константы решение. Доказательство. В неприводимой марковской цепи В с фазовым пространством X = {0,1,...} и матрицей переходных
2.1. Эргодическая теорема 101 вероятностей Р = [Pjj] вероятности достижения f*G удовлетво- ряют равенствам fi0 = Pi0+ Е г = 1,2,... (2.1.18) jex\{0} (см. (1.3.7)). Равенства (2.1.18) означают, что последователь- ность 2/0 = 1, yj = fj^ 7 = 1,2,... (2-1.19) всегда является решением системы (2.1.17). Если цепь В невозвратная, то найдется j (j = 1,2,...) такое, что //о<1 (см. теорему 1.3.7). И следовательно, для невозвратной цепи В существует ограниченное отличное от константы решение систе- мы (2.1.17). Таким решением, например, является (2.1.19). Пусть система (2.1.17) имеет отличное от константы ограни- ченное решение {у3}: \yj\ < С < оо, j = 0,1,... Докажем, что тогда цепь В невозвратная. Ограниченное отличное от константы решение системы (2.1.17) можно считать таким, что 2/0 = 1, о <7/, <2, j = 0,1,.... (2.1.20) В самом деле, вместе с каждым решением {т/Д системы (2.1.17) его линейное преобразование: Zj = &2/г + b, i = 0, 1, . . . (для любых а и Ь) также будет решением этой системы. За счет выбора а и b для значений Zj = аУг + b,i = 0,1, ... , можно обеспечить выполнение условий ^о = 1, 0 < Zj < 2, i = 0,1,...,
102 Глава 2. Предельные теоремы для марковских цепей (см. рис. 2.1.1), например, потребовав, чтобы а и b в линейном преобразовании z = ay + b удовлетворяли системе ( aC + b < 2, < —aC + b > 0, ayQ + b= 1 (систему можно решить, выразив b из уравнения ay$ + b = 1 и подставив его в неравенства). Так что далее решение {yj} системы (2.1.17) такое, что 2/0 = 1, 0 < у3 < 2, j = 0,1,2... Далее, вместе с марковской цепью В с матрицей одношаго- вых переходных вероятностей Р = [Pij] рассмотрим марковскую цепь В (ее параметры будем “маркировать” значком ~) с матри- цей одношаговых переходных вероятностей Р = [Pij], у которой состояние 0 является поглощающим экраном (далее {0} = Со), а вероятности перехода между другими состояниями те же, что и в цепи В. Цепь В получена из цепи В превращением состоя- ния 0 в поглощающий экран. Матрица переходных вероятностей Р цепи В имеет вид Р = [А;] = Ao А)1 Ao А1 Ao Ai А)2 Р12 Р22 ’10 0 Р10 Рц Р12 Р20 Р21 Р22 (2.1.21)
2.1. Эргодическая теорема 103 т. е. Poo = 1, Poj —0, j = Р0 =Р0, г = 1,2,..., 7=0,1,... Каждое из состояний г, i = 1,2,..., в цепи В несущественное (а следовательно, и невозвратное) — поскольку цепь В неприво- дима, то состояние 0 достижимо из каждого состояния i (г 0) в цепи В, а, следовательно, и в цепи В, поскольку Рю = Рю, i = 1,2,... А так как Со = {0} — поглощающий экран в цепи В, то состояния i = 1,2,... в цепи В несущественные. Ограниченное отличное от константы решение {yj} (у$ = = 1, 0 < < 2, 7 = 0,1,2...) системы (2.1.17) при каждом п = 1,2,..., является решением и системы оо Vi = 52 г = 0,1,... (2.1.22) 7=0 В самом деле, {yj} — решение системы оо Vi = i = 0,1,..., 7=0 поскольку при i = 1,2,... уравнения этой системы совпадают с уравнениями системы (2.1.17), а при i = 0 соответствующее уравнение последней системы имеет вид Уо = До • Уо, или уо = 1 • уо- Из оо Уг = 52 А7У7, г = 0,1,..., 7=0 ОО yj = 52 р^Ук, j = о, i,..., k=0
104 Глава 2. Предельные теоремы для марковских цепей имеем оо оо оо оо оо У г — ?ij Pjkyk — У k ?ij Pjk = Pik(^)yk j=0 к=0 к=0 j=0 к=0 т. е. оо yi — Ък^Ук к=0 и так далее. Так что для каждого п = 1,2,... система (2.1.22) имеет своим решением ограниченное отличное от константы ре- шение {yj} системы (2.1.17). Из (2.1.22) для каждого п = 1,2,... имеем оо Vi = ^2 Д/(п)%' - Ло(п)уо = Ао(п), г = о, 1,2,... j=0 т. е. ЛоЫ < yi, i = 0,1,2... Переходя в полученных неравенствах к пределу при п —> оо в силу теоремы о вероятностях поглощения (см. теорему 2.1.6) получим 7гДСо)7го < yi, i = 0,1,2,..., а, учитывая, что тго = 1, тгДСо) < yi, i = 0,1,2,... И поскольку 7гДСо) = /*0^ = 0,1,2,..., то для всех i = 0,1,2,... f*0 < Уг- Последовательность {ty} не является постоянной, а уо = 1, по- этому найдутся такие ук, что у*, < 1 или у*, > 1. Если найдется Ук < 1, то fko <Ук<^- И, следовательно, цепь В невозвратна — у возвратной цепи все и в частности /£0, равны 1.
2.1. Эргодическая теорема 105 Если все yk > 1, то Zj = ~Vi + 2, г = 0,1,... — ограниченное отличное от константы решение системы (2.1.17), причем Z{ < 1. И мы приходим к уже рассмотренной ситуации. Тем самым теорема доказана. Теорема 2.1.8 (достаточное условие возвратности цепи). Пусть В — неприводимая марковская цепь с фазовым простран- ством X = {0,1,...} и матрицей переходных вероятностей Р = [Pjj]. Достаточным условием возвратности цепи В явля- ется существование стремящегося к +оо решения {уД систе- мы неравенств оо Vi — Pijyj'") ^ = 1,2,... (2.1.23) j=0 Доказательство. Пусть {уД — стремящееся к +оо ре- шение системы неравенств (2.1.23). Будем считать его положи- тельным, поскольку вместе с каждым решением {уД системы (2.1.23) ее решением будет zj = У1 + j = 0,1,2,... Решение {yj} системы неравенств (2.1.23) при каждом п = = 1,2,... является решением и системы неравенств оо Уг > 52 г = 0, 1,... j=0 (2.1.24) (Pjj и Pjj(n) введены в доказательстве теоремы 2.1.7). В самом деле, {yj} — решение системы неравенств Из Уг > 'P'Pijyj, г = 0,1,... 7=0 ОО Уг > г = 0,1,..., 7=0
106 Глава 2. Предельные теоремы для марковских цепей ОО yj > ^Pjkyk, j = 0,1,..., k=o имеем оо оо / оо \ оо Vi > Pijyj — Pij I PjkVk j — Pik^tyyk-, i — 0, 1, . . . , j=0 j=0 \k=0 J k=0 ИЛИ oo yi > Piki.tyyk’) i — 0,1, ... , k=0 и так далее. Так что для каждого п = 1,2,... система неравенств (2.1.24) имеет своим решением стремящееся к +оо решение {т/Д. системы неравенств (2.1.23). Из (2.1.24) для каждого п = 1,2,... имеем М— 1 оо yi > 52 &АпУУз + 52 ^з^Уз j=0 j=M М—1 оо > 52 Рз&Ууз + ““{yr} 52 Аяп) = j=0 j=M М-1 / М-1 \ = 52 Кз(пУуз+1 - 52 > j=o г~ \ j=o J т. е. м-1 / м-i \ yi > 52 Рз(.пУуз + чрп{уг} 1 - 52 АЯ71) ,«= 1,2,... j=0 \ j=0 ) Перейдем в этих неравенствах к пределу при п оо. Для i = 1,2,..., j' 0 получим lim Рц(п) = 0, n J поскольку в цепи В все состояния j = 1,2,... несущественные. Для $ = 1,2,...hJ = 0b силу теоремы о вероятностях поглоще- ния lim Ру (п) = 7Гг(Со)7ГО = 7fj(Co),
2.2. Цепь, описывающая очередь 107 поскольку i = 1,2,... — несущественные состояния, а класс {0} = Со в цепи В возвратный. Так что в результате предель- ного перехода имеем yi > тГг(Со)уо + min{yr}(l - 7fj(C0)), г = 1,2,... г>М Отсюда Перейдем в последнем неравенстве к пределу при М сю. Так как уп сю при п сю, то и min{?/r} сю при М сю, г>М поэтому в пределе имеем 1 - 7Гг(Со) < 0, г = 1,2,..., и следовательно, 7г»(Со) = 1, i = 1,2,... А поскольку = 4 г = 1,2,..., ТО /*о = 1, г = 1,2,... Поэтому цепь В возвратна — в невозвратной цепи хотя бы для одного i значение f*Q < 1 (см. теорему 1.3.7). 2.2 Дискретная марковская цепь, описывающая очередь Важным приложением марковских цепей является теория массового обслуживания. Рассмотрим одну из простейших ее задач — обслуживание с ожиданием. Заявки в случайные моменты времени поступают к месту обслуживания и становятся в очередь. Обслуживание одной за- явки занимает фиксированное время — будем считать его рав- ным 1. За единицу времени обслуживается одна заявка. Начина- ется и заканчивается обслуживание в целочисленные моменты времени. Найти распределение длины очереди в момент време- ни п, если не при всех п, то хотя бы при достаточно больших, т. е. в установившемся режиме.
108 Глава 2. Предельные теоремы для марковских цепей Обозначим через цп число заявок, ждущих обслуживания к моменту времени п — длину очереди из заявок к моменту време- ни п. Случайную величину цп будем называть состоянием систе- мы обслуживания в момент времени n, п = 0,1,2,... В течение времени обслуживания данной заявки могут поступать новые заявки. Обозначим через £п число заявок, поступивших за пери- од обслуживания [n, n+ 1), число заявок £п является случайной величиной, п = 0,1,2,... Будем предполагать, что случайные величины £n, п = 0,1,..., независимы и одинаково распределе- ны, каждая с распределением P{£n = k} = ак, к = 0,1,... Ясно, что по истечении периода обслуживания [n, n+1) система из состояния т]п переходит в состояние ?7п+1 = (т?п - 1)+ + 6г, туо = 0, п = 0,1,... (2.2.1) Последовательность случайных величин {%} образует мар- ковскую цепь. Чтобы убедиться в этом, проверим, что для {г?п} выполняется марковское свойство. Имеем, учитывая, что слу- чайные величины {£„} независимы, Р{%+1 = j\fln = г, Vn-1 = in-i,..., г)0 = г0} = = Р{(% - 1)+ + U = j \т]п = г,Tjn-i = in-i,..., Tfo = г0} = = Р{(г - 1)+ + 6г = j, Tin = г, ??n-i = гп-!,.. , г?0 = г0} = Р{т]п = г, r/n-i = in-i,..., г)0 = г0} = Р{(г - 1)+ + 6г = j} = P{£n = j-(i- 1)+}. Аналогично Р{%+1 = j\Tln = о = Р{6г = j - G - 1)+}- (2.2.2) Так что последовательность случайных величин {т/п} — длина очереди из заявок, ждущих обслуживания к моменту тг, обла- дает марковским свойством, и, следовательно, является марков- ской цепью. Элементы матрицы переходных вероятностей этой цепи (см. 2.2.2) имеют вид pij = Р{т1п+1 = j\Tln = г} = P{£n = j - (г - 1)+}, г, j = 0,1,... (чтобы цепь за период обслуживания перешла из состояния i в состояние за этот период должно поступить j — (г — 1)+
2.2. Цепь, описывающая очередь 109 заявок). Цепь стационарная — переходные вероятности Pjj не зависит от п, поскольку £п одинаково распределены. Поскольку £п — неотрицательная целочисленная случайная величина с распределением P&n = к} = ak, к = 0,1,... (значения Р{£п = к} = 0, к = — 1, —2,...), то элементы Pij = Pttn = 1)+}, i,j = 0,1,... матрицы переходных вероятностей Р можно записать в следую- щем виде: элементы первой строки (г = 0) Poj = Р{£п = j - (о - 1)+} = Жг = Л = aj, j = 0,l,..., а элементы, начиная со второй строки (i > 1), j = 0,1,..., P0 = PR„=j-(i-l)+} = = PRn=j-G-l)} = aj_(i_1)) (2.2.3) при j — (i — 1) <0 значения = 0. Матрица переходных вероятностей цепи Р= [Ру] = ао ао 0 0 ai а2 аз ai а2 аз ао ai az 0 ао ai Далее будем предполагать, что к = 0,1,..., строго боль- ше нуля. Это предположение обеспечивает неприводимость це- пи {т)п}. Среднее число заявок и распределение длины очере- ди. Интуитивно ясно, что если среднее число заявок Л/= ка^, к которые поступают за время обслуживания данной заявки, боль- ше числа заявок, обслуживаемых за период (здесь больше 1): 52> х> к
110 Глава 2. Предельные теоремы для марковских цепей то с ростом п длина г]п очереди заявок будет неограниченно возрастать. Если же среднее число заявок ^kak, поступивших к за период обслуживания, меньше 1: < 1, к то естественно ожидать, что распределение длины очереди долж- но стремиться к некоторому стационарному (равновесному) рас- пределению. Теорема 2.2.1. Если в марковской цепи Лп+1 = (% - 1)+ + Сп, % = О, п = 0, 1, . . . , описывающей очередь, оо > 1, k=0 и > 0, к = 0,1,..., то цепь {г]п} является невозвратной и, как следствие, сходится по вероятности к сю. Доказательство. Условие ак > 0, к = 0,1,..., обеспечивает неприводимость марковской цепи. Покажем, что если оо ^kak > 1, k=o то система уравнений оо Vi — ^ijyj’» ~ 2,... (2.2.4) j=0 имеет ограниченное отличное от константы решение, что, со- гласно теореме 2.1.7, является достаточным условием невозврат- ности цепи. Будем искать решение системы (2.2.4) в виде Уз = .7 = ОД,,
2.2. Цепь, описывающая очередь 111 где х — число из промежутка (0; 1), т. е. убедимся в существова- нии числа хо 6 (0; 1) такого, что yj = Xq, j = 0,1,..., является решением (2.2.4). Если yj = х3, j = 0,1,..., — решение системы (2.2.4), то ^PijXj = х\ i = 1,2,... (2.2.5) j=0 А поскольку, начиная со второй строки, т. е. при i > 1, элементы матрицы Р = [Pij] имеют вид = aj-^-ip причем при j — (г — 1) < 0 значение aj_^_^ = 0, то оо оо оо 52 РИх3 = 52 «7-0-1)^ = 52 г = 1,2,..., j=0 j=0 j=i-l и систему (2.2.5) можно переписать в виде оо — (г—1)*^ = > 1 = 1,2,..., j=i-l ИЛИ оо £ = х, i = 1,2,..., .7=2-1 или оо ^2akxk = х, i — 1,2, • • • к=0 (все уравнения системы оказались одинаковыми). Убедимся, что уравнение /(х) = X, оо где f(x) = akx\ имеет решение на промежутке (0,1). к=о
112 Глава 2. Предельные теоремы для марковских цепей Рассмотрим непрерывную на [0,1] функцию F(x) = f(x) ~ х- Для F(x) имеем F(0) = /(0) = а0 > 0; ОО F(l) = /(1)-1 = $>*-1 = 0, k=0 оо F'(x) = f’(x) - 1 = 5? kakxk~1 - 1, k=i oo F'(l) = $>afe - 1 > 0, k=l последнее неравенство имеет место в силу условия теоремы. По- этому на промежутке (0,1) найдется точка, в которой F(x) от- рицательна. И поскольку F(x) непрерывна на [0,1], существует точка xq 6 (0; 1), такая, что F(xq) = f(xQ) - хо = 0, или, что то же, оо ^акх% = х0, к=0 а в исходных обозначениях оо Fij Xq — Xq у i — 1,2,... j=0 Вектор Уд =хф j = 0,1,... является ограниченным отличным от константы решением системы (2.2.4), что влечет невозвратность цепи {т/п}. Неприводимая невозвратная, а, значит, и нулевая цепь {т/п} с фазовым пространством X = {0,1,...} при п —> оо сходится по вероятности к +оо (см. следствие из теоремы 1.3.4). Послед- нее означает неограниченный рост длины очереди с течением времени. Утверждение, аналогичное теореме 2.2.1 имеет место, если за единицу времени обслуживается s заявок.
2.2. Цепь, описывающая очередь 113 Теорема 2.2.2. Если в марковской цепи 7?п+1 = (% - «)+ + 6г, % = О, П = 0, 1, . . . , описывающей очередь, оо 52 ka* >s' k=0 и > 0, к = 0,1,..., то цепь {г]п} является невозвратной и, как следствие, сходится по вероятности к +оо. Теорема 2.2.3. Если в марковской цепи Vn+l = (jin - 1)+ + £п, % = О, П = 0, 1, . . . , описывающей очередь, оо 52 ка* < х> к=0 и > 0, к = 0,1,..., то цепь {г]п} является возвратной и, как следствие, ее распределение сходится к эргодическому распре- делению. Доказательство. Условие > 0, к = 0,1,..., обеспечивает неприводимость и непериодичность марковской це- пи. Покажем, что в предположении оо 52 как <1 к=0 система неравенств оо Vi > РцУ;Ь ^—1,2,..., j=0 имеет решение, стремящееся к +оо, что согласно теореме 2.1.8, является достаточным условием возвратности цепи {т/п}, а, сле- довательно, и ее эргодичности. Таким решением, в частности, является yj = 3, 3 = ОД, • • •
114 Глава 2. Предельные теоремы для марковских цепей Убедимся в этом. Учитывая вид матрицы переходных вероятнос- тей цепи, описывающей очередь (см. (2.2.3)), имеем: оо оо оо У2 ^0^ — У2а.7-(г-1)7 = У? — j=0 j=0 j=i-l оо оо = 52 aJ-(i-l)0' - (« - !)) + 52 «j-(i-l)G “ 1) = j=?-l j=i-l oo oo = У2 kak + G — 1) = У2 kak — 1 + 2 < 2, k=Q k=0 i = 1,2,... Так что г > г = 1,2,..., j=0 и, следовательно, в силу теоремы 2.1.8 цепь {т)п} возвратная. Согласно теореме 2.1.3 распределение возвратной неприво- димой непериодической цепи сходится к эргодическому распре- делению. Последнее обозначает, что распределение длины оче- реди с течением времени стремится к предельному распределе- нию. Утверждение, аналогичное теореме 2.2.3 имеет место, если за единицу времени обслуживается s заявок. Теорема 2.2.4. Если в марковской цепи 7?п+1 = (»7п - «)+ + £п, % = 0, п = 0, 1, . . . , описывающей очередь, оо k=0 < s, uak > 0, к = 0,1,..., mo цепь {г]п} является возвратной и, как следствие, ее распределение сходится к эргодическому распре- делению.
2.3. Задача о разорении игрока 115 2.3 Задача о разорении игрока Игрок Gm (с капиталом т) играет в азартную игру с игро- ком Gm (с капиталом М), участвуя в серии последовательных партий игры. В результате каждой партии капитал игрока Gm с вероятностью р увеличивается на 1 (за счет игрока Gm) и с вероятностью q = 1 — р уменьшается на 1 (в пользу игрока Gm)- Результат каждой партии не зависит от результатов предыду- щих партий. Если капитал одного из игроков становится равным нулю, то игрок разоряется, игра прекращается. Найти вероят- ность разорения игрока Gm. Обозначим через капитал игрока Gm после k-й партии. Последовательность случайных величин {£&} образует марков- скую цепь, см. пример 1.1.2 (с. 13). Множеством состояний мар- ковской цепи {£ь} является {0,1,..., п}, где п = т + М -— сум- марный капитал игроков. Матрица переходных вероятностей це- пи {£ь} имеет вид р = ’10 0 0 q 0 р 0 ... 0 0 ... 0 0 ... 0 0 0 ‘ 0 0 (2.3.1) 0 q 0 р 6 6 6 6 ... q 6 р ООО 0 ... 0 0 1 _ Состояния 1,2,... ,п — 1 несущественные. Состояния 0 и п яв- ляются поглощающими экранами, цепь, попав в поглощающее состояние, остается в нем навсегда. Далее класс {0} будем обо- значать через Со, а класс {п} — через Сп- В терминах марковской цепи {£&} вероятность разорения иг- рока Gm — это вероятность поглощения цепи классом Со- И, сле- довательно, задача “найти вероятность разорения игрока Gm” в терминах марковской цепи {£&} формулируется так: “найти ве- роятность поглощения цепи {£&} классом Со”. Уравнения для вероятностей поглощения. Пусть {Са} — марковская цепь с матрицей переходных вероятностей [Р^-], С — некоторый ее класс эквивалентности, Т — множество всех несущественных состояний цепи, i — несущественное состояние цепи. Через тгДС), как и ранее, будем обозначать вероятность того, что цепь, стартуя из несущественного состояния г, рано или поздно достигнет класса С, и, следовательно, будет им по- глощена, а через тг[к\с) — вероятность того, что цепь, стартуя
116 Глава 2. Предельные теоремы для марковских цепей из состояния г, достигнет класса С на k-м шаге (74(G) будем называть вероятностью поглощения цепи классом С, а тг^\с) — вероятностью поглощения цепи классом С на fc-м шаге). Вероятности поглощения 74(G), г е Т, классом С цепи с матрицей переходных вероятностей [Pij], удовлетворяют сис- теме линейных уравнений 7Г,(С) = тгг(1)(С) + £Pi^C), i е Т. (2.3.2) зет Заметим, что тг^(С) вычисляется по элементам матрицы пере- ходных вероятностей [Р^] : ^1)(C') = EPV’ зес Вероятность разорения игрока, играющего с партне- ром, капитал которого ограничен. Марковская цепь {£&}, описывающая размер капитала игрока Gm, играющего с партне- ром Gm, капитал М которого ограничен, имеет конечное число состояний: O,l,...,n(n = m + M — суммарный капитал игроков Gm и Gm) и её матрица переходных вероятностей [Р^] имеет вид (2.3.1). Вероятность разорения игрока Gm, накопившего капитал до размера i, равна вероятности поглощения тгДСо) цепи классом Go = {0}, г = 1,2,... ,п — 1. Найдем вероятности щ = тъ(Св), г = 1,2,... ,п — 1, как решение системы уравнений (2.3.2), когда С = Go = {0}, матрица переходных вероятностей Р имеет вид (2.3.1), класс Т = = {1,2,..., тг — 1}. При этом система (2.3.2) запишется так: п—1 7гг(С’о) = тгг(1)(С’о) +^PyTTj^’o), г = 1,2,... ,п — 1, (2.3.3) где тг^Со) = Е Pv = Е • ’п- jeco je{0}
2.3. Задача о разорении игрока 117 или так: щ = Рю + Pijuj) i — 1,2,... ,п — 1. (2.3.4) J=i Первое уравнение (соответствующее i = 1) системы (2.3.4) за- пишется так: их = q + puz- Уравнения системы (2.3.4) для i = 2,3,..., п — 2 имеют вид щ = quj-i + рщ±х- Последнее уравнение (при i = п — 1) системы (2.3.4) имеет вид ^п—1 = q^n—2- Так что система (2.3.4) запишется так: их = q + pu2, U2 = < щ = qui-x + рщ+х, (2.3.5) un-2 = qun-3+pun_x, un—i — qun—2- Будем искать решение системы (2.3.5) отдельно для случая q р и для случая q = р = 1/2. Пусть q р. Сначала найдем решение системы щ = qui-x + pui+x, i = 2,3,... ,п — 2. (2.3.6) Будем искать решение в виде щ = хг, i = 2,3,... ,п — 2. Под- ставляя щ = хг, i = 2,3,..., п — 2, в уравнения щ = qu^x + pui+x, i = 2,3,... ,п — 2, получим: хг = qx1-1 +рхг+\ i = 2,3,... ,п - 2, или рх2 + q = х.
118 Глава 2. Предельные теоремы для марковских цепей Это квадратное уравнение имеет два решения: х = 1 и х = = q/p- При х = 1 имеем Щ = = хг = 1, i = 2,3,..., п — 2. Но щ, i = 2,3,... ,п — 2, -— вероятности поглощения цепи клас- сом Со, и они не могут быть равны 1, поскольку цепь с ненуле- вой вероятностью может быть поглощена и классом Сп = {п}, поэтому решение тгДСо) = щ = 1, i = 2,3,..., п — 2, системы (2.3.6) мы не можем рассматривать в качестве вероятностей по- глощения классом Со- Для х = q/p -— второго корня квадратного уравнения — име- ем такое решение системы (2.3.6): / q\i Uj = ( - I , i = 2,3,..., n — 2. \PJ Вместе с решением щ, i = 2,3,..., n — 2, системы уравнений (2.3.6), ее решением является и А + Вщ, г = 2,3,..., п — 2, для любых констант А и В (в последнем убеждаемся непосред- ственной проверкой). Выберем константы А и В так, чтобы это решение было решением также первого и последнего уравнений системы (2.3.5). Из первого уравнения u\ = q + pu2 системы (2.3.5) имеем: А + Buy = q + р(А + Виъ), А(1 - р) = q + B(pu2 - гн), Aq = q + B(p(l\2-Я), \ \Р/ Р/ Aq = q - Bq, А + В = 1.
2.3. Задача о разорении игрока 119 Из последнего уравнения un—1 — Q^n—2 системы (2.3.5) получаем: А + Bun-i = q(A + Btin-2), A(l-q) = B(qun-2 - un_ / / \ n-2 п—1 Ар = В Ар = -В P ' Apn + Bqn = 0. Таким образом, для определения А и В имеем систему уравне- ний А + В = 1, Арп + Bqn = 0. Отсюда qn (1-В)рп + В^п=0, рп В = —---------, рп _ qn рп А = 1 - В = 1--------= - рп — qn qn _ рп И следовательно, решением системы (2.3.5), если q р, является Uj = А + В qn рп qn _ рп рп _ qn = 1 (ап _ vn (Я VA = (д/р)' - (g/p)n g"-pnV р \р) J i-(q/p)n i = 1,2,... , n — 1. Так что при q р игрок Gm, имея накопленный капитал г, разорится с вероятностью (q/рУ - (.q/рУ , 9 . -------:——-----, Г = 1, 2, . . . ,П — 1. 1 - (q/p)n
120 Глава 2. Предельные теоремы для марковских цепей Заметим, что вероятность разорения игрока Gm не зависит от его начального капитала т, она определяется капиталом г, на- копленным им к данному моменту. Рассмотрим теперь случай, когда q = р = 1/2 . Система (2.3.5) перепишется так: f u\ = 1/2 + u2/2, u2 = ui/2 + us/2, < Uj — 1/2 + 712+1/2, ^n—2 — з/2 + Un—1/2, < Un— 1 — Un — 2/2. Решением системы является Ui — i, i — 2,3,... ,n 2, в этом убеждаемся непосредственной проверкой. Легко видеть, что вместе с решением щ решением последней системы будет и А + Вщ = А + Bi, i = 2,3,... ,n — 2. Выберем теперь А и В так, чтобы это решение было также ре- шением первого и последнего уравнений системы. Для первого уравнения имеем Л + В = | + |(Л + 2В). Отсюда А = 1. Для последнего уравнения 1 un—1 — 2^п—2 системы имеем А + В(п - 1) = + В(п - 2)).
2.3. Задача о разорении игрока 121 Отсюда и, следовательно, решением системы (2.3.5), если q = р = 1/2 является i щ = 1-----, г = 1,2,... ,п — 1. п Так что если игрок Gm, с вероятностью р = 1/2 увеличивая свой капитал на 1 в результате каждой партии (и с вероятностью 1/2 теряя единицу капитала), стал обладателем капитала г, то вероятность его разорения г ur = 1----, г = 1,2,..., п — 1, п а вероятность неразорения г 1 — ur = г = 1,2,..., п — 1, п пропорциональна величине г накопленного капитала. Замечание. Аналогичные выкладки показывают, что ве- роятность vr разорения игрока Gm, если он накопил капитал г, равна 1 — ur, г = 1,2,..., п — 1. Вероятность разорения игрока, играющего с беско- нечно богатым партнером. Пусть теперь игрок Gm играет с игроком Gqo, капитал которого неограничен (равен +оо). Мат- рица переходных вероятностей марковской цепи {£&}, описыва- ющей размер капитала игрока Gm, имеет вид 1 Q О Р = ООО О р О q о р (2.3.7) состояние 0 (Cq = {0}) цепи является поглощающим, состояния 1,2,... — несущественные. Система уравнений (2.3.2) для вероятностей щ = тгДС), i 6 Г, поглощения цепи классом G, когда матрица переход- ных вероятностей цепи имеет вид (2.3.7), класс Go = {0}, а Т = {1,2,...} запишется так: ( ui = q + pu2, I Щ = qui-i + pui+i, i = 2,3,... (2.3.8)
122 Глава 2. Предельные теоремы для марковских цепей Решение последней системы получаем так же, как и в случае игры с игроком Gm, капитал которого ограничен. Сначала найдем решение системы щ = quj-i +pui+i, i = 2,3,... При q p ее решением является последовательность щ = А + в(^ , г = 2,3,..., если q = р = 1/2, то решением является последовательность щ = А + В • i, i = 2,3,... При q/p > 1 и при р = <7 = 1/2из условия ограниченности решения щ, i = 2,3,, получаем, что В = 0, и, следовательно, как при q > р, так и при р = q = 1/2 решение системы щ = qui-i +p^+i, i = 2,3,..., имеет вид Uj = A, i = 2,3,... Выберем А так, чтобы последовательность щ = А, г = 1,2,3,... была решением и уравнения u\ = q + pu2 системы (2.3.8). Для этого А должно удовлетворять уравнению А = q + рА. Отсюда А = 1 и, следовательно, решением системы (2.3.8) яв- ляется щ = 1, i = 1,2,..., т. е. 7г(Со) = щ = 1, i = 1,2,... Последнее означает, что если q > р, то игрок Gm, играя с иг- роком Gqo, капитал которого неограничен, неизбежно разорится (вероятность разорения равна 1) вне зависимости от размера его начального капитала. Если вероятность р выигрыша игрока Gm больше вероятнос- ти q выигрыша игрока Goo, т. е. р > q, то для получения выводов
2.3. Задача о разорении игрока 123 о вероятности 7гг(Со) разорения игрока Gm, играющего с игро- ком Gqo, капитал которого неограничен, воспользуемся резуль- татом, полученным в задаче о разорении игрока Gm, играющего с игроком Gm, капитал М которого ограничен. В качестве вероятности разорения 7rr(Go) игрока Gm, игра- ющего с игроком Gqo, естественно рассмотреть предельное зна- чение вероятности ur = ur(n) = (q/рУ - (q/p)n i - {.q/p)n разорения игрока Gm при п = М + т^оо — при неограничен- ном росте капитала М игрока Gm, а именно 7Гг(С0) = (q/pY, Г = 1,2,... Из последнего равенства следует, что чем больше накопленный капитал г игрока Gm и чем больше вероятность р выигрыша игрока Gm в одной партии, тем меньше вероятность 7rr(Go) его разорения, что вполне согласуется с нашей интуицией. Если, к примеру, р = 2/Зиг = 10, то вероятность разорения игрока Gm, играющего с бесконечно богатым игроком, равна /дУ=р/3У°= 1 \р) \2/з) 1024’ а вероятность того, что игрок не разорится, естественно, равна 1 - 1/1024. Интересно, что если вероятность р выигрыша игрока Gm больше вероятности q выигрыша игрока G^, то игрок Gm с вероятностью 1 — (q/p)r не только не разорится, но с ростом числа к сыгранных партий неограниченно увеличит свой капи- тал. В самом деле, пусть игрок Gm начинает игру с капиталом г. Покажем, что для любого целого положительного L при fc —> (X) P{£k > L} -+ 1 - тгг(Со) = 1 - (j) . Очевидно, Ш <L} = P{£k € Co} + P{1 < Cfc < L}. (2.3.9)
124 Глава 2. Предельные теоремы для марковских цепей По определению оо к оо тгг(Со) = £тг^(С0) = 2>W(Co)+ £ 7Г^(Со), S=1 S=1 s = fc+l и т. к. к Е^(С0) = Р{£к G Со}, S=1 то тгг(Со) = Р{& G Со} + £ тг^(Со). s=fc+l Поэтому при А) —> СЮ Р{£к е Со} -+ 7ГГ(СО). (2.3.10) Оценим сверху Р{1 < < L}. Воспользовавшись соотношением (1.1.8), получим L L оо L Р{1 < 4 < L} = ^Р{^к = j} = j=l j=l i=l j=l (для i У г значения pi = 0, a pr = 1 — цепь стартует из состо- яния г). И поскольку состояния j = 1,2,..., L несущественные, а, следовательно, и невозвратные, то Prj(k) 0 при к сю. Поэтому для любого е > 0 при достаточно больших к Р{1 < & < L} < г. Из последнего неравенства и соотношений (2.3.9), (2.3.10) полу- чаем, что для каждого L при fc —> сю Р{£к > L} 1 - 7ГГ(СО) = 1 - (q/p)r. Если у игрока Gm, играющего с бесконечно богатым игро- ком Gqo, вероятность р выигрыша в одной партии равна, напри- мер, 2/3, то он, начиная игру с капиталом m = 10, с вероят- ностью неограниченно увеличит свой капитал (ну очень разбогатеет).
2.4. Примеры и задачи 125 2.4 Примеры и задачи Примеры Пример 2.4.1. Пусть марковская цепь задана матрицей одношаговых переходных вероятностей Р = Г 4/5 3/5 О О L 1/5 1/5 1/5 4/5 О 1/5 О О 1/5 О 1/5 О О 1 1/5 1/5 0 1 О О О 1/5 J Найти ПтД7(п) для всех пар i,j = 1,2,... ,5, если п J пределы существуют. Решение. Классы Ci = {1,2,3}, С? = {4} возвратные нену- левые непериодические, состояние {5} — несущественное. Для вычисления 7Г5(С'1)>7Г5(С2) воспользуемся тем, что ОО оо тг5(С1) = £ £ = £(тг^(ед + + ^(сд), у=1 keCi 12=1 (см. обозначения в доказательстве теоремы 2.1.6). Аналогично ОО 1 ОО 1 12=1 12=1 так что = 3/4. Для класса Сд ^(Сг) = £ = | + ^ + /; + -- - = / 12=1 Далее предельное поведение Pij{n) исследуется аналогично тому, как это делалось в примере 2.1.3.
126 Глава 2. Предельные теоремы для марковских цепей Задачи Задача 2.1. 1) Доказать, что у конечной неприводимой непе- риодической марковской цепи существует собственное стацио- нарное распределение. 2) Доказать, что у конечной неприводимой непериодической марковской цепи существуют пределы lim Рц(п), n J причем их значения отличны от нуля. Указание к п. 1. Описанная цепь ненулевая, а, следова- тельно, возвратная, поэтому существует эргодическое распреде- ление. Далее воспользоваться теоремой 2.1.4. Задача 2.2. В двух урнах находится 8 шаров — в первой 4 белых, во второй 4 черных. Из каждой урны наудачу выбирают по шару и переклады- вают из одной урны в другую. Пусть £п — число белых шаров в первой урне после n-го перекладывания. Предположим, что ша- ры можно перекладывать неограниченное число раз (п оо). Найти предельное распределение числа белых шаров в пер- вой урне (если такое распределение существует). Указание. Убедиться, что последовательность {£п} явля- ется марковской цепью. Предельные значения lim Р{£п — к} совпадают с эргодичес- п ким распределением {л*;}: 1 16 36 16 1 ТГО - уд, 7Г1 - —, 7Г2 — —, 7Г3 — —, 7Г4 - —. Задача 2.3. В двух урнах находится 6 шаров (по 3 в каждой) среди них 3 белых и 3 черных. Из каждой урны наудачу выбирают по шару и переклады- вают из одной урны в другую. Пусть £п — число белых шаров в первой урне после n-го перекладывания. Предположим, что ша- ры можно перекладывать неограниченное число раз (п оо). Найти предельное распределение при п —> оо, т. е. limР{£п = к}, /с = 0,1,2,3, п (если такое распределение существует). Указание. Убедиться, что последовательность {£п} явля- ется марковской цепью. Значения limР{£п = к} = тг&, /с = 0,1,2,3. п
2.4. Примеры и задачи 127 Матрица переходных вероятностей цепи ’О 1 0 0‘ 1/9 4/9 4/9 О О 4/9 4/9 1/9 0 0 10 Эргодическое распределение цепи 19 9 1 770 - 20’ “ 20’ 71-2 “ 20’ 773 “ 20’ Задача 2.4. Монету, вероятность выпадения герба кото- рой равна р (0 < р < 1), подбрасывают независимым образом неограниченное число раз. Пусть — число выпавших гербов при fc-м подбрасывании монеты, к = 1,2,... Рассмотрим после- довательность случайных величин TJn+1 = (Лп + l)-f{i}(6г), % = о, п = 0,1,2,... Вычислить limР{т)п = к}, к = 0,1,2,..., п если эти пределы существуют. Задача 2.5. Симметричную игральную кость подбрасыва- ют независимым образом неограниченное число раз. Пусть — число выпавших шестерок при к-м подбрасывании кости, к = 1,2,... Рассмотрим последовательность случайных величин Vn+I = (»7n + 1)/{6}(&i), % = о, п = 0,1,2,... Вычислить limР{т)п = fc}, к = 0,1,2,... п если эти пределы существуют. Задача 2.6. Марковская цепь с фазовым пространством X = {1,2,3} описывается матрицей переходных вероятностей: ' 1/4 3/4 0 ' 1/4 1/4 1/2 . 0 1/4 3/4 . Найти limPn(n), если он существует. п Ответ: ИтРц(п) = 1/10.
128 Глава 2. Предельные теоремы для марковских цепей Задача 2.7. Марковская цепь с фазовым пространством X = {1,2,3} описывается матрицей одношаговых переходных вероятностей Г 1/2 1/2 0 ‘ 1/4 1/2 1/4 . О 1/2 1/2 Существует ли предел limP22(^)? Если существует — найти п его. Ответ: limP22(^) = 1/2. п Задача 2.8. Марковская цепь с фазовым пространством X = {1,2,3} описывается матрицей переходных вероятностей ’ 1/4 3/4 0 ‘ 1/4 1/2 1/4 О 1/4 3/4 Задано распределение цепи в момент времени t = 0 (начальное распределение): (1 2 3 \ 3/8 1/4 3/8 )• Вычислить limР{£п = к}, к = 1,2,3. п Указание. Воспользуйтесь следствием из эргодической тео- ремы 2.1.2 и теоремой 2.1.4 (о стационарном и эргодическом рас- пределении). Ответ: lim Р{£п = 1} = 1/7, lim Р{£п = 2} = 3/7, lim Р{£п = 3} = 3/7. Значения пределов не зависят от начального распределения. Задача 2.9. Рассматривается марковская цепь с фазовым пространством X = {1,2,3,4}, описываемая матрицей переход- ных вероятностей 2/3 1/3 О О 1/3 1/3 1/3 О О 1/3 2/3 О 0 0 0 1 Вычислить limР^-(п), г, j = 1,2,3,4, если эти пределы сущест- вуют.
2А. Примеры и задачи 129 Задача 2.10. Рассматривается марковская цепь с фазовым пространством {1,2,3}, описываемая матрицей одношаговых пе- реходных вероятностей ’ 4/5 1/5 0 ‘ 3/5 1/5 1/5 О 4/5 1/5 1° Существует ли lim Рц(п)? п 2° Если существует ИтРц(п), найти его. Ответ: ИтРц(п) = 12/17. Задача 2.11. Рассматривается марковская цепь с фазовым пространством {1,2,3,4,5}, описываемая матрицей одношаго- вых переходных вероятностей Г 1/3 2/3 0 0 0 Я 1/3 1/3 1/3 0 0 0 1/3 0 2/3 0 . 0 0 1/3 0 2/3 . 0 0 0 1/3 2/3 . Классифицировать состояния марковской цепи. Для возврат- ных состояний найти математическое ожидание времени перво- го возвращения в состояние. Ответ: Мтг = 17, Мт2 = 17/2, Мт3 = 17/2, Мт4 = 17/4, Мт5 = 17/8. Задача 2.12. Рассматривается марковская цепь с фазовым пространством {1,2,3}, описываемая матрицей одношаговых пе- реходных вероятностей ’ 4/5 1/5 0 ‘ 3/5 1/5 1/5 . 0 4/5 1/5 Задано начальное распределение цепи (распределение в мо- мент времени 0): 1 2 3 \ 1/10 4/5 1/10 )• Вычислить limР{£п = к}, к = 1,2,3.
130 Глава 2. Предельные теоремы для марковских цепей Задача 2.13. Рассматривается марковская цепь с фазовым пространством {1,2,3,4}, описываемая матрицей одношаговых переходных вероятностей ’ 3/4 1/4 О О 1/4 1/2 1/4 О О 1/4 1/2 1/4 О 0 1/2 1/2 1° Можно ли утверждать, что limP^n) существует? п 2° Если ИтРз2(п) существует, найти его. п 3° Вычислить математическое ожидание времени первого воз- вращения в состояние 2. Задача 2.14. Классифицировать состояния цепи Маркова с матрицей одношаговых переходных вероятностей Г 1/2 0 1/2 0 0 “I 0 10 0 0 0 0 1/2 1/4 1/4 0 0 2/3 1/6 1/6 . 0 0 1/3 1/3 1/3 . и вычислить lim Рц(п), если эти пределы существуют. Для возвратных состояний найти математическое ожидание времени первого возвращения. Задача 2.15. Найти предельное распределение марковской цепи, заданной матрицей одношаговых переходных вероятнос- тей 0 1/4 1/5 1/5 4/5 0 1/4 0 0 0 -1 1/5 0 0 1/5 0 0 0 1 0 1/4 1/4 0 Указание. См. пример 2.1.3. Задача 2.16. Рассматривается марковская цепь {£п} с фа- зовым пространством X = {1,2,3} и матрицей одношаговых переходных вероятностей ’ 1/4 3/4 0 ' Р= 1/4 1/4 1/2 0 1/4 3/4
2А. Примеры и задачи 131 Задано распределение цепи в момент времени t = 0: 1 2 Ч \ 1/4 1/2 1/4 J' Вычислить limР{£п — к}, к = 1,2,3. Ответ: lim Р{£п = 1} = 1/10, lim Р{£п = 2} = 3/10, lim P{^n = 3f= 6/10. Задача 2.17. Классифицировать состояния цепи Маркова с матрицей одношаговых переходных вероятностей Г 1/8 0 о о о Р = 1/2 1/8 1/8 1 о о 0 1/2 1/4 0 2/3 1/6 0 1/3 1/3 1/8 I о 1/4 1/6 1/3 J Найти предельное распределение марковской цепи. Задача 2.18. Найти предельные значения Pij(n) для мар- ковских цепей, заданных матрицами одношаговых переходных вероятностей: ’ 0 1/3 2/3 ‘ 0 2/3 1/3 1 о о 0 0 1/3 2/3 О 0 2/3 1/3 0 10 О 10 0 О Задача 2.19. Найти предельные значения Ру(п) для мар- ковской цепи, заданной матрицей одношаговых переходных ве- роятностей О 0 0 1' О 0 10 1/4 3/4 О О 1/2 1/2 О О
132 Глава 2. Предельные теоремы для марковских цепей Задача 2.20. Пусть марковская цепь задана матрицей од- ношаговых переходных вероятностей р = Г V2 1/4 1/4 1/2 1/4 1/4 0 0 1/4 1/4 1/4 0 0 -1 1/4 0 0 1/2 0 0 О 1 О О 1/4 1/4 Найти lim Ру (п) для всех пар (г, J). Задача 2.21. Для марковской цепи с матрицей одношаго- вых переходных вероятностей ’ 3/4 1/4 0 0 0 0 О 3/4 1/400 О р_ 1/4 0 3/4 О О О 1/4 1/4 1/4 0 0 1/4' 1/5 1/5 1/5 0 1/5 1/5 .0 О ООО 1 Вычислить lim Ру (n), i, j = 1,2,... 6, если эти пределы сущест- п вуют. Ответ. Классы эквивалентности — С± = {1,2,3}, С2 = {6}; состояния {4} и {5} — несущественные. limP^n) = 7Г4(С1)тг2, i = 1,2,3; п limP5i(n) = i = 1,2,3; п limP56(n) = 7г5(С2)7г6; limP46(n) = тгДС^тгв- п п Далее см. пример 2.4.1. Задача 2.22. Для марковской цепи с матрицей одношаго- вых переходных вероятностей Г 3/4 1/4 О О О О I 1/2 1/2 0 0 0 О 1/4 1/4 1/5 0 1/5 1/10 1/10 1/5 0 1/2 1/10 1/10 О 0 0 0 1/5 4/5 О 0 0 0 2/5 3/5 вычислить limРу(n), i,j = 1,2,...6, если эти пределы суще- п ствуют.
2А. Примеры и задачи 133 Задача 2.23. Для марковских цепей {^п}, {^п} , описанных в задаче 1.11, найти: 1) lim Р^(п), г, j = 1,2,.. .6 (если эти преде- лы существуют); 2) предельные распределения этих марковских цепей (если они существуют). Вычислить математические ожидания времени первого воз- вращения в состояние. Ответ. 1) Заметим, что состояния 2,3,... ,6 несущественные, а сос- тояние 1 является поглощающим экраном. Для i 1 6 £Ру(п) = 1. (2.4.1) J=1 Поскольку при j 1 значения lim Pij(n) = 0 — состояния i^j = = 2,3, ...,6, несущественные, то переходя в равенстве (2.4.1) к пределу при п оо, получим ИтРи(^) — 1- 2) Марковская цепь {0п} неприводимая, непериодическая, возвратная, ненулевая. Поэтому существует эргодическое рас- пределение lim Pij(n) = 7Tj, j = 1,2,... 6 и оно совпадает с собственным стационарным распределением, т. е. удовлетворяет системе 7Г, 1. Подробнее эта система перепишется так: 7Г1 + 7Г2 + 7ГЗ + 7Г4 + ТГ5 + 7Гб = 6ТГ1, 7Г1 + 7Г2 + 7ГЗ + 7Г4 + ТГ5 + 7Гб = 6ТГ2, 4тг1 + 7Г2 + 7ГЗ + 7Г4 + ТГ5 + 7Г6 = 6ТГ3, ЗТГ2 + 7ГЗ + 7Г4 + ТГ5 + 7Гб = бтГд, 27Г3 + 7Г4 + ТГ5 + 7Г6 = 67Г5, 7Г4 + 7Г5 + 7Г6 = 6ТГ6, 7Г1 + 7Г2 + 7ГЗ + 7Г4 + 7Г5 + 7Г6 = 1. Последовательно вычитая из первого и второго уравнений по- следнее, получаем 1 1 7Г1 = 7Г2 = 6 6
134 Глава 2. Предельные теоремы для марковских цепей Вычитая из третьего уравнения последнее, имеем 37Г! = 67Г3 — 1, отсюда 7Гз = 1/4. И так далее, получаем 7 11 5 74 - 36’ “ 72’ “ 72’ Задача 2.24. Исследовать предельное поведение марков- ских цепей описанных в задаче 1.11. Задача 2.25. Пусть {£п} — последовательность независи- мых одинаково распределенных целочисленных случайных ве- личин, каждая с распределением P{£k = j} = aj, j =0,1,2,... Рассмотрим последовательности случайных величин 1) Сп+1 = (Сп - 1)+ + Cn, С1 = 6, n = 1,2,...; 2) еп+1 = (0п - 3)+ + Сп, 01 = 6, n = 1,2,...; 3) </?п+1 = (<Ai - s)+ + £n, V’l = Ci, n = 1,2,..., s — целое положительное. Показать, что последовательности {^n}, {#п}5 {^п} образуют марковские цепи. Найти их матрицы переходных вероятностей. Пусть 1) имеют распределение P{£k = j} = l/m, j = 1,2,..., m; 2) имеют распределение m = j} = - P)5~j, j = 0,1,..., 5. Исследовать предельное поведение цепей {^n}, {#n}> {^n}- При каких значениях параметров m, р цепи имеют собствен- ное эргодическое распределение? Что можно сказать о предель- ном поведении цепи, если цепь не имеет собственного эргодиче- ского распределения? Задача 2.26. Для марковской цепи из примера 1.3.5 най- ти: 1) limi,j = 1,2,3,4 (если эти пределы существуют); 2) предельные распределения марковской цепи. Вычислить ма- тематические ожидания времени первого возвращения в состо- яние.
Глава 3 Марковские цепи с непрерывным временем 3.1 Основные понятия и определения Определение. Семейство случайных величин е [0, оо)} со значениями в R1, зависящее от параметра t 6 [0, сю), будем называть случайным процессом со значениями в R1, заданным на множестве [0, сю). При каждом фиксированном t случайная величина — функция на Q вероятностного пространства {Q,#, Р}: e(f) = e(f,w), поэтому случайный процесс £(£)=£(£, cu), (t,cu) 6 [0, оо) х Q, является функцией двух переменных t и си. Для каждого фиксированного cu е Q функцию £(£)=£(£, cu), te[O, оо), со значениями в R1, заданную на [0, оо), будем называть траек- торией случайного процесса 6 [0,оо)}.
136 Глава 3. Марковские цепи с непрерывным временем Определение. Случайный процесс {^(t),t е [0,+оо)} со значениями в {0,1,...} будем называть марковской цепью с не- прерывным временем, если для него имеет место марковское свойство: для любых to < ti < ... < tn < tn+i и jo, ji,..., jn-1, i, j Шя) — j I — i, £(£n-i) — jn-iy • • • > C(^i) — C(^o) — Jo}: = ^(Ul) — j | £(*n) — 0- Далее множество X = {0,1,...} значений цепи будем назы- вать её фазовым пространством. Определение. Условную вероятность PRO) = J|C(s) = 0 = Pij(s,t), s,t е [0; сю), s < t, i, j = 0,1,2,..., называют переходной веро- ятностью (вероятностью перехода) марковской цепи. Вероятность Pk(t) = РШ =k},t> 0, называют вероятностью пребывания в состоянии к, к = 0,1,... Определение. Марковскую цепь будем называть марковс- кой цепью со стационарными переходными вероятностями — стационарной марковской цепью, если ее переходные вероят- ности Р{£(£ + $) — 3’ I ^(s) — 0 — Pij(s>s + 0? Л j = 0> 1> 2,...; s,t > 0 не зависят от s. При этом переходные вероятности называют стационарными и обозначают Pij(t): Pij(s, s + t) = Pij(t), i,j = 0,1,2,...; s,t > 0. Мы будем рассматривать марковские цепи со стационарны- ми переходными вероятностями. Определение. Матрицей переходных вероятностей мар- ковской цепи {£(t),t 6 [0, оо)} будем называть матрицу, элемен- тами которой являются переходные вероятности Руw = р{еа+*)=j।e(s) = i}, i,j = Непосредственно из определения матрицы переходных веро- ятностей следуют такие её свойства:
3.1. Основные понятия и определения 137 1° Pij(t)>0, ^2Py(t) = l, t > 0; i = 0,1,2,... j — каждая строка матрицы переходных вероятностей задает на фазовом пространстве X = {0,1,2,...} семейство вероятност- ных распределений, зависящих от параметра t. 2° Переходные вероятности Pij(t) удовлетворяют уравнению Колмогорова-Чепмена: Pij(s + t) = s,t>0, i, j = 0,1,2,..., k=o или в матричном виде, Р($ + t) = P(s)P(f), где P(f) = [Ро(ОЬ t > °- Уравнение Колмогорова-Чепмена является непосредственным следствием марковского свойства. Дале мы будем требовать, чтобы переходные вероятности Pij(h), i,j = 0,1,2,..., обладали свойством непрерывности в точке 0: т о Г если j — 0, если j?, (в силу стационарности цепи непрерывность переходной вероят- ности в точке 0 влечет непрерывность в каждой точке t > 0). Непрерывность переходных вероятностей фактически обо- значает непрерывность стационарной марковской цепи — если цепь в момент t находится в состоянии г, то за малое время h с вероятностью близкой к 1 цепь и останется в состоянии i (за малое время с вероятностью близкой к 1 состояние цепи не из- менится). Переходную матрицу, элементы Р^(/г), г,j = 0,1,2,..., ко- торой удовлетворяют свойству непрерывности, будем называть стандартной матрицей. ТеоремаЗ.1.1 (уравнениеКолмогорова-Чепмена). Переход- ные вероятности стационарной марковской цепи удовлетворя- ют уравнению Колмогорова- Чепмена: Pij(s + t) = ^Pik(S)Pkj(t), s,t>Q, i,j = 0,1,..., (3.1.1) к
138 Глава 3. Марковские цепи с непрерывным временем или в матричном виде: P(s + t) = P(s)P(f). Доказательство. Очевидно, {£(s + t) =iC(0) = г} = |J{£(0) = i,£(s) = k,£(t + s) = j}, k причем события в правой части несовместны. Отсюда p{^+t) = j । е(о) = о = Е =j, e(s) = к । e(o) = о = k = -P{C(g + 0 = j, C(g) = M(Q) = 0 = V p^°) = v p{^s+t)=j\ g(s) = k, e(o) = pp{e(s) = k, g(o) = о V p^°) = v p{^s+t)=j\ e(g) = к}рщ = к, g(o) = о Y pm = i} = e p{^+t)=j\ e(s) = к}рш = к । e(o) = о = к — Pik(s)Pkj(t). к Замечание. Равенство P(s + t) = P(s)P(f), s > 0Д > 0, обозначает, что семейство операторов P(t), t > 0, обладает по- лугрупповым свойством. Следствие 1. Для любых ti,^2> • • • Дп + ^2 + • • • + tn) — Piki (tl^Pk^(t2) • • • Pkn-ij(tn)• ki,k2,---,kn-i (3.1.2) Доказательство. Pij(tl + t2 + • • • + tn) = Pij(ti + (t>2 + • • • + tn)) —
3.1. Основные понятия и определения 139 — Piki(ti)Pkij(t2 + ts + • • • + tn) — ki = Pjki Gl) Pkik2 (tz)Pk2jGs + ^4 “b • • • “b ^n) = • • • ki k2 •••— Piki (tl)Pkik2(t2) • • • Pkn-ij(tn). ki -)k2 • •fkfi—i Следствие 2. Pij^fy. + ^2 + • • • + tn) > Piki (^1)F/C1/C2G2) • • • Pkn-ij(tn)• Следствие 3. Pa(t) > (Pii(t/n))n. Достаточно в следствии 2 положить t\ = t% = - - - = tn = t/п, j = i,ki = i,k2 = 2,..., kn-i = i. Задание марковской цепи. Случайный процесс {£(t), t 6 [0, +00)}, в частности, марковская цепь с непрерывным вре- менем {£(£) Д 6 [0, +оо)} считается заданной, если заданы ее ко- нечномерные распределения, а именно, для любых 0 = to,ti,... tn и го, 21,..., in заданы Ptoti...tn Go, ^1 ч • • • in) = Р{Ш — 2q,£G1) — 21, . . . ,£(tn) = ^n}- Как и для цепей Маркова с дискретным временем, марков- ская цепь с непрерывным временем задается своим начальным распределением (распределением при t = 0) и матрицей пере- ходных вероятностей [P^G)], t > 0. Убедимся в этом. Пусть 0 = to < ti <...< tn. Воспользо- вавшись формулой умножения и марковским свойством, имеем P{£Go) = *o,£Gi) = й, • • • ,£Gn-i) = in-i^(tn) = in} = = P{CGn) = in I CGn—1) = in—li • • •, ^(^o) — ^0} x xP{£(tn-l) = in-liC(tn-2) = in-21 • • • i£(fy) = ^0} = — P{£(tn) = in I £(tn—i) = in—i}x xP{£(tn-l) = in-li^(tn-2) = in-21 • • • i£(to) = ^0} = — Pin-1 in(tn ~ tn-i)x
140 Глава 3. Марковские цепи с непрерывным временем х/Ш-1) — *п-1,£(£п-2) = *п-2, • • • ,£(*()) = М = ^п-1*п(^П ^п—1) ’ Ргп-2 «п-1 (^П— 1 tn—2) X . . . • • • X Pioi^ti - to) • P{£fao) = го}. Равенство Р{£(*о) — *o,£(*i) — й, • • • ,£(^п—1) — гп—1,£(М — in} — — Pin-iinfan ~ tn—1) ’ Pin-2 «п-i fan—1 — tn—2) X • • • ... X Pi.iSh - to) • P{^to) = го}. (3.1.3) и обозначает, что цепь задается ее начальным распределением Р{£(£0) = г0} и матрицей переходных вероятностей [Pij(t)]. Во многих ситуациях поведение матрицы переходных веро- ятностей [Р^(/г)] в окрестности нуля определяет поведение ве- роятностей пребывания Pnfa), п = 0,1,2,..., при всех t > 0. Точнее, можно выписать систему дифференциальных уравне- ний, которым удовлетворяют Pnfa)- Поэтому общий подход в задании марковских цепей с непрерывным временем состоит в задании (постулировании) вида матрицы переходных вероятно- стей [Р^ (h)] в окрестности нуля. При изучении цепей Маркова с непрерывным временем (как и для цепей с дискретным временем) важной задачей является изучение асимптотического поведения распределения £fa), т- е- поведения вероятностей пребывания P{£fa) = n} = Pnfa), п = 0,1,2,..., при t сю. 3.2 Процесс чистого рождения Пусть £(f) — размер популяции леммингов, зайцев, лис, вол- ков, ... на данной территории. При благоприятных условиях — достаточное количество пищи, отсутствие смертности, отсут- ствие миграции размер популяции будет неограниченно расти. (Реально неограниченный рост невозможен хотя бы потому, что
3.2. Процесс чистого рождения 141 при большом размере популяции пищи для всех не хватит.) Ма- тематической моделью численности популяции в описанной си- туации является так называемый процесс чистого рождения. Определение. Процессом чистого рождения будем назы- вать стационарную марковскую цепь с непрерывным временем, переходные вероятности которой в окрестности нуля удовлетво- ряют постулатам: 1° Р^Л+1(^) = + °(^)> 0 + О, к = 0,1,...; 2° Pk,k(h) = l~Xkh + o(h), h 0 + 0, к = 0,1,...-, 3°P^(0)=4j, k,j = O,l,... Из 1° - 2° следует, что для j' к, к + 1 Pk,j(h) = о(К), h 0 + 0 — вероятности перехода в несоседние состояния есть величины порядка o(h) при /г —> 0 + 0. Параметры fc = 0,1,2,..., — неотрицательные числа, o(h) могут, вообще говоря, зависеть от к. Числа Хк, к = 0,1,..., называют инфинитезимальными ха- рактеристиками или инфинитезимальными интенсивностя- ми роста процесса чистого рождения. Матрицу Г —До До 0 0 0 -Д1 Д1 0 ... 0 0 —Д2 Д2 • • • называют инфинитезимальной матрицей процесса чистого рож- дения. Заметим, что в точке нуль существуют производные пере- ходных вероятностей процесса чистого рождения и они равны интенсивностям роста: -f’fc, fc+l (0) = ^k, РкДО) = -Afe. Первый постулат процесса чистого рождения обозначает, что при малых h вероятность покинуть состояние к (перейти в сос- тояние к + 1) растет пропорционально времени h (как Д^/г), вто- рой постулат обозначает, что при малых h вероятность остаться в состоянии к убывает (как 1 — Д^/г). Из определения процесса чистого рождения следует, что пе- реходные вероятности обладают свойством непрерывности.
142 Глава 3. Марковские цепи с непрерывным временем Постулируя такой вид переходных вероятностей цепи при малых h (локально), мы обеспечиваем монотонность траекторий цепи — за малое время (локально) цепь из данного состояния к может перейти только в соседнее состояние fc+1 (с вероятностью Л^/^ + о(/г)), либо остаться на месте (в состоянии fc), естественно, с вероятностью 1 — Xkh + o(h). Заданные локально (при малых /г) переходные вероятности Pij(h) определяют вероятности пребывания Pk(t) = P{£(t) = к} цепи для всех t > 0. Теорема 3.2.1. Вероятности пребывания PkW = РШ = к}, к = 0,1,2,..., процесса 6 [0;оо),£(0) = 0} чистого рождения, выходя- щего из 0, удовлетворяют системе дифференциальных уравне- ний ГР'(г) = -А0Р(М Hfe+iW = -^k+iPk+itt) + XkPk(t), к = 0,1,..., с начальными условиями Ро(О) = 1, РДО) =0, к = 1,2,... Доказательство. Сначала составим уравнение для веро- ятности Ро(О пребывания цепи в точке 0. Для процесса чистого рождения Po(t + h) = P{£(t + h) = 0} = P{^t + h) = 0, ^(0 = 0} = = P{£(t + h) = 01 e(t) = 0}P{C(t) = 0} = Poo(/i)Po(t) = = (1 - А0/г + о(/г))Ро(0, отсюда Po(t + h) = P0(t) - XohPo(t) + P0(t)o(h) или P0(t + h)-P0(t) = _ + Po(f)2^). n ti Переходя к пределу в правой и левой частях при /г —> 0 + 0 (предел правой части существует), получаем P^t) = -AoPo(i). (3.2.1)
3.2. Процесс чистого рождения 143 Далее получим уравнения, которым удовлетворяют вероят- ности пребывания Pk(t), к = 1,2,... Имеем Pfc+1(£ + h) = P{£(t + h) = к + 1} = (/fc+i \ \ W + Л) = k +1}n UW) = 4 = \?=0 // fc+1 = £pw + /l) = fc + i,ew = 4 = ?=0 A+l = £ P{^t + h) = к +11 £(t) = i}P{^t) = i} = ?=0 A+l = £ = ?=0 — Pk+1, fc+l(^)A:-|-l(0 + Л^Л+1(^)^(^) + к-1 + Pi(t)Pi,k+l(h) — ?=0 = ^+1(0(1 — ^к+ih + + Pk(t)(Xkh + o(/z))+ k—1 ?=0 — Pk+i(t) ~ Xk+ihPk+i(t) + XkhPk(t) + o(/z). Отсюда Pk+i(t+h) — -Pfc+iW — —Xk-^-ihPk-^i^+XkhPk^+o^h), h 0+0, где o(h)/h 0 при /г —> 0 равномерно no t. Разделив левую и правую части на h и перейдя к пределу при h 0 + 0, для вероятностей пребывания Pk(t), к = 0,1,..., получим систему дифференциальных уравнений Г-^о(^) = ~/о 2 21 {PU1W = -XMPk+iW + XkPk(tl к = 1,2,...
144 Глава 3. Марковские цепи с непрерывным временем с начальными условиями Ро(О) = 1, Pfc(O) =0, k = 1,2,... Для вероятностей пребывания Pk(t) можно доказать суще- ствование и левосторонних производных. Из первого уравнения системы (3.2.2) Р'(0 = -AoPo(f), с учетом начального условия Ро(О) = 1 получаем Po(t) = e~Xot. При конкретных значениях А& > 0 можно последовательно про- интегрировать уравнения (3.2.2). Определение. Временем пребывания марковской цепи {£(£),£ 6 [0;оо),£(0) = 0}, стартующей из состояния 0, в со- стоянии 0 будем называть случайную величину то = inf{t : е(0 / 0, е(0) = 0}. Цепь до момента то пребывает в состоянии 0, а в момент то “уходит” из состояния 0. Следствие. Время пребывания то в состоянии 0 процесса чистого рождения, выходящего из 0, распределено показатель- но с параметром Aq: Р{т0 <0 = 1- e-Aot, t > 0. Действительно, при t > 0 Р{т0 < 0 = 1--PR0 >t} = 1-P{£(t) = 0} = l-Po(t) = 1-e~Xot. Пуассоновский процесс. Одним из частных случаев про- цесса чистого рождения является пуассоновский процесс. Определение 1. Пуассоновским процессом с параметром А (А > 0), стартующим из нуля, называется процесс чистого рождения t 6 [0; +схз),£(О) = 0}, у которого интенсивности роста Хк = А, к = 0,1,2,...
3.2. Процесс чистого рождения 145 Теорема 3.2.2. У пуассоновского процесса [0,оо),£(0) = 0} с параметром Л, стартующего из нуля, вероятности пребыва- ния Pk^ = (^~e~xt’fc = 0’1’--- Доказательство. Согласно теореме 3.2.1, вероятности пре- бывания РД£), к = 0,1,2,..., процесса рождения и гибели, у ко- торого интенсивности роста А^ = А, fc = 0,l,2,..., удовлетворя- ют системе дифференциальных уравнений (P^t) = -APo(t), 1Л+1W = -APfc+i(t) + APfc(i), к = 0,1,... при начальных условиях Ро(О) = 1, РДО) = 0, к= 1,2,... Для решения последней системы уравнений введем функции Qk(t): Pk(t) = e~XtQk(t), к = 0,1,..., (3.2.3) и перепишем систему в терминах Qk(fy. Имеем: (е XtQk+\(t)^ =—Хе XtQk+i(t) + Хе XtQk(f), —Хе XtQk+i(t) + e XtQM(t) =-Хе XtQk+i(t) + Хе XtQk(f), Q'k+l(t) = XQk(t), к = 0,1,... (3.2.4) Заметим, что поскольку Ро(О) = 1, РДО) =0, к = 1,2,..., то из равенств (3.2.3) для Qk(t) получаем начальные условия Qo(O) = 1, ЗДО) =0, к= 1,2,... Решим систему дифференциальных уравнений (3.2.4) при начальных условиях Qo(O) = 1, ЗДО) =0, к= 1,2,...
146 Глава 3. Марковские цепи с непрерывным временем Ранее мы получили, что ад = e"At, поэтому из (3.2.3) при к = 0 имеем Qo(0 = I- Для <3i(t),Q2(t), • • • последовательно получаем <2'1(0 = AQo(t) = А, <31 (t) - <31 (0) = At, что с учетом <3i (0) = 0 дает < 31 (t) = At; < 32(0 = A<3i(t) = A2t, A2/2 < ?2(t)-<?2(0) = ^, что с учетом <Эг(О) = 0 дает И Т. д., Возвращаясь к функциям Pk(t), получаем Pfc(t) = e-^Qkit) = к = 0,1,... Так что для пуассоновского процесса е [0, оо),£(0) = 0} с параметром Л, стартующего из нуля, при каждом t случай- ная величина имеет пуассоновское распределение с пара- метром At Эквивалентным выше данному определению пуассоновского процесса является следующее. Определение 2. Пуассоновским процессом с параметром Л (Л > 0), стартующим из нуля, будем называть случайный
3.2. Процесс чистого рождения 147 процесс {£(£), t е [0; +оо),£(0) = 0}, удовлетворяющий следую- щим постулатам: 1) для любых 0 = to < ti < ^2 < • • • < tn-i < tn случайные величины £(fi) - £(fo), £(*2) - £(h), • • •, £(tn) ~ £(*n-i) незави- симы (£(£) — процесс с независимыми приращениями), 2) приращения £(t) — £(s), 0 < s < t, имеет распределение Пуассона с параметром X(t — s): P{£(t) - C(s) = к} = ~ s^k e-4t-s^ fc = 0,1,2,... Неформально пуассоновский процесс с параметром Л, выхо- дящий из нуля, можно описать так. Стартуя из нуля, процесс в течении времени то, распределенном показательно с парамет- ром Л, пребывает в состоянии 0. В момент времени то процесс скачком переходит в состояние 1 и пребывает в состоянии 1 в те- чении времени ti, распределенном показательно с параметром Л и не зависящим от то- В момент времени to + ti процесс скачком переходит в состояние 2 и пребывает в состоянии 2 в течении времени тг, распределенном показательно с параметром Л и не зависящим от то и ri. В момент времени то + л + Т2 процесс скачком переходит в состояние 3 и т. д. Определение. Пусть то, л,Т2,... — последовательность независимых показательно распределенных с параметром Л слу- чайные величины. Последовательность моментов времени (по- следовательность случайных величин) tn = ткч 72 = 0, 1, 2, ... , к=е называется простейшим потоком событий с параметром Л (ин- тенсивности Л). Пуассоновский процесс с параметром Л задает простейший поток событий: tn = 1~ki 72 = 0, 1, 2, ... , к=0 где ть — время пребывания процесса £(t) в состоянии /с, к = = 0,1,2,... Справедливо и обратное. Простейший поток событий tn = 1~ki 72 = 0, 1, 2, ... , к=0
148 Глава 3. Марковские цепи с непрерывным временем с параметром Л определяет пуассоновский процесс W), t€ [0;+оо),е(0)=0} с параметром Л, выходящий из нуля. В момент времени t процесс £(t) принимает значение к, если tk-i < t < tk, к = 1,2,... На промежутке [0, то] значение £(t) равно 0. Процесс Юла. Рассмотрим один важный частный случай процесса чистого рождения, так называемый процесс Юла. Предположим, что в момент времени t = 0 в популяции име- ется N особей (7V > 0). Через £(t) обозначим размер популяции в момент времени t. Предположим, что каждая особь популяции независимо от других в интервале времени длиной h с вероят- ностью (3h + o(h) порождает новую особь. Если в момент времени t размер популяции £(£) = /с, (fc = N, N + 1,...), то за время h размер популяции увеличи- вается на 1 с вероятностью + o(Zi))1 (1 — ph — othyf-1 = kBh + /1^0 + 0. Поэтому переходные вероятности процесса £(t) при малых h (/г —> 0 + 0) имеют вид P{£(t + h) = к + 11 ^(0 = к} = kf3h + о(/г), P{^t + h) = k\ ^(0 = к} = 1 - (k(3h + o(h)) или Рк,к+! = kfth + o(h) = Xkh + o(h), Pk,k — 1 — k(3h + o(h) = 1 — Xkh + o(h) (у процесса Юла Xk = k/3). Система уравнений (3.2.2) для вероятностей пребывания про- цесса Юла, стартующего из 1 (размер популяции £(0) в момент времени 0 равен 1), имеет вид (P[(t) = -X1P1(t), = —^+1^+1(0 + ^kPk(t)) к = 1, 2, . . . , подробнее, l^+1 w = -(к+1)ж+1 w + fcmw, к = 1,2,...
3.3. Процессы рождения и гибели 149 Начальные условия Р1(0) = 1, Рк(0) = 0, к = 2,3,... Решением этой системы является Л(<) = е"^, Pfc(t) = е-^(1 - е-^к~\ к = 2,3,..., в чем можно убедиться непосредственной проверкой. Заметим, что Pfc(t) = е-^(1 - е-01/-1, к = 1,2,3,..., является геометрическим распределением с параметром pt = _ “смещенным на 1”, т. е. заданным на множестве к = 1,2,3,... 3.3 Процессы рождения и гибели Естественным обобщением процесса чистого рождения яв- ляется процесс рождения и гибели — если в момент t процесс находится в состоянии /с, то за малое время h он переходит в одно из соседних состояний (fc + 1) или (fc — 1) или остается в том же состоянии к. Определение. Процессом рождения и гибели будем назы- вать стационарную марковскую цепь с непрерывным временем, переходные вероятности которой в окрестности нуля удовлетво- ряют постулатам: 1° Pk,k+i(h) = Xkh + o(h) при /г —> 0 + 0, к > 0; 2° Р^_1(/г) = ПРИ > 0 + 0, к > 1; 3° Рк k{h) = 1 — {Хк + pk)h + при /г —> 0 + 0, к > 0; 4°Р^(0)=<^, fc,j =0,1,2,... Из 1° - 3° следует, что для j к — l,fc,fc+l Pk,j(h) = о(/г), /г —> 0 + 0 — вероятности перехода в состояния отличные от соседних есть величины порядка o(h) при /г —> 0 + 0. Параметры Хк, цк {ро = 0,Ао > 0), к = 0,1,2,..., неотри- цательны, их называют инфинитезимальными характеристи- ками {инфинитезимальными интенсивностями) рождения и гибели соответственно.
150 Глава 3. Марковские цепи с непрерывным временем В равенствах пунктов 1° — 3° член o(h) может зависеть от к. Определение. Матрицу —Ао Ао О О Ш -(Ai+jtzi) Ai О О -(А2 + ^2) А 2 0 0 цз -(Аз + ^з) будем называть инфинитезимальной матрицей процесса рож- дения и гибели. Замечание. Инфинитезимальная матрица процесса рож- дения и гибели — это матрица производных переходных вероят- ностей процесса в точке нуль. Обратные дифференциальные уравнения Колмого- рова для процесса рождения и гибели. Переходные вероят- ности Pjj (t) процесса рождения и гибели удовлетворяют системе дифференциальных уравнений, известных под названием обрат- ных дифференциальных уравнений Колмогорова. Получим эти уравнения. Пусть h > 0, t > 0. Из уравнения Колмогорова-Чепмена име- ем при i = 1,2,..., j =0,1,2,... Рг^(/г+i) = 52 д* W-Pfej w = fe=0 — + Pj^(h)Pjj{t) + Pi,i+\(h)Pj+^j(t) + +'^Pi,k(h)Pk,j(t), i = 1,2,..., (3.3.1) к в последней сумме суммирование ведется по всем к i — 1, г, г+1. При /г —> 0 ^Pi'kWPkJf) < J2'Pi,kW = 1-(Л^-1(/1) + Рм(/1)+Рм+1(^)) = к к = 1 - (щЬ + о(/г)) - (1 - (Аг + Hi)h + о(/г)) - (Aj/г + о(/г)) = о(/г). Так что 52 PijAh'jPk^t') = о(/г).
3.3. Процессы рождения и гибели 151 Используя последнее равенство и постулаты 1°-3° процесса рож- дения и гибели, равенство (3.3.1) можно записать так: i = 1,2,... Перенесем Pi,j(t) в левую часть, разделим получен- ное равенство на h и перейдем к пределу при /г —> 0 + 0. В ре- зультате получим P[j(t) = - (Ai + + AjPi+ij(t), i = 1,2,... (3.3.2) Для i = 0, j = 0,1,2,... выкладки аналогичные приведенным выше дают ^j(t) = -AoPoj(t) + AoPij(t), (3.3.3) при t = 0 ^j(O) = fcj = 0,1,2,... Уравнения (3.3.2), (3.3.3) называются обратными дифферен- циальными уравнениями Колмогорова. В обратных дифференциальных уравнениях начальное со- стояние является “переменным”, а конечное состояние “фикси- рованным” (в Рц меняется первый индекс). Обратные дифференциальные уравнения удобно записывать в матричном виде р'(0 = i/P(f), где р — инфинитезимальная матрица процесса рождения и ги- бели, F(f) = [-F’j(f)]- Прямые дифференциальные уравнения Колмогоро- ва для процесса рождения и гибели. При выводе обрат- ных дифференциальных уравнений Колмогорова мы воспользо- вались уравнением Колмогорова-Чепмена, разбив промежуток (0, t + h) на части (0, h) и (h,t + h). Другая ситуация возникает если промежуток (0, t + h) разбить на части (0, t) и (t,t + h) и использовать тот же подход, что и при выводе обратных диф- ференциальных уравнений. Из уравнения Колмогорова-Чепмена при j = 1,2,..., i = = 0,1,... имеем Pij(f + /г) = = к=0 = Pi,j-i(t)Pj-ij(h) + Pj,j(t)Pj,j(h) + Pjj+i(j)Pj+ij(Ji)+
152 Глава 3. Марковские цепи с непрерывным временем +£р^)рк;(Ь), j = 1,2,... (3.3.4) k Оценим 'Е,'Pi,k(.t)Pk,j(.h) : k 52 = 52 pi,b(t)hok(X) = k k = /zsupofc(l)\2 Р?Д0 < /zsupofc(l). k k k Далее будем предполагать, что для k / j — 1,7,7 + 1 переход- ные вероятности Pkj(h) = ho^X) при /г —> 0 + 0 удовлетворяют соотношению supofc(l) = о(1). к В этих предположениях при /г —> 0 + О 52'^Л(4)Р^(/г) = о(/г). к Из равенства (3.3.4), последнего равенства и постулатов 1°-3° процесса рождения и гибели при 7 = 1,2,... имеем Pij(t + /i) = + + P?j(^)(l — (Aj + jtzj)/i + o(/i))+ +PiJ+1(t)Xj+1h + o(h)) + o(h). Перенесем P?j(0 в левую часть, разделим полученное равен- ство на h и перейдем к пределу при /г —> 0. В результате для 7 = 1,2,... получим = Aj-iP?j-i(O — (Aj + /ij)Pjj(t) + p,j+iPij+i(t)- (3.3.5) Для 7 = 0, i = 0,1,... выкладки аналогичные приведенным выше дают Р'цХ = -AoP?,oW + ^1Рг,1 W- (3.3.6) При t = 0 значения Рм(0) = 7 = 0,1,..., i = 0,1,... Уравнения (3.3.5), (3.3.6) известны под названием прямых дифференциальных уравнений Колмогорова.
3.3. Процессы рождения и гибели 153 В прямых дифференциальных уравнениях конечное состо- яние является “переменным”, а начальное состояние “фиксиро- ванным” (в Pjj меняется второй индекс). Прямые дифференциальные уравнения удобно записывать в матричном виде P'(t) = iZ(P(f))T, где р — инфинитезимальная матрица процесса рождения и гибе- ли, ит и — матрицы, транспонированные соответственно к матрицам р и P(t), F(t) = [P'j (£)]. Эргодическая теорема для процесса рождения и ги- бели. Для процесса рождения и гибели имеет место следующее утверждение, аналогичное эргодической теореме для дискрет- ных марковских цепей. Теорема 3.3.1 (эргодическая для процесса рождения и ги- бели). Переходные вероятности Pjj{t), i,j = 0,1,2,..., процес- са рождения и гибели с интенсивностями рождения Xj и гибе- ли pj и их производные Pjj(t) при t оо имеют пределы lim Pj At) = 7г?, lim Р' At) = 0, j = 0,1,2,..., t—>оо t—>оо пределы tvj не зависят от начального состояния i и удовлетво- ряют уравнениям -АОТГО + ^17Г1 = О, Xj—i^j—i — {Xj + Pj)^j + Pj+iiTj+i = 0, j' = 1,2,... Формально последние уравнения для пределов 7tj получают- ся предельным переходом при £ —> оо в правой и левой частях прямых дифференциальных уравнений Колмогорова: p'(t) = l/T(p(f))T. Предельные значения 7г? = lim Pi At), j = 0,1,2,..., t—>+oo задают на фазовом пространстве {0,1,2,...} цепи вероятностное распределение (собственное или несобственное). Действительно, из оо 52 = 1 j=0
154 Глава 3. Марковские цепи с непрерывным временем имеем N — 1- J=1 Предельным переходом при t сю получаем N 52^' 7=1 отсюда при N —> оо имеем ОО 52^' - L j=0 Определение. Вероятностное распределение 7г7 = lim Pi ЛГ), j = 0,1,2,..., J t—^oo называется эргодическим распределением процесса рождения и гибели. Теорема 3.3.2 (о предельном значении вероятностей пре- бывания). У процесса рождения и гибели предельные значения вероятностей пребывания Pk(t) существуют и совпадают с эр- годическими вероятностями: lim Pk(t) = тгк, к = 0,1,... t—>оо Доказательство. Достаточно показать, что для данно- го s |Л(<) - TTfel < £ при достаточно больших t. Пусть {яД — начальное распределение цепи. Тогда оо Pk(t) = P{£(t) = к} = y^XiPik(,t) i=0 Отсюда имеем \Pk(t} - TTfcl = оо оо ?=0 ?=0
3.3. Процессы рождения и гибели 155 N оо — Xi |.Pifc(£) — TT/cl + 2 Xj. ?=0 i=N+l Второе слагаемое не превосходит s за счет выбора N достаточно большим, а первое не превосходит s при достаточно больших t в силу эргодической теоремы. Определение. Вероятностное распределение {иД будем называть стационарным распределением процесса рождения и гибели с матрицей переходных вероятностей [Р^(£)], если для всех t > О оо ^2 (f) = vh i = °> 2> • • • i=0 Теорема 3.3.3 (об эргодическом и стационарном распреде- лениях). У процесса рождения и гибели эргодическое распределе- ние является стационарным распределением и наоборот, соб- ственное стационарное распределение является эргодическим. Доказательство. Убедимся, что эргодическое распреде- ление является стационарным. Из уравнения Колмогорова—Чепмена для любых s,t и N имеем оо N Pjj(s + ^) — к=0 k=0 Переходя в этом неравенстве к пределу при s оо, получаем N ^k^kj (^) k=Q (в силу эргодической теоремы lim Pi Д£) = я>). А поскольку N t—^oo 1 произвольно, то и оо TTj > j = 0,1,... (3.3.7) fc=o На самом деле все нестрогие неравенства (3.3.7) являются ра- венствами оо 7TJ = ^TTfePfe/f), j = 0, 1, . . . k=0
156 Глава 3. Марковские цепи с непрерывным временем Если предположить, что хотя бы одно из неравенств (3.3.7) стро- гое и просуммировать все неравенства (3.3.7), то оо оо / оо \ оо оо оо 52^’ > 52 (52 )= 52 52 = 52 7=0 j=0 \k=0 J k=0 j=0 k=0 Из полученного противоречия следует, что оо = TTj, j = 0,1,... k=o Так что эргодическое распределение является стационарным. Пусть теперь {^} — собственное стационарное распределе- ние цепи: оо ViPij(t) =Vj, j = 0,1,..., (3.3.8) i=0 ОО j=0 Формально переходя к пределу при t ч ос в правой и левой частях равенств (3.3.8) (в силу эргодической теоремы пределы Pij(t) существуют), получаем оо =Vj, j =0,1,... ?=0 оо Отсюда, учитывая что vi — 1, имеем ?=0 Ч? = ТГ7 , J = 0, 1, . . . Корректность предельного переходя следует из неравенства оо оо N оо 5 > ~ ViKj < 52^l‘^(^) — 5 > ?=0 ?=0 ?=0 i=N+l в котором правая часть меньше 2s при достаточно больших t (второе слагаемое меньше е за счет выбора ЛГ, при фиксирован- ном N первое слагаемое меньше е за счет выбора t).
3.3. Процессы рождения и гибели 157 Теорема3.3.4 (о представлении эргодического распределе- ния). Пусть е [0,оо)} — процесс рождения и гибели с интенсивностями роста Xj и гибели pj(р3> 0, j = 1,2,...), Ao Al Aj-i ио = 1, Uj =------------—, 7 = 1,2,... Р\ Р2 Pj Если оо ^2 uk < оо, k=0 то существует собственное эргодическое распределение про- цесса 6 [0,оо)} и оно представимо в виде = из^~, .7 =0,1,2,... У? к=0 Если оо = +оо, k=0 то эргодическое распределение является несобственным и TVj = 0, j = 0,1,2,... Доказательство. Заметим, что и3j = 1,2,... (3.3.9) Pj Согласно эргодической теореме (см. теорему 3.3.1), эргоди- ческое распределение {тг^} (собственное или несобственное) су- ществует и удовлетворяет уравнениям -Аотго + Z^iTTi = 0, Xj_iTTj-1 - (Xj + Pj)itj + pj+iitj+i = 0, 7 = 1,2,... (3.3.10) Решение последней системы уравнений можно представить в виде = UkTro, к = 1,2,... (3.3.11)
158 Глава 3. Марковские цепи с непрерывным временем Действительно, из первого уравнения имеем 7Г1 = (АоМ1)тго = 'Щтго- Предположим, что представление (3.3.11) имеет место и при к = = 2,3,... ,7 и установим, что оно имеет место и для к = j + 1. Из равенства (3.3.10) имеем = “1“ ~ Из равенств тгк = ^7Го, к = 1,2,... J, и равенства (3.3.9) получаем = “1“ P'j^'UjTTfy ~ — 1^0 = — XjU jiffy + (jjsjU Xj—iUj—i^To) = — XjUjTTfy “И (^/JjjUj Xj— 1 Uj— 1)тГ() = XjUjTTfy t. e. = XjUjTTfy или TTji+i = (Aj/P'j-^-i^UjTTfy = Uj+iTTfy) j = 1,2,... Так что эргодическое распределение {ттк} процесса рождения и гибели представимо в виде 7Tk = ukTTfy, к = 0,1,... Учитывая последнее представление, имеем оо оо оо 52 (3.3.12) к=0 k=fy k=fy оо Если ряд uk сходится, то положив к=0 оо 7Г° = l/^Ufe, k=0
3.4. Обслуживание с ожиданием 159 получим оо 52^ = к=0 т. е. существует собственное эргодическое распределение {тг^}, при этом = uj^o = uj^-----> j = 0,1,2,... У7 Uk к=0 Единственность эргодического распределения следует из един- ственности предела 7Vj = Jim j = 0,1,2,... oo Если uk = +°° (ряд расходящийся), то из равенства к=0 оо оо fc=0 k=0 учитывая, что {тг&} — вероятностное распределение, следует, что тго = 0. Поэтому распределение 7Tj = UjTTQ = 0, j = 0,1,2,..., несобственное. Замечание. Тот факт, что = 0, к = 0,1,2,... (при ик = оо) обозначает, что цепь при t сю “уходит на сю”. к 3.4 Обслуживание с ожиданием Мы рассмотрим классическую задачу теории массового об- служивания в той постановке, в какой она была решена А.К. Эр- лангом. 1° На обслуживающий прибор поступает простейший поток требований интенсивности Л.
160 Глава 3. Марковские цепи с непрерывным временем 2° Если в момент поступления требования прибор свободен, требование начинает немедленно обслуживаться. Если прибор занят, то требование становится в очередь за поступившими ра- нее требованиями. 3° Время обслуживания £ каждого требования показательно распределено с параметром ц и не зависит от продолжительнос- ти обслуживания ранее поступивших требований. Задача. Найти распределение длины ^(t) очереди — коли- чества £(£) требований в очереди в момент времени t (если не при всех t, то хотя бы при достаточно больших, т. е. в уста- новившемся режиме). Реальных ситуаций, в которых возникают подобные задачи, великое множество. А.К. Эрланг решил эту задачу примени- тельно к телефонной связи. Рассмотрим подробнее введенные в пунктах 1° и 3° понятия простейшего потока требований и обслуживания требований. Простейший поток требований. Под простейшим пото- ком требований интенсивности Л мы понимаем последователь- ность случайных величин tn = п = 0,1,2,... fc=o где Tk, к = 0,1,2,..., — независимые показательно распределен- ные с параметром Л случайные величины: Р{тк <f} = l- Xe~xt, t > 0. Значения tn,n = 0,1,2,..., мы интерпретируем как моменты поступления требований (tn — момент поступления (п + 1)-го требования, t$ = то — момент поступления первого требования), случайные величины к = 1,2,..., мы интерпретируем как промежутки между поступлениями требований. В простейшем потоке требований с параметром Л за ма- лое время h (h 0 + 0) требования поступают так: одно тре- бование поступает с вероятностью Xh + o(h), два и больше требований поступают с вероятностью o(h). В самом деле, простейший поток требований с параметром Л определяет пуассоновский процесс {£(t), t 6 [0; оо)} — число тре- бований £(t), поступивших к моменту времени t, t 6 [0; оо). Для пуассоновского процесса с параметром Л P{£(t) - С(з) = k} = fc = о, 1,...
3.4. Обслуживание с ожиданием 161 Поэтому P{e(f + /i)-e(i) = 1} = ^-e~Xh = A/z(l — A/z + o(/z)) = A/i+o(/i), т. e. вероятность поступления одного требования за время h: P{£(t + h) - £(f) = l} = Xh + o(h), h 0 + 0. (3.4.1) Вероятность поступления двух и более требований р{&+h)~ e(t) > 2} = i - p{^t+h) - at) < i} = = i - (p{e(t+h) - e(t) = o} + p{^t+h) - at) = i}) = = 1 _ (^-e~Xh + ^e~Xh^ = 1 - e"Aft(l + Xh) = = 1 - (1 - Xh + o(/i))(l + A/i) = (A/i)2 + o(/i) = o(/i), h 0 + 0, t. e. P{£(t + h) - £(f) > 2} = o(h\ h 0 + 0. (3.4.2) Показательное время обслуживания. Из предположе- ния о показательном распределении времени обслуживания £ требования: Р{< <0 = 1- t > 0, и независимости случайных величин СьСг, • • • (время обслужи- вания Q г-го требования не зависит от продолжительности об- служивания поступивших ранее требований) следует, что за ма- лое время h (h 0 + 0) требования обслуживаются так: одно требование за время h обслуживается с вероятностью ph + о(/г), два и более требований за время h обслуживают- ся с вероятностью о(К), /г —> 0 + 0. Действительно, поскольку в каждый момент времени прибор обслуживает только одно требование, то вероятность того, что до момента h будет обслужено находящееся на обслуживании требование равна Р{С < h} = 1 - e~^h = /j,h + o(h), 0 + 0, (3.4.3) где £ — продолжительность обслуживания требования — пока- зательно распределенная с параметром р случайная величина. Далее, требования обслуживаются одно за другим. Пусть Q — время обслуживания г-го требования, i = 1,2,... Тогда
162 Глава 3. Марковские цепи с непрерывным временем событие “до момента времени h будет обслужено п требований” представимо в виде {Ci + С2 + • • • + Cn < h}. Пусть — событие “за время h будет обслужено более одного требования”, Ясно, что Ah, С |^J {Cl + С2 + • • • + Cn < h}, n=2 00 P(Ah) < 52 + C2 + • • • + Cn < h}, n=2 n {Cl + C2 + • • • + Cn < h} c P|{C? < ^}> i=l n P{Ci + C2 + • • • + < h} < П P{Ci < h} = (M + o(/i))n < (2M)n, i=l 00 P(A) < V(2M)n < (2M)2——— < 8(M)2 = h 0 + 0, Zl 1 - 2»h т. e. вероятность того, что за малое время h (h 0 + 0) будет обслужено два или более требований равна о(/г), /г —> 0 + 0. Марковская цепь, описывающая очередь. Относитель- но длины очереди 6 [0;+оо)} в задаче обслуживания с ожиданием имеет место следующее важное утверждение. В предположениях о простейшем потоке поступления тре- бований и показательном распределении времени их обслужи- вания длина очереди е [0;оо), является стационарной марковской цепью с непрерывным временем. Выпишем элементы матрицы переходных вероятностей мар- ковской цепи, описывающей длину очереди требований. Пусть длина очереди £(£) = к и h малое (/г —> 0 + 0). Вероят- ность P{£(t + h) = к+11 С(0 = к} увеличения длины очереди на единицу за время h равна вероятности поступления одного тре- бования за время /г, эта вероятность равна Xh + о(/г), /г —> 0 + 0. Поэтому P{^t + h) = к + 11 £(f) = к} = Xh + о(/г), h 0 + 0,
3.4. Обслуживание с ожиданием 163 или Pk-k+i(h) = Xh + o(h), /г —> 0 + 0. Пусть длина очереди £(t) = к > 0 и h малое (h 0 + 0). Вероятность P{£(t + h) = к — 11 £(£) = к} уменьшения длины очереди на единицу за время h равна вероятности того, что за время h будет обслужено одно требование, эта вероятность рав- на ph + о(/г), /г —> 0 + 0. Поэтому Р{£(£ + h) = к — 11 £(t) = к} = ph + o(h), /г —> 0 + 0, или Pk-,k-i(h) = ph + o(h), /г —> 0 + 0. Далее, вероятность того, что за малое время /г (/г —> 0 + 0) длина очереди изменится более чем на 1 равна о(/г), посколь- ку вероятность увеличения длины очереди более чем на едини- цу равна o(h) и вероятность уменьшения длины очереди более чем на единицу равна о(/г), h 0 + 0. Поэтому вероятность Р{£(£ + h) = к\ £(£) = к} того, что длина очереди за время h не изменится, равна вероятности события, противоположного к событию “длина очереди увеличится на 1, или уменьшится на 1, или изменится более чем на 1”: P{^(t + h) = k\ £(f) = к} = 1 - (Л/г + /г/г + o(h)), или Pk;k(h) = 1 — (Xh + ph) + o(h), /г —> 0 + 0. Таким образом, для марковской цепи {£(t),t 6 [0, сю)}, опи- сывающей длину очереди, в предположениях о простейшем по- токе поступления требований и показательном распределении времени их обслуживания имеют место следующие утвержде- ния: при /г —> 0 + 0 Pk,k+i(h) = Xh + o(h), Pk.k-i(h) = ph + o(h), Pk,k(h) = 1 - (Л + p)h + o(h). Последнее означает, что марковская цепь {£(t),t е [0;оо)}, опи- сывающая очередь, является процессом рождения и гибели с интенсивностями рождения X и гибели ц. Предельное поведение длины очереди. Рассмотрим по- ведение длины очереди {£(t),t 6 [0; сю)} при больших t (t сю).
164 Глава 3. Марковские цепи с непрерывным временем Согласно теореме об эргодическом распределении процесса рождения и гибели (см. теорему 3.3.1) длина очереди, как про- цесс рождения и гибели, имеет эргодическое распределение — распределение P{£(t) = 7}, j = 0,1,2,..., длины очереди при t оо стремится к некоторому предельному распределе- нию {ttj}. При этом, согласно теореме о представлении эргоди- ческого распределения (см. теорему 3.3.4), если оо Ufc < оо, k=0 то эргодическое распределение представимо в виде = uj^—> 3 = i,2,--, к=0 а если оо У2 uk = +°°> k=0 то эргодическое распределение является несобственным и 7Г; =0, j =0,1,2,..., где Ao Al Aj-i uq = 1, Uj =--------——, > 0, 7 = 1,2,... Pl Р2 Pj Поэтому если в цепи {£(£), t 6 [0; сю)}, описывающей очередь, значение X/р меньше 1, т. е. среднее время обслуживания одного требования 1 / /z меньше среднего времени 1/А между поступле- нием требований, то и, следовательно, цепь имеет собственное эргодическое распре- деление: ^3 = ^к к=0 7 — 0,1,2,...
3.5. Свойство дифференцируемости ... 165 (совпадающее с геометрическим распределением с параметром 1 — Х/ц). Последнее означает, что если Х/ц < 1, то при достаточ- но больших t распределение длины очереди “устанавливается”. Если, например, Л = 1, ц = 2 — среднее время обслуживания одной заявки \/ц = 1/2, среднее время между поступлениями требований 1/Л = 1, то 7Г0 = 1/2, 7Г1 = 1/4, 7Г2 = 1/8, 7Г3 = 1/16, . . . Эти равенства можно интерпретировать так: с течением време- ни в очереди с вероятностью 1/2 будут отсутствовать требова- ния, с вероятностью 1/4 будет одно требование, с вероятностью 1/8 — два требования, ... Если X/ц > 1 — среднее время обслуживания \/ц одной за- явки больше среднего времени 1/Л между поступлениями тре- бований, то эргодическое распределение цепи несобственное и имеет вид 7rjt = 0, к = 0,1,2,... Последнее означает, что если Х/ц > 1, то со временем распреде- ление длины очереди требований “уходит на оо” — длина очере- ди со временем неограниченно растет. Мы рассмотрели простейшую ситуацию — одного обслужи- вающего прибора. Разумеется, обслуживающих приборов может быть больше одного. 3.5 Свойство дифференцируемости переходных вероятностей Из предположения непрерывности в нуле переходных веро- ятностей Pij(t) стационарной марковской цепи с непрерывным временем можно получить неожиданно много содержательных результатов. Одним из таких результатов является дифферен- цируемость Pij(t). Мы докажем дифференцируемость Pij(t), i,j = 0,1,2,..., в точке 0. Дифференцируемость Pu(t) и Pij(t) (j / i) будем доказывать по отдельности.
166 Глава 3. Марковские цепи с непрерывным временем Теорема 3.5.1 (о дифференцируемости Р^(£)). Если пере- ходные вероятности Pa(t) марковской цепи непрерывны в нуле, то они и дифференцируемы в нуле — существует конечный или бесконечный предел lim--------= -Р??(0) = qj для каждого i. Доказательство. Нам будет удобно доказать дифферен- цируемость в нуле функции = -lnPa(t), te [0,оо). Дифференцируемость Pu(t) будет следовать из равенства Рц(Г) = ехр{—</?(£)}, t € [0, оо). Функция = — 1пРц(Г) определена корректно, поскольку при всех t > 0 значение Pu(t) > 0. В самом деле из непрерывнос- ти Pu(t) в нуле и равенства Рц(0) = 1 следует, что для данного е > 0 найдется такое и, что при всех s из [0, гл] Рц(з) > 1-е. А в силу следствия из уравнения Колмогорова-Чепмена для дан- ного t и любого п PaW>(Pjj ал<. При достаточно больших п значение s = t/n принадлежит про- межутку [0,и], поэтому Р^(£) > 0 для всех t 6 [0; сю). Отметим, что функция <p(t) 1° неотрицательна и конечна; 2° полуаддитивна: </?(£ + s) < + </?($). Неотрицательность и конечность <p(t) следуют из неравенств о < PuW < 1,
3.5. Свойство дифференцируемости ... 167 полуаддитивность <p(t) следует из неравенства Pii(t + $) > Рц(/)Рц(з). Дифференцируемость ip(t) в точке 0, т. е. существование пре- дела <p(t) - (/2(0) <p(t) lim ----------— = lim — t—>o t t—>o t мы докажем, установив, что верхний и нижний пределы <р>(€)/t равны числу ^(0 qi = sup —— : t>0 t а именно, Inn—— =qi, hm——=qi. i—>0 t i->0 t Поскольку (p(t) 6 [0, oo), to snp(cp(t)/t) = qi может прини- t>o мать, вообще говоря, любые значения из [0;+оо]. Мы рассмот- рим отдельно случаи < оо и ф = +оо. 1° Пусть qi = sup —— < оо. t>o t По определению sup(</?(£)/£) = qi для данного е > 0 найдется t>o to > 0 такое, что а._£<м Чл . to Представим to в виде to = nh + 5, 0 < 5 < h < to,n > 0. В силу полуаддитивности </?($) имеем: £ < <£>(*о) _ <p(nh + 6) < ncp(h) + </?(5) _ n<p(h) </?(5) _ ~ to to ~ to to to to to _ nh </?(5) to h to to т. е. nh </?(5) Qt S ~ to h + to
168 Глава 3. Марковские цепи с непрерывным временем Вычислим нижний предел от правой и левой частей последнего неравенства при /г —> 0: - s < lim------= lim-------------------hm + lim ^~L. h-t-O \ Й) h to J h-t-O ^0 h—>0 h—>0 ^0 Значение lim = lim = 0, h^0 поскольку функция </?(s) непрерывна в нуле, <£>(0) = 0 и 5 ч 0 при /г —> 0. Равенство nh nh lim — = lim — = 1 h^0 *0 to следует из равенства to — nh = 8. Поэтому Qi - e < lim h->0 П И, следовательно, qi- £ < hm —— < hm —— < sup —— = qi. h^o n n h>0 К поскольку e произвольно, то qi = lim —7— = hm —— = qi. л->о h h^o h Поэтому, во-первых, существует lim^ =</(0) t^o t у J и, во-вторых, </(0) = sup——— = qi. t>o t Далее, поскольку Pn(t) = exp{-</?(f)},
3.5. Свойство дифференцируемости ... 169 Putt) = -</Л*)ехр{-^(£)}, Р'№ = -</(0)е° = —<//(0) = -qi. Так что --fii(O) =Qi= sup t>0 t 2° Пусть теперь </?(£) sup------= qi = +сю. t>o t Из равенства sup(<^(t)/t) = qi = +оо t>o следует, что для данного М > 0 найдется to > 0 такое, что м<^. to Отсюда, повторяя приведенные выше рассуждения, получим t^Q t Поскольку М может быть выбрано сколь угодно большим, то . ^(0 . Г--- ^(0 + СЮ < 11Ш--- < 11Ш----. £->0 t t И, следовательно, г ^(0 lim------------------------= Qi = +сю. t—>о t Теорема 3.5.2 (о дифференцируемости Pij(t)). Если пере- ходные вероятности Pij(t) i,j = 0,1,2,..., марковской цепи непрерывны в нуле, то Pij(t), j / г, дифференцируемы в нуле —существуют конечные пределы lim = Qij, J + i, i,j = 0,1,2,...
170 Глава 3. Марковские цепи с непрерывным временем Доказательство. Сначала докажем лемму. Для данных i,j (j г) и е > 0 найдется to (достаточно малое), что при любых h и п (п — целое неотрицательное) таких, что 0 < nh < to, выполняется неравенство (1 — Зс) h ~ nh (3.5.1) Доказательство леммы. Для данного h (произвольного, но фиксированного) по марковской цепи {£(t), t 6 [0, сю)} с непре- рывным временем определим марковскую цепь с дискрет- ным временем: &Л = £(kh), к = 0,1,... Матрица одношаговых переходных вероятностей цепи рав- на [Рц (h)], а матрица n-шаговых переходных вероятностей рав- на [Р^ (п/г)]. Для марковской цепи {£п,д} определим вероятности jPa(nh) перехода из i в i с запретами: jPiiW = 1, jPii^h) — P{£n,h — ^ч £o,h — ^ч £>u,h 7^ Зч V = 1,2,..., П— 1 | (,o,h = 0 — вероятность того, что цепь стартовав из i, за п шагов вернется в i без захода в j. Напомним еще, что fij (nh) = Р{£n,h = ji ^0,h = ^ч £>v,h 7^ Зч V = 1,2,..., П~ 1 | £о,Л = 0 • Имеет место следующее неравенство: п—1 Ру(п/г) > ^2 jpu^h)pijWpjj(.(.n ~ О' + 1))М (J / «)• (3-5.2) L/ = 0 Каждое слагаемое в правой части (3.5.2) соответствует пути длиной п, ведущему из состояния i в состояние j (шаг длиной h), у которого имеется переход из i в j за один шаг. Эти пути несов- местны, но, вообще говоря, не исчерпывают всех путей из i в j за п шагов (здесь учтены только пути, у которых имеется переход из i в j за один шаг, но среди путей из i в j не все такие).
3.5. Свойство дифференцируемости ... 171 Оценим правую часть (3.5.2) снизу. Для этого сначала оце- ним снизу jPn(i/h), воспользовавшись равенством У— 1 Рц(уК) = 57 /y(m/l)Pjj((z/ - то)^) + jPiiivh), тп=1 — переход из i в i за и шагов возможен с заходом в j и без захода в j. Имеем У—1 jPutyh) = Palish) - 52 fijtmh'jPjitt1' ~ m)h) > m=l у— 1 > Pjj(vh) — max Pji((v — m)ti) > ~ ~ m=l > Pn(i/h) — max Pji((p — m)h), l<m<y—l t. e. jPafvh) > Pa(vh) — max P™((z/ — m)h). (3.5.3) Из (3.5.2) и (3.5.3) имеем Py(n/l) > n— 1 > - .max Pji^-m^Pij^Pjj^n- (i/+ l))/i)). y=0 (3.5.4) Далее, пусть e > 0 (произвольное, но фиксированное). Для дан- ных г, j в силу непрерывности Рц(1), Pji(t), найдется та- кое to (достаточно малое), что при 0 < t < to Putt) > 1 - s, Pji(t) < s, Pjj(t) > 1 - e. Поэтому для любых h > 0 и целых к таких, что 0 < kh < to имеют место неравенства Pa(kh) > 1 — г, Pjj(kh) < е, Pjj(kh) > 1 — е.
172 Глава 3. Марковские цепи с непрерывным временем Учитывая последние три неравенства, для h > 0 и п таких, что nh < to, из неравенства (3.5.4) получаем п—1 Ру(п/г) > J2(l - г - г)Ру(/г)(1 - г) = 1/=0 = (1 - 2s) (1 - s)nP0(/z) > (1 - 3s)nP^(/z), или PZJ(nh) > (1 — 3e)nPij(h). Разделив обе части последнего неравенства на nh, получим нера- венство (3.5.1). Тем самым лемма доказана. Дальнейшее доказательство теоремы будет основано на нера- венстве (3.5.1). Обозначим 1 • qij = ШИ — Заметим, что значение qij < оо. Действительно, из леммы следует, что для данного е > 0 най- дется такое to, что для любых п и h, удовлетворяющих условию nh € (to/2, to) С (0, to], (1 — Зс) (nty < 1 — h ~ nh ~ to/2 to" поэтому qjj < ex?. Далее докажем, что р— Pij(t) 1- Pij(t) lim —-— < qa = lim —-— t -чгд t Поскольку 1- Pij(t) qij = hm t^o t то для данного s > 0 найдется tf G (0, to) такое, что tf < q^ +
3.5. Свойство дифференцируемости ... 173 В силу непрерывности Pij(t) последнее неравенство имеет место и в некоторой окрестности (Д — h^t! + ho) точки tf (дополни- тельно выберем ее принадлежащей промежутку (0 До)), т. е. р. .(А —< Qij + £•> t G (tf — ho, tf + Hq) С (0, to). (3.5.5) Для достаточно малых h (0 < h < ho) найдется такое п, что nh 6 (t' — ho, t' + ho) C (0, to). Поэтому из (3.5.1) и (3.5.5) имеем (1 _ 3c}Fij^ < Pi^nl^ <(/ +£ ( ’ h - nh -q^+£ при h < ho- Так что для h < ho Вычисляя верхний предел при /г —> 0 от правой и левой частей последнего неравенства, получим (1 - Зе) lim + s, h^o h J а поскольку e можно выбрать сколь угодно малым, то что вместе с равенством r PijW qij = hm — завершает доказательство теоремы. Пр им ер 3.5.1. Для процесса рождения и гибели с интен- сивностями роста Xi и гибели щ вычислить Qi — — Рц(9) и Qij — Fiji®)- Решение. По определению процесса рождения и гибели при /г —> 0 + 0 {Xih + o(h), если j = i + 1; 1 — (A^ + Pi)h + o(h), если j = i, Pih + o(h), если j = i — 1.
174 Глава 3. Марковские цепи с непрерывным временем Pij(h) непрерывны в нуле, поэтому согласно теореме о диффе- ренцируемости Pij(h) существуют производные Р-(0) и Р^-(О), j i (собственно говоря, существование производных следует и из вида переходных вероятностей Р^(/г)). При этом р' /го г 1 — Qi = ~Рц(9) = lim---------------= л->о h _ 1 _ (1 “ (Ai + Лг)^ + °(^)) _ х . , — ПШ — Лг “Г /1?, h—>0 h г>! ((\\ 1* •f>i,i+l(^') г Aj/l + o(h) Qi,i+1 = Pi,i+i(0) = bm -------------= bm--------т-----= Xi, h—>0 h h—>0 h Uih + oth) Qi,i-i = -fi,i-i(0) = hm-------------= Щ, ’ tl для j i — 1,г, г + 1 P/,(0) = lim = lim = 0. v h^0 h h^0 h 3.6 Распределение времени пребывания в состоянии Из теоремы о дифференцируемости Рц(Г) мы получим важ- ное утверждение о распределении времени пребывания цепи в данном состоянии. Определение. Временем пребывания в состоянии i мар- ковской цепи {£(£), t 6 [0, оо)}, стартующей из г, будем называть случайную величину 77, определяемую равенством Ti = inf{t: £(t) / i, €(0) = 0- Марковская цепь {£(£)> t € [0, oo)} в момент т, скачком ухо- дит из состояния г. Мы будем считать, что в момент значение £(77) все еще равно г, т. е. £(77) = Г Теорема 3.6.1 (о распределении времени пребывания). Ес- ли у стационарной марковской цепи {£(£), t 6 [0, оо)} Qi < оо, то время пребывания Tj в состоянии i цепи, стартующей из i, имеет показательное распределение с параметром qi: Р{п < 11 £(0) = г} = 1 “ exp{-^f}, t > 0.
3.6. Распределение времени пребывания 175 Доказательство. Пусть t > 0 — произвольное фиксиро- ванное. Рассмотрим событие {ъ > £,£(0) = г} — время пребывания Tj цепи, стартующей из состояния г, в со- стоянии i больше t. Разобьем промежуток [0, t] точками sk — fc = 0, 1, . . . , 2П ($о = 0, 82” = t) 2П и обозначим через An(t) событие, состоящее в том, что в момен- ты времени fc = 0,1,..., 2П, цепь находится в состоянии i: An(t) = {£ («о) = i,£ («1) = («2") = г} • Ясно, что -^n+i(^) С An(t), n = 1,2,... Непосредственной проверкой можно убедится, что {Tj > t,£(s0) = г} = Q An(t). П=1 Из последнего равенства в силу свойства непрерывности веро- ятности имеем (оо \ P|An(f) = limP(An(f)). (3.6.1) 11 In n=l / Вычислим lim P (An(t\). В марковской цепи конечномерные распределения, в частнос- ти и P(An(t)) = *Ш) = i, C(«1) =«,•••> C(«2"-1) = i,C(«2") = i}> выражаются через распределение начального состояния и пере- ходные вероятности (см. (3.1.3)): P(An(i)) = Р{С(«о) = i, £(«i) = г, , С(«2"-1) = г,С(в2п) = = = Р{£(в2п) = i I C(s2n-1) = г}Р{£(в2п-1) = i I ^(®2П—2) =«}... • • • -Р{С(«1) = i I €(so) = i}P{£(s0) = i} =
176 Глава 3. Марковские цепи с непрерывным временем = -Р{<Ы = *}- Поэтому (3.6.1) можно переписать так / St\\2n Р{тг > £,фо) = г} = -Р{С(«о) = 4lim ( Рп эд • п \ \Л'1 J J ( ( t \\2П Найдем lim ( Рц ( ) ) • Поскольку Pu(s) дифференцируема в нуле и по условию тео- ремы —Р/ДО) = qi < оо, то Pu(s) = 1 - qis + o(s), s —> 0. Положив s = t/2n, при n —> оо получим: Рц I 77“ I — 1 — Q?77“ + О I I , (3.6.2) \2n J 4 2n \ 2n) v 7 (^(2")) = y1 ~qi?n +0 (2”)) = ln^n(t) = 2” In (1 - qt^- + о ~ ~2n (-«^ +° = -%i + o(l), ln^n(i) -> -qit, <^n(i) -> e~git. Так что при n 00 / / . \\2n <^„(f) = [Pa (2^)) -»•e-9it, limP(An(i)) = PR(so) = i}e~git. n Поэтому равенство (3.6.1) можно переписать так: P{n > t,£(s0) = г} = P{C(so) = 0е 9it
3.6. Распределение времени пребывания 177 Отсюда Р{тг >t|£(0) =0 = e~qit, t >0, Р{п < 11 C(0) =г} = 1- e~9it, t > 0, т. e. время пребывания цепи, стартующей из состояния г, в со- стоянии i имеет показательное распределение. Следствие. Если qi = 0, то Р{тг = +оо I £(0) = г} = 1, Другими словами, если qi = 0, то цепь, стартовав из состоя- ния i, останется в i навсегда. Доказательство. При qi = 0 из равенства (3.6.2) имеем Отсюда, повторяя выкладки теоремы, получим что для любого t > 0 р{г{ > t ie(o) = о = 1- Переходя в последнем равенстве к пределу при £ —> +оо, полу- чим P{Ti > +ОО | £(0) =0 = 1- Определение. Состояние г, для которого qi < оо, называется устойчивым. Состояние г, для которого Qi = 0, называется поглощающим (цепь, попав в поглощающее состоя- ние г, остается в нем навсегда). Состояние г, для которого qi = -hoc, называется мгновенным. Среднее время пребывания цепи во мгновенном состоянии равно нулю. Попадая в такое состояние, цепь мгновенно его по- кидает. Теория марковских цепей с непрерывным временем, име- ющих мгновенные состояния, крайне сложна.
178 Глава 3. Марковские цепи с непрерывным временем Мы не будем рассматривать марковские цепи, у которых имеются мгновенные либо поглощающие состояния. Вложенная цепь. Событие “цепь, пребывая в состоянии г, в момент времени t покидает г” обозначает, что для любого, сколь угодно малого /г, происходит событие {€(<) = i, £(£ + />) / О- Обозначим через Лц(/г) = P{£,(t + h)=j\ £(t) = i, £(t + h)^i} вероятность того, что цепь в момент t + h пребывает в состо- янии j при условии, что пребывая в момент t в состоянии г, в момент t + h она в состоянии i не пребывает. Тогда Ру = lim Rijfji) естественно рассматривать (интерпретировать) как вероятность события “покидая состояние i, цепь переходит в состояние j”. Убедимся, что lim Rijth) существует, и более того lim Rij(h) = h—>o lJ' 7 qi Для Rij(h) имеем Rdj(h) = pm+h) = j\ e(t) = i, +h)^i} = = Р{& + h)= j, £(t) = i, + h)^i} = pm = i, pm+h) = j,e(o = i} pm+h) = j\e(f) = i} p{&t+h^i,= о p{t(t+h)/i\e(t) = o p{^t+h) = j\^t) = i} p^h) l-P{^t + h) = i\^t) = i} l-Pathy t. e. <3-6-3’ мы воспользовались тем, что {£(t + h) = =z} C {£(t + h) = z},
3.6. Распределение времени пребывания 179 W + ^) + =г} = {£(t + h) = = г}. Разделив числитель и знаменатель правой части равенства (3.6.3) на h и переходя к пределу при /г —> 0 (существование предела следует из дифференцируемости Рц{1) и P^-(t)), получим lim Rii(h) = hm ---z, ч 4 ., = — = рц. h^o J h^o (1 — Pii(hY)/h qi J Итак, вероятность того, что цепь, покидая состояние г, пе- рейдет в состояние j равна /П — Pij ~ о Чг Например, для процесса рождения и гибели вероятность pij того, что цепь, покидая состояние г, перейдет в состояние j, рав- на Pi,i+i = lim Riti+i(h) = , Л->0 qi Xi + щ Pi,i-1 = lim7?M_i(/i) = , Л->0 qi Xi + щ для j i — 1, г + 1 значения Pij = lim Rij(K) = ^ = 0, h,—>0 qi см. также пример 3.5.1 (с. 173). Структура марковской цепи с непрерывным временем опи- сывается следующим утверждением. Стационарная марковская цепь е [0;оо),£(0) = г}, стартовав в момент времени t = 0 из состояния г, пребывает в i случайное время ъ, имеющее показательное распределение с параметром qi = -Р/ДО). По окончании времени пребывания цепи в состоянии i цепь, уходя из состояния i, переходит в состояние j / i с вероятнос- тью р^ = q^ /qi и пребывает в состоянии j случайное вре- мя Tj, имеющее показательное распределение с параметром qj, и т. д. Определение. Пусть 6 [0;оо)} — стационарная марковская цепь с непрерывным временем и фазовым простран- ством X = {0,1,2,...}, р^ = q^/qi — вероятность перехода из
180 Глава 3. Марковские цепи с непрерывным временем состояния i в состояние j (J i) по истечении времени пребыва- ния Ti цепи в состоянии i. Марковскую цепь {£п} с дискретным временем, фазовым пространством X и матрицей переходных вероятностей [Ру], i,j е х, pa = о, i е х, будем называть вложенной марковской цепью стационарной мар- ковской цепи 6 [0;оо)}. Матрицу \pij] называют матрицей переходных вероятностей вложенной марковской цепи. Определение. Числа Vij(i,j = 0,1,2,...), определяемые равенством = I -Qi, если j = i, tj I Qij, если j i, называются инфинитезимальными интенсивностями перехо- да марковской цепи 6 [0;оо)} с непрерывным временем, а матрицу v = [z/^] называют матрицей инфинитезимальных характеристик. Матрица инфинитезимальных характеристик задает марков- скую цепь: уц = qz — параметр показательного распределения времени пребывания цепи в состоянии г, а р^ = Qij/Qi — вероят- ность перехода из состояния i в состояние j (j г). Заметим, что матрица инфинитезимальных характеристик i/ = P'(0). 3.7 Обратные дифференциальные уравнения Колмогорова Определение. Марковскую цепь {£(f),f € [0;оо)} с непре- рывными в нуле переходными вероятностями будем называть консервативной, если для всех i ^2 Hi = (Ь (9<<И< °°)- (3.7.1) j-j/i Другими словами, марковская цепь консервативна, если для всех i У? Pij = 1- j-j^i Эквивалентность определений следует из равенств р^ = Iq2, i,j = 0,1,2,...
3.7. Обратные дифференциальные уравнения 181 Пример 3.7.1. Процесс рождения и гибели консервативен, поскольку Qm+i = Qij = °, -+ qi = Xi + щ. Теорема 3.7.1 (обратные уравнения Колмогорова). В кон- сервативной цепи Маркова переходные вероятности Pij(t) удов- летворяют обратным дифференциальным уравнениям Колмо- горова: Р'гД) = Е QikPkj^ ~ QiPijW) (3-7.2) k:k^i для всех i,j = 0,1,2,...; в матричном виде P'(f) = Рр(£), где и — инфинитезимальная матрица. Доказательство. Из уравнения Колмогорова-Чепмена име- ем Ру (/г + t) - Pij (t) = Е PikWPkjtt) - Pijlt) = к = 52 pfc(/i)pfeJ(t) + (Paw - 1)р^. k:k^i Отсюда Pij(h + t)~ Pjj(t) h =l +p"th: ip->w- k:k^i Формально переходя к пределу при /г —> 0 + О, причем в правой части под знаком суммы, для всех г, j, получим ~ QikPkj(t) qiPijfy- k-.k^i Для обоснования предельного перехода установим, что Е ^кРкД} < lim 1 Е Pik(h')Pkj(t') < k-.k^i /wO+О h к.к^
182 Глава 3. Марковские цепи с непрерывным временем — . к УТ PikWPkj^t) < УТ QikPkj(t)- ^0+0h Для любого N 1 N 1 - £ Pik(h)Pkj(t) < - £ Pik(h)pkj(t). tl £' tl £< k=l,k^i k:k^i Отсюда N 1 52 QikPkjit) < lim - y''Pik(h)Pkj(t), k=i^i h^+°hk^i а так как N произвольно, то 52 qikPkj(t) < lim | 52 pik(h)Pkj(tY (3.7.3) k-.kjti h-Ю+О к.к^ Докажем теперь, что к lijrLn 7? УТ Pik(h)Pkj(t) < УТ QikPkj(t)- k-.k^i k-.k^i Пусть N достаточно большое, так что i 6 [0,7V). Тогда 52 pik(h)pkj(t) < 52 pik(h)pkj(t) + 52 рм = k:k^i k=l,k^i k=N+l N N = 52 pik(h)pkj(t) + i-^PikW = k=l,k^i k=l N N = 52 вд)ркд«)+((1-рй(/г))- 52 pm). k=l,k^i k=l,k^i Разделив на h и вычислив верхний предел при h 0 + 0 от обеих частей, получим 1 N N Um Т Pik(h)Pkj(t) < QikPkjW + \Qi ~ Qik ) • Л->0+0 Г1 £z£' \ £' / k:k^i к=1, k^i k=l,k^i
3.8. Примеры и задачи 183 При N +оо, учитывая, что процесс консервативен (см. (3.7.1)), а, следовательно, N Qi~ 52 Qik °’ к=1, k^i получаем lim Г 12 pik(typkj(t) < 52 <kkPkj(t)- ft—>0+0 h f--' f-' к-.к^г к\к^рг Из последнего неравенства и неравенства (3.7.3) следует, что, во-первых, существует Йо S £ р*‘* к\к^г и, во-вторых, он равен QikPkj(t)- k:k^i Тем самым теорема доказана. Замечание. Переходные вероятности Pij(t) консерватив- ной марковской цепи удовлетворяют системе обратных дифференциальных уравнений (3.7.2) и без предположения кон- сервативности, но последнее делает доказательство теоремы осо- бенно простым. 3.8 Примеры и задачи Примеры Пример 3.8.1 (цепь с двумя состояниями). Пусть 6 6 [0, ex?)} — стационарная марковская цепь с непрерывным вре- менем и фазовым пространством X = {0; 1}. Найти Pij(t), i,j = 0,1, по известным qo и qi, если состо- яния цепи ненулевые, т. е. qo > 0 и qi > 0, и не мгновенные, т. е. qo / сю и qi / сю. Решение. Поскольку фазовое пространство X = {0; 1} со- стоит из двух состояний и состояния ненулевые — цепь не оста- ется в состояниях 0 и 1, то вероятности перехода во вложенной цепи равны: Poi = 1, Рю = 1. Далее, _ Qij • / • Pij ~ •> 3 Qi
184 Глава 3. Марковские цепи с непрерывным временем поэтому Qoi <7ю Poi = —, Рю = —, Qo Q1 а т. к. Р01 = 1, Рю = 1, то «и = qo, qw = qi и, следовательно, матрица инфинитезимальных характеристик Г -Qo Qoi 1 Г -Qo Qo I L Q10 -Qi J L Qi -Qi J ’ Переходные вероятности = 0,1, найдем как реше- ния обратных дифференциальных уравнений Колмогорова: Р'(^) = подробнее Роо(О = -Qo-Poo(i) + Qo-Pio(i), (3.8.4) Poi (0 = -Qo-Poi(i) + Qo-Pu(i), (3.8.5) PwW = Qi-PooW - Qi-PioW, (3.8.6) Pf1(t) = giPoi(t)-9iPii(t), (3.8.7) с начальными условиями Py(0) = <^, м = 0,1. (3.8.8) Поскольку Poo(t) + Poi(t) = 1, Pio(i) + Pn(t) = 1, (3.8.9) то для решения системы уравнений (3.8.4) — (3.8.7) достаточно найти РОо(О и Рю(£), решив систему уравнений (3.8.4) и (3.8.6). Вычитая уравнение (3.8.6) из уравнения (3.8.4), получим: (Poo(f) - PioW)' = -(Qi + Qo)(PooW - PioW). (3.8.10) Решением последнего дифференциального уравнения при на- чальном условии Роо(О) - Рю(0) = 1
3.8. Примеры и задачи 185 является Poo(t) - Pio(t) = е-(<го+^. (3.8.11) Подставляя в (3.8.4), получим: = -</ое-(9о+91)*. Откуда f P^(s)ds = - f qoe-^+^sds, Jo Jo Poo(t) = Роо(0) - -5— (1 - е-^+^)‘). qo + qi Итак, P00(t) = —Я’— + _Я2_е-(9о+91)*5 t > 0. Qo + <71 Qo + Ql По P00(t) находим оставшиеся Pij(t). Подставив выражение для Роо(О в равенство (3.8.11), нахо- дим, что Р10(<) = —----------^e-(90+Ql)t5 t > 0 qo + qi qo + qi Наконец, из (3.8.9) получаем, что Poi(i) = 1 - Poo(t) = —--------®e-(9o+</i)t5 t > 0) qo + qi qo + qi Pn(f) = 1 - Pio(t) = 90 + 91 e~(go+gl)t, t > 0. QO + Ql QO + Ql Из найденных представлений для Pij(t), i,j = 0,1, получаем lim Pjo(t) = ———, i = 0,1, i->oo qo + qi lim Pn(t) = ———, i = 0,1. i—>oo qo + qi Пример 3.8.2. Пусть t G [0,oo),£(0) = 0} — процесс чистого рождения, стартующий из 0 с фазовым простран- ством X = {0,1,2,...} и положительными интенсивностями роста Xk.
186 Глава 3. Марковские цепи с непрерывным временем Вероятности пребывания Pk(t) = P{£(t) — &}> fc = 0,1,2,... удовлетворяют системе дифференциальных уравнений p^t) = -лад, = -AfcPfc(t) + Afe-iPfe-i(f), к > 1. (3.8.12) Система (3.8.12) имеет единственное решение {Pfe(f)}, удовле- творяющее соотношениям Pk(t) > о, оо к=0 Показать, что если оо Ep*w = 1 к=0 при всех t > О, то ряд (3.8.13) расходится. Решение. Из (3.8.12) получаем: XkPk(t) = -P^t) + Afc_iPfc_i(f). (3.8.14) Пользуясь рекуррентным соотношением (3.8.14), имеем: ^kPk(t) — Pk(t) + ^к— 1Рк—1(0 — = -P^t) - P^t) + Afc_2Pfc_2(f) = ... = -£ P'(t)- j=0 Интегрируя последнее равенство, получаем: Afc fpk(s)ds= (-^PXs)) = о \ j=o J о
3.8. Примеры и задачи 187 k k = £(pz(o)-p/f)) = i-£pz(t), j=0 j=0 (воспользовались тем, что процесс стартует из нуля: Ро(О) — = 1,РД0) = 0J = 1,2,...) или t к j=0 0 Отсюда имеем t f Pk(s)ds < -к J Afc о (3.8.15) Предположим, что ОО £nw = i- к=0 Сложив почленно неравенства (3.8.15) (fc = 0,1,2,...) и вос- пользовавшись теоремой Лебега о монотонной сходимости, по- лучим: оо оо t t оо t 52 д- 52 / Pk(s)ds = / ^Pktsjds = Idt = t fc=0 Лк k=o о о fc=° о при всех t > 0, что доказывает расходимость ряда (3.8.13). В случае же, когда ряд (3.8.13) сходится, для некоторого to оо 52 pk(do) ± 1, к=0 т. е. в момент времени to мы имеем дело с парадоксальной ситуа- цией (ведь события {£(to) = к}, к = 0,1,2,... образуют полную группу событий и сумма их вероятностей обязана равняться 1). Объяснить это явление можно так: при достаточно быстро стре- мящихся к бесконечности интенсивностях роста (настолько быстро, что ряд (3.8.13) сходится) размер популяции может за
188 Глава 3. Марковские цепи с непрерывным временем конечное время Т вырости до бесконечности (так называемый взрыв) и процесс при t > Т не определен. Задачи Задача 3.1. Выписать обратные дифференциальные урав- нения Колмогорова для процесса чистого рождения. Ответ: Р'(^) = где -Ао О Ао -Л1 О О О А1 О —А2 А2 Задача 3.2. Доказать, что для любого состояния г марков- ской цепи с непрерывным временем вероятность возвращения в исходное состояние Рц(£) строго больше нуля при всех t > 0. Указание. Воспользоваться уравнением Колмогорова-Чеп- мена. Задача 3.3. Пусть i,j — два состояния марковской цепи с непрерывным временем и существует to такое, что Pij(to) > 0. Доказать, что > 0 для любого t > 0. Указание. Воспользоваться формулой Колмогорова-Чеп- мена. Задача 3.4. Доказать, что для процесса чистого рождения переходные вероятности удовлетворяют соотношению t = Aj-i e~Xit f e^Pij-^sjds, j > i. 0 Указание. Воспользоваться прямыми дифференциальны- ми уравнениями. Задача 3.5. Пусть £(£) — процесс чистого рождения с ин- тенсивностями роста Ло = 1, А1 = 3, Л2 = 2, Аз = 5. Найти Ро,п(£) при п = 0,1,2,3. Задача 3.6. Пусть — пуассоновский процесс с интен- сивностью А = 5. Найти: 1)Р{£(3) = 8, е(7) = 12}; 2)Р{£(3) = 3, £(6) = 5}. Задача 3.7. Пусть £(£) — пуассоновский процесс с интен- сивностью А = 7. Найти Р{£(3) = 81 £(10) = 22}.
Литература [1] Боровков А. А. Курс теории вероятностей / А. А. Боровков. — М. : Наука, 1972. — 288 с. [2] Гихман И. И. Теория вероятностей и математическая ста- тистика / И. И. Гихман, А. В. Скороход, М. И. Ядренко. — К. : Вища шк. Головное изд-во, 1979. — 320 с. [3] Гнеденко Б. В. Введение в теорию массового обслуживания / Б. В. Гнеденко, И. Н. Коваленко. — М. : Наука, 1966. — 432 с. [4] Зубков А. М. Сборник задач по теории вероятностей: учеб, пособие для вузов / А. М. Зубков, Б. А. Севастьянов, В. В. Чистяков. — 2-е изд., испр. и доп. — М. : Наука. Гл. ред. физ.-мат. лит., 1989. — 320 с. [5] Карлин С. Основы теории случайных процессов / С. Кар- лин. — М. : Мир, 1971. — 536 с. [6] Мешалкин Л. Д, Сборник задач по теории вероятностей / Л. Д. Мешалкин. — М. : Изд-во Моск, ун-та, 1963. — 155 с. [7] Миллер Б. М. Теория случайных процессов в примерах и задачах / Б. М. Миллер, А. Р. Панков. — М. : ФИЗМАТ- ЛИТ, 2002. - 320 с. [8] Розанов Ю. А. Случайные процессы / Ю. А. Розанов. — М. : Наука, 1971. - 288 с. [9] Скороход А. В. Элементы теории вероятностей и случай- ных процессов / А. В. Скороход. — К. : Вища школа, 1980. - 344 с.
190 Глава 3. Марковские цепи с непрерывным временем [10] Теория вероятностей: Сб. задач. / А. Я. Дороговцев, Д. С. Сильвестров, А. В. Скороход, М. И. Ядренко. — К. : Вища шк. Головное изд-во, 1980. — 432 с. [11] Турчин В. Н. Теория вероятностей и математическая ста- тистика: учебник / В. Н. Турчин. — Д.: Изд-во Днепропетр. ун-та, 2008. — 656 с. [12] Тутубалин В. Н. Теория вероятностей и случайных процес- сов / В. Н. Тутубалин. — М. : Изд-во Моск, ун-та, 1992. — 400 с. [13] Феллер В. Введение в теорию вероятностей и ее приложе- ния: В 2 т. / В. Феллер. — 3-е изд. — М. : Мир, 1984. — Т.1. - 527 с.; Т.2. - 751 с. [14] Ширяев А. Н. Вероятность / А. Н. Ширяев. — М. : МЦН- МО, 2004. - Т.1. - 520 с.; Т.2. - 408 с. [15] Bhattacharya R. N. Stochastic Processes with Applications / R. N. Bhattacharya, E. C. Waymire. — Philadelphia: SIAM, 2009. - 676 p. [16] Chung K. L. Markov Chains with Stationary Transition Probabilities / K. L. Chung. — Berlin: Springer-Verlag, 1960. - 278 p. [17] Lefebvre M. Applied Stochastic Processes / M. Lefebvre. — N.Y.: Springer Science+Business Media LLC, 2007. — 382 p. [18] Norris J. R. Markov Chains / J. R. Norris. — Cambridge: Cambridge University Press, 1997. — 238 p. [19] Parzen E. Stochastic Processes / E. Parzen. — San Francisco: Holden-Day, 1962. — 324 p. [20] Privault N. Understanding Markov Chains / N. Privault. — Singapore: Springer, 2013. — 354 p. [21] Resnick S. Adventures in Stochastic Processes / S. Resnick. — Boston: Birkhauser, 2005. — 626 p. [22] Stirzaker D. Stochastic Processes and Models / D. Stirzaker. — Oxford: Oxford University Press, 2005. — 332 p.
Оглавление Предисловие.................................... 3 1 Цепи Маркова — основные понятия и факты 5 1.1 Определение цепи Маркова. Простейшие свойства........................ 6 1.2 Возвратность.............................. 21 1.3 Существенные состояния. Классы эквивалентности.................... 31 1.4 Примеры и задачи.......................... 52 2 Предельные теоремы для марковских цепей 71 2.1 Эргодическая теорема ..................... 71 2.2 Дискретная марковская цепь, описывающая очередь ......................107 2.3 Задача о разорении игрока.................115 2.4 Примеры и задачи..........................125 3 Марковские цепи с непрерывным временем 135 3.1 Основные понятия и определения ...........135 3.2 Процесс чистого рождения..................140 3.3 Процессы рождения и гибели................149 3.4 Обслуживание с ожиданием..................159 3.5 Свойство дифференцируемости переходных вероятностей...................165 3.6 Распределение времени пребывания в состоянии...............................174 3.7 Обратные дифференциальные уравнения Колмогорова ....................180 3.8 Примеры и задачи..........................183 Литература....................................189
Навчальне видання Турчин Валерш Миколайович Турчин €вген Валершович MAPKOBCBKI ЛАНЦЮГИ Основы! поняття, приклады, задач! Навчальний посгбник для студентов вищих навчальних закладгв (росгйською мовою) Редактор К).В. Козаченко Художник К.Д. Ткаченко Орипнал-макет B.M. Турчин ГПдниеано до друку 01.02.2016 р. Формат 84x108/32. Ум. друк. арк. 10,08. Тираж 300 нрим. Зам. № 010216. Видавництво i друкарня TOB «Л1зуновПрес» 49127, м. Дшнронетровськ, вул. Немировича-Данченка, 30/166. Свщоцтво суб’екта видавничоГ снрави: cepin ДК № 3597 в!д 06.10.2009 р. BiddpyKoeano з готового авторського оригша.л-макета (1з прав, на с. 1, 2, 3, 191, 192)
ТУРЧИН Валерий Николаевич Автор 107 научных и научно- методических работ, 14 учебников и учебных пособий по теории вероятностей и математической статистике. Заведующий кафедрой статистики и теории вероятностей Днепропетровского национального университета имени Олеся Гончара. ТУРЧИН Евгений Валериевич Автор 27 научных и научно- методических работ, 2 учебных пособий по теории вероятностей и математической статистике. Доцент кафедры статистики и теории вероятностей Днепропетровского национального университета имени Олеся Гончара.