Марковские цепи: Основные понятия, примеры, задачи - Турчин В.Н., Турчин Е.В.

Турчин В.Н., Турчин Е.В. Марковские цепи
Глава 1 Цепи Маркова — основные понятия и факты
Существенные состояния. Классы эквивалентности
Глава 2 Предельные теоремы для марковских цепей
Дискретная марковская цепь, описывающая очередь
Глава 3 Марковские цепи с непрерывным временем
Свойство дифференцируемости переходных вероятностей
Распределение времени пребывания в состоянии
Обратные дифференциальные уравнения Колмогорова
Author: Турчин В.Н. Турчин Е.В.
Tags: теория вероятностей и математическая статистика теория вероятностей математическая статистика комбинаторный анализ теория графов математика высшая математика дискретная математика учебное пособие
ISBN: 978-966-2575-61-3
Year: 2016
Similar
Теория вероятностей и математическая статистика: основные понятия, примеры, задачи
Задачи по теории вероятностей: Основные понятия. Предельные теоремы. Случайные процессы
Задачи по теории вероятностей
Text
                    МАРКОВСКИЕ
В.Н. ТУРЧИН
Е.В. ТУРЧИН
В.Н. ТУРЧИН, Е.В. ТУРЧИН
МАРКОВСКИЕ
ЦЕПИ
основные
понятия,
примеры,
задачи
Учебное пособие для студентов
высших учебных заведений
Рекомендовано
Министерством образования
и науки, молодежи и спорта Украины
Дыпропетровськ. LizunoffPress. 2016
УДК 519.21
ББК 22.17я73
Т89
Рецензенты: Ю.В. Козаченко, д-р физ.-мат. наук, проф. (Киевский
национальный университет имени Тараса Шевченко),
В.В. Булдыгин, д-р физ.-мат. наук, проф. (Националь-
ный технический университет Украины «КПИ»).
Рекомендовано Министерством образования и науки, молодежи
и спорта Украины в качестве учебного пособия для студентов
высших учебных заведений (письмо № 1/11 — 857 от 30.01.13).
Навчальний посябник е елементарним вступом до Teopii’ марковських
ланцюпв — облает! сучасноТ Teopii’ ймов!рностей !з широкою сферою застосу-
вань. Викладено основш поняття i факти Teopii’ марковських ланцюпв.
Теоретичш положения проыюстровано численними прикладами. До кожно’Г
глави наведено na6ip завдань для самостшно’Г роботи. Для читання книги
досить знань Teopii’ ймов!рностей у обсяз! дискретно’1 модел! та вищо’1 матема-
тики в обсяз! стандартного курсу вищих навчальних заклад!в.
Для студенев вищих навчальних заклад!в.
Турчин В.Н., Турчин Е.В.
Т89 Марковские цепи: Основные понятия, примеры, задачи: Учеб,
пособ. для студентов вузов. — Днепропетровск: ЛизуновПресс, 2016. —
192 с.
ISBN 978-966-2575-61-3
Учебное пособие представляет собой элементарное введение в теорию
марковских цепей — широко используемую в приложениях область современ-
ной теории вероятностей. Изложены основные понятия и факты теории
марковских цепей. Теоретические положения проиллюстрированы многочис-
ленными примерами. К каждой главе приведен набор задач для самостоятель-
ной работы. Для чтения книги достаточно знания теории вероятностей в
объеме дискретной модели и высшей математики в объеме стандартного
курса высших учебных заведений.
Для студентов высших учебных заведений.
УДК 519.21
ББК 22.17я73
В оформлении обложки использована работа Клода Моне
«Розовая тропинка, Живерни».
ISBN 978-966-2575-61-3	© Турчин в м- Турчин е в- 2016
© Ткаченко К.Д., обкладинка, титул. 2016
Предисловие
Настоящее учебное пособие является элементарным введени-
ем в теорию случайных процессов, которая является содержа-
тельной, широко используемой в приложениях областью совре-
менной теории вероятностей. Оно написано на основе лекций,
читаемых авторами в Днепропетровском национальном универ-
ситете имени Олеся Гончара.
Марковские цепи представляют собой простейший тип слу-
чайных процессов, для которых характерно “отсутствие памя-
ти”. Книга охватывает традиционную тематику курса “Марков-
ские цепи”: матрицы переходных вероятностей и задание мар-
ковской цепи, возвратность, классификация состояний, классы
эквивалентности, эргодическая теорема, эргодические и стацио-
нарные распределения, предельное поведение марковской цепи,
марковская цепь, описывающая очередь, задача о разорении иг-
рока, марковские цепи с непрерывным временем, пуассоновский
процесс, процессы рождения и гибели, обратные и прямые урав-
нения Колмогорова, эргодическая теорема для процесса рожде-
ния и гибели, обслуживание с ожиданием, дифференцируемость
переходных вероятностей и время пребывания в состоянии.
Изложение материала иллюстрируется многочисленными
примерами и задачами, в частности, из теории массового об-
служивания.
Учебным пособием могут пользоваться как студенты механи-
ко-математических факультетов, факультетов прикладной ма-
тематики и кибернетики университетов, так и технических, пе-
дагогических, экономических высших учебных заведений.
Авторы будут признательны всем, кто в той или иной фор-
ме выскажет свои пожелания, замечания и предложения отно-
сительно содержания книги. Предложения и пожелания про-
сим присылать по адресу: Украина, 49010, Днепропетровск-10,
пр. Гагарина, 72, Днепропетровский национальный университет
имени Олеся Гончара, механико-математический факультет, ка-
федра статистики и теории вероятностей, В. Н. Турчину или по
адресу vnturchyn@gmail.com

Глава 1
Цепи Маркова —
основные понятия
и факты
Детерминированные и стохастически детерминиро-
ванные системы. В различных областях естествознания, на-
уки и техники мы имеем дело с системами, состояние которых
в данный момент определяет их дальнейшую эволюцию. Такие
системы называют детерминированными. Естественным обоб-
щением детерминированных систем являются стохастически де-
терминированные системы. Они эволюционируют случайным об-
разом, но состояние системы в данный момент времени опреде-
ляет ее распределение (вероятности пребывания в состояниях)
во все последующие моменты времени. Такие системы называ-
ются марковскими.
Мы будем изучать марковские системы, множество возмож-
ных состояний X которых — фазовое пространство — конечно
либо счетно (будем считать X множеством целых чисел или его
частью).
Математическими моделями марковских систем, у которых
переходы из одного состояния в другое осуществляются в цело-
численные моменты времени t = 0,1,2,... являются цепи Мар-
кова с дискретным временем, а моделями систем, у которых пе-
реходы могут происходить в любой момент времени t 6 [0, +схз),
являются цепи Маркова с непрерывным временем.
6
Глава 1. Цепи Маркова — основные понятия и факты
1.1 Определение цепи Маркова.
Простейшие свойства
Далее множество состояний цепи — фазовое пространство X
— множество целых чисел или его часть.
Определение. Последовательность {£&} целочисленных
случайных величин таких, что
P{£k+i — 4+1 |£о = 4ь£1 = й, = ч} =
= -Pfe+i = 4+ilCfe = 4}	(l-1-1)
для каждого к > 0 и любых $o,$i> •••> ^fc+i из фазового прост-
ранства X будем называть цепью Маркова (марковской цепью).
Предполагается, что все условные вероятности, участвую-
щие в определении марковской цепи, определены.
Равенство (1.1.1) называют марковским свойством.
Так что марковская цепь — это последовательность цело-
численных случайных величин, для которой имеет место мар-
ковское свойство.
Случайную величину будем называть состоянием систе-
мы в момент времени t = к, к = 0,1,..., вероятность Р{£к —
i 6 X, — вероятностью пребывания системы (цепи) в состоя-
нии г, а вероятностное распределение Р{£к = i},i Е X, будем
называть распределением цепи в момент t = к, к = 0,1,...
Переходные вероятности марковской цепи. Условную
вероятность Р{^+1 = j\£k — 0 называют одношаговой переход-
ной вероятностью из состояния i в состояние j и обозначают
Pij(k, к + 1) :
Р{£к+1 = JlCfc = г} = к + !)•
Условную вероятность P{^k+n = j\£k = г} называют п-ша-
говой переходной вероятностью из состояния i в состояние j и
обозначают Pij(k, к + п), т. е.
=	— Pij(k) к + п).
В общем случае переходные вероятности зависят не только от
начального i и конечного j состояний цепи, но и от к (момента
перехода).
Определение. Марковскую цепь будем называть стаци-
онарной, если ее переходные вероятности Рц(к, к + п) не зависят
1.1. Определение цепи Маркова. Простейшие свойства
7
от к. В этом случае переходные вероятности называют стацио-
нарными и обозначают
Pij(k,k + n) = Pij(ri),
Pij(n) еще называют вероятностью перехода цепи из i в j за п
шагов (n-шаговой переходной вероятностью). По определению
Ри(0) = 1, Р^(0) = О,
Одношаговые стационарные переходные вероятности обознача-
ют через Pij, т. е.
P{£k+i — JlCfc — 0 — Pi?-
Вероятность Р^ еще называют вероятностью перехода цепи из
i в j за один шаг.
Далее мы будем рассматривать только стационарные мар-
ковские цепи.
Если = г, £&+1 = j, то мы будем говорить, что цепь за один
шаг переходит из состояния i в состояние j.
Если = г, £&+п = J, то будем говорить, что цепь за п шагов
переходит из состояния i в состояние j.
Матрицы переходных вероятностей. Пусть {£&} — мар-
ковская цепь с фазовым пространством X = {0,1,...}. Мат-
рицу, составленную из элементов Р^-(п), называют матрицей
n-шаговых переходных вероятностей и обозначают
Р(п) = [Рц(п)] =
Роо(п)
Pw(n)
Р(л(п)
Рц(п)
Pinin')
Рц(п)
В частности, если п = 1, то матрицу Р(1) = Р, составленную из
элементов Р?Д1) = P?j, называют матрицей одношаговых пере-
ходных вероятностей и обозначают
" Poo Poi
Рю Рц
Р = [Pij] =
Р?о Р?1
8
Глава 1. Цепи Маркова — основные понятия и факты
Матрица n-шаговых переходных вероятностей (в частности,
матрица одношаговых переходных вероятностей) обладает свой-
ствами:
1° Pij(n) >0, г,j = 0,1,...,
2° 'T'Pijt.n) = 1, i = 0,1,...
3
Свойство 1° очевидно (поскольку Pij(n) являются вероят-
ностями).
Свойство 2° следует из свойства счетной аддитивности ве-
роятности — достаточно заметить, что условная вероятность
Р(-/{£о — 0) относительно события {£о — 0 является веро-
ятностью, а
О =	= fc} П Кп = 1} = 0, к + I.
3
Тогда
1 = р(п| Ro = о) = Е =№> = о = Е р^-
j	j
Свойства 1°,2° обозначают, что каждая строка матрицы
n-шаговых переходных вероятностей является вероятностным
распределением на фазовом пространстве цепи.
Определение. Матрица [Р^], элементы которой удовле-
творяют условиям
Pij > о, ij е х,
Е^ = 1,^Х,
j
называется стохастической.
Следующее утверждение является непосредственным след-
ствием марковского свойства.
Теорема 1.1.1 (уравнение Колмогорова-Чепмена). В мар-
ковской цепи для любых i,j из фазового пространства X и лю-
бых целых положительных целых чисел г, s
Pij(r + s) = Е Pik(r)Pkj(s)	(1.1.2)
kex
или в матричном виде:
Р(г + $) = Р(г)Р($).
1.1. Определение цепи Маркова. Простейшие свойства 9
Доказательство. Очевидно
{£г+$ — 7?£о — 0 — |^{£о —	— j}i
k
причем события в правой части несовместны. Отсюда, учиты-
вая, что для {£п} имеет место марковское свойство, получаем
P{£r+s — Л£о — 0 — P{£r+s —	— &|£о — 0 —
k
Е-^Ч^г+s —	£o — 0 _
к P{^ = i} ~
_ V-^ P{£r+s — j\£>r —	— Q _
~k	m = o	
= £ P{£r+S = j\£r = k}P{£r = fcko = 4 = E Pik^Pkj^-
к	к
Так что
Py(r + s) = ^Pik^Pkj^, i,j e X.
к
Совокупность этих равенств можно записать в матричном виде
так:
Р(г + s) = P(r)P(s).
Из уравнения Колмогорова-Чепмена следует, что по матрице
одношаговых переходных вероятностей всегда можно выписать
матрицу n-шаговых переходных вероятностей.
Следствие 1. Матрица n-шаговых переходных вероятнос-
тей равна п-й степени матрицы одношаговых переходных ве-
роятностей:
Р(п) = (Р)п.
Доказательство. В силу теоремы
Р(г + s) = P(r)P(s).
В частности,
P(n) = РР(п - 1) = Р(РР(п - 2)) = (Р)2Р(п - 2) = ... = (Р)п.
10
Глава 1. Цепи Маркова — основные понятия и факты
Следствие 2. Матрица n-шаговых переходных вероятнос-
тей марковской цепи является стохастической.
Доказательство. Из следствия 1 имеем
Р(п) = (Р)п.
Убедимся, что матрица (Р)п стохастическая.
Достаточно убедиться, что если Р — стохастическая матрица,
то и (Р)2 также стохастическая матрица.
Элементы матрицы (Р)2 имеют вид
PjkPkj ч Ъ-)Э £ X.
к
Отсюда, во-первых, следует, что они неотрицательны, и, во-вторых,
сумма элементов г-строки, i 6 X,
У? (У? PikPkj^ — У2 У2 PikPkj =
j к	к j
—	Рik	Pkj — Pik — 1? X.
к j	к
Следствие 3.
Ру (г + s) > Pik(r)Pkj(s), к е X.
Следствие 4. Для любых i,j 6 X и целых положитель-
ных г, s, t
Pij(r + s + t)= ^2 Pik(r)Pku(s)Puj(t) .
k,uex
или в матричном виде
P(r + s + f) = P(r)P(s)P(f).
Следствие 5.
Pij(r + s + t) > Pik(r)Pku(^)Puj(t), k.ue X.
Примеры марковских цепей. К приведенным примерам
марковских цепей мы будем неоднократно возвращаться.
1.1. Определение цепи Маркова. Простейшие свойства
11
Пример1.1.1 (одномерное случайное блуждание). Частица
движется по целочисленной решетке ..., —2, —1,0,1,2,..., ме-
няя свое положение в целочисленные моменты времени. Обо-
значим через £п, п = 0,1,2,..., положение (координату) части-
цы в момент времени п. За единицу времени (за один шаг)
частица перемещается из точки с координатой i в точку с
координатой (i - 1) с вероятностью Qi, в точку (i + 1) — с ве-
роятностью Pi, либо остается в точке i с вероятностью
(Pi + Qi +	= 1) — будем говорить, что частица принимает
участие в одномерном случайном блуждании по целочисленной
решетке. Последовательность случайных величин {£п} еще на-
зывают одномерным случайным блужданием.
Убедимся, что {£п} образует марковскую цепь и найдем ее
матрицу одношаговых переходных вероятностей.
Покажем, что последовательность {£п} обладает марковским
свойством. Для этого выпишем
Р{Сп+1 — ДСп — Сп—1 — ^п—1> • • • >Со = ^о}> Р{Сп+1 — ДСп — О-
По определению случайного блуждания по одномерной целочис-
ленной решетке,
Р{£п+1 — j\£n =	= in-i, • • • ,£о = М =
А,
П,
если j = i + 1;
если j = i — 1;
если j = i’,
P{£n+1 — j\£n — 0 —
Pi, если j = i + 1;
qi, если j = i — 1;
Vi, если j = i.
(1.1.3)
Так что
P{£n+i — JlCn — i^n-i — in—1> • • • Co — ^0} — P{Cn+i — JlCn — O’
т. e. для последовательности случайных величин {Си} имеет мес-
то марковское свойство и, следовательно, {£п} является марков-
ской цепью.
Равенства (1.1.3) задают элементы матрицы одношаговых
переходных вероятностей Р = [Р^-]. Подробнее:
Р{Сп+1 — + 1 |Сп = 0 = P?,«+i = Рь
P{Cn+l — i ~ 1 |Сп — 0 = Pi,i—l = Qi’>
12
Глава 1. Цепи Маркова — основные понятия и факты
^{Cn+l — ^ICn — 0 — Pi,i — Tiy
где Pi > О, qi > О, Ti > О, Pi + qi + n = 1, i = ..., -1,0,1,...
Если фазовым пространством X марковской цепи является
множество целых неотрицательных чисел, то матрица переход-
ных вероятностей случайного блуждания, очевидно, имеет вид
го ро 0	0
qi ri pi 0
о Q2 Г2 Р2
(1-1-4)
Ясно, что ро + го — 1- Если при этом ро = 1 (а значит го = 0),
то нулевое состояние обладает свойством отражающего экра-
на (в нуле находится упругая стенка). Если р0 = 0, го = 1, то
состояние нуль ведет себя как поглощающий экран — попав в
состояние нуль, частица остается в нем навсегда. Если ро > 0,
го > 0, то состояние нуль — частично отражающий экран.
Если фазовое пространство случайного блуждания ограни-
чено, например, X = {0,1,..., 7И}, то матрица переходных ве-
роятностей имеет вид
	 To	Po	0	0	0	0	0 	
	<11	Г1	Pl	0	0	0	0	
	0	Q2	Г2	P2	0	0	0	
p =								.	(1.1.5)
	6	0	6	6	   QM-1	ГМ-1	PM-1	
	. 0	0	0	0	0	дм	TM .	
Состояния 0 и М могут быть экранами перечисленных выше
типов.
Заметим, что для случайного блуждания {£п} имеет место
представление
&+1 — £>к “Ь & — 0,2,...,
или, что то же,
к+1
&+1 = £о + Vi, к = 0,1,2,...,
г=1
где случайные величины vk независимы и каждая имеет распре-
деление
P{vk = -1} = qk, P{vk = 0} = rk, P{vk = 1} = pk, pk+qk+rk = 1.
1.1. Определение цепи Маркова. Простейшие свойства
13
Пример 1.1.2 (азартная игра). Игрок Gm (с капиталом т)
играет в азартную игру с игроком Gm (с капиталом М), участ-
вуя в серии последовательных партий игры. В результате каж-
дой партии капитал игрока Gm с вероятностью р увеличива-
ется на 1 (за счет игрока Gm) с вероятностью q = 1 — р
уменьшается на 1 (в пользу игрока Gm)- Результат каждой
партии не зависит от результатов предыдущих партий.
Обозначим через капитал игрока Gm после k-й партии,
через п суммарный капитал игроков Gm и Gm - п = т + М. Ес-
ли = 0 или = п, то игра прекращается. Событие {£& = 0}
означает разорение игрока Gm, событие {£& = п} — разорение
игрока Gm-
Покажем, что последовательность {£&} образует марков-
скую цепь, найдем ее матрицу переходных вероятностей.
Решение. Обозначим через Vk результат k-й партии — из-
менение капитала игрока Gm в результате k-й партии, и к — слу-
чайная величина с распределением
P{vk = 1} = р, P{vk = -1} = я,
р > 0, q > 0, p+q = 1, к = 1,2,... Случайные величины Vi,...
независимы.
Очевидно,
&+1 = & + ^+1, к = 0,1,..., £о = т
или, что то же,
Ан-1
tk+1 = to + ^ к = 0,1,2,...; to = т.
г=1
Убедимся, что для последовательности {£&} имеет место мар-
ковское свойство. Для этого выпишем
P{tk+i = j\£k =	= ik-i,-   ,ti = Ч,£о = т),
p{^k+i=jkfc = О-
Имеем:
^{Cfe+1 =	= i,tk-l = ik-l,    , tl = 4, to = m} =
_ P{tk+1 = j,tk = i,tk-l = ik-l, ••• ,£1 = 4,to = m} _
P{tk = i,£k-i = ik-l, • • • >6 = ii,to = m}
14 Глава 1. Цепи Маркова — основные понятия и факты
_ P{£k + ^fc+l = j; Cfe = 4 Cfc-1 = 4-1;    ; Cl = 4, Co = TO} _
P{£k = iAk-l = ik-1,- • • >C1 = 4,Co = m}
= P{i + Vfc+1 = J;Cfc = 4Cfc-l = 4-1;    ,£1 = 4,Co = TO} =
P{£k = iAk-l = ik-1, - • • ; Cl = 4; Co = m}
= P{Vk+l = j - i}P{£k = 4Cfe-l = 4-1   ;C1 = 4; Co =	=
P{£k = iAk-l = ik-1, - • • ; Cl = 4; Co = m}
= P{vk+1 =j-i},
воспользовались независимостью событий
{Ш1 = j -	{£k =	= Ч-ь • • • ,£i = *i,£o = m}-
Аналогично получаем
P{Cfc+i = JlCfc = 0 = P{yk+1 =j-i}
(чтобы сумма £&+1 =	была равна j, при условии, что
£& = г, слагаемое vj^+i должно быть равно j — г).
Поэтому последовательность случайных величин {£&} обла-
дает марковским свойством, и, следовательно, является марков-
ской цепью. Элементы ее матрицы переходных вероятностей
Pij = Р{£к+1 = j\£k = 0 = P{vk+1 = j -
i = 1,2,..., n — 1, j = 0,1,..., n. Если i = 0, to
Ш+1 = 0|Cfc = 0} = i,
если i = n, to
P{£k+1 = n|& = n} = 1.
Цепь стационарная, поскольку переходные вероятности
Pij = P{Vk+l = j - i}
не зависят от к (случайные величины к = 1,2,..., одинаково
распределены).
Подробнее элементы матрицы переходных вероятностей за-
пишутся так
Роо = Р{&+1 = о|& = 0} = 1,
Рпп — Р{&+1 —	— Ц
Р?,?+1 — Р{£&+! — - + 1|£/с — 0 — Рч Ъ' — 1> 2, . . . , П — 1,
1.1. Определение цепи Маркова. Простейшие свойства
15
Рi,i—1 — Р{£/с+1 —	1	— 0 — 0.1	— 1,2,. . . ,П 1,
все неперечисленные P^j равны нулю. Сама матрица переход-
ных вероятностей цепи {£&} имеет вид
р =	’1000...000' q	0	р	0	...	0	0	0 0	q	0	р	...	0	0	0 0	0	0	0	...	q	0	р 0000...001
Заметим, что состояния 0 и п являются поглощающими экрана-
ми.
Если капитал игрока Gm неограничен (М = оо), матрица
переходных вероятностей цепи {£&} имеет вид
(1.1.6)
(состояние 0 является поглощающим экраном).
Марковская цепь, описанная в примере 1.1.2, является част-
ным случаем случайного блуждания (см. пример 1.1.1).
Пример 1.1.3 (сумма независимых случайных величин как
марковская цепь). Пусть £i,£2, • • •	~ независимые неот-
рицательные целочисленные случайные величины, каждая с рас-
пределением
P{^k = l}=Pi, / = 0,1,2,...
Рассмотрим последовательность случайных величин
п
% = п= 1,2,...
fe=l
Покажем, что последовательность {г]п} образует марковскую
цепь и найдем ее матрицу переходных вероятностей.
Решение. Аналогично тому, как мы это делали в примере
1.1.2, получаем
P{rin+i = j\f]n = г, Vn-i = in-i, = г’1} = -P{Cn+i = j - 0,
16 Глава 1. Цепи Маркова — основные понятия и факты
Р{т]п+1 = j\r)n = г} = Р{6г+1 =3 - г}
(чтобы сумма r/k+i = % + £&+1 была равна j при условии, что
т/k = i, слагаемое ^+1 должно быть равно j — г).
Из двух последних равенств следует, что, во-первых, {т)п} —
марковская цепь (для {т)п} выполняется марковское свойство),
а во-вторых, матрица переходных вероятностей {т/п} имеет вид
Р = [-Ру] = [Р{%+1 =	= г}] = [Р{£п+1 = j - г}], г, j = 1,2,..
Подробнее
Р = [Pij] =
РО Pl Р2 РЗ
о Ро Pl Р2
о о Ро Pi
О 0	0	ро
Замечание. Сумма независимых целочисленных случай-
ных величин будет марковской цепью и без предположения об
их неотрицательности.
Задание марковской цепи. Случайная величина £ задает-
ся своим распределением Р^, случайный вектор (£о>£1> • • • >£п) —
совместным распределением P^0,Ci,...,Cn случайных величин
Со>С1> • • • >Сп> бесконечная последовательность случайных вели-
чин 4о>С1> • • • >Сп> • • • (в частности, марковская цепь) задана, ес-
ли для каждого п (п = 0,1,...) известно распределение слу-
чайного вектора (£о>£1> • • • >£п) — известны конечномерные рас-
пределения последовательности £о>£1> • • • >£п> • • • Но оказывает-
ся, чтобы задать марковскую цепь — бесконечную последова-
тельность случайных величин, для которой имеет место мар-
ковское свойство, достаточно задать распределение начального
состояния £о цепи и матрицу [Pjj] одношаговых переходных ве-
роятностей.
Теорема 1.1.2. Марковская цепь задается матрицей одно-
шаговых переходных вероятностей [Pjj] и своим распределени-
ем в начальный момент времени.
Доказательство. Достаточно показать, что для марков-
ской цепи {£п} конечномерные распределения P^0,<i,...,£n вычис-
ляются по ее одношаговым переходным вероятностям Pjj и рас-
пределению {pk} случайной величины £о:
Р{& = k} = Pk, к = 0,1,...
1.1. Определение цепи Маркова. Простейшие свойства
17
Пользуясь марковским свойством, имеем
= -Р{Со = 4,6. = Ч,   • Лп-1 = 4-1, Cn = in} =
= Р{£п = 4|£о = 4,6 = ii,... ,£n-i = 4-1}х
xP{Co = 4,6 = ii, • • • ,£n-i = 4-1} =
= P{£n = 4|6— 1 = in—1}-Р{6 = 4,6 = *1,- • • , Cn—1 = in—1} =
= Pin-^inP^o = 4,6 = 6,  • • ,6-1 = 4-1} = • • 
• •  = PioPioh Piii2 ’ ’ ’ ^in-iin ’
Так что
^1>••• > Ъг) = Pio-Pioii-Piii2 • • • Pin-iin'
Замечание. Поскольку одношаговые переходные вероятнос-
ти
Pij = P{£k+1 = 3\£к = 0 = P{£k+1 = ЗЛк = i}/P{t,k =
то для задания марковской цепи достаточно знать только ее дву-
мерные распределения
Р{^+1 = j,£k = 0’ ^3 = 0,1,2,,
одномерные распределения выражаются через двумерные:
m = o =	=	= s>
S
Определение. При каждом фиксированном си последова-
тельность 4о(^)>С1(<^)> • • • Лк(ш})... будем называть траектори-
ей марковской цепи {£п}-
Соотношение (1-1.7) задает вероятность того, что марков-
ская цепь в моменты времени 0,1,..., п пройдет соответственно
через точки го, zi,..., гп-1, гп.
18
Глава 1. Цепи Маркова — основные понятия и факты
Теорема 1.1.3. Распределение
Pttn = j}, j е х,
марковской цепи {£п} в момент времени t = п задается ее рас-
пределением
Pi = Р{Со = г}, « € X,
в момент времени t = 0 и матрицей п-шаговых переходных
вероятностей:
Р{^п = j} = ^PiPij(n), j е х.	(1.1.8)
iex
Доказательство. Поскольку события {£о = i}, i Е X,
образуют полную группу:
Q = |J {£0 = {Со = к} П {£о = 1} = 0, k / I,
iex
то согласно формуле полной вероятности
Р{$П = j} = £^{^0 = г}Р{Сп = ЛСо = 0 =
iex	iex
Следствие. Из равенства (1.1.8) следует, что предельное
поведение распределения
QnO) = P{Cn=j}, jtX,
марковской цепи при п —> оо определяется предельным поведе-
нием n-шаговых переходных вероятностей цепи (и, возможно,
ее начальным распределением Р{& = i} = pj, i Е X).
Теорема 1.1.4. Каждая стохастическая матрица задает
марковскую цепь, другими словами, для данной стохастиче-
ской матрицы найдется марковская цепь, матрица переход-
ных вероятностей которой совпадает с данной стохастиче-
ской матрицей.
Доказательство. Пусть [Pjj] — стохастическая матрица,
{рЦ — вероятностное распределение на {0,1,2,...}. Определим
на множестве {0,1,2,...} семейство вероятностных распределе-
ний Р(го, 21,..., in) — для каждого п и любых го,i\,..., in поло-
жим
Р(го, 21, ... , 2n) = Pin_1inPin_2in-1 • • • Pi^PioiiPio- (1.1.9)
1.1. Определение цепи Маркова. Простейшие свойства
19
Непосредственной проверкой убеждаемся, что
• • • -^l«2-^0hP«0 = I’
in,in — lr-^O
Последовательность случайных величин £о>£1> • • • определим
так, чтобы её конечномерные распределения, т. е. распределения
векторов (Со>С1> • • • >Сп)> ПРИ каждом п совпадали с распределе-
ниями (1.1.9):
Р{& = *0,6. = й, • • • ,£п-1 = ^п-1Лп = in} =
=	,Сп(^0>	• • • yin) — Pin-iinPin_2in-i • • • PhhPiohPio
(такая последовательность случайных величин £о>£1> • • • всегда
существует).
Убедимся, что последовательность случайных величин £о, С1> • •
обладает марковским свойством. Имеем
^{£п+1 = 3' I Cn = iy^n-i = in-iy • • • ,£i = й,£о = 2о} =
_ P{£n+i = j,t,n = iy^n-i = in-iy • • • ,£1 = 2i,gp = 2p} _
P{£n = iy^n-i = in-1, • • • ,£i = ii,^o =	}
_ PjjPin-liPin-2in-i • • • Pj^PipiiPio _ p
Pin-iiPin-2in-i • • • Piii2pioiiPio
pje a I e n P{£n+1 — ЗЛп — 0
/>(«„« = JI «„=.) = —p{£n=i}— =
52	-Р{£п+1 = j,£n = i,£n-l = in-1, • • • ,C1 = *l,€o = *0}
in-i,in-2,,io	_ * 52
E -P{Cn = i,£n-i = in-1, • • • ,Ci =	= *o}
in-i,in-2,,io
52 RjPin-liPin-zin-i ‘ • • ^iih^ioiiPio
= »n-Mn-2,-,8Q______________________________ =P fl I 10)
E Pin liPi„ 2in 1 • • • PilhPioilPio l3' { ' 3
in-i,in-2,---,io
Так что для последовательности случайных величин {^} имеет
место марковское свойство и, следовательно, {^} является мар-
ковской цепью, причем ее матрица переходных вероятностей
[Жг+1 = 3 Кп = г}]> i,j =0,1,2,...
20
Глава 1. Цепи Маркова — основные понятия и факты
совпадает с данной стохастической матрицей [Р^], т. с.
Р{£n+i = J I Сп = 0 = Fiji j — 0,1,2,...
(см. равенство (1.1.10)).
Итак, стохастическая матрица [Pjj] равенством (1.1.9) всег-
да задаст на множестве {0,1,2,...} семейство распределений, а
вместе с ним и последовательность случайных величин £о> £1> • • •
с конечномерными распределениями (1.1.9). Такой вид конечно-
мерных распределений случайных величин £о>£1> • • • гарантиру-
ет выполнение для них марковского свойства, поэтому последо-
вательность £о>£1> • • • является марковской цепью.
Пример 1.1.4. Марковская цепь с фазовым пространством
X = {1,2,3} описывается матрицей одношаговых переходных
вероятностей
Г 1/2
О
L 1/2
Р =
1/2	0 ‘
1/2 1/2
О 1/2
Найти вероятность того, что:
1° цепь, стартовав из состояния 1, через два шага окажет-
ся в состоянии 3;
2° цепь, стартовав из состояния 2, через три шага ока-
жется в состоянии 3.
Найти распределение цепи в момент t = 2 (через два шага
после старта), если в момент t = 0 цепь с равными вероят-
ностями находится в одном из своих состояний.
Решение. Ясно, что необходимо найти
Р{& = 3|£о = 1} = Р1,з(2). Р{Сз = ЗКо = 2} = Р2,з(3),
или, что то же, элемент Р\^(2) матрицы Р(2) и элемент Р2д(3)
матрицы Р(3). Матрицы Р(2) и Р(3) находим по матрице Р од-
ношаговых переходных вероятностей: Р(2) = (Р)2, Р(3) = (Р)3.
Распределение цепи в момент t = 2 (распределение случай-
ной величины £2) получим по известному начальному распреде-
лению
1	2	3 \
1/3 1/3 1/3 J
цепи и матрице Р(2) двухшаговых переходных вероятностей,
воспользовавшись равенством (1.1.8).
1.2. Возвратность
21
Ответы:
1° Р{& = 3 |Со = 1} = 1/4;
2° Р{£3 = 3 |Со = 2} = 3/8.
Распределение цепи в момент t = 2:
Р{& = 1} = 1/3, Р{& = 2} = 1/3, Р{& = 3} = 1/3.
1.2 Возвратность
Каждое состояние марковской цепи характеризуется време-
нем первого возвращения.
Представим множество Ко — О в виде объединения следую-
щих непересекающихся подмножеств:
Ко = Л £1 = Ко = Л £р 7^ Л ^ = 1,2,...},
Ко = ^Кп = ^Кр / z/= 1,2,..., п — 1}, п = 2,3,...,
Определим случайную величину т = так: на множестве
Ко — ^£1 — 0 она принимает значение 1, на множестве
Ко — Л£п — *,£р /	— 1,2,... ,п — 1} (п > 2) — значе-
ние п, на множестве Ко = ^, £р у — 1,2,...} — значение -4-схэ
(на дополнении к Ко — 0 случайную величину т будем считать
равной 0). Из определения т = т(о>) следует, что
{-г = 1} = {Со = г,С1 = о,
{г = оо} = {£о = i, & / г, ^ = 1,2,...},
{т = п} = Ко = ^, £n = ^, £р / v — 1,2, • • •, п — 1}, п = 2,3,...
Случайная величина т называется временем первого возвра-
щения в состояние i.
Обозначим
fu(n) = Р{т = п|£0 = 4, П = 1,2,...,
значение /«(0) положим равным 0 (по определению). Вероят-
ностное распределение
Р{т = п|£0 = г} = Лг(п), п = 0,1,...,
22
Глава 1. Цепи Маркова — основные понятия и факты
будем называть распределением времени первого возвращения в
состояние i.
По отношению ко времени первого возвращения все состоя-
ния делятся на возвратные и невозвратные.
Определение. Состояние i будем называть возвратным,
если
Р{т < оо|£о = г} = 1
и невозвратным, если
Р{т < оо|£о = г} < 1-
Другими словами, состояние i возвратно, если
Р{т = оо|£0 = г} = О,
и невозвратно, если
Р{т = оо|£о = г} > О-
Вероятность Р{т < оо|£о — 0 называют вероятностью пер-
вого возвращения в состояние i.
Так как
оо
{т<оо}= U{r = n},
п=0
то вероятность первого возвращения можно записать в виде
оо	оо
Р{т < оо|£о = г} = У2 р{т = п1£° = 0 = 52
п=0	п=0
её обычно обозначают через /г*:
оо
/й = 52/й(п)-
п=0
В терминах состояние i возвратно, если
fii = 1
и невозвратно, если
fit < 1-
1.2. Возвратность
23
Среднее время возвращения
Мт = УпЩп)
п=0
у возвратного состояния может быть как конечным, так и бес-
конечным.
У невозвратного состояния среднее время возвращения рав-
но бесконечности.
Производящие функции. Напомним теорему о произве-
дении абсолютно сходящихся степенных рядов.
Теорема 1.2.1. Если степенные ряды
A(s) =	|s| < 1, и B(s) =	|s| < 1,
к=о	1=0
абсолютно сходятся, то абсолютно сходится и ряд
оо
C(S) = ’£cnSn, Н<1,
п=0
где
сп = аоЬп + aibn-i + • • • + апЬ0, = 0,1,2,...,
и имеет место равенство
A(s)B(s) = C(s).	(1.2.1)
Ряд C(s) называется произведением рядов A(s) и B(s).
Определение. Сумму
оо
Л(з) =	И < 1,
к=0
оо
абсолютно сходящегося степенного ряда ак8^ будем называть
к=0
производящей функцией последовательности
В частности,
оо	оо
Pa(s) = ургг(к)зк, |а| < 1, Fa(s) =	|з| < 1,
к=0	к=0
24
Глава 1. Цепи Маркова — основные понятия и факты
— производящие функции соответственно последовательностей
{Рц(к}} и
Производящие функции Рц(з) и Fu(s) определены, т. к. при
И<1
ОО	ОО	1
< D»i‘= тттл.
t=0	4.0	11
ОО	ОО	1
Ei/..ms‘i<£|S|‘ = —у.
k=0	k=0	1	|s|
Нам понадобится следующая лемма Абеля,
оо
Лемм а 1.2.1 (лемма Абеля). 1° Если ряд	ак$к, И < 1? об’-
к=е
оо
солютно сходится в точке s = 1, то существует lim V аьзк
^1-0 к=о
и
оо	оо
Л“о 52 акзк = 52 ак' (L2-2)
fe=0	k=0
оо
2° Пусть > 0, к = 0,1,... Если существует lim aksk
s->l-0fc=0
(конечный или бесконечный), то
Л%5>*? = ^ак-
к=0	к=0
Доказательство. Сначала докажем утверждение 1°.
оо
Из абсолютной сходимости ряда aksk в точке s = 1, оче-
к=0
оо
видно, следует абсолютная сходимость ряда ак§к ПРИ И < 1-
к=о
Для доказательства равенства (1.2.2) оценим разность
оо	оо
^к^	&к
к=0	к=0
в окрестности точки s = 1. Очевидно,
оо	оо
^к^ &к
к=0	к=0
оо
Ем^-i)
k=0
1.2. Возвратность
25
N
^ak(sk - 1)
k=0
ak(sk - 1)
k=N+l
выберем далее).
Сначала оценим сверху
оо
Запишем в терминах остатков Аь =	+	. ряда аГ-
1=0
&к = Лк ~ ^/с+1-
Имеем
оо	оо
£ ak(sk - 1) = £ (Ак — Ak+1)(sk — 1) =
k=N+l	k=N+l
оо	оо
= £ A(sfc-i)- £ Xfc+1(sfe -1) =
k=N+l	k=N+l
оо	оо
= Лу+1(Л+1-1)+ £ Afc(s*-1)- 52 Afe+1(sfc - 1) =
k=N+2	fc=N+l
oo	oo
= Алг+1(Л+1 - 1) + £ Afc(sfc-1)- 52 Afc(sfe-1 - 1) =
k=N+2	k=N+2
oo
= An+1(sn+1 - 1) + 52
k=N+2
oo
Поскольку Ak — остаток сходящегося ряда lad> т0 Для Дан-
1=0
ного e > 0 найдется такое что для всех к > N имеют место
неравенства |А&| < е. Поэтому
оо
X
k=N-^-l
ak(sk - 1)
ОО
< 1АЛГ+11КЛ+1 - 1)1+ 52 |A/j||sfc — sfc-1| <
k=N+2
26
Глава 1. Цепи Маркова — основные понятия и факты
ОО
<£|Л+1-1|+£ lsfe-1Hs-1l<
k=N+2
< 2£ + e|s|N+1|s-	=
1 - И
= 2s + e|s|;v+1(l — s) ——— < 2s + s = 3e.
1 — s
N
Осталось заметить, что	&k(sk ~ 1) —> 0 при s —> 1 (в силу
k=o
N
непрерывности функции ak(sk — 1))-
k=o
Убедимся теперь в справедливости утверждения 2° теоремы,
оо
Пусть > 0, к = 0,1,..., и существует lim ак$к- Рас-
s—>1—О k=Q
смотрим два случая:
оо	оо
a) lim a^sk = +сю, b) lim У^ a^sk < сю.
~ k=o	s-> ” к=0
а)	Из
оо
lim > агзк = +сю
к=о
и неравенства
оо	оо
^к^ — &к
к=0	к=0
оо
(при 0 < s < 1) следует, что ак — +оо, поэтому
к=о
оо	оо
к=0	к=0
Ь)	Пусть
оо
lim У2 ак§к = а < оо.
~ k=0
1.2. Возвратность
27
Переходя в неравенстве
п	оо
Еaksk - Еaksk
k=0	к=0
к пределу сначала при s —> 1 — 0, а потом при п сю, получаем
оо	оо
Еа^ Л^Е а^зк = а < сю.
k=o s-> - к=о
оо
Так что ряд ак абсолютно сходится, и в силу утверждения 1°
к=0
леммы
оо	оо
lim YW = У2ак-
s^-1—О2-—'
к=0	к=0
Лемма доказана.
Необходимые и достаточные условия возвратности
состояния. Далее мы получим условия невозвратности и воз-
вратности состояния i в терминах сходимости и расходимости
ряда ^2 Рц(п).
п
Теорема 1.2.2 (необходимое и достаточное условие возврат-
ности состояния). Для того, чтобы состояние i было возврат-
00
ным, необходимо и достаточно, чтобы ряд Рй(п) расходил-
п=0
ся.
Доказательство. Сначала докажем, что производящие
функции Pu(s), Fa(s) последовательностей {Рц(п)}, {fu(n)} свя-
заны соотношением
1 L V lsl < L t1-2-3)
1 - Fii(s)
Для этого установим, что последовательности {РДп)}, {fu(n)}
связаны соотношением
п
Рц(п) = 52 fii(k)Pii(n -k), п = 1,2,...,	(1-2-4)
k=o
(при п = 0 равенство не имеет места).
28
Глава 1. Цепи Маркова — основные понятия и факты
Представим событие {£п = г,£о — О в виде объединения
непересекающихся событий
Е1 = {£п =	;
Ek =	==	~	£>к ~ ^ч^и ^ч V ~ 1,2,. . . , /и 1},
к = 2,3,..., п (событие Ек состоит в том, что в моменты 0 и п
цепь находится в состоянии г, и первое возвращение в состояние
i происходит на к-м шаге):
п
{£п ~ £о = 0 = |^J Ек-
к=1
Отсюда
Р{^п = г|€о = 0 = Е = 0-	(1-2.5)
к=\
И поскольку
Р{£*|Со = 0 =
_ Р{£п = i,^o = i,^k = i,^¥:'>',y='i-,2,...,k-l} _
Р{&> = О
= P{£n = z|$t = i, Со = i, kv / г, v = 1,2,..., к - 1} х
x-P{Cfc = «,Со = Л Ср И iy v = 1,2,... ,к - 1}/Р{Со = г} =
= р{£п = *ICfe = 0 * * х
xP{Cfc = г,Со = я,Ср И Л = 1,2,-  ,к — 1|Со = г} =
= Рц(п- k)fn(k),
к = 2,3,... ,п, равенство (1.2.5) перепишется так:
Put™) = /гг(к)Рц(п - к),
fe=i
или, учитывая что /й(0) = 0, так:
Рц(п) = ^2 fii(k)Pii(n - к)
k=0
1.2. Возвратность
29
для всех п = 1,2,... (при п = 0 последнее равенство не имеет
места).
Далее, рассмотрим произведение абсолютно сходящихся при
|s| < 1 степенных рядов (см. теорему 1.2.1)
оо	оо
Fii^ = ^fn^k и Рц(з) = ^Рц(Г)81.
к=0	1=0
оо / п	\
Fii^Pii^ = £ £ fu(k)Pa(n -k)\sn =
п=0 \к=0	/
(О	\	оо	/	п	\
52	- м Ь°+Е Е - м Ьп =
к=0	/	п=1	\/с=0	/
оо	оо
= е Pa («х = Е р^$п+p^s° - p^s° =
n=l	n=l
оо
= E^(n)s”-l = P«(s)-l.
n=0
Отсюда и получаем, что
оо
Далее, ряд fa(.n) — fii сходится абсолютно (/^* < 1), по-
п=0
этому в силу леммы Абеля (см. лемму 1.2.1), во-первых, суще-
ствует предел
lim fii(n)sn = lim Рц(з)
7	5^i-o nv 7
n=0
oo
и, во-вторых, этот предел равен fa(n) — fii> T- e-
n=0
Um Д(5) = /*
s—>1—0
30
Глава 1. Цепи Маркова — основные понятия и факты
(для возвратного состояния i значение = 1, для невозврат-
ного /* < 1). Из существования lim Fa(s) = f*. и равенства
s—>1—О
(1.2.3) следует, что при s —> 1 — О существует
lim Pais') = lim Pa(ri)sn,
n=0
(бесконечный, если = 1, и конечный, если < 1), а из леммы
Абеля следует, что
оо	оо
п=0	п=0
Так что если /г* = 1 (г возвратно), то
оо
У2-Ргг(п) = ОО,
п=0
если /г* < 1 (г невозвратно), то
оо
У2-Ргг(п) < °0-
п=0
Следствие. Для того чтобы состояние i было невозврат-
00
но, необходимо и достаточно, чтобы ряд ^2 -Ргг(п) сходился.
п=0
Ненулевые состояния; нулевые состояния, нулевые
возвратные и нулевые невозвратные состояния. Состо-
яние i называется ненулевым, если Рц(п) не стремится к нулю
при п сю.
Ненулевое состояние i всегда возвратно, поскольку для него
оо
ряд -Ргг(п) расходится.
п=0
Состояние i называется нулевым, если при п —> оо
Рд(п) 0.
Нулевое состояние i может быть как возвратным, так и
оо
невозвратным — ряд -Ри(п) с общим членом Рц(п), стремя-
п=0
щимся к нулю, может как сходиться, так и расходиться.
1.3, Существенные состояния. Классы эквивалентности
31
Заметим, что возвратное состояние i может быть как ну-
оо
левым, так и ненулевым — у расходящегося ряда ^и(п) °б-
п=0
щий член Рц(п) может как стремиться к нулю, так и не стре-
миться.
Невозвратное состояние i является нулевым, поскольку для
оо
невозвратного состояния i ряд ^и(п) сходится.
п=0
1.3 Существенные состояния.
Классы эквивалентности
Определение. Будем говорить, что состояние j дости-
жимо из состояния i (обозначение i j), если найдется такое
п > 0, что Pij(n) > 0, другими словами, j достижимо из i, если
из i можно попасть в j (с ненулевой вероятностью).
Поскольку Ри(0) = 1, то г всегда достижимо из i.
Транзитивность свойства достижимости: если j достижимо
из i, а к достижимо из j, то к достижимо из i.
Действительно, из уравнения Колмогорова—Чепмена (след-
ствие 2) имеем
Pik(n + т) > Pij{n)Pjk(m).
И так как г —> 7, а 7 —> fc, то найдутся такие п > 0 и т > 0, что
РгДп) > 0, Pjk(m) > 0, поэтому
Pik(n + т) > Pij(n)Pjk(m) > 0.
Неравенство
Pik(n + m) > 0
обозначает, что к достижимо из г.
Определение. Состояния i и j будем называть сообщаю-
щимися, если i достижимо из j, и j достижимо из г.
Тот факт, что состояния i и j сообщающиеся, будем обозна-
чать так: i j.
Из определения следует, что если состояния i и j не явля-
ются сообщающимися, то либо Рц(п) = 0 для всех п > 0, либо
Pji(m) = 0 для всех т > 0.
Из транзитивности свойства достижимости следует транзи-
тивность свойства сообщаемости: если i j и j к, то ivk.
32
Глава 1. Цепи Маркова — основные понятия и факты
Опр еделение. Состояние i называется существенным, ес-
ли для каждого состояния j, достижимого из i, состояние i дос-
тижимо из j.
Состояние i существенное, если, стартовав из г, в i всегда
можно вернуться.
Определение. Состояние i называется несущественным,
если найдется состояние j, достижимое из i, из которого i не
достижимо.
Состояние i несущественное, если найдется состояние j, в ко-
торое из i можно попасть, но обратно в i вернуться невозможно.
Несущественное состояние i является невозвратным и, как
следствие, нулевым.
В самом деле, если i — несущественное состояние, то най-
дется состояние j, достижимое из г с ненулевой вероятностью р
такое, что состояние i не достижимо из j. Поэтому вероятность
Р{т = +оо|£о — 0 не меньше р и, следовательно,
Р{т < оо|£о = г} < 1,
т. е. i — невозвратное состояние.
Классы эквивалентности. Множество всех состояний мар-
ковской цепи “распадается” на несущественные состояния и су-
щественные, последние, в свою очередь, образуют непересекаю-
щиеся между собой классы существенных сообщающихся состо-
яний.
Теорема 1.3.1. Множество всех существенных состояний
марковской цепи представимо в виде объединения непересекаю-
щиеся классов, каждый из которых состоит из сообщающихся
между собой состояний.
Доказательство. Для каждого существенного состояния i
рассмотрим класс состояний Si, включающий в себя состояние i
и все существенные состояния, с ним сообщающиеся. Так опре-
деленные классы либо не пересекаются, либо совпадают.
Если Si и Sj пересекаются, то они совпадают. В самом деле,
пусть k 6 Si П Sj. Тогда для любого состояния I 6 Si имеем:
l^i^k^j,T. е. l^j. Последнее обозначает, что I е Sj.
И так как I произвольное из класса Si, то Si С Sj. Аналогично
имеем Sj С Si, поэтому Si = Sj.
Определение. Класс всех существенных сообщающихся
между собой состояний марковской цепи называется классом эк-
вивалентности.
Классы эквивалентности мы, как правило, будем обозначать
буквой С, возможно с индексами.
Определение. Марковская цепь, все состояния которой
образуют один класс существенных сообщающихся состояний,
1.3, Существенные состояния. Классы эквивалентности
33
называется неприводимой или неразложимой марковской це-
пью.
Если марковская цепь содержит несущественные состояния
или более одного класса существенных сообщающихся состоя-
ний (или и то, и другое), то ее называют приводимой (разложи-
мой) марковской цепью.
В неприводимой марковской цепи каждое состояние дости-
жимо из каждого.
Если в матрице одношаговых переходных вероятностей вы-
черкнуть строки и столбцы, соответствующие состояниям, не
входящим в данный класс эквивалентности, то полученная мат-
рица будет стохастической.
Марковская цепь, попав в класс эквивалентности, покинуть
его не может.
Марковскую цепь, полученную из данной цепи сужением ее
фазового пространства X до класса эквивалентности С
(С С X), также будем называть классом эквивалентности. Мат-
рица переходных вероятностей этой цепи получается из матри-
цы переходных вероятностей [Рц] данной цепи и имеет вид [Р^],
г, j € С.
Определение. Пусть Мг — множество положительных чи-
сел т, для которых Рц(т) > 0. Наибольший общий делитель
d(i) совокупности Mj будем называть периодом состояния i. Ес-
ли Mj = то по определению полагаем d(i) = 0. Если d(i) = 1,
то состояние i будем называть непериодическим.
Из того, что состояние i периодично с периодом с?, не следует,
что Pu(d) > 0.
Пример. Марковская цепь с фазовым пространством X =
= {1,2,...,7} и матрицей переходных вероятностей
	г0	1	0	0	0	0	0 1
	0	0	1	0	0	0	0
	0	0	0	1/2	1/2	0	0
р =	1	0	0	0	0	0	0
	0	0	0	0	0	1	0
	0	0	0	0	0	0	1
	1	0	0	0	0	0	0 .
имеет период 2, но Рц(2)		=	о,	i = 1,2,...		,7.	
Теорема 1.3.2 (солидарности). В неприводимой марковской
цепи все состояния принадлежат одному типу: 1) если одно
возвратно, то все возвратны; 2) если одно нулевое, то все ну-
левые; 3) если одно периодично с периодом d, то все периодичны
с периодом d.
34
Глава 1. Цепи Маркова — основные понятия и факты
Доказательство. Пусть i и j — различные состояния.
Для любых n, s, m
Рц(п + s + m)> Pij(n)Pjj(s)Pji(m)
(в силу следствия 4 из уравнение Колмогорова-Чепмена). Так
как цепь неприводимая, то найдутся числа пит (зафиксируем
их), такие что
Pij(n) = a > 0, Pji(m) = /3 > О,
поэтому
Рц(п + s + m) > a/3Pjj(s).	(1.3.1)
Аналогично
Pjj(m + г + п)> а/ЗРц(г).	(1.3.2)
Поскольку г и s произвольны, то можно выбрать г так, чтобы
т + г + п = s. Тогда последнее неравенство перепишется так:
Pjj(s) > a/3Pa(s - (n + m)).	(1.3.3)
Из неравенств (1.3.1) и (1.3.3) имеем
af3Pu(s - (n + m)) < Pjj(s) < -^Pa(s +	+ m))-
Отсюда следует, что асимптотические свойства Рц(к) и Pjj(k)
одинаковы: если Рц(к) 0 (состояние i нулевое), то ясно, что и
Pjj(k) 0 (состояние j нулевое); если
^Рц(к) = оо
к
(состояние i возвратное), то и
= °°
к
(состояние j возвратное).
Установим, что с?(г) = d(f) — все состояния имеют один и тот
же период.
В силу неприводимости цепи найдется г такое, что
Рц(г) > О,
1.3, Существенные состояния. Классы эквивалентности
35
и такие пит, что
Pjj(m + г + п) > а/ЗРц(г) > О,
а вместе с ними и
Pjj(m + 2г + п) > ос/ЗРц(2г) > а/ЗРц(г)Рц(г) > О
(см. (1.3.2)), т. е.
Pjj(m + 2г + п) > О и Pjj(m + г + п) > 0.
Из определения периода d(J) состояния j следует, что d(J) —
делитель чисел (т + г + п) и (т + 2г + п), а, следовательно, и
числа (т + 2г + п) — (т + г + п) = г. Так что d(J) — делитель
чисел г > 0, для которых Рц(г) > 0, а с?(г), как период г, —
наибольший общий делитель таких чисел, поэтому d(J) < d(i).
Аналогично с?(г) < c?(j), следовательно с?(г) = d(j).
Тем самым теорема доказана.
Из теоремы солидарности следует корректность таких опре-
делений.
Определение. Неприводимую марковскую цепь будем на-
зывать ненулевой, если хотя бы одно ее состояние ненулевое, ну-
левой, если хотя бы одно ее состояние нулевое, возвратной, если
хотя бы одно ее состояние возвратное, периодической с перио-
дом d, если хотя бы одно ее состояние периодическое с перио-
дом d, и т. д.
Аналогично класс эквивалентности будем называть ненуле-
вым, если хотя бы одно его состояние ненулевое, нулевым, если
хотя бы одно его состояние нулевое, возвратным, если хотя бы
одно его состояние возвратное, и т. д.
Теорема 1.3.3. В нулевом классе эквивалентности для лю-
бых i,j
Pij(m) -> 0
при т -4- +сю.
Доказательство. Действительно
Pjj(n + т) > Pji(n)Pij(m).
(1.3.4)
Поскольку i,j принадлежат одному и тому же классу эквива-
лентности, найдется п, что Pji(n) > 0. Поэтому из неравенства
(1.3.4), учитывая, что Pjj(n + m) 0 при т —> +схз, получаем,
что и Pjj(m) -4- 0 при т -4- +сю.
36
Глава 1. Цепи Маркова — основные понятия и факты
Теорема 1.3.4 (асимптотика нулевой цепи). Неприводимая
нулевая марковская цепь {£п} с фазовым пространством
X = {0,1,2,...} при п +оо сходится по вероятности к +оо :
для любого М > 0 при п сю
Р{£п >м}^1.
Доказательство. Для произвольного фиксированного М
оценим Р{£п < М}, воспользовавшись (1.1.8):
М	М оо
Р{£п < ЛО = Е = 0 = Е =
?=0	?=0 к=0
оо М	КМ	оо М
= ^Рк Pki(jl) = ^Pk Pki(jl) +	Р^(п) <
k=0	?=0	к=0	?=0	к=К+1	?=0
КМ	оо
<Е^Ер^и + Е рк-
к=0 ?=0	к=К+1
Последнее слагаемое можно сделать меньше данного е за счет
выбора К, а первое слагаемое за счет выбора п — в неприводи-
мой нулевой марковской цепи для любых /с, i при п —> +оо
•PfciW -> °-
Тем самым теорема доказана.
Следствие. Невозвратная неприводимая марковская цепь
{£п} с фазовым пространством X = {0,1,2,...} при п +оо
сходится по вероятности к +оо : для любого М > 0 при п оо
Р{£п > М} -> 1.
Доказательство. Невозвратная марковская цепь являет-
ся нулевой.
Замечание. Теорема и следствие имеют место и для мар-
ковской цепи с фазовым пространством X = {...,—1,0,1,2,...}.
Пример 1.3.1. Марковская цепь с фазовым пространством
X = {1,2,3} описывается матрицей одношаговых переходных
вероятностей
’ 0	1	0 '
О 1/2 1/2	.
О 1/2 1/2
1.3, Существенные состояния. Классы эквивалентности
37
Классифицировать состояния цепи (указать существенные,
несущественные, периодические, непериодические состояния).
Решение. Состояние 1 имеет период, равный нулю.
Состояние i заведомо непериодическое, если с ненулевой ве-
роятностью из i можно вернуться в г за один шаг. Поэтому со-
стояния 2 и 3 — непериодические.
Состояние 2 достижимо из состояния 1. Состояние 1 недо-
стижимо ни из 2, ни из 3. Состояние 1 несущественное, состо-
яния 2 и 3 — существенные. Состояния 2 и 3 сообщающиеся, 1 и 2
— несообщающиеся. Цепь приводима, поскольку в ней имеются
несущественные состояния.
Пр им ер 1.3.2. Классифицировать состояния марковской
цепи, описывающей азартную игру, см. пример 1.1.2 (с. 13).
Решение. Если капитал игрока Gm конечен (равен М), то
состояния 0 и п (п = т + М) являются поглощающими экра-
нами; состояния 1,2, ...,п — 1 являются несущественными, а,
следовательно, и невозвратными.
Если капитал игрока Gm бесконечен, то состояние 0 являет-
ся поглощающим экраном; состояния 1,2,..., являются несуще-
ственными и невозвратными.
Пример 1.3.3 (одномерное случайное блуждание, продол-
жение). Рассмотрим одномерное случайное блуждание по це-
лочисленной решетке — марковскую цепь, описывающую дви-
жение частицы, которая за единицу времени перемещается
с вероятностью р на единицу вправо и с вероятностью q на
единицу влево (р + q = 1); состояние цепи — координата
частицы в момент времени п (см. также пример 1.1.1).
Исследовать на возвратность состояния описанной мар-
ковской цепи.
Решение. Поскольку цепь неприводимая, достаточно ис-
следовать на возвратность, например, состояние 0. Необходи-
мым и достаточным условием возвратности состояния 0 являет-
оо
ся расходимость ряда Лю(^)- Исследуем этот ряд на сходи-
п=0
мость. Очевидно, Роо(2п +1) = 0. Поэтому
оо	оо
£РОоИ = Ррр(2п).
п=0	п=0
Выпишем подробнее выражение для Ррр(2п). Вероятность
того, что цепь, стартовав из состояния 0 (Р{£о — 0} — Ро — 1),
38
Глава 1. Цепи Маркова — основные понятия и факты
вернется в состояние 0, пройдя по данному пути
{£о = 0,£1 = Ч, • • • ,£2п-1 = ^2п-1,^2п = 0},
равна
Р{& = 0,£1 = й, • • • ,£гп = О|£о = 0} = poFoiiFhi2 • • • ^2n-i0 —
— ^0?1 Piii2 • • • -^22n-10
(см. (1.1.7)). При этом число перемещений вправо равно числу
перемещений влево. Поэтому в последнем произведении п со-
множителей равно р и п сомножителей — q. Само произведение
Foil• • • Fi2n_i0 равно pnqn. Путь из 0 в 0 длиной 2п опре-
деляется словом длиной 2п, составленным из двух букв: П —
вправо и Л — влево. Число всех таких слов, а вместе с ними и
путей из 0 в 0, равно С^. И, следовательно,
Poo(2n) = C?„pV = ^pV.
Далее, воспользовавшись формулой Стирлинга:
n\ ~ nne nV2irn при п оо,
получим, что при п —> оо
Р00(2п) = ^-pnqn
n\n\
(2n)2ne 2»х/2^	_	_ (4pg)n
(ппе-пу2тт)2	у/кп	у/тгп
т. е.
Poo(2n) ~	(1.3.5)
у/ТГП
Поэтому оба ряда
оо
У2-Роо(2п) и
п=0
сходятся или оба являются расходящимися.
1.3, Существенные состояния. Классы эквивалентности
39
Рассмотрим общий член ' ряда V . Произведе-
V7rn n=o V7ГП
ние pq (0 < р < 1, 0 < q < 1) принимает наибольшее значение,
равное 1/4, при р = q = 1/2, что следует из равенств
pq = р(1 - р) = р - р2, 0 < р < 1.
Поэтому 0 < 4pg < 1, и 4pg = 1 только при р = q = 1/2.
Следовательно, при р = q = 1/2
(4pg)n = 1
у/тт у/тт^
а ряд с таким общим членом расходится.
Если р Q, то 4рд = с < 1. Ряд с общим членом сп/у/тт
(с < 1) является сходящимся.
Итак, при р = q = 1/2 марковская цепь возвратна, а при
р q невозвратна (заключение о возвратности или невозврат-
ности цепи мы делаем по возвратности или невозвратности со-
стояния 0, поскольку цепь неприводимая).
Конечные цепи Маркова. Далее посмотрим, что можно
сказать о состояниях марковской цепи, если цепь конечна — ко-
нечно ее фазовое пространство.
Теорема 1.3.5. Конечная неприводимая цепь Маркова яв-
ляется ненулевой.
Доказательство. Пусть М — число состояний конечной
неприводимой цепи. Стартуя из состояния г, за п шагов цепь с
вероятностью 1 окажется в одном из своих возможных состоя-
ний, поэтому
м
= (L3-6)
J=1
Если предположить, что цепь нулевая, то для любых г, j из фа-
зового пространства
А?(П) О
при п —> оо (см. теорему 1.3.3). Переходя в равенстве (1.3.6) к
пределу при п —> оо, получаем противоречие: 0=1. Так что в
конечной цепи все состояния ненулевые.
Следствие!. Конечная неприводимая марковская цепь воз-
вратна.
Поскольку в конечной неприводимой марковской цепи каж-
дое состояние i ненулевое — Рц(п) при п —> оо не стремится к
40
Глава 1. Цепи Маркова — основные понятия и факты
нулю, то ряд ^Рц(п) расходится, и, следовательно, состояние i
возвратно.
Следствие 2. Невозвратный класс эквивалентности не
может быть конечным.
Теорема. В конечной марковской цепи хотя бы одно сос-
тояние существенное.
Доказательство. Обозначим через X = {1,2,..., М} фа-
зовое пространство конечной марковской цепи. Предположим,
что все состояния цепи несущественные. Пусть в начальный мо-
мент цепь находится в состоянии i\. Так как — несуществен-
ное, то найдется состояние 22, в которое из можно попасть
с ненулевой вероятностью, но вернуться из в невозмож-
но. Состояние 22 также несущественное, поэтому найдется со-
стояние 2з, в которое из 22 можно попасть, но вернуться в 22
невозможно, невозможно из 23 попасть и в 21, так как тогда из
22 можно было бы вернуться в 21 (через 23), что невозможно,
и так далее. За М или меньшее число шагов мы окажемся в
некотором состоянии im (т < М), из которого нельзя попасть
в 21,22, • •2m-i по построению, а в другие (если такие еще оста-
нутся) нельзя попасть, в силу их недостижимости из im. По-
этому цепь с вероятностью 1 остается в состоянии 2Ш, т. е. за
каждый последующий шаг она переходит с вероятностью 1 из
im в im- Последнее обозначает, что im — существенное состояние.
Полученное противоречие и доказывает утверждение.
Возвратные и невозвратные классы. Понятие возврат-
ности состояния введено безотносительно к другим состояниям
цепи. Здесь мы рассмотрим возвратные и невозвратные классы
состояний.
Пусть j i. Введем обозначения
ЛДА:) = Р{Со = г, 4 =	± j, и = 1,2,... ,k - 1|Со = г},
к = 2,3,..., для к = 0 и 1 положим
/о(0) = О, ЛД1) = Р{£о = г,6 = Жо = г};
fij(k) — вероятность первого достижения состояния j из состо-
яния 2 на к-м шаге.
Обозначим вероятность достижения j из i (j 2) через /*-,
ясно, что
оо
к=0
1.3, Существенные состояния. Классы эквивалентности 41
Мы часто будем пользоваться приведенными далее соотно-
шениями между и , когда г, j принадлежат данному классу
эквивалентности.
Уравнения для f*j и для Для гД из одного класса
эквивалентности при каждом п (п = 1,2,...)
^ = Ру(п)+ £ PMfkj.	(1.3.7)
kex\{j}
Для состояний i из данного класса эквивалентности при
каждом п (п = 1,2,...)
/^ = рй(п)+ £ Pik(n)f*ki.	(1.3.8)
kex\{i}
Далее через Pij(s) будем обозначать производящую функ-
цию последовательности {Р^(п)}:
оо
p0(s) = £p0(fc)s\ и < I,
k=Q
а через Fij(s) — производящую функцию последовательности
ОО
Рг^ = ^Ык)8к, |в|<1.
к=0
Аналогично тому, как было получено соотношение (1.2.4),
получаем
Pij(n) = 52 fij^P3i(n п- °> 3 И i- (1-3.9)
k=0
Из теоремы о произведении степенных рядов (теорема 1.2.1)
и равенства (1.3.9), аналогично тому как было получено соотно-
шение (1.2.3) между производящими функциями Рц(з) и Fu(s),
получаем
Pij(s) — Fij(s)Pjj(s)) Н < 1.
(1.3.10)
42
Глава 1. Цепи Маркова — основные понятия и факты
Теорема 1.3.6 (необходимые и достаточные условия невоз-
вратности состояния в классе). Пусть i,j принадлежат одному
классу эквивалентности. Для того, чтобы состояние j было
оо
невозвратным, необходимо и достаточно, чтобы ряд	Pij (п)
п=0
сходился.
оо
Доказательство. Поскольку /*• =	< 1, то в
д=о
силу леммы Абеля всегда существует lim^F^(s) и
оо
JiniQFy(s) =
S	k=Q
оо
Если j — невозвратное состояние, то ряд Pjj^J1) сходится,
п=0
и в силу леммы Абеля
оо
п=0
Поэтому при <s —> 1 — О существует конечный предел правой
части равенства
Pij(s) = Pij(s)Pjj(s) ,
а, следовательно, и левой, и в силу леммы Абеля
оо
п=0
оо
Так что если j невозвратно, ряд Рц(п) сходится.
п=0
оо
Установим, что из сходимости ряда Piji™) следует невоз-
п=0
вратность состояния j.
Из равенства (1.3.10) имеем
Pjj(s) — Pij^/Fij^.
(1.3.11)
1.3, Существенные состояния. Классы эквивалентности 43
Из сходимости рядов Ргз(п) и 12 fij(k) следует существо-
n=0	к=0
вание конечных пределов lim Рц(з) и lim Рц(з) (см. лем-
$->1-0 J $—>1—0 J
му Абеля), а вместе с ними существование конечного предела
lim Pjj(s) (см. равенство (1.3.11)). Поэтому в силу леммы Абе-
оо
ля ряд	сходится, а, следовательно, состояние j невоз-
п=0
вратно.
Следствие 1. Пусть i, j принадлежат одному классу эк-
вивалентности. Для того, чтобы состояние j было возврат-
но
ным, необходимо и достаточно, чтобы ряд	расходил-
п=0
ся.
Следствие 2. Для любых i,j из невозвратного класса эк-
вивалентности При П СЮ
О-
оо
Коль скоро состояние j невозвратное, то ряд Fiji™) схо-
п=0
дится и, следовательно, Pij(n) 0.
Теорема 1.3.7 (/^ в невозвратном классе). В невозврат-
ной неприводимой марковской цепи для каждого i из фазового
пространства X найдется состояние j Е X, j i такое, что
f* < 1
Доказательство. Из равенства (1.3.8) при п = 1 имеем
fii = Pa+ Е Pikf*ki.
kex\{i}
Если предположить, что в невозвратной цепи = 1 для всех
к 6 X \ {г}, то последнее равенство можно переписать так:
fu = Pu+ Е р*
kex\{i}
или так:
/й = Ер^-
кех
Отсюда имеем
44
Глава 1. Цепи Маркова — основные понятия и факты
fii = 1,
что противоречит невозвратности цепи.
Следствие. Если в неприводимой марковской цепи най-
дется состояние i такое, что для любого j / i значение
f*i = 1, то цепь возвратна.
Доказательство. В невозвратной цепи для каждого i
найдется j, такое, что < 1.
Теорема 1.3.8 (/^ в возвратном классе). В возвратной не-
приводимой марковской цепи для каждой пары j,i из фазового
пространства X значения
f*. = 1
Доказательство. Для каждого п (п = 1,2,...)
& = Рц(п) + £ PMfki
kex\{i}
(см. равенство (1.3.8)), а поскольку цепь возвратна, т. е. = 1,
то для каждого п (п = 1,2,...)
Рц(п) + 52 Pik(n)fki = l.	(1.3.12)
kex\{i}
С другой стороны, для каждого п (п = 1,2,...)
Рц(п)+ 52 Pik(n) = l.	(1.3.13)
kex\{i}
Вычитая последовательно из равенства (1.3.13) равенство (1.3.12)
получим
52 Pffc(n)(l - fki) = 0.	(1.3.14)
kex\{i}
для всех п = 1,2,... Если предположить, что найдется пара j, i
U 7^ я), у которой < 1, то из равенства (1.3.14) следует, что
для всех п = 1,2,... значения Ptj(ri) должны быть равны нулю.
Но цепь неприводима, поэтому найдется хотя бы одно п, для
которого Pij(n) > 0. Полученное противоречие и доказывает
теорему.
1.3, Существенные состояния. Классы эквивалентности
45
Так что в возвратном классе эквивалентности для любых j, i
значение f* = 1.
Следствие. Если в классе эквивалентности найдется па-
ра состояний i,j таких, что f*j < 1, то класс является невоз-
вратным.
В самом деле, в возвратном классе /* = 1 для любых i,j.
Теорема (о вероятности посещения состояния). Марков-
ская цепь с вероятностью 1 посещает возвратное состояние
бесконечно много раз, а невозвратное с вероятностью 1 посе-
щает конечное число раз.
Доказательство. Введем обозначения
= {цепь посещает состояние i бесконечно много раз},
= {цепь посещает состояние i не менее N раз}.
Ясно, что
<«> С Л™,
ОО
Л-, = П
4 4	|| 4 4 '
N=1
в справедливости равенства убеждаемся непосредственной про-
веркой.
Вычислим P(A*J£o — 0- Воспользуемся свойством непре-
рывности вероятности:
Р(Л*^о = 0 = limP(4JV)|eo = г).
Обозначим
Q(y =	Ко = *)•
Очевидно,
QT =	N = 2,3,...
Отсюда
Qu =(fii)N, tv = 2,3,...
leo = i) = UmQW = lim(/*r
46
Глава 1. Цепи Маркова — основные понятия и факты
Поэтому если состояние i возвратно, т. е. = 1, то
= 0 = 1,
а если состояние i невозвратно, т. е. < 1, то
Р(^Ко = г) = 0.
Тем самым теорема доказана.
Резюме. Состояния марковской цепи делятся на несуще-
ственные и существенные.
Множество существенных состояний распадается на непе-
ресекающиеся классы существенных сообщающихся между со-
бой состояний — классы эквивалентности.
Каждый класс эквивалентности является нулевым или
ненулевым.
Нулевой класс эквивалентности может быть как возврат-
ным, так и невозвратным.
Периодические цепи. Пусть {£&} — марковская цепь. Для
данного фиксированного целого t > 0 определим последователь-
ность случайных величин {£&}:
Ck = £kt, к = 0,1,2,...
Последовательность {£&} образует марковскую цепь — для {£&}
выполняется марковское свойство.
Пусть Р = [Pij] — матрица переходных вероятностей марков-
ской цепи {£&}:
— -Р{£а;+1 — jI'Oc =
a Q = [Qij] — матрица переходных вероятностей марковской
цепи {CJ:
Qij = -^{Cfc+l = 31Ск =
Из определения цепи {£&} имеем
Qij = -^{C/c+l — j\Ck — 0 — P{£(k+l)t = JlCfct = i} =
= P{£kt+t — JlCfct = i} =
t. e.
Qij = Pijti), i,3
1.3, Существенные состояния. Классы эквивалентности
47
или в матричной форме
Q = P(f) = (Р/.
Для любого целого s > О
= -^{Gh-s = j\Ck — 0 —	= i} =
= P{£kt+st = JlCfct = /} = P^st),
т. e.
Qij(s) = Pij(st), i,j € X,	(1.3.15)
или в матричной форме
Q(s) = P(sf).
Марковскую цепь с матрицей переходных вероятностей Р бу-
дем называть Р-цепью.
Из определения Р-цепи {£&}, Q-цепи {£&} и равенства
=	X,
следует, что состояние j достижимо из i в Q-цепи за s шагов
тогда и только тогда, когда в P-цепи j достижимо из i за st
шагов.
Теорема 1.3.9 (о структуре периодической марковской це-
пи). 1° В неприводимой периодической с периодом t марковской
P-цепи фазовое пространство G представимо в виде объеди-
нения t непересекающихся классов G$,G\,... ,Gt-\, P-цепь за
один шаг из класса Gy переходит в класс Gy+\ (и = 0,1,...
... Д - 2), из класса Gt-\ в класс Go; за st (s = 1,2,...) шагов
P-цепь из класса Gy переходит в класс Gy.
2° В Q-цепи (Q = P(t)) каждый из классов Go,Gi,... ,Gt-i
является непериодическим классом эквивалентности.
3° Если P-цепь возвратна, то каждый из классов эквива-
лентности Go, Gi,..., Gt-i в Q-цепи является возвратным.
Доказательство. Сначала докажем, что для периодиче-
ской с периодом t марковской цепи имеет место следующее свой-
ство:
Лемма. Если состояние i достижимо из состояния j за
и за П2 шагов (P^(ni) > 0, P^(ri2) > 0), то ni и П2 предста-
вимы в виде
48
Глава 1. Цепи Маркова — основные понятия и факты
П1 = V + Sit, П2 = v + S2t, 0 < и < t — 1,	(1.3.16)
причем и определяется единственным образом.
Из следствия 2 теоремы 1.1.1 (уравнение Колмогорова-Чеп-
мена) имеем
Pjj(ni + т) > Р^(щ)Р^(т),
Pjj(n2 + m) > Pji(n2)Pij(m).
Из неприводимости цепи следует существование хотя бы одно-
го т, для которого Р^-(т) > 0, далее т минимальное из таких
чисел (оно единственно). Поэтому
Pjj (rii + т) > О,
Pjj(n2 + m) > 0.
Отсюда, поскольку цепь периодична с периодом t, следуют пред-
ставления
ni + т = s'it,
п2 + т = s2t,
или
ni = s'it — т,
П2 = s2t — т.
или
ni = (s'it — st) + (st — т) = sit + z/,
П2 = (s2t — st) + (st — m) = S2t + z/,
где v = st — m. Выбрав s так, чтобы и лежало между 0 и t — 1 (та-
кое и определяется единственным образом), получим требуемое
представление.
Тем самым лемма доказана.
Представление
п = v + st, 0 < I/ < t — 1,
для числа п шагов, за которое в периодической с периодом t
цепи состояние i достижимо из состояния j, дает возможность
разбить фазовое пространство G марковской цепи на t непересе-
кающихся классов следующим образом. Поскольку цепь непри-
водима, то каждое состояние достижимо из состояния 1, причем
в силу леммы только за число шагов вида
п = v + st, 0 < 1у < t — 1.
1.3, Существенные состояния. Классы эквивалентности
49
Отнесем в класс Go все состояния марковской цепи, достижимые
из состояния 1 за
п = 0 + st
шагов. В класс Gi отнесем все состояния, достижимые из 1 за
п = 1 + st
шагов, и т. д., в класс Gy отнесем все состояния, достижимые
из 1 за
п = у + st
шагов (0 < у < t — 1).А поскольку у в представлении п = у + st
единственно, то классы Gy, у = 0,1,..., t — 1, не пересекаются.
Далее, пусть цепь находится в состоянии i из класса Gy
(у = 0,1,... , t — 2), т. е. состояние i достижимо из состояния 1
за st + у шагов. За один шаг из состояния г класса Gy цепь пе-
рейдет в некоторое состояние j. Состояние j достижимо из 1 за
(s£ + z/) + l = s£ + (i/+l) шагов, поэтому j принадлежит классу
6^+1. Таким образом, P-цепь из класса Gy за один шаг перехо-
дит в класс G^i, а из класса Gt-i за один шаг цепь переходит
в класс Go-
Пусть i 6 Gy, т. е. i достижимо из состояния 1 за y+s't шагов,
и пусть сделано st шагов, при этом цепь оказалась в некотором
состоянии 7, которое достижимо из состояния 1 за у + s't + st =
= у + (s' + s)t шагов. Поэтому j 6 Gy. Так что за st шагов цепь
переходит из класса Gy в класс Gy.
Убедимся, что в Q-цепи каждый из классов Gy является
классом эквивалентности.
В самом деле, все состояния из класса Gy сообщаются в
P-цепи, причем только за число шагов вида st, т. е. для дан-
ных г, j найдутся числа и S2, что Pjj(sit) > 0, Pjj(s2t) > О
или, что то же Qij(si) > 0, Qji(s2) > 0. Два последних нера-
венства обозначают, что каждые два состояния i,j из класса Gy
сообщаются в Q-цепи.
Далее, в Q-цепи состояния из класса Gy сообщаются только
с состояниями из Gy. Действительно, пусть i е Gy и i j,
т. е. существует такое s, что Qij(s) > 0, а, следовательно, и
Pij(st) > 0. Но из состояния i е Gy в P-цепи за st шагов можно
попасть только в состояние из класса Gy, поэтому j е Gy.
Убедимся, что класс эквивалентности Gy в Q-цепи неперио-
дический. Предположим обратное. И пусть j е Gy и н. о. д. тех
чисел и, для которых Qjj(u) > 0 равен d > 1, т. е. числа и имеют
вид и = vd. Переход из j в j в P-цепи возможен только за число
шагов вида ut, при этом
0 < Qjj(u) = Qjj(vd) = Pjj((vd)t) = Pjj(v(dt)).
50
Глава 1. Цепи Маркова — основные понятия и факты
Отсюда следует, что период состояния j в P-цепи не менее dt,
причем dt > t. Но период P-цепи равен t. Это противоречие и
доказывает, что Q-цепь является непериодической.
Осталось проверить, что если P-цепь возвратна, то каждый
из классов Gy в Q-цепи возвратен. Пусть i 6 Gy. Состояние i воз-
вратно в P-цепи, что равносильно расходимости ряда ^Рц(п).
Но в P-цепи из состояния i класса Gy в состояние i можно вер-
нуться только за st шагов, поэтому
^Piiin) = 'Y^Pu(st') = y^Q tils')
n	s	s
(воспользовались (1.3.15)). Так что ряд Qu(s) является расхо-
s
дящимся и, следовательно, i — возвратное состояние в Q-цепи.
Теорема доказана.
Замечание Если в периодической с периодом t марков-
ской цепи состояние i достижимо из j 6 Gf за п шагов, то
п = у + st, 0 < у < t — 1,
при этом за первые у шагов цепь, последовательно переходя
из класса в класс, перейдет в класс Gf+y, а затем за каждые
последующие t шагов будет переходить из класса Gf+y в класс
Gf+y, пока не окажется в состоянии i.
Пример 1.3.4 (Q-цепь для случайного блуждания). Рас-
смотрим одномерное случайное блуждание по целочисленной
решетке с вероятностью р перехода на единицу вправо и с ве-
роятностью q перехода на единицу влево (р + д=1, 0<р<1),
см. также пример 1.1.1. P-цепь неприводима и имеет период 2.
А потому матрица переходных вероятностей (Q-цепи
Q = (Р)2.
Фазовое пространство Z представимо в виде объединение
двух непересекающихся классов Go и G\, а именно
Go = {..., -2п,..., -2,0,2,..., 2п,...},
Gi = {..., -(2n + 1),..., -3, -1,1,3,..., 2п + 1,...}.
При этом мы за один шаг в P-цепи переходим из класса Go в
класс Gi, а из Gi в Go. В Q-цепи Go и Gi являются неперио-
дическими классами эквивалентности.
1.3, Существенные состояния. Классы эквивалентности
51
Пример 1.3.5. Марковская цепь с фазовым пространством
{1,2,3,4} задана матрицей одношаговых переходных вероятнос-
тей
"О 01/2 1/2 '
р_	о	0	1	О
1	О	О	О	•
1/2	1/2	О	О
Классифицировать состояния марковской цепи. Убедиться,
что цепь периодична. Пусть t — период цепи, представить
фазовое пространство в виде:
G = Go U Gi U ... U Gt—\.
В Q-цепи (Q = P(t)) найти матрицу переходных вероятностей
для классов эквивалентности Go,Gi, • • • , G*-i. Классифициро-
вать состояния в классах эквивалентности Gy, и = 0,1,...
...,t- 1.
Решение. Цепь неприводимая.
Из состояния 1 в состояние 1 можно попасть только за четное
число шагов: 2,4,6,... Поэтому состояние 1, а вместе с ним и
цепь, периодична с периодом 2.
Фазовое пространство G (согласно теореме 1.3.9) представи-
мо в виде
G = G0UGi = {1,2} U {3,4}.
Класс Go образуют состояния, в которые из состояния 1 можно
попасть 3ast + 0 = s- 2 + 0 шагов, такими состояниями являют-
ся {1,2}. Класс Gi образуют состояния, в которые из 1 можно
попасть 3ast+l = s- 2+ l шаг, такими состояниями являются
{3,4}-
Каждый из классов Gq и Gi в Q = Р(2)-цепи является неперио
дическим возвратным классом эквивалентности.
Матрица переходных вероятностей Q-цепи
Q = Р(2) = (Р)2 =
0
0
1
1/2
0
0
о
1/2
1/2 1/2 I Г 0
1	0	0
0	0	1
’ 3/4	1/4	0
1	о	о
0	0	1/2
0	0	3/4
0	1/2	1/2
0	1	о
ООО
1/2	0	0
0 '
0
1/2 •
1/4 J
52
Глава 1. Цепи Маркова — основные понятия и факты
Матрица переходных вероятностей <Qo класса эквивалентнос-
ти Gq:
3/4 1/4
1 О
Матрица переходных вероятностей <Q*i класса эквивалентнос-
ти Gp.
’ 1/2 1/2 ‘
3/4 1/4 ’
1.4 Примеры и задачи
Примеры
Пример 1.4.1. Матрица переходных вероятностей марков-
ской цепи с фазовым пространством X = {1,2,3} имеет вид
Р =
’ 0,1 0,5 0,4 ‘
0,6 0,2 0,2
0,3 0,4 0,3
Распределение цепи (по состояниям) в момент t = 0, другими
словами, распределение случайной величины имеет вид
/ 1 о 3 \
( 0,7 0,2 0,1 )•
Найти:
1° распределение цепи в момент t = 2;
2° вероятность того, что в моменты t = 0, 1, 2, 3 цепь бу-
дет находиться соответственно в состояниях 1, 3, 3, 2, т. е.
найти Р{£о = 1, £i = 3, £2 = 3, £з = 2}.
Решение.
1° Воспользуемся равенством (1.1.8) при п = 2, X = {1,2,3}:
з
P{^=j} = ^PiPij^, / = 1,2,3.
i=l
2° В силу теоремы 1.1.2 (см. (1.1.7)) искомая вероятность
выражается через начальное распределение цепи и одношаговые
переходные вероятности:
Р{£о = 1, £1 = з, & = 3, 6 = 2} =
= Р{£0 = 1}Р1зРззРз2 = 0,0336.
1.4. Примеры и задачи
53
Пример 1.4.2. Марковская цепь с фазовым пространством
X = {1,2,3,4,5} задается матрицей одношаговых переходных
вероятностей
p = [Pij] =	Г 0	1/3	1/3 1/3	0	0 0	0	1/2 0	0	1/2 .000	0 1/3 1/2 1/2 0	1/3 ] 1/3 0 0 1 J
Классифицировать состояния цепи.			
Решение. Состояния 1 и 2 — несущественные, так как из 1 и
из 2 можно с ненулевой вероятностью попасть в 5, но вернуться
из состояния 5 невозможно (цепь приводима).
Состояния 3 и 4 — существенные, 5 — существенное.
Состояния 3 и 4 образуют класс эквивалентности (конеч-
ный), поэтому состояния 3 и 4 ненулевые и возвратные (см. тео-
рему 1.3.5).
Состояние 5 образует класс эквивалентности, 5 ненулевое,
возвратное состояние.
Состояния 3,4,5 — непериодические.
Пример 1.4.3. Симметричную игральную кость подбрасы-
вают независимым образом неограниченное число раз. Пусть
— число выпавших очков при к-м подбрасывании кости, к =
= 1,2,... Рассмотрим последовательность случайных величин
Т)п = max{£i,£2,---,&i}, п= 1,2,...
Показать, что последовательность {г?п} образует марковскую
цепь, найти ее матрицу переходных вероятностей, классифи-
цировать состояния цепи.
Решение. Заметив, что
T]n+1 = max{£i,£2, • • • ,Сп,Сп+1} = max{r?n,£n+i},
получим
P{Vn+i =j\nn = г,бп-1 =	= Й} =
= -Pfa+1 = j,^?n	=n} =
P{rin =	= in-i,... ,771 =zi}
_ P{max{^n+i = j,r)n = j,	= tn-i,..., тд = ?i} _
Р{Пп =i,r]n-i	=ii}
54
Глава 1. Цепи Маркова — основные понятия и факты
_ -P{max{gn+i,z} = j,pn = i,T]n-i = in-i, = zj _
P{fln =	-,rn= Z1}
= P{max{£n+1,z} = j}P{r/n = г,рп-1 = zn t... ,771 = zi} =
P{z?n = z,z/n-i =	. .,m= 71}
= P{max{£n+1, z} = j}.
Воспользовались независимостью событий
{max{Cn+i,z} = j}, {т)п = i,... ,тц = zj.
Аналогично получаем
P{rh+1 = j\rin = z} = P{max{£n+1, z} = j}-
Откуда и следует, что для последовательности случайных ве-
личин {рп} имеет место марковское свойство и, следовательно,
последовательность {т/п} является марковской цепью, причем
стационарной.
Матрица одношаговых переходных вероятностей цепи
Pij = Р{т]п+1 = j\r]n = г} = -P{max{£n+i,z} = /}, z,j = 1,2,...6,
подробнее
	Г 1/6	1/6	1/6	1/6	1/6	1/61
	0	2/6	1/6	1/6	1/6	1/6
II II	0	0	3/6	1/6	1/6	1/6
	0	0	0	4/6	1/6	1/6
	0	0	0	0	5/6	1/6
	0	0	0	0	0	1 J
Состояния 1,2,..., 5 несущественные. Состояние 6 существен-
ное, оно образует класс эквивалентности и является возврат-
ным, непериодическим.
Пример 1.4.4. Монету, вероятность выпадения герба ко-
торой равна р (0 < р < 1), подбрасывают независимым образом
неограниченное число раз. Пусть ~ число выпавших гербов
при k-м подбрасывании монеты, к = 1,2,... Рассмотрим по-
следовательность случайных величин
Z?n+1 = (z?n + 1)/{1}(Сп+1), % = о, п = 0,1,2,...
Показать, что последовательность {??„} образует марковскую
цепь, найти ее матрицу переходных вероятностей, классифи-
цировать состояния цепи.
1.4. Примеры и задачи
55
Решение. В том, что последовательность образует марков-
скую цепь, убеждаемся аналогично тому, как это делалось в при-
мере 1.4.3.
Элементы матрицы одношаговых переходных вероятностей
цепи
г, f -| q P{fln+1 = j, Т)п = О
P(,„+1=*„=.} = —5— =
= Р{(т)п + l)J{i}(gn+i) = j,rin = г} =
Р{т1п = г}
_ Р{(г + l)J{i}(gn+i) = j,r)n = г} _
Р{т1п = г}
= Р{(.г + 1)/{1}(Сп+1) = э}Р{т)п = г} =
Р{т>п = 0
= Р{(г + 1)/{1}($п+1) = j},
Pij = P{(i + 1)-^{1}(£п+1) =	€ X.
Матрица переходных вероятностей цепи
q р О О О
q 0 р О О
q 0 0 р О
Цепь неприводима, непериодична.
Убедимся, что цепь возвратна. Для этого проверим, что со-
стояния 0 возвратно (см. теорему солидарности). Достаточным
условием возвратности состояния 0 является расходимость ряда
оо
У>о,о(п)
П=1
(см. терему 1.2.2).
Непосредственной проверкой последовательно получаем, что
Fo,o(l) = <7, Род(2) = <7, Род(3) = <7,..., Род(п) = q,...
56
Глава 1. Цепи Маркова — основные понятия и факты
— для того чтобы найти Ро,о(^ + 1) достаточно знать только
первый столбец матрицы Р(п), поскольку
P(n+ 1) = РР(п), п = 1,2,...,
а первый столбец матрицы Р(п) имеет вид
(q Ч Ч <1 •••)'•
Поэтому
оо	оо
52n,ow = 52 = с».
П=1	П=1
Другое доказательство возвратности состояния 0:
оо
Р{т < <х>\т)0 = 0} = 52 р{т = «Ь» = 0}
П=1
= Р(Р) + Р(ГР) + Р(ГГР) + ... =
= q+pq + p2q + ... =	+ р + р2 + ...) =	= 1
1 -Р
(буква Г обозначает выпадение герба, буква Р — выпадение ре-
шетки) .
Замечание. Марковская цепь {т/п} описывает длину серии
успехов в последовательности независимых испытаний с вероят-
ностью успеха р в одном испытании. Каждая новая серия начи-
нается после неудачи.
Пример 1.4.5 (случайное блуждание по двумерной решет-
ке). Рассмотрим симметричное случайное блуждание по дву-
мерной целочисленной решетке: вероятности смещения на еди-
ницу вправо, влево, вверх, вниз равны по 1/4. Исследовать на
возвратность состояние 0(0; 0) — начало координат.
Решение. Возвращение из 0(0;0) в 0(0;0) обеспечивают
траектории (пути), состоящие из i перемещений влево, i переме-
щений вправо, j перемещений вверх, j перемещений вниз (всего
перемещений 2г + 2j = 2п). Каждая такая траектория опреде-
ляется словом длиной 2п, составленным из i букв П (вправо),
i букв Л (влево), j букв В (вверх), j букв Н (вниз).
Вероятность частице пройти из 0(0; 0) в 0(0; 0) по данной
траектории длиной 2п равна (1/4)2п, по траектории длиной 2п,
1.4. Примеры и задачи
57
состоящей из i перемещений влево, i перемещений вправо, j пе-
ремещений вверх, j перемещений вниз равна

(2п)! /1\2”
коэффициент при (1/4)2" равен числу слов длиной 2п, состав-
ленных из букв П, Л, В, Н соответственно в количестве г, г, j, j.
А вероятность Роо(2п) возвращения из 0(0; 0) в 0(0; 0) равна
Р00(2п) =
(2п)!
(i,iJJ):2i+2j=2n
/1\2п ул (2п)!п!п!
_ /1\2п (2п)! ул п!п!
\4/ п\п\	ihljlj!
(W,j)'-i+j=n
/ -] \ 2п п	/ \ 2п
___ / 1 I z^n \	__ I 1 । гуп гуп
“ y4y	~ \4/ C2nC2n’
воспользовались тождеством
n
Era s~ii ______ s^n
— ^2n
i=0
Используя формулу Стирлинга (см. пример 1.3.3), получим
Ряд с общим членом 1 /(тгп) расходится, поэтому состояние 0(0; 0),
а вместе с ним и марковская цепь возвратная.
Установим использованное в доказательстве тождество
п
Es'iks'ik __ гуп
— ^2п-
к=0
58
Глава 1. Цепи Маркова — основные понятия и факты
Число кратчайших путей из точки 0(0; 0) в точку А(п;п)
равно Каждый такой путь проходит через одну и толь-
ко одну из точек АЦк;п — к), 0 < к < п (точки А^ лежат
на отрезке, соединяющем точки (0;п) и (п;0)). Число путей из
точки 0(0;0) в точку АЦк\п — к) равно С^+(п_^ = С^, поэто-
му число путей из точки 0(0; 0) в точку А(п;п), проходящих
через АЦк\п — к) равно (в силу правила умножения).
Сложив количество путей, проходящих через каждую из точек
АЦк,п — к), к = 0,1,...,п, получим общее количество путей из
0(0; 0) в точку А(п;п), т. е. (%(%. Тем самым тождество
к=о
доказано.
Замечание. Отметим, что в отличие от симметричного
случайного блуждания по одномерной целочисленной решетке и
по двумерной, симметричное случайное блуждание по трехмер-
ной целочисленной решетке является невозвратным. На нефор-
мальном языке это означает, что человек, злоупотребляющий
спиртным, случайно блуждая по городу с вероятностью 1 всегда
вернется домой, а вот хлебнувший лишнего воробей, возвраща-
ясь домой (все еще в трехмерном пространстве — не пешком)
рискует домой не вернуться.
Задачи
Задача 1.1. Марковская цепь с фазовым пространством
X = {1,2,3} описывается матрицей одношаговых переходных
вероятностей
’ 1/3 2/3
О 1/3
1/3 о
о
2/3
2/3
Найти вероятность того, что:
1° цепь, стартовав из состояния 2, через два шага окажется
в состоянии 1;
2° цепь, стартовав из состояния 3, через три шага вернется
в состояние 3.
Найти распределение цепи через три шага после старта
(в момент t = 3), если начальным распределением цепи (рас-
пределением в момент t = 0) является
12	3
1/3 1/3 1/3
Ответы:
1° Р{& = 1\^ = 2} = Р21(2)=2/Э-
1.4. Примеры и задачи
59
2° Р{& = 31 £0 = 3} = Рзз(З) = 12/27.
Распределение цепи через 3 шага после старта:
1	2	3	\
20/81 19/81 42/81 )
Задача 1.2. Матрица одношаговых переходных вероятно-
стей марковской цепи имеет вид
Р =
0,1 0,8 0,1 ‘
0,4 0,4 0,2
0,5 0,5 0
Распределение цепи в момент t = 0
величины £о) имеет вид
(распределение случайной
/ 1	о	Ч \
( 0,7 0,2 0,1 )•
Найти:
1° распределение цепи в момент t = 2;
2° вероятность того, что в моменты t = 0, 1, 2, 3 цепь будет
находиться соответственно в состояниях 2, 3, 1, 2;
3° вероятность того, что в моменты t = 0, 1, 2, 3, 4 цепь бу-
дет находиться соответственно в состояниях 3, 2, 1, 1, 3.
Ответы:
1° Распределение цепи в момент t = 2:
/ 1	2	3 \
t 0,351 0,491 0,158 )
2° 0,016; 3° 0,0002.
Задача 1.3 (существенные и несущественные состоя-
ния). 1° Могут ли все состояния марковской цепи быть сущест-
венными? у конечной марковской цепи? у бесконечной? (привес-
ти примеры).
О т в е т. У случайного блуждания по целочисленной решетке
(см. 1.3.3) все состояния существенные.
У конечной неприводимой марковской цепи все состояния
существенные.
2° Могут ли все состояния марковской цепи быть несущест-
венными? (привести примеры).
Ответ: в бесконечной марковской цепи все состояния могут
быть несущественными, в конечной — нет.
Примером марковской цепи, все состояния которой несущест-
венные, может быть, например, марковская цепь с матрицей пе-
реходных вероятностей
60
Глава 1. Цепи Маркова — основные понятия и факты
1/2 1/22
0	1/2
О О
1/23
1/22
1/2
1/24 1/25
1/23 1/24
1/22 1/23
3° Могут ли в марковской цепи быть как существенные, так
и несущественные состояния? (привести примеры).
Ответ: да, например, в марковской цепи с матрицей пере-
ходных вероятностей
1/3 1/3 ‘
1/2 1/2
1/2 1/2
4° Могут ли несущественные состояния марковской цепи быть
сообщающимися? (привести пример).
Ответ: да, см. пример 1.3.2, состояния 1,2,... ,п — 1 несу-
щественные сообщающиеся.
5° Могут ли несущественные и существенные состояния мар-
ковской цепи быть сообщающимися?
Ответ. Нет, не могут. Пусть i — несущественное состояние,
тогда найдется к такое, что i к, но i не достижимо из к.
Пусть j — существенное состояние и j о г, тогда j i к. Но
j — существенное состояние, поэтому fc —> 7, а, следовательно, и
fc —> 7 —> г, т. е. г достижимо из к — противоречие.
6° Могут ли существенные состояния марковской цепи быть
несообщающимися? (привести примеры).
Ответ: да, если марковская цепь содержит больше одного
класса эквивалентности, см. пример 1.3.2 (с. 37), состояния 0 и
п существенные, но несообщающиеся.
7° Каждая марковская цепь имеет хотя бы один класс экви-
валентности. Справедливо ли это утверждение?
Ответ: да для конечной марковской цепи, для бесконечной
— нет (см. 2° в задаче 1.3).
Задача 1.4 (нулевые, ненулевые состояния). 1° Могут
ли все состояния неприводимой марковской цепи быть нулевы-
ми? (привести примеры).
Ответ: Да — в бесконечной марковской цепи, см. пример
1.3.3 (с. 37) и пример 1.4.5 (с. 56). Нет — в конечной марковской
цепи, см. теорему 1.3.5.
2° Могут ли в конечной марковской цепи быть нулевые со-
стояния? (привести примеры).
1.4. Примеры и задачи
61
Ответ: да.
3° Могут ли все состояния конечной марковской цепи быть
нулевыми?
Ответ: нет (см. теорему 1.3.5).
4° Могут ли в конечной марковской цепи все состояния быть
ненулевыми? Если да, то что необходимо потребовать от такой
цепи?
Ответ: да, цепь не должна иметь несущественных состоя-
ний.
Задача 1.5 (нулевые и возвратные состояния). Может
ли неприводимая нулевая марковская цепь быть
1° возвратной;
2° невозвратной?
Решение. Заметим, что в конечной неприводимой марков-
ской цепи все состояния ненулевые, поэтому неприводимую ну-
левую марковскую цепь надо искать среди бесконечных цепей.
Случайное блуждание по целочисленной решетке является
примером неприводимой нулевой марковской цепи, поскольку
Р»о(2„) ~ ЙС.
у/1ГП
При этом цепь может быть как возвратной (при р = q = 1/2),
так и невозвратной (при р / q).
3° Может ли неприводимая марковская цепь, сходясь по ве-
роятности к ex?, с вероятностью 1 возвращаться в каждое свое
состояние бесконечно много раз? Если да — привести примеры.
Ответ: да, например, случайное блуждание по целочислен-
ной решетке, когда р = q = 1/2 — с одной стороны, случайное
блуждание, как нулевая марковская цепь, сходится по вероят-
ности к бесконечности, а с другой стороны, при р = q = 1/2 оно
возвратно.
4° Доказать, что несущественное состояние является невоз-
вратным.
5° Доказать, что несущественное состояние является нуле-
вым.
Задача 1.6. Доказать, что неприводимая конечная марков-
ская цепь возвратная.
Указание. Достаточно доказать, что такая цепь ненулевая.
Задача 1.7. 1° Доказать, что в невозвратной неприводимой
марковской цепи с фазовым пространством
X = {...,-2,-1,0,1,2,...}
62
Глава 1. Цепи Маркова — основные понятия и факты
для любого К
Р{ |£п | > К}	1 при п сю.
Другими словами, неприводимая невозвратная марковская цепь
с фазовым пространством X = {..., —2, — 1,0,1,2,...} при п
сю “уходит в бесконечность” (по вероятности).
Указание. Невозвратная марковская цепь является нуле-
вой.
Задача 1.8. Конечная неприводимая марковская цепь яв-
ляется ненулевой, а может ли неприводимая бесконечная мар-
ковская цепь быть ненулевой? (если да, то привести примеры).
Решение. Марковская цепь с фазовым пространством X =
= {1,2,...} и матрицей переходных вероятностей
является неприводимой ненулевой.
У матрицы Р(2) первый столбец имеет вид (100 ...)', а, сле-
довательно, такой же вид имеет и столбец у матрицы Р(2п),
п = 1,2,.... Так что Рц(2п) = 1, п = 1,2,..., поэтому цепь
ненулевая.
Задача 1.9. Привести пример неприводимой возвратной мар-
ковской цепи, которая была бы нулевой. Какое может быть чис-
ло состояний этой цепи: 1) только конечное, 2) только бесконеч-
ное, 3) может быть как конечным, так и бесконечным?
Ответ: случайное блуждание по одномерной целочисленной
решетке при р = q = 1/2 является возвратным. При этом цепь
нулевая, так как
РМ(2„) ~
х/КП
при п —> оо (см. (1.3.5)).
Неприводимая возвратная нулевая цепь может быть только
бесконечной.
Задача 1.10. Доказать, что
п
Pij(n) = У	“ fc)> П = °’ 1’ • • •
k=0
1.4. Примеры и задачи
63
Воспользовавшись последним равенством, установить, что
(см. также (1.3.9), (1.3.10)).
Указание. См. в теореме 1.2.2 доказательство равенства
Рц(п) = fii(k)Pii(n - к).
k=0
Задача 1.11. Симметричную игральную кость подбрасыва-
ют независимым образом неограниченное число раз. Пусть
— число очков, выпавших при к-м подбрасывании кости, к =
= 1,2,... Рассмотрим последовательности случайных величин
1)	Cn = min{£i,£2, • • • Лп}, П= 1,2,
2)	т;п+1 = min{77n + 1,^п}, % =Сь п= 1,2,...;
3)	#п+1 = min{0n + 2,£п}> #1 = 6, п = 1,2,...
4)т„+1 = тах{тп,£п}, П = Ci, п = 1,2,...;
5)<Лг+1 = max{(y>n - 2)+, £п}, уч = £1; п = 1,2,...,
где х+ = тах{0,х} — положительная часть числа х;
бИп+i =тах{(^„ - 1),Сп}, ^1=6, «= 1,2,...
Показать, что перечисленные последовательности образуют
марковские цепи, найти их матрицы переходных вероятностей,
классифицировать состояния этих цепей.
Ответ. В том, что последовательности образуют марков-
ские цепи, убеждаемся аналогично тому, как мы это делали в
примере 1.4.3.
1)	Матрица одношаговых переходных вероятностей цепи {Сп}:
Р = [-Ру] = [P{min{i,^„} = j}], i,j = 1,2, ...6,
подробнее
	г 1	0	0	0	0	0
	1/6	5/6	0	0	0	0
II а? II	1/6	1/6	4/6	0	0	0
	1/6	1/6	1/6	3/6	0	0
	1/6	1/6	1/6	1/6	2/6	0
	L i/е	1/6	1/6	1/6	1/6	1/6
Состояния 1,2,..., 6 не сообщаются, состояния 2,3,..., 6 несу-
щественные. Состояние 1 образует возвратный непериодический
класс эквивалентности.
64
Глава 1. Цепи Маркова — основные понятия и факты
2)	Матрица одношаговых переходных вероятностей цепи {т/п}:
Р = [Ру] = [P{rnin{z + l,£n} = j}], i,j = 1,2, ...6,
подробнее
	Г 1/6	5/6	0	0	0	0 1
	1/6	1/6	4/6	0	0	0
II II	1/6	1/6	1/6	3/6	0	0
	1/6	1/6	1/6	1/6	2/6	0
	1/6	1/6	1/6	1/6	1/6	1/6
	L i/е	1/6	1/6	1/6	1/6	1/6 J
Цепь {г/п} неприводимая, возвратная, непериодическая.
3)	Матрица одношаговых переходных вероятностей цепи {#п}:
Р = [Ру] = [P{min{z + 2,Cn} = J}], i,j = 1,2,... 6.
	Г 1/6	1/6	4/6	0	0	0 1
	1/6	i/е	1/6	3/6	0	0
II II	1/6	1/6	1/6	1/6	2/6	0
	1/6	1/6	1/6	1/6	1/6	1/6
	1/6	i/е	1/6	1/6	1/6	1/6
	L i/б	1/6	1/6	1/6	1/6	1/6 J
Цепь {0П} неприводимая, возвратная, непериодическая.
4)	Матрица переходных вероятностей цепи {тп}
Р = {pij} = [P{max{z,^n} = j}], i,j = 1,2,
подробнее
’ 1/6 1/6 1/6 1/6 1/6 1/6 ‘
О	2/6	1/6	1/6	1/6	1/6
О	0	3/6	1/6	1/6	1/6
О	0	0	4/6	1/6	1/6
0	0	0	0	5/6	1/6
0	0	0	0	0	1
Состояния 1,2,..., 5 — несущественные, состояние 1 образу-
ет класс эквивалентности.
5)	Матрица переходных вероятностей цепи {</?п}
Р = {Ру} = [P{max{(z — 2)+,£n) = J}] , i,j = 1,2,... ,6,
подробнее
1.4. Примеры и задачи
65
Г 1/6	1/6	1/6	1/6	1/6	1/6 I
1/6	1/6	1/6	1/6	1/6	1/6
1/6	1/6	1/6	1/6	1/6	1/6
О	2/6	1/6	1/6	1/6	1/6
О	О	3/6	1/6	1/6	1/6
О	О	0	4/6	1/6	1/6
Цепь неприводимая, возвратная, непериодическая.
6)	Матрица переходных вероятностей цепи {V’n}
Р = {Рц} = [P{max{(i-l)+,e„}=j}], i, j = 1,2,... 6,
подробнее
Г 1/6	1/6	1/6	1/6 1/6	1/6	I
1/6	1/6	1/6	1/6 1/6	1/6
р_	0	2/6	1/6	1/6	1/6	1/6
1Г_	0	0	3/6	1/6	1/6	1/6 '
О	0	0	4/6	1/6	1/6
. 0	0	0	0	5/6	1/6 .
Цепь неприводимая, возвратная, непериодическая.
Задача 1.12. Симметричную игральную кость подбрасыва-
ют независимым образом неограниченное число раз. Пусть £&
— число выпавших очков при к-м подбрасывании кости, к =
= 1,2,... Рассмотрим последовательности случайных величин
п
1)	Лп = 52п = 1,2,...;
2)	С„+1 = (с„ - 1)+ + С1 = 6, п = 1,2,...;
3)	0п+1 = (0п ~ 2)+ + Сп, 01 = £1, п = 1,2,...;
Показать, что последовательности {ту™}, {Сп}> {#п} образу-
ют марковские цепи. Найти матрицы переходных вероятностей,
классифицировать состояния цепей.
Ответ. В том, что {т?™}, {Сп}> {#п} образуют марковские це-
пи, убеждаемся аналогично тому, как мы это делали в примере
1.4.3.
1)	Матрица переходных вероятностей цепи {т/п}:
Р = [-Ру] = [Р{* + Сп = /}], i,j = 1,2,...,
подробнее
’0	1/6	1/6	1/6	1/6	1/6	1/6	0	о	...
р= 0	0	1/6	1/6	1/6	1/6	1/6	1/6	0	...
66
Глава 1. Цепи Маркова — основные понятия и факты
Все состояния марковской цепи {т/п} несущественные.
2)	Матрица переходных вероятностей цепи {Сп}:
Р = [Ру] = [P{(i - 1)+ + Cn = Л] , i, j = 1,2,...,
подробнее
’ 1/6	1/6	1/6	1/6	1/6	1/6	0	0	0	...	'
р =	0	1/6	1/6	1/6	1/6	1/6	1/6	о	о	...
Все состояния марковской цепи несущественные.
3)	Матрица переходных вероятностей цепи {#п}:
Р = [Ру] = [Р{(г - 2)+ + Сп = Л] , i, j = 1,2,...,
подробнее
’ 1/6	1/6	1/6	1/6	1/6	1/6	0	0	0..
1/6	1/6	1/6	1/6	1/6	1/6	0	0	0..
р =	0	1/6	1/6	1/6	1/6	1/6	1/6	о	о ..
0	0	1/6	1/6	1/6	1/6	1/6	1/6	0..
Цепь неприводимая, непериодическая.
Задача 1.13. Монету, вероятность выпадения герба кото-
рой равна р (0 < р < 1), подбрасывают независимым образом
неограниченное число раз. Пусть — число выпавших гербов
при fc-м подбрасывании монеты, к = 1,2,... Рассмотрим после-
довательности случайных величин
1)	77n+i = max{7?n,£n}, щ = £1; п= 1,2,...;
2)	Сп+1 = max{«n - l)+,Cn}, С1 =6, п = 1,2,...;
3)	0n+i =min{0n,£n}, #1 =С1, п= 1,2,...;
4)	</?п+1 = min{^n + 1,£п}> <Р1 = €1, « = 1,2,...
п
5)	V’n = n = 1,2,...
k=i
Показать, что последовательности {рп}, {Си}, {#п}> {<Рп}>
Ш образуют марковские цепи, найти их матрицы переходных
вероятностей, классифицировать состояния.
1.4. Примеры и задачи
67
Ответ. В том, что {г/п}, {Сп}, {<?„}, {<^п}> {Фп} образуют
марковские цепи, убеждаемся аналогично тому, как это дела-
лось в примере 1.4.3.
1)	Матрица переходных вероятностей цепи {ту™}-
Р = {Ру} = [Р{тах{г,£п} = Л], i,j = 0,1,
подробнее
Г 1-Р Р1
[О 1 ]•
2)	Матрица переходных вероятностей цепи {£п}:
Р = {ptj} = [Р{тах{(г - 1)+, £„} = Л] , i, j = 0,1,
подробнее
Г 1-Р Р1
L 1-Р РJ '
3)	Матрица переходных вероятностей цепи {0П}:
Р = {Ру} = [P{min{z,£п} = j}], i,j = 0,1,
подробнее
Г 1 о 1
L1-р р J ’
4)	Матрица переходных вероятностей цепи {<рп}:
Р = {Ру} = [^’{пйп{г + 1,£п} = Л], i,j = 0,1,
подробнее
Г 1-Р Р1
L 1-Р РJ ’
5)	Матрица переходных вероятностей цепи {V’n}
Р = {Ру} = [Р{* + U = Л], Ф J = 1,2, • • •,
подробнее
1 -Р
О
О
Р =
р ООО
1 — р р 0 0
0	1 — р р о
68
Глава 1. Цепи Маркова — основные понятия и факты
Все состояния марковской цепи {^п} несущественные.
Задача 1.14. Марковская цепь с фазовым пространством
{1,2,3,4} задана матрицей одношаговых переходных вероятнос-
тей
"О 01/2 1/2 '
р_	0	0	0	1
1	0	0	0
_	1/2	1/2	0	0
Классифицировать состояния марковской цепи. Убедиться, что
цепь периодична. Пусть t — период цепи. Представить фазовое
пространство в виде:
G = Go U Gi U ... U Gt—i-
В Q-цепи (Q = P(t)) найти матрицу переходных вероятностей
для каждого из классов эквивалентности Go, Gi,..., Gt-i. Клас-
сифицировать состояния в классах эквивалентности Gy, v =
= 0,1,. ..,f-l.
Задача 1.15. Марковская цепь с фазовым пространством
{1,2,3,4,5} задана матрицей одношаговых переходных вероят-
ностей
р =	Г 0	0	1	0	0 0	0	10	0 1/4	1/2	0	0	1/4 0	0	0	0	1 0	0	1/2	1/2	0
Классифицировать состояния марковской цепи. Убедиться, что
цепь периодична. Пусть t — период цепи. Представить фазовое
пространство в виде:
G = G0UGiU...UGt_i.
В Q-цепи (Q = P(t)) найти матрицу переходных вероятностей
для каждого из классов эквивалентности Go, Gi,..., Gt-i- Клас-
сифицировать состояния в классах эквивалентности G^, v =
= 0,1,. ..,f-l.
Задача 1.16. Монету, вероятность выпадения герба кото-
рой р, подбрасывают независимым образом неограниченное чис-
ло раз. Пусть £п — разность между числом выпавших гербов и
решеток после n-го подбрасывания.
Убедиться, что последовательность £п образует марковскую
цепь, найти ее матрицу переходных вероятностей.
1.4. Примеры и задачи
69
Указание. Пусть £п = i — разность между числом выпав-
ших гербов и решеток. Если в (п + 1)-м подбрасывании выпал
герб, то число выпавших гербов увеличивается на 1, число ре-
шеток остается тем же, и, следовательно, £n+i = г + 1, а
Р{Сп+1 — ^ + l|£n = i} = р
Если выпала решетка, то
•PRn+1 = г - 1|£п = г} = 1 - р.
Задача 1.17. В двух урнах находится 2N шаров (по N в
каждой), среди них N белых и N черных. Из каждой урны на-
удачу выбирают по шару и перекладывают из одной урны в
другую. Пусть £п — число белых шаров в первой урне после
n-го перекладывания (в момент п).
Убедиться, что последовательность £п образует марковскую
цепь, найти ее матрицу переходных вероятностей.
Указание. Пусть £п = к (1 < к < N — 1). Значение £n+i =
= к+1, если из первой урны выбран черный шар, а из второй —
белый, вероятность этого события равна (7V — к)2/N2. Значение
£п+1 = к — 1, если из первой урны выбран белый шар, а из второй
— черный, вероятность этого события равна к2/N2. Значение
£п+1 — к, если из первой и второй урны выбраны шары одно-
го цвета, вероятность этого события равна 2fc(7V — k)/N2. Если
= 0, то £п+1 = 1; если = N, то £n+i = N-1. Для 0 < к < N
Ал+1 = (^ - tf/N2, Рк,к-1 = k2/N2, Рк,к = 2k(N - k)/N2,
Род = 1, Pn,N-1 = 1-
Для остальных пар i,j значения P^j = 0.
Очевидно, что состояние £п+1 системы — число белых шаров
в первой урне после (п + 1)-го перекладывания — определяется
состоянием £п системы в момент п и не зависит от того, сколько
белых шаров было в первой урне до момента п. Поэтому после-
довательность {£п} образует марковскую цепь.
Задача 1.18. Организм в конце своей жизни производит
случайное число £ потомков. Распределение случайной величи-
ны
Р{£ = к} = ак, к = 0,1,2,...	(1.4.1)
Каждый из потомков в конце своей жизни независимо от дру-
гих потомков производит потомство, численность которого име-
ет распределение (1.4.1). (Мы будем предполагать, что продол-
жительность жизни одинакова для всех организмов.)
70
Глава 1. Цепи Маркова — основные понятия и факты
Обозначим через £п численность популяции в n-м поколении,
п = 1,2,...
Убедиться, что последовательность {£п} образует марков-
скую цепь, найти ее матрицу переходных вероятностей (после-
довательность {Сп} известна под названием ветвящегося процес-
са).
Указание. Пусть численность популяции в n-м поколении
равна г, т. е. £n = i. Каждый из i членов популяции произво-
дит £ потомков, в результате чего численность £п+1 популяции в
(п + 1)-м поколении становится равной £i + £2 + • • • + £?•
Непосредственной проверкой убеждаемся, что
= PRn+1 — j\Cn — 0 — Р{£1 + £2 + • • • + £? — j}-
Эта вероятность равна значению в точке j распределения суммы
£1 + £2 + • • • + 6
независимых случайных величин £1, & > • • • > &> распределение каж
дой из которых определяется равенством (1.4.1).
Задача 1.19. Доказать, что равенство (1.1.9) при каждом
фиксированном п задает вероятностное распределение на мно-
жестве последовательностей $оД1,... ,in целых неотрицатель-
ных чисел.
Глава 2
Предельные теоремы
для марковских цепей
2.1 Эргодическая теорема
Дискретное уравнение восстановления. Ключевым в ана-
лизе предельного поведения марковской цепи является следую-
щий результат.
Теорема 2.1.1 (уравнение восстановления). Пусть
1) F — вероятностное распределение, сосредоточенное на
множестве целых неотрицательных чисел такое, что н.о.д.
тех к, для которых
F({k}) =ak >0, k = 0,l,...,
равен 1;
оо
2) bk — сходящийся ряд с неотрицательными членами.
к=о
Если уравнение восстановления
п
Un ^к^п—к = ^п>	— 0, 1, . . . ,	(2.1.1)
к=0
имеет ограниченное решение и = (uq, и\,.. .):
sup \ип\ < М,
п
72
Глава 2. Предельные теоремы для марковских цепей
то оно имеет и предел, причем
оо / оо
limtzn = ^bk / ^kak,	(2-1.2)
"	fc=O I k=o
OO
если kak < oo, и
k=0
limun = 0,
n
oo
если kak — oo.
k=Q
Доказательство. Мы докажем теорему в предположе-
нии, что ai > 0, но она имеет место и в приведенной выше фор-
мулировке.
В условиях теоремы решение уравнения восстановления неот-
рицательно. Действительно, из ai > 0 следует 0 < 1 — ао- Пола-
гая в (2.1.1) последовательно п = 0,1,2 ..., получаем: при п = 0
ио — aouo = bo, t4o(l — &o) = bo,
и так как 0 < 1 — ao, bo > 0, то uq > 0; при п = 1
их - (ao^i + ai^o) = bi, ?zi(1 — ао) = i>i + aiuo,
и так как bi > 0, ai > 0, uq > 0, то и ui > 0. И так далее (по
индукции) получаем, что ип > 0 для всех п = 0,1,2,...
Для доказательства теоремы установим, что
оо
если kak < оо, и
k=Q
0 < lim ип < lim ип < 0
оо
если ^ак — оо.
к=0
Обозначим
ц = lim ип, Л = lim ип
2.1. Эргодическая теорема
73
Далее нам понадобится следующее вспомогательное утвер-
ждение.
Если {пП;.} — подпоследовательность последовательности
{пп}, для которой
limun. = Л = limnn,
nj 3
то и
limuni_d = А	(2-1-4)
nj
для каждого натурального d. ________
Заметим, что поскольку Л = limnn, то для данного е > О,
начиная с некоторого по (п > по)
ип < А + е.	(2.1.5)
Сначала покажем, что
limnn._i = А.
п7-	3
Предположим противное, т. е. unj_\ не сходится к А. Тогда най-
дется А' < А (найдется окрестность (А',+оо) точки А), что для
бесконечного числа значений индекса nj
— А < А.
Для этих индексов оценим unj сверху, воспользовавшись тем,
что unj удовлетворяют равенствам
Tlj
^nj =	> ^k^nj—k “Ь bnj
k=0
(см. (2.1.1)) или
N	rtj
Un3 =	> akunj—k + alunj — 1 +	akunj—k +
k=O,k^l	k=N+l
(TV выберем далее). Оценим каждое слагаемое в правой части
последнего равенства.
74
Глава 2. Предельные теоремы для марковских цепей
Поскольку unj-i < Л', то
< «1А'-
При достаточно больших nj значение
brij _ £>
оо
поскольку ряд bk сходится.
к=0
оо
Из сходимости ряда ак и ограниченности последователь-
но
ности {?in} следует, что найдется такое 2V, что
Tlj	ОО
'Г, akunj-k <м ^2 ak<M ^2 ak<^,
k=N+l	k=N+l	k=N+l
зафиксируем это N.
И, наконец, в силу (2.1.5), при достаточно больших nj
(nj > no,nj > TV) с учетом того, что к < N, имеем
N	N
^k^rij—k < (А + s)	Ofc <
к=О,к^1	к=О,к^1
<(A + s) а/* = (А + г)(1 — ai).
к=0, /с/1
“Собирая” все оценки, получим
tinj < (A+s)(l— 6ii)+6ii Az+s+s = А(1—cii)+s(l — cii)“H&iA'+2s
< А — Аб&1 + A 6Z-1 + 3s — А — 611 (А — А ) + 3s.
В частности, если
3 s = - 6Zi (А — А7),
то для бесконечного числа индексов nj имеем
unj < А — —611 (А — А ),
J 2
2.1. Эргодическая теорема
75
т. е. бесконечное число элементов последовательности {unj}, схо-
дящейся к Л, не принадлежит окрестности точки Л. Из получен-
ного противоречия и следует, что если unj А, то и unj_\ Л.
Повторяя те же рассуждения применительно к unj-i, убеж-
даемся, что Unj-2 сходится к Л и т. д.
Так что, если последовательность {unj} сходится к X, то и
последовательность {unj-d} также сходится к X для каждого
целого d > 0.
Аналогичное утверждение имеет место для ц = lim к.
Если подпоследовательность {unj} последовательности
сходится к ц:
limun. = ц = lim Un,
то и
limun—d = ц = limun	(2.1.6)
nj
для каждого натурального d.
Далее нам понадобится запись уравнения восстановления
п
^k^n—k ~ ^п> а — 0,1,...,
к=0
в терминах остатков:
Гп — ^п+1 + ^п+2 + • • • , П = 0, 1, . . . ,
ряда ^2 ак.
k=o
Очевидно,
го = ai + в2 + аз + ... = 1 - ао.
ап = гп-г -гп, п = 1,2,...,
ао = 1 - г0.
При п = 0 из уравнения восстановления (см. (2.1.1)) имеем
ио — ново = Ьо
или, в терминах остатков,
гоио = Ьо,
(2-1.7)
76
Глава 2. Предельные теоремы для марковских цепей
при n > 1 из (2.1.1) имеем
un - (aoun + aiUn-i + • • • + an-iui + anuo) = bn,
в терминах остатков —
t4n(l-ao)-((ro-ri)t4n_i + (ri-r2)t4n-2 + - • • + (rn-i - rn)u0) = bn
или
“Ь ^l^n—1 + ... +	(^O^n—1 + ... + 'f'n—1^0) = bn-
Обозначив
roun + riun-i + ... + rnuo = An, n = 0,1,2,...,
перепишем уравнение восстановления так:
A^ An-i — bn у n — 1,2,...,
при n = 0
Ao = &o
(см. равенство (2.1.7)). И, наконец, так:
An = bfc, n = 0,1,...,
k=o
или, подробнее,
п
roun + HUn-i + ... + rnuo = bk, П = 0,1,...	(2.1.8)
k=o
(уравнение восстановления в терминах остатков).
На следующем этапе доказательства, используя запись урав-
нения восстановления в терминах остатков, предельным перехо-
дом по п получим, что
lim и„ = ц = X = limun.
Пусть {nj} — последовательность индексов, для которых
limtu. = Л,
„ J
2.1. Эргодическая теорема
77
а, следовательно, и
lim uni-d = А
nj J
для каждого d. Положив в (2.1.8) п = получим
nj
rounj+r1unj_1 + . . .+rNUnj_N+rN+lUnj_^N+^ + . . .+rnjU0 = ^bk.
k=0
Отсюда
nj
rounj + ViUrij-l + • • • + nv Unj-N < bk.
k=Q
Переходя к пределу при nj —> оо в правой и левой частях по-
следнего неравенства, имеем
оо
А(го + И + ... + rN) < 52
k=o
отсюда
оо / N
А < ^bk / ^rk.
k=0 I k=0
Далее рассмотрим отдельно два случая:
(2.1.9)
ОО
52= +оо;
к=0
< сю
оо	оо
(заметим, что гк — 12 как)-
к=0	к=0
оо
Если гк — +оо, то переходя в неравенстве (2.1.9) к пре-
к=0
делу при 7V —> сю, получаем
А < О,
что с вместе с неравенствами 0 < р, < А < 0 доказывает теорему.
78
Глава 2. Предельные теоремы для марковских цепей
ОО
Если rk < °0, то из (2.1.9) имеем
k=o
оо / оо
А <52^ / ^гк.
к=0	/ к=0
Установим, что имеет место и неравенство
оо / оо
52/ ^гк < р.
к=0	/ к=0
Пусть rij — последовательность индексов, для которых
[1 = limtu.,
nj 3
а, следовательно, и
lim un d = у,
nj 3
для каждого d > 0. Для этих значений индексов из (2.1.8) имеем
+ П^п7--1 + • • • + rN Unj-N +
nj
+(r/v+i (jv+i) + • • • + rn.uo) = bk.
k=Q
Отсюда, учитывая что sup?i^ < M, получаем неравенство
к
nj
TOUnj + HUnj-l + • • • + rN Unj-N + M(rN+i + ... + rnj) > ^2 bk •
k=0
Переходя к пределу при nj оо в правой и левой частях этого
неравенства, имеем
оо	оо
р(.го + п + ... + rN) + М ^2 rk У
k=N+l	к=0
далее, переходя к пределу при 7V —> оо и учитывая, что
оо
lim
N—>оо
52 Гк
k=N+l
= 0
2.1. Эргодическая теорема
79
ОО
(рад rk сходится), получаем
&=0
оо	оо
P^rk >
к=0	к=0
ИЛИ
оо / оо
52Ьк / 52Гк -
к=0	/ к=0
Что вместе с ранее полученным неравенством
оо / оо
а < ^2Ьк / 52Гк
к=0	/ к=0
и доказывает теорему.
Эргодическая теорема для непериодических цепей.
Напомним, что
Putty = 1, Рц(п) = Р{£п = i|£0 = 0> п = 1,2, • • •,
/и(0) = О, ЛД1) =	= г|£0 = 0 = Рц(1),
= Р{£>п = Со =	7^ V = 1, 2, . . . , 71 — 1|£о = О’
п = 2,3,...,
Рц(п) = 52 ~кУ п = 1,2, . . . ,
к=0
Tj — момент первого возвращения в состояние г, его математи-
ческое ожидание
Mri = ^kfu(k).
к=0
Теорема2.1.2 (эргодическая). В неприводимой возвратной
непериодической марковской цепи для любых состояний i,j су-
ществуют limРц(п), limP^(n) и
limPjJn) = lim Рц(п),
п J	п
80
Глава 2. Предельные теоремы для марковских цепей
причем, если Mrj < сю, то
“»тР”(п) = Ж’
если = оо, то
limPjj(n) = 0.
п
Доказательство. Равенства
Ри(0) = 1, Рц(п) - Г fii(k)Pn(n - fc) = 0, n = 1,2,...,
fe=0
обозначают, что последовательность
Un = Рц(п), n = 0, 1 . . . ,
является ограниченным решением уравнения восстановления
п
^k^n—k —	— 0, 1, ... ,
к=0
у которого
= fatty, к = 0,1,2,...,
bo = 1, Ьп = 0, n = 1,2,...
При этом, во-первых, = fatty, к = 0,1,2,..., — вероятност-
ное распределение на множестве {0,1,2,...} — поскольку цепь
возвратна, то
оо
k=0
и, во-вторых, цепь непериодична, т. е. наибольший общий дели-
тель тех к, для которых Patty > 0 равен 1 (не нарушая общ-
ности будем считать, что /«(1) = Patty > 0). Поэтому согласно
теореме 2.1.1 ограниченное решение {Р^(п)} уравнения восста-
новления имеет предел, причем
lim Рц(п) = —-----
”	Е кШк)
k=o
1
Ж’
2.1. Эргодическая теорема
81
если Мтг < оо, и
limPjj(n) = О,
п
если Мтг = сю.
Установим ещё, что
lim Рц(п) = limPn(n).
п J	п
Имеет место следующее легко проверяемое соотношение:
п
Pji(n) = У fji(k)Pii(n ~k), п = 0,1,2, ... ,
fc=0
которое в обозначениях Pji(n) = уп, Рц(п) = хп, fji(k) =
перепишем так:
п
Уп =	bfoXn—кч 72 = 0, 1, 2, ... ,
к=0
причем, поскольку цепь возвратная, то
оо	оо
к=0	к=0
см. теорему 1.3.8.
Покажем, что если хп с при п сю (|xn| < 1 и |с| < 1), то
уп с при п сю.
Действительно,
п	п	оо
Уп ~ с	bfcXn—k — С = bfcXn—k — С bfc =
к=0	п=0	к=0
п	оо
— Ък(хп—к — с) — С bfc =
к=0	/с=п+1
N	п	оо
— Ь^^хп—к — с) + Ьь(хп—к — с) — с bfc.
к=0	k=N+l	&=п+1
82
Глава 2. Предельные теоремы для марковских цепей
Отсюда
N	п	оо
\Уп - с| < ^bk\xn_k - с| + ^2 bfel^n-fc - с| + С ^2 bk-
k=0	k=N+l	k=n+l
Будем оценивать правую часть, начиная со второй суммы.
Пусть е > 0. Выберем N так, чтобы
п	п	оо
bk\%n—k ~ с| — 2	< 2 bfc < £
fc=N+l	k=N+l	fc=N+l
и зафиксируем. Далее, поскольку последовательность {xi} схо-
дится к с, то при достаточно больших п
N
bk\^n—k ~ с| —
к=0
Третья сумма как остаток сходящегося ряда меньше е. Поэтому
при достаточно больших п
\уп - с| < 3s.
Тем самым теорема доказана.
Следствие 1. В ненулевой неприводимой непериодической
марковской цепи для любых состояний i, j существуют lim Рц(п),
п
limP7Jn) и
п J
limPn(n) = lim Рц(п),
п	п
среднее время возвращения
оо
Мгг =
k=Q
конечно и
ПтРй(п) = —.
п	MTi
Доказательство. Так как цепь ненулевая, то она воз-
вратна, и в силу эргодической теоремы существуют и равны
limРц(п\ lim Рц(п).
п	п J
2.1. Эргодическая теорема
83
Далее, среднее время возвращения Мтг в состояние i ко-
нечно — если бы Мтг = оо, то в силу эргодической теоремы
limРц(п) = 0, но последовательность Рц(п) не стремится к ну-
п
лю (цепь ненулевая). В силу эргодической теоремы
limPii(n) = -г^-.
п	MTj
Замечание. В силу теоремы 1.3.1 множество существен-
ных состояний марковской цепи распадается на непересекаю-
щиеся классы сообщающихся между собой состояний (классы
эквивалентности). Для тех из классов, которые являются воз-
вратными непериодическими, имеет место эргодическая теоре-
ма.
Эргодическое распределение. Пусть С — возвратный не-
периодический класс. Вероятностное распределение {тгД, задан-
ное на классе С равенствами
7Tj = lim Pjj (n), j 6 C,
называется эргодическим. Если при этом хотя бы для одного i
значение тг^ > 0, то класс С называется возвратным ненулевым
(эргодическим), если хотя бы для одного к значение = 0, то
класс называется возвратным нулевым (слабо эргодическим).
Определение эргодического распределения, возвратного нену-
левого и возвратного нулевого классов корректно. Из
оо
52	= 1
j=0
N
имеем ^ij(n) < 1- Переходя в последнем неравенстве к пре-
j=o
делу сначала по п, а затем по 7V, получим
оо
т. е. {тг^} является вероятностным распределением (собствен-
ным1 или несобственным).
Распределение {тг7-} называют собственным вероятностным распреде-
лю	оо
лением, если = 1 и несобственным, если	71 з < 1-
J=0	j=0
84
Глава 2. Предельные теоремы для марковских цепей
Далее, для любых i,j € С
Pjj(n + s + m)> Pji(n)Pu(s)Pij(m)	(2.1.10)
(см. следствие 3 из уравнения Колмогорова — Чепмена). В си-
лу неприводимости класса С числа пит можно выбрать так,
что Pji(n) > 0, Рц(т) > 0. Переходя в неравенстве (2.1.10) к
пределу при s оо, получаем
7Г7- > Pji (n)7ViPij(m).
Поэтому, если для некоторого i значение тгг > 0, то 7Vj > 0 и для
каждого другого j 6 С; если для некоторого j значение тг7 = 0,
то для всех i 6 С значение тгг = 0.
Заметим, что у нулевого класса эквивалентности С эргоди-
ческое распределение всегда существует, поскольку для каждого
состояния j из нулевого класса С
hmPjj(n) = 0.
Теорема 2.1.3 (о предельном распределении марковской
цепи). Распределение неприводимой возвратной непериодической
марковской цепи сходится к ее эргодическому распределению {тг^}:
lim Р{£п = k} = тг&, к = 0,1,...
п
Доказательство. Обозначим Р{£п = к} через Qn{{k}).
В силу (1.1.8) Qn({k}) можно представить в виде
оо
Qn({^}) — Р{£п — к} =	pjPёДн).
?=0
Отсюда
\Qn({k}) - 7Гк\ =
оо
^PiPikM - 7Гк
1=0
оо	оо
-ТГк^Рг
?=0	?=0
оо
- TTfc)
i=0
2.1. Эргодическая теорема
85
N	оо
< ^Pi \Pik(n) — TTfcl + ^2 Pi\Pik(.n) -як\<
?=0	i=N+l
N	oo
< "£2Pi\Pik(n) — TTfcl + 2£ Pi.
?=0	i=N+l
oo
Выберем N так, чтобы 2 Pi < e и зафиксируем. Далее, по-
i=N+l
скольку	7i> при n —> оо, то при достаточно больших п
N
&1ВД - 7rfe| < е,
г=0
а, следовательно,
l<2n(W) - TTfel < Зе.
Тем самым теорема доказана.
Стационарное распределение марковской цепи. Ста-
ционарным распределением марковской цепи с матрицей пере-
ходных вероятностей Р = [Рц] называется вероятностное рас-
пределение {vfc} (собственное или несобственное), для которого
при каждом п
^ViPij(n) =Vj, j = 0,1,...,	(2.1.11)
г=0
или, в матричном виде,
P'(n)v = V,
где v = (vo, vi, V2,..
Пусть {v^} — начальное распределение марковской цепи {£п}:
Р{£о = i} = Vi, i = 0,1,...,
тогда для любого п
52	= Р{£п = k}, к = 0,1,...
86
Глава 2. Предельные теоремы для марковских цепей
Если начальное распределение {г^} цепи является ее стационар-
ным распределением, то из последнего равенства и определения
стационарного распределения цепи следует
Р{£п = k} = vk, к = 0,1,...,
т. е. при каждом п распределение Р{£п = к}, к = 0,1,..., цепи
совпадает с ее стационарным распределением {v^} — с течением
времени распределение цепи не меняется.
Далее мы будем пользоваться следующим утверждением.
Для того, чтобы вероятностное распределение {и^} мар-
ковской цепи с матрицей переходных вероятностей Р = [Р^]
было стационарным, достаточно, чтобы
^ViPik = vk,k = 0,l,...,	(2.1.12)
?=0
или, в матричном виде,
P'v = V.
В самом деле, умножив правую и левую часть равенства
оо
ViPik = ^кч к = 0, 1, . . . ,
?=0
на Pkj и просуммировав по всем к, получим
оо	оо	оо
PikPkj =	VkPkj ч
i=0 k=0	к=0
ИЛИ
У2ViPij(2) =Vj, j = 0,1,...
i=0
Повторив эту операцию п раз, получим (2.1.11).
Распределение {v&}, для которого имеет место (2.1.12), так-
же называют стационарным.
2.1. Эргодическая теорема
87
Теорема 2.1.4 (о стационарном и эргодическом распреде-
лениях). Эргодическое распределение неприводимой ненулевой
непериодической цепи является ее собственным стационарным
распределением, и наоборот: собственное стационарное распре-
деление неприводимой возвратной непериодической цепи явля-
ется ее эргодическим распределением.
Доказательство. Заметим, что ненулевая цепь заведомо
возвратная, поэтому у неё существует эргодическое распределе-
ние.
Сначала покажем, что любое эргодическое распределение це-
пи {тг^} (ttj = limPjjfji)) является ее стационарным распределе-
нием, т. е.
оо
=^j, j =0, 1,...
г=0
Из уравнения Колмогорова—Чепмена для любых п имеем
оо	N
Pjj(n +1)=	> У^
к=0	к=0
N произвольное. Переходя в этом неравенстве к пределу при
п —> оо, получаем
N
itj > У^ ^k^kj-)
к=0
ат. к. N произвольно, то и
оо
j =0,1,...	(2.1.13)
к=0
На самом деле все нестрогие неравенства (2.1.13) являются ра-
венствами. Если предположить, что хотя бы одно из неравенств
(2.1.13) строгое и просуммировать все неравенства (2.1.13), то
получим противоречие:
оо	оо / оо	\	оо	оо	оо
У? Kj > У? I У? ^kPkj j = У27Гк У?	= У?7г/с-
j=0	j=0 \к=0	/	к=0	j=0	к=0
Откуда следует, что для всех j = 0,1,...
оо
У? ^kPkj = Kj.
к=0
88
Глава 2. Предельные теоремы для марковских цепей
Так что эргодическое распределение всегда является стаци-
онарным.
Убедимся, что в ненулевой (неприводимой) цепи эргодиче-
ское распределение {тч} является собственным стационарным
распределением.
Эргодическое распределение {тгД всегда является стацио-
нарным: для любого п
оо
^2^П/п) = тг,, j = 0,1,2,...	(2.1.14)
k=0
Переходя в последнем равенстве к пределу при п сю, причем в
левой части под знаком суммы (если такой предельный переход
возможен), получим
оо
УТ ^k^j — Яр
k=0
Отсюда, поскольку класс ненулевой и, следовательно tvj 0,
имеем
оо
12
к=0
т. е. эргодическое распределение в ненулевом классе является
собственным.
Убедимся, что в левой части равенства (2.1.14) можно перей-
ти к пределу при п —> сю под знаком суммы. Для этого оценим
сверху разность
оо
-TTj .
k=0
Имеем
оо
-7TJ
k=0
оо	оо
уТ^р^и - УТ7^
к=0	к=0
N
^7Vk(Pkj(n) ~7Vj)
k=0
k=N+l
N	oo
< ^27r*:i-p^(n) -141+2 ^2 ^k-
k=Q	k=N+l
2.1. Эргодическая теорема
89
Второе слагаемое, как это остаток сходящегося ряда, можно сде-
лать меньше данного е за счет выбора N. При фиксированном
N первое слагаемое меньше е для достаточно больших п. Так
что для любого данного е > 0 при достаточно больших п
оо
^2^kPkj(.n) - TTj
k=0
< 2г.
Последнее неравенство и доказывает справедливость (2.1.14).
Пусть теперь {^} — собственное стационарное распределе-
ние неприводимой возвратной непериодической цепи: для каж-
дого п = 1,2,...
оо	оо
^2ViPij(п) =Vj, j = 0,1,...,	= 1.
?=0	j=0
Убедимся, что {vj} является эргодическим распределением.
Как и в первой части теоремы, переходя в равенстве
оо
^ViPij^n) = Vj
i=0
к пределу под знаком суммы при п оо, получим
оо
=Vj, j = 0,1,...,
i=0
(существование пределов lim Рц(п) гарантировано возвратнос-
тью и непериодичностью неприводимой цепи). И поскольку рас-
оо
пределение {г^} собственное, т. е. = 1, то
?=о
Vj j =0,1,...
Замечание. В теореме в явном виде непериодичностью мы
не пользуемся. Непериодичность вместе с возвратностью обес-
печивает существование эргодического распределения.
Резюме. Если класс С нулевой, то все предельные зна-
чения для Pij(n) известны — они равны нулю (независимо от
того класс возвратный или нет, периодический или нет). Если
90
Глава 2. Предельные теоремы для марковских цепей
же класс С ненулевой (как следствие он возвратный) и непери-
одический (требование непериодичности цепи не принципиаль-
но), то в силу эргодической теоремы существуют предельные
(эргодические) значения для Pij(n):
lim (п) = 7Vj, j 6 C,
заведомо отличные от нуля (класс ненулевой).
Эргодическое распределение {тг?} ненулевого класса эквива-
лентности совпадает с его собственным стационарным рас-
пределением и поэтому эргодическое распределение можно по-
лучить как решение системы линейных уравнений
Р'тГ = 7Г, ^2^2 = 1.
iec
Пример 2.1.1. Рассматривается марковская цепь с фазо-
вым пространством X = {1,2,3}, заданная матрицей одноша-
говых переходных вероятностей
’ 4/5 1/5	0	‘
3/5 1/5 1/5
О 4/5 1/5
1° Существует ли limРц(п), i = 1,2,3?
п
2° Если limРц(п), существует, найти его.
п
3° Вычислить среднее Mri времени первого возвращения ъ
в состояние i, i = 1,2,3.
Решение. Марковская цепь, описываемая матрицей пере-
ходных вероятностей Р, неприводимая и непериодическая. По-
скольку цепь конечна, то она ненулевая и, как следствие, воз-
вратная. Поэтому согласно эргодической теореме существует
limРц(п) = 7Vj, i = 1,2,3.
п
Далее, в неприводимой ненулевой непериодической марков-
ской цепи эргодическое распределение совпадает с собственным
стационарным распределением, т. е. удовлетворяет системе
Р'7Г = 7Г,
3
Е^ = 1-
2.1. Эргодическая теорема
91
или, что то же, с	истеме					
	Г 4 5%1	+	3 -я2	+	0тг3 =	7Г1,
<	1 5"1	+	1 5"2	+	4 5"3 =	7Г2,
	Otti	+	1 5"2	+	1 5"3 =	7ГЗ,
	,	7Г1	+	7Г2	+	7Г3 =	1.
Решая эту систему, получим
12	4	1
= 17’	= 17’
Согласно эргодической теореме среднее время возвращения
Mri = 1/тгг, i = 1,2,3.
Эргодическая теорема для периодической цепи. Ис-
следование асимптотического поведения переходных вероятнос-
тей Pij(n) при п ч ос в периодической цепи сводится к их ис-
следованию в непериодической цепи.
Теорема 2.1.5 (эргодическая теорема для периодических
t-i
цепей). Пусть G = |J Gy — фазовое пространство неприво-
У = в
Зимой возвратной периодической с периодом t марковской це-
пи с матрицей переходных вероятностей Р = [Рц], матрица
[Qol — Q — Р(0-
Для каждого i Е Gy (z/ = 0,1, ...,£— 1)
/ ч ( Qi — lirnQi^n), если
lim (nt) =	п h
п J [0,	если
, ч ( Qi = limQiJn), если
ИтРДк + nt) = < 3 n
n	[0,	если
j е Gy,
3 i Gy,
j 6 Gy+k^
j Gy+k,
к = 1,2,. ..,t- 1.
Доказательство. Согласно теореме о структуре периоди-
ческой цепи (см. теорему 1.3.9) в Q-цепи каждый класс эквива-
лентности Gy является неприводимой возвратной непериодиче-
ской цепью, поэтому для гД 6 Gy в силу эргодической теоремы
92
Глава 2. Предельные теоремы для марковских цепей
существует lim Qjj (п) и
lim Qjj (n) = lim Qjj (n) = qj.
А поскольку
Pij(nt) = Qijfa)
(cm. 1.3.15), to
lim Pjj (nt) = lim (n) = qj
для i,j e Gy.
Если j Gy, to Pjj(nt) = 0 (за nt шагов из i 6 Gy можно
перейти только в класс Gy), а значит
lim Рц (nt) = 0.
п
Пусть теперь i е Gy, j е Gy+k (k = 1,2,..., t — 1). Убедимся
в справедливости равенства
lim Рц(к + nt) =qj-	(2.1.15)
Из класса Gy P-цепь за первые к шагов перейдет в класс
Gy+k (см. теорему 1.3.9), поэтому в силу уравнения Колмогорова-
Чепмена
Py(fc + nt)= Pis(k)PSj(nt). (2.1.16)
За последующие nt шагов P-цепь из класса Gy+k переходит толь-
ко в класс Gy+k (см. теорему 1.3.9).
При п —> оо правая часть равенства (2.1.16) имеет предел,
равный qj. Убедимся в этом. Для этого оценим сверху разность
Имеем
^2 Pis^Psjint') - qj
^2 PiS(k)Psj(nt) -qj
S(zGv+k
2.1. Эргодическая теорема
93
52 Pis(k')PSj(nt') - 52 Pis(k)qj <
s^Gv+k	seelie
< ^2 Pis^ ~ + 12 Pis^ \psj(nt) - <
sEM	s€.G и+к\М
< 52 P™№) \Psj(nt) - qj\ + 2 52 Pis(k).
stM	s^Gly^-ic\M
Для данного s > О, выбрав конечное подмножество М С Gy^
так, чтобы
52 Pis(k) £’
sEGu+^\M
а затем (при фиксированном М) п настолько большим, чтобы
52 Pisik') \PSj(nt) -qj\<£,
seM
получаем, что при достаточно больших п
Pis(k)PSj(nt) qj
sZGv+k
< £.
Так что правая часть равенства (2.1.16), а вместе с ней и веро-
ятность Pij(к + nt), при п —> оо имеет предел, равный qj.
Если j Gy+k, то Pij(к + nt) = 0 и, следовательно,
]ш1Рц(к + nt) = 0.
'П J
Пример 2.1.2. Найти предельные значения Рг](п) при
п <х> (если они существуют) для марковской цепи, заданной
матрицей переходных вероятностей
’О 01/2 1/2 '
О 0	3/4	1/4
1/2 1/2 О О
1/2 1/2 О О
94
Глава 2. Предельные теоремы для марковских цепей
Решение. Марковская цепь периодична с периодом 2. Со-
гласно теореме о структуре марковской цепи фазовое простран-
ство G цепи представимо в виде объединения непересекающиеся
классов Go и Gi, причем за 2 шага P-цепь переходит из класса
Gy в класс Gy, v = 0,1. Матрица переходных вероятностей
		Q = Р(2) =	(р;	)2,	
подробнее					
	 0	0	1/2 1/2 ‘		’ 0	0	1/2 1/2 ‘
(Л) — ТП) . ТП)—	0	0	3/4 1/4		0	0	3/4 1/4
О’ — 1г • 1г —	1/2 1	/2	0	0		1/2	1/2	0	0
	1/2 1	/2	0	0		L 1/2	1/2	0	0
		’ 1/2 1/2	0		0 ‘	
		1/2 1/2	0		0	
		0	0	5/8		3/8	
		0	0 5/8		3/8	
Матрица переходных вероятностей класса эквивалентности
Go = {1,2} имеет вид
Qo =
1/2 1/2
1/2 1/2 ’
класса эквивалентности Gi = {3,4} —
Qi =
5/8 3/8
5/8 3/8
Далее воспользуемся эргодической теоремой для периодичес-
кой цепи (теорема 2.1.5).
Для непериодического возвратного класса Go = {1,2} с мат-
рицей одношаговых переходных вероятностей
Qo =
1/2 1/2
1/2 1/2
найдем эргодическое распределение {<Zi, #2}, оно совпадает с соб-
ственным стационарным распределением цепи, т. е. является ре-
шением системы
f Qotf = ъ
[ <71 + <72 = 1,
2.1. Эргодическая теорема
95
где q = (qi,Q2)z- Подробнее:
qi/2 + Q2/2
qi/2 + Q2/2
qi + <72
qi,
Q2,
1.
Решением этой системы является
1 1
= 2’ 92 = 2
Аналогично находим эргодическое распределение {#3, q^} непе-
риодического возвратного класса Gi = {3,4} с матрицей одно-
шаговых переходных вероятностей
Qi =
5/8 3/8
5/8 3/8
как решение системы
(5/8)93 + (5/8)q4 = q3,
(3/8)93 + (3/8)<?4 = 94,
?з+?4 = 1,
где q = (Q3, </4)'. Имеем
5	3
93 = 8 ’ 94 = 8’
Поэтому согласно эргодической теореме для периодических це-
пей имеем: для i 6 {1,2}
lim Pjj (2ri) =
Qj = limQjj(n), j G {1,2};
0,	”	j € {3,4};
r, 7O	f 9j = limQjj(n), je{3,4};
limP,j(2n +1) = | 0	je{i 2};
для i € {3,4}
limPy(2n) =
qj = limQjj(n), j G {3,4};
0,	”	j G {1,2};
96
Глава 2. Предельные теоремы для марковских цепей
1,тРу(2„+1)=| 0_ п
Вероятности поглощения. Следующая далее теорема опи-
сывает предельное поведение Pij(n) при п сю, когда i — несу-
щественное состояние, а состояние j принадлежит некоторому
классу эквивалентности С. Класс С будем считать непериоди-
ческим (исследование периодической цепи сводится к исследо-
ванию непериодической).
Далее через тгДС) будем обозначать вероятность того, что
цепь, стартовав из несущественного состояния г, достигнет воз-
вратного класса С.
Теор е м а 2.1.6 (о вероятностях поглощения). Если i — несу-
щественное состояние, состояние j принадлежит возвратно-
му непериодическому классу С, то
lim Рц(п) = 7Ti(C)7rj,
п—^оо
где 7Vj = lim Pjj(n).
Доказательство. Оценим разность |Рц(п) —тц(C)irj|. Обо-
значим через тг^ (С) вероятность того, что цепь, стартовав из
невозвратного состояния г, войдет в класс С через состояние
к на 1/-м шаге (заметим, что цепь, попав в класс С, из него не
выйдет, поскольку С — класс эквивалентности). Тогда для тгj(C)
имеет место представление
оо
i2=i кес
а для Рц (п) — представление
12=1 кес
— цепь, стартовав из состояния г, входит в класс С (через одно
из его состояний к) на некотором шаге v (1 < и < п), а затем за
оставшиеся п — и шагов из состояния к попадает в состояние j.
Используя приведенные представления для тгДС) и Р^-(п),
оценим разность
|Р0(п) -^^((7)1
2.1. Эргодическая теорема
97
(далее Cf — конечное подмножество С):
|Ру(п)-7Г,7гДС')| =
п	оо
52 52	52 52
y=i kec	у=1кес
п	оо
5252^)(cxp^(n-i/)-7rJ>-7г.? 52 52 ^ (°)
У=1кес	у=п+1кес
52 52 ^(ik^pki<n - - ъ)+
у=1кеС'
+52 52 7rifc)(c')(p^(n-z/)-7rj)
v=lкеС\С’
оо
*з 52 52
y=n+i kec
N
< 52 52 7rifc)(c')ipfej(n - о - ^1+
у=1 кеС'
+ 52 52 7r^)(c')ipfc/n - - ^1+
l/=n+i кес'
п	оо
+52 52 7rifc)(c)ipfe/n-i/)-7rJ+7rJ 52 52
y=ikec\c'	v=n+ikec
< 52 52 7rife)(c')ipfej(n -р) - ^1+
у=1 кеС'
+2 Ё Е ++)+
р=лг+1 кес'
п	оо
+2Е Е <’(0) + ^ Е Е+’(с)-
y=ikec\c'	v=n+ikec
Пусть е > 0 произвольное фиксированное. Выберем N так, что-
бы вторая сумма, как остаток сходящегося ряда, была меньше е
(и зафиксируем N). Выберем конечное С' так, чтобы третья
98
Глава 2. Предельные теоремы для марковских цепей
сумма, как остаток сходящегося ряда, была меньше е (и зафик-
сируем С')- Четвертая сумма при достаточно больших п мень-
ше е (как остаток сходящегося ряда). И, наконец, первая сумма
при достаточно больших п, как конечное число “малых” слагае-
мых, меньше е — каждое слагаемое мало при больших п в силу
эргодической теоремы. Так что при достаточно больших п
\Pij(n) - 7Г,7ГДС)| < 4е,
откуда и следует утверждение теоремы.
Пример 2.1.3. Пусть марковская цепь задана матрицей
одношаговых переходных вероятностей
р =	Г 1/3	1/3	1/3	0	0	3 2/3	1/6	1/6	0	0 1/2	1/4	1/4	0	0 0	0	0	1	0 . 0	1/3	0	1/3	1/3	.
Найти limPjj(п) для всех пар (i, j).
Решение. Состояние {5} — несущественное, классы эквива-
лентности Ci = {1,2,3} и С2 = {4} являются ненулевыми непе-
риодическими. Поэтому для вычисления lim Pjj(n), i,j = 1,2,3,
можно воспользоваться теоремой о стационарном и эргодиче-
ском распределениях (см. теорему 2.1.4), limP44(n), очевидно,
равен 1.
Далее, Р^(п) = 0 для i = 1,2,3 и P4j(n) = 0 для j = 1,2,3,
поскольку состояние 4 и состояния 1,2,3 принадлежат разным
классам эквивалентности.
Значения limP^n) = 0, i = 1,2,3, и limP^n) = 0 т. к.
состояния {1,2,3}, {4} образуют классы эквивалентности, кото-
рым состояние {5} не принадлежит.
Для вычисления lim Р^(п), j = 1,2,3,4 воспользуемся тео-
ремой о вероятностях поглощения (см. теорему 2.1.6):
йтРзДп) = 7T5(Ci)7Tj, j = 1,2,3;
limP54(n) = 7Г5(С2)7Г4.
n
Легко видеть, что
/z-, ч 1	1	1	1
7Г5(С1)-3 + 9 + 27 + ---"2;
2.1. Эргодическая теорема
99
, 1 1 1 1
7Г5(С2)-§ + 9 + 27 + "'“ 2'
Поэтому
limP5j(n) = 7г5(С1)7г^ = Kj/2, j = 1,2,3;
limP54(n) = 7Г5(С2)7Г4 = 1/2.
п
Вероятности ttj, j = 1,2,3, находим, пользуясь теоремой о ста-
ционарном и эргодическом распределении (см. теорему 2.1.4):
7П = 7/15, 7Г1 = 4/15, 7Г1 = 4/15.
О предельном поведении марковской цепи. Как из-
вестно, множество всех состояний марковской цепи — фазовое
пространство — распадается на несущественные состояния и не-
пересекающиеся классы существенных состояний — классы эк-
вивалентности (некоторые классы эквивалентности могут состо-
ять из одного состояния). Мы исследовали предельное поведение
Pij(n) при п —> оо для всех возможных пар г, j :
1° Для несущественного состояния j
lim Pjj (ri) = О,
вне зависимости от того, каким является состояние i — су-
щественным или несущественным.
2° Если состояния i и j принадлежат разным классам эк-
вивалентности, то
lim Р^ (n) = О,
поскольку Pij(n) = 0 для всех п.
3° Состояния j и i принадлежат одному классу эквива-
лентности. Если класс эквивалентности нулевой, то
lim Р^ (ri) = 0.
Если класс эквивалентности ненулевой, то
lim Р^ (n) = 7Tj, j e C,
— в силу эргодической теоремы.
Из приведенных результатов о поведении Pij(ri) при п —> оо
следует, что при п —> оо распределение
Qn({fc}) = Р{£п = к}, к е х,
100
Глава 2. Предельные теоремы для марковских цепей
марковской цепи всегда сходится к некоторому предельному рас-
пределению:
1° В нулевом классе эквивалентности С для любого N > О
при п сю
Ж1 > N} -+ 1
— “цепь уходит в бесконечность** (см. теорему 1.3.4).
Если класс С нулевой возвратный, то цепь, уходя в беско-
нечность из данного состояния j, с вероятностью 1 возвраща-
ется в него бесконечное число раз, если же класс С нулевой
невозвратный, то цепь с вероятностью 1 возвращается в со-
стояние i конечное число раз.
2° В ненулевом классе эквивалентности существует соб-
ственное предельное распределение цепи, совпадающее с эргоди-
ческим:
limQn({fc}) = limР{£п = к} = тг&, к 6 С.
3° Цепь, стартующая из несущественного состояния i, “по-
глощается” классом (классами) эквивалентности. При этом
цепь, будучи поглощенной нулевым классом, уходит в беско-
нечность, если же цепь поглощается ненулевым классом эк-
вивалентности, то ее распределение сходится к собственному
эргодическому распределению.
Критерии возвратности и невозвратности марковской
цепи. Далее приводятся необходимые и достаточные условия
невозвратности марковской цепи в терминах существования ре-
шения некоторой системы линейных уравнений и достаточные
условия возвратности цепи в терминах существования решения
некоторой системы линейных неравенств.
Теорема 2.1.7 (критерий невозвратности цепи). Пусть В
— неприводимая марковская цепь с фазовым пространством
X = {0,1,...} и матрицей переходных вероятностей Р = [Р^-].
Для того, чтобы марковская цепь В была невозвратной, необ-
ходимо и достаточно, чтобы система уравнений
У> = Т^УЬ г = 1,2,...,	(2.1.17)
j=0
имела ограниченное отличное от константы решение.
Доказательство. В неприводимой марковской цепи В с
фазовым пространством X = {0,1,...} и матрицей переходных
2.1. Эргодическая теорема
101
вероятностей Р = [Pjj] вероятности достижения f*G удовлетво-
ряют равенствам
fi0 = Pi0+ Е г = 1,2,...	(2.1.18)
jex\{0}
(см. (1.3.7)). Равенства (2.1.18) означают, что последователь-
ность
2/0 = 1, yj = fj^ 7 = 1,2,...	(2-1.19)
всегда является решением системы (2.1.17).
Если цепь В невозвратная, то найдется j (j = 1,2,...) такое,
что
//о<1
(см. теорему 1.3.7). И следовательно, для невозвратной цепи В
существует ограниченное отличное от константы решение систе-
мы (2.1.17). Таким решением, например, является (2.1.19).
Пусть система (2.1.17) имеет отличное от константы ограни-
ченное решение {у3}:
\yj\ < С < оо, j = 0,1,...
Докажем, что тогда цепь В невозвратная.
Ограниченное отличное от константы решение системы (2.1.17)
можно считать таким, что
2/0 = 1, о <7/, <2, j = 0,1,....	(2.1.20)
В самом деле, вместе с каждым решением {т/Д системы (2.1.17)
его линейное преобразование:
Zj = &2/г + b, i = 0, 1, . . .
(для любых а и Ь) также будет решением этой системы. За счет
выбора а и b для значений
Zj = аУг + b,i = 0,1, ... ,
можно обеспечить выполнение условий
^о = 1, 0 < Zj < 2, i = 0,1,...,
102
Глава 2. Предельные теоремы для марковских цепей
(см. рис. 2.1.1), например, потребовав, чтобы а и b в линейном
преобразовании z = ay + b удовлетворяли системе
( aC + b < 2,
< —aC + b > 0,
ayQ + b= 1
(систему можно решить, выразив b из уравнения ay$ + b = 1 и
подставив его в неравенства).
Так что далее решение {yj} системы (2.1.17) такое, что
2/0 = 1, 0 < у3 < 2, j = 0,1,2...
Далее, вместе с марковской цепью В с матрицей одношаго-
вых переходных вероятностей Р = [Pij] рассмотрим марковскую
цепь В (ее параметры будем “маркировать” значком ~) с матри-
цей одношаговых переходных вероятностей Р = [Pij], у которой
состояние 0 является поглощающим экраном (далее {0} = Со),
а вероятности перехода между другими состояниями те же, что
и в цепи В. Цепь В получена из цепи В превращением состоя-
ния 0 в поглощающий экран. Матрица переходных вероятностей
Р цепи В имеет вид
Р = [А;] =
Ao А)1
Ao А1
Ao Ai
А)2
Р12
Р22
’10	0
Р10 Рц Р12
Р20 Р21 Р22
(2.1.21)
2.1. Эргодическая теорема
103
т. е.
Poo = 1, Poj —0, j =
Р0 =Р0, г = 1,2,..., 7=0,1,...
Каждое из состояний г, i = 1,2,..., в цепи В несущественное
(а следовательно, и невозвратное) — поскольку цепь В неприво-
дима, то состояние 0 достижимо из каждого состояния i (г 0)
в цепи В, а, следовательно, и в цепи В, поскольку Рю = Рю,
i = 1,2,... А так как Со = {0} — поглощающий экран в цепи В,
то состояния i = 1,2,... в цепи В несущественные.
Ограниченное отличное от константы решение {yj} (у$ =
= 1, 0 <	< 2, 7 = 0,1,2...) системы (2.1.17) при каждом
п = 1,2,..., является решением и системы
оо
Vi = 52 г = 0,1,...	(2.1.22)
7=0
В самом деле, {yj} — решение системы
оо
Vi =	i = 0,1,...,
7=0
поскольку при i = 1,2,... уравнения этой системы совпадают
с уравнениями системы (2.1.17), а при i = 0 соответствующее
уравнение последней системы имеет вид
Уо = До • Уо,
или
уо = 1 • уо-
Из
оо
Уг = 52 А7У7, г = 0,1,...,
7=0
ОО
yj = 52 р^Ук, j = о, i,...,
k=0
104
Глава 2. Предельные теоремы для марковских цепей
имеем
оо	оо	оо	оо	оо
У г —	?ij Pjkyk —	У k	?ij Pjk = Pik(^)yk
j=0	к=0	к=0	j=0	к=0
т. е.
оо
yi — Ък^Ук
к=0
и так далее. Так что для каждого п = 1,2,... система (2.1.22)
имеет своим решением ограниченное отличное от константы ре-
шение {yj} системы (2.1.17).
Из (2.1.22) для каждого п = 1,2,... имеем
оо
Vi = ^2 Д/(п)%' - Ло(п)уо = Ао(п), г = о, 1,2,...
j=0
т. е.
ЛоЫ < yi, i = 0,1,2...
Переходя в полученных неравенствах к пределу при п —> оо
в силу теоремы о вероятностях поглощения (см. теорему 2.1.6)
получим
7гДСо)7го < yi, i = 0,1,2,...,
а, учитывая, что тго = 1,
тгДСо) < yi, i = 0,1,2,...
И поскольку
7гДСо) = /*0^ = 0,1,2,...,
то для всех i = 0,1,2,...
f*0 < Уг-
Последовательность {ty} не является постоянной, а уо = 1, по-
этому найдутся такие ук, что у*, < 1 или у*, > 1. Если найдется
Ук < 1, то
fko <Ук<^-
И, следовательно, цепь В невозвратна — у возвратной цепи все
и в частности /£0, равны 1.
2.1. Эргодическая теорема
105
Если все yk > 1, то
Zj = ~Vi + 2, г = 0,1,...
— ограниченное отличное от константы решение системы (2.1.17),
причем Z{ < 1. И мы приходим к уже рассмотренной ситуации.
Тем самым теорема доказана.
Теорема 2.1.8 (достаточное условие возвратности цепи).
Пусть В — неприводимая марковская цепь с фазовым простран-
ством X = {0,1,...} и матрицей переходных вероятностей
Р = [Pjj]. Достаточным условием возвратности цепи В явля-
ется существование стремящегося к +оо решения {уД систе-
мы неравенств
оо
Vi —	Pijyj'") ^ = 1,2,...	(2.1.23)
j=0
Доказательство. Пусть {уД — стремящееся к +оо ре-
шение системы неравенств (2.1.23). Будем считать его положи-
тельным, поскольку вместе с каждым решением {уД системы
(2.1.23) ее решением будет
zj = У1 + j = 0,1,2,...
Решение {yj} системы неравенств (2.1.23) при каждом п =
= 1,2,... является решением и системы неравенств
оо
Уг > 52 г = 0, 1,...
j=0
(2.1.24)
(Pjj и Pjj(n) введены в доказательстве теоремы 2.1.7). В самом
деле, {yj} — решение системы неравенств
Из
Уг > 'P'Pijyj, г = 0,1,...
7=0
ОО
Уг >	г = 0,1,...,
7=0
106
Глава 2. Предельные теоремы для марковских цепей
ОО
yj > ^Pjkyk, j = 0,1,...,
k=o
имеем
оо	оо	/ оо	\	оо
Vi > Pijyj — Pij I PjkVk j — Pik^tyyk-, i — 0, 1, . . . ,
j=0	j=0	\k=0	J	k=0
ИЛИ
oo
yi > Piki.tyyk’) i — 0,1, ... ,
k=0
и так далее. Так что для каждого п = 1,2,... система неравенств
(2.1.24) имеет своим решением стремящееся к +оо решение {т/Д.
системы неравенств (2.1.23).
Из (2.1.24) для каждого п = 1,2,... имеем
М— 1	оо
yi > 52 &АпУУз + 52 ^з^Уз
j=0	j=M
М—1	оо
> 52 Рз&Ууз + ““{yr} 52 Аяп) =
j=0	j=M
М-1	/	М-1	\
= 52 Кз(пУуз+1 - 52	>
j=o	г~ \ j=o J
т. е.
м-1	/	м-i	\
yi > 52 Рз(.пУуз + чрп{уг} 1 - 52 АЯ71) ,«= 1,2,...
j=0	\	j=0	)
Перейдем в этих неравенствах к пределу при п оо. Для
i = 1,2,..., j'	0 получим
lim Рц(п) = 0,
n J
поскольку в цепи В все состояния j = 1,2,... несущественные.
Для $ = 1,2,...hJ = 0b силу теоремы о вероятностях поглоще-
ния
lim Ру (п) = 7Гг(Со)7ГО = 7fj(Co),
2.2. Цепь, описывающая очередь
107
поскольку i = 1,2,... — несущественные состояния, а класс
{0} = Со в цепи В возвратный. Так что в результате предель-
ного перехода имеем
yi > тГг(Со)уо + min{yr}(l - 7fj(C0)), г = 1,2,...
г>М
Отсюда
Перейдем в последнем неравенстве к пределу при М сю. Так
как уп сю при п сю, то и min{?/r} сю при М сю,
г>М
поэтому в пределе имеем
1 - 7Гг(Со) < 0, г = 1,2,...,
и следовательно,
7г»(Со) = 1, i = 1,2,...
А поскольку
= 4 г = 1,2,...,
ТО
/*о = 1, г = 1,2,...
Поэтому цепь В возвратна — в невозвратной цепи хотя бы для
одного i значение f*Q < 1 (см. теорему 1.3.7).
2.2 Дискретная марковская цепь,
описывающая очередь
Важным приложением марковских цепей является теория
массового обслуживания. Рассмотрим одну из простейших ее
задач — обслуживание с ожиданием.
Заявки в случайные моменты времени поступают к месту
обслуживания и становятся в очередь. Обслуживание одной за-
явки занимает фиксированное время — будем считать его рав-
ным 1. За единицу времени обслуживается одна заявка. Начина-
ется и заканчивается обслуживание в целочисленные моменты
времени. Найти распределение длины очереди в момент време-
ни п, если не при всех п, то хотя бы при достаточно больших,
т. е. в установившемся режиме.
108
Глава 2. Предельные теоремы для марковских цепей
Обозначим через цп число заявок, ждущих обслуживания к
моменту времени п — длину очереди из заявок к моменту време-
ни п. Случайную величину цп будем называть состоянием систе-
мы обслуживания в момент времени n, п = 0,1,2,... В течение
времени обслуживания данной заявки могут поступать новые
заявки. Обозначим через £п число заявок, поступивших за пери-
од обслуживания [n, n+ 1), число заявок £п является случайной
величиной, п = 0,1,2,... Будем предполагать, что случайные
величины £n, п = 0,1,..., независимы и одинаково распределе-
ны, каждая с распределением
P{£n = k} = ак, к = 0,1,...
Ясно, что по истечении периода обслуживания [n, n+1) система
из состояния т]п переходит в состояние
?7п+1 = (т?п - 1)+ + 6г, туо = 0, п = 0,1,...	(2.2.1)
Последовательность случайных величин {%} образует мар-
ковскую цепь. Чтобы убедиться в этом, проверим, что для {г?п}
выполняется марковское свойство. Имеем, учитывая, что слу-
чайные величины {£„} независимы,
Р{%+1 = j\fln = г, Vn-1 = in-i,..., г)0 = г0} =
= Р{(% - 1)+ + U = j \т]п = г,Tjn-i = in-i,..., Tfo = г0} =
= Р{(г - 1)+ + 6г = j, Tin = г, ??n-i = гп-!,.. , г?0 = г0} =
Р{т]п = г, r/n-i = in-i,..., г)0 = г0}
= Р{(г - 1)+ + 6г = j} = P{£n = j-(i- 1)+}.
Аналогично
Р{%+1 = j\Tln = о = Р{6г = j - G - 1)+}-	(2.2.2)
Так что последовательность случайных величин {т/п} — длина
очереди из заявок, ждущих обслуживания к моменту тг, обла-
дает марковским свойством, и, следовательно, является марков-
ской цепью. Элементы матрицы переходных вероятностей этой
цепи (см. 2.2.2) имеют вид
pij = Р{т1п+1 = j\Tln = г} = P{£n = j - (г - 1)+}, г, j = 0,1,...
(чтобы цепь за период обслуживания перешла из состояния i
в состояние за этот период должно поступить j — (г — 1)+
2.2. Цепь, описывающая очередь
109
заявок). Цепь стационарная — переходные вероятности Pjj не
зависит от п, поскольку £п одинаково распределены.
Поскольку £п — неотрицательная целочисленная случайная
величина с распределением
P&n = к} = ak, к = 0,1,...
(значения Р{£п = к} = 0, к = — 1, —2,...), то элементы
Pij = Pttn =	1)+}, i,j = 0,1,...
матрицы переходных вероятностей Р можно записать в следую-
щем виде: элементы первой строки (г = 0)
Poj = Р{£п = j - (о - 1)+} = Жг = Л = aj, j = 0,l,...,
а элементы, начиная со второй строки (i > 1), j = 0,1,...,
P0 = PR„=j-(i-l)+} =
= PRn=j-G-l)} = aj_(i_1))	(2.2.3)
при j — (i — 1) <0 значения	= 0. Матрица переходных
вероятностей цепи
Р= [Ру] =
ао
ао
0
0
ai а2 аз
ai а2 аз
ао ai az
0 ао ai
Далее будем предполагать, что к = 0,1,..., строго боль-
ше нуля. Это предположение обеспечивает неприводимость це-
пи {т)п}.
Среднее число заявок и распределение длины очере-
ди. Интуитивно ясно, что если среднее число заявок
Л/= ка^,
к
которые поступают за время обслуживания данной заявки, боль-
ше числа заявок, обслуживаемых за период (здесь больше 1):
52> х>
к
110 Глава 2. Предельные теоремы для марковских цепей
то с ростом п длина г]п очереди заявок будет неограниченно
возрастать. Если же среднее число заявок ^kak, поступивших
к
за период обслуживания, меньше 1:
< 1,
к
то естественно ожидать, что распределение длины очереди долж-
но стремиться к некоторому стационарному (равновесному) рас-
пределению.
Теорема 2.2.1. Если в марковской цепи
Лп+1 = (% - 1)+ + Сп, % = О, п = 0, 1, . . . ,
описывающей очередь,
оо
> 1,
k=0
и > 0, к = 0,1,..., то цепь {г]п} является невозвратной и,
как следствие, сходится по вероятности к сю.
Доказательство. Условие
ак > 0, к = 0,1,...,
обеспечивает неприводимость марковской цепи. Покажем, что
если
оо
^kak > 1,
k=o
то система уравнений
оо
Vi — ^ijyj’» ~ 2,...	(2.2.4)
j=0
имеет ограниченное отличное от константы решение, что, со-
гласно теореме 2.1.7, является достаточным условием невозврат-
ности цепи.
Будем искать решение системы (2.2.4) в виде
Уз =	.7 = ОД,,
2.2. Цепь, описывающая очередь
111
где х — число из промежутка (0; 1), т. е. убедимся в существова-
нии числа хо 6 (0; 1) такого, что yj = Xq, j = 0,1,..., является
решением (2.2.4).
Если yj = х3, j = 0,1,..., — решение системы (2.2.4), то
^PijXj = х\ i = 1,2,...	(2.2.5)
j=0
А поскольку, начиная со второй строки, т. е. при i > 1, элементы
матрицы Р = [Pij] имеют вид
= aj-^-ip
причем при j — (г — 1) < 0 значение aj_^_^ = 0, то
оо	оо	оо
52 РИх3 = 52 «7-0-1)^ = 52	г = 1,2,...,
j=0	j=0	j=i-l
и систему (2.2.5) можно переписать в виде
оо
— (г—1)*^ = > 1 = 1,2,...,
j=i-l
ИЛИ
оо
£	= х, i = 1,2,...,
.7=2-1
или
оо
^2akxk = х, i — 1,2, • • •
к=0
(все уравнения системы оказались одинаковыми).
Убедимся, что уравнение
/(х) = X,
оо
где f(x) = akx\ имеет решение на промежутке (0,1).
к=о
112
Глава 2. Предельные теоремы для марковских цепей
Рассмотрим непрерывную на [0,1] функцию
F(x) = f(x) ~ х-
Для F(x) имеем
F(0) = /(0) = а0 > 0;
ОО
F(l) = /(1)-1 = $>*-1 = 0,
k=0
оо
F'(x) = f’(x) - 1 = 5? kakxk~1 - 1,
k=i
oo
F'(l) = $>afe - 1 > 0,
k=l
последнее неравенство имеет место в силу условия теоремы. По-
этому на промежутке (0,1) найдется точка, в которой F(x) от-
рицательна. И поскольку F(x) непрерывна на [0,1], существует
точка xq 6 (0; 1), такая, что
F(xq) = f(xQ) - хо = 0,
или, что то же,
оо
^акх% = х0,
к=0
а в исходных обозначениях
оо
Fij Xq — Xq у i — 1,2,...
j=0
Вектор
Уд =хф j = 0,1,...
является ограниченным отличным от константы решением
системы (2.2.4), что влечет невозвратность цепи {т/п}.
Неприводимая невозвратная, а, значит, и нулевая цепь {т/п}
с фазовым пространством X = {0,1,...} при п —> оо сходится
по вероятности к +оо (см. следствие из теоремы 1.3.4). Послед-
нее означает неограниченный рост длины очереди с течением
времени.
Утверждение, аналогичное теореме 2.2.1 имеет место, если
за единицу времени обслуживается s заявок.
2.2. Цепь, описывающая очередь
113
Теорема 2.2.2. Если в марковской цепи
7?п+1 = (% - «)+ + 6г, % = О, П = 0, 1, . . . ,
описывающей очередь,
оо
52 ka* >s'
k=0
и > 0, к = 0,1,..., то цепь {г]п} является невозвратной и,
как следствие, сходится по вероятности к +оо.
Теорема 2.2.3. Если в марковской цепи
Vn+l = (jin - 1)+ + £п, % = О, П = 0, 1, . . . ,
описывающей очередь,
оо
52 ка* < х>
к=0
и > 0, к = 0,1,..., то цепь {г]п} является возвратной и, как
следствие, ее распределение сходится к эргодическому распре-
делению.
Доказательство. Условие
> 0, к = 0,1,...,
обеспечивает неприводимость и непериодичность марковской це-
пи. Покажем, что в предположении
оо
52 как <1
к=0
система неравенств
оо
Vi > РцУ;Ь ^—1,2,...,
j=0
имеет решение, стремящееся к +оо, что согласно теореме 2.1.8,
является достаточным условием возвратности цепи {т/п}, а, сле-
довательно, и ее эргодичности. Таким решением, в частности,
является
yj = 3, 3 = ОД, • • •
114
Глава 2. Предельные теоремы для марковских цепей
Убедимся в этом. Учитывая вид матрицы переходных вероятнос-
тей цепи, описывающей очередь (см. (2.2.3)), имеем:
оо	оо	оо
У2 ^0^ — У2а.7-(г-1)7 = У? —
j=0	j=0	j=i-l
оо	оо
= 52 aJ-(i-l)0' - (« - !)) + 52 «j-(i-l)G “ 1) =
j=?-l	j=i-l
oo	oo
= У2 kak + G — 1) = У2 kak — 1 + 2 < 2,
k=Q	k=0
i = 1,2,... Так что
г >	г = 1,2,...,
j=0
и, следовательно, в силу теоремы 2.1.8 цепь {т)п} возвратная.
Согласно теореме 2.1.3 распределение возвратной неприво-
димой непериодической цепи сходится к эргодическому распре-
делению. Последнее обозначает, что распределение длины оче-
реди с течением времени стремится к предельному распределе-
нию.
Утверждение, аналогичное теореме 2.2.3 имеет место, если
за единицу времени обслуживается s заявок.
Теорема 2.2.4. Если в марковской цепи
7?п+1 = (»7п - «)+ + £п, % = 0, п = 0, 1, . . . ,
описывающей очередь,
оо
k=0
< s,
uak > 0, к = 0,1,..., mo цепь {г]п} является возвратной и, как
следствие, ее распределение сходится к эргодическому распре-
делению.
2.3. Задача о разорении игрока
115
2.3 Задача о разорении игрока
Игрок Gm (с капиталом т) играет в азартную игру с игро-
ком Gm (с капиталом М), участвуя в серии последовательных
партий игры. В результате каждой партии капитал игрока Gm
с вероятностью р увеличивается на 1 (за счет игрока Gm) и с
вероятностью q = 1 — р уменьшается на 1 (в пользу игрока Gm)-
Результат каждой партии не зависит от результатов предыду-
щих партий. Если капитал одного из игроков становится равным
нулю, то игрок разоряется, игра прекращается. Найти вероят-
ность разорения игрока Gm.
Обозначим через капитал игрока Gm после k-й партии.
Последовательность случайных величин {£&} образует марков-
скую цепь, см. пример 1.1.2 (с. 13). Множеством состояний мар-
ковской цепи {£ь} является {0,1,..., п}, где п = т + М -— сум-
марный капитал игроков. Матрица переходных вероятностей це-
пи {£ь} имеет вид
р =	’10 0 0 q 0 р 0		... 0 0 ... 0 0 ... 0 0	0 ‘ 0 0	(2.3.1)
	0 q 0	р			
	6 6 6	6	... q 6	р	
	ООО	0	... 0 0	1 _	
Состояния 1,2,... ,п — 1 несущественные. Состояния 0 и п яв-
ляются поглощающими экранами, цепь, попав в поглощающее
состояние, остается в нем навсегда. Далее класс {0} будем обо-
значать через Со, а класс {п} — через Сп-
В терминах марковской цепи {£&} вероятность разорения иг-
рока Gm — это вероятность поглощения цепи классом Со- И, сле-
довательно, задача “найти вероятность разорения игрока Gm” в
терминах марковской цепи {£&} формулируется так: “найти ве-
роятность поглощения цепи {£&} классом Со”.
Уравнения для вероятностей поглощения. Пусть {Са}
— марковская цепь с матрицей переходных вероятностей [Р^-],
С — некоторый ее класс эквивалентности, Т — множество всех
несущественных состояний цепи, i — несущественное состояние
цепи. Через тгДС), как и ранее, будем обозначать вероятность
того, что цепь, стартуя из несущественного состояния г, рано
или поздно достигнет класса С, и, следовательно, будет им по-
глощена, а через тг[к\с) — вероятность того, что цепь, стартуя
116
Глава 2. Предельные теоремы для марковских цепей
из состояния г, достигнет класса С на k-м шаге (74(G) будем
называть вероятностью поглощения цепи классом С, а тг^\с)
— вероятностью поглощения цепи классом С на fc-м шаге).
Вероятности поглощения 74(G), г е Т, классом С цепи с
матрицей переходных вероятностей [Pij], удовлетворяют сис-
теме линейных уравнений
7Г,(С) = тгг(1)(С) + £Pi^C), i е Т. (2.3.2)
зет
Заметим, что тг^(С) вычисляется по элементам матрицы пере-
ходных вероятностей [Р^] :
^1)(C') = EPV’
зес
Вероятность разорения игрока, играющего с партне-
ром, капитал которого ограничен. Марковская цепь {£&},
описывающая размер капитала игрока Gm, играющего с партне-
ром Gm, капитал М которого ограничен, имеет конечное число
состояний: O,l,...,n(n = m + M — суммарный капитал игроков
Gm и Gm) и её матрица переходных вероятностей [Р^] имеет вид
(2.3.1).
Вероятность разорения игрока Gm, накопившего капитал до
размера i, равна вероятности поглощения тгДСо) цепи классом
Go = {0}, г = 1,2,... ,п — 1. Найдем вероятности
щ = тъ(Св), г = 1,2,... ,п — 1,
как решение системы уравнений (2.3.2), когда С = Go = {0},
матрица переходных вероятностей Р имеет вид (2.3.1), класс Т =
= {1,2,..., тг — 1}. При этом система (2.3.2) запишется так:
п—1
7гг(С’о) = тгг(1)(С’о) +^PyTTj^’o), г = 1,2,... ,п — 1,	(2.3.3)
где
тг^Со) = Е Pv = Е	• ’п-
jeco je{0}
2.3. Задача о разорении игрока
117
или так:
щ = Рю + Pijuj) i — 1,2,... ,п — 1.	(2.3.4)
J=i
Первое уравнение (соответствующее i = 1) системы (2.3.4) за-
пишется так:
их = q + puz-
Уравнения системы (2.3.4) для i = 2,3,..., п — 2 имеют вид
щ = quj-i + рщ±х-
Последнее уравнение (при i = п — 1) системы (2.3.4) имеет вид
^п—1 = q^n—2-
Так что система (2.3.4) запишется так:
их = q + pu2,
U2	=
<	щ	=	qui-x + рщ+х,	(2.3.5)
un-2	=	qun-3+pun_x,
un—i	— qun—2-
Будем искать	решение системы (2.3.5) отдельно для случая
q р и для случая q = р = 1/2.
Пусть q р. Сначала найдем решение системы
щ = qui-x + pui+x, i = 2,3,... ,п — 2.	(2.3.6)
Будем искать решение в виде щ = хг, i = 2,3,... ,п — 2. Под-
ставляя щ = хг, i = 2,3,..., п — 2, в уравнения
щ = qu^x + pui+x, i = 2,3,... ,п — 2,
получим:
хг = qx1-1 +рхг+\ i = 2,3,... ,п - 2,
или
рх2 + q = х.
118
Глава 2. Предельные теоремы для марковских цепей
Это квадратное уравнение имеет два решения: х = 1 и х =
= q/p-
При х = 1 имеем
Щ =	= хг = 1, i = 2,3,..., п — 2.
Но щ, i = 2,3,... ,п — 2, -— вероятности поглощения цепи клас-
сом Со, и они не могут быть равны 1, поскольку цепь с ненуле-
вой вероятностью может быть поглощена и классом Сп = {п},
поэтому решение тгДСо) = щ = 1, i = 2,3,..., п — 2, системы
(2.3.6) мы не можем рассматривать в качестве вероятностей по-
глощения классом Со-
Для х = q/p -— второго корня квадратного уравнения — име-
ем такое решение системы (2.3.6):
/ q\i
Uj = ( - I , i = 2,3,..., n — 2.
\PJ
Вместе с решением щ, i = 2,3,..., n — 2, системы уравнений
(2.3.6), ее решением является и
А + Вщ, г = 2,3,..., п — 2,
для любых констант А и В (в последнем убеждаемся непосред-
ственной проверкой). Выберем константы А и В так, чтобы это
решение было решением также первого и последнего уравнений
системы (2.3.5).
Из первого уравнения
u\ = q + pu2
системы (2.3.5) имеем:
А + Buy = q + р(А + Виъ),
А(1 - р) = q + B(pu2 - гн),
Aq = q + B(p(l\2-Я),
\ \Р/ Р/
Aq = q - Bq,
А + В = 1.
2.3. Задача о разорении игрока
119
Из последнего уравнения
un—1 — Q^n—2
системы (2.3.5) получаем:
А + Bun-i = q(A + Btin-2),
A(l-q) = B(qun-2 - un_
/ / \ n-2
п—1
Ар = В
Ар = -В
P '
Apn + Bqn = 0.
Таким образом, для определения А и В имеем систему уравне-
ний
А + В = 1,
Арп + Bqn = 0.
Отсюда
qn
(1-В)рп + В^п=0,
рп
В = —---------,
рп _ qn
рп
А = 1 - В = 1--------= -
рп — qn qn _ рп
И следовательно, решением системы (2.3.5), если q р, является
Uj = А + В
qn
рп
qn _ рп рп _ qn
=	1	(ап _ vn (Я VA = (д/р)' - (g/p)n
g"-pnV р \р) J i-(q/p)n
i = 1,2,... , n — 1.
Так что при q р игрок Gm, имея накопленный капитал г,
разорится с вероятностью
(q/рУ - (.q/рУ , 9	.
-------:——-----, Г = 1, 2, . . . ,П — 1.
1 - (q/p)n
120
Глава 2. Предельные теоремы для марковских цепей
Заметим, что вероятность разорения игрока Gm не зависит от
его начального капитала т, она определяется капиталом г, на-
копленным им к данному моменту.
Рассмотрим теперь случай, когда q = р = 1/2 . Система
(2.3.5) перепишется так:
f u\ = 1/2 + u2/2,
u2 = ui/2 + us/2,
<	Uj —	1/2 + 712+1/2,
^n—2 —	з/2 + Un—1/2,
<	Un— 1	— Un — 2/2.
Решением системы
является
Ui — i, i — 2,3,... ,n 2,
в этом убеждаемся непосредственной проверкой. Легко видеть,
что вместе с решением щ решением последней системы будет и
А	+ Вщ = А + Bi, i = 2,3,... ,n — 2.
Выберем теперь А и В так, чтобы это решение было также ре-
шением первого и последнего уравнений системы. Для первого
уравнения имеем
Л + В = | + |(Л + 2В).
Отсюда
А = 1.
Для последнего уравнения
1
un—1 — 2^п—2
системы имеем
А + В(п - 1) =	+ В(п - 2)).
2.3. Задача о разорении игрока
121
Отсюда
и, следовательно, решением системы (2.3.5), если q = р = 1/2
является
i
щ = 1-----, г = 1,2,... ,п — 1.
п
Так что если игрок Gm, с вероятностью р = 1/2 увеличивая свой
капитал на 1 в результате каждой партии (и с вероятностью
1/2 теряя единицу капитала), стал обладателем капитала г, то
вероятность его разорения
г
ur = 1----, г = 1,2,..., п — 1,
п
а вероятность неразорения
г
1 — ur = г = 1,2,..., п — 1,
п
пропорциональна величине г накопленного капитала.
Замечание. Аналогичные выкладки показывают, что ве-
роятность vr разорения игрока Gm, если он накопил капитал г,
равна
1 — ur, г = 1,2,..., п — 1.
Вероятность разорения игрока, играющего с беско-
нечно богатым партнером. Пусть теперь игрок Gm играет с
игроком Gqo, капитал которого неограничен (равен +оо). Мат-
рица переходных вероятностей марковской цепи {£&}, описыва-
ющей размер капитала игрока Gm, имеет вид
1
Q
О
Р =
ООО
О р О
q о р
(2.3.7)
состояние 0 (Cq = {0}) цепи является поглощающим, состояния
1,2,... — несущественные.
Система уравнений (2.3.2) для вероятностей щ = тгДС),
i 6 Г, поглощения цепи классом G, когда матрица переход-
ных вероятностей цепи имеет вид (2.3.7), класс Go = {0}, а
Т = {1,2,...} запишется так:
( ui = q + pu2,
I Щ = qui-i + pui+i, i = 2,3,...
(2.3.8)
122
Глава 2. Предельные теоремы для марковских цепей
Решение последней системы получаем так же, как и в случае
игры с игроком Gm, капитал которого ограничен.
Сначала найдем решение системы
щ = quj-i +pui+i, i = 2,3,...
При q p ее решением является последовательность
щ = А + в(^ , г = 2,3,...,
если q = р = 1/2, то решением является последовательность
щ = А + В • i, i = 2,3,...
При q/p > 1 и при р = <7 = 1/2из условия ограниченности
решения щ, i = 2,3,, получаем, что В = 0, и, следовательно,
как при q > р, так и при р = q = 1/2 решение системы
щ = qui-i +p^+i, i = 2,3,...,
имеет вид
Uj = A, i = 2,3,...
Выберем А так, чтобы последовательность щ = А, г = 1,2,3,...
была решением и уравнения
u\ = q + pu2
системы (2.3.8). Для этого А должно удовлетворять уравнению
А = q + рА.
Отсюда А = 1 и, следовательно, решением системы (2.3.8) яв-
ляется
щ = 1, i = 1,2,...,
т. е.
7г(Со) = щ = 1, i = 1,2,...
Последнее означает, что если q > р, то игрок Gm, играя с иг-
роком Gqo, капитал которого неограничен, неизбежно разорится
(вероятность разорения равна 1) вне зависимости от размера его
начального капитала.
Если вероятность р выигрыша игрока Gm больше вероятнос-
ти q выигрыша игрока Goo, т. е. р > q, то для получения выводов
2.3. Задача о разорении игрока
123
о вероятности 7гг(Со) разорения игрока Gm, играющего с игро-
ком Gqo, капитал которого неограничен, воспользуемся резуль-
татом, полученным в задаче о разорении игрока Gm, играющего
с игроком Gm, капитал М которого ограничен.
В качестве вероятности разорения 7rr(Go) игрока Gm, игра-
ющего с игроком Gqo, естественно рассмотреть предельное зна-
чение вероятности
ur = ur(n) =
(q/рУ - (q/p)n
i - {.q/p)n
разорения игрока Gm при п = М + т^оо — при неограничен-
ном росте капитала М игрока Gm, а именно
7Гг(С0) = (q/pY, Г = 1,2,...
Из последнего равенства следует, что чем больше накопленный
капитал г игрока Gm и чем больше вероятность р выигрыша
игрока Gm в одной партии, тем меньше вероятность 7rr(Go) его
разорения, что вполне согласуется с нашей интуицией.
Если, к примеру, р = 2/Зиг = 10, то вероятность разорения
игрока Gm, играющего с бесконечно богатым игроком, равна
/дУ=р/3У°= 1
\р)	\2/з)	1024’
а вероятность того, что игрок не разорится, естественно, равна
1 - 1/1024.
Интересно, что если вероятность р выигрыша игрока Gm
больше вероятности q выигрыша игрока G^, то игрок Gm с
вероятностью 1 — (q/p)r не только не разорится, но с ростом
числа к сыгранных партий неограниченно увеличит свой капи-
тал.
В самом деле, пусть игрок Gm начинает игру с капиталом г.
Покажем, что для любого целого положительного L при
fc —> (X)
P{£k > L} -+ 1 - тгг(Со) = 1 - (j) .
Очевидно,
Ш <L} = P{£k € Co} + P{1 < Cfc < L}.
(2.3.9)
124
Глава 2. Предельные теоремы для марковских цепей
По определению
оо	к	оо
тгг(Со) = £тг^(С0) = 2>W(Co)+ £ 7Г^(Со),
S=1	S=1	s = fc+l
и т. к.
к
Е^(С0) = Р{£к G Со},
S=1
то
тгг(Со) = Р{& G Со} + £ тг^(Со).
s=fc+l
Поэтому при А) —> СЮ
Р{£к е Со} -+ 7ГГ(СО).	(2.3.10)
Оценим сверху Р{1 <	< L}. Воспользовавшись соотношением
(1.1.8), получим
L	L оо	L
Р{1 < 4 < L} = ^Р{^к = j} =
j=l	j=l i=l	j=l
(для i У г значения pi = 0, a pr = 1 — цепь стартует из состо-
яния г). И поскольку состояния j = 1,2,..., L несущественные,
а, следовательно, и невозвратные, то Prj(k) 0 при к сю.
Поэтому для любого е > 0 при достаточно больших к
Р{1 < & < L} < г.
Из последнего неравенства и соотношений (2.3.9), (2.3.10) полу-
чаем, что для каждого L при fc —> сю
Р{£к > L} 1 - 7ГГ(СО) = 1 - (q/p)r.
Если у игрока Gm, играющего с бесконечно богатым игро-
ком Gqo, вероятность р выигрыша в одной партии равна, напри-
мер, 2/3, то он, начиная игру с капиталом m = 10, с вероят-
ностью
неограниченно увеличит свой капитал (ну очень разбогатеет).
2.4. Примеры и задачи
125
2.4 Примеры и задачи
Примеры
Пример 2.4.1. Пусть марковская цепь задана матрицей
одношаговых переходных вероятностей
Р =
Г 4/5
3/5
О
О
L 1/5
1/5
1/5
4/5
О
1/5
О О
1/5 О
1/5 О
О 1
1/5 1/5
0 1
О
О
О
1/5 J
Найти ПтД7(п) для всех пар i,j = 1,2,... ,5, если
п J
пределы существуют.
Решение. Классы Ci = {1,2,3}, С? = {4} возвратные нену-
левые непериодические, состояние {5} — несущественное.
Для вычисления 7Г5(С'1)>7Г5(С2) воспользуемся тем, что
ОО	оо
тг5(С1) = £ £	= £(тг^(ед +	+ ^(сд),
у=1 keCi	12=1
(см. обозначения в доказательстве теоремы 2.1.6). Аналогично
ОО	1 ОО	1
12=1	12=1
так что
= 3/4.
Для класса Сд
^(Сг) = £	= | + ^ + /; + -- - = /
12=1
Далее предельное поведение Pij{n) исследуется аналогично
тому, как это делалось в примере 2.1.3.
126
Глава 2. Предельные теоремы для марковских цепей
Задачи
Задача 2.1. 1) Доказать, что у конечной неприводимой непе-
риодической марковской цепи существует собственное стацио-
нарное распределение.
2) Доказать, что у конечной неприводимой непериодической
марковской цепи существуют пределы
lim Рц(п),
n J
причем их значения отличны от нуля.
Указание к п. 1. Описанная цепь ненулевая, а, следова-
тельно, возвратная, поэтому существует эргодическое распреде-
ление. Далее воспользоваться теоремой 2.1.4.
Задача 2.2. В двух урнах находится 8 шаров — в первой
4 белых, во второй 4 черных.
Из каждой урны наудачу выбирают по шару и переклады-
вают из одной урны в другую. Пусть £п — число белых шаров в
первой урне после n-го перекладывания. Предположим, что ша-
ры можно перекладывать неограниченное число раз (п оо).
Найти предельное распределение числа белых шаров в пер-
вой урне (если такое распределение существует).
Указание. Убедиться, что последовательность {£п} явля-
ется марковской цепью.
Предельные значения lim Р{£п — к} совпадают с эргодичес-
п
ким распределением {л*;}:
1	16	36	16	1
ТГО - уд, 7Г1 - —, 7Г2 — —, 7Г3 — —, 7Г4 - —.
Задача 2.3. В двух урнах находится 6 шаров (по 3 в каждой)
среди них 3 белых и 3 черных.
Из каждой урны наудачу выбирают по шару и переклады-
вают из одной урны в другую. Пусть £п — число белых шаров в
первой урне после n-го перекладывания. Предположим, что ша-
ры можно перекладывать неограниченное число раз (п оо).
Найти предельное распределение при п —> оо, т. е.
limР{£п = к}, /с = 0,1,2,3,
п
(если такое распределение существует).
Указание. Убедиться, что последовательность {£п} явля-
ется марковской цепью. Значения
limР{£п = к} = тг&, /с = 0,1,2,3.
п
2.4. Примеры и задачи
127
Матрица переходных вероятностей цепи
’О	1	0	0‘
1/9 4/9 4/9	О
О 4/9 4/9 1/9
0	0	10
Эргодическое распределение цепи
19	9	1
770 - 20’	“ 20’ 71-2 “ 20’ 773 “ 20’
Задача 2.4. Монету, вероятность выпадения герба кото-
рой равна р (0 < р < 1), подбрасывают независимым образом
неограниченное число раз. Пусть — число выпавших гербов
при fc-м подбрасывании монеты, к = 1,2,... Рассмотрим после-
довательность случайных величин
TJn+1 = (Лп + l)-f{i}(6г), % = о, п = 0,1,2,...
Вычислить
limР{т)п = к}, к = 0,1,2,...,
п
если эти пределы существуют.
Задача 2.5. Симметричную игральную кость подбрасыва-
ют независимым образом неограниченное число раз. Пусть —
число выпавших шестерок при к-м подбрасывании кости,
к = 1,2,... Рассмотрим последовательность случайных величин
Vn+I = (»7n + 1)/{6}(&i), % = о, п = 0,1,2,...
Вычислить
limР{т)п = fc}, к = 0,1,2,...
п
если эти пределы существуют.
Задача 2.6. Марковская цепь с фазовым пространством
X = {1,2,3} описывается матрицей переходных вероятностей:
' 1/4 3/4	0 '
1/4 1/4 1/2 .
0	1/4 3/4 .
Найти limPn(n), если он существует.
п
Ответ: ИтРц(п) = 1/10.
128
Глава 2. Предельные теоремы для марковских цепей
Задача 2.7. Марковская цепь с фазовым пространством
X = {1,2,3} описывается матрицей одношаговых переходных
вероятностей
Г 1/2 1/2	0 ‘
1/4 1/2 1/4 .
О 1/2 1/2
Существует ли предел limP22(^)? Если существует — найти
п
его.
Ответ: limP22(^) = 1/2.
п
Задача 2.8. Марковская цепь с фазовым пространством
X = {1,2,3} описывается матрицей переходных вероятностей
’ 1/4 3/4	0	‘
1/4 1/2 1/4
О 1/4 3/4
Задано распределение цепи в момент времени t = 0 (начальное
распределение):
(1	2	3 \
3/8 1/4 3/8 )•
Вычислить
limР{£п = к}, к = 1,2,3.
п
Указание. Воспользуйтесь следствием из эргодической тео-
ремы 2.1.2 и теоремой 2.1.4 (о стационарном и эргодическом рас-
пределении).
Ответ:
lim Р{£п = 1} = 1/7, lim Р{£п = 2} = 3/7, lim Р{£п = 3} = 3/7.
Значения пределов не зависят от начального распределения.
Задача 2.9. Рассматривается марковская цепь с фазовым
пространством X = {1,2,3,4}, описываемая матрицей переход-
ных вероятностей
2/3 1/3 О О
1/3 1/3 1/3 О
О 1/3 2/3 О
0	0	0	1
Вычислить limР^-(п), г, j = 1,2,3,4, если эти пределы сущест-
вуют.
2А. Примеры и задачи
129
Задача 2.10. Рассматривается марковская цепь с фазовым
пространством {1,2,3}, описываемая матрицей одношаговых пе-
реходных вероятностей
’ 4/5 1/5	0	‘
3/5 1/5 1/5
О 4/5 1/5
1° Существует ли lim Рц(п)?
п
2° Если существует ИтРц(п), найти его.
Ответ: ИтРц(п) = 12/17.
Задача 2.11. Рассматривается марковская цепь с фазовым
пространством {1,2,3,4,5}, описываемая матрицей одношаго-
вых переходных вероятностей
Г 1/3	2/3	0	0	0	Я
1/3	1/3	1/3	0	0
0	1/3	0	2/3	0	.
0	0	1/3	0	2/3
. 0	0	0	1/3 2/3 .
Классифицировать состояния марковской цепи. Для возврат-
ных состояний найти математическое ожидание времени перво-
го возвращения в состояние.
Ответ: Мтг = 17, Мт2 = 17/2, Мт3 = 17/2, Мт4 = 17/4,
Мт5 = 17/8.
Задача 2.12. Рассматривается марковская цепь с фазовым
пространством {1,2,3}, описываемая матрицей одношаговых пе-
реходных вероятностей
’ 4/5 1/5	0 ‘
3/5 1/5 1/5 .
0	4/5 1/5
Задано начальное распределение цепи (распределение в мо-
мент времени 0):
1	2	3 \
1/10 4/5 1/10 )•
Вычислить limР{£п = к}, к = 1,2,3.
130
Глава 2. Предельные теоремы для марковских цепей
Задача 2.13. Рассматривается марковская цепь с фазовым
пространством {1,2,3,4}, описываемая матрицей одношаговых
переходных вероятностей
’ 3/4 1/4 О О
1/4 1/2 1/4 О
О 1/4 1/2 1/4
О 0	1/2	1/2
1° Можно ли утверждать, что limP^n) существует?
п
2° Если ИтРз2(п) существует, найти его.
п
3° Вычислить математическое ожидание времени первого воз-
вращения в состояние 2.
Задача 2.14. Классифицировать состояния цепи Маркова с
матрицей одношаговых переходных вероятностей
Г 1/2	0	1/2	0	0	“I
0	10	0	0
0	0	1/2	1/4	1/4
0	0	2/3	1/6	1/6
. 0	0 1/3 1/3 1/3 .
и вычислить lim Рц(п), если эти пределы существуют.
Для возвратных состояний найти математическое ожидание
времени первого возвращения.
Задача 2.15. Найти предельное распределение марковской
цепи, заданной матрицей одношаговых переходных вероятнос-
тей
0
1/4
1/5
1/5
4/5
0
1/4
0	0	0	-1
1/5	0	0
1/5	0	0
0	1	0
1/4	1/4	0
Указание. См. пример 2.1.3.
Задача 2.16. Рассматривается марковская цепь {£п} с фа-
зовым пространством X = {1,2,3} и матрицей одношаговых
переходных вероятностей
’ 1/4 3/4	0 '
Р= 1/4 1/4 1/2
0	1/4 3/4
2А. Примеры и задачи
131
Задано распределение цепи в момент времени t = 0:
1	2 Ч \
1/4 1/2 1/4 J'
Вычислить limР{£п — к}, к = 1,2,3.
Ответ: lim Р{£п = 1} = 1/10, lim Р{£п = 2} = 3/10,
lim P{^n = 3f= 6/10.
Задача 2.17. Классифицировать состояния цепи Маркова с
матрицей одношаговых переходных вероятностей
Г 1/8
0
о
о
о
Р =
1/2	1/8	1/8
1	о	о
0	1/2	1/4
0	2/3	1/6
0	1/3	1/3
1/8 I
о
1/4
1/6
1/3 J
Найти предельное распределение марковской цепи.
Задача 2.18. Найти предельные значения Pij(n) для мар-
ковских цепей, заданных матрицами одношаговых переходных
вероятностей:
’ 0 1/3 2/3 ‘
0 2/3 1/3
1 о о
0 0 1/3 2/3
О 0 2/3 1/3
0 10	О
10 0	О
Задача 2.19. Найти предельные значения Ру(п) для мар-
ковской цепи, заданной матрицей одношаговых переходных ве-
роятностей
О 0	0 1'
О 0	10
1/4 3/4 О О
1/2 1/2 О О
132
Глава 2. Предельные теоремы для марковских цепей
Задача 2.20. Пусть марковская цепь задана матрицей од-
ношаговых переходных вероятностей
р =	Г V2 1/4 1/4 1/2 1/4 1/4 0	0 1/4 1/4
1/4	0	0	-1
1/4	0	0
1/2	0	0
О	1	О
О	1/4	1/4
Найти lim Ру (п) для всех пар (г, J).
Задача 2.21. Для марковской цепи с матрицей одношаго-
вых переходных вероятностей
’ 3/4 1/4 0	0	0	0 
О	3/4	1/400	О
р_ 1/4	0	3/4 О О	О
1/4 1/4 1/4 0	0	1/4'
1/5	1/5	1/5 0 1/5	1/5
.0	О	ООО	1
Вычислить lim Ру (n), i, j = 1,2,... 6, если эти пределы сущест-
п
вуют.
Ответ. Классы эквивалентности — С± = {1,2,3}, С2 = {6};
состояния {4} и {5} — несущественные.
limP^n) = 7Г4(С1)тг2, i = 1,2,3;
п
limP5i(n) =	i = 1,2,3;
п
limP56(n) = 7г5(С2)7г6; limP46(n) = тгДС^тгв-
п	п
Далее см. пример 2.4.1.
Задача 2.22. Для марковской цепи с матрицей одношаго-
вых переходных вероятностей
Г 3/4	1/4	О	О	О	О I
1/2	1/2	0	0	0	О
1/4	1/4	1/5	0	1/5	1/10
1/10	1/5	0	1/2	1/10	1/10
О	0	0	0	1/5	4/5
О	0	0	0	2/5	3/5
вычислить limРу(n), i,j = 1,2,...6, если эти пределы суще-
п
ствуют.
2А. Примеры и задачи
133
Задача 2.23. Для марковских цепей {^п}, {^п} , описанных в
задаче 1.11, найти: 1) lim Р^(п), г, j = 1,2,.. .6 (если эти преде-
лы существуют); 2) предельные распределения этих марковских
цепей (если они существуют).
Вычислить математические ожидания времени первого воз-
вращения в состояние.
Ответ.
1) Заметим, что состояния 2,3,... ,6 несущественные, а сос-
тояние 1 является поглощающим экраном.
Для i 1
6
£Ру(п) = 1.	(2.4.1)
J=1
Поскольку при j 1 значения lim Pij(n) = 0 — состояния i^j =
= 2,3, ...,6, несущественные, то переходя в равенстве (2.4.1)
к пределу при п оо, получим ИтРи(^) — 1-
2) Марковская цепь {0п} неприводимая, непериодическая,
возвратная, ненулевая. Поэтому существует эргодическое рас-
пределение
lim Pij(n) = 7Tj, j = 1,2,... 6
и оно совпадает с собственным стационарным распределением,
т. е. удовлетворяет системе
7Г,
1.
Подробнее эта система перепишется так:
7Г1	+	7Г2	+	7ГЗ	+	7Г4	+	ТГ5	+	7Гб = 6ТГ1,
7Г1	+	7Г2	+	7ГЗ	+	7Г4	+	ТГ5	+	7Гб = 6ТГ2,
4тг1	+	7Г2	+	7ГЗ	+	7Г4	+	ТГ5	+	7Г6 = 6ТГ3,
		ЗТГ2	+	7ГЗ	+	7Г4	+	ТГ5	+	7Гб = бтГд,
				27Г3	+	7Г4	+	ТГ5	+	7Г6 = 67Г5,
						7Г4	+	7Г5	+	7Г6 = 6ТГ6,
7Г1	+	7Г2	+	7ГЗ	+	7Г4	+	7Г5	+	7Г6 =	1.
Последовательно вычитая из первого и второго уравнений по-
следнее, получаем
1	1
7Г1 =	7Г2 =
6	6
134
Глава 2. Предельные теоремы для марковских цепей
Вычитая из третьего уравнения последнее, имеем
37Г! = 67Г3 — 1,
отсюда 7Гз = 1/4. И так далее, получаем
7	11	5
74 - 36’	“ 72’	“ 72’
Задача 2.24. Исследовать предельное поведение марков-
ских цепей описанных в задаче 1.11.
Задача 2.25. Пусть {£п} — последовательность независи-
мых одинаково распределенных целочисленных случайных ве-
личин, каждая с распределением
P{£k = j} = aj, j =0,1,2,...
Рассмотрим последовательности случайных величин
1)	Сп+1 = (Сп - 1)+ + Cn, С1 = 6, n = 1,2,...;
2)	еп+1 = (0п - 3)+ + Сп, 01 = 6, n = 1,2,...;
3)	</?п+1 = (<Ai - s)+ + £n, V’l = Ci, n = 1,2,..., s — целое
положительное.
Показать, что последовательности {^n}, {#п}5 {^п} образуют
марковские цепи. Найти их матрицы переходных вероятностей.
Пусть
1) имеют распределение
P{£k = j} = l/m, j = 1,2,..., m;
2) имеют распределение
m = j} =	- P)5~j, j = 0,1,..., 5.
Исследовать предельное поведение цепей {^n}, {#n}> {^n}-
При каких значениях параметров m, р цепи имеют собствен-
ное эргодическое распределение? Что можно сказать о предель-
ном поведении цепи, если цепь не имеет собственного эргодиче-
ского распределения?
Задача 2.26. Для марковской цепи из примера 1.3.5 най-
ти: 1) limi,j = 1,2,3,4 (если эти пределы существуют);
2) предельные распределения марковской цепи. Вычислить ма-
тематические ожидания времени первого возвращения в состо-
яние.
Глава 3
Марковские цепи
с непрерывным временем
3.1 Основные понятия и определения
Определение. Семейство случайных величин
е [0, оо)}
со значениями в R1, зависящее от параметра t 6 [0, сю), будем
называть случайным процессом со значениями в R1, заданным
на множестве [0, сю).
При каждом фиксированном t случайная величина —
функция на Q вероятностного пространства {Q,#, Р}:
e(f) = e(f,w),
поэтому случайный процесс
£(£)=£(£, cu), (t,cu) 6 [0, оо) х Q,
является функцией двух переменных t и си.
Для каждого фиксированного cu е Q функцию
£(£)=£(£, cu), te[O, оо),
со значениями в R1, заданную на [0, оо), будем называть траек-
торией случайного процесса 6 [0,оо)}.
136
Глава 3. Марковские цепи с непрерывным временем
Определение. Случайный процесс {^(t),t е [0,+оо)} со
значениями в {0,1,...} будем называть марковской цепью с не-
прерывным временем, если для него имеет место марковское
свойство: для любых to < ti < ... < tn < tn+i и jo, ji,..., jn-1, i, j
Шя) — j I	— i, £(£n-i) — jn-iy • • • > C(^i) —	C(^o) — Jo}:
= ^(Ul) — j | £(*n) — 0-
Далее множество X = {0,1,...} значений цепи будем назы-
вать её фазовым пространством.
Определение. Условную вероятность
PRO) = J|C(s) = 0 = Pij(s,t),
s,t е [0; сю), s < t, i, j = 0,1,2,..., называют переходной веро-
ятностью (вероятностью перехода) марковской цепи.
Вероятность
Pk(t) = РШ =k},t> 0,
называют вероятностью пребывания в состоянии к, к = 0,1,...
Определение. Марковскую цепь будем называть марковс-
кой цепью со стационарными переходными вероятностями —
стационарной марковской цепью, если ее переходные вероят-
ности
Р{£(£ + $) — 3’ I ^(s) — 0 — Pij(s>s + 0? Л j = 0> 1> 2,...; s,t > 0
не зависят от s. При этом переходные вероятности называют
стационарными и обозначают Pij(t):
Pij(s, s + t) = Pij(t), i,j = 0,1,2,...; s,t > 0.
Мы будем рассматривать марковские цепи со стационарны-
ми переходными вероятностями.
Определение. Матрицей переходных вероятностей мар-
ковской цепи {£(t),t 6 [0, оо)} будем называть матрицу, элемен-
тами которой являются переходные вероятности
Руw = р{еа+*)=j।e(s) = i}, i,j =
Непосредственно из определения матрицы переходных веро-
ятностей следуют такие её свойства:
3.1. Основные понятия и определения
137
1° Pij(t)>0, ^2Py(t) = l, t > 0; i = 0,1,2,...
j
— каждая строка матрицы переходных вероятностей задает на
фазовом пространстве X = {0,1,2,...} семейство вероятност-
ных распределений, зависящих от параметра t.
2° Переходные вероятности Pij(t) удовлетворяют уравнению
Колмогорова-Чепмена:
Pij(s + t) =	s,t>0, i, j = 0,1,2,...,
k=o
или в матричном виде,
Р($ + t) = P(s)P(f),
где P(f) = [Ро(ОЬ t > °-
Уравнение Колмогорова-Чепмена является непосредственным
следствием марковского свойства.
Дале мы будем требовать, чтобы переходные вероятности
Pij(h), i,j = 0,1,2,..., обладали свойством непрерывности в
точке 0:
т о Г если j —
0, если j?,
(в силу стационарности цепи непрерывность переходной вероят-
ности в точке 0 влечет непрерывность в каждой точке t > 0).
Непрерывность переходных вероятностей фактически обо-
значает непрерывность стационарной марковской цепи — если
цепь в момент t находится в состоянии г, то за малое время h
с вероятностью близкой к 1 цепь и останется в состоянии i (за
малое время с вероятностью близкой к 1 состояние цепи не из-
менится).
Переходную матрицу, элементы Р^(/г), г,j = 0,1,2,..., ко-
торой удовлетворяют свойству непрерывности, будем называть
стандартной матрицей.
ТеоремаЗ.1.1 (уравнениеКолмогорова-Чепмена). Переход-
ные вероятности стационарной марковской цепи удовлетворя-
ют уравнению Колмогорова- Чепмена:
Pij(s + t) = ^Pik(S)Pkj(t), s,t>Q, i,j = 0,1,...,	(3.1.1)
к
138
Глава 3. Марковские цепи с непрерывным временем
или в матричном виде:
P(s + t) = P(s)P(f).
Доказательство. Очевидно,
{£(s + t) =iC(0) = г} = |J{£(0) = i,£(s) = k,£(t + s) = j},
k
причем события в правой части несовместны. Отсюда
p{^+t) = j । е(о) = о = Е =j, e(s) = к । e(o) = о =
k
= -P{C(g + 0 = j, C(g) = M(Q) = 0 =
V p^°) =
v p{^s+t)=j\ g(s) = k, e(o) = pp{e(s) = k, g(o) = о
V	p^°) =
v p{^s+t)=j\ e(g) = к}рщ = к, g(o) = о
Y	pm = i}
= e p{^+t)=j\ e(s) = к}рш = к । e(o) = о =
к
— Pik(s)Pkj(t).
к
Замечание. Равенство
P(s + t) = P(s)P(f), s > 0Д > 0,
обозначает, что семейство операторов P(t), t > 0, обладает по-
лугрупповым свойством.
Следствие 1. Для любых ti,^2> • • • Дп
+ ^2 + • • • + tn) —	Piki (tl^Pk^(t2) • • • Pkn-ij(tn)•
ki,k2,---,kn-i
(3.1.2)
Доказательство.
Pij(tl + t2 + • • • + tn) = Pij(ti + (t>2 + • • • + tn)) —
3.1. Основные понятия и определения
139
— Piki(ti)Pkij(t2 + ts + • • • + tn) —
ki
= Pjki Gl)	Pkik2 (tz)Pk2jGs + ^4 “b • • • “b ^n) = • • •
ki	k2
•••—	Piki (tl)Pkik2(t2) • • • Pkn-ij(tn).
ki -)k2 • •fkfi—i
Следствие 2.
Pij^fy. + ^2 + • • • + tn) > Piki (^1)F/C1/C2G2) • • • Pkn-ij(tn)•
Следствие 3.
Pa(t) > (Pii(t/n))n.
Достаточно в следствии 2 положить t\ = t% = - - - = tn = t/п,
j = i,ki = i,k2 = 2,..., kn-i = i.
Задание марковской цепи. Случайный процесс {£(t),
t 6 [0, +00)}, в частности, марковская цепь с непрерывным вре-
менем {£(£) Д 6 [0, +оо)} считается заданной, если заданы ее ко-
нечномерные распределения, а именно, для любых 0 = to,ti,... tn
и го, 21,..., in заданы
Ptoti...tn Go, ^1 ч • • • in) = Р{Ш — 2q,£G1) — 21, . . . ,£(tn) = ^n}-
Как и для цепей Маркова с дискретным временем, марков-
ская цепь с непрерывным временем задается своим начальным
распределением (распределением при t = 0) и матрицей пере-
ходных вероятностей [P^G)], t > 0.
Убедимся в этом. Пусть 0 = to < ti <...< tn. Воспользо-
вавшись формулой умножения и марковским свойством, имеем
P{£Go) = *o,£Gi) = й, • • • ,£Gn-i) = in-i^(tn) = in} =
= P{CGn) = in I CGn—1) = in—li • • •, ^(^o) — ^0} x
xP{£(tn-l) = in-liC(tn-2) = in-21 • • • i£(fy) = ^0} =
— P{£(tn) = in I £(tn—i) = in—i}x
xP{£(tn-l) = in-li^(tn-2) = in-21 • • • i£(to) = ^0} =
— Pin-1 in(tn ~ tn-i)x
140
Глава 3. Марковские цепи с непрерывным временем
х/Ш-1) — *п-1,£(£п-2) = *п-2, • • • ,£(*()) = М =
^п-1*п(^П	^п—1) ’ Ргп-2 «п-1 (^П— 1 tn—2) X . . .
• • • X Pioi^ti - to) • P{£fao) = го}.
Равенство
Р{£(*о) — *o,£(*i) — й, • • • ,£(^п—1) — гп—1,£(М — in} —
— Pin-iinfan ~ tn—1) ’ Pin-2 «п-i fan—1 — tn—2) X • • •
... X Pi.iSh - to) • P{^to) = го}.	(3.1.3)
и обозначает, что цепь задается ее начальным распределением
Р{£(£0) = г0} и матрицей переходных вероятностей [Pij(t)].
Во многих ситуациях поведение матрицы переходных веро-
ятностей [Р^(/г)] в окрестности нуля определяет поведение ве-
роятностей пребывания Pnfa), п = 0,1,2,..., при всех t > 0.
Точнее, можно выписать систему дифференциальных уравне-
ний, которым удовлетворяют Pnfa)- Поэтому общий подход в
задании марковских цепей с непрерывным временем состоит в
задании (постулировании) вида матрицы переходных вероятно-
стей [Р^ (h)] в окрестности нуля.
При изучении цепей Маркова с непрерывным временем (как
и для цепей с дискретным временем) важной задачей является
изучение асимптотического поведения распределения £fa), т- е-
поведения вероятностей пребывания
P{£fa) = n} = Pnfa), п = 0,1,2,...,
при t сю.
3.2 Процесс чистого рождения
Пусть £(f) — размер популяции леммингов, зайцев, лис, вол-
ков, ... на данной территории. При благоприятных условиях
— достаточное количество пищи, отсутствие смертности, отсут-
ствие миграции размер популяции будет неограниченно расти.
(Реально неограниченный рост невозможен хотя бы потому, что
3.2. Процесс чистого рождения
141
при большом размере популяции пищи для всех не хватит.) Ма-
тематической моделью численности популяции в описанной си-
туации является так называемый процесс чистого рождения.
Определение. Процессом чистого рождения будем назы-
вать стационарную марковскую цепь с непрерывным временем,
переходные вероятности которой в окрестности нуля удовлетво-
ряют постулатам:
1° Р^Л+1(^) =	+ °(^)>	0 + О, к = 0,1,...;
2° Pk,k(h) = l~Xkh + o(h), h 0 + 0, к = 0,1,...-,
3°P^(0)=4j, k,j = O,l,...
Из 1° - 2° следует, что для j' к, к + 1
Pk,j(h) = о(К), h 0 + 0
— вероятности перехода в несоседние состояния есть величины
порядка o(h) при /г —> 0 + 0.
Параметры fc = 0,1,2,..., — неотрицательные числа,
o(h) могут, вообще говоря, зависеть от к.
Числа Хк, к = 0,1,..., называют инфинитезимальными ха-
рактеристиками или инфинитезимальными интенсивностя-
ми роста процесса чистого рождения.
Матрицу
Г —До	До	0	0
0	-Д1	Д1	0	...
0	0	—Д2	Д2	• • •
называют инфинитезимальной матрицей процесса чистого рож-
дения.
Заметим, что в точке нуль существуют производные пере-
ходных вероятностей процесса чистого рождения и они равны
интенсивностям роста:
-f’fc, fc+l (0) = ^k,
РкДО) = -Afe.
Первый постулат процесса чистого рождения обозначает, что
при малых h вероятность покинуть состояние к (перейти в сос-
тояние к + 1) растет пропорционально времени h (как Д^/г), вто-
рой постулат обозначает, что при малых h вероятность остаться
в состоянии к убывает (как 1 — Д^/г).
Из определения процесса чистого рождения следует, что пе-
реходные вероятности обладают свойством непрерывности.
142
Глава 3. Марковские цепи с непрерывным временем
Постулируя такой вид переходных вероятностей цепи при
малых h (локально), мы обеспечиваем монотонность траекторий
цепи — за малое время (локально) цепь из данного состояния к
может перейти только в соседнее состояние fc+1 (с вероятностью
Л^/^ + о(/г)), либо остаться на месте (в состоянии fc), естественно,
с вероятностью 1 — Xkh + o(h).
Заданные локально (при малых /г) переходные вероятности
Pij(h) определяют вероятности пребывания Pk(t) = P{£(t) = к}
цепи для всех t > 0.
Теорема 3.2.1. Вероятности пребывания
PkW = РШ = к}, к = 0,1,2,...,
процесса 6 [0;оо),£(0) = 0} чистого рождения, выходя-
щего из 0, удовлетворяют системе дифференциальных уравне-
ний
ГР'(г) = -А0Р(М
Hfe+iW = -^k+iPk+itt) + XkPk(t), к = 0,1,...,
с начальными условиями
Ро(О) = 1, РДО) =0, к = 1,2,...
Доказательство. Сначала составим уравнение для веро-
ятности Ро(О пребывания цепи в точке 0.
Для процесса чистого рождения
Po(t + h) = P{£(t + h) = 0} = P{^t + h) = 0, ^(0 = 0} =
= P{£(t + h) = 01 e(t) = 0}P{C(t) = 0} = Poo(/i)Po(t) =
= (1 - А0/г + о(/г))Ро(0,
отсюда
Po(t + h) = P0(t) - XohPo(t) + P0(t)o(h)
или
P0(t + h)-P0(t) = _	+ Po(f)2^).
n	ti
Переходя к пределу в правой и левой частях при /г —> 0 + 0
(предел правой части существует), получаем
P^t) = -AoPo(i).
(3.2.1)
3.2. Процесс чистого рождения
143
Далее получим уравнения, которым удовлетворяют вероят-
ности пребывания Pk(t), к = 1,2,... Имеем
Pfc+1(£ + h) = P{£(t + h) = к + 1} =
(/fc+i	\ \
W + Л) = k +1}n UW) = 4	=
\?=0	//
fc+1
= £pw + /l) = fc + i,ew = 4 =
?=0
A+l
= £ P{^t + h) = к +11 £(t) = i}P{^t) = i} =
?=0
A+l
= £ =
?=0
— Pk+1, fc+l(^)A:-|-l(0 + Л^Л+1(^)^(^) +
к-1
+ Pi(t)Pi,k+l(h) —
?=0
= ^+1(0(1 — ^к+ih +	+ Pk(t)(Xkh + o(/z))+
k—1
?=0
— Pk+i(t) ~ Xk+ihPk+i(t) + XkhPk(t) + o(/z).
Отсюда
Pk+i(t+h) — -Pfc+iW — —Xk-^-ihPk-^i^+XkhPk^+o^h), h 0+0,
где o(h)/h 0 при /г —> 0 равномерно no t. Разделив левую
и правую части на h и перейдя к пределу при h 0 + 0, для
вероятностей пребывания Pk(t), к = 0,1,..., получим систему
дифференциальных уравнений
Г-^о(^) = ~/о 2 21
{PU1W = -XMPk+iW + XkPk(tl к = 1,2,...
144
Глава 3. Марковские цепи с непрерывным временем
с начальными условиями
Ро(О) = 1, Pfc(O) =0, k = 1,2,...
Для вероятностей пребывания Pk(t) можно доказать суще-
ствование и левосторонних производных.
Из первого уравнения системы (3.2.2)
Р'(0 = -AoPo(f),
с учетом начального условия Ро(О) = 1 получаем
Po(t) = e~Xot.
При конкретных значениях А& > 0 можно последовательно про-
интегрировать уравнения (3.2.2).
Определение. Временем пребывания марковской цепи
{£(£),£ 6 [0;оо),£(0) = 0}, стартующей из состояния 0, в со-
стоянии 0 будем называть случайную величину
то = inf{t : е(0 / 0, е(0) = 0}.
Цепь до момента то пребывает в состоянии 0, а в момент то
“уходит” из состояния 0.
Следствие. Время пребывания то в состоянии 0 процесса
чистого рождения, выходящего из 0, распределено показатель-
но с параметром Aq:
Р{т0 <0 = 1- e-Aot, t > 0.
Действительно, при t > 0
Р{т0 < 0 = 1--PR0 >t} = 1-P{£(t) = 0} = l-Po(t) = 1-e~Xot.
Пуассоновский процесс. Одним из частных случаев про-
цесса чистого рождения является пуассоновский процесс.
Определение 1. Пуассоновским процессом с параметром
А (А > 0), стартующим из нуля, называется процесс чистого
рождения t 6 [0; +схз),£(О) = 0}, у которого интенсивности
роста
Хк = А, к = 0,1,2,...
3.2. Процесс чистого рождения
145
Теорема 3.2.2. У пуассоновского процесса
[0,оо),£(0) = 0}
с параметром Л, стартующего из нуля, вероятности пребыва-
ния
Pk^ = (^~e~xt’fc = 0’1’---
Доказательство. Согласно теореме 3.2.1, вероятности пре-
бывания РД£), к = 0,1,2,..., процесса рождения и гибели, у ко-
торого интенсивности роста А^ = А, fc = 0,l,2,..., удовлетворя-
ют системе дифференциальных уравнений
(P^t) = -APo(t),
1Л+1W = -APfc+i(t) + APfc(i), к = 0,1,...
при начальных условиях
Ро(О) = 1, РДО) = 0, к= 1,2,...
Для решения последней системы уравнений введем функции
Qk(t):
Pk(t) = e~XtQk(t), к = 0,1,...,	(3.2.3)
и перепишем систему в терминах Qk(fy. Имеем:
(е XtQk+\(t)^ =—Хе XtQk+i(t) + Хе XtQk(f),
—Хе XtQk+i(t) + e XtQM(t) =-Хе XtQk+i(t) + Хе XtQk(f),
Q'k+l(t) = XQk(t), к = 0,1,...	(3.2.4)
Заметим, что поскольку
Ро(О) = 1, РДО) =0, к = 1,2,...,
то из равенств (3.2.3) для Qk(t) получаем начальные условия
Qo(O) = 1, ЗДО) =0, к= 1,2,...
Решим систему дифференциальных уравнений (3.2.4) при
начальных условиях
Qo(O) = 1, ЗДО) =0, к= 1,2,...
146
Глава 3. Марковские цепи с непрерывным временем
Ранее мы получили, что
ад = e"At,
поэтому из (3.2.3) при к = 0 имеем
Qo(0 = I-
Для <3i(t),Q2(t), • • •	   последовательно получаем
<2'1(0 = AQo(t) = А,
<31 (t) - <31 (0) = At,
что с учетом <3i (0) = 0 дает
<	31 (t) = At;
<	32(0 = A<3i(t) = A2t,
A2/2
<	?2(t)-<?2(0) = ^,
что с учетом <Эг(О) = 0 дает
И Т. д.,
Возвращаясь к функциям Pk(t), получаем
Pfc(t) = e-^Qkit) =	к = 0,1,...
Так что для пуассоновского процесса е [0, оо),£(0) = 0}
с параметром Л, стартующего из нуля, при каждом t случай-
ная величина имеет пуассоновское распределение с пара-
метром At
Эквивалентным выше данному определению пуассоновского
процесса является следующее.
Определение 2. Пуассоновским процессом с параметром
Л (Л > 0), стартующим из нуля, будем называть случайный
3.2. Процесс чистого рождения
147
процесс {£(£), t е [0; +оо),£(0) = 0}, удовлетворяющий следую-
щим постулатам:
1)	для любых 0 = to < ti < ^2 < • • • < tn-i < tn случайные
величины £(fi) - £(fo), £(*2) - £(h), • • •, £(tn) ~ £(*n-i) незави-
симы (£(£) — процесс с независимыми приращениями),
2)	приращения £(t) — £(s), 0 < s < t, имеет распределение
Пуассона с параметром X(t — s):
P{£(t) - C(s) = к} =	~ s^k e-4t-s^ fc = 0,1,2,...
Неформально пуассоновский процесс с параметром Л, выхо-
дящий из нуля, можно описать так. Стартуя из нуля, процесс
в течении времени то, распределенном показательно с парамет-
ром Л, пребывает в состоянии 0. В момент времени то процесс
скачком переходит в состояние 1 и пребывает в состоянии 1 в те-
чении времени ti, распределенном показательно с параметром Л
и не зависящим от то- В момент времени to + ti процесс скачком
переходит в состояние 2 и пребывает в состоянии 2 в течении
времени тг, распределенном показательно с параметром Л и не
зависящим от то и ri. В момент времени то + л + Т2 процесс
скачком переходит в состояние 3 и т. д.
Определение. Пусть то, л,Т2,... — последовательность
независимых показательно распределенных с параметром Л слу-
чайные величины. Последовательность моментов времени (по-
следовательность случайных величин)
tn = ткч 72 = 0, 1, 2, ... ,
к=е
называется простейшим потоком событий с параметром Л (ин-
тенсивности Л).
Пуассоновский процесс с параметром Л задает простейший
поток событий:
tn = 1~ki 72 = 0, 1, 2, ... ,
к=0
где ть — время пребывания процесса £(t) в состоянии /с, к =
= 0,1,2,...
Справедливо и обратное. Простейший поток событий
tn = 1~ki 72 = 0, 1, 2, ... ,
к=0
148
Глава 3. Марковские цепи с непрерывным временем
с параметром Л определяет пуассоновский процесс
W), t€ [0;+оо),е(0)=0}
с параметром Л, выходящий из нуля. В момент времени t процесс
£(t) принимает значение к, если tk-i < t < tk, к = 1,2,... На
промежутке [0, то] значение £(t) равно 0.
Процесс Юла. Рассмотрим один важный частный случай
процесса чистого рождения, так называемый процесс Юла.
Предположим, что в момент времени t = 0 в популяции име-
ется N особей (7V > 0). Через £(t) обозначим размер популяции
в момент времени t. Предположим, что каждая особь популяции
независимо от других в интервале времени длиной h с вероят-
ностью (3h + o(h) порождает новую особь.
Если в момент времени t размер популяции £(£) = /с,
(fc = N, N + 1,...), то за время h размер популяции увеличи-
вается на 1 с вероятностью
+ o(Zi))1 (1 — ph — othyf-1 = kBh +	/1^0 + 0.
Поэтому переходные вероятности процесса £(t) при малых h
(/г —> 0 + 0) имеют вид
P{£(t + h) = к + 11 ^(0 = к} = kf3h + о(/г),
P{^t + h) = k\ ^(0 = к} = 1 - (k(3h + o(h))
или
Рк,к+! = kfth + o(h) = Xkh + o(h),
Pk,k — 1 — k(3h + o(h) = 1 — Xkh + o(h)
(у процесса Юла Xk = k/3).
Система уравнений (3.2.2) для вероятностей пребывания про-
цесса Юла, стартующего из 1 (размер популяции £(0) в момент
времени 0 равен 1), имеет вид
(P[(t) = -X1P1(t),
= —^+1^+1(0 + ^kPk(t)) к = 1, 2, . . . ,
подробнее,
l^+1 w = -(к+1)ж+1 w + fcmw, к = 1,2,...
3.3. Процессы рождения и гибели
149
Начальные условия
Р1(0) = 1, Рк(0) = 0, к = 2,3,...
Решением этой системы является
Л(<) = е"^,
Pfc(t) = е-^(1 - е-^к~\ к = 2,3,...,
в чем можно убедиться непосредственной проверкой.
Заметим, что
Pfc(t) = е-^(1 - е-01/-1, к = 1,2,3,...,
является геометрическим распределением с параметром pt =
_	“смещенным на 1”, т. е. заданным на множестве
к = 1,2,3,...
3.3 Процессы рождения и гибели
Естественным обобщением процесса чистого рождения яв-
ляется процесс рождения и гибели — если в момент t процесс
находится в состоянии /с, то за малое время h он переходит в
одно из соседних состояний (fc + 1) или (fc — 1) или остается в
том же состоянии к.
Определение. Процессом рождения и гибели будем назы-
вать стационарную марковскую цепь с непрерывным временем,
переходные вероятности которой в окрестности нуля удовлетво-
ряют постулатам:
1° Pk,k+i(h) = Xkh + o(h) при /г —> 0 + 0, к > 0;
2° Р^_1(/г) =	ПРИ > 0 + 0, к > 1;
3° Рк k{h) = 1 — {Хк + pk)h + при /г —> 0 + 0, к > 0;
4°Р^(0)=<^, fc,j =0,1,2,...
Из 1° - 3° следует, что для j к — l,fc,fc+l
Pk,j(h) = о(/г), /г —> 0 + 0
— вероятности перехода в состояния отличные от соседних есть
величины порядка o(h) при /г —> 0 + 0.
Параметры Хк, цк {ро = 0,Ао > 0), к = 0,1,2,..., неотри-
цательны, их называют инфинитезимальными характеристи-
ками {инфинитезимальными интенсивностями) рождения и
гибели соответственно.
150
Глава 3. Марковские цепи с непрерывным временем
В равенствах пунктов 1° — 3° член o(h) может зависеть от к.
Определение. Матрицу
—Ао Ао	О	О
Ш	-(Ai+jtzi)	Ai	О
О	-(А2 + ^2)	А 2
0	0	цз -(Аз + ^з)
будем называть инфинитезимальной матрицей процесса рож-
дения и гибели.
Замечание. Инфинитезимальная матрица процесса рож-
дения и гибели — это матрица производных переходных вероят-
ностей процесса в точке нуль.
Обратные дифференциальные уравнения Колмого-
рова для процесса рождения и гибели. Переходные вероят-
ности Pjj (t) процесса рождения и гибели удовлетворяют системе
дифференциальных уравнений, известных под названием обрат-
ных дифференциальных уравнений Колмогорова. Получим эти
уравнения.
Пусть h > 0, t > 0. Из уравнения Колмогорова-Чепмена име-
ем при i = 1,2,..., j =0,1,2,...
Рг^(/г+i) = 52 д* W-Pfej w =
fe=0
—	+ Pj^(h)Pjj{t) + Pi,i+\(h)Pj+^j(t) +
+'^Pi,k(h)Pk,j(t), i = 1,2,...,	(3.3.1)
к
в последней сумме суммирование ведется по всем к i — 1, г, г+1.
При /г —> 0
^Pi'kWPkJf) < J2'Pi,kW = 1-(Л^-1(/1) + Рм(/1)+Рм+1(^)) =
к	к
= 1 - (щЬ + о(/г)) - (1 - (Аг + Hi)h + о(/г)) - (Aj/г + о(/г)) = о(/г).
Так что
52 PijAh'jPk^t') = о(/г).
3.3. Процессы рождения и гибели
151
Используя последнее равенство и постулаты 1°-3° процесса рож-
дения и гибели, равенство (3.3.1) можно записать так:
i = 1,2,... Перенесем Pi,j(t) в левую часть, разделим получен-
ное равенство на h и перейдем к пределу при /г —> 0 + 0. В ре-
зультате получим
P[j(t) =	- (Ai +	+ AjPi+ij(t), i = 1,2,...
(3.3.2)
Для i = 0, j = 0,1,2,... выкладки аналогичные приведенным
выше дают
^j(t) = -AoPoj(t) + AoPij(t),	(3.3.3)
при t = 0
^j(O) = fcj = 0,1,2,...
Уравнения (3.3.2), (3.3.3) называются обратными дифферен-
циальными уравнениями Колмогорова.
В обратных дифференциальных уравнениях начальное со-
стояние является “переменным”, а конечное состояние “фикси-
рованным” (в Рц меняется первый индекс).
Обратные дифференциальные уравнения удобно записывать
в матричном виде
р'(0 = i/P(f),
где р — инфинитезимальная матрица процесса рождения и ги-
бели, F(f) = [-F’j(f)]-
Прямые дифференциальные уравнения Колмогоро-
ва для процесса рождения и гибели. При выводе обрат-
ных дифференциальных уравнений Колмогорова мы воспользо-
вались уравнением Колмогорова-Чепмена, разбив промежуток
(0, t + h) на части (0, h) и (h,t + h). Другая ситуация возникает
если промежуток (0, t + h) разбить на части (0, t) и (t,t + h) и
использовать тот же подход, что и при выводе обратных диф-
ференциальных уравнений.
Из уравнения Колмогорова-Чепмена при j = 1,2,..., i =
= 0,1,... имеем
Pij(f + /г) =	=
к=0
= Pi,j-i(t)Pj-ij(h) + Pj,j(t)Pj,j(h) + Pjj+i(j)Pj+ij(Ji)+
152 Глава 3. Марковские цепи с непрерывным временем
+£р^)рк;(Ь), j = 1,2,...	(3.3.4)
k
Оценим 'Е,'Pi,k(.t)Pk,j(.h) :
k
52	= 52 pi,b(t)hok(X) =
k	k
= /zsupofc(l)\2 Р?Д0 < /zsupofc(l).
k	k	k
Далее будем предполагать, что для k / j — 1,7,7 + 1 переход-
ные вероятности Pkj(h) = ho^X) при /г —> 0 + 0 удовлетворяют
соотношению
supofc(l) = о(1).
к
В этих предположениях при /г —> 0 + О
52'^Л(4)Р^(/г) = о(/г).
к
Из равенства (3.3.4), последнего равенства и постулатов 1°-3°
процесса рождения и гибели при 7 = 1,2,... имеем
Pij(t + /i) =	+	+ P?j(^)(l — (Aj + jtzj)/i + o(/i))+
+PiJ+1(t)Xj+1h + o(h)) + o(h).
Перенесем P?j(0 в левую часть, разделим полученное равен-
ство на h и перейдем к пределу при /г —> 0. В результате для
7 = 1,2,... получим
= Aj-iP?j-i(O — (Aj + /ij)Pjj(t) + p,j+iPij+i(t)- (3.3.5)
Для 7 = 0, i = 0,1,... выкладки аналогичные приведенным
выше дают
Р'цХ = -AoP?,oW + ^1Рг,1 W- (3.3.6)
При t = 0 значения Рм(0) =	7 = 0,1,..., i = 0,1,...
Уравнения (3.3.5), (3.3.6) известны под названием прямых
дифференциальных уравнений Колмогорова.
3.3. Процессы рождения и гибели
153
В прямых дифференциальных уравнениях конечное состо-
яние является “переменным”, а начальное состояние “фиксиро-
ванным” (в Pjj меняется второй индекс).
Прямые дифференциальные уравнения удобно записывать в
матричном виде
P'(t) = iZ(P(f))T,
где р — инфинитезимальная матрица процесса рождения и гибе-
ли, ит и — матрицы, транспонированные соответственно
к матрицам р и P(t), F(t) = [P'j (£)].
Эргодическая теорема для процесса рождения и ги-
бели. Для процесса рождения и гибели имеет место следующее
утверждение, аналогичное эргодической теореме для дискрет-
ных марковских цепей.
Теорема 3.3.1 (эргодическая для процесса рождения и ги-
бели). Переходные вероятности Pjj{t), i,j = 0,1,2,..., процес-
са рождения и гибели с интенсивностями рождения Xj и гибе-
ли pj и их производные Pjj(t) при t оо имеют пределы
lim Pj At) = 7г?, lim Р' At) = 0, j = 0,1,2,...,
t—>оо	t—>оо
пределы tvj не зависят от начального состояния i и удовлетво-
ряют уравнениям
-АОТГО + ^17Г1 = О,
Xj—i^j—i — {Xj + Pj)^j + Pj+iiTj+i = 0, j' = 1,2,...
Формально последние уравнения для пределов 7tj получают-
ся предельным переходом при £ —> оо в правой и левой частях
прямых дифференциальных уравнений Колмогорова:
p'(t) = l/T(p(f))T.
Предельные значения
7г? = lim Pi At), j = 0,1,2,...,
t—>+oo
задают на фазовом пространстве {0,1,2,...} цепи вероятностное
распределение (собственное или несобственное). Действительно,
из
оо
52	= 1
j=0
154
Глава 3. Марковские цепи с непрерывным временем
имеем
N
— 1-
J=1
Предельным переходом при t сю получаем
N
52^'
7=1
отсюда при N —> оо имеем
ОО
52^' - L
j=0
Определение. Вероятностное распределение
7г7 = lim Pi ЛГ), j = 0,1,2,...,
J t—^oo
называется эргодическим распределением процесса рождения и
гибели.
Теорема 3.3.2 (о предельном значении вероятностей пре-
бывания). У процесса рождения и гибели предельные значения
вероятностей пребывания Pk(t) существуют и совпадают с эр-
годическими вероятностями:
lim Pk(t) = тгк, к = 0,1,...
t—>оо
Доказательство. Достаточно показать, что для данно-
го s
|Л(<) - TTfel < £
при достаточно больших t.
Пусть {яД — начальное распределение цепи. Тогда
оо
Pk(t) = P{£(t) = к} = y^XiPik(,t)
i=0
Отсюда имеем
\Pk(t} - TTfcl =
оо	оо
?=0	?=0
3.3. Процессы рождения и гибели
155
N	оо
—	Xi |.Pifc(£) — TT/cl + 2 Xj.
?=0	i=N+l
Второе слагаемое не превосходит s за счет выбора N достаточно
большим, а первое не превосходит s при достаточно больших t
в силу эргодической теоремы.
Определение. Вероятностное распределение {иД будем
называть стационарным распределением процесса рождения и
гибели с матрицей переходных вероятностей [Р^(£)], если для
всех t > О
оо
^2	(f) = vh i = °> 2> • • •
i=0
Теорема 3.3.3 (об эргодическом и стационарном распреде-
лениях). У процесса рождения и гибели эргодическое распределе-
ние является стационарным распределением и наоборот, соб-
ственное стационарное распределение является эргодическим.
Доказательство. Убедимся, что эргодическое распреде-
ление является стационарным.
Из уравнения Колмогорова—Чепмена для любых s,t и N
имеем
оо	N
Pjj(s + ^) —
к=0	k=0
Переходя в этом неравенстве к пределу при s оо, получаем
N
^k^kj (^)
k=Q
(в силу эргодической теоремы lim Pi Д£) = я>). А поскольку N
t—^oo 1
произвольно, то и
оо
TTj >	j = 0,1,...	(3.3.7)
fc=o
На самом деле все нестрогие неравенства (3.3.7) являются ра-
венствами
оо
7TJ = ^TTfePfe/f), j = 0, 1, . . .
k=0
156
Глава 3. Марковские цепи с непрерывным временем
Если предположить, что хотя бы одно из неравенств (3.3.7) стро-
гое и просуммировать все неравенства (3.3.7), то
оо	оо / оо	\	оо	оо	оо
52^’ > 52 (52	)= 52 52	= 52
7=0	j=0 \k=0	J	k=0	j=0	k=0
Из полученного противоречия следует, что
оо
= TTj, j = 0,1,...
k=o
Так что эргодическое распределение является стационарным.
Пусть теперь {^} — собственное стационарное распределе-
ние цепи:
оо
ViPij(t) =Vj, j = 0,1,...,	(3.3.8)
i=0
ОО
j=0
Формально переходя к пределу при t ч ос в правой и левой
частях равенств (3.3.8) (в силу эргодической теоремы пределы
Pij(t) существуют), получаем
оо
=Vj, j =0,1,...
?=0
оо
Отсюда, учитывая что vi — 1, имеем
?=0
Ч? = ТГ7 , J = 0, 1, . . .
Корректность предельного переходя следует из неравенства
оо	оо	N	оо
5 >	~ ViKj < 52^l‘^(^) —	5 >
?=0	?=0	?=0	i=N+l
в котором правая часть меньше 2s при достаточно больших t
(второе слагаемое меньше е за счет выбора ЛГ, при фиксирован-
ном N первое слагаемое меньше е за счет выбора t).
3.3. Процессы рождения и гибели
157
Теорема3.3.4 (о представлении эргодического распределе-
ния). Пусть е [0,оо)} — процесс рождения и гибели с
интенсивностями роста Xj и гибели pj(р3> 0, j = 1,2,...),
Ao Al	Aj-i
ио = 1, Uj =------------—, 7 = 1,2,...
Р\ Р2	Pj
Если
оо
^2 uk < оо,
k=0
то существует собственное эргодическое распределение про-
цесса 6 [0,оо)} и оно представимо в виде
= из^~, .7 =0,1,2,...
У?
к=0
Если
оо
= +оо,
k=0
то эргодическое распределение является несобственным и
TVj = 0, j = 0,1,2,...
Доказательство. Заметим, что
и3j = 1,2,...	(3.3.9)
Pj
Согласно эргодической теореме (см. теорему 3.3.1), эргоди-
ческое распределение {тг^} (собственное или несобственное) су-
ществует и удовлетворяет уравнениям
-Аотго + Z^iTTi = 0,
Xj_iTTj-1 - (Xj + Pj)itj + pj+iitj+i = 0, 7 = 1,2,...	(3.3.10)
Решение последней системы уравнений можно представить
в виде
= UkTro, к = 1,2,...	(3.3.11)
158
Глава 3. Марковские цепи с непрерывным временем
Действительно, из первого уравнения имеем
7Г1 = (АоМ1)тго = 'Щтго-
Предположим, что представление (3.3.11) имеет место и при к =
= 2,3,... ,7 и установим, что оно имеет место и для к = j + 1.
Из равенства (3.3.10) имеем
=	“1“	~
Из равенств
тгк = ^7Го, к = 1,2,... J,
и равенства (3.3.9) получаем
=	“1“ P'j^'UjTTfy ~	—	1^0 =
— XjU jiffy + (jjsjU	Xj—iUj—i^To) =
— XjUjTTfy “И (^/JjjUj Xj— 1 Uj— 1)тГ() = XjUjTTfy
t. e.
= XjUjTTfy
или
TTji+i = (Aj/P'j-^-i^UjTTfy = Uj+iTTfy) j = 1,2,...
Так что эргодическое распределение {ттк} процесса рождения и
гибели представимо в виде
7Tk = ukTTfy, к = 0,1,...
Учитывая последнее представление, имеем
оо	оо	оо
52	(3.3.12)
к=0	k=fy	k=fy
оо
Если ряд uk сходится, то положив
к=0
оо
7Г° = l/^Ufe,
k=0
3.4. Обслуживание с ожиданием
159
получим
оо
52^ =
к=0
т. е. существует собственное эргодическое распределение {тг^},
при этом
= uj^o = uj^-----> j = 0,1,2,...
У7 Uk
к=0
Единственность эргодического распределения следует из един-
ственности предела
7Vj = Jim	j = 0,1,2,...
oo
Если uk = +°° (ряд расходящийся), то из равенства
к=0
оо	оо
fc=0	k=0
учитывая, что {тг&} — вероятностное распределение, следует, что
тго = 0. Поэтому распределение
7Tj = UjTTQ = 0, j = 0,1,2,...,
несобственное.
Замечание. Тот факт, что
= 0, к = 0,1,2,...
(при ик = оо) обозначает, что цепь при t сю “уходит на сю”.
к
3.4 Обслуживание с ожиданием
Мы рассмотрим классическую задачу теории массового об-
служивания в той постановке, в какой она была решена А.К. Эр-
лангом.
1° На обслуживающий прибор поступает простейший поток
требований интенсивности Л.
160
Глава 3. Марковские цепи с непрерывным временем
2° Если в момент поступления требования прибор свободен,
требование начинает немедленно обслуживаться. Если прибор
занят, то требование становится в очередь за поступившими ра-
нее требованиями.
3° Время обслуживания £ каждого требования показательно
распределено с параметром ц и не зависит от продолжительнос-
ти обслуживания ранее поступивших требований.
Задача. Найти распределение длины ^(t) очереди — коли-
чества £(£) требований в очереди в момент времени t (если не
при всех t, то хотя бы при достаточно больших, т. е. в уста-
новившемся режиме).
Реальных ситуаций, в которых возникают подобные задачи,
великое множество. А.К. Эрланг решил эту задачу примени-
тельно к телефонной связи.
Рассмотрим подробнее введенные в пунктах 1° и 3° понятия
простейшего потока требований и обслуживания требований.
Простейший поток требований. Под простейшим пото-
ком требований интенсивности Л мы понимаем последователь-
ность случайных величин
tn = п = 0,1,2,...
fc=o
где Tk, к = 0,1,2,..., — независимые показательно распределен-
ные с параметром Л случайные величины:
Р{тк <f} = l- Xe~xt, t > 0.
Значения tn,n = 0,1,2,..., мы интерпретируем как моменты
поступления требований (tn — момент поступления (п + 1)-го
требования, t$ = то — момент поступления первого требования),
случайные величины к = 1,2,..., мы интерпретируем как
промежутки между поступлениями требований.
В простейшем потоке требований с параметром Л за ма-
лое время h (h 0 + 0) требования поступают так: одно тре-
бование поступает с вероятностью Xh + o(h), два и больше
требований поступают с вероятностью o(h).
В самом деле, простейший поток требований с параметром Л
определяет пуассоновский процесс {£(t), t 6 [0; оо)} — число тре-
бований £(t), поступивших к моменту времени t, t 6 [0; оо). Для
пуассоновского процесса с параметром Л
P{£(t) - С(з) = k} =	fc = о, 1,...
3.4. Обслуживание с ожиданием
161
Поэтому
P{e(f + /i)-e(i) = 1} = ^-e~Xh = A/z(l — A/z + o(/z)) = A/i+o(/i),
т. e. вероятность поступления одного требования за время h:
P{£(t + h) - £(f) = l} = Xh + o(h), h 0 + 0.	(3.4.1)
Вероятность поступления двух и более требований
р{&+h)~ e(t) > 2} = i - p{^t+h) - at) < i} =
= i - (p{e(t+h) - e(t) = o} + p{^t+h) - at) = i}) =
= 1 _ (^-e~Xh + ^e~Xh^ = 1 - e"Aft(l + Xh) =
= 1 - (1 - Xh + o(/i))(l + A/i) = (A/i)2 + o(/i) = o(/i), h 0 + 0,
t. e.
P{£(t + h) - £(f) > 2} = o(h\ h 0 + 0.	(3.4.2)
Показательное время обслуживания. Из предположе-
ния о показательном распределении времени обслуживания £
требования:
Р{< <0 = 1- t > 0,
и независимости случайных величин СьСг, • • • (время обслужи-
вания Q г-го требования не зависит от продолжительности об-
служивания поступивших ранее требований) следует, что за ма-
лое время h (h 0 + 0) требования обслуживаются так: одно
требование за время h обслуживается с вероятностью
ph + о(/г), два и более требований за время h обслуживают-
ся с вероятностью о(К), /г —> 0 + 0.
Действительно, поскольку в каждый момент времени прибор
обслуживает только одно требование, то вероятность того, что
до момента h будет обслужено находящееся на обслуживании
требование равна
Р{С < h} = 1 - e~^h = /j,h + o(h),	0 + 0,	(3.4.3)
где £ — продолжительность обслуживания требования — пока-
зательно распределенная с параметром р случайная величина.
Далее, требования обслуживаются одно за другим. Пусть
Q — время обслуживания г-го требования, i = 1,2,... Тогда
162
Глава 3. Марковские цепи с непрерывным временем
событие “до момента времени h будет обслужено п требований”
представимо в виде
{Ci + С2 + • • • + Cn < h}.
Пусть — событие “за время h будет обслужено более одного
требования”, Ясно, что
Ah, С |^J {Cl + С2 + • • • + Cn < h},
n=2
00
P(Ah) < 52	+ C2 + • • • + Cn < h},
n=2
n
{Cl + C2 + • • • + Cn < h} c P|{C? < ^}>
i=l
n
P{Ci + C2 + • • • + < h} < П P{Ci < h} = (M + o(/i))n < (2M)n,
i=l
00
P(A) < V(2M)n < (2M)2——— < 8(M)2 = h	0 + 0,
Zl	1 - 2»h
т. e. вероятность того, что за малое время h (h 0 + 0) будет
обслужено два или более требований равна о(/г), /г —> 0 + 0.
Марковская цепь, описывающая очередь. Относитель-
но длины очереди	6 [0;+оо)} в задаче обслуживания с
ожиданием имеет место следующее важное утверждение.
В предположениях о простейшем потоке поступления тре-
бований и показательном распределении времени их обслужи-
вания длина очереди е [0;оо), является стационарной
марковской цепью с непрерывным временем.
Выпишем элементы матрицы переходных вероятностей мар-
ковской цепи, описывающей длину очереди требований.
Пусть длина очереди £(£) = к и h малое (/г —> 0 + 0). Вероят-
ность P{£(t + h) = к+11 С(0 = к} увеличения длины очереди на
единицу за время h равна вероятности поступления одного тре-
бования за время /г, эта вероятность равна Xh + о(/г), /г —> 0 + 0.
Поэтому
P{^t + h) = к + 11 £(f) = к} = Xh + о(/г), h 0 + 0,
3.4. Обслуживание с ожиданием
163
или
Pk-k+i(h) = Xh + o(h), /г —> 0 + 0.
Пусть длина очереди £(t) = к > 0 и h малое (h 0 + 0).
Вероятность P{£(t + h) = к — 11 £(£) = к} уменьшения длины
очереди на единицу за время h равна вероятности того, что за
время h будет обслужено одно требование, эта вероятность рав-
на ph + о(/г), /г —> 0 + 0. Поэтому
Р{£(£ + h) = к — 11 £(t) = к} = ph + o(h), /г —> 0 + 0,
или
Pk-,k-i(h) = ph + o(h), /г —> 0 + 0.
Далее, вероятность того, что за малое время /г (/г —> 0 + 0)
длина очереди изменится более чем на 1 равна о(/г), посколь-
ку вероятность увеличения длины очереди более чем на едини-
цу равна o(h) и вероятность уменьшения длины очереди более
чем на единицу равна о(/г), h 0 + 0. Поэтому вероятность
Р{£(£ + h) = к\ £(£) = к} того, что длина очереди за время h
не изменится, равна вероятности события, противоположного к
событию “длина очереди увеличится на 1, или уменьшится на 1,
или изменится более чем на 1”:
P{^(t + h) = k\ £(f) = к} = 1 - (Л/г + /г/г + o(h)),
или
Pk;k(h) = 1 — (Xh + ph) + o(h), /г —> 0 + 0.
Таким образом, для марковской цепи {£(t),t 6 [0, сю)}, опи-
сывающей длину очереди, в предположениях о простейшем по-
токе поступления требований и показательном распределении
времени их обслуживания имеют место следующие утвержде-
ния: при /г —> 0 + 0
Pk,k+i(h) = Xh + o(h),
Pk.k-i(h) = ph + o(h),
Pk,k(h) = 1 - (Л + p)h + o(h).
Последнее означает, что марковская цепь {£(t),t е [0;оо)}, опи-
сывающая очередь, является процессом рождения и гибели с
интенсивностями рождения X и гибели ц.
Предельное поведение длины очереди. Рассмотрим по-
ведение длины очереди {£(t),t 6 [0; сю)} при больших t (t сю).
164
Глава 3. Марковские цепи с непрерывным временем
Согласно теореме об эргодическом распределении процесса
рождения и гибели (см. теорему 3.3.1) длина очереди, как про-
цесс рождения и гибели, имеет эргодическое распределение —
распределение P{£(t) = 7}, j = 0,1,2,..., длины очереди
при t оо стремится к некоторому предельному распределе-
нию {ttj}. При этом, согласно теореме о представлении эргоди-
ческого распределения (см. теорему 3.3.4), если
оо
Ufc < оо,
k=0
то эргодическое распределение представимо в виде
= uj^—> 3 = i,2,--,
к=0
а если
оо
У2 uk = +°°>
k=0
то эргодическое распределение является несобственным и
7Г; =0, j =0,1,2,...,
где
Ao Al Aj-i
uq = 1, Uj =--------——,	> 0, 7 = 1,2,...
Pl Р2 Pj
Поэтому если в цепи {£(£), t 6 [0; сю)}, описывающей очередь,
значение X/р меньше 1, т. е. среднее время обслуживания одного
требования 1 / /z меньше среднего времени 1/А между поступле-
нием требований, то
и, следовательно, цепь имеет собственное эргодическое распре-
деление:
^3 =
^к
к=0
7 — 0,1,2,...
3.5. Свойство дифференцируемости ...
165
(совпадающее с геометрическим распределением с параметром
1 — Х/ц). Последнее означает, что если Х/ц < 1, то при достаточ-
но больших t распределение длины очереди “устанавливается”.
Если, например, Л = 1, ц = 2 — среднее время обслуживания
одной заявки \/ц = 1/2, среднее время между поступлениями
требований 1/Л = 1, то
7Г0 = 1/2, 7Г1 = 1/4, 7Г2 = 1/8, 7Г3 = 1/16, . . .
Эти равенства можно интерпретировать так: с течением време-
ни в очереди с вероятностью 1/2 будут отсутствовать требова-
ния, с вероятностью 1/4 будет одно требование, с вероятностью
1/8 — два требования, ...
Если X/ц > 1 — среднее время обслуживания \/ц одной за-
явки больше среднего времени 1/Л между поступлениями тре-
бований, то
эргодическое распределение цепи несобственное и имеет вид
7rjt = 0, к = 0,1,2,...
Последнее означает, что если Х/ц > 1, то со временем распреде-
ление длины очереди требований “уходит на оо” — длина очере-
ди со временем неограниченно растет.
Мы рассмотрели простейшую ситуацию — одного обслужи-
вающего прибора. Разумеется, обслуживающих приборов может
быть больше одного.
3.5 Свойство дифференцируемости
переходных вероятностей
Из предположения непрерывности в нуле переходных веро-
ятностей Pij(t) стационарной марковской цепи с непрерывным
временем можно получить неожиданно много содержательных
результатов. Одним из таких результатов является дифферен-
цируемость Pij(t).
Мы докажем дифференцируемость Pij(t), i,j = 0,1,2,...,
в точке 0. Дифференцируемость Pu(t) и Pij(t) (j / i) будем
доказывать по отдельности.
166
Глава 3. Марковские цепи с непрерывным временем
Теорема 3.5.1 (о дифференцируемости Р^(£)). Если пере-
ходные вероятности Pa(t) марковской цепи непрерывны в нуле,
то они и дифференцируемы в нуле — существует конечный или
бесконечный предел
lim--------= -Р??(0) = qj
для каждого i.
Доказательство. Нам будет удобно доказать дифферен-
цируемость в нуле функции
= -lnPa(t), te [0,оо).
Дифференцируемость Pu(t) будет следовать из равенства
Рц(Г) = ехр{—</?(£)}, t € [0, оо).
Функция = — 1пРц(Г) определена корректно, поскольку
при всех t > 0 значение Pu(t) > 0. В самом деле из непрерывнос-
ти Pu(t) в нуле и равенства Рц(0) = 1 следует, что для данного
е > 0 найдется такое и, что при всех s из [0, гл]
Рц(з) > 1-е.
А в силу следствия из уравнения Колмогорова-Чепмена для дан-
ного t и любого п
PaW>(Pjj ал<.
При достаточно больших п значение s = t/n принадлежит про-
межутку [0,и], поэтому
Р^(£) > 0
для всех t 6 [0; сю).
Отметим, что функция <p(t)
1° неотрицательна и конечна;
2° полуаддитивна:
</?(£ + s) <	+ </?($).
Неотрицательность и конечность <p(t) следуют из неравенств
о < PuW < 1,
3.5. Свойство дифференцируемости ...
167
полуаддитивность <p(t) следует из неравенства
Pii(t + $) > Рц(/)Рц(з).
Дифференцируемость ip(t) в точке 0, т. е. существование пре-
дела
<p(t) - (/2(0)	<p(t)
lim ----------— = lim —
t—>o	t	t—>o t
мы докажем, установив, что верхний и нижний пределы <р>(€)/t
равны числу
^(0
qi = sup —— :
t>0 t
а именно,
Inn—— =qi, hm——=qi.
i—>0 t	i->0 t
Поскольку (p(t) 6 [0, oo), to snp(cp(t)/t) = qi может прини-
t>o
мать, вообще говоря, любые значения из [0;+оо]. Мы рассмот-
рим отдельно случаи < оо и ф = +оо.
1° Пусть
qi = sup —— < оо.
t>o t
По определению sup(</?(£)/£) = qi для данного е > 0 найдется
t>o
to > 0 такое, что
а._£<м
Чл	.
to
Представим to в виде
to = nh + 5, 0 < 5 < h < to,n > 0.
В силу полуаддитивности </?($) имеем:
£ < <£>(*о) _ <p(nh + 6) < ncp(h) + </?(5) _ n<p(h) </?(5) _
~ to	to ~ to	to to
to	to
_ nh	</?(5)
to h to
to
т. е.
nh </?(5)
Qt S ~ to h + to
168
Глава 3. Марковские цепи с непрерывным временем
Вычислим нижний предел от правой и левой частей последнего
неравенства при /г —> 0:
- s < lim------= lim-------------------hm + lim ^~L.
h-t-O \ Й) h to J h-t-O ^0 h—>0	h—>0 ^0
Значение
lim = lim = 0,
h^0
поскольку функция </?(s) непрерывна в нуле, <£>(0) = 0 и 5 ч 0
при /г —> 0. Равенство
nh	nh
lim — = lim — = 1
h^0 *0	to
следует из равенства to — nh = 8. Поэтому
Qi - e < lim
h->0 П
И, следовательно,
qi- £ < hm —— < hm —— < sup —— = qi.
h^o n	n h>0
К поскольку e произвольно, то
qi = lim —7— = hm —— = qi.
л->о h h^o h
Поэтому, во-первых, существует
lim^ =</(0)
t^o t у J
и, во-вторых,
</(0) = sup——— = qi.
t>o t
Далее, поскольку
Pn(t) = exp{-</?(f)},
3.5. Свойство дифференцируемости ...
169
Putt) = -</Л*)ехр{-^(£)},
Р'№ = -</(0)е° = —<//(0) = -qi.
Так что
--fii(O) =Qi= sup
t>0 t
2° Пусть теперь
</?(£)
sup------= qi = +сю.
t>o t
Из равенства
sup(<^(t)/t) = qi = +оо
t>o
следует, что для данного М > 0 найдется to > 0 такое, что
м<^.
to
Отсюда, повторяя приведенные выше рассуждения, получим
t^Q t
Поскольку М может быть выбрано сколь угодно большим, то
.	^(0 . Г--- ^(0
+ СЮ < 11Ш--- < 11Ш----.
£->0 t	t
И, следовательно,
г ^(0
lim------------------------= Qi = +сю.
t—>о t
Теорема 3.5.2 (о дифференцируемости Pij(t)). Если пере-
ходные вероятности Pij(t) i,j = 0,1,2,..., марковской цепи
непрерывны в нуле, то Pij(t), j / г, дифференцируемы в нуле
—существуют конечные пределы
lim	= Qij, J + i,
i,j = 0,1,2,...
170
Глава 3. Марковские цепи с непрерывным временем
Доказательство. Сначала докажем лемму.
Для данных i,j (j г) и е > 0 найдется to (достаточно
малое), что при любых h и п (п — целое неотрицательное)
таких, что 0 < nh < to, выполняется неравенство
(1 — Зс)
h ~ nh
(3.5.1)
Доказательство леммы. Для данного h (произвольного, но
фиксированного) по марковской цепи {£(t), t 6 [0, сю)} с непре-
рывным временем определим марковскую цепь с дискрет-
ным временем:
&Л = £(kh), к = 0,1,...
Матрица одношаговых переходных вероятностей цепи рав-
на [Рц (h)], а матрица n-шаговых переходных вероятностей рав-
на [Р^ (п/г)].
Для марковской цепи {£п,д} определим вероятности jPa(nh)
перехода из i в i с запретами:
jPiiW = 1,
jPii^h) — P{£n,h — ^ч £o,h — ^ч £>u,h 7^ Зч V = 1,2,..., П— 1 | (,o,h = 0
— вероятность того, что цепь стартовав из i, за п шагов
вернется в i без захода в j. Напомним еще, что
fij (nh) = Р{£n,h = ji ^0,h = ^ч £>v,h 7^ Зч V = 1,2,..., П~ 1 | £о,Л = 0 •
Имеет место следующее неравенство:
п—1
Ру(п/г) > ^2 jpu^h)pijWpjj(.(.n ~ О' + 1))М (J / «)• (3-5.2)
L/ = 0
Каждое слагаемое в правой части (3.5.2) соответствует пути
длиной п, ведущему из состояния i в состояние j (шаг длиной h),
у которого имеется переход из i в j за один шаг. Эти пути несов-
местны, но, вообще говоря, не исчерпывают всех путей из i в j за
п шагов (здесь учтены только пути, у которых имеется переход
из i в j за один шаг, но среди путей из i в j не все такие).
3.5. Свойство дифференцируемости ...
171
Оценим правую часть (3.5.2) снизу. Для этого сначала оце-
ним снизу jPn(i/h), воспользовавшись равенством
У— 1
Рц(уК) = 57 /y(m/l)Pjj((z/ - то)^) + jPiiivh),
тп=1
— переход из i в i за и шагов возможен с заходом в j и без захода
в j. Имеем
У—1
jPutyh) = Palish) - 52 fijtmh'jPjitt1' ~ m)h) >
m=l
у— 1
> Pjj(vh) — max Pji((v — m)ti)	>
~ ~	m=l
> Pn(i/h) — max Pji((p — m)h),
l<m<y—l
t. e.
jPafvh) > Pa(vh) — max P™((z/ — m)h).	(3.5.3)
Из (3.5.2) и (3.5.3) имеем
Py(n/l) >
n— 1
>	- .max Pji^-m^Pij^Pjj^n- (i/+ l))/i)).
y=0
(3.5.4)
Далее, пусть e > 0 (произвольное, но фиксированное). Для дан-
ных г, j в силу непрерывности Рц(1), Pji(t), найдется та-
кое to (достаточно малое), что при 0 < t < to
Putt) > 1 - s, Pji(t) < s, Pjj(t) > 1 - e.
Поэтому для любых h > 0 и целых к таких, что 0 < kh < to
имеют место неравенства
Pa(kh) > 1 — г, Pjj(kh) < е, Pjj(kh) > 1 — е.
172
Глава 3. Марковские цепи с непрерывным временем
Учитывая последние три неравенства, для h > 0 и п таких, что
nh < to, из неравенства (3.5.4) получаем
п—1
Ру(п/г) > J2(l - г - г)Ру(/г)(1 - г) =
1/=0
= (1 - 2s) (1 - s)nP0(/z) > (1 - 3s)nP^(/z),
или
PZJ(nh) > (1 — 3e)nPij(h).
Разделив обе части последнего неравенства на nh, получим нера-
венство (3.5.1).
Тем самым лемма доказана.
Дальнейшее доказательство теоремы будет основано на нера-
венстве (3.5.1).
Обозначим
1 •
qij = ШИ —
Заметим, что значение
qij < оо.
Действительно, из леммы следует, что для данного е > 0 най-
дется такое to, что для любых п и h, удовлетворяющих условию
nh € (to/2, to) С (0, to],
(1 — Зс)	(nty < 1 —
h ~ nh ~ to/2 to"
поэтому qjj < ex?.
Далее докажем, что
р— Pij(t)	1- Pij(t)
lim —-— < qa = lim —-—
t -чгд	t
Поскольку
1- Pij(t)
qij = hm
t^o t
то для данного s > 0 найдется tf G (0, to) такое, что
tf
< q^ +
3.5. Свойство дифференцируемости ...
173
В силу непрерывности Pij(t) последнее неравенство имеет место
и в некоторой окрестности (Д — h^t! + ho) точки tf (дополни-
тельно выберем ее принадлежащей промежутку (0 До)), т. е.
р. .(А
—< Qij + £•> t G (tf — ho, tf + Hq) С (0, to). (3.5.5)
Для достаточно малых h (0 < h < ho) найдется такое п, что
nh 6 (t' — ho, t' + ho) C (0, to). Поэтому из (3.5.1) и (3.5.5) имеем
(1 _ 3c}Fij^ < Pi^nl^ <(/ +£
(	’ h - nh -q^+£
при h < ho- Так что для h < ho
Вычисляя верхний предел при /г —> 0 от правой и левой частей
последнего неравенства, получим
(1 - Зе) lim	+ s,
h^o h J
а поскольку e можно выбрать сколь угодно малым, то
что вместе с равенством
r PijW
qij = hm —
завершает доказательство теоремы.
Пр им ер 3.5.1. Для процесса рождения и гибели с интен-
сивностями роста Xi и гибели щ вычислить
Qi — — Рц(9) и Qij — Fiji®)-
Решение. По определению процесса рождения и гибели
при /г —> 0 + 0
{Xih + o(h), если j = i + 1;
1 — (A^ + Pi)h + o(h), если j = i,
Pih + o(h), если j = i — 1.
174
Глава 3. Марковские цепи с непрерывным временем
Pij(h) непрерывны в нуле, поэтому согласно теореме о диффе-
ренцируемости Pij(h) существуют производные Р-(0) и Р^-(О),
j i (собственно говоря, существование производных следует и
из вида переходных вероятностей Р^(/г)). При этом
р' /го г 1 —
Qi = ~Рц(9) = lim---------------=
л->о h
_	1 _ (1 “ (Ai + Лг)^ + °(^)) _ х . ,
— ПШ	— Лг “Г /1?,
h—>0	h
г>!	((\\	1*	•f>i,i+l(^') г Aj/l + o(h)
Qi,i+1 = Pi,i+i(0) = bm -------------= bm--------т-----= Xi,
h—>0	h	h—>0	h
Uih + oth)
Qi,i-i = -fi,i-i(0) = hm-------------= Щ,
’	tl
для j i — 1,г, г + 1
P/,(0) = lim = lim = 0.
v h^0 h h^0 h
3.6 Распределение времени пребывания
в состоянии
Из теоремы о дифференцируемости Рц(Г) мы получим важ-
ное утверждение о распределении времени пребывания цепи в
данном состоянии.
Определение. Временем пребывания в состоянии i мар-
ковской цепи {£(£), t 6 [0, оо)}, стартующей из г, будем называть
случайную величину 77, определяемую равенством
Ti = inf{t: £(t) / i, €(0) = 0-
Марковская цепь {£(£)> t € [0, oo)} в момент т, скачком ухо-
дит из состояния г. Мы будем считать, что в момент значение
£(77) все еще равно г, т. е. £(77) = Г
Теорема 3.6.1 (о распределении времени пребывания). Ес-
ли у стационарной марковской цепи {£(£), t 6 [0, оо)}
Qi < оо,
то время пребывания Tj в состоянии i цепи, стартующей из i,
имеет показательное распределение с параметром qi:
Р{п < 11 £(0) = г} = 1 “ exp{-^f}, t > 0.
3.6. Распределение времени пребывания
175
Доказательство. Пусть t > 0 — произвольное фиксиро-
ванное. Рассмотрим событие
{ъ > £,£(0) = г}
— время пребывания Tj цепи, стартующей из состояния г, в со-
стоянии i больше t. Разобьем промежуток [0, t] точками
sk — fc = 0, 1, . . . , 2П ($о = 0, 82” = t)
2П
и обозначим через An(t) событие, состоящее в том, что в момен-
ты времени fc = 0,1,..., 2П, цепь находится в состоянии i:
An(t) = {£ («о) = i,£ («1) =	(«2") = г} •
Ясно, что
-^n+i(^) С An(t), n = 1,2,...
Непосредственной проверкой можно убедится, что
{Tj > t,£(s0) = г} = Q An(t).
П=1
Из последнего равенства в силу свойства непрерывности веро-
ятности имеем
(оо	\
P|An(f) = limP(An(f)). (3.6.1)
11	In
n=l /
Вычислим lim P (An(t\).
В марковской цепи конечномерные распределения, в частнос-
ти и
P(An(t)) = *Ш) = i, C(«1) =«,•••> C(«2"-1) = i,C(«2") = i}>
выражаются через распределение начального состояния и пере-
ходные вероятности (см. (3.1.3)):
P(An(i)) = Р{С(«о) = i, £(«i) = г, , С(«2"-1) = г,С(в2п) =	=
= Р{£(в2п) = i I C(s2n-1) = г}Р{£(в2п-1) = i I ^(®2П—2) =«}...
• • • -Р{С(«1) = i I €(so) = i}P{£(s0) = i} =
176
Глава 3. Марковские цепи с непрерывным временем
=	-Р{<Ы = *}-
Поэтому (3.6.1) можно переписать так
/ St\\2n
Р{тг > £,фо) = г} = -Р{С(«о) = 4lim ( Рп эд •
п \	\Л'1 J J
(	( t \\2П
Найдем lim ( Рц (	) )	•
Поскольку Pu(s) дифференцируема в нуле и по условию тео-
ремы —Р/ДО) = qi < оо, то
Pu(s) = 1 - qis + o(s), s —> 0.
Положив s = t/2n, при n —> оо получим:
Рц I 77“ I — 1 — Q?77“ + О I	I ,	(3.6.2)
\2n J 4 2n \ 2n)	v 7
(^(2"))	= y1 ~qi?n +0 (2”))	=
ln^n(t) = 2” In (1 - qt^- + о	~
~2n (-«^ +°	= -%i + o(l),
ln^n(i) -> -qit,
<^n(i) -> e~git.
Так что при n 00
/	/ . \\2n
<^„(f) = [Pa (2^))	-»•e-9it,
limP(An(i)) = PR(so) = i}e~git.
n
Поэтому равенство (3.6.1) можно переписать так:
P{n > t,£(s0) = г} = P{C(so) = 0е 9it
3.6. Распределение времени пребывания
177
Отсюда
Р{тг >t|£(0) =0 = e~qit, t >0,
Р{п < 11 C(0) =г} = 1- e~9it, t > 0,
т. e. время пребывания цепи, стартующей из состояния г, в со-
стоянии i имеет показательное распределение.
Следствие. Если qi = 0, то
Р{тг = +оо I £(0) = г} = 1,
Другими словами, если qi = 0, то цепь, стартовав из состоя-
ния i, останется в i навсегда.
Доказательство. При qi = 0 из равенства (3.6.2) имеем
Отсюда, повторяя выкладки теоремы, получим что для любого
t > 0
р{г{ > t ie(o) = о = 1-
Переходя в последнем равенстве к пределу при £ —> +оо, полу-
чим
P{Ti > +ОО | £(0) =0 = 1-
Определение. Состояние г, для которого
qi < оо,
называется устойчивым.
Состояние г, для которого
Qi = 0,
называется поглощающим (цепь, попав в поглощающее состоя-
ние г, остается в нем навсегда).
Состояние г, для которого
qi = -hoc,
называется мгновенным.
Среднее время пребывания цепи во мгновенном состоянии
равно нулю. Попадая в такое состояние, цепь мгновенно его по-
кидает. Теория марковских цепей с непрерывным временем, име-
ющих мгновенные состояния, крайне сложна.
178
Глава 3. Марковские цепи с непрерывным временем
Мы не будем рассматривать марковские цепи, у которых
имеются мгновенные либо поглощающие состояния.
Вложенная цепь. Событие “цепь, пребывая в состоянии г,
в момент времени t покидает г” обозначает, что для любого,
сколь угодно малого /г, происходит событие
{€(<) = i, £(£ + />) / О-
Обозначим через
Лц(/г) = P{£,(t + h)=j\ £(t) = i, £(t + h)^i}
вероятность того, что цепь в момент t + h пребывает в состо-
янии j при условии, что пребывая в момент t в состоянии г,
в момент t + h она в состоянии i не пребывает. Тогда
Ру = lim Rijfji)
естественно рассматривать (интерпретировать) как вероятность
события “покидая состояние i, цепь переходит в состояние j”.
Убедимся, что lim Rijth) существует, и более того
lim Rij(h) =
h—>o lJ' 7 qi
Для Rij(h) имеем
Rdj(h) = pm+h) = j\ e(t) = i, +h)^i} =
= Р{& + h)= j, £(t) = i, + h)^i} =
pm = i,
pm+h) = j,e(o = i} pm+h) = j\e(f) = i}
p{&t+h^i,= о p{t(t+h)/i\e(t) = o
p{^t+h) = j\^t) = i} p^h)
l-P{^t + h) = i\^t) = i} l-Pathy
t. e.
<3-6-3’
мы воспользовались тем, что
{£(t + h) =	=z} C {£(t + h)	= z},
3.6. Распределение времени пребывания
179
W + ^)	+	=г} = {£(t + h) =	= г}.
Разделив числитель и знаменатель правой части равенства (3.6.3)
на h и переходя к пределу при /г —> 0 (существование предела
следует из дифференцируемости Рц{1) и P^-(t)), получим
lim Rii(h) = hm ---z, ч 4 ., = — = рц.
h^o J h^o (1 — Pii(hY)/h qi J
Итак, вероятность того, что цепь, покидая состояние г, пе-
рейдет в состояние j равна
/П —
Pij ~ о 
Чг
Например, для процесса рождения и гибели вероятность pij
того, что цепь, покидая состояние г, перейдет в состояние j, рав-
на
Pi,i+i = lim Riti+i(h) =	,
Л->0	qi	Xi + щ
Pi,i-1 = lim7?M_i(/i) =	,
Л->0	qi	Xi + щ
для j i — 1, г + 1 значения
Pij = lim Rij(K) = ^ = 0,
h,—>0	qi
см. также пример 3.5.1 (с. 173).
Структура марковской цепи с непрерывным временем опи-
сывается следующим утверждением.
Стационарная марковская цепь е [0;оо),£(0) = г},
стартовав в момент времени t = 0 из состояния г, пребывает
в i случайное время ъ, имеющее показательное распределение
с параметром qi = -Р/ДО).
По окончании времени пребывания цепи в состоянии i цепь,
уходя из состояния i, переходит в состояние j / i с вероятнос-
тью р^ = q^ /qi и пребывает в состоянии j случайное вре-
мя Tj, имеющее показательное распределение с параметром qj,
и т. д.
Определение. Пусть	6 [0;оо)} — стационарная
марковская цепь с непрерывным временем и фазовым простран-
ством X = {0,1,2,...}, р^ = q^/qi — вероятность перехода из
180
Глава 3. Марковские цепи с непрерывным временем
состояния i в состояние j (J i) по истечении времени пребыва-
ния Ti цепи в состоянии i. Марковскую цепь {£п} с дискретным
временем, фазовым пространством X и матрицей переходных
вероятностей
[Ру], i,j е х, pa = о, i е х,
будем называть вложенной марковской цепью стационарной мар-
ковской цепи 6 [0;оо)}.
Матрицу \pij] называют матрицей переходных вероятностей
вложенной марковской цепи.
Определение. Числа Vij(i,j = 0,1,2,...), определяемые
равенством
= I -Qi, если j = i,
tj I Qij, если j i,
называются инфинитезимальными интенсивностями перехо-
да марковской цепи 6 [0;оо)} с непрерывным временем,
а матрицу v = [z/^] называют матрицей инфинитезимальных
характеристик.
Матрица инфинитезимальных характеристик задает марков-
скую цепь: уц = qz — параметр показательного распределения
времени пребывания цепи в состоянии г, а р^ = Qij/Qi — вероят-
ность перехода из состояния i в состояние j (j г).
Заметим, что матрица инфинитезимальных характеристик
i/ = P'(0).
3.7 Обратные дифференциальные
уравнения Колмогорова
Определение. Марковскую цепь {£(f),f € [0;оо)} с непре-
рывными в нуле переходными вероятностями будем называть
консервативной, если для всех i
^2 Hi = (Ь (9<<И< °°)-	(3.7.1)
j-j/i
Другими словами, марковская цепь консервативна, если для всех i
У? Pij = 1-
j-j^i
Эквивалентность определений следует из равенств р^ = Iq2,
i,j = 0,1,2,...
3.7. Обратные дифференциальные уравнения
181
Пример 3.7.1. Процесс рождения и гибели консервативен,
поскольку
Qm+i =	Qij = °,	-+
qi = Xi + щ.
Теорема 3.7.1 (обратные уравнения Колмогорова). В кон-
сервативной цепи Маркова переходные вероятности Pij(t) удов-
летворяют обратным дифференциальным уравнениям Колмо-
горова:
Р'гД) = Е QikPkj^ ~ QiPijW) (3-7.2)
k:k^i
для всех i,j = 0,1,2,...; в матричном виде
P'(f) = Рр(£),
где и — инфинитезимальная матрица.
Доказательство. Из уравнения Колмогорова-Чепмена име-
ем
Ру (/г + t) - Pij (t) = Е PikWPkjtt) - Pijlt) =
к
= 52 pfc(/i)pfeJ(t) + (Paw - 1)р^.
k:k^i
Отсюда
Pij(h + t)~ Pjj(t)
h
=l +p"th: ip->w-
k:k^i
Формально переходя к пределу при /г —> 0 + О, причем в правой
части под знаком суммы, для всех г, j, получим
~ QikPkj(t) qiPijfy-
k-.k^i
Для обоснования предельного перехода установим, что
Е ^кРкД} < lim 1 Е Pik(h')Pkj(t') <
k-.k^i	/wO+О h к.к^
182
Глава 3. Марковские цепи с непрерывным временем
— . к УТ PikWPkj^t) < УТ QikPkj(t)-
^0+0h
Для любого N
1	N	1
-	£	Pik(h)Pkj(t) <	-	£	Pik(h)pkj(t).
tl	£'	tl	£<
k=l,k^i	k:k^i
Отсюда
N 1
52 QikPkjit) < lim - y''Pik(h)Pkj(t),
k=i^i	h^+°hk^i
а так как N произвольно, то
52 qikPkj(t) < lim | 52 pik(h)Pkj(tY (3.7.3)
k-.kjti	h-Ю+О к.к^
Докажем теперь, что
к lijrLn 7? УТ Pik(h)Pkj(t) < УТ QikPkj(t)-
k-.k^i	k-.k^i
Пусть N достаточно большое, так что i 6 [0,7V). Тогда
52 pik(h)pkj(t) < 52 pik(h)pkj(t) + 52 рм =
k:k^i	k=l,k^i	k=N+l
N	N
= 52 pik(h)pkj(t) + i-^PikW =
k=l,k^i	k=l
N	N
= 52 вд)ркд«)+((1-рй(/г))- 52 pm).
k=l,k^i	k=l,k^i
Разделив на h и вычислив верхний предел при h 0 + 0 от
обеих частей, получим
1	N	N
Um Т Pik(h)Pkj(t) < QikPkjW + \Qi ~ Qik ) •
Л->0+0 Г1 £z£'	\	£'	/
k:k^i	к=1, k^i	k=l,k^i
3.8. Примеры и задачи
183
При N +оо, учитывая, что процесс консервативен (см. (3.7.1)),
а, следовательно,
N
Qi~ 52 Qik °’
к=1, k^i
получаем
lim Г 12 pik(typkj(t) < 52 <kkPkj(t)-
ft—>0+0 h f--'	f-'
к-.к^г	к\к^рг
Из последнего неравенства и неравенства (3.7.3) следует, что,
во-первых, существует
Йо S £ р*‘*
к\к^г
и, во-вторых, он равен QikPkj(t)-
k:k^i
Тем самым теорема доказана.
Замечание. Переходные вероятности Pij(t) консерватив-
ной марковской цепи удовлетворяют системе обратных
дифференциальных уравнений (3.7.2) и без предположения кон-
сервативности, но последнее делает доказательство теоремы осо-
бенно простым.
3.8 Примеры и задачи
Примеры
Пример 3.8.1 (цепь с двумя состояниями). Пусть 6
6 [0, ex?)} — стационарная марковская цепь с непрерывным вре-
менем и фазовым пространством X = {0; 1}.
Найти Pij(t), i,j = 0,1, по известным qo и qi, если состо-
яния цепи ненулевые, т. е. qo > 0 и qi > 0, и не мгновенные,
т. е. qo / сю и qi / сю.
Решение. Поскольку фазовое пространство X = {0; 1} со-
стоит из двух состояний и состояния ненулевые — цепь не оста-
ется в состояниях 0 и 1, то вероятности перехода во вложенной
цепи равны:
Poi = 1, Рю = 1.
Далее,
_ Qij • / •
Pij ~	•> 3
Qi
184
Глава 3. Марковские цепи с непрерывным временем
поэтому	Qoi	<7ю Poi = —, Рю = —, Qo	Q1
а т. к.	Р01 = 1, Рю = 1,
то	«и = qo, qw = qi
и, следовательно, матрица инфинитезимальных характеристик
Г -Qo Qoi 1	Г -Qo Qo I
L Q10 -Qi J	L Qi -Qi J ’
Переходные вероятности	= 0,1, найдем как реше-
ния обратных дифференциальных уравнений Колмогорова:
Р'(^) =
подробнее
Роо(О = -Qo-Poo(i) + Qo-Pio(i),	(3.8.4)
Poi (0 = -Qo-Poi(i) + Qo-Pu(i),	(3.8.5)
PwW = Qi-PooW - Qi-PioW,	(3.8.6)
Pf1(t) = giPoi(t)-9iPii(t),	(3.8.7)
с начальными условиями
Py(0) = <^, м = 0,1.	(3.8.8)
Поскольку
Poo(t) + Poi(t) = 1, Pio(i) + Pn(t) = 1,	(3.8.9)
то для решения системы уравнений (3.8.4) — (3.8.7) достаточно
найти РОо(О и Рю(£), решив систему уравнений (3.8.4) и (3.8.6).
Вычитая уравнение (3.8.6) из уравнения (3.8.4), получим:
(Poo(f) - PioW)' = -(Qi + Qo)(PooW - PioW). (3.8.10)
Решением последнего дифференциального уравнения при на-
чальном условии
Роо(О) - Рю(0) = 1
3.8. Примеры и задачи
185
является
Poo(t) - Pio(t) = е-(<го+^.	(3.8.11)
Подставляя в (3.8.4), получим:
= -</ое-(9о+91)*.
Откуда
f P^(s)ds = - f qoe-^+^sds,
Jo	Jo
Poo(t) = Роо(0) - -5— (1 - е-^+^)‘).
qo + qi
Итак,
P00(t) = —Я’— + _Я2_е-(9о+91)*5 t > 0.
Qo + <71 Qo + Ql
По P00(t) находим оставшиеся Pij(t).
Подставив выражение для Роо(О в равенство (3.8.11), нахо-
дим, что
Р10(<) = —----------^e-(90+Ql)t5 t > 0
qo + qi qo + qi
Наконец, из (3.8.9) получаем, что
Poi(i) = 1 - Poo(t) = —--------®e-(9o+</i)t5 t > 0)
qo + qi qo + qi
Pn(f) = 1 - Pio(t) =	90	+	91 e~(go+gl)t, t > 0.
QO + Ql QO + Ql
Из найденных представлений для Pij(t), i,j = 0,1, получаем
lim Pjo(t) = ———, i = 0,1,
i->oo	qo + qi
lim Pn(t) = ———, i = 0,1.
i—>oo	qo + qi
Пример 3.8.2. Пусть t G [0,oo),£(0) = 0} — процесс
чистого рождения, стартующий из 0 с фазовым простран-
ством X = {0,1,2,...} и положительными интенсивностями
роста Xk.
186
Глава 3. Марковские цепи с непрерывным временем
Вероятности пребывания Pk(t) = P{£(t) — &}> fc = 0,1,2,...
удовлетворяют системе дифференциальных уравнений
p^t) = -лад,
= -AfcPfc(t) + Afe-iPfe-i(f), к > 1.
(3.8.12)
Система (3.8.12) имеет единственное решение {Pfe(f)}, удовле-
творяющее соотношениям
Pk(t) > о,
оо
к=0
Показать, что если
оо
Ep*w = 1
к=0
при всех t > О,
то ряд
(3.8.13)
расходится.
Решение. Из (3.8.12) получаем:
XkPk(t) = -P^t) + Afc_iPfc_i(f).	(3.8.14)
Пользуясь рекуррентным соотношением (3.8.14), имеем:
^kPk(t) — Pk(t) + ^к— 1Рк—1(0 —
= -P^t) - P^t) + Afc_2Pfc_2(f) = ... = -£ P'(t)-
j=0
Интегрируя последнее равенство, получаем:
Afc fpk(s)ds= (-^PXs)) =
о	\ j=o J о
3.8. Примеры и задачи
187
k	k
= £(pz(o)-p/f)) = i-£pz(t),
j=0	j=0
(воспользовались тем, что процесс стартует из нуля: Ро(О) —
= 1,РД0) = 0J = 1,2,...) или
t
к
j=0
0
Отсюда имеем
t
f Pk(s)ds < -к
J	Afc
о
(3.8.15)
Предположим, что
ОО
£nw = i-
к=0
Сложив почленно неравенства (3.8.15) (fc = 0,1,2,...) и вос-
пользовавшись теоремой Лебега о монотонной сходимости, по-
лучим:
оо оо t	t оо	t
52 д- 52 / Pk(s)ds = / ^Pktsjds = Idt = t
fc=0 Лк k=o о	о fc=°	о
при всех t > 0, что доказывает расходимость ряда (3.8.13).
В случае же, когда ряд (3.8.13) сходится, для некоторого to
оо
52 pk(do) ± 1,
к=0
т. е. в момент времени to мы имеем дело с парадоксальной ситуа-
цией (ведь события {£(to) = к}, к = 0,1,2,... образуют полную
группу событий и сумма их вероятностей обязана равняться 1).
Объяснить это явление можно так: при достаточно быстро стре-
мящихся к бесконечности интенсивностях роста (настолько
быстро, что ряд (3.8.13) сходится) размер популяции может за
188
Глава 3. Марковские цепи с непрерывным временем
конечное время Т вырости до бесконечности (так называемый
взрыв) и процесс при t > Т не определен.
Задачи
Задача 3.1. Выписать обратные дифференциальные урав-
нения Колмогорова для процесса чистого рождения.
Ответ:
Р'(^) =
где
-Ао
О
Ао
-Л1
О
О О
А1 О
—А2 А2
Задача 3.2. Доказать, что для любого состояния г марков-
ской цепи с непрерывным временем вероятность возвращения в
исходное состояние Рц(£) строго больше нуля при всех t > 0.
Указание. Воспользоваться уравнением Колмогорова-Чеп-
мена.
Задача 3.3. Пусть i,j — два состояния марковской цепи с
непрерывным временем и существует to такое, что Pij(to) > 0.
Доказать, что > 0 для любого t > 0.
Указание. Воспользоваться формулой Колмогорова-Чеп-
мена.
Задача 3.4. Доказать, что для процесса чистого рождения
переходные вероятности удовлетворяют соотношению
t
= Aj-i e~Xit f e^Pij-^sjds, j > i.
0
Указание. Воспользоваться прямыми дифференциальны-
ми уравнениями.
Задача 3.5. Пусть £(£) — процесс чистого рождения с ин-
тенсивностями роста Ло = 1, А1 = 3, Л2 = 2, Аз = 5. Найти Ро,п(£)
при п = 0,1,2,3.
Задача 3.6. Пусть — пуассоновский процесс с интен-
сивностью А = 5. Найти:
1)Р{£(3) = 8, е(7) = 12}; 2)Р{£(3) = 3, £(6) = 5}.
Задача 3.7. Пусть £(£) — пуассоновский процесс с интен-
сивностью А = 7. Найти
Р{£(3) = 81 £(10) = 22}.
Литература
[1]	Боровков А. А. Курс теории вероятностей / А. А. Боровков.
— М. : Наука, 1972. — 288 с.
[2]	Гихман И. И. Теория вероятностей и математическая ста-
тистика / И. И. Гихман, А. В. Скороход, М. И. Ядренко.
— К. : Вища шк. Головное изд-во, 1979. — 320 с.
[3]	Гнеденко Б. В. Введение в теорию массового обслуживания
/ Б. В. Гнеденко, И. Н. Коваленко. — М. : Наука, 1966. —
432 с.
[4]	Зубков А. М. Сборник задач по теории вероятностей: учеб,
пособие для вузов / А. М. Зубков, Б. А. Севастьянов,
В. В. Чистяков. — 2-е изд., испр. и доп. — М. : Наука. Гл.
ред. физ.-мат. лит., 1989. — 320 с.
[5]	Карлин С. Основы теории случайных процессов / С. Кар-
лин. — М. : Мир, 1971. — 536 с.
[6]	Мешалкин Л. Д, Сборник задач по теории вероятностей /
Л. Д. Мешалкин. — М. : Изд-во Моск, ун-та, 1963. — 155 с.
[7]	Миллер Б. М. Теория случайных процессов в примерах и
задачах / Б. М. Миллер, А. Р. Панков. — М. : ФИЗМАТ-
ЛИТ, 2002. - 320 с.
[8]	Розанов Ю. А. Случайные процессы / Ю. А. Розанов. —
М. : Наука, 1971. - 288 с.
[9]	Скороход А. В. Элементы теории вероятностей и случай-
ных процессов / А. В. Скороход. — К. : Вища школа, 1980.
- 344 с.
190
Глава 3. Марковские цепи с непрерывным временем
[10]	Теория вероятностей: Сб. задач. / А. Я. Дороговцев,
Д. С. Сильвестров, А. В. Скороход, М. И. Ядренко. —
К. : Вища шк. Головное изд-во, 1980. — 432 с.
[11]	Турчин В. Н. Теория вероятностей и математическая ста-
тистика: учебник / В. Н. Турчин. — Д.: Изд-во Днепропетр.
ун-та, 2008. — 656 с.
[12]	Тутубалин В. Н. Теория вероятностей и случайных процес-
сов / В. Н. Тутубалин. — М. : Изд-во Моск, ун-та, 1992. —
400 с.
[13]	Феллер В. Введение в теорию вероятностей и ее приложе-
ния: В 2 т. / В. Феллер. — 3-е изд. — М. : Мир, 1984. — Т.1.
- 527 с.; Т.2. - 751 с.
[14]	Ширяев А. Н. Вероятность / А. Н. Ширяев. — М. : МЦН-
МО, 2004. - Т.1. - 520 с.; Т.2. - 408 с.
[15]	Bhattacharya R. N. Stochastic Processes with Applications /
R. N. Bhattacharya, E. C. Waymire. — Philadelphia: SIAM,
2009. - 676 p.
[16]	Chung K. L. Markov Chains with Stationary Transition
Probabilities / K. L. Chung. — Berlin: Springer-Verlag, 1960.
- 278 p.
[17]	Lefebvre M. Applied Stochastic Processes / M. Lefebvre. —
N.Y.: Springer Science+Business Media LLC, 2007. — 382 p.
[18]	Norris J. R. Markov Chains / J. R. Norris. — Cambridge:
Cambridge University Press, 1997. — 238 p.
[19]	Parzen E. Stochastic Processes / E. Parzen. — San Francisco:
Holden-Day, 1962. — 324 p.
[20]	Privault N. Understanding Markov Chains / N. Privault. —
Singapore: Springer, 2013. — 354 p.
[21]	Resnick S. Adventures in Stochastic Processes / S. Resnick. —
Boston: Birkhauser, 2005. — 626 p.
[22]	Stirzaker D. Stochastic Processes and Models / D. Stirzaker.
— Oxford: Oxford University Press, 2005. — 332 p.
Оглавление
Предисловие.................................... 3
1	Цепи Маркова — основные понятия и факты 5
1.1	Определение цепи Маркова.
Простейшие свойства........................ 6
1.2	Возвратность.............................. 21
1.3	Существенные состояния.
Классы эквивалентности.................... 31
1.4	Примеры и задачи.......................... 52
2	Предельные теоремы
для	марковских цепей	71
2.1	Эргодическая теорема ..................... 71
2.2	Дискретная марковская цепь,
описывающая очередь ......................107
2.3	Задача о разорении игрока.................115
2.4	Примеры и задачи..........................125
3	Марковские цепи
с непрерывным временем	135
3.1	Основные понятия и определения ...........135
3.2	Процесс чистого рождения..................140
3.3	Процессы рождения и гибели................149
3.4	Обслуживание с ожиданием..................159
3.5	Свойство дифференцируемости
переходных вероятностей...................165
3.6	Распределение времени пребывания
в состоянии...............................174
3.7	Обратные дифференциальные
уравнения Колмогорова ....................180
3.8	Примеры и задачи..........................183
Литература....................................189
Навчальне видання
Турчин Валерш Миколайович
Турчин €вген Валершович
MAPKOBCBKI ЛАНЦЮГИ
Основы! поняття, приклады, задач!
Навчальний посгбник
для студентов
вищих навчальних закладгв
(росгйською мовою)
Редактор К).В. Козаченко
Художник К.Д. Ткаченко
Орипнал-макет B.M. Турчин
ГПдниеано до друку 01.02.2016 р.
Формат 84x108/32. Ум. друк. арк. 10,08.
Тираж 300 нрим. Зам. № 010216.
Видавництво i друкарня TOB «Л1зуновПрес»
49127, м. Дшнронетровськ, вул. Немировича-Данченка, 30/166.
Свщоцтво суб’екта видавничоГ снрави:
cepin ДК № 3597 в!д 06.10.2009 р.
BiddpyKoeano з готового авторського оригша.л-макета
(1з прав, на с. 1, 2, 3, 191, 192)
ТУРЧИН
Валерий Николаевич
Автор 107 научных и научно-
методических работ,
14 учебников и учебных пособий
по теории вероятностей
и математической статистике.
Заведующий кафедрой
статистики и теории вероятностей
Днепропетровского
национального университета
имени Олеся Гончара.
ТУРЧИН
Евгений Валериевич
Автор 27 научных и научно-
методических работ,
2 учебных пособий по теории
вероятностей и математической
статистике.
Доцент кафедры статистики
и теории вероятностей
Днепропетровского
национального университета
имени Олеся Гончара.