Text
                    Позиционное
ИГРЫ

ТЕОРИЯ ИГР ПОЗИЦИОННЫЕ ИГРЫ ПОД РЕДАКЦИЕЙ Н. Н. ВОРОБЬЕВА и И. Н. ВРУБЛЕВСКОЙ ИЗДАТЕЛЬСТВО «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ МОСКВА 1967
517.8 П 47 УДК 519.9 2-2-3 100-67
СОДЕРЖАНИЕ Предисловие редактора.................................. 4 Воробьев Н. Н., Позиционные игры....................... 5 Кун Г, У., Позиционные игры и проблема информации [Пере- вод О. Н. Бондаревой]................................. 13 Дэлки Н., Эквивалентность информационных схем и сущест- венно определенные игры [Перевод О. Н. Бондаревой] 41 Берч Б. Дж., Об играх с почти полной информацией [Перевод О. Н. Бондаревой]..................................... 72 Воробьев П. Н., Редуцированные стратегии в позиционных играх^............................................ 94 Врублевская И. Н., Эквивалентность стратегий в конечной позиционной структуре................................ 114 Исбелл Дж. Р., Финитарные игры [Перевод А. А. Корбута] 132 Берж К., Теоретико-множественный подход к поочередным играм [Перевод Е. Б. Яновской]....................... 155 Воробьев И. Н., К вопросу об эндоморфизмах полных полу- структур множеств.................................... 183 Милнор Дж., Суммы позиционных игр [Перевод Д’. А. Петро- сяна] ....................* . . . . 187 Ханнер О., Средняя партия для сумм позиционных игрДПере- вод Л. А. Петросяна] ................ 198 Петросян Л. А., Сигнальные стратегии и стратегии поведе- ния в одном классе бесконечных позиционных игр. . 221 Петросян Л. А., Еще одно обобщение теоремы Куна . . . 230 Врублевская И.„ Н,, Эквивалентность смешанных стратегий и стратегий поведения в счетной позиционной структуре 246 Ауман Р. Дж., Смешанные стратегии и стратегии поведения в бесконечных позиционных играх [Перевод И. Н. Вруб- левской] ............................................ 251 Пирс А. Р., О топологических играх [Перевод И. Н. Врублев- ской] ............................................... 278 Сайон М., Вулф Ф., Об игре, не обладающей значением [Пе- ревод И. Л. Романовской]............................. 290 Приложение. Вальд А., Статистические решающие функ- ции [Перевод Н. II. Воробьева, Л. А. Петросяна] . . . 300
ПРЕДИСЛОВИЕ РЕДАКТОРА Предыдущие сборники статей по теории игр («Теория игр. Матричные игры», Физматгиз, 1961 и «Теория игр. Бесконечные антагонистические игры», Физматгиз, 1963) были посвящены антагонистическим играм в нормальной форме. В настоящем сборнике собраны основные работы, касающиеся позиционных игр, называемых иногда также играми в обобщенной форме или играми в развернутой форме. Позиционные игры относятся, по существу,* к так назы- ваемым динамическим играм, но не исчерпывают их. Перво- начально предполагалось посвятить данный сборник всему классу динамических игр. Однако обилие материала вынудило составителей ограничиться более узким клас- сом игр. Работы по динамическим играм, не являющимся позиционными и не примыкающим к ним непосредствен- но, предполагается включить в следующий сборник дан- ной серии. В предлагаемый читателю сборник входят как перевод- ные, так и оригинальные работы. Вводная статья содержит краткое описание помещенных в сборнике работ и места освещаемого раздела теории игр в общей теории. Следует заметить, что содержание настоящего сборника непосредственно не связано с результатами работ, поме- щенных в предыдущих сборниках. Поэтому его можно читать независимо от них. Н. Н. Воробьев
ПОЗИЦИОННЫЕ ИГРЫ Н. Н. Воробьев 1. Принято считать, что теория игр есть теория мате- матических ситуаций конфликтного типа, т. е. таких си- туаций, в которых принимают участие несколько активных сторон, наделенных различными интересами и способных выбирать те или иные свои действия. Вместе с тем в по- следнее время распространяется новая, несколько более общая точка зрения, согласно которой теория игр рас- сматривается как теория принятия решений в условиях неопределенности. Эта новая точка зрения не противоре- чит старой, ибо в условиях конфликта каждый из его участников, как правило, заинтересован в том, чтобы со- хранить в тайне свой предстоящий образ действий и не допустить получения противником «стратегической инфор- мации» о нем. Таким образом, той специфической чертой конфликтов, которая рассматривается в теории игр, явля- ется принятие решений в условиях неполной информации (и, в частности, в условиях отсутствия информации) о фактически складывающейся обстановке. Вместе с тем в некоторых приложениях теории игр рассматриваются не конфликты в собственном смысле слова, а явления, кото- рые могут быть лишь интерпретированы как конфликты. К числу таких явлений можно отнести, например, борьбу с природой, принятие статистических решений и т. д. Из сказанного следует, что вопросы об «информацион- ном состоянии» принимающего решения субъекта явля- ются, по существу, теоретико-игровыми вопросами: объем информации может быть переменным лишь в тех случаях, когда допускается возможность неполной информации. Тем более естественно изучать в теории игр оптимальные поведения лиц, информационные состояния которых в про- цессе принятия ими решений изменяются. На практике
6 Н. Н. ВОРОБЬЕВ такое положение дел встречается довольно часто, а именно каждый раз, когда принятие решений представляет собой протекающий во времени процесс, в ходе которого при- нимающее решение лицо приобретает об обстановке новую, дополнительную информацию или, наоборот, утрачивает, «забывает» ее (например, в результате ограниченности тех или иных видов его памяти). 2. Процесс принятия решений можно предполагать как непрерывным, так и дискретным. С последним случаем мы сталкиваемся каждый раз, когда в ходе процесса при- нятия решений субъект проходит последовательность «по- зиций», в каждой из которых ему приходится принимать не- которое частичное решение. В сущности, именно к этому и сводится неформальное описание позиционной игры. В некоторых играх игрок, в какой бы позиции он ни находился, знает эту позицию точно. Такие игры назы- ваются играми с полной информацией. Характерным при- мером такой игры являются шахматы, равно как и другие игры, разыгрываемые на разного рода досках. Поскольку полную информацию можно рассматривать как частный случай неполной, игры с полной информацией естественно рассматривать в рамках общей теории игр. Однако ока- зывается, что с чисто теоретико-игровой точки зрения слу- чай полной информации не представляет большого инте- реса, так как и по постановке вопроса, и по способам его решения, и, наконец, по характеру ответа на него в этом случае утрачиваются специфические теоретико-игровые черты, и вся проблема приобретает общематематический (аналитический или комбинаторный) характер. Значительно больший интерес в теоретико-игровом пла- не представляют случаи, когда позиция, в которой участник игры находится, известна ему не полностью, а лишь «при- близительно», как некоторый неизвестный элемент извест- ного множества. Эти множества в теории позиционных игр называются информационными множествами. Структура позиционной игры в основном и определяется семействами информационных множеств каждого из ее участников и взаимными расположениями этих множеств в множестве всех позиций. Примерами позиционных игр с неполной информацией (если оставаться в рамках салонных игр) могут служить различные игры в карты, домино и т. п.
ПОЗИЦИОННЫЕ ИГРЫ 7 3. Основные понятия теории позиционных игр содер- жатся в основополагающем труде Дж. фон Неймана и О. Моргенштерна «Теория игр и экономическое поведе- ние» [1], русский перевод которого готовится к изданию в той же серии, что и данный сборник. Однако приведен- ное в этой книге описание позиционных игр еще не было должным образом формализовано. Впервые эта формали- зация была проведена в статье Г. Куна, перевод которой помещен на стр. 13—40 настоящего сборника. Если чита- телю пока неизвестны основные понятия теории позицион- ных игр и соответствующая терминология, то ему можно посоветовать ознакомиться с этой статьей непосредственно. Кроме основного концептуального аппарата теории по- зиционных игр, эта статья содержит и ряд важных кон- кретных результатов. К их числу следует отнести в первую очередь исследование об играх с полной памятью. Говоря неформально, полная память игрока состоит в его способ- ности в любой момент игры знать, был ли он до этого мо- мента в том или ином информационном множестве или нет, и если был, то какое решение было им там принято. Таким образом, полная память игрока определяется вза- имным расположением лишь его собственных информацион- ных множеств. Теорема Куна утверждает, что игрок, имеющий полную память, может, не терпя при этом никакого ущерба, огра- ничить свои смешанные стратегии так называемыми стра- тегиями поведения, т. е. такими смешанными стратегия- ми, в которых случайные выборы игроком своих частичных решений в каждом информационном множестве являются стохастически независимыми. Именно с этой теоремы начинается связь теории игр с теорией вероятностей (а отнюдь не с понятия смешанной стратегии, которая, явля- ясь совершенно изолированной случайной величиной, ни- как не связанной с какими-либо другими случайными ве- личинами, относится скорее к общей теории меры, чем к собственно теории вероятностей). Более того, теорема Куна означает, что если некоторое вероятностное распределение на множестве всех исходов позиционной игры может быть осуществлено в результате применения игроками произвольных смешанных страте- гий, то это же распределение может быть достигнуто при
8 Н. Н. ВОРОБЬЕВ использовании лишь стратегий поведения теми из игро- ков, которые имеют полную память. Если называть экви- валентными две стратегии игрока, которые приводят к одинаковым распределениям на множестве окончательных позиций, то теорему Куна можно рассматривать как тео- рему об эквивалентности стратегий поведения игрока с полной памятью произвольным его стратегиям. 4. Теорема Куна в достаточной мере проясняет поло- жение дел для случая игр с полной памятью. Однако рас- сматриваемый в ней вопрос представляется ограниченным с нескольких точек зрения. Во-первых, в нем идет речь о памяти игроков, т. е. о способности игрока иметь и сохранять информацию о себе самом. При этом совершенно игнорируются особен- ности взаимного расположения информационных мно- жеств различных игроков. Во-вторых, теорема Куна касается только случая пол- ной памяти игрока и не дает оснований делать какие-либо заключения о возможностях игрока ограничиваться теми или иными классами своих смешанных стратегий даже в тех случаях, когда игрок располагает памятью, в том или ином смысле близкой к полной. Наконец, в-третьих, в работе Куна речь идет лишь об играх с конечным числом позиций. Некоторые статьи в настоящем сборнике преодолевают указанные ограничения работы Куна. 5. Грубо говоря, неопределенность в позиционной игре возникает для игрока потому, что его информацион- ные множества оказываются «слишком большими»; если их «раздробить» до такой степени, чтобы каждое информацион- ное множество состояло из одной позиции, то в получив- шейся игре игрок будет иметь полную информацию со всеми вытекающими из этого стратегическими последст- виями для него. Ясно, однако, что, вообще говоря, для того чтобы игрок имел возможность ограничиться своими чистыми стратегиями, столь полное дробление его инфор- мационных множеств не является необходимым. Встает естественный вопрос о том необходимом уточнении инфор- мации игрока о позициях, при котором он уже сможет обойтись своими чистыми стратегиями. Аналогичный во- прос возникает в связи с памятью игрока и его стратегия-
ПОЗИЦИОННЫЕ ИГРЫ 9 ми поведения. Эти вопросы рассматриваются в статье Дэл- ки, помещенной на стр. 41—71 данного сборника, на основе вводимого им понятия «полного уточнения» игры. Дальнейшее развитие этих идей содержится в статье Берча (см. стр. 72—93). В ней устанавливается, что в пол- ном уточнении любой позиционной игры существует си- туация равновесия, в которой все игроки с почти полной информацией в исходной игре имеют чистые стратегии. Оказывается, что при довольно естественном условии (разумеется, речь идет о содержательной, но не о фор- мальной естественности) справедливо и обратное утвер- ждение. 6. Наряду с наиболее простым случаем взаимного расположения информационных множеств одного игрока, отражающим его полную память, возможны и другие, более широкие типы таких расположений, соответствую- щие тем или иным видам его неполной памяти. Можно предполагать, что различным типам памяти игрока соот- ветствуют свои классы смешанных стратегий, которые эквивалентны произвольным смешанным стратегиям и которыми игрок может ограничиться, подобно тому как игрок с полной памятью может довольствоваться страте- гиями поведения. Один из таких типов памяти рассмат- ривается в статье Н. Н. Воробьева на стр. 94—113. Этот тип памяти, называемый автором «упорядояивающей па- мятью», формально отражает то положение дел, когда игрок в любой момент игры знает, был ли он уже в неко- тором информационном множестве или нет, но может (в отличие от случая полной памяти) не знать, какое реше- ние было им в этом информационном множестве принято. Оказывается, что игрок, обладающий в позиционной игре упорядочивающей памятью, может ограничиться приме- нением редуцированных стратегий, т. е. таких своих смешанных стратегий, в которых решение, принимаемое игроком в каждом из его информационных множеств, стохастически зависит только от тех его ранее принятых решений, которые игрок к данному моменту «забыл». В этом случае любая смешанная стратегия игрока эквивалентна некоторой его редуцированной стратегии. Заметим, что можно поставить также вопрос об исполь- зовании в общих позиционных играх некоторых более
10 Н. Н. ВОРОБЬЕВ конкретных особенностей памяти игрока. По этому вопро- су читателя можно отослать к статьям Томпсона [2] и Н. Н. Воробьева [3], не включенным в настоящий сборник. Общие вопросы эквивалентности стратегий в позицион- ных играх рассматриваются в работе И. Н. Врублевской (см, стр. 114—131). 7. По определению (см., например, стр. 16) информа- ционное множество не может «предшествовать самому себе», т. е., говоря содержательно, в позиционной игре игроку не приходится более одного раза принимать реше- ние в одной и той же информационной ситуации. Пред- ставляет интерес исследование игр, подпадающих под определение позиционных во всех пунктах, кроме этого. Такое исследование выполнено Исбеллом в статье «Фини- тарные игры», перевод которой помещен на стр. 132—154. 8. Близкими к позиционным играм являются так на- зываемые «игры на графах», обстоятельно изложенные в книге Бержа [4]. Полезным дополнением к материалу этой книги может служить статья Бержа «Теоретико-множест- венный подход к поочередным играм», первые две главы которой, как наиболее интересные, включены в настоя- щий сборник (см. стр. 155—182). Примыкающая к ней заметка Н. Н. Воробьева (стр. 183—186) содержит кри- тический разбор одного из утверждений этой статьи. С таким теоретико-множественным подходом к играм тесно связано понятие суммы двух или более игр. При этом под суммой нескольких игр понимается игра, состоя- щая в одновременном разыгрывании этих игр, причем каждый раз в свою очередь хода игрок делает ход лишь в одной из этих игр-слагаемых. В качестве выигрыша игрока в сумме игр принимается сумма его выигрышей во всех играх-слагаемых. Суммы позиционных игр рассматри- ваются в статье Милнора (см. стр. 187—197 настоящего сборника). В ней анализируются оптимальные стратегии игроков в суммах игр, а также вводится весьма интересное понятие эквивалентности игр (описывающее их своего рода взаимозаменяемость в любой сумме игр). В следующей статье Ханнера (стр. 198—220) рассмат- риваются стратегии игроков в суммах игр, которые можно было бы назвать асимптотически оптимальными: разница в выигрыше, которую теряет игрок, используя такую
ПОЗИЦИОННЫЕ ИГРЫ и стратегию вместо оптимальной, оказывается ограниченной при возрастании числа игр-слагаемых в игре-сумме. 9. Следующая группа статей основной части сборника посвящена бесконечным позиционным играм. Основной круг проблем здесь в настоящее время связан с перенесе- нием на бесконечные позиционные игры важнейших поня- тий и теорем теории конечных позиционных игр. Часть этих проблем решается в статьях Л. А. Петросяна (стр. 221—245), И. Н. Врублевской (стр. 246—250) для слу- чая счетных позиционных игр и Аумана (стр. 251—277) для континуальных игр. Близкие вопросы рассматриваются Пирсом в его статье о топологических играх, помещенной на стр. 278—289. Весьма интересный прием сведения игр на единичном квадрате к позиционным играм разбирается в статье Сай- она и Вулфа (стр. 290—299). При помощи этого приема устанавливается, что некоторая антагонистическая игра на единичном квадрате с весьма просто устроенной функ- цией выигрыша не обладает значением. Принципиальный интерес, выходящий за пределы соб- ственно теории игр, приобрело направление, начавшееся с работы Гейла и Стюарта [5] об отсутствии в некоторых бесконечных играх с полной информацией ситуаций рав- новесия в чистых стратегиях. Связь этих вопросов с ак- сиомой Цермело, при всем ее значении, уже не входит в теорию позиционных игр. Поэтому посвященные этим вопросам статьи в данный сборник не включены. С фак- тическими же теоретико-игровыми результатами читатель может познакомиться по указанной статье Гейла и Стюар- та, а также по работе Э. Д. Стоцкого [6]. 10. Раздел «Приложение» в настоящем сборнике пред- ставлен переводом книги Вальда «Статистические решаю- щие функции». Включение этой книги в сборник работ по позиционным играм естественно по ряду причин. Эта, ставшая классической, книга представляет интерес для лиц, интересующихся теорией игр, потому что в ней приведен ряд интересных и довольно тонких результатов, непосредственно касающихся теории игр. Кроме того, в ней дается систематическое описание задач последователь- ного статистического анализа как многошаговых (т. е. фактически как позиционных) игр.
12 Н. Н. ВОРОБЬЕВ ЛИТЕРАТУРА [l]Von Neumann J., Morgenstern О., Theory of games and economic behavior, 2nd ed., Princeton, 1947. [2] Thompson G. L., Signaling strategies in n-person games, Contributions to the theory of games, vol. II, Princeton, 1953, 267—278. [3] В о p о б ь e в H. H., Расчлененные стратегии в позиционных играх, Проблемы кибернетики, № 7, 1962, 5—20. [4] Б е р ж К., Общая теория игр нескольких лиц, Физматгиз, 1961. [5] Gale D., Stewart F., Infinite games with perfect info- rmation, Contributions to the theory of games, vol. II, Prince- ton, 1953, 245—266. [6] G тоцкий Э. Д., О дескриптивной теории игр, Проблемы кибернетики, № 8, 1962, 45—54.
ПОЗИЦИОННЫЕ ИГРЫ И ПРОБЛЕМА ИНФОРМАЦИИг) Г. У, Кун Принстонский университет В описанной фон Нейманом и Моргенштерном [1] мате- матической теории стратегических игр два момента пред- ставляются наиболее существенными: 1) изложение всеобъ- емлющей формальной характеристики произвольной игры п лиц, 2) введение понятия чистой стратегии, которое делает возможным радикальное упрощение этой схемы путем замены произвольной игры соответствующей ей мо- делью. Эти два способа описания называются позиционной анормальной формами игры. Как отмечено в [1], нормаль- ная форма больше приспособлена для получения общих теорем (например, основной теоремы теории антагонисти- ческих 1 2) игр), тогда как в позиционной форме проявля- ются характеристические различия между «играми и рас- скрываются основные структурные свойства игр, опреде- ляющие эти различия. Так как все игры реализуются в позиционной форме, то, хотя и бывает полезно нормали- зовать большинство из них, желательно построить общую теорию позиционных игр. В этой статье прежде всего дается новое, интуитивно совершенно естественное определение позиционной игры, которое охватывает более широкий класс игр, чем опре- 1) Kuhn Н. W., Extensive gamesand the problem of informa- tion, Contributions to the theory of games, vol. II, Princeton, 1953, 193-216. Подготовка этой статьи была поддержана Бюро военно-морских исследований. 2) Антагонистической игрой называется нулевая игра двух лиц. {Прим, ред.)
14 Г. У. КУН деление фон Неймана. Использование геометрической мо~ дели сокращает необходимый теоретико-множественный ап- парат и вносит определенную ясность в тонкую проблему ин- формации. После определения чистых стратегий теорема 1 устраняет избыточность, содержащуюся в этом определе- нии. Теоремы 2 и 3 описывают свойства естественного разложения игры, возможного для многих игр, наподыгру и ряд фактор-игр. Эти теоремы представляют собой обобщение утверждения о том, что любая антагонистиче- ская игра с полной информацией имеет решение в чистых стратегиях. Теорема 4 содержит эффективный критерий разрешимости игры в стратегиях поведения. Последнее во многих случаях значительно уменьшает вычислитель- ные трудности по сравнению с отысканием смешанных стратегий. На протяжении всей статьи рассуждения, являющиеся мотивировками, интерпретациями или эвристическими выводами, заключены в квадратные скобки [...]. Это сде- лано для того, чтобы подчеркнуть независимость опреде- лений и доказательств от этих рассуждений. § 1. Позиционная форма игры Определение 1. Деревом, игры К называется конечное дерево с отмеченной вершиной О, расположен- ное в ориентированной плоскости х). [Понятие дерева игры вводится как естественная гео- метрическая модель такой существенной черты игры, как последовательный выбор альтернатив. Отмеченная верши- на и расположение в ориентированной плоскости служат для облегчения арифметизации понятия стратегии. Прежде чем приступать к определению игры, необходимо ввести некоторые общие технические термины, связанные с дере- вом игры; важно отметить, что, хотя эти термины взяты из обычной речи, их значение дается определениями.] Терминология. Альтернативами в вершине хеДК. называются ребра е, инцидентные с х и лежащие в тех х) Графическое представление игры с помощью дерева было введено фон Нейманом (см. [1], стр. 77), однако он рассматривал только случай игр с полной информацией.
ПОЗИЦИОННЫЕ ИГРЫ И ПРОБЛЕМА ИНФОРМАЦИИ 15 компонентах К, которые не содержат О, если разрезать К в х х). Если х имеет / альтернатив, то они нумеруются целыми числами 1,..., /, причем х обходится в положи- тельном, в смысле ориентации плоскости, направлении. В вершине О первая альтернатива может быть указана произвольно. Если некоторая вершина х =/= О обходится в положительном направлении, то первой альтернативой считается та, которая следует за единственным ребром в х, не являющимся альтернативой. Определенную таким образом функцию, которая нумерует альтернативы в К, обозначим через v, так что v (е) есть номер альтернативы е. Вершины, имеющие альтернативы, будут называться про- межуточными позициями или просто позициями * 2), осталь- ные — окончательными позициями. Партией будем называть единственный уникурсальный3) путь из О в окончательную позицию. Разбиение4) множества проме- жуточных позиций на множества / =1, 2,..., где Aj содержит все позиции с j альтернативами, назовем аль- тернативным разбиением. Порядок во времени на К опре- деляется отношением х у, если я лежит на wv, где wy — уникурсальный путь, соединяющий О с у; отношение является частично упорядочивающим. Рангом промежу- точной позиции у называется число таких позиций х, что х у, или, что то же самое, число позиций х GE ыу. Определение 2. Позиционной игрой п лиц Г называется дерево игры К, на котором заданы: (I) Разбиение промежуточных позиций на п +1 мно- жество Ро, Рп, называемое разбиением по игро- кам 5). Позиции из Ро называются позициями случая; позиции из Pi — личными позициями i-го игрока для i = == 1,..., п. х) Вообще, альтернативами также называются отличные от х концы этих ребер. {Прим, ред.) 2) Важно пояснить различие между позициями у нас и у фон Неймана. Именно, у фон Неймана это — множество всех позиций в нашем смысле, имеющих данный ранг. 3) «Уникурсальный» — здесь путь без самопересечений. (Прим, ред,) 4) В этой статье под разбиением понимается полное разложение на непересекающиеся (возможно, и пустые) множества. 5) Или разбиением на множества очередности, {Прим, ред.)
16 Г. У. КУН (II) Разбиение промежуточных позиций на множест- ва U, которое является утончением как разбиения на мно- жества очередности, так и альтернативного разбиения (т. е. каждое U содержится в Pi f| Aj для некоторых I и ;) и таково, что никакое U не содержит двух позиций од- ной и той же партии. Это разбиение называется информа- ционным разбиением, а его элементы — информацион- ными множествами, (III) Для каждого U cz Ро Q А; вероятностное распре- деление на множестве чисел 1,..., /, приписывающее каж- дому из них положительную вероятность. Эти информа- ционные множества предполагаются одноэлементными. (IV) n-набор вещественных чисел h (w) = (/&i(w),... ... (ш)) для каждой окончательной позиции w. Функ- ция h называется функцией выигрыша. [Как следует интерпретировать эту формальную схе- му? Иными словами, как играть в позиционную игру п лиц? Можно, например, представить себе несколько чело- век, называемых агентами, изолированных друг от друга и знающих правила игры. Имеется по одному агенту на каждое информационное множество, и они объединяются в «игроков» естественным образом: агент принадлежит Z-му игроку, если его информационное множество содер- жится в Р{. Кажущийся избыток агентов вызывается возможным сложным характером информации игроков, которые могут быть вынуждены, в соответствии с пра- вилами игры, забывать факты, известные им ранее в пар- тии г). Партия начинается с позиции О. Предположим, что она уже дошла до некоторой позиции х. Если х — личная позиция с / альтернативами, то тот агент, чье информа- ционное множество содержит х, выбирает положительное целое число, не превосходящее /, зная только, что он выби- рает альтернативу в одной из позиций своего информацион- ного множества. Если х — позиция случая, то альтерна- тива выбирается в соответствии с вероятностями, опреде- ленными условием (III), для информационного множества, содержащего х. Таким образом, строится некоторый путь *) Именно в этом смысле следует понимать высказывание фон Неймана о том, что бридж является игрой двух лпц.
ПОЗИЦИОННЫЕ ИГРЫ И ПРОБЛЕМА ИНФОРМАЦИИ 17 с начальной точкой О. Этот путь уникурсален, и, так как дерево К конечно, он приводит к единственной оконча- тельной позиции w. В этой точке w игроку i выплачива- ется выигрыш hi (ш), i = 1,..., п. Случай, когда К со- стоит только из одной вершины О, не исключается. В этом случае Г есть игра без ходов, никто в ней ничего не де- лает, и выигрышем является h (О). Платой за то, что в результате использования геомет- рической модели интуиция выигрывает, является введе- ние некоторой избыточности. Пусть Гх и Г2 — две игры, определенные деревьями К± и К2, для которых (1) Кг и К2 гомеоморфны; (2) гомеоморфизм о дерева К± на К2 сохраняет от- меченные вершины и свойства (I) — (IV); (3) на каждом информационном множестве гомеомор- физм о производит перенумерацию альтернатив. (Точнее, ‘(3) требуетсуществования такой подстановки г и чисел 1,...,; для каждого информационного множества U czAj, что если vx и v2 —• функции, нумерующие альтернативы в Кх и в К2, то v2 (о(е)) — Ту (vx (е)) для всех альтернатив е пози- ций из U.) Ясно, что в таком случае игры Г3 и Г2 следует считать эквивалентными, так что правильнее было бы опре- делять позиционную игру п лиц как некоторый класс эк- вивалентности, определяемый этим отношением эквива- лентности. Однако нет надобности подчеркивать различие между играми и классами эквивалентности. Если давать определения, применимые как к классам, так и к их представителям, то их различие можно полностью игно- рировать при доказательствах, отметив, что все теоремы справедливы и для классов и для отдельных представи- телей. Хотя большинство из приведенных выше формализа- ций не нуждается в обоснованиях, так как их достаточная мотивировка уже дана в книге фон Неймана и Моргенштер- на, некоторые детали заслуживают пояснений. Первое отно- сится к конечности дерева игры. Хотя в большинстве игр имеется правило остановки, обеспечивающее окончание каждой партии после конечного числа ходов, совсем не очевидно, что из этого факта следует конечность дерева игры. Чтобы доказать это, предположим, следуя Кёнигу 2 Позиционные игры
18 Г. У. КУН [2], что существует бесконечное число возможных партий, и получим противоречие с правилом остановки, построив уникурсальный путь, начинающийся в О и содержащий бесконечное число ребер. Так как в О делается выбор из конечного множества альтернатив, должно существовать бесконечное число партий, начинающихся с одного и того же ребра e±. Далее рассуждаем по индукции; предположим, что выбраны так, что £г..ег является началь- ным отрезком бесконечного числа партий. Тогда, так как следующий выбор делается из конечного множества, бес- конечное подмножество этих партий должно проходить че- рез одно и то же ребро, скажем ег+1. Это завершает дока- зательство. Более существенным является вопрос о формализации состояния информации игрока в момент выбора решения, т. е. в промежуточных позициях. При рассмотрении ин- формации, даваемой игроку в «модели информации» фон Неймана, мы замечаем, что она состоит из нескольких час- тей. Прежде всего игроку сообщается, что ход принадлежит ему, и называется число альтернатив. В наших терминах это означает, что позиция находится в Pi(]Aj для некото- рых фиксированных i и у. Затем игроку говорят, что позиция принадлежит одной партии из некоторого мно- жества партий и что этой позиции предшествовало опре- деленное число ходов. Из этого игрок может сделать вы- вод, что эта его позиция лежит в множестве позиций одного ранга. Это множество позиций и образует некоторое U в информационном разбиении; однако мы заменяем требо- вание, чтобы все позиции в U имели один и тот же ранг, более слабым условием, чтобы никакое U не содержало двух позиций из одной и той же партии.] § 2. Сравнение с формулировкой фон Неймана [Целью этого параграфа является разъяснение отно- шения между нашей «позиционной игрой п лиц» и «игрой п лиц по фон Нейману». Попутно будет показано, что приве- денная выше формулировка является более общей, однако наша главная цель — проследить, как они согласуются. Для этого мы укажем способ перехода от одной формы к
ПОЗИЦИОННЫЕ ИГРЫ И ПРОБЛЕМА ИНФОРМАЦИИ 19 другой. Рассмотрим сначала переход от «игры п лиц по фон Нейману» к «позиционной игре п лиц» х).] Возьмем в качестве вершин дерева К непустые подмно- жества Лх разбиений 31х (х =1,..., v 4- 1). Вершина Л х соединяется с вершиной Лх+1 ребром, если Ах+1= Лх П С* для некоторого Сх. Заметим, что вершина Лх имеет / альтернатив, если она содержится в Z)x, которое состоит из у множеств Сх, и что промежуточными позициями в К являются вершины Лх (х —1,..., v), а окончательными позициями — вершины Л v+1. Разбиение по игрокам опре- деляется следующим образом: Рк = {Лх | Лх содержит- ся в некотором Бк (к)} для к = О, 1,..., п. Информацион- ное разбиение определяется так: U ~ {Лх | Лхс=.Ох}с един- ственным U\ определенным для каждого D* ЕЕ Эх(&) (х = = 1,.., v и п); позиции случая Лх cz jBx (0) обра- зуют одноэлементные множества в информационном раз- биении. Для каждого U с: Ро А Л~, т. е- Для каждого А к cz Вк (0), где А к содержит j множеств Сх из ©х (0), вероятность, приписываемая альтернативе, соответствую- щей Лх П Сх, равна рх (Сх). Наконец, функции hk на окончательных позициях определяются равенством hk (Лу+1) = %к (Лу+1) для всех окончательных позиций Л и к = 1,..., п. Вложение дерева в ориентированную плоскость можно сделать в последнюю очередь, так как оно «не зависит от остальных определений. Расположение О произвольно. Предположим, что расположение осуществлено до пози- ции Лх. Расположим альтернативы во всех позициях Лх из некоторого фиксированного U в одинаковом порядке относительно ориентации. Это возможно, так как все эти позиции имеют одинаковое число альтернатив (количество Сх, содержащихся в фиксированном множестве Z>x, кото- рое определяет U). Имеется два ограничительных условия, наложенных на полученную таким способом позиционную игру п лиц: (А) Все партии содержат одинаковое число промежу- точных позиций V. 1) При этом сравнении мы пользуемся обозначениями фон Неймана (см. [1], стр. 73—75) (с точностью до некоторых шриф- товых расхождений). 2*
20 Г. У. КУН (В) Все позиции в одном информационном множестве U (определяемом Z)z) имеют один и тот же ранг (х). Условие (А) тривиально, и его выполнение может быть достигнуто во всех наших играх введением в короткие пар- тии позиций «болвана» с одной альтернативой. Условие (В) нетривиально и будет рассмотрено после осуществле- ния перехода от «позиционной игры п лиц», удовлетворяю- щей условиям (А) и (В), к «игре п лиц по фон Нейману». (10 : А : а) Число v есть число, даваемое условием (А). (10 : А : Ъ) Конечное множество Q является множе- ством партий на К. (10 : А : с) Для каждого г =1,..., п определяется функ- ция (w) = h} (w) для w е= £2. (10 : A : d) Для каждого г =1,..., v разбиение 2lr в Q содержит для каждой позиции х ранга г по одному множеству Аг, которое определяется как Ar = {w\w 2> я}. Разбиение 9lv+1 состоит из одноэлементных множеств {w}. (10 : А : е) Для каждого г = 1,..., v разбиение 55г в й содержит для каждого i = 0, 1,..., п по одному множеству Вг (0, которое определяется как Br (i) — {w\w х, где х имеет ранг г и х Ez Pi}- (10 : А : f) Для каждого r~ 1,..., v и каждого i = 0, 1,..., п разбиение (£r (Z) в Вг (г) содержит по одному мно- жеству Сг для каждой альтернативы е информационного множества U сг Д, имеющего ранг г. Оно определяетсякак Cr ~ {w\w следует за некоторым xeU по альтернати- ве е}. (10 : А : g) Для каждого r== 1,..., v и каждого i = 1,..., п разбиение ©г (г) в Вг (г) содержит по одному множеству Dr для каждого такого U cz которое состоит только из позиций ранга г. Оно определяется как Dr = {zp|u? х, х е #}• (10 : А : h) Для каждого г = l,...,v и каждого Сг (0) число Рг (Сг) есть вероятность, приписанная альтернативе е условием (III). Мы опускаем доказательства того, что полученные таким образом игры действительно удовлетворяют требуе- мым условиям (т. е. определениям 1 и 2 в первом случае и (10 : А : а) — (10 : А : h) — во втором). Если и не всюду они получаются непосредственно, то все они просты и легко проверяются. Важным является следующий вопрос:
ПОЗИЦИОННЫЕ ИГРЫ И ПРОБЛЕМА ИНФОРМАЦИИ 21 что произойдет, если мы снова образуем из игры по фон Нейману позиционную игру п лиц? Ответ очевиден из сказанного выше, а именно: множество Q было образо- вано так, что оно включало только партии, допускае- мые правилами игры. Более точно, й было образовано так, что (1) все разбиения какого-либо множества тако- вы, что объединение элементов соответствующего раз- биения равно этому множеству, и (2) партии л ЕСХЕ ®х(0), для которых рх (Сх) = 0, были исключены. Сказан- ное можно суммировать в виде следующей теоремы. Теорема о к а- т е г о р из ации . Игры * ------------ по фон Нейману, в кото- . ------- рых исключены недопу- стимые и невозможные • партии, являются по- -------\ зиционными играми п лиц, в которых в инфор- Рис. 1. мации игрока в момент хода содержится знание числа предшествовавших выборов. Завершим этот параграф рисунком, дающим пример г) позиционной игры п лиц, в которой игрок не информи- рован о числе предшествовавших выборов. Пунктирные линии указывают информационные множества.] § 3. Чистые и смешанные стратегии Определение 3. Пусть = {£71 U czPt}. Чистой стратегией игрока i называется функция л$, отображаю- щая в множество положительных чисел так, что л1(С7)^ 7, если UczAj. Будем говорить, что л{ выбирает альтер- нативу е в позиции x&J, если лj (£7) = v (е). [Чистую стратегию можно интерпретировать как план, выработанный заранее для игрока i некоторым стратегом, который затем сообщает свои выборы агентам игрока i. Это можно сделать без нарушения характера информации агента, представляя себе, что стратег заполняет книгу, отводя по странице для каждого информационного мно- г) Этот пример сообщили Л. С. Шепли и Дж. Мак-Кинси,
22 Г. У. КУН жества i-ro игрока. Если информационное множество име- ет j альтернатив, то на его странице будет написано по- ложительное целое число, не превосходящее /, и оно сообщается агенту, который действует в этом информа- ционном множестве за игрока I. Если информационное множество этого агента реализуется в разыгрываемой партии, то он должен выбрать альтернативу, обозначен- ную указанным числом. Эта интерпретация поясняет и следующие определения.] Любой набор л = (лх,..., лп) чистых стратегий для п игроков х) определяет вероятностное распределение на множестве альтернатив в каждом информационном множе- стве дерева К следующим образом. Если е является альтернативой в личной позиции иг- рока i из информационного множества £7, то n (Р\ _ I1’ если = v(e), [О в остальных случаях. Если е — альтернатива позиции случая, то рп (е) есть вероятность, сопоставленная v (е) условием (III). Это в свою очередь определяет вероятностное распреде- ление на окончательных позициях дерева К: Рп (W) = п Рп (Ю для всех W2). [Интерпретация очевидна: если п стратегов выбирают чистые стратегии л1?..., лп, то вероятность того, что в результате получится окончательная позиция ip, равна рп («0-1 Определение 4. Ожидаемый выигрыш (л) игрока i в ситуации лд,..., лп определяется как математи- ческое ожидание Hi (л) = 3Р„ (w) для i = 1, . . .,п. W г) n-набор стратегий любого типа будем в дальнейшем называть ситуацией. (Прим, перев.) 2) Здесь через w часто обозначается и окончательная позиция и при водящая в нее партия. (Прим, перев.)
ПОЗИЦИОННЫЕ ИГРЫ И ПРОБЛЕМА ИНФОРМАЦИИ 23 [Снова мы расплачиваемся избыточностью за простоту определения чистых стратегий. Характер этой избыточ- ности становится ясным, если заметить, что чистая стра- тегия может сделать на ранней стадии игры такой выбор, который делает невозможными многие следующие пози- ции, и, следовательно, выборы в этих позициях оказы- ваются ненужными. Однако можно рассмотреть избыточ- ность и с другой точки зрения, измеряя эффективность стратегии л^ выигрышем и две стратегии считать эквивалентными, если они приводят к одинаковым вы- игрышам при любом выборе стратегий остальными игро- ками. Полагая пока функцию h произвольной, это мож- но переформулировать так: две стратегии следует считать эквивалентными, если они приписывают одинаковые ве- роятности каждой окончательной позиции при любом выборе стратегий остальными игроками. В остальной части этого параграфа показано, что две приведенные точки зрения на избыточность совпадают, и таким образом исправляется определение чистой стратегии.] Если л — (л1?..., л^,..., лп), то (л1?..., л',..., лп) будем обозначать через л||л'. Определение 5. Чистые стратегии л{ и я' называются эквивалентными, или л* =л'? если рп (w) = =P«ll^'i(u?) Для всех окончательных позиций всех л, со- держащих л{. Определение 6. Личная позиция х игрока i называется возможной для щ, если существуют оконча- тельная позиция w и ситуация л, содержащая л{, такие, что рк (и?) О и х w. Информационное множество U игрока i называется существенным для щ, если некоторая позиция x^U возможна для Обозначим множество позиций, возможных для ло через Poss л!? а семейство информационных множеств, существенных для ло через Rel Лр Утверждение 1. Позиция х игрока i возможна для л{ тогда и только тогда, когда лi выбирает альтерна- тивы, лежащие на отрезке партии wx от О до х, во всех позициях этого отрезка, принадлежащих игроку i. Доказательство. Пусть позиция х возможна для л.; тогда существует такая партиям?, содержащая х, и
24 Г. У. КУН такая ситуация л, содержащая л$, что П /\(г)>0. е&п Следовательно, л{ выбирает все альтернативы игрока i в партии w, а тогда и в wx. Предположим теперь, что л£ выбирает все альтерна- тивы игрока i в wx. Чтобы доказать возможность х для Л|, нужно построить партию и соответствующий набор стратегий для остальных игроков. Так как ни одно инфор- мационное множество не содержит двух позиций одной и той же партии, при построении стратегий выборы на уникурсальном пути могут быть сделаны независимо.В лич- ных позициях игроки выбирают альтернативы, содержащи- еся в В х выбор делается стратегией л$; далее партия стр оится произвольно, кроме тех выборов, которые опре- деляются стратегией л{. Обозначим полученную партию через w. Не определенные выше выборы делаются про- извольно, и пусть полученные чистые стратегии обозна- чаются через л1?..., Л|_д, лп. Тогда, так как ве- роятности альтернатив случая положительны, рп (w)^>0 и х возможна для Следствие. Пусть информационное множество U содержит первую личную позицию х игрока i в партии w. Тогда U существенно для всех чистых стратегий л$ игрока i. Теорема 1. Чистые стратегии л* и л$ эквивалентны тогда и только тогда, когда они определяют одни и те же существенные информационные множества и совпадают на них. Доказательство. Пусть л$ = л^ и U сущест- венно для л*. Тогда существуют такие позиция ХЕЕ U, окончательная позиция w и ситуация л, содержащая что рп (w) 0 и х w. Следовательно, (ip) = рп (w) 0 и U существенно для л$. Кроме того, по определению р (w), л4 (U) = = Hi (U) = v (е), где е — альтернатива в х, которая ле- жит в партии w, и, следовательно, л$ и л$ совпадают на U. Чтобы показать, что эти условия достаточны, предпо- ложим, что даны окончательная позиция w и ситуация л,
ПОЗИЦИОННЫЕ ИГРЫ И ПРОБЛЕМА ИНФОРМАЦИИ 25 содержащая Если р„ (w) = П то л4(СТ) = е&о = v (е) jsjisi всех альтернатив е, лежащих в w и выходящих из соответствующих личных позиций игрока i в U. Все эти позиции возможны для Л|, и, следовательно, то же справедливо для от*; тогда Жц<(е) = П МО- е&) 1 е&лз Ввиду симметричности этих рассуждений относительно и щ имеем, что из рп (ш) = 0 следует п. (W) = °- г Итак, = л/. [Интерпретация чистой стратегии как стратегической книги может быть распространена на определенные выше эквивалентные классы, если предположить, что мы остав- ляем пустыми те страницы, которые соответствуют несу- щественным информационным множествам. ] [Даже в самых простых играх, скажем в «сравнении монет», игроку становится невыгодно использовать одну и ту же чистую стратегию в каждой разыгрываемой партии. Вместо этого он должен рандомизировать свои выборы. В этой статье описываются два способа рандомизации. В первом игрок использует вероятностное распределение на своих чистых стратегиях, выбирая отдельную чистую стратегию, которую он будет применять в данной разы- грываемой партии, в согласии с этим распределением. Следуя фон Нейману, такую стратегию назовем смешан- ной. Второй способ изучается в § 5. ] Определение 7. Смешанной стратегией игрока i называется вероятностное распределение на мно- жестве чистых стратегий этого игрока, ставящее в соот- ветствие каждой стратегии rci вероятность qK.. Любой набор ц = (ц!,..., цп) смешанных стратегий для п игроков х) определяет вероятностное распределение на множестве окончательных позиций в К\ Р^. . q р (w) для всех w, Ситуация. (Прим, перев,)
26 Г. У. КУН Определение 8. Ожидаемый выигрыш Hi (pi) игро- ка i в ситуации pij,..., pin определяется как математиче- ское ожидание W Утверждение 2. Для каждой позиции х обозна- чим через с (х) произведение вероятностей выбора случаем альтернатив на wx, отрезке партии от О до х. Тогда р(х) = с(х) 3 q q =с(ж)й( 3 ?„.) XePOSSTt^ п z-—l XXGPOSS7C. %' п есть вероятность появления позиции х при ситуации ц. Доказательство непосредственно следует из утвержде- ния 1 и интерпретации смешанной стратегии. Определение 9. Личная позиция х игрока i называется возможной для pq, если существует ситуация pi в смешанных стратегиях, содержащая рц и такая, что (х) 0. Информационное множество U игрока i на- зывается существенным для рц, если некоторое xEElU явля- ется возможным для pi^. Опять обозначаем через Poss множество возможных для pij позиций и через Rel рц семейство существенных дляц{ информационных множеств. § 4. Разложение игр [Часто случается, что позиции игры, которые следуют за некоторой фиксированной позицией х, определяют естественным образом подыгру. Они являются вершинами дерева игры с х в качестве начальной позиции, при этом разбиение на множества очередности, распределение веро- ятностей в позициях случая и выигрыши в окончательных позициях для этого дерева переносятся из первоначаль- ной игры. Это справедливо и для информационного разбие- ния, если в каждой позиции первоначальной игры соот- ветствующий игрок знает, находится эта позиция в по- дыгре или нет. Если последнее условие выполнено, то позиции, не принадлежащие подыгре, также составляют позиции неко- торой игры, в которой определено все, кроме выигрыша в
ПОЗИЦИОННЫЕ ИГРЫ И ПРОБЛЕМА ИНФОРМАЦИИ 27 вершине х (которая является окончательной позицией в этой игре!). В этом параграфе изучается именно такое разложение игры на пару игр и доказывается, что ситуа- ции равновесия полученной пары игр определяют ситуа- цию равновесия в первоначальной игре.] Определение 10. Пусть дана позиция х в игре Г, и пусть Кх — та из компонент К, получающихся после удаления единственного ребра в х, не являющегося альтер- нативой в х (если такое существует), которая содержит х. Будем говорить, что игра Г разлагается в х на Гх и Гр (цх), если каждое информационное множество U или содер- жится в Кх, или не пересекается с Кх. Игра Гх называ- ется подыграй и определяется следующим образом. Деревом игры является Кх, оно расположено в той же самой ориентированной плоскости, что и К, и имеет своей отмеченной вершиной х. (1Х), (Пх) Разбиение на множества очередности и ин- формационное разбиение множества позиций в Гх явля- ются соответствующими разбиениями позиций из К, огра- ниченными множеством Кх. Семейство информационных множеств игрока i будет обозначаться (Шх) Для каждой позиции случая в Гх вероятностное распределение есть вероятностное распределение, опре- деленное условием (III) для Г. (IVX) Функция выигрыша hx для Гх есть функция /г, ограниченная множеством окончательных пдзиций из Кх. Игра Гр (цх), называемая фактор-игрой, определяет- ся для каждой ситуации в смешанных стратегиях цх в Гх. Ее деревом игры будет К \ Кх, дополненное пози- цией х,сОв качестве отмеченной вершины. Условия (1р)— (IVp) вводятся так же, как и выше, с дополнительным опре- делением hD (х) = Нх (цх); чтобы подчеркнуть зависимость выигрыша в Гр (рх) от цх, будем записывать его в виде Hd (Цгн Их)- Семейство информационных множеств игрока i обозначим через ©{. [Такому естественному разложению Г на подыгру Гх и фактор-игру Гр соответствует естественное разложение чистых стратегий в Г на пару чистых стратегий в Гх и в Гр. Суть доказательств в этом параграфе состоит в анализе действия этого разложения и аналогичного разложения смешанных стратегий из Г на выигрыш.]
28 Г. У. КУН Определение 11. Пусть игра Г разложена в х. Будем говорить, что чистая стратегия л4 игрока i разло- жена в х на чистые стратегии лхц и Лр ц игрока i в Гх и в Гр, если (а) Хф есть ограничение щ семейством (Ь) Лр|i есть ограничение щ семейством Так как U4 есть объединение непересекающихся мно- жеств и©4, мы можем также составить чистую страте- гию л4 из чистых стратегий лХ|г илрц, обозначив ее через Лемма 1. Если л4 разложено на лхц и Лр|{ для i = = 1,..., п, то Ря (у) = РП]} (у) для всех y^KD И рп (у) = PnD (*) рПх(у) для всех у е Кх, где л — (л^,...., лп), (^х|г »••• > ^xin) Яр ~~ (Лр|1 >••• ..., Яр । п). Доказательство следует немедленно из опре- деления рп (у) и того факта, что все пути от О к у в Кх проходят через х. Определение 12. Пусть игра Г разложена в х. Будем говорить, что смешанная стратегия р4 игрока i разложена в х на смешанные стратегии рХ| i и рр । < игрока i в Гх и в Гр, если (а) = S ДЛЯ ВСеХ ‘ D'1 В(п.)=яр14 где D (л<) означает ограничение щ семейством (Ь) при х ЕЕ Poss р4 х(пд—nx|i хе Poss п. у = ------------ ДЛЯ всех JTxji, ж|г 3 <Зп. xsPoss л. г г где х (л4) означает ограничение Л| семейством Х{. При х Poss р4 а ,. = 2 для всех ' *1’ 4лР=”х|г
ПОЗИЦИОННЫЕ ИГРЫ И ПРОБЛЕМА ИНФОРМАЦИИ 29 Лемма 2. Любая пара и Цр|г смешанных страте- гий игрока i в Гх и в Гр может быть получена как разло- жение некоторой стратегии рц в Г. Доказательство. Пусть (Лр|й лхц) означает чистую стратегию в Г, составленную из Лр|4 и Хф. По- ложим q, ч == q q_ для всех Лри и Лдч4. ^*Р|г лх|г 1 1 Тогда легко проверить (а) и (Ь),если заметить, что яЕЕРоззрц тогда и только тогда, когда з; ЕЕ Possptp ц. Следует отме- тить, что такое разложение и составление смешанных стра- тегий является естественным обобщением соответствующих понятий для чистых стратегий. Теорема 2. Если игра Г разложена в х, то сущест- вует отображение множества ситуаций pi в смешанных стратегиях для Г на множество пар (pip, рц.) ситуаций в сме- шанных стратегиях для Гр и для Гх такое, что Н (р) = Hd(pd, рх), (1) adtf (pip, pix) соответствуете при этом отображении. Доказательство. Таким отображением будет разложение pi на пары (pip, pix) в соответствии с определе- нием 12. Лемма 2 показывает, что это есть отображение на все такие пары. Для доказательства (1) рассмотрим отдельно обе части этого равенства: Н(н) = = W = S P^hlw)-^ 2 pAw)h(w) (2) w<=K\Kx ™=кх И HD (цс, нж) = 3 Р~п(w)hD (w) = w^KD = 3 Py.D^)hD(w) + P (х)Нх(цх). (3) Заметим, что если w(^K\Kx, то = S q^...q\P*D(w) = n n nD \D(n)^nD 1 nJ "
30 г. У. КУН и, следовательно, остается показать, что S P^htw) = р (г)Нх(ц ). (4) weKx r D Но так как Нх(Рх) = з р (w)hx(w)= 3 /’.(w’)A(w), w&K ugKv Нх • X л для доказательства (4) достаточно показать, что Р». («О = P»D (*) р».х («О для всех w е к*- (5) (Нужно отметить, что это равенство аналогично равенству, установленному в лемме 2 для смешанных стратегий, и что определение разложения смешанных стратегий было специально сделано так,\ чтобы сохранить это свойство.) Замечая, что г) 3 ^nD|i) =сп ( 3 ? )> z=al \ хе Poss-D[i / z==1 \xeposs Я. я. где с (х) есть произведение вероятностей выбора случаем альтернатив на пути от О до х (пустое произведение пола- гаем равным единице), и замечая, что !) Это доказывается для х ЕЕ Poss pf, для х<$ Poss доказа- тельство тривиально: 0 = 0. (Прим, перев.)
ПОЗИЦИОННЫЕ ИГРЫ И ПРОБЛЕМА ИНФОРМАЦИЙ 31 имеем PyDW =с(*)S{Й Iр*х= пх ^z—1 4 хеPoss~. ' = S q . . . о p (t)p, M~ - -<i„nPAw>)^ P^W>>' Это и завершает доказательство. [Основным следствием теоремы 2 является то, что реше- ния игры Г могут быть составлены из решений для Гх и для Гр, если считать решением игры п лиц ситуацию равно- весия.] _ „ _ Определение 13. Ситуация |х = (|Хх,..., Нп) в смешанных стратегиях игры Г называется ситуацией рав- новесия [3], если Нъ (jx) Нг (р || ц{), i = 1,...., п, для всех рц, где ц||щ означает ситуацию, полученную из ц при замене jx^ на Теорема 3. Пусть игра Г разложена в х, и пусть jxx есть ситуация равновесия в подыгре Гх, a йр — ситуация равновесия в Гр (рх). Если jx — любая ситуация в смешанных стратегиях в Г, которая разлагается на цх и jxp, то jx есть ситуация равновесия в Г. Доказательство. Пусть — какая-нибудь смешанная стратегия игрока z, которая разлагается на цХ|г и (Хрц. Тогда очевидно, что |х|]|х{ разлагается на нх||р,хц И ЙЪ||ро|{ И (н) = Hd\1 (|Ар, р.ж) нD\i (Ив II Их) == = hm'W + > = Hj)\i (Цр || Цр[г, Цх II Нх|г) — И} (ц || (Xj). [Полезность теоремы 3 для вычислений очевидна; вооб- ще говоря, легче решить две меньшие игры, чем одну большую. Мы укажем два применения этой теоремы, кото- рые прямо или косвенно из нее следуют.]
32 Г. У. КУН (А) Теорема Цермело — фон Не й м а н а. Хоро- шо известно, что антагонистическая игра с полной информа- цией всегда имеет седловую точку х) [4]. В нашей форма- лизации игра с полной информацией есть игра, в которой все информационные множества являются одноэлемент- ными, и седловая точка для антагонистической игры есть частный случай понятия ситуации равновесия. Следствие. Позиционная игра п лиц Г с полной информацией всегда имеет ситуацию равновесия в чистых стратегиях. Доказа1ельство проводится индукцией по числу промежуточных позиций в Г. Для игры без промежу- точных позиций теорема тривиальна. Для игры с одной промежуточной позицией теорема верна, так как если это личная позиция игрока i, то он должен выбирать альтер- нативу, максимизирующую его выигрыш, а если это пози- ция случая, то теорема снова тривиальна. Игра ст промежу- точными позициями, являясь по предположению игрой с полной информацией, может быть разложена на две игры, каждая с числом промежуточных позиций, меньшим т. По предположению индукции эти игры имеют ситуации равновесия в чистых стратегиях; из этих стратегий состав- ляются чистые стратегии в Г, которые образуют в ней по теореме 3 ситуацию равновесия. (В) Одновременные игры. При помощи ис- пользования теоремы 3 могут быть легко решены игры одного класса, введенные Г. Томпсоном в качестве есте- ственного обобщения игр с полной информацией и называе- мые одновременными играми. Это антагонистические игры, которые могут быть описаны словесно как игры, состоящие из последовательности одновременных ходов двух игроков; после каждого такого хода обоим игрокам становятся известными сделанные выборы. Так как наша формальная система не допускает одновременных ходов (даже сравне- ние монет имеет два последовательных хода), мы дол- жны описывать эти игры следующим образом. Игрок 1 имеет альтернатив в позициях ранга 2к — 1, и игрок 2 име- ет а2к альтернатив в позициях ранга 2/с, где Л: — 1,...,Х. х) Седловая точка — ситуация равновесия в чистых стратеги- ях для игры двух лиц. (Прим, персе.)
ПОЗИЦИОННЫЕ ИГРЫ И ПРОБЛЕМА ИНФОРМАЦИИ 33 Игрок 1 имеет полную информацию во всех своих позици- ях, в то время как игрок 2 знает в своих позициях ранга 2к всё, кроме выборов игрока 1 в позициях ранга 2к— 1. Ясно, что мы можем разложить одновременную игру в любой позиции первого игрока. § 5. Стратегии поведения [В этом параграфе изучается другой естественный спо- соб рандомизации. При этом способе игрок выбирает веро- ятностное распределение на альтернативах для каждого своего информационного множества, и в случае своего вы- бора он производит рандомизацию, пользуясь соответ- ствующим, известным ему, распределением. При этом, очевидно, предполагается, что выборы альтернатив в различных информационных множествах производятся независимо. Поэтому можно было бы назвать такие стра- тегии «некоррелированными» или «локально рандоми- зированными»; однако, так как они являются теми рас- пределениями, которые измерялись бы при желании оценить поведение игрока, мы назовем их стратегиями по- ведения. ] Определение 14. Каждому информационному множеству РеИ] такому, что tZcz Aj, стратегия поведения Pi игрока i соотносит / неотрицательных чисел b (U, v), v = 1,...,/, таких, что S&(tz,v) = l. V Любой п-наборр = (Pi,..., рп) стратегий поведения для п игроков х) определяет вероятностное распределение на окончательных позициях К следующим образом. Если е — альтернатива личной позиции U ЕЕ то р& (е) = b(U,v (е)). Если е — альтернатива позиции случая, то р$ (е) есть вероятность, приписанная v (е) условием (III). Наконец, Рр (W-) = П Рр (е). г) Ситуация. (Прим. перев.} 3 Позиционные игры
34 Г. У. КУН Определение 15. Ожидаемый выигрыш Hi (Р) игрока i в ситуации рь..., Рп определяется как математи- ческое ожидание Hi (₽) = S Р& (w) hl (w) для i = 1, .. п. W н [Из нашей интерпретации стратегий поведения ясно, что каждая смешанная стратегия определяет стратегию пове- дения. Следующее определение устанавливает это соот- ветствие, а следующая за ним лемма утверждает, что мы можем получить каждую стратегию поведения из некоторой смешанной стратегии.] Определение 16. Стратегией поведения рь соответствующей смешанной стратегии 1^1== (qni) игрока г, называется стратегия поведения, определенная следую- щим образом. Если C/EzReljXp то 2J я*. u^Rel-. г <?п. UeRel я. г &(/7, v) = Если U ^Relp^, то b(U, v)= s \(U)^ 1 Лемма 3. Если дана стратегия поведения р$ игрока i и смешанная стратегия = (^я.) определена следующим образом: П b(U, НДС/)), (6) пегц то Р{ есть стратегия поведения, соответствующая |иц. Доказательство. Лемма есть прямое следствие определения 16 и формулы (6). [Чтобы пояснить эти понятия на конкретном примере, рассмотрим следующую игру. Игра с партнером. В этой антагонистической игре первый игрок состоит из двух агентов, называемых Играющий и Партнер. Две карты, «старшая» и «младшая», сдаются Играющему и игроку 2. Обе возможные сдачи
ПОЗИЦИОННЫЕ ИГРЫ И ПРОБЛЕМА ИНФОРМАЦИИ 35 считаются равновероятными. Агент со старшей картой получает доллар от агента с младшей картой и имеет альтернативы либо закончить, либо продолжить партию. Если партия продолжает- ся, Партнер, не зная рас- клада, может посоветовать Играющему поменяться картой с игроком 2 или со- хранить свою карту. Снова имеющий старшую карту получает доллар от имею- щего младшую. В нашей формализации эта игра изображается диаграммой, показанной на рис. 2 (в каждой окон- чательной позиции запи- сан выигрыш игрока 1). Для простоты обозначим чистые стратегии лг первого игрока через (лт (C7J, лг (С73)) и чистые стратегии л2 вто- рого игрока через (л2 (Z72)). Тогда матрица ожидаемых выигрышей Нг (л1? л2) есть (1) (2) (1,1) 0 1 “ 2 (1-2) 0 1 2 (2,1) 2 1 0| (2,2) 1 2 0 и «решение» 9(1>х) = ?(2>2) = 0, 9(1,г) = g(2>1) = А и qm = — 7(2) = у обеспечивает игроку 1 ожидаемый выигрыш х/4, а игроку 2 ожидаемую потерю не более С другой сто- роны, если взять стратегию поведения игрока 1: х — = Ъ (U^ 1), 1 - х - Ъ (tZi, 2) и у - b 1 - у = ~~ Ъ (t73, 2), то получим, чти ожидаемый выигрыш игрока 1 3*
36 г. У. КУЙ при 1 , 1 . [(1), --^ + ^х + у-ху, л2 = 1 ,9х равен , I — х — ху. Следовательно, максимальная сумма, которую игрок 1 может себе обеспечить, равна Г 1 1 max mm ]----- + —х + у — ху, —х — ху\ = 0. I 2 2 2 с J Таким образом, стратегии поведения могут дать худ- ший результат, чем смешанные стратегии. Заметим, что смешанная стратегия (7ад), 7(1,2), 7(2,1), 7(2,2)) имеет соот- ветствующую стратегию поведения — (х, у) — (7дд) + + 7(1,2), 7(i,i)+ 7(2,1))- Следовательно, если мы рассмотрим оптимальную смешанную стратегию (0, 1/2, 0) игро- ка 1, соответствующей стратегией поведения будет х = у = — 1/2, и, в то время как оптимальная смешанная стратегия обеспечивает первому игроку выигрыш г/А, даже соответ- ствующая ей стратегия поведения дает ему только 0. Это расхождение объясняется, конечно, независимостью, со- держащейся в природе стратегии поведения. Чтобы полу чить положительные результаты при использовании стра- тегий поведения, надо наложить ограничение на информа- ционное разбиение.] Определение 17. Говорят, что игра Г является игрой с полной памятью для f-ro игрока, если из t/EE Rel щ iixeU следует я ЕЕ Poss jq для всех U, х и лР [Читатель может проверить, что это условие эквива- лентно утверждению, что правилами игры игроку позво- лено помнить все, что он знал в предшествовавших пози- циях, и все свои выборы в этих позициях. Это избавляет его от необходимости использования агентов; действи- тельно. только в правилах игр с Неполной памятью, как, например, бридж, содержится описание агентов.] Лемма 4. Пусть Г — игра с полной памятью для i = 1,...., п. Пусть игрок i имеет позицию в партии ы, и пусть последняя альтернатива е для i в ы принадле- жит позиции xeeU; тогда положим = | UEE Rel л{ и Лг (U) = v (е)}. В противном случае пуппъ Т\ (w) есть
ПОЗИЦИОННЫЕ ИГРЫ И ПРОБЛЕМА ИНФОРМАЦИИ 37 Рп (W) = 1 множество всех л^. Наконец, пусть с(ш) равно или произве- дению вероятностей альтернатив случая, лежащих в пар- тии w, или 1, если таковых нет. Тогда для всех л и всех w c(w), если л4ЕЕ Ti (w), i = 1, . . .,п, О в остальных случаях. Доказательство. Очевидно, достаточно пока- зать, что если л4ЕЕ Т4 (w), то л{ выбирает все альтернативы игрока i в партии w (если такие существуют). Но если л4ЕЕ Ti(w), то Z7 ЕЕ Rel лн и, так как Г — игра с полной памятью, я ЕЕ Poss л^. По утверждению 1, щ выбирает все альтернативы игрока i в партии w. Лемма 5 х). Пусть е—альтернатива в партии w, при- надлежащая позиции xEzl U^VLi, и пусть следующая позиция игрока i, если она существует, есть y^V. Далее, пусть S — {л41 U G= Rel Я| и л$ (Z7) .== v (е)} и Т = {щ\У Rel nJ. Тогда S ~ Т. Доказательство. Пусть л{ ЕЕ S. Тогда U G Rel л4, и, так как Г — игра с полной памятью, £ ЕЕ Poss л^ сле- довательно, по утверждению 1, л£ выбирает все альтерна- тивы игрока i на пути от О до х. Но л4 (U\ ~ v (е), и, значит, л,- выбирает все альтернативы игрока i на пути от О до у. Следовательно, у ЕЕ Poss л{, Vе Rel л4 и л4 е Т. Пусть ЩЕНТ. Тогда Fee Rel лн и, так как Г — игра с полной памятью, z/ЕЕ Poss л(. Следовательно, х ЕЕ Poss л4 и л4 (U) = v (е), т. е. Лемма доказана. Теорема 4. Пусть |3 — ситуация в стратегиях поведения, соответствующая произвольной ситуации в сме- шанных стратегиях р в игре Г (в которой все позиции имеют по крайней мере две альтернативы). Тогда для того чтобы Н^)=Н^) (z = l,...,n) для всех р и для всех значений функции выигрыша h, х) Предполагается, что Г — игра с полной памятью для игро- ка i. (Прим, ред.)
38 Г. У. КУН необходимо и достаточно, чтобы Г была игрой с полной памятью *). Доказательство. Предположим, что Г — игра с полной памятью * 2); тогда достаточно показать, что р^ (w) = Рр. (w) для всех ip. Если существует в партии w альтернатива е игрока i, выходящая из позиции, принадлежащей несуществен- ному для pi* информационному множеству, то обе части, очевидно, равны нулю. Поэтому можно считать, что все такие информационные множества существенны для 1Ц. Преобразуем каждую часть равенства отдельно; АзИ= П Р»(е)- е w Рассмотрим те альтернативы е в партии ip, которые при- надлежат игроку г; их вероятности даются дробями из опре- деления 16. Знаменатель самой первой дроби, очевидно, равен 1, а каждый числитель совпадает, по лемме 5, со знаменателем следующей дроби. Следовательно, п pfJ (w) =с и П ( 3 <1^} > где с (w) и Ti (ш) определяются леммой 4. С другой стороны, Ру. И = 2 9». • • • (W) = 3 ?«>••• (7"nc И Л е (W) по лемме 4. Сравнивая оба выражения для р (ш), получа- ем, что достаточность доказана. Необходимость. Если Г не является игрой с полной памятью 3), то должны существовать чистая стра- тегия л?- и две такие позиции х и у в некотором информа- ционном множестве U, что ЕЕ Poss лъ az/^Poss лР Выбе- *) Для всех игроков. {Прим, ред.) 2) Для всех i — 1, . . ., п. {Прим, ред.) 3) Для некоторого игрока i. {Прим, ред.)
ПОЗИЦИОННЫЕ ИГРЫ И ПРОБЛЕМА ИНФОРМАЦИИ 39 рем стратегию для которой # принадлежит Poss л^ин? ил' — соответствующие определению 6 окончательная 1 1 * позиция и ситуация. Если положить Щ т0 di di = у При этом существует альтернатива е, лежащая на пути от О до у, которая стратегией щ выбирается, а стратегией л£ нет и, следовательно, получает вероятность при исполь- зовании стратегии поведения, соответствующей ц*. По- скольку всегда можно взять л$ так, что (U) (Е7), то стратегия поведения, соответствующая ui, приписывает вероятность х/2 альтернативе позиции г/, ведущей в w. Значит, и доказательство завершено. Примеры. Чтобы проиллюстрировать действен- ность стратегий поведения, можно привести три примера из литературы. То, что они все являются вариантами по- кера,— простое совпадение; существенным общим свойст- вом их является наличие полной памяти. Пример 1. Фон Нейман и Моргенштерн приводят пример покера ([1], стр. 190—196), в котором число чистых стратегий для каждого игрока равно 3s, где $ — число возможных «сдач». Следовательно, размерность множе- ства смешанных стратегий равна 3s — 1. При этом раз- мерность множества стратегий поведения равна 2s; когда s велико, разница получается существенная. Пример 2. В примере, данном автором ([5], стр. 97—103), используя доминирование, можно умень- шить число чистых стратегий с 27 до 8 для игрока 1 и с 64 до 4 для игрока 2. Тем не менее нахождение решений остается утомительным. При стратегиях поведения функ- ция выигрыша имеет три параметра для первого игрока и два параметра — для второго; кроме того, она не имеет членов степени выше второй, и поэтому нахождение реше- ний есть простое упражнение в элементарных вычислениях. Пример 3. В простом покере трех лиц у Нэша и Шепли ([6], стр. 105—116) соображения о доминировании
40 Г. УКУН приводят к игре, в которой три игрока имеют соответ- ственно 17-, 19- и 31-мерные множества смешанных страте- гий. В то же время каждый из них имеет 5-мерные множе- ства стратегий поведения, и такое сокращение делает возможным нахождение единственной ситуации равновесия в этой игре. ЛИТЕРАТУРА [1] Von Neumann J., Morgenstern О., The theory, of games and economic behavior, 2nd ed., Princeton, 1947. [2] . К о n i g D., Uber eine Schlussweise aus dem Endlichen ins Unendliche, Acta Szeged 3 (1927), 121—230. [3] Нэш Дж., Бескоалиционные игры, сб. «Матричные игры», Физматгиз, 1961, 105—121. [4] Ц е р м е л о Э., Об одном применении теории множеств к тео- рии шахматной игры, сб. «Матричные игры», Физматгиз, 1961. [5] К u h n N. W., A simplified two-person poker, Annals of Math. Studies, 24 (1950). [6] N ash J., Shapley L. S., A simple three-person game, Annals of Math. Studies 24 (1950).
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ И СУЩЕСТВЕННО ОПРЕДЕЛЕННЫЕ ИГРЬР) Н. Дэлки § 1. Введение В первых параграфах (1—5) мы рассматриваем экви- валентность позиционных игр, используя предложенную Куном [2] модель. Можно исследовать различные виды эквивалентности, и это зависит отчасти от того, что счи- тать разумными способами разыгрывания. Мы рассматри- ваем эквивалентность по отношению к смешанным стра- тегиям. Совершенно другое понятие эквивалентности потребовалось бы, если ограничиваться, например, стра- тегиями поведения [2]. Понятие эквивалентности, которое мы здесь развиваем, лишь отдаленно связано с идеей стратегической эквива- лентности, введенной фон Нейманом и Моргенштерном ([4], стр. 245—248). Последние исследуют главным образом изменения в функции выигрыша, которые оставляют ин- вариантным решение; мы будем изучать те изменения в структуре позиционной игры, которые оставляют инва- риантными основные стратегические свойства игры, неза- висимо от функции выигрыша 1 2). Здесь не дается полного исследования эквивалентности относительно любых изменений в структуре позиционной 1)Dalkey Norman, Equivalence of information patterns and essentially determinate games, Contributions to the theory of games, vol. II, Princeton, 1953, 217—243. Подготовка этой статьи была поддержана корпорацией РЭНД. 2) Наш подход аналогичен методу Крентала, Куайна и Мак- Кинси [1], и наши результаты можно рассматривать как распростра- нение на общий случай их результатов для игр двух и трех лиц с нулевой суммой.
42 н. дэлки игры, и эквивалентность рассматривается лишь относи- тельно изменений в схеме информации. Грубо говоря, две информационные схемы одного игрока считаются экви- валентными, если они отличаются в каждой данной по- зиции игры только тем знанием, которое этот игрок име- ет о своих собственных предшествующих ходах. В остальных параграфах эти результаты применяются для получения необходимых и достаточных условий того, чтобы позиционная игра имела ситуацию равновесия в чистых стратегиях независимо от функции выигрыша и от вероятностных распределений в позициях случая. Мы назовем такие игры существенно определенными, так как для них вопрос о существовании ситуации равновесия в чистых стратегиях полностью определяется только инфор- мационной схемой. Условие, которое мы назовем эффективно полной ин- формацией, есть условие, что при каждом своем ходе игрок знает все предшествующие игры своих противни- ков, и знает по крайней мере столько, сколько знают его противники в момент хода. В частности, когда нет ходов случая, это условие заключается просто в том, что относи- тельно информации игра эквивалентна игре с полной ин- формацией 1). § 2. Позиционные игры Мы будем придерживаться определения позиционной игры, данного Куном, с некоторыми незначительными из- менениями обозначений. Определение 1. Позиционная игра п лиц Г определяется следующими объектами: Р1. Деревом игры К, которое является частично упоря- доченным множеством позиций {х, у, z,...}. х) Фон Нейман и Моргенштерн впервые доказали, что полная ин- формация является достаточным условием для того, чтобы антагонис- тическая (нулевая двух лиц.—Прим, персе.) игра имела ситуацию равновесия в чистых стратегиях (см. [4], § 15). Кун распространил этот результат на ситуацию равновесия в чистых стратегиях для общего случая. Шепли [5] дал необходимое и достаточное условие существования ситуации равновесия в чистых стратегиях для огра- ниченного класса антагонистических игр, подобное данному ниже условию для общего случая.
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 43 Р2. Информационной схемой U = {Uo, Hi,..., Un}, где каждое = {U, V,...} является разбиением некото- рого подмножества из К. РЗ. n-мерной вещественной вектор-функцией h (w) — — (^i (^)»---> hn (ip)), заданной на некотором определенном подмножестве W множества К. Р4. Функцией множества р (v, £7), определенной для С/еПД), v — 1, 2,..., т (£7), 0 < р (v, U) < 1. При желании подчеркнуть зависимость Г от этих объектов будем писать Г = Г (7Г, U, й, р). Вместо того чтобы аксиоматизировать эти основные понятия, мы, следуя Куну, дадим им геометрическую ин- терпретацию. Дерево К есть конечное дерево с отмеченной вершиной О, расположенное в ориентированной евклидовой пло- скости. Концевые точки из К, составляющие множество Ж, называются окончательными позициями, остальные вер- шины — промежуточными позициями (мы будем иногда называть и те и другие общим словом позиции). Единст- венный уникурсальный * 2) путь от О к окончательной позиции w будет называться партией и обозначаться w. Далее, т позиций, непосредственно следующих за по- зицией х, нумеруются числами v == 1, 2,..., т, где т зависит от х; xv будет означать v-ю позицию, непосред- ственно следующую за х; т (х) означает общее число возможных выборов (альтернатив) в х. Рангах в К, т. е. число позиций, которые предшествуют х, будем обозна- чать через г (х)*, D (х) (потомки х) означает множество всех позиций, которые следуют за х, и D (х, у) — множе- ство позиций, которые следуют за v-й альтернативой х. Информационная схема U прежде всего разбивает про- межуточные позиции из К на п 4- 1 непересекающихся подмножеств и далее подразделяет каждое из этих подмно- жеств на информационные множества*, J U — Pi— это и те позиции, в которых «имеет ход» игрок i. Р — {Ро, Р^... ..., Рп} называется разбиением по игрокам или на множества очередности. В каждом х ЕЕ U ЕЕ игрок i знает, что он х) i = 0, 1,..., п. (Прим, ред.) 2) См. примечание 3) на стр. 15. (Прим, перев.)
44 н. дэлки находится в одной из позиций множества U. Для каждого информационного множества U число альтернатив во всех его позициях одно и то же; следовательно, общее число альтернатив, имеющееся в любой позиции из £7, можно обозначать т (£7). Кроме того, информационные множе- ства подчиняются условию, что никакое информационное множество не пересекается с одной и той же партией более одного раза. Обозначение Uo оставлено для «случайного игрока», т. е. каждое хЕЕ PQ является позицией случая. Мы допуска- ем, чтобы Z7eeU0 содержало более одной позиции; это дает удобный способ отождествления вероятностных рас- пределений в различных позициях случая. Функция множества р (v, U) определяется так, что для U ^Uoh для каждого v имеем р (v, U) = 1. Для f/EU0 т (U) имеем О <Ср (у, U) < 1, 2 р (v, £7) = 1. Следовательно, v=l для позиций случая р (у, U) дает вероятностное распре- деление на т альтернативах. Положим р (v, х) = “ Р (v, U) для х GE U. Функция h есть функция выигрыша. Каждой оконча- тельной позиции w она соотносит n-набор вещественных чисел, означающих, сколько каждый игрок должен полу- чить в этой позиции. Пару (К, U) будем называть игровой структурой, и со- ответственно (К, U) называется структурой игры Г (К,УХ, h, р); Ui будет называться информационной схемой игрока i. Определение 2. Чистой стратегией игрока i называется функция щ (£7), которая сопоставляет каж- дому некоторое целое положительное число v^m (U). (Мы иногда будем также использовать pf и для обозна- чения чистых стратегий.) Выбор в позиции х стратегии определяем как (х) = л* (U), где х е= U. Ясно, что игровая структура (К, U) полностью опреде- ляет множество всех возможных чистых стратегий (а так- же смешанных и стратегий поведения) для каждого игрока. Заметим, что наше определение описывает стратегии случайного игрока так же, как и всех остальных игроков.
ОКВЙЙАЛЕНТЙОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 45 Стратегия случая соответствует «выбору посредника» у фон Неймана и Моргенштерна ([4], стр. 81). Пусть л* — (л0, лп л2,..., лп) обозначает (м4-1)-набор стратегий по одной для каждого игрока, а л = (лх, л^,... ..., лп)—ft-набор стратегий по одной для каждого личного игрока1). Ясно, чтокаждое л* определяет единственную окон- чательную позицию it, которую мы обозначим w (л*). По- ложим л* (U) = щ (Z7), где иЛ| содержится в л*. Партию w (л*) определим рекурсивно. Определение 3. w (л*) есть множество таких позиций, что: 1. О ЕЕ w (л*). 2. Если х ЕЕ w (л*), то xv GE w (л*), где v — л* {х)\ w (л*) — последний элемент w (л*). Если xEEw (л*), то говорим, что л* реализует х. Вообще, если л есть m-набор стратегий, т^п + 1, то говорим, что л реализует х, когда существует л*,содержащее л и такое, что хЕЕы (л*). Из определения 3 непосредственно следует Лемма 1. w (л*) — w (р*) тогда и только тогда, когда л* (х) — р* (х) длякаждого хЕЕш (л*), или, что то же, когда л*(С7) = p*(Z7) для каждого U, пересекающегося с (л*). Пусть л*||р| означает (ft + 1)-набор, который полу- чается подстановкой pi вместо л{ в л*, т. е. если Л*^ -— (Лд, Л j , . . . , Л^, » . . , Лп), то < ^*11 Pi ~ (*0» Л1,..., Pi»**’» Ля). Теорема 1. Если w (л*|| pt) = w (л*||Т;), то W (л*) = W (л* || Pi) = W (л* || т,) = w (л* II Pi II Tj). - Доказательство. Если никакое £7 ЕЕ не пе- ресекает w (л*||р{), то по определению 3 и?(л*||р{) не зави- сит от р{, и, следовательно, w (л*) не зависит от лг; та- ким образом, w (л*||pz) = w (л*). Аналогично w (л*||Т;) = == w (л* || Xj || pi). Если U е Ui пересекается с w (л* || р{), то, по предположению и по лемме 1, л* || pi (Z7)— л* || Tj (U), 1) Такие n-наборы будем называть ситуациями в чистых стра- тегиях. (Прим, иерее.}
46 н. дэлки т. е. л} (U) = р|(С/). Если никакое У е U, не пересекается с w (л* || Tj), то w (л*||т?-) не зависит от tj. Если V ЕЕ U; пере- секается с w_ (л* || г,-), то л* || р; (У) = л* || Tj (У), т. е. (Ю — (У). Так как для U ЕЕ ХЦ, к =f= i, кф j, имеем л* (U) = л* || р| (£7) = л* || Т; (£7), то требуемые равен- ства следуют из леммы 1. Теорема 1 в дальнейшем не используется. Однако она иллюстрирует характер структурного отношения между окончательными позициями и стратегиями, который теря- ется при приведении игры к нормальной форме. Таким же образом, как (п + 1)-набор стратегий л* оп- ределяет единственную партию, ситуация л определяет некоторое поддерево К (л), в котором каждая точка ветв- ления есть позиция случая. Множество концевых точек X (л) будем обозначать через W (л)= {w\ существует та- кое л0, что W ~ w (л0, л)}. Лемма 2. ТУ (л) = ТУ (р) тогда и только тогда, когда ш (л0, л) = w (л0, р) для, каждого л0. Доказательство. Достаточность очевидна. Докажем необходимость. Предположим, что ТУ (л) = ~ W (р), но w (л0, л) =/= и? (л0, р) для некоторого л0. Тогда существует такое т0, что w (л0, л) = w (т0, р). Но тогда по лемме 1 для каждого £7 ЕЕ Uo, пересекаю- щего w (т0, р), будет т0 (£7) = л0 (£7), а для любого дру- гого £7, также пересекающего w (т0, р), имеем л (£7) = = р (£7). Следовательно, w (л0, л) = w (л0, р), т. е. при- ходим к противоречию. Определение 4. Пусть wx означает отрезок партии от О до х; тогда 7?(а:)= П P(v>y) для х=£О, р(О) = 1. Определение 5. Ожидаемый выигрыш Н (л) в ситуации л в чистых стратегиях равен н (л) = 3 р (w) h (w). we w (n) Если w не содержит позиций случая, то р (w) ~ 1; в противном случае р (w) есть произведение вероятностей тех альтернатив в позициях случая, принадлежащих гр,
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 47 которые ведут к последующим позициям из w. Отметим, что р (ш) зависит только от р (v, U) для С/ЕЕ Uo и не зави- сит от стратегий личных игроков; при этом всегда выпол- няется соотношение 2 p(w)-=i. W G W (п) § 3. Редуцированная нормальная форма игры Список чистых стратегий для каждого личного игрока в игре Г и заданный ожидаемый выигрыш Н (л) для каж- дой ситуации в чистых стратегиях называются, по фон Ней- ману и Моргенштерну, нормальной формой игры Г. Если Н (л) представлена в виде лг-мерной таблицы, то последняя называется матрицей выигрышей для Г. При преобразовании игр из позиционной формы в нор- мальную часто появляется некоторая избыточность, со- стоящая в повторении в матрице выигрышей строк или столбцов («гиперстрок» в случае игры п лиц). Мы пока- жем ниже, что эта избыточность есть, вообще говоря, ре- зультат излишней информации у одного или нескольких игроков. Очевидно, игрок не теряет никаких своих стра- тегических преимуществ, если повторения будут устране- ны. Этим мотивируется определение редуцированной нор- мальной формы игры. Уточним сначала понятие повторения, определив отношение эквивалентности для стратегий. Определение 6. щ s р$, если Н (л) = = Я (л || р^) для каждого л, содержащего щ. Лемма 3. Отношение = является отношением эк- вивалентности (транзитивным, симметричным и рефлек- сивным) . Доказательство немедленно следует из опре- деления. Пусть s‘i, называемое эквивалентной стратегией, оз- начает некоторый класс эквивалентности чистых страте- гий f-го игрока, a Si — множество всех таких классов. Декартово произведение S = S1xS2 X ... xSn означает множество всех ситуаций в эквивалентных стратегиях. Элементы S будем обозначать через s ~ sn). Положим Н (s) = Н (л), где ЛЕЕ 5.
48 н. дэлки Определение 7. Редуцированная Нормальная форма игры есть перечень множеств эквивалентных стратегий для каждого личного игрока i и функция Н (s), сопоставляющая каждой ситуации в эквивалентных стра- тегиях n-набор вещественных чисел. Если Н (s) представить в виде n-мерной таблицы, то она соответствует матрице выигрышей, в которой устра- нены повторения гиперстрок. § 4. Эквивалентность игр Если допускаются и смешанные стратегии, то все стра- тегические свойства игры Г будут содержаться в редуциро- ванной нормальной форме. Это приводит к тому, что две различные игры считаются эквивалентными, если они имеют редуцированные нормальные формы, отличающиеся разве лишь перестановками в их перечнях стратегий. Определение 8. Игра Г называется эквивалент- ной игре Г' (обозначается Г = Г'), если существует такое взаимно-однозначное соответствие между Si и Si для каж- дого i =f= 0, что при этом соответствии Н (s) = Н' (s'). Лемма 4. Отношение = есть отношение эквива- лентности для игр. Доказательство следует из определения (так как взаимно-однозначные соответствия и равенство выигры- шей являются отношениями эквивалентности). § 5. Эквивалентность информационных схем Характер эквивалентности игр, который вытекает из определений 6 и 8, не слишком глубок в том смысле, что эквивалентность здесь зависит от функций выигрыша и дан- ных вероятностных распределений в позициях случая. Более показательным является анализ эквивалентностей (они будут названы существенными эквивалентностями), которые от этих функций не зависят. Рассмотрим две игровые структуры (A\U) и (К', U'), в которых К — К' и Uo — Uo. Для удобства будем гово- рить, что р совпадает с р', если р (у, U) = р' (у, U') для каждого Z7 ЕЕ Uo. Такая идентификация представляется разумной в свете того факта, что р (у, U) ~ 1 для любого
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 49 С/^иоидля каждого v. Помня об этом соглашении, да- дим определение. Определение 9. Пусть (А\ U) и (К', U') — две иг- ровые структуры, для которых К — К' и Uo - Uo. Бу- дем говорить, что (К, U) существенно эквивалентна (К', U') (обозначается (К, U) ~ (ТС, U')), если Г (К, U, Л, р)~ = Г (ТС, U', /г, р) при любых h и р, для которых Г (К, U, Л, р) и Г (A', U', h, р) — игры. Лемма 5. Отношение ~ есть отношение эквивалент- ности для игровых структур. Доказательство следует из определения 9 и леммы 4. Теорема 2. Если (К, U) ~ (К, U'), то Р{ ~ Pi для каждого i. Доказательство. Теорема устанавливает, что позиции, отнесенные к данному игроку разбиением U, должны быть позициями, отнесенными к соответствующему игроку разбиением U'. Для Ро и Р$ теорема верна по пред- положению (определение 9). Допустим, что Pi =/= Pi для некоторого I. Тогданайдется такое х<Е1Р{. что хЕеРц и k^= i. Можно считать, что х имеет по крайней мере две альтер- нативы 1) (в противном случае х — тривиальная позиция и может быть исключена). Пусть x£U Е Uj и Определим h следующим образом: 1) A; (it) = 0 для всех w, если / =f= i; < 2) hi (w) = 0 для всех таких ш, что xt w и x2^w; 3) Ы (w) — 1 для всех таких ш, что 4) hi (w) = — 1 для всех таких w, что x2^w. Из определения h ясно, что не может быть Hi (л) О и (р) 0, если щ = рР Пусть щ и р^ — две такие стратегии игрока к в (К, U'), что (Ю = 1? Рь (F) = 2 и каждая реализует х. Пусть %' — любая ситуация, реали- зующая х\ (т' || щ) > О, Н{ (т' || рк) < 0, следовательно, в Г (К, U, А, р) не существует эквивалентной страте- гии, соответствующей той эквивалентной стратегии $$ в Г (К, U', Л, р), которая содержит Tj. •*•) •*•) Они обозначены и х2. {Прим, перев.} 4 Позиционные игры
50 н. дэлки Теорема 2 утверждает, что без ограничения общности можно считать Р — Р'. Мы пойдем еще дальше и рассмот- рим случай фиксированной (но произвольной) информа- ционной схемы U \ для всех игроков, кроме одного, и исследуем воздействие изменения И£. В этом упрощенном случае удобно пренебречь тем, что имеются две различные игровые структуры, и отождествить все их составляющие, кроме информационной схемы и стратегий игрока i. При таком соглашении становится осмысленным, например, выражение л || р$, где л — ситуация в (К, 11), а р$ — стра- тегия игрока i в (Kf, 11'). Это соглашение также избавляет от множества тривиальных доказательств взаимно-одно- значных соответствий. Определение 10. Пусть (К, И) и (К, И') — две игровые структуры, для которых И \ Uz = 1Г\Иь Будем говорить, что чистая стратегия л7 игрока i в (Я, И) существенно эквивалентна чистой стратегии л$ игрока i в (К, И') (обозначается л, ~ лЭ, если Н (л) = = Н (л||Лг) для каждого л, содержащего л^, и всех h и р, для которых Г (К, И, h, р) и Г (К, И', h, р) — игры. Лемма 6. Пусть (Я, И) и (Я,1Г) такие, как в опре- делении 10. Тогда (К, 11) ~ (К, И') в том и только в том случае, когда для каждой чистой стратегии л$ игрока i в {К, И) существует такая стратегия л$ игрока i в (К, 11'), что л$~Лг, и наоборот. Доказательств о. Достаточность. Если т7 ~ р;, у =£= z, в Г (К, 11, h,p), то Tj^p; и в Г (К, И', А, р). Если предположить противное, то Н (л) = Н (л || р;) для каждого л, содержащего т7, но для некоторого л', со- держащего Г;, Н (л') =£= Н (л'|| р7). Пусть Л| — стратегия z-го игрока в л'. По предположению существует такое ль что Я (л) = Я(л|1л{) для любого л, содержащего л<; в частности, Н (л'||л^ = Н (л'). Но по предположению Н (л' || л^) = Н (л' || л{ || р ), так как л' содержит т7- и т? = = Р;. Также по предположению Н (л' || лЛ р,) = Н (л' || II IIР; II = н (л' II Р.)» откуда Н (л') = Н (л' [| р}), и мы пришли к противоречию. Так же получим, что из т3- ~ = р, в Г (К, И', h, р) следует т7 = pj в Г (К, 11, h, р). Значит, для / =)= i эквивалентные стратегии из в
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 51 Г (A?, tl, h, р) находятся во взаимно-однозначном соответст- вии с эквивалентными стратегиями изSj в Г (К, И', А, р). Определим теперь соответствие si <-> Si следующим образом: если л* е то л$ЕЕ 4, где *4 — Ясно, что если = = лг, то для каждого р$ ~ р$ будет pi = Л{, т. е. это соот- ветствие взаимно-однозначное. Равенство Н (s) — Н (s') для соответствующих элементов следует непосредственно из определения отношения ~ для стратегий. Необходимость. Предположим, что найдется такое в (К, 11), для которого не существует щ в (К, И') такого, что Л| ~ л,. Тогда найдутся такие А, р и некоторое л, содержащее лй что Н (л) =/= Н (л || л$). Это противоречит предположению, что (К, 11) ~ (К, И'). Теорема 3. Пусть (К, 11) и (К, 11') — две игро- вые структуры с И \ 11£ = 11' \ Н^. Пусть л* — произвольная стратегия игрока i в (К, И) и pt — про- извольная стратегия игрока i в (К, 11'). Для того чтобы л| ~ р|, необходимо и достаточно выполнения любого из двух условий: 1) W (л) = W (л |1 р|) для каждого л, содержащего 2) w (л*) = w (л* J] pi) для каждого л*, содержащего Доказательство. (I) Из 1) следует л1 ~ pi, так как если W (л) = Ж(л|| р|),тоЯ (л) = Н (л|| р$)для каж- дого л. (II) Из ni ~ Pi следует 2). Действительно, предпо- ложим, что найдется такое л*, содержащее что и? (л*) =/= =/= и; (л* || pi). Тогда не существует такого г*, что w (т* ||pt) = — w (л*), так как в противном случае по определению 3 т* II Pi (#) “ л* (ж) Для каждого х Ezw (л*) и, значит, снова по определению 3 w (т* || pi) =lp (л* || р^) = w (л*). Пусть р произвольно, и положим 4{ (ш) = 0 для всех w -=f= w (л*) и hi (w (л*)) = 1. Тогда Hi (л)> 0 для некоторого л, содер- жащего л4, в то время как (л || рг) = 0. (III) Из 2) немедленно следует 1). Определение 11. Множество позиций В (В—не обязательно информационное множество) называется реализуемым стратегией л^, если существует л*, содержа- щее л4 и такое, что w (л*) пересекается с В. Пусть /7 ЕЕ Щ — некоторое информационное множество и В — его подмно- жество. Будем говорить, что В изолировано в U, если для 4*
52 н. дэлки каждого щ из того, что В реализуемо для л{, следует, что U \ В не реализуемо для Лемма 7. Пусть Uy есть множество всех позиций, которые следуют за v-й альтернативой некоторой позиции из U. Тогда В изолировано в U EzUj в том и только в том случае, когда для любых хЕ В и у Е U \ В существует такое V ЕЕ U $, что xEEVy, у ЕЕ Vv и у =j= т]. Доказательство. Достаточность. Возь- мем какое-нибудь л* и предположим, что оно реализует некоторые ХЕЕВ и yEE U\B. По предположению найдется такое VЕЕ Ui, что хеУч, yEEV-ц и v =у= т]. Но если л* реализует х, то (У) = v по определению 3, а если щ реализует у, то Л| (V) = т], что противоречит определению стра- тегии. Необходимость. Предположим, что для не- которых хееВ и z/EE U\B для любогоК^И;, удовлетворяю- щего условию хЕЕVy, уЕЕУц, имеем v — т]. Пусть щ реа- лизует х, a pi реализует у. Построим так, чтобы xi (У) = “ (Ю Для каждого Fe Ui? пересекающегося с wx, и тг (Ю “ Рг (Ю Для каждого V ЕЕ U|, пересекающегося с Wy. Тогда реализует и х и у, значит, В не изоли- ровано в U. Определение 12. а) Пусть (К, U) и (К, U') — две игровые структуры с Рг — Р{. Будем называть Щ непо- средственным уточнением Ui} если существую? такие БеШ и Ult что 1Ц\ {Z71, С72} = Hi\ {И} и Ult U2 изолированы в V. Ь) Назовем 1Ц уточнением Uj, если существует ко- нечная последовательность 2В?, . . . , SSS| такая, что Uz — SBj и Ui = Ж}, a — непосредственное уточне- ние 7 = 1,2,...,/—1. с) Назовем 11$ вполне уточненным, если не сущест- вует такого что есть уточнение 1Ц. d) Назовем 1Ц полным уточнением U-, если 1Ц есть уточнение и если ХЦ вполне уточнено. е) U есть уточнение (полное уточнение) U', если есть уточнение (полное уточнение) 11$ Для каж- дого i.
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 53 Теорема 4. Пусть (К, U) и (A, U') — две игровые структуры с U \ Щ = U' \ 11$, и пусть U4 — непосредст- венное уточнение U4. Тогда (К, U)~(A, U'). Доказательство. Пусть УеЩ и С7х, U2e?l — множества, участвующие в определении 12а. Пусть л4 — любая стратегия игрока i в (К, U'). Далее, пусть л4 — такая стратегия в (К, U), что л^ (У') = л4 (У') для каждого V' =/= V и nL (UL) = л4 (£72) == л4 (7); тогда л^ ~ ~ л$, так как для любого л*, содержащего л4, по лемме 1 w (л*) = w (л*||Л{), и, следовательно, л4 ~ щ по теоре- ме 3. Обратно, рассмотрим теперь любое л4 в (К, U). Если л4 не реализует V, то существует такое л4, что л* (U) = — л4 (U) для U =/= V, и по лемме 1 л^ ~ л4 . Если же л4 реализует У, то, так как £7Х и £72 изолированы в У, л4 может реализовать только либо С7Х, либо £72. Допустим, что она реализует С7Х, и положим л4 (U) — щ (£7) для любого U =/= У и л4 (У) = л4 (С/i). Так как л4 по лемме 1 так- же не реализует £72, то л4 ~ л4. И теорема следует из леммы 6. Следствие 4а. Если (К, U) и (К, U') — игровые структуры, совпадающие везде, кроме некоторого U4, ко- торое является уточнением 114, то (К, U) ~ (К, U'). Доказательство следует из теоремы 4 и леммы 5. Следствие 4Ь. Если (К, U) и (К, U'} — две игро- вые структуры и для каждого i либо U4 — U4, либо является уточнением U4, либо является уточне- нием то (A,U)~(A, U'). Доказательство. Повторно применяем следст- вие 4а. Теорема 5. Если (К, U) ~ (A, U'), U \ == U'\ и как U, так и U вполне уточнены, то U4 = U4. (Две эквивалентные1) вполне уточненные информационные схемы2) совпадают,) х) Здесь и далее имеется в виду существенная эквивалентность. (Прим, перев.) 2) Игрока i. (Прим, перев.)
54 н. дэлки Доказательство. Пусть (К, U) и (К, U') удовлетворяют условиям теоремы и ХЦ Без огра- ничения общности можно предполагать, что существуют такие V<EE Ui и U2€E Ui? что и Ur и U2 пересекаются с V, Возьмем какую-нибудь стратегию л^ в (К, U'). Она не может реализовать оба множества У Q иг и V (] U2. Действи- тельно, если предположить противное, то должно суще- ствовать такое в (К, U), что л$ ~ лг', и, значит, л$ реализует и U1(}V и С/2П^« Определим pi так, чтобы для любого CZ'eUi, U' =у= U1 и U' U2, Pi (ЕГ) = л{ (U')\ a Pi (^i) v ф т] = pi (Е72). Теперь pi реализует и UA 0 V и Z72flF. Тогда не существует р\ в (К, U') такого, чтобы Pi р|, так как найдутся два различных (п + 1)-набора л*, л*, содержащих р{ и таких, что w (л*)ееХ\ и w (л*) ЕЕ ЕУ,. Таким образом, и U\ П V и Z72f]F изолированы в V, что противоречит предположению о том, что Ui вполне уточнено. Следствие 5а. Информационная схема U| игро- ка i имеет единственное полное уточнение. Доказательство немедленно следует из теорем 4 и 5. Теорема 6. Структуры (К, U) и (К, U') с U— = U' — Ui эквивалентны, (К, U) ~ (К, U') тогда и только тогда, когда полное уточнение Ui совпадает с полным уточнением Ui. Доказательство. Следствие 5а утверждает, что существуют единственные полные уточнения для U| и для Ui соответственно. Достаточность следует из теоремы 4, необходимость — из теоремы 5. Следствие 6а. (К, U) ~{К, U') (здесь Uo = Uo) тогда и только тогда, когда полное уточнение Uj совпадает с полным уточнением Uj для каждого j. Доказательство получается из теоремы 6 и следствия 4Ь. Замечание. Довольно утомительный путь, кото- рым мы пришли к теореме 6 и следствию 6а, можно интуитивно обойти при помощи следующего эвристиче- ского рассуждения. Теорема 4, которая не используется непосредственно в доказательстве, показывает, что
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 55 уточнение есть, по существу, процесс добавления к инфор- мации игрока в данной позиции некоторых дополнитель- ных сведений о его собственных предшествующих ходах (причем эта дополнительная информация не касается пред- шествующих ходов других игроков). Но если игрок посту- пает в соответствии с заранее выбранной чистой стратегией и знает полностью структуру игры, то в каждой позиции с его очередью хода его стратегия будет говорить ему, каковы были его предшествующие ходы. Значит, сама по себе информация единственно о его предшествовавших ходах является излишней. По-видимому, память игрока о стратегии будет одинаково полной, следует ли она из непосредственного выбора (чистая стратегия в точном смысле) или из предварительного выбора чистой страте- гии некоторым случайным устройством (смешанная стра- тегия). Однако ясно, что если игрок использует стратегии поведения, т. е. делает случайный выбор в каждой своей позиции, то нельзя гарантировать, что он будет помнить все свои предшествующие выборы. Это происходит, в частности, когда игрок представляет собой команду, чле- ны которой действуют в различных информационных множествах. По этой причине, как легко проверить, тео- рема 6 не верна для стратегий поведения. § 6. Склеивание • До сих пор наше внимание было сосредоточено на уточ- нении информационных схем. Однако с практической точки зрения на упрощение игр уточнение не так инте- ресно, как его обращение — склеивание. Проиллюстрируем порядок уменьшения размеров мат- рицы выигрышей при помощи склеивания на примере игры в крестики и нулики. Первый игрок имеет прибли- зительно 1031 000 чистых стратегий (если не учитывать правило остановки и считать, что каждая партия игры за- канчивается, когда заполняются все клетки). В сущест- венно редуцированной форме первый игрок имеет только 10127 чистых стратегий. Хотя и это второе число баснослов- но велико, ясно, что все же происходит существенное уменьшение объема игры. При этом положительной чертой
56 н. дэлки является то, что такая редукция может быть произведена прямо в игровой структуре, без предварительного построе- ния матрицы астрономического объема и последующего отбрасывания повторений. К сожалению, мы не можем утверждать, что любая информационная схема имеет единственное полное склеи- вание. Рассмотрим игру Г, изображенную на рисунке, а. На рисунке информационные множества игроков представ- лены эллипсами. Очевидно, уточнено: игрок 1 на своем втором ша- ге знает, какой первый ход он сделал. В действительности есть уточнение и в Г' и Г" соответственно. И Ui и вполне склеены. Легко проверить, что в этом случае остается некоторая избыточность в информа- ционной схеме в том смысле, что и Г' и Г" (рисунки, б, в) имеют по две или более существенно эквивалентных стра- тегий,
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 57 § 7. Существенно определенные игры В предыдущих параграфах мы руководствовались более или менее интуитивным понятием эквивалентности, осно- ванным на предположении, что нормальная форма игры полностью исчерпывает все стратегические возможности. Было бы желательно основывать наши исследования на некотором множестве правил, позволяющих вести игру разумным образом. К сожалению, в настоящее время в удовлетворительном состоянии могут считаться правила разумного поведения лишь для игр одного игрока и антаго- нистических игр. Существует, правда, некоторое понятие слабого решения для общего случая, введенное Нэшем [3], которое можно использовать по крайней мере для изучения некоторых свойств информационных схем и кото- рое в случае антагонистических игр превращается в из- вестное правило минимакса. Это — понятие ситуации равновесия. Так как выше мы определяли только чистые стратегии, ограничимся исследованием ситуации равнове- сия в чистых стратегиях. Определение^. Ситуация л в чистых стратегиях называется ситуацией равновесия, если для всех i Нг (л) > Hi (л || при любом рР Определение 14. Будем называть игровую струк- туру (К. U) существенно определенной, если Г (К. U, h. р) имеет ситуацию равновесия в чистых стратегиях при любых h и р, для которых Г {К. U, h. р) — игра. Л е м м а 8. Если {К. U) ~ (К. U'), то (К. U) су- щественно определена тогда и только тогда, когда сущест- венно определена (К. U'). Доказательство немедленно следует из опре- делений отношения ~ и существенной определенности. Кун показал [2], что достаточным условием сущест- венной определенности игровой структуры (К. U) яв- ляется наличие в ней полной информации г). 2) Строго говоря, он доказал несколько отличное от сказанно- го; но, чтобы получить существенную определенность, доста- точно тривиального замечания, что h и р могут быть выбраны про- извольно.
58 н. дэлки Определение 15. Говорят, что (К, U) имеет полную информацию^ если каждое информационное множе- ство состоит из одной позиции. Ясно, что не будет существенных изменений, если в определении 15 ограничиться личными информацион- ными множествами. Легко найти примеры игр, существенно определенных и не имеющих полной информации. Действительно, любая игра одного лица является существенно определенной независимо от вида информационной схемы (см. ниже лем- му 10). Значит, полная информация не является необхо- димым условием для существенной определенности. Пусть U V означает, что существует партия w, пе- ресекающаяся с U и У, и пересечение ее с U предшествует пересечению с V. Мы будем иногда также употреблять обозначение х < U, если существует партия w, содержащая х и пересекающая £7, и при этом х предшествует этому пересечению. Определение 16. Будем говорить, что (К, U) имеет эффективно полную информацию, если для лю- бой пары личных информационных множеств С7ее1Ци k=j= i, имеем: если U <С F, то V cz при не- котором V. Заметим, что в определении ничего не говорится ни об отношении между информационными множествами одного игрока, ни об отношении между личными информацион- ными множествами и позициями случая. Переводя на язык интуиции, будем говорить, что игрок имеет эффективно полную информацию, если в любой позиции с его ходом он «помнит» все предшествующие ходы всех своих личных противников и знает по крайней мере столько,сколько они знали в момент хода. Лемма 9. Любая игра одного лица имеет эффективно полную информацию. Доказательство непосредственно следует из определения. Л е м ма 10. Любая игра одного лица существенно опре- делена. Доказательство. Так как Н (л)( = (л{)) — функция только одной переменной на конечной области, то она достигает там максимума.
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 59 Мы сначала покажем, что игра с эффективно полной информацией может быть разложена на направленное семейство подыгр (частично упорядоченных по включе- нию), в каждой из которых ситуации равновесия могут быть исследованы независимо от следующих за ней подыгр. Понятие подыгры здесь несколько более широкое, чем при простом применении определения 1. Определение 17. Пусть В есть некоторое мно- жество позиций (не обязательно информационное множест- во) и D (В) —- множество всех позиций, которые следуют за позициями из В, т. е. D (В) = {у | существует х ЕЕ В и yEzD(x)}. Аналогично/) (v, В) есть множество всех пози- ций, которые следуют за В по v-й альтернативе, т. е. D (v, В) = {у\ существует х В и у е D (v, х)}. Будем пи- сать х С7, если либо х U, либо xEzU. Точной нижней границей (т. н. г.) множества В будем считать позицию х наибольшего ранга, которая содержится в каждой партии w, пересекающейся с В\ V В означает, что либо V <Z В, либо V пересекается с В» А. Множество позиций В определяет подыгру Гв, если 1) для каждого личного информационного множества V В имеем В cl Vv для некоторого v; 2) для каждого личного информационного множества V > В имеем V cl D (В) U В. В. Чистая стратегия игрока i в Гв есть функция л?, сопоставляющая каждому V ЕЕЩ, V > В, целое число v < т (V). Выражение ntf также используем для обозна- чения ограничения на Гв стратегии я* (т. е. nf есть такая стратегия игрока i в Гв, что л?(7) =л{(7) для 7 > В, Feu,). С. W (лв) ~{w\wEED (В) и для любой личной позиции у>В из у EEw следует у^Е^ы, где лв (у) = v}. D. Пусть р (В) = 2 Р (у)- Для х > В имеем рв (х) — у<=в Р(В) ’ Е.Н(лв)^ S PB(w)h(w), W^W(nB)
60 н. дэлки Можно дать следующее обоснование того, что Гв назва- на подыгрой (более точная мотивировка содержится в леммах И—13, приведенных ниже). Определение 17 А2 утверждает, что В выделяет некоторую часть К, а именно B\}D (В); никакое личное информационное множество не пересекает одновременно и B\]D (В) и оставшуюся часть К. Определение 17 А1 утверждает, что любая позиция из В U D (В) реализуется единственным множеством выборов во всех личных информационных множествах V В. Таким образом, если дано л, реализующее 5, то выбор стра7 тегии в Гв может быть сделан независимо от оставшейся части Г. Отметим, что множество {0} определяет подыгру Г{0}, т. е. саму Г. Существенные элементы в подыгре Гв, именно стра- тегии и ожидаемый выигрыш, определяются точно так же, как соответствующие понятия в полной игре, только О заменяется на т. н. г. В, Мы не можем, однако, просто определить поддерево, скажемКв, которое начиналось бы вт. н. г. В и вместе со своей информационной схемой определяло бы структуру подыгры, так как, во-первых, между В и т. н. г. В могут существовать личные инфор- мационные множества, которые пересекаются и с Кв и с оставшейся частью К, и, во-вторых, Кв может быть шире, чем часть К, которая выделяется множеством 5, т. е. следует за В. Лемма И. Если В определяет подыгру, то либо для любых х, уЕЕВ т. н. г. {х, у} есть позиция случая, либо В — одноэлементное множество. Доказательство. Предположим, что В — не одноэлементное множество и х, у ЕЕ В. Тогда т. н. г. {х, у} е£В х). Но т. н. г. {х, у} не может при- надлежать личному информационному множеству, по оп- ределению 17А1. Значит, т. н. г. {х, у} — позиция случая. Лемма 12. Если В определяет подыгру Гв, то для любого л, реализующего В, имеем Н (л) = р (В)Н (лв) 4~ -f- Т (л), где Т (л) не зависит от лв. х) Доказательство остается верным и без этого положения, кото- рое, вообще говоря, неверно. {Прим, перев.)
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 61 Доказательство. Если п реализует В, то W (лв) = W (л) (В). Значит, Я(л)= S p(w)h(w) + Т(п), w^W(~B) где Т(л) = S p(w)h(w), wEW(-)\W(rB) откуда Н (л) = р (В) 2 Рв (w) h(w) + Т (л) = w&W(nB) — р (В) Н (лв)Т (п). Если wEiW (л)\ТУ(лв), то w не пересекается с В и, следовательно, по определению 17 А2 не пересекается ни с каким личным V В. Отсюда, если лир совпадают для всех личных V В, то Т (л) == Т (р). Л е м м а 13. Для того чтобы л была ситуацией равно- весия в Г, необходимо и достаточно, чтобы в любой подыгре Гв такой, что К (л) пересекается с В, пв была ситуацией равновесия. Доказательство. Достаточность оче- видна, так как Г есть подыгра для самой себя. Необхо- димость. Если пв не ситуация равновесия в некоторой Гв, то существуют / и pf такие, что (лв|| pf) > (лв). Пусть р{ совпадает с pf в игре Гв и с л^ вне ее. Тогда по лем- ме 12, Я{ (л [Ipt) (л) и л не ситуация равйовесия в Г. Определение 18. Пусть U и V — личные ин- формационные множества. Будем говорить, что U свя- зано с V, если существует такая последовательность лич- ных информационных множеств U1, U2,..., U1, что U = U1, V = U1; для каждого /существует партия w, пере- секающая иг и Ui+1, причем Ul qt U^1, U^1 qt: Ul ни для какого v. Л е м м а 14. Связанность есть отношение эквивалент- ности. Доказательство, а) Транзитивность. Если U связано с У и V связано с У', то существует последователь- ность U1, U2,..., U1, связывающая U и У, и последова- тельность У1, У2,..., Vh, связывающая У и У'. Тогда последо- вательность U1, U2,..., U1, У2,..., Vh будет связывать ЯиУ'.
62 н. дэлки b) Симметричность следует из определения. с) Рефлексивность тривиальна. Определение 19. Обозначим множество клас- сов эквивалентности личных информационных множеств по отношению связанности через S = {С\, Положим (J С = {х | существует UeChxeU] и В (С) = {х | х е U С и не существует у Е\}С, у С т. е. В (С) состоит из ми- нимальных точек J С. Лемма 15. Если С ЕЕ то В (С) определяет подыгру. Доказательство. 1) Пусть U — какое-нибудь личное информационное множество и U^B(C), т. е. существует w, пересекающее U и В (С). Пусть w пересе- кает В (С) по информационному множеству V г). Если для любого v имеем U ф то U ЕЕ С, и, значит, каждая пар- тия w, пересекающая 17, пересекает и В (С). То же самое имеет место и в случае U cz: Vv для некоторого v. 2) Пусть теперь U есть личное информационное мно- жество и U В (С); U С, так как В (С) минимально. Найдется некоторая партия ш, пересекающая U и пересе- кающая В (С) в х е V ЕЕ С; отсюда следует, что V cz Uv для некоторого v, так как иначе U EEC. Пусть V' — любое дру- гое информационное множество из С. По определению V и V' связаны последовательностью V1, V2,..., V1, V = ==1^, V' = Vl. Мы уже показали, что VlaUv для неко- торого v. Предположим, что Pcz U„. Так как существует wQ, пересекающееи7^+1, и каждое w, пересекающее Р, пересекает и U, то получаем, что wQ пересекает U и W+1. Далее, U^V^1 ни для какого ц, так как U СВ (С); по- этому, если Р’+1 ф Un ни для какого ц, то U EEC. Значит, P‘+1 gz для некоторого ц и ц = v, так как по предполо- жению wQ проходит через v-ю альтернативу в U. Таким образом, существует такое v, что для любого V EEC имеем V czz Z7V. Следовательно, и В (С) cz Z7V. Определение 20. Будем говорить, что класс эквивалентности С покрывает класс эквивалентности С", если В (С) СВ (С") и не существует такого класса С", что В (С) <5 (С") СВ (С"). Лемма 16. Если С покрывает Сто для любого U ЕС' имеем U В (С), и для каждого V ЕЕ С из существования w, х) V может быть равно U. {Прим. ред.}
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 63 пересекающего V и В (С'), следует В (C')czzFv при некото- ром V. Доказательство следует из леммы 15. Лемма 16, по существу, утверждает, что если класс эквивалентности С предшествует другому классу экви- валентности С", то В (С') определяет подыгру в игре Гв(С)- Лемма 17. Два различных класса эквивалентности не могут покрывать один и тот же класс. Доказательство. Допустим, что С и С" оба покрывают С". По лемме 16 любое w, пересекающее Б (С"), пересекает и В (С") и В (С). Так как В (С) и В (С) не совпадают, то либо В (С)<С В (С"), либо В (Cf) < В (С). Тогда соответственно либо С, либо С' не покрывает С". Если начальная позиция О в (К, U) — личная позиция, то класс С, содержащий О, определяет всю игру Г. Если Oe^Pq, то может оказаться,что никакое С не определяет всей игры. В этом случае удобно расширить S, считая, что {0} Е 6. В любом случае обозначим класс С, содержащий О, через Со- Т еорема 7. Множество К и отношение покрыва- ния образуют дерево с отмеченной вершиной Со- Доказательство. Пусть>-означает расширение отношения покрывания, т. е. С >- С' тогда и только тогда, когда существует такая последовательность С2,..., Сп1 что С =Cj, С' =Спл Ci покрывает Ci+1. Отношение тран- зитивно по определению, асимметрично по демме 16 и является ациклическим частично упорядочивающим от- ношением на К. Имеем Со >- С для каждого С =£= Со- На- конец, если С\ >- С и С2 >- С, то либо >- С2, либо С2 >- С± по лемме 17. Лемма 18. Если (К, U) имеет эффективно полную информацию и С то С cz ХЦ для некоторого I. Доказательство. Пусть VgeC, V EEU^ ~ неко- торое информационное множество в С. Рассмотрим любое Ue^C; U связано с V последовательностью U1, U2,..., Uh. Но если С/гЕЕХЦ, то и Ui+1 (ЕЕ U|, так как по предположению из иг+1е£ ХЦ следовало бы либо Ul cz U1*1, либо £Zi+1 cz cz ui, T. e. Ui+1&C. Лемма 18 показывает, что при эффективно полной информации в дереве @ переход от какого-то множества
64 н. дэлки подыгр к покрывающей их подыгре добавляет только од- ного игрока. Теорема 8. Для того чтобы (К, U) была сущест- венно определенной, необходимо и достаточно, чтобы ее полное уточнение имело эффективно полную информацию. Доказательство. Достаточность. Тре- бование полного уточнения (К, U) для достаточности не нужно х). Поэтому предположим, что (k, U) имеет эффективно полную информацию. Мы докажем достаточ- ность, построив для произвольных h и р ситуацию рав- новесия л. Будем называть Се£ минимальным, если не существует такого С', что С >- С". Ясно, что минимальное С определяет игру одного лица. Для простоты вместо Гв(С) и лв<с> будем писать Гс и лс. 1) Для каждого минимального С выберем лс( = л? при Ссз11г) так, чтобы * 2) 2) Для любого С положим лс(7) — лс' (7) для VeeC' , >- С'. Выберем лс (U), UEEiC, так, чтобы (лс) > Нk (лС || pf), с <=. Uj., где pi (У) = лс' (V) для Ve С и С >- С. Покажем, что любое л, построенное по этому рекуррентному правилу, явля- ется ситуацией равновесия. Пусть pi — произвольная стра- тегия игрока i; построим последовательность стратегией pt pt---, pi Для этого игрока следующим образом: (а) pj =pi- (b) pf1 совпадает с р| везде, кроме класса С (ко- торый мы будем обозначать Cj) наибольшего ранга, кото- рый пересекает К (л||р?) и для которого р| (7) Л{ (7) для некоторого7ЕЕ Cj. Отметим, что Cj cz ХЦ. (Если суще- ствует несколько таких множеств С одинакового ранга, то возьмем в качестве Cj одно из них.) (с) Для 7 > В (Cj) г) На основании следствия 4 и леммы 8. (Прим, ред.) 2) Лемма 10. (Прим, ред.)
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 65 положим p{+1 (F) = (У). По лемме 12 и по построению л имеем Щ (л IIРГ1) > Щ (Л || pi). Так как С, пересекающих К (л||р4), существует лишь ко- нечное число и переход от pi! к р?+1 требует понижения ранга (или по крайней мере понижения ранга после ко- нечного числа шагов), то последовательность pl дол- жна кончаться таким pt что К (л |[pi) — К. (л), откуда Нг (л 1|pi) = Нг (л) и, следовательно, 1Ц (л) > Нг (л) ||р{). Необходимость. Предположим, что полное уточнение (К, U') данной структуры (К, U) не имеет эффективно полной информации. Пусть — лич- ная позиция наименьшего ранга, для которой существует zeeD (я0), zeeVeeU}, i =+=j,-RVqz С7уни прикакомv(если существует несколько таких позиций, то xQ — одна из них). Пусть х(= V ЕЕ 11ь k =f= i,— позиция наименыпего?ран- гав/Э (х0) такая, что V qt t7v ни при каком v. Так как xEz D (т), ж0) при некотором ц, найдется такое у ЕЕ 7, что yEjt D (т], Яо)-Для простоты переименуем игроков и аль- тернативы так,чтобы U сРц V с=Р2, ® (1» ^о)- Будем различать три основных случая. __ С л у ч а й I. х0 = т. н. г. {х, у}. Положим W = =D (х) J D (у), и пусть т = max [г (я^), г (а:2)]. Обозна- чим через z позицию наибольшего ранга в пересечении w с wx или wy и определим h (w) следующим образом: a) we£W: 1) z^PQ : (w) = 0 для каждого i. 2) z Рц, z < {zo}: hi (w) = для каждого Z. P \z) 3) zt£P0, z>{a?0}: hi(w) = для i^=l, hi\w) = , , P\z) m +1 , n 7 / 4 r (z) == ~ Для Pi, в остальных случаях ni (w) = • b) w e= W7: 1) i =j^= 1, i =f= 2: hi (w) — . 5 Позиционные игры
66 н. дэлки 2) i = 1 или i — 2: w б~~ D (^i) w^D (бг2) w e D (yi) w<=D (y2) Ai (w) h2 (w) m m 4~ 1 р(ж) p(x) m 4-1 />(*) p(x) tn 4- 1 P(«/) P{y) tn tn 4~ 1 Р(У) P(y) При таком определении h никакое л не может быть ситуацией равновесия. Покажем это. Существует две воз- можности. ______ А. К (л) П W = 0. Пусть z Е - позиция наибольшего ранга в пере- сечении А (л) с wx или wy, и пусть рк совпадает с л7. везде, кроме U, а p/f (Z7) = v, где zv ЕЕ или wy. Тогда Нк (л II рэ > Г (zv) > г (z) = Нк (л). В. К (л) П w =/= 0. Выигрыш любого игрока не зависит от выборов, сделанных выше V. Следовательно, по существу, имеем че- тыре случая, зависящих от лх (U) и л2 (7); они приведены в матрицах: (л) Н2 (л) X. *2 (V) ' (С/) 1 2 (V) (й) 1 2 1 т пг 4- 1 1 т 4- 1 т 2 т 4~ 1 т 2 т т 4- 1 Мы замечаем, что для любой пары выборов лх (U) , л2 (Ю существует выбор одного из игроков, который уве- личивает его выигрыш.
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 67 С л у ч а й II. ж0^=т. н. г. {х, у}, U пересекает wy. Т. н. г. {х, у}^Р0, так как в противном случае х0 не бу- дет минимальной позицией, для которой не выполнены условия эффективно полной информации. Пусть ЕЕ — позиция наименьшего ранга в wy такая, что U пересекает ых и Уф Uy ни для какого v. Ввиду минимальности V имеем U EEUX. Пусть ЯГ, z, т таковы, как в случае I, и положим t = г (х0) — г (уо). Определим h (w) для а) 1, 2 и b) 1 так же, как в случае I. а) 3) z^P0, z>{^0}: «ля г‘=М, р \z) _ 7 / \ 2m 4~ 1 4~ t z^wx: = 2>n+l-t ДЛЯ^Р1( Z е Wy: hr (w) = —-T-r- hi (w) = ‘тйт для z e P1' p \z) Ь) 2) М№) hv(w) w е D 2т р(х) 2т 4- 1 р(аг) w f— D (х2) 2т 4- 1 4-* t р(ж) 2т р(х) W е D (г/i) 2т 4-1 — t Р (у) 2т ♦ р(у) w €= D (у2) 2т Р(у) 2m 4- 1 р(у) Доказательство того, что никакое л не может быть си- туацией равновесия, проводится, как в случае I, с той лишь разницей, что надо рассмотреть большее число под- случаев. ______ А. К (л) 0 W = 0. Пусть z определено, как в случае IA. 1. z т. н. г. {ж, у}; рассуждения те же, что и в слу- чае IA. 2. z т. и. г. {х, у}. Пусть и zy ЕЕ Uy — пози- ции наибольшего ранга в пересечении К (л) с wx и wy соответственно. Возможны два подслучая. (1) Либо Ux <£ <£ zv, либо Uv <£ zx. Предположим, что Ux <£ zy. Пусть 5*
68 н. дэлки t/xGUi, и положим равной л{ всюду, кроме а рг (их) = V, где z*^wx. Тогда Hi (rt 11 pi) > г (z*) + Г (z«) > г (z*) + г (zy) = #< (л). Аналогично рассуждаем и в случае Uy <£ zx. (2) Ux <Z zy и Uv <С zx- В этом случае Ux, Uy GE Ui, иначе нарушались бы условия минимальности для U и V. Положим рг рав- ной Л! везде, кроме U s Ui, х > U > zx, а для таких U положим pi(U) = v, где x^eD (v, U). Тогда нг (л IIР1) > 2т + г (у0) > г (zx) 4- г (zy) = Нг (л). Внутреннее неравенство выполняется, так как г (zv) — г (Уо) < т (О < т- В. К (л) П W =/= 0. Только одна из позиций х и у может принадлежать К (л); обозначим эту позицию че- рез а, а другую — через (3. Тогда а0 означает xQ или yQ соответственно, a — позицию наибольшего ранга в пересечении К (л) с w$. Заметим, что z$ {|30}. Пусть Wq е К (л) П W. 1. zs<{M. Н? не пересекает wa по условиям мини- мальности для осо. Положим Pi равной л| всюду, кро- ме U^, a pi(&r3) = v, где Тогда Hi (л || Pi) > р (а) (w0) + г (zj) > р (а) h{ (wQ) + + г (z3) = (л). 2. z& = Ро- Имеются четыре возможности, зависящие от выборов в U или U_ и в 7. Восемь возможных комбина- ций, получающихся из двух выборов в каждом из этих трех информационных множеств, сокращаются, так как либо U = U, либо четыре возможности дают К (л) Q W = 0, что было рассмотрено выше. Обозначим выборы в U так, чтобы XEE.D (1, tf), y^D (2, U), Из условия минималь- ности V имеем U, U_^. U'i; следовательно, выборы в U и U
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 69 полностью контролируются игроком 1, и мы имеем под- матрицы Для любой из этих четырех возможностей один из игроков может выбрать стратегию, которая увеличит его выигрыш. Заметим, что приведенное доказательство не нуждается в существенных изменениях, если мы ослабим условие ми- нимальности для Xq, потребовав только, чтоебы это была позиция наименьшего ранга, для которой не выполнены условия эффективно полной информации, и чтобы она принадлежала информационному множеству, пересекаю- щемуся и с wx и с wy. __ Случай III. х0 т. н. г. {х, у}, U не пересекает wy. Не ограничивая общности, можно считать, что для любого U По, пересекающего wx и wy, существует та- кое v, что {х, у} cz Uv. Покажем это. 1. Существует такое zEiV —D (U), что для любого U е U2, U =£= 7, пересекающего wx и wy, имеем {х, z} с Uv при некотором v. Допустим, что для каждого z' ЕЕ 7, z' е=£ ^D(U) найдется такое U eU2,4To{#, z'} ф Uv при любом v. Из условия минимальности для х имеем U х$, откуда, в силу минимальности х0, U cz С7удля некоторого v и, еле-
70 н. дэлки довательно, D (С7) cz C7V для некоторого v. Но тогда для лю- бых z"EzD(U) И 7 и z' EE.V — D (U) существует такое U ЕЕ U2, что z'EE v =/= т]. Значит, по лемме 7 D (С7)р|7 изолировано в 7, что противоречит предположению, что U' вполне уточнено. Мы можем взять это и, существование которого только что доказано, в качестве у. 2. Не существует такого U UoU^iU ^2, что оно пересекается с wx и. wy и {х, y}(^Uv для любого v (из условий минимальности для х0 и для х). 3. Не существует такого UEzWi, U х^, что оно пересекается с ?£х и wy и {х, у}ф.Щ для любого v (в силу минимальности я0). 4. Если существует такое U EEUJ, U х0, что оно пе- ресекается с wxii и {х, у} ф то, как отмечено ъ конце доказательства предыдущего пункта, имеем, по существу, случай II. Определим т и z, как в предыдущих случаях. Пусть W = WJD (2, х0). Определим h следующим образом: a) w W: 1) z ЕЕ Ро: ^(w) = 0 для каждого I. 2) z^P0, z>{x0}: ^(w) = -^-. р \z) 3) z(£P0, Z>{xo}-. A{(w) == i=/=l, = z^Plt hl{w)=^, z^Pl. b) w e W: 1) Mw) = 2) МЪ • 1 Л • 1 A для I #=1, z=#=2. p(z) > T- A1 (w) h2 (w) w G D (2, Ж)) m 4- 1 m P(*o) w D (Ж1) m pW m 2 р(ж) w G D (x2) m E 2 р(ж) m p(x) w m p{y) m P(y) w e D (?/2) m p{y) m 4- 1 p(y)
ЭКВИВАЛЕНТНОСТЬ ИНФОРМАЦИОННЫХ СХЕМ 71 Пусть W* — [D (2, я0) (JZ) (я)] П D (у). Рассмотрим два случая. А. К (л) |W* - 0. Рассуждаем так же, как в случае ПА 1, 2 (1). В. K(^W*±0. Здесь имеем четыре случая в зависимости от выборов в U и 7, сведенных в матрицы: Я1(я) 7Г,(У) (U) \ 1 2 1 2/n 2wi 4“ 2 2 2m 4- 1 2m 4- 1 Я2(л) *2 (V) -i (U) 1 2 1 2/n 4~ 2 2m 4- 1 2 2m 2m + 1 Для любой пары выборов существует выбор одного из иг- роков, увеличивающий его выигрыш. ЛИТЕРАТУРА [1] Кг en tai W. D., McKinsey J. С. С., Quine W. V., A simplification of games in extensive form, Duke Math. Journal 18 (1951), 885—900. [2]Kuhn H. W., Extensive games, Proceedingswof the National Academy of Sciences USA, 36 (1950), 570—576. [3] Нэш Дж., Бескоалиционные игры, сб. «Матричные игры», Физматгиз, 1961, 205—221. [4] Von Neumann J., Morgenstern О., Theory of games and economic behavior, Princeton, 1944, 2nd ed. 1947. [5] S h a p 1 e у L. S., Information and the formal solution of many- moved games, Proc, of the Intern. Congress of Mathematicians, Cambridge, 1950 (American Math. Society 1, (1952), 574—575).
ОБ ИГРАХ С ПОЧТИ ПОЛНОЙ ИНФОРМАЦИЕЙ1) В. Дж. Берч Тринити-Колледж, Кембридж 1. Хорошо известно, что игра с полной информа- цией имеет ситуацию равновесия в чистых стратегиях; это впервые было доказано Цермело [9] для игр двух лиц, а затем распространено на игры п лиц Куном [3]. Позднее Дэлки [1], а также Оттер и Данн [8] опубликовали более сильный результат (теорема 6 ниже): Если в полном уточнении игры Г каждый игрок имеет полную информацию о каждом другом игроке, то Г имеет ситуацию равновесия в чистых стратегиях. Прежде всего нашей целью является построение теории разложения игр, с помощью которой мы смогли бы обоб- щить эту теорему; эта теория будет основана на теории разложения, построенной Куном [4] и использованной Дэлки для доказательства теоремы 6. Будем говорить, что игра является игрой с почти полной информацией для данного игрока i, если он имеет полную информацию о любом другом игроке, а любой другой игрок имеет полную информацию о нем. Мы докажем следующий результат (тео- рема 5 ниже): Пусть Г — произвольная игра и Г — ее полное уточнение. Тогда существует ситуация равнове- сия в Г, содержащая чистые стратегии для тех игроков, для которых в Г имеется почти полная информация. Теоре- ма 6 является частным случаем этой теоремы. Как мы увидим, теорема 5 относится не столько к отдель- ной игре, сколько к множеству всех игр с данной структу- х) В i г с Ь В. J., On games with almost complete information» Proc. Cambridge Philos. Soc. 51, Ks 2 (1955), 275—287.
ОБ ИГРАХ С ПОЧТИ ПОЛНОЙ ИНФОРМАЦИЕЙ 73 рой 7Г. При рассмотрении возможности усиления теоремы 5 естественно спросить: (А) Если даны произвольная игровая структура К и игрок f, для которого нет почти полной информации в пол- ном уточнении К структуры К, то всегда ли можно найти игру со структурой К, не имеющую ситуации равновесия с чистой стратегией для г? Ответ на этот вопрос мы даем в теореме 9, слегка огра- ничив рассматриваемый класс игр. Если рассмотреть теорему б^саму^по^себе, а не как част- ный случай теоремы 5, то возникает более простой вопрос: (В) Если дана произвольная игровая структура К, которая не удовлетворяет условиям теоремы 6, то всегда ли можно найти игру Г со структурой К, не имеющую си- туаций равновесия в чистых стратегиях? Дэлки [1] уже дал ответ на этот вопрос своей теоремой 8. Так как в рассматриваемой области существует очень ма- ло общепринятых терминов, необходимо дать полный набор определений и сводку основных результатов, которые нам потребуются. Это сделано в п. 2 на базе работ Куна [3, 4] и Дэлки [1] с некоторыми изменениями. В п. 3 строится теория разложения игр, и как ее след- ствие в п. 4 получается теорема 5. Построение теории разложения было начато Куном [3, 4] и продолжено Дэлки 11]; позже Оттер и Данн [8] и Гейл [2] опубликовали ре- зультаты, которые могут быть просто получены при помо- щи этой теории. Большинство наших определений экви- валентно определениям, данным Дэлки [1]. В п. 5 рассматривается теория разложения по отно- шению к стратегиям поведения; приводятся некоторые результаты Куна [4]. В п. 6 мы пытаемся ответить на наш вопрос (А). Тео- рема 9 в этом пункте является обратной по отношению к теореме 5. 2. Дерево игры Т есть дерево, начинающееся в отме- ченной вершине О. Концы ветвей называются окончатель- ными позициями (ip), а остальные вершины — промежуточ- ными позициями (х, уПромежуточные и оконча- тельные позиции г) образуют частично упорядоченное г) В дальнейшем, когда это не вызывает путаницы, те и дру- гие будут называться просто позициями. (Прим, ред.)
74 Б. ДЖ. БЕРЧ отношением предшествования множество, так что х у (я предшествует £/) означает, что существует путь в 7, веду- щий от О к у через х, и х =/= у. Таким образом, имеем О <4 х для всехх=1=0,и если w — окончательная позиция, то не существует таких z, что w z. Отрезки, выходящие из любой промежуточной пози- ции, называются альтернативами; число альтернатив в позиции х обозначается через ц (я), и мы при этом счита- ем, что альтернативы в х находятся во взаимно-одно- значном соответствии с числами 1,2,..., ц (х). Заметим, что ц (х) 2. Будем писать (х, v) <4 у, если х <2 у и путь от х к у проходит через альтернативу v позиции х. Если U и V — какие-нибудь два множества позиций, то полагаем U <^V, если существуют такие х ЕЕ U и Z EE К что х z. Если дано дерево игры 7, то получаем позиционную игру п лиц следующим образом. (1) Промежуточные позиции из Т разбиваются на п 4-1 множеств Ро, Р1? Рп- Множество Ро состоит из позиций случая, а каждое Pi (Z = 1,..., ri) — из личных позиций игрока I. (2) Каждое Р{ (г =1,..., п) разбивается на информа- ционные множества U, V,..., удовлетворяющие следующим двум условиям: а) все позиции в U имеют одно и то же число альтер- натив ц (U)\ b) U не предшествует самому себе. (3) В каждой позиции х ее Ро имеется вероятностное рас- пределение р (х, v) на ее альтернативах, которое приписы- вает каждой из альтернатив положительную вероят- ность. (4) Для каждой окончательной позиции w определя- ется вещественный лг-мерный вектор h (w) ,..hn (ш)}, называемый функцией выигрыша для w. Чистая стратегия лг игрока i указывает альтернативу в каждом его информационном множестве; таким образом, чистую стратегию можно считать функцией множества, сопоставляющей каждому информационному множеству U из Рг положительное целое число л/ (С7), 1 п1 (U) (U).
ОБ ИГРАХ С ПОЧТИ ПОЛНОЙ ИНФОРМАЦИЕЙ 75 При лг-наборе л чистых стратегий г) и данном р (х, v) на Pq различные окончательные позиции w будут осуще- ствляться с некоторыми вероятностями, которые мы обозна- чим через р (w, л); тогда ожидаемый выигрыш игрока i будет Нг (л) = 2 Р (w, л) кг (w). w Если даны позиция z и ситуация л, то будем поль- зоваться выражением: z возможно для л, в естественном смысле, т. е. если существует такая окончательная позиция ip, что z w и р (ip, л) 0. Оттер и Данн [8] ввели удоб- ное понятие — след л, понимая под этим множество всех позиций, возможных для л. Если даны z и личная стратегия лг, то говорят, что z возможно для лг, если существует такая ситуация л, имею- щая своей z-й компонентой лг, что z возможно для л; следом (лг) можно тогда называть множество всех позиций, возможных для лг. Множество В позиций называется возможным, если некоторое х EzB возможно; в противном случае В невоз- можно. Две чистые стратегии, лги о/, называются эквивалентны- ми, если они определяют одно и то же множество возмож- ных позиций и совпадают на этих позициях, т. е. если след (лг)=след (о/). Легко показать, что замена втратегии на эквивалентную ей стратегию не изменяет вероятности никакой окончательной позиции, и, следовательно, не изменяет ожидаемых выигрышей. Кун принял это свойство в качестве определения эквивалентности стратегий. Таким образом, нет надобности различать эквивалентные чистые стратегии; мы этого и не делаем, и в дальнейшем под чис- той стратегией будем подразумевать «класс эквивалентных чистых стратегий»; это также согласуется с интуицией. Если мы захотим подчеркнуть это переопределение страте- гий, то будем говорить о фактических чистых стратегиях. Смешанной стратегией игрока i называется вероят- ностное распределение на множестве его фактических чистых стратегий; если неэквивалентные чистые стратегии х) См. примечание *) на стр. 22.
76 Б. ДЖ. БЕРЧ игрока i перенумеровать от 1 до р (£), то g* можно пред- ставить как ? вектор с |3(0 компонентами > О, для 3(0 ’ которых 2 Ч 1 • .7=1 Если дана ситуация £ в смешанных стратегиях, то ожидаемый выигрыш игрока i в ней будет равен 3(1) • 3(П) = 3... S h=i 4=1 п п Если даны ситуация £ и смешанная стратегия то |||тр означает ситуацию, полученную из % заменой ее i-й компоненты на Теперь можно определить ситуацию равновесия. Си- туация g в смешанных стратегиях называется ситуацией равновесия, если Нг (£) > Нг (Цлг) для всех лг и для каж- дого игрока i. Иными словами, ситуация является ситуацией рав- новесия, если ни один игрок не может увеличить свой ожидаемый выигрыш путем изменения своей стратегии, при условии, что стратегии других игроков остаются неизменными. Понятие ситуаций равновесия введено Нэ- шем [5]. Основная теорема о ситуациях равновесия сле- дующая: Теорема 1. Любая игра имеет ситуацию равнове- сия в смешанных стратегиях, Нэшем же в [5] дано простое доказательство этой тео- ремы, опирающееся на теорему Брауэра о неподвижной точке. Пусть дана позиция х\ множество D (х), множество потомков х, есть множество таких позиций z, что х z. Аналогично определим D (х, v) как множество таких z, что (х, v) << z. Для любого U мы имеем D (U) = U D (х); если Z7—-информационноемножество,то/) = (J D(x,v). x&U Пусть даны две позиции хх и х2. Назовем точной нижней границей т.н.г. (а^, х^ последнюю позицию z, для которой z <^хъ z х2. Ясно, что либо z = х± << х2, либо z = х2 <Г хг, либо (z, vj х± и (z, v2) х2, где
ОБ ИГРАХ С ПОЧТИ ПОЛНОЙ ИНФОРМАЦИЕЙ 77 vr =/= v2. Для любого множества U определяем т.н.г.(£7) как последнюю позицию z, для которой z х при всех xEzU. Заметим, что для любого данного множества U в нем найдутся такие две позиции и х2, что т.н.г. (xx, х2) = — т.н.г. (£7). Будем говорить, что информационное множество У пере- крывает информационное множество £7, если U < V, но ни для какого v не выполняется V cz D (U, v). Игрок i имеет в игре полную информацию об игроке /, если ни одно информационное множество игрока i не пе- рекрывает никакого информационного множества игрока /. В частности, игрок i имеет полную память, если ни одно его информационное множество не перекрывает другого, т. е. если он имеет полную информацию о себе самом х). Игра называется игрой с полной информацией, если каж- дое информационное множество состоит из одной пози- ции; в этом случае никакие два информационных множе- ства не перекрываются; каждый игрок имеет полную па- мять и имеет полную информацию о любом другом игроке. Две игры, Г и Г', называются эквивалентными, если они совпадают во всем, кроме разве лишь разбиения мно- жеств Р личных позиций на информационные множества, и если можно установить взаимно-однозначное соответствие между фактическими чистыми стратегиями л в Г и фактическими чистыми стратегиями л' в Г', при котором р (w, л) — р (w', л') для любых w и л <-» л'. Оче- видно, если Г и Г эквивалентны, то ситуация равновесия в Г соответствует ситуации равновесия в Г', и если какой- то игрок имеет чистую стратегию в такой ситуации равно- весия в Г, то он имеет чистую стратегию также и в Г'. Наша ближайшая цель—дать, в теореме 2, условия экви- валентности двух игр. Пусть U — информационное множество игрока i в игре Г, а В — подмножество U. Говорят, что В изолировано в U, если для каждого лг, для которого В возможно, U \В невозможно. Дэлки показал, что В изолировано в U тогда и только тогда, когда для любых хЕЕВ, yEEU\B существует х) Игры с полной памятью рассматривал Кун [-4]. Его основной результат состоит в том, что если игрок имеет полную память, то его смешанные стратегии эквивалентны соответствующим страте- гиям поведения.
78 Б. ДЖ. БЕРЧ личное информационное множество V игрока f, при ко- тором х ЕЕ D (V, у), у ЕЕ D (У, ц) и у =/= ц. Пусть Г и Г' — две игры, которые отличаются только тем, что информационное множество U из Г разбито на два информационных множества V± и V2 (того же игрока) в Г'. Если V± и У2 изолированы в U, то говорят, что Г' есть непосредственное уточнение Г. Игра, не имеющая непосредственных уточнений, называется вполне уточненной} таким образом, игра вполне уточнена, если никакое информационное мно- жество не может быть разбито на изолированные подмно- жества. Справедлива Теорема 2. Для любой игры Г существует един- ственная эквивалентная ей вполне уточненная игра Г. Это, по существу, результат теорем 5 и 6 Дэлки [1]. Игра Г, которая называется полным уточнением Г, получается разбиением некоторых информационных мно- жеств из Г на несколько информационных множеств в Г. В частности, если игрок i имеет полную информацию об игроке у в Г, то это же справедливо и в Г; обратное неверно. Можно заметить, что в приведенных выше определе- ниях выигрыши в Г не играли существенной роли; это же справедливо для многих важнейших свойств позицион- ных игр, поэтому удобно иметь понятие, описывающее игру без ее функции выигрыша. Будем говорить, что две игры имеют одну и ту же структуру, если они отличаются только своими функциями выигрыша г). Нашим обычным обозначением игровой структуры будет К, 3. Пусть дана произвольная игран пусть множество В личных позиций удовлетворяет условиям: (1) Если информационное множество U пересекает В (JD (В), то оно содержится в B\}D (В). (2) ЕслиИ — личное информационное множество, пред- шествующее В, то В cz D (7, у) при некотором у. Будем говорить, что такое множество В образует базу подыгры} для краткости иногда будем просто говорить, что В есть база. Из (1) и (2) непосредственно получаем: (3) Никакие позиции в В не предшествуют друг другу. х) Термин «структура» используется здесь в несколько ином смысле, чем у Дэлки [1].
ОБ ИГРАХ С ПОЧТИ ПОЛНОЙ ИНФОРМАЦИЕЙ 79 (4) Для любых двух ПОЗИЦИЙ Х2 Ez В т.н.г. (х±, х2) есть позиция случая. Поэтому и т.н.г. (В) — позиция случая. (5) Для любой ситуации л в чистых стратегиях либо ни одна позиция в В не возможна, либо все позиции в В возможны и имеют определенные вероятности р (х, л). Отношения и т. д. не зависят от л, а зависят Р(^2, Л) лишь от вероятностных распределений на альтернативах в позициях случая. Если дана база В, то из (5) следует, что можно опре- делить условные вероятности р (х, В) позиций ХЕЕВ: ГФ, В) = - >1 Р (ж. я) х^В для тех стратегий л, для которых В возможно. Эти ус- ловные вероятности не зависят от л. Теперь можно определить подыгру Гв. Позициями Гв являютсясоответствующие позиции из B[)D (В) с добав- лением позиции случая Ов, которая предшествует всем остальным позициям. Выигрыши игроков в Гв те же, что и в Г; в В (В) сохраняются также личные информацион- ные множества и вероятностные распределения в позициях случая. Альтернативы в Ов приводят к различным пози- циям хЕЕВ с соответствующими вероятностями рп (х. В). Из каждой ситуации л в чистых стратегиях в Г, для которой В ВОЗМОЖНО, МОЖНО получить ситуацию Л в в чис- тых стратегиях в Гв, ограничивая л позициями из В \}D(B), и для любого лв можно определить ожидаемые выигрыши Нг (л в) в игре Г в. Если К — структура игры Г, то подыгра Гв, очевидно, соответствует подструктуреКв, и любая база В в К будет определять подструктуру Кв. Если даны структура А и подструктура Кв, то мы можем получить фактор-структуру К / Кв, удаляя из К все позиции множества D (В) и заменяя позиции из В на окончательные позиции. Будем говорить в этом случае, что Г разложена на компоненты Кв и К / Кв; используя очевидную алгебраическую аналогию, будем писать К = = КВ® (К/Кв).
80 Б. ДЖ. БЕРЧ Приведем теперь две леммы, необходимые для доказа- тельства теоремы 3. Будем обозначать через (Кв) множест- во позиций из Кв, т. е. (Кв) = B[)D (В). Для краткости будем обозначать через К} подструктуру с базой В±, и т. д. Лемма 1. Если Кг есть подструктура К, то мно- жество В2 будет базой в Кг тогда и только тогда, когда оно является базой в К и лежит в Доказательство. Легко проверить, что оба требования, предъявляемые к базе, выполняются. Лемма 2. Если Кг и К2 — различные подструктуры К, то либо (1) Кг есть подструктура К2, либо (2) К2 есть подструктура Кг, либо (3) (Kj) и (К2) суть непересекаю- щиеся множества, либо (4) существуют три непересекаю- щиеся подструктуры соответственно с множествами по- зиций (К^/(К2), (К2) /{Кх), (KJ П (К2). Доказательство. Пусть Вг — база А\, В2 — база К2. Ясно, что если х и у — такие две различные пози- ции в К, что х J D (х) и у J D(y) пересекаются, то либо х у, либо у <Z X. Предположим, что В± <С В2, так что существуют пози- ции хг В± и х2ЕЕВ2, для которых < х2. Пусть содер- жится в информационном множестве U. Тогда U пересекает и предшествует В2, так что (AJ id 5 J D (U) id D 2 (ЛГ2), и мы имеем случай (1). Если 51 id 52, то по лемме 1 имеем случай(1). Анало- гично, если В2 <С В± или В2 зэ 5Х, то получаем случай (2). Если 51, В2 не пересекаются и не предшествуют друг другу, то имеем случай (3). В последнем оставшемся случае 5Х \ 52, 52 \ 5Х, 51 П В2 являются непересекающимися непустыми мно- жествами, ни одно из которых не предшествует другому. Легко проверить выполнение условий (1) и (2), так что эти три множества будут базами некоторых подструктур. Множества позиций этих трех подструктур не пересе- каются, и мы имеем случай (4). Будем называть структуру К неразложимой, если не существует такой подструктуры Кв, что и Кв, иК/ Кв содержат по крайней мере по одной личной позиции. Теорема 3. Игровая структура К может быть полностью разложена на неразложимые компоненты; это разложение единственно и дает дерево из подструктур.
ОБ ИГРАХ С ПОЧТИ ПОЛНОЙ ИНФОРМАЦИЕЙ 81 Доказательство. Если структура К не является неразложимой, то ее можно разложить: К^КвО^К/Кв). Если теперь либо Кв, либо К / Кв разложимы, то про- должим процесс разложения, и так как К содержит лищь конечное число личных позиций, в конце концов полу- чим полное разложение. Если С — некоторая компонента К (С может быть, на- пример, подструктурой структуры К / Кв), то легко ви- деть, что позиции из C[)D (С) образуют подструктуру в К (обозначим ее через 7ГС), кроме того, С [) D (С) есть объединение некоторых компонент К. Следовательно, если С\, С2 — две различные неразложимые компонен- ты то по лемме 2 либо одна из КСг является под- структурой другой, либо (КС1) и (Кс2)—непересекающиеся множества; четвертая возможность исключается ввиду неразложимости С. Отсюда следует, что полное разложение К приводит к дереву из подструктур. Для доказательства единственности достаточно пока- зать, что две неразложимые компоненты Ci и С2в К, имею- щие общие позиции, должны совпадать. А это ясно из ска- занного выше, так как в этом случае одна из KCl, КСг есть подструктура другой. Два информационных множества, U и V, называются связанными, если существует такая последовательность информационных множеств U = VF0, И\,..., Wm = V, что для любого i =1,..., т одно из множеств Wif W^i перекрывает другое. Лемма 3. Игровая структура неразложима тогда и только тогда, когда любая пара информационных множеств связана. Мы не будем доказывать эту лемму, отсылая читателя к работе Дэлки [1]. Его лемма 15 показывает, что если игро- вая структура неразложима, то ее информационные мно- жества связаны. Обратное тривиально. Из этой леммы следует, что каждая компонента пол- ного разложения состоит из нескольких связанных инфор- мационных множеств; с этой точки зрения единственность разложения очевидна. 4. Пусть дана игра Г, подыгра Гв и произвольная си- туация в смешанных стратегиях в Гв.Определим фактор- игру Г / Гв (£в) следующим образом. Г / Гв (£в) имеет Позиционные игры
82 Б. ДЖ. БЕРЧ структуру К / Кв. Выигрыши в ней совпадают с выиг- рышами в Г для тех окончательных позиций, которые являются окончательными позициями в Г; для окончатель- ных позиций из В положим выигрыши равными матема- тическому ожиданию выигрышей в Гв в ситуации Если дана ситуация л, для которой В возможно, то бу- дем обозначать через лв ограничение л на Гв, а через лв ог- раничение л на позициях Г / Гв. Обозначаем через лв ограничение стратегии лг, для которой В возможно, на Гв ичерезлг2 ограничение лг на позициях Г / Гв, независимо от того, возможно В для лг или нет. Если В невозможно для лг, то ясно, что л^ совпадает с л\ Аналогичным образом обозначения £в, Vb , %в используем для смешанных стратегий. Теперь мы можем доказать следующую теорему. Теорема 4. Пусть Гв — подыгра Г, и пусть £ — ситуация в смешанных стратегиях. (а) Если В возможно для то | — ситуация равновесия в Г тогда и только тогда, когда %в и О суть соответст- венно ситуации равновесия в Гв и в Г / Гв(£в)« (Ь) Если В невозможно для компоненты ситуации но В возможно для & при всех j =f= i, то % — ситуация равновесия в Г тогда и только тогда, когда существует та- кая ситуация Цв в смешанных стратегиях в Гв, что 1) цв совпадает с %в для всех j =f= i; 2) Цв — оптимальная стратегия для игрока i в Гв, когда остальные игроки используют стратегии изч}в, т. е. Нг (Цв) > Нг (цв || *в) для всех лгв, 3) £в — ситуация равновесия в Г / ГБ (цБ)« (с) Если В невозможно для двух или более компонент си- туации £, то £ — ситуация равновесия в Г тогда и только тогда, когда О — ситуация равновесия в Г / ГБ (Цв), где Цв — некоторая ситуация в смешанных страте- гиях в Гр. Доказательство. Достаточно доказать (а); доказательство (Ь) аналогично, а доказательство (с) три- виально.
ОБ ИГРАХ С ПОЧТИ ПОЛНОЙ ИНФОРМАЦИЕЙ 83 Предположим противнее: | не является ситуацией равновесия в Г, в то время как £в и £в — ситуации равнове- сия соответственно в Гвиь Г / Гв (£в). Тогда для некото- рого i существует такое л/, что Нг (£ || лг) Нг (£). Но £в — ситуация равновесия в Гв; поэтому Нг (£в|| лв) И1 (£в). Отсюда следует, что выигрыши игрока i в игре Г / Гв (£в || лв) не больше, чем выгрыши в Г / Гв (£в). Значит, из Нг (Цлг) Нг (g) следует Это противоречит предположению, что £в — ситуация равновесия в Г / Гв (|в). Для доказательства обратного утверждения предполо- жим, что £в не является ситуацией равновесия вГв; тогда для некоторого i существует такое лв, что Пг (Нв||лв) > Н1 (£в). Так как В возможно для £, из этого следует, что Нг (£ || лв) Нг(%) для самой игры Г, т. е. не есть ситуация равновесия в Г. Точно так же получаем, что если £в — не ситуация равновесия в Г / Гв (£в), то £ — не ситу- ация равновесия в Г. Теорему 4 немедленно можно распространить на игры, имеющие более одной подыгры. Объединяя теоремы 3 и 4, получим следующий простой процесс нахождения и опи- сания ситуаций равновесия в позиционной игре Г. Разла- гаем Г полностью, как это указано в теореме 3; получаем в результате дерево подструктур. Находим сначала ситуа- ции равновесия во всех концевых вершинах этого дерева. Затем, по теореме 4, мы можем спускаться по ветвям дерева, находя последовательно ситуации равновесия для всех подыгр. Закончив этот процесс, мы тем самым построим ситуацию равновесия для самой игры. Этот алгоритм не дает всех ситуаций равновесия, даже если считать эквивалентными ситуации равновесия, отли- чающиеся только на несущественных позициях; действи- тельно, другие ситуации равновесия могут быть получены несколько искусственно из случая (Ь) теоремы 4. Теперь можно доказать, как простое следствие теорем 2, 3 и 4, основные результаты, упомянутые во введении. Теорема 5. Пусть Г — игра, а Г — ее полное уточнение. Пусть S — множество игроков, для которых Г имеет почти полную информацию. Тогда в Г существует 6*
84 Б. ДЖ. БЕРЧ ситуация равновесия, содержащая чистые стратегии для всех игроков из S. Доказательство. По теореме 2 достаточно до- казать, что Г имеет ситуацию равновесия, в которой игро- ки из S имеют чистые стратегии. В игре Г из условий полной информации следует, что ни одно информационное множество любого игрока из S не перекрывается и не перекрывает никакого информационно- го множества других игроков; значит,ни одно информацион- ное множество любого игрока из5не связано ни с каким ин- формационным множеством других игроков. Разложим Г полностью, как указано в теореме 3; каждая компонента, содержащая позиции любого игрока из S, будет состоять только из его позиций и позиций случая. Следовательно, когда мы построим ситуацию равнове- сия указанным выше способом, то получим, что игроки из 5 имеют в ней чистые стратегии, так как их позиции будут образовывать игры одного игрока. Следствием теоремы 5 является теорема 6. Теорема 6. Если в полном уточнении игры Г каждый игрок имеет полную информацию о любом дру- гом игроке, то Г имеет ситуацию равновесия в чистых стра- тегиях. Ситуации равновесия можно строить так, чтобы они удовлетворяли и каким-нибудь другим требованиям, особенно если рассматриваемая игра имеет полную инфор- мацию; например, можно легко получить теорему, сфор- мулированную Гейлом [2]. 5. Теорию разложения можно применять к стратегиям поведения с неменьшим успехом, чем к обычным смешан- ным стратегиям. Мы дадим краткое описание соответ- ствующей теории, не вдаваясь в детали х). Стратегия поведения* 2) |Зг определяет вероятностное распределение на альтернативах каждого возможного для Р* информационного множества игрока i. т) Основные свойства стратегий поведения подробно изучены Куном [4]. 2) Под стратегией поведения понимается фактическая стра- тегия поведения. (Прим, перев.) •
ОБ ИГРАХ С ПОЧТИ ПОЛНОЙ ИНФОРМАЦИЕЙ 85 Если предполагать, что выборы в различных информа- ционных множествах делаются независимо, так что можно принять правило умножения составляющих вероятностей, то стратегия поведения определяет вероятностное распре- деление на множестве всех фактических чистых страте- гий; таким образом, каждой стратегии поведения соот- ветствует смешанная стратегия. Обратно, смешанная стратегия всегда определяет вероятностное распределение на альтернативах каждого существенного информационного множества, так что каждой смешанной стратегии соответ- ствует стратегия поведения; но, конечно, эта стратегия поведения может определять совсем другое вероятностное распределение на множестве чистых стратегий. Будем говорить, что смешанная стратегия соответ- ствует стратегии поведения, если обе они определяют одинаковое вероятностное распределение на множестве фактических чистых стратегий. Две смешанные стратегии игрока эквивалентны, если, какие бы стратегии ни использовали остальные игроки, обе они дают одинаковые вероятности для каждой оконча- тельной позиции. Смешанная стратегия |г эквивалентна стратегии поведения если £г эквивалентна смешанной стратегии, соответствующей Р*. В теореме об играх с полной памятью Кун дает необ- ходимые и достаточные условия для того, чтобы все сме- шанные стратегии были эквивалентны стратегиям поведе- ния. Используя рассуждения Куна, можно Доказать сле- дующую теорему. Теорема 7. Пусть дана игровая структура К. Для того чтобы каждая смешанная стратегия игрока i была эквивалентна некоторой стратегии поведения, необхо- димо и достаточно, чтобы игрок 1имел в К полную память. Процесс уточнения Дэлки не может быть использо- ван при изучении стратегий поведения. Однако понятие подыгры в этом случае не теряет силы; в частности, оста- ется справедливой теорема 3. Важное свойство подыгр дается также следующей теоремой. Теорема 8. Для того чтобы каждая игра со струк- турой К имела ситуацию равновесия в стратегиях пове- дения, необходимо и достаточно, чтобы это имело ме- сто для каждой компоненты в полном разложении К.
86 Б. ДЖ. БЕРЧ Достаточность получается из теоремы 3 с помо щыо обычных рассуждений. Необходимость почти три- виальна. Из теоремы 5 следует, что всякая игра, полное уточ- нение которой имеет полную информацию, обладает ситуа- цией равновесия в чистых стратегиях. В теореме 7 полу- чен аналогичный результат для игр с полной памятью. Далее, применяя теоремы 5 и 7 к компонентам К. упо- мянутым в теореме 8, можно получить широкий класс игр, имеющих ситуацию равновесия в стратегиях пове- дения. 6. Переходим, наконец, к изучению вопроса о том, является ли требование полной информации в условии тео- ремы 5 необходимым для того, чтобы все игры с вполне уточненной структурой К были вполне определенными г) для игрока i. Это является непосредственным обобщением второй части теоремы 8 Дэлки. Чтобы ответить на этот вопрос, мы покажем, как из произвольной вполне уточненной игровой структуры К, в которой нарушено условие полной информации, по- строить соответствующую «простую» структуру Ks стан- дартной формы; должна обладать тем свойством, что любая игра со структурой KSl не являющаяся вполне опре- деленной для игрока i, приводит к игре со структурой К, которая также не будет вполне определенной для игрока i. Затем мы определим выигрыши на Ks так, чтобы получить игру Гз, которая не является вполне определенной для игрока Z; тогда соответствующая игра Г со структурой К также не будет вполне определенной для i. Если бы это рассуждение удалось провести, мы полу- чили бы положительный ответ на вопрос, поставленный в начале этого пункта. К сожалению, автор не смог исследо- вать «простую» структуру Ks во всей общности, и поэтому Ч Мы употребляем фразу «Г вполне определена для игрока i» в том же смысле, что и Дэлки; это просто означает, что существует ситуация равновесия в Г, в которой игрок i имеет чистую стратегию. Если игра Г не является вполне определенной для игрока Z, то он должен иметь смешанную стратегию в любой ситуации равновесия в Г. (У Дэлки вводится понятие «существенной определенности*, ко- торое несколько от этого отличается; см. настоящий сборник. Прим, перев.)
ОБ ИГРАХ С ПОЧТИ ПОЛНОЙ ИНФОРМАЦИЕЙ 87 сделано упрощение, состоящее в том, что рассматриваются только игры, удовлетворяющие следующему условию: ни для каких двух информационных множеств U и V не- возможно, чтобы одновременно U предшествовало V и V предшествовало U. Заслуживает внимания тот факт, что все игры класса, определенного Куном в его более ранней работе [3], удов- летворяют этому условию. Кун сначала вводил «порядок во времени» на позициях и информационных множествах, который, как оказалось в дальнейшем, не является необ- ходимым. Прежде чем проводить рассуждения, план которых мы только что описали, приведем четыре примера игр, которые не являются вполне определенными для любого из игро- ков. Примеры 1 и 3 представляют собой игры двух игроков L и М, примеры 2 и 4 — игры трех игроков L, М и N. Во всех случаях каждый игрок имеет единственное информа- ционное множество, обведенное пунктирной линией; в при- мере 3 первая позиция есть позиция случая, в которой две альтернативы выбираются с равными вероятностями. Для каждой окончательной позиции выигрыши предоставлены у конца соответствующей ветви (см. рисунок на стр. 88.). Легко убедиться, что каждая из этих игр имеет един- ственную ситуацию равновесия, в которой ни один из игро- ков не имеет чистой стратегии.Действительно,в каждом слу- чае единственной ситуацией равновесия будет ситуация, в которой каждый игрок выбирает свои две альтернативы с равными вероятностями. Теперь предположим, что К — вполне уточненная игровая структура, *удовлетворяющая нашему дополни- тельному условию, и некоторое информационное множе- ство U игрока 1 перекрывает какое-то информационное множество V игрока 2; таким образом, условие полной информации не выполняется в К ни для игрока 1, ни для игрока 2. Существуют такие позиции xv х2 ее U, что (У, v) < хг, a x2z£D(y, v). Положим т.н.г.^, х^) — z. Можно предполагать, что хи х2 выбраны так, что не существует информационного множества W игрока 1, которое пред- шествует и х2 по различным альтернативам, так как
88 Б. ДЖ. БЕРЧ иначе множества UftD (7, v) и U\D (V, v) были бы изолированы в U и К не было бы вполне уточненным. Пусть R — множество всех таких позиций у, что О <^у xiили О <С у х2. Пусть промежуточная позиция t R; можно сделать t неэффективной, положив выигры- ши h (w) одинаковыми для всех окончательных позиций Затем можно образовать игровую структуруК2, исключая все позиции, не принадлежащие R, и заменяя те из них, которые непосредственно следуют за позициями из /?, на окончательные; если все игры со структурой К вполне определены для любого данного игрока, то то же самое верно и для К2. Пусть t — такая позиция в К2, что О t 2=т.н.г. = х2), и пусть zEzD(t, v). Если t — личная позиция игрока г, то определим функции выигрыша так, чтобы в этой позиции сделать очевидно невыгодным для i выбор любой альтернативы, отличной от v; если t — позиция случая, положим 1гг (w) =0 для всех окончательных по-
ОБ ИГРАХ С ПОЧТИ ПОЛНОЙ ИНФОРМАЦИЕЙ 89 зиций ip, следующих за t по альтернативе, отличной от v. Теперь можно исключить все позиции tEzK2, которые пред- шествуют z; тогда получаем структуру К3. Если t есть позиция из К3, то либо либо еслц все игры со структурой К2 вполне определены для некоторого данного игрока, то то же верно и для всех игр со струк- турой К3. Заменим К3 ее полным уточнением К±. В силу выбо- ра х^ х2 не существует такого информационного множе- ства W игрока 1, что (W, vx) < xlf (РИ, v2) < х2, следовательно, в и хг и х2 принадлежат одному и тому же информационному множеству U. В любом информационном множестве из К± можно всег- да сделать выбор альтернативы, не ведущей ни в хъ ни в х2, очевидно невыгодным. Таким способом мы исключим все информационные множества из кроме (1) позиции z, информационного множества U и, может быть, информа- ционного множества У, и (2) любого информационного множества, которое предшествует и хг и х2, но по раз- личным альтернативам. Кроме того, мы можем изба- виться от всех позиций случая, кроме, может быть, z, и от всех, кроме двух, альтернатив игрока 1 в £7. Таким образом, получаем «простую» структуру имеющую следующие позиции: (а) позицию z, которая предшествует всем другим позициям в Kg*, (Ь) позиции и х2, лежащие в одном информационном множестве U игрока 1; (с) позицию z/x, принадлежащую* игроку 2 и такую, что vj, и, возможно, еще такую позицию у2 в том же самом информационном множестве (обозна- чим его через V'1)), что x2^D (i/2, v2) и vr=£= v2; и (d) информационные множества W\ каждое из которых сос- тоит из двух позиций, обозначаемых через и t2, В каж- дом случае имеем хг^ D(t{, vj), х2е D (tj2l v2), Vi=f=vJ2. Никакие два из этих информационных множеств не при- надлежат одному и тому же игроку, и ни одно из них не принадлежит игрокам 1 или 2. (Это следует из того, что структура вполне уточнена.) В каждой позиции из Ks имеется не более двух альтернатив. Если z — позиция *) Заметим, что V' не обязательно будет тем информационным множеством в которое соответствует множеству V в К,
90 Б. ДЖ. БЕРЧ случая, то можно считать, что обе альтернативы (назовем их А-i, А2) появляются с равными вероятностями; в самом деле, если эти вероятности равны (а, 1 — а), то мож- но умножить выигрыши в D(z, Ах) и/)(г, А2) на 2а и 2 (1 — а) соответственно и заменить вероятности на ; ожидае- мые выигрыши при этом не изменятся. По дополнитель- ному условию, первоначально наложенному на К, инфор- мационные множества W\ U, V' следуют друг за другом по двум ветвям z -> и z -> х2 в одинаковом порядке. Мы построили структуру К$ в стандартной форме. Покажем теперь, что для любой стандартной структуры Ks, в которой игрок 1 имеет неполную информацию об игро- ке 2, можно задать выигрыши так, чтобы получить игру, не являющуюся вполне определенной для игрока 1, и можно задать выигрыши так, чтобы получить игру, не являющуюся вполне определенной для игрока 2. Отсюда будет следовать требуемый результат для произвольной вполне уточненной структуры К. Различаем два основных случая. Случай 1А. Множество V' состоит из двух позиций, одна из которых принадлежит ветви z -* х±, другая — ветви z -> х2. В этом случае можно не отличать V' от набо- ра множеств W^; докажем, что можно приписать этой струк- туре выигрыши так, что полученная игра будет иметь единственную ситуацию равновесия, причем никакой из рассматриваемых игроков не будет иметь в ней чистой стратегии. Перенумеруем множества Z7, V', W1 так, чтобы Wm < И7™"1 <С ... < W2 W1 =U. Тогда Ks — игровая структура с т игроками. Перенумеруем позиции так, чтобы t\ ~ t\ — х2 и т. д., т. е. 4, ^2 будут позициями в W* и tf1 следует за fr по альтернативе vr, г = 1, 2. Пере- именуем игроков так, чтобы РР принадлежало игроку I; заметим, что тп > 2. Если z — позиция случая, то его две альтернативы по- являются с равными вероятностями; положим hz (и) = 0 (для всех I) для^ЕЕ D (£™, vj и для weD ($\ vj; игра не изменится, если мы уничт жим z> объединив t™ и t™
ОБ ИГРАХ С ПОЧТИ ПОЛНОЙ ИНФОРМАЦИЕЙ 91 в tm и разделив пополам выигрыши для D vj и D (^, v2). Если т 3, рассмотрим позиции tm, как образующие игру двух лиц; если задать выигрыши, как в примере 1, то в этой игре существует единственная ситуа- ция равновесия, в которой оба игрока т и т — 1 выбира- ют две свои возможные стратегии с равными вероятностя- ми. Поэтому в любой ситуации равновесия позиции £™~2 будут встречаться с равными вероятностями; что ка- сается игроков 1,...? т — 2, то три позиции tm, t™"1, могут быть заменены единственной позицией случая z; тогда, как и выше, мы можем исключить z и объединить £™~2 , в *т~2 г)« Таким образом, если т 3, то мы можем отбрасывать последовательно по два игрока, и при этом каждый из них будет иметь в любой ситуации равновесия смешан- ную стратегию; остается рассмотреть случаи т = 2 и т = 3. Но случай т = 2 — это пример 1, а т = 3 — пример 2. Случай IB. V' состоит из одной позиции z. Этот случай тривиально сводится к случаю 1А. Случай 2. V' состоит из единственной позиции у такой, что z У <С А. Если не существует информационных множеств W\ то имеем пример 3 или 4 в зависимости^ от того, яв- ляется ли z позицией случая или личной позицией; при заданных выигрышах каждый из рассматриваемых игроков имеет в ситуации равновесия смешанную стра- тегию. В. Если имеются какие-нибудь информационные мно- жества W\ то легко определить выигрыши так, чтобы все игроки в Ks. кроме игрока 2, имели смешанные стратегии в единственной ситуации равновесия, так как мы можем просто сделать выбор v2 невыгодным для игрока 2, затем исключить позицию у и действовать дальше с Ks, как в случае 1. г) Это является обращением схемы, упомянутой у фон Нейма- на и Моргенштерна [7], §§ 18.6.2.-18.7.1.
92 Б. ДЖ. БЕРЧ Таким образом, остается доказать существование таких функций выигрыша, при которых игрок 2 имеет смешан- ную стратегию в любой ситуации равновесия. Так же, как в случае 1, мы можем разбить на пары информационные множества W, для которых <Су, и также можем сделать, чтобы ябыло единствен- ной позицией в Ks, предшествующей у; далее, если суще- ствуют такие множества Ж, что у W Z7, то обозна- чим через W0 первое из них. Перепишем выигрыши так, чтобы выборы для всех позиций в D (И70) были несущест- венными; эти позиции можно затем исключить. Мы при- ходим к структуре либо примера 3, либо примера 4, и, следовательно, можно задать выигрыши так, что игра не будет вполне определенной для игрока 2. Это завершает доказательство. Сформулируем резуль- тат в виде теоремы. Теорема 9. Пусть К — вполне уточненная игро- вая структура, информационные множества которой удов- летворяют требованию, что если U предшествует V, то V не предшествует U. Тогда, если любая игра со струк- турой К вполне определена для игрока i, то для него дол- жно выполняться условие полной информации. Ограничение, при котором мы доказали эту теорему, может быть значительно ослаблено с помощью небольших изменений в рассуждениях. Например, можно легко дока- зать теорему без ограничения для игр трех игроков; можно также доказать результаты, подобные резуль- татам Дэлки, если не указывать, какой именно игрок должен иметь в ситуации равновесия смешанную стра- тегию. Автор признателен X. П. Ф. Свиннертону-Дайеру за большую помощь при подготовке этой статьи. ЛИТЕРАТУРА [1] Дэлки Н., Эквивалентность информационных схем и суще- ственно определенные игры, см. настоящий сборник, стр. 41—71. [2] Gale D., A theory of n-person games with perfect information, Proc. Nat. Acad. Sci. USA 39 (1953), 496—501. [3] Kuhn H. W., Extensive games, Proc. Nat. Acad. Sci. USA 36 (1950), 570—576.
ОБ ИГРАХ G ПОЧТИ ПОЛНОЙ ИНФОРМАЦИЕЙ 93 [4] Кун Г. У., Позиционные игры и проблема информации, см. настоящий сборник, стр. 13—40. [5] N a s h J. F., Equilibrium points in n-person games, Proc. Nat. Acad. Sci. USA 36 (1950), 48—49. [6] N a s h J. F., Non-cooperative games, Ann. Math. Princeton 54 (1951), 286—295. [7] Von Neumann J., Morgenstern 0., Theory of games and economic behavior, Princeton, 1947. [8] Otter R., Dunne J., Games with equilibrium-points, Proc. Nat. Acad. Sci. USA 39 (1953), 310—314. [9] Ц ер мело Э., Об одном применении теории множеств к теории шахматной игры, сб. «Матричные игры», Физматгиз, 1961.
РЕДУЦИРОВАННЫЕ СТРАТЕГИИ В ПОЗИЦИОННЫХ ИГРАХ Н. Н. Воробьев Ленинградское отделение Центрального экономико-математического института Чистой стратегией игрока в позиционной игре является функция, определенная на семействе всех информацион- ных множеств этого игрока, значениями которой могут быть любые альтернативы соответствующих информацион- ных множеств. Поэтому общее число чистых стратегий игрока равно произведению чисел альтернатив в каждом из его информационных множеств. С увеличением числа информационных множеств игрока число его чистых стра- тегий, таким образом, сильно возрастает. При этом смешанные стратегии игрока, которые являются ве- роятностными мерами на множестве его чистых стра- тегий, приходится задавать весьма большим числом пара- метров. Однако сама структурность стратегий, предопределяю- щая большое их число, нередко позволяет дать более простое обозрение смешанным стратегиям и тем самым уменьшить количество параметров, которые их опреде- ляют. Говоря точнее, особенности расположения информа- ционных множеств игрока на дереве игры можно исполь- зовать для выделения такого множества смешанных стратегий, что каждый класс эквивалентных друг другу смешанных стратегий будет иметь в этом множестве своего представителя. Известны два типа теорем, обосновываю- щих такую возможность. Одни теоремы не предъявляют для своей применимо- сти каких-либо требований к памяти игрока. В других,
РЕДУЦИРОВАННЫЕ СТРАТЕГИИ 95 напротив, память игрока должна удовлетворять тем или иным условиям. Универсальность теорем первого типа достигается за счет снижения эффективности: для более узкого класса игр, вообще говоря, удается доказывать более сильные утверждения. Примерами теорем первого типа являются теоремы Томпсона [1] о сигнальных стратегиях и автора [2] о рас- члененных стратегиях. К теоремам второго типа относится известная теорема Куна [3] о стратегиях поведения, при- менимая лишь в тех случаях, когда игрок имеет полную память. Условие полной памяти игрока, а также его раз- личные ослабления удобно описывать при помощи введен- ного Томпсоном понятия «агента». Сущность такого описа- ния состоит в следующем. Сопоставим каждому информационному множеству игрока «агента» и будем рассматривать игрока как состоя- щую из этих агентов команду. Альтернативы информа- ционного множества понимаются при этом как поведения агента (здесь термин «стратегия» неуместен, потому что агент не является игроком, т. е. участником игры, имею- щим самостоятельные интересы). Тогда наличие у игрока полной памяти означает, что. каждый агент знает о каж- дом другом агенте, действовал ли тот уже в ходе игры или нет, и если действовал, то как именно. Более слабым свойством памяти, чем полнота, явля- ется ее упорядоченность. Игрок обладает упорядочиваю- щей памятью, если каждый его агент знает относитель- но каждого другого агента лишь о факте его действия, но о выбранном этим агентом поведении может и не знать. Настоящая статья посвящена рассмотрению так назы- ваемых редуцированных стратегий, в которых условные вероятности действий агента зависят лишь от действий тех его контрагентов, деятельность которых известна ему не вполне. Оказывается, что каждая смешанная стратегия игрока с упорядочивающей памятью эквивалентна некоторой его редуцированной стратегии. Этот результат был без доказательства приведен в за- метке автора [4].
96 Н. Н. ВОРОБЬЕВ § 1. Основные определения Чтобы сделать чтение этой статьи независимым от других работ, приведем определения основных понятий. Древовидно упорядоченным множеством (короче, деревом) называется конечное множество К, частично упорядочен- ное отношением <^, в котором: а) каковы бы ни были X, Y,ZeeK,h3 X <^Z и У < Z следует либо X У, либо Y X (условие упорядочения сверху); б) существует такое О ЕЕ. К, что 0^ X для лю- бого х е к. Элементы древовидно упорядоченного множества называются позициями. Древовидно упорядоченные множества удобно изобра- жать в виде одномерных комплексов, вершинами которых являются позиции, а ребра соединяют позиции, непосред- ственно следующие друг за другом. Ребра, соединяющие некоторую позицию с непосредственно следующими за ней, называются альтернативами этой позиции. В теории позиционных игр рассматриваются такие деревья, в кото- рых альтернативы каждой позиции перенумерованы нату- ральными числами (скажем, по часовой стрелке). Очевидно, для любой позиции X каждый из трех объектов: позиция У, непосредственно следующая за X, альтернатива, сое- диняющая X и У, и номер этой альтернативы — одно- значно определяет два остальных. Поэтому можно, не опа- саясь недоразумений, эти три объекта отождествить. Про- извольная альтернатива, следующая за позицией X, иног- да обозначается через vx- Если X У, то альтернативу X, направленную к У, обозначают через vj. Множество всех позиций, следующих за позицией X, обозначается через D (X). Множество всех позиций, сле- дующих за X в направлении альтернативы обознача- ется через D (X, v^). Если U — некоторое множество позиций, обладающих альтернативами с одним и тем же номером v, то совокуп- ность этих альтернатив называется альтернативой U и обозначается через Уу. Положим D(U)== \)D(X), D(U.vu)^ U£>(X,vx). XeCU . X&J
РЕДУЦИРОВАННЫЕ СТРАТЕГИИ 97 Позиция, непосредственно предшествующая X, обо- значается через / (X), а множество непосредственно сле- дующих за X позиций —- соответственно через f-1 (X). Позиции, не имеющие последующих, называются окон- чательными. Множество окончательных позиций обозна- чается через X*. Если U, V cz К, то U V означает, что существуют такие X ЕЕ U и У Е F, что X Y. Множество всех позиций Y, для которых Y X, обо- значается через ф (X); ф (X) \ X обозначается через Г (X). Игроки обозначаются номерами 1, 2,..., п. Случай счи- тается нулевым игроком. Множество позиций, в которых очередь хода принадле- жит игроку i, называется множеством очередности и обо- значается через Ц. Для любой позиции X полагаем ф(Х)ПА = ФЦХ), Г(Х) ПЛ = Ф?(Х). Каждое из множеств очередности разбивается на попарно непересекающиеся информационные множества. Пусть U и V — два информационных множества. Гово- рят, что U перекрывает V, если V U и не существует такой альтернативы vv информационного множества V, что U cz. D (V, vy). Семейство всех информационных множеств игрока i обозначается через Ui. Принимается, что каждое множе- ство из Uo состоит только из одной позиции. Семейство всех информационных множеств игроков, со- держащих по одной позиции из ф (X) каждое, обозна- чается через С (X). Естественно определяются семейства £* (Х),С{ (Х)иСГ (X). Будем говорить, что задана позиционная структура С. если заданы: а) дерево позиций X; б) разбиение множества К \ Х*на множества очеред- ности /0, /х,..., 7П; в) вероятностные распределения Р (X, v) на множест- вах альтернатив каждой позиции X из Ц; г) разбиение К \ X* на информационные множества. 7 Позиционные игры
98 Н. Н. ВОРОБЬЕВ Далее позиционную структуру мы будем называть просто структурой. Процесс игры со структурой С можно определить индук- тивно следующим образом. Первый шаг (ход) в игре со структурой С состоит в вы- боре начальной позиции О, Пусть к ходов уже произве- дены, в результате чего была получена позиция X. Если X ЕЕ К*, то процесс считается законченным. Если X ЕЕ 70, то в результате (к + 1)-го хода происходит переход из позиции X в позицию Y ЕЕ f'1 (X) с определенной при зада- нии структуры вероятностью Р (X, v^). Если же X ЕЕ Ц и i =£= 0, то игрок I выбирает произвольно одну из позиций среди альтернатив X. Стратегией (точнее, чистой стратегией) игрока i в игре со структурой С называется функция л$, определен- ная на Uj, значениями щ (U) (U ЕЕ которой явля- ются альтернативы информационных множеств. Множество всех стратегий игрока i обозначается че- рез Пр Всякая система вида (л1,..., лп), где л1 ЕЕ Пр i = 1,..., п, называется, как обычно, ситуацией (в чистых стратегиях) игры со структурой С, Множество всех ситуаций обозна- чается через П. Рассмотрим некоторую ситуацию л — (лх,..., лп) струк- туры С и положим для любого Z ЕЕ К \ К* и всякой альтер- нативы v в этой позиции л (Z, v) = P(Z, v), 1, О если ZEzIq, если Z ЕЕ £7 ЕЕ 1Ц и л$ (U) — v, во всех остальных случаях. Ситуация л определяет, таким образом, некоторое слу7 чайное блуждание на дереве К, Всякая позиция X при этом получает некоторую вероятность л [X] своего появ- ления. Очевидно, л[Х] = П jt(F,vy) = Y<=W(X) = П P(Y,vy) п П л(У, Vy). 1=1
РЕДУЦИРОВАННЫЕ СТРАТЕГИИ 99 Произведение п n(y,vf) (1) Уеф-(Х) зависит не от самой ситуации л, а от входящей в ее состав стратегии л$ игрока I. Обозначим поэтому его через щ [X]. Если л$ [X] =/= 0, то позиция X называется возможной в условиях стратегии л4. Это обозначается как Хе Poss л{. Если X е U еХЦ и X е Poss ло то полагаем по определе- нию U е Rel Смешанной стратегией игрока i называется вероят- ностная мера рц на множестве его чистых стратегий П$. Если Т cz. Пй то вероятность появления некоторой чистой стратегии игрока i из Т обозначается через р< [Т]. В ча- стности, вероятность самой чистой стратегии л$ обозна- чается через р,$ [л{]. Всякая система смешанных стратегий р = (pn ...,рп) называется ситуацией в смешанных стратегиях. Ситуа- цию р в смешанных стратегиях можно рассматривать как рандомизированное случайное блуждание на дереве пози- ций К, т. е. как такое явление, в котором случайное блуж- дание л реализуется с вероятностью р[л] = Pi[лх]... рп[Лп]. (2) Поэтому можно говорить о вероятностях любой из пози- ций в условиях ситуации р: р[Х] == S яЕП Учитывая обозначение для (1), мы можем написать [Х[Х]= П P(Y, vf)fi S (3) Положим S Л{[Х] = Pi[X], (4) Мы видим, что в условиях каждой смешанной страте- гии любую позицию можно рассматривать как случайное 7*
100 Н. Н. ВОРОБЬЕВ событие. Полагая для R cz К П Л, я.еп. Л’ей мы интерпретируем как случайное событие любое множе- ство позиций (подчеркнем, что стратегия отнюдь не явля- ется мерой на множестве позиций). Пусть теперь R — некоторое множество позиций, Т— произвольное множество стратегий игрока i. Тогда совме- щение R П Т также оказывается в условиях смешанной стратегии случайным событием и М* л Л = S Смешанные стратегии рц и Uj игрока i называются экви- валентными, если для любой позиции X ЕЕ К |л:[Х] = |г"[Х]. (5) Нетрудно проверить, что для эквивалентности смешан- ных стратегий рц и рц необходимо и достаточно, чтобы равенство (5) выполнялось лишь для окончательных пози- ций из К. Будем говорить, что задана позиционная игра Г, если заданы: а) структура игры С; б) принимающие вещественные значения функции Лп... Лп, определенные на множестве всех окончательных позиций К* дерева структуры С. Так как каждая окончательная позиция W является в условиях любой ситуации как в чистых, так и в смешанных стратегиях (понимаемой как случайное блуждание) слу- чайным событием, выигрыш h^w) каждого из игроков ока- зывается случайной величиной. Ее математическое ожи- дание называется выигрышем игрока i в ситуации |1, а функция, сопоставляющая каждой ситуации р выигрыш игрока i в
РЕДУЦИРОВАННЫЕ СТРАТЕГИИ 101 этой ситуации, называется функцией выигрыша и обозна- чается через ЕЦ. Ввиду (6), (3) и (4) ЗД) = s h^W) П о Поэтому, если и — две эквивалентные стратегии игрока г, то fli (NI р4) = (и II Hi) (здесь двойная вертикальная черта означает операцию за- мены в ситуации ц имеющейся в ней стратегии игрока i на pi и соответственно на |щ). Поскольку при современном состоянии теории игр рассматриваются только средние выигрыши, все эквивалентные стратегии можно считать для игрока равноценными. § 2. Предварительные теоремы 1. Пусть 23czUi и ЛгЕЕЩ. Положим Хе Poss если для любого У ЕЕ ® П Ол(Х) имеет место л (7) = v у. Пусть снова SB cz 1Ц. Семейство всех информационных множеств из Ub перекрываемых U, обозначим через £5 (£7). Разность 1Ц\25(£7) обозначим через 31 (£7). Очевидно, если U ЕЕ СМИ7), то П «(£/)-£1 (X) Q 23(^7), где X е U и X < W. 2. Теорема. ЕслиХ, Ye=UЕ^и Хее. Poss то существует такая стратегия для которой 1) (7) = л/ (7) при V е 31 (£7); 2) У Е Poss
102 Н. Н. ВОРОБЬЕВ Доказательство. Построим стратегию по- ложив а) при Kg 31 (U) л- (7) = л{ (7); б) при n'i (7) = vy. Построенная стратегия щ является искомой. Действи- тельно, п. а) построения обеспечивает выполнение требо- вания 1). Нам остается показать, что Y^E Poss л$, т. е. что У ЕЕ Poss л<. (7) а! (У) Но по п. б) построения Y е Poss щ. (8) О*(У)П»(С7) Если же Уей?(У) n al (U), то найдется такое v, что U clD (У, v) и, в частности, ХеD (Z, v) при некотором Z ЕЕ У. Атак как по условию X ЕЕ Poss л{, будет л$ (7) = V. Но тогда поп. а)ил$ (У) == v, и на осно- вании того, что Y ЕЕ UczYD (У, v), мы получаем v = vY. Значит, Y е Poss (9) Сопоставляя (8) и (9), получаем (7). 3. Теорема. Если ф* (X) =^= 0 и У ЕЕ С/ ЕЕ яв- ляется последним элементом ф* (X), то положим (X) = {л*: U е Rel лъ л* (U) = vx, X е Poss л{}. О*(Х)П83(17) Если же (X) = 0, то положим Т(X) — Щ. Тогда [1, если Л(Х), .л. | J [0 в противном случае.
РЕДУЦИРОВАННЫЕ СТРАТЕГИИ 103 Доказательство. Из (X) следует, что Rel Яр Значит, по теореме п. 2 найдется такая страте- гия Jti, совпадающая с л^ на 91 (Z7), для которой KeePoss л$. Поэтому, в частности, У е Poss Jti цГ(У)П№) Следовательно. У е Poss л*. Но по условию У ЕЕ Poss лг a*, (nrw(tf) Стало быть, У е Poss л/= Poss л?. &•(?) Значит, поскольку У — последний элемент (X), а Hi (Z7) = v£, должно быть X ЕЕ Poss ль и нам остается сослаться на следствие леммы Куна [3]. 4. Т е о р е м а. Пусть Хее Ue^iuX<^Z. Обозначим через Y следующую в ф* (Z) за X позицию, если такая есть, а через V — содержащее ее информационное множество. Положим S (X) = {jq : U ЕЕ Rel ль nz(t/) = vu, Хе Poss nJ и а*(*)П»(П) Г(Х) = {л{: РеРе1ль Уе Poss nJ. а- (у)П» (V) Тогда S (X) = Т (X). Доказательство. Пусть л^ ЕЕ S (X). Тогда U ЕЕ Rel Л| и по теореме п. 2 существует стратегия л£, для которой X CEE Poss л$ и которая совпадает с л{ на всех информационных множествах из 91 (U). Поэтому X G Poss л{, Q- (Х)ГШ(£7)
104 Н. Н. ВОРОБЬЕВ а так как по условию ХЕ Poss лг, (Х)П8 W то должно быть Х|еЕ Poss л^. Следовательно, Y е Poss Яр а- (X) Но, кроме того, У е Poss лй а £1*(У) = С*(Х) J {U}. и Значит, У ЕЕ Poss л{, (10) а поэтому VЕЕ Rel лР Наконец, из (10) следует У ЕЕ Poss ль &*(У)П93(Ю Таким образом, оба условия принадлежности щ к Т (X) выполнены. Наоборот, если л1ЕЕ Т (X), то, используя теорему п. 2, получаем, что Y ЕЕ Poss Л|, откуда немедленно вытекает, что Хе Poss л^ (И) и л{(£7) = Уц. Но из (10) следует как X е Poss лъ а? (Х)П» (U) так и U ЕЕ Rel л^. Поэтому щее8 (х). § 3. Упорядочивающая память 1. Будем говорить, что игрок i обладает в игре Г упорядочивающей памятью, если для любых U,VeeV^ из U <^V следует Vc±D (U). 2. Т е о р е м а. Для того чтобы i-й игрок обладал в игре упорядочивающей памятью, необходимо и достаточно, чтобы при всяком FEE Ui выполнялось 55(F) о: П аГ(Х). (12) X&V
РЕДУЦИРОВАННЫЕ СТРАТЕГИИ 105 Доказательство. Необходимость. Пусть игрок i обладает упорядочивающей памятью, FЕЕ и UЕЕ 35(F). Тогда U <^V, так что F cz D (U). Поэтому для любого XeeV XeeD (U) (13) или, что то же самое, UeeS* (X). (14) Так как это соотношение имеет место для любого X ЕЕ Y, то Ь'Е П П*(Х), (15) X&V а поскольку это верно для всякого /7ЕЕ 35(F), справед- ливо и (12). Достаточность. Пусть теперь при любом V ЕЕ 11$ имеет место (12). Возьмем некоторое Z7EEUi, для которого U <" F. Если при этом UЕЕ 21(F), то существует такое v, что FczZ) (U, v)czZ) (J7). Если же £7ЕЕ 35 (F), то в силу (12) имеет место (14) при лю- бом X ЕЕ F, и поэтому справедливо (13). А так как это верно для произвольного XeF, должно быть Fez:D (С7), что и требовалось доказать. 3. Теорема. Если игрок i имеет в игре Г упоря- дочивающую память, то для любой его чистой стратегии л$ и информационных множеств U,VeeVLi из U<^V zzFEERel л$ следует Fee Reln^. Доказательство. Пусть Z7, F ЕЕ Up U F и FeeRel л$. Последнее означает, что существует такое KeF, что л^ [У] > 0. Если игрок i имеет упорядочивающую память, то FezD (U), так что мтх Sмг]< S «4[2>(zz)i = s лах]. уev УеР (U) x&j Поэтому существует такое X ЕЕ ?7, что лДХ]^>0 и U е Rel
106 Н. Н. ВОРОБЬЕВ 4. Будем называть семейство информационных мно- жеств 23 = {Fx,..., Vr} стандартно упорядоченным, если при любых к и I из к I следует V\ <£ Vk. 5. Теорема. Если игрок i имеет в игре Г упоря- дочивающую память, то семейство всех его информационных множеств поддается стандартному упорядочению. Доказательство. Очевидно, возможность стан- дартного упорядочения равносильна невозможности образования из принадлежащих 11$ информационных мно- жеств циклов, т. е. таких последовательностей информа- ционных множеств Vx,..., Vk, что ^<-<ъг<м Но из определения упорядочивающей памяти игрока непо- средственно вытекает, что из его информационных мно- жеств циклы составить нельзя. § 4. Редуцированные стратегии 1. Далее мы будем считать, что перечисление UY,... .... Ur всех информационных множеств изU* является пере- числением их в стандартном порядке. Пусть UkEE: 1Ц.и для произвольных Uk и vUk PiK^, (Ult VUt)] (16) l<k — неотрицательные числа, причем 3Pi[(^, м)| П (uh V[Zl)] = 1. (17) *uk l<k Систему этих чисел при всевозможных Uk и vUk назовем ре- дуцированной стратегией игрока i в игре Г. 2. Теорема. Пусть — редуцированная стратегия игрока i. Положим для любого Т cz пмо moi о о мад. (18) тх.&Т А==1 Кк Тогда q является вероятностной мерой на множестве П^, т. е. некоторой смешанной стратегией (которую мы будем далее называть смешанной стратегией, соответствующей редуцированной стратегии pj.
РЕДУЦИРОВАННЫЕ СТРАТЕГИИ 107 Доказательство. Очевидно, q [Т] > 0 и при Т^Т2 = 0 q (Л U Г2] = q ГЛ1 + Я [Г2]. Нам остается доказать, что q [IIJ = 1. Мы имеем 7[П{]= з ... s ПргК^ь vnft)| П(С7г, vUz)] = vn, чиг *=1 г<& = SPiK^l» Vj/,)] 3pi 1(^2, VyJKt/l, VUt)] X *Ui *и2 ... хЗ... 3 Pil(t7r, vUr)| m, vcr,)J. VU3 vUr l<r Применяя формулу (17) последовательно к суммам по V[/r, получаем, что q [HJ = 1, и теорема до- казана. 3. Один из способов задания редуцированных страте- гий игрока i состоит в следующем. Пусть рц — некото- рая смешанная стратегия игрока i. Положим для любых Uk ееХЦи произвольных и vUt Pp.[(tffc, Vy )| П (Ul, Ml = Рг « ‘1<к Ш K«i Ш = VyJ П 0 (Я{ (Ut) = Vy ) n (C/fc e Rel л,)] K и 1^8 (uk> K = M П (л{ (Ul) = Vu ) n (U^ Rel л{)] ’ U j€=93 (Uk) # (19) если стоящая справа дробь имеет смысл, т. е. если ее знаменатель отличен от нуля, и рн vuj \^R(Ui, vVl)] = н [л (UJ = vUfc] (20) в противном случае. Так определенные числа Рр., l(Uk, тцк)| П (Ui, Уцг)], 1<к очевидно, неотрицательны и удовлетворяют соотноше- ниям (17), так что по предыдущему Рр.. можно считать Редуцированной стратегией игрока i. Эта редуцирован- ная стратегия называется редуцированной стратегией
108 Н. Н. ВОРОБЬЕВ соответствующей смешанной стратегии Очевидно, рр. определяется по р{ однозначно. Если pi — смешанная стратегия, соответствующая ре- дуцированной стратегии р^.., соответствующей в свою оче- редь смешанной стратегии р,, то pi называется редукцией 4. Лемма. Пусть X,Y ЕЕ It, причем X ЕЕ U является последним в ф* (У) элементом и Х^ Poss р^. (21) Тогда длятого, чтобы Y(=£ Poss ^.необходимо и доста- точно , чтобы | р{ {U е Rel л{ П (Е7) = v£) А А (щ(иг) = v%,)] = 0. | Н'еЯЗ (U) (22) Доказательство. Необходимое ть. Если бы левая часть (22) была отлична от нуля, то нашлась бы такая стратегия ль удовлетворяющая стоящим под зна- ком меры pi условиям, для которой | PiA^O. (23) Нодля всех U'EE.% (U) мы имеем vv' = Таким образом, из теоремы п. 2 § 2 непосредственно вытекает, что если л$ (U') — vu' Для всех U’ е= 35 (C7)t то X е~— Poss Л$. (24) Но из (24) и из Лг (U) = vu следует, что У е= Poss Вместе с (23) это дает нам У е= Posspi? что противоречит предполо- женному. Необходимость тем самым доказана. Достаточность немедленно следует из того, что У (= Poss л; для всех л{, по которым производится суммиро- вание в левой части (18). § 5. Теорема об эквивалентности Теорема. Если в игре Г игрок i имеет упорядочи- вающую память, то каждая его смешанная стратегия эк- вивалентна своей редукции.
РЕДУЦИРОВАННЫЕ СТРАТЕГИИ 109 Доказательство. Нам нужно установить, что Иг [-Х] = Нг 1-^П для любой позиции X. Но Й[Х] = Й[ п (Л<(^) = v£)b иеа* (X) На основании пп. 2 и 3 из § 4 отсюда следует, что йнх]= з пржв! л (uh щ (О) тс. А =1 иеа’ да (мы сохраняем перечисление информационных множеств, принятое в п. 1 § 4). Пусть t/x,..., Um' — элементы £1* (X), a — элементы \ £1* (X), перечисленные в стандартном порядке. Тогда MX] = - X ... 5] ПрЖ «| п Ж^Ж))], (25) (26) память, быть причем ^(Ut) = Vu't> * = 1,. . m'. Так как игрок i имеет в Г упорядочивающую при Uk ЕЕ&* (X) на основании п. 2 § 3 должно ®Шс:£1*(Х). Поэтому при соблюдении (26) сомножитель MOI n (Ult щ(£7г))] (Uft)
110 Н. Н. ВОРОБЬЕВ имеет вид М(^> <)| 0 (Uh v£)], (27) к uze$8(Ufc) Ul не зависит отл* (Ut) (t — 1,...., т") и может поэтому быть вынесен за все знаки суммы в формуле (25). Поступая так со всеми сомножителями вида (27), мы получаем ^[Х]= ,П ,(f4,v)]x t=i us&$ (Ut) x s ... s nPi[(t4', ^(г7';))| П (tfs,MOb (Up U(Up Но из UsEz%> (Ut) следует, что в стандартном упорядоче- нии информационных множеств U$ предшествует t7f, поэтому мы имеем 3 ... 2 П PiK^.M^))! n (tfs,Mtfs))l = ”4 <U1> "i (ит”> /=1 {Ud = П 3 РН(^,М^))| л (Us, лДС/s))], fa=1 п. (u'l) us&q (Ut) а в последнем произведении все суммы на основании (17) равны единице. Поэтому Й[Х] = Прг [(^, <)1 , п , ({/;, <)]. (28) t=l t Use8(Up s Пусть X e Poss Pi. Применяя формулу (19), получаем й [X] = m, Pi[(«i n , П r (J4(tO= *р')П(^еНе1л{)] _ TT _____________t v's&s (v't) ______J_____________ ~ (Ji Pi ( n (л{ (U's) = v^,) n (U't e Rel л{)] UsefB (Ut) s
РЕДУЦИРОВАННЫЕ СТРАТЕГИИ 111 или, пользуясь обозначением, введенным в п. 1 § 2, т, Рч [(«i (fA) = v*) n (X е Poss Л{) П (u’t e Rel л{)] - rvi П Ut Hi A = I] ------------------------------------------- • r H [(* e Poss nJ n e Rel nJ] 58 (Uj Вводя, далее, обозначение Xt = %(X)[\Ut и замечая, что соотношения X PoSS ТЦ И Xt ~ PoSS Ttj 5В (Uf) 58 (Щ) равносильны, мы получаем т' Pi [(^; е Rel Л{) И (Л| (U't) = v*,) Г) (Xt е Poss л{)] н<|Х| = П -------------.---------------------- >-i R 1(1', е ке! «,) п № е Boss «,)) 58 (Uj) или, пользуясь обозначениями теоремы п. 4 § 2 и учиты- вая при этом, что Xt+i является следующей за Xt позицией в (X), имеем - ГХ1 = ГТ Pi Н№)]_________________Pi H№)J___________ н «Ди«[г(Х<-1)] PiUC^GReln^fHXfePossjii)] ’ Заметим теперь, что на основании теоремы п. 4 § 2 S (Xt) = Т (X/), а соотношениям Ur ЕЕ Rd и Xr е Poss щ удовлетворяют все стратегии из Щ. Следовательно, Ш 1^П “ Ш (^т')Ь Но в обозначениях теоремы п. 3 § 2 S (Хт») = Т{,(Х). Поэтому кЧ [-XJ = кЧ 1^г (^)Ь Применяя, наконец, теорему п. 3 § 2, мы имеем Hi [X] = S Л{[Х] = [X].
112 Н. Н. ВОРОБЬЕВ Этим случай X GE Poss щ разобран. Пусть теперь X Poss |иц. Очевидно, достаточно огра- ничиться случаем, когда X есть окончательная позиция. Р ассм отр им ситу ацию где рц = а при любом / ф i Нетрудно видеть, что такие ситуации существуют. Оче- видно, 3 рчх] = з mm, М* Х^к* или 2 Hi [X] П и* IX] = S н [X] п p; [X] (29) Xt^K* Х&К* (ибо каждая из этих сумм равна единице). Как было доказано, из [X] О следует рц [X] = = щ [X]. Но и при pi [X] = О должно быть р$ [X] > 0. Поэтому во всех случаях Pi [X] < Pi [X]. (30) Если бы для некоторого Хе X здесь выполнялось строгое неравенство, то ввиду положительности всех произведе- ний П р^ [X] равенство (29) было бы невозможно. Поэто- J ¥= i му строгого неравенства в (30) быть не может, а это и означает требуемое. § 6. Пример Рассмотрим позиционную структуру с одним игроком, изображенную на рисунке. Каждая смешанная стратегия определяется здесь 31 параметром. Теорема Куна здесь неприменима, ибо память игрока неполная. Применение теоремы Томпсона (информацион- ное множество иъ не является сигнальным) сокращает число определяющих параметров до 16.
РЕДУЦИРОВАННЫЕ СТРАТЕГИЙ 113 Определяя разделяющие стратегии на информационных Множествах С72 и U± (это — наилучший вариант приме- нения теоремы о расчлененных стратегиях из [2] к данной структуре), мы можем ограничиться 13 параметрами (три параметра определяют \ / / > разделяющую стратегию, а из разделенных \ / / / те две, которые соответствуют выбору в у -у // U2 левой альтернативы, определяются 5 д—/ тремя параметрами каждая, и остальные \ / \/ две — двумя). Для оценки результата применения / теоремы § 5 заметим, что при к = 2, 3, \ / // 4, 5 семейство 35 (Uk) состоит ровно из одного информационного множества (имен- ’Г/1 / но из предыдущего). Поэтому в соответ- \/ I/ ствии с формулой (19) для описания по- ведения игрока в Ur достаточно одного параметра, а для описания его поведе- \/ ния в каждом из последующих информа- Ц (?) ционных множеств — двух (при выборе в предыдущем информационном множестве правой или левой альтернативы). Общее число парамет- ров равно, таким образом, 9. ЛИТЕРАТУРА [1] Thompson G. L., Signaling strategies in n-Person games, Contributions to the theory of games, voJ. II, Princeton, 1953, 267-278. [2] В о p о б ь e в H. H., Расчлененные стратегии в позиционных играх, сб. «Проблемы кибернетики», вып. 7, М. (1962), 6—20. [3] Кун, Позиционные игры и проблема информации, см. настоя- щий сборник, стр. 13—40. [4] В о р о б ь е в Н. Н., Редуцированные стратегии для игр в обобщенной форме, ДАН СССР 115, 5 (1957), 855—857. 8 Позиционные игры
ЭКВИВАЛЕНТНОСТЬ СТРАТЕГИЙ В КОНЕЧНОЙ ПОЗИЦИОННОЙ СТРУКТУРЕ1) И. Н. Врублевская Ленинградское отделение Центрального экономике-математического института Рассматривается конечная позиционная структура с произвольным семейством информационных множеств. Считая взаимозаменяемыми, эквивалентными такие стра- тегии z-ro игрока, при которых его ожидаемые выигрыши совпадают для любой игры над данной структурой, легко видеть, что эти стратегии обладают свойством давать оди- наковые вероятности любой окончательной позиции в любой содержащей их ситуации, и наоборот. Последнее, как обычно (см. [1], а также [2]), принимается за определе- ние эквивалентных стратегий, причем в форме, охваты- вающей и стратегии разных типов. Какую стратегию из класса эквивалентных выбрать, для z-ro игрока без- различно. Связь между вероятностями произвольной позиции и окончательных позиций (п. 2) позволяет просто охаракте- ризовать множество возможных при данной стратегии позиций (п. 3) и дать другое, равносильное определение эквивалентности стратегий (п. 4). В п. 5 дается ряд не- обходимых и достаточных условий эквивалентности раз- личных стратегий, в частности смешанных стратегий и стратегий поведения. В случае полной памяти игрока от- сюда вытекает теорема 4 Куна [1] (п. 7). В п. 6 устанав- ливаются некоторые соотношения между смешанной стра- х) Сообщение об этой работе было сделано на IV Всесоюзном математическом съезде, 1961 г.
ЭКВИВАЛЕНТНОСТЬ СТРАТЕГИЙ 115 тегией и порожденной ею стратегией поведения, а также между стратегией поведения и порожденной ею смешанной стратегией. В п. 8 делаются замечания о достаточности использования чистых стратегий вместо произвольных при подстановках в ситуацию. 1. Обозначения. Позиционная структура есть позицион- ная игра, рассматриваемая без функции выигрыша [31; п — число игроков, Т — множество всех позиций, Тг — множество всех позиций f-ro игрока, W — множество всех окончательных позиций. л = (л1,..., лп) означает ситуацию в чистых страте- гиях, ц = (ц1,...,^?) — ситуацию в смешанных страте- гиях, Р — (Р1,..., рп) — ситуацию в стратегиях поведе- ния [1]. Будем обозначать через ф=(фг,..., фп) произвольную из этих ситуаций и через ф = (ф1,..., фп) —ситуацию, в ко- торой каждая стратегия может быть любого из ука- занных типов; фгс ф означает, что стратегия фг входит в ситуацию ф, причем фг и ф имеют один и тот же тип (л, Р или ц). Для любого множества позиций Y соотношение z Y (z^Y) означает либо z^E. Y, либо z<^y (z> у) для не- которого у (= Y; У есть совокупность всех У; xv — позиция из У""1 (х), в которую приводит из х альтерна- тива v; vz или vu— произвольная альтернатива в позиции z или соответственно в информационном множестве U; Uz — содержащее z информационное множество; с(г) = П P«(vp. x<z X Е Т° Остальные обозначения содержатся в [2]. Заметим, что в позиционной структуре число окон- чательных позиций больше числа внутренних по- зиций. Действительно, дерево позиционной структуры конечно; поэтому его можно построить последовательно, начиная с начальной позиции и присоединяя на каждом шаге все позиции /-1 (ж) к уже имеющейся позиции х. По определе- нию У“1(гг) содержит не менее двух элементов, откуда и следует утверждение. 8*
116 И. Н. ВРУБЛЕВСКАЯ 2. г-вероятности гр< и вероятности гр для w и для Для любого ZEE.T i-вероятность tf[z\ определяется фор- мулами: ф’ [z] = П фг {х, vxx) ДЛЯ 1|/ = х<г. (₽’ и1 [z] — Sh* (я*) [z] = S н{ (я<); ni[z]>0 вероятность гр определяется формулами: Н [z] = Зн(л)я [Z1 ~ c(z) 2 Н'(я)’ 71 ТС П [Z]>O -ф [z] == с (z) Пфг [z], н(л) = П нЧя*)- г==1 г==1 Отметим, что гр [z] 0 тогда и только тогда, когда гр1 [z] 0, i = п, (2.1) Для любого z£? \ W множество позиций YczD (z) назовем сечением D(z), если для каждого wEzD (z) рИ7 су- ществует единственный yEEzY такой, что y^w. В частнос- ти, сечениями D(z) будут f'1 (z) и D (z)Q W. Пусть хЕЕ Тг. Рассмотрим какое-нибудь x^EEf"1 (я). Обозначим через У (;rv) либо {#v}, если х^Тг |J И7, л ибо такое сечение Y множества D (#v), чтоУсТ4 (J W и Y является «ближайшим» к Xv, т. е. для xv t <^Y будет t Т1. Оче- видно, [z] (2.2) для любой позиции z такой, ЧТО 2<^У (xv). Легко видеть, что для любого х ее Тг S ‘фЧуь (2.3) г/е/-1 (х) Действительно, есл и/"1 (х} — Xj}, то для /-веро- ятности позиции х имеем ф* [ж] = 'Ф' [ U1 A ®v)] = 2 4|/ [ж n *vl = 3 kvb
ЭКВИВАЛЕНТНОСТЬ СТРАТЕГИЙ 117 Лемма 2.1. Для любого z£T существует такое мно- жество W' tczD (z)0 W, что гр* [z] = S tflw’b weW' В самом деле, используя (2.2) и (2.3) и поднимаясь ох и к окончательным позициям, легко построить множество И7'. Лемма 2.2. ф [и] = 2 Ф [^], г$е z £= \ и Y — v&r произвольное сечение D(z). Действительно, для вероятности ф позиции z имеем 3 3 $ [Z] = $ [ц* (Z 0 Z,)] = 2 $ [Z,]. Легко видеть, что У\я= (J У”1 (я); следовательно, “ ~ z^x<Y сечение Y будет получено после конечного числа по- следовательных замен каждого х, z х <С У, на /-1 (х). Раскладывая каждый раз <ф [я] в сумму S $ [«»] xve/“x(x) и подставляя это в ф [z], получим требуемое равенство. Предл о ж е н и е 2.3. Пусть z^T \ [ip] = = Ф1 [ip! для всех wEzD (z) Q РК тогда и только jnoeda, Koedatyl [ж] = ф>2 Ы для всех х ЕЕ {z} |J D (z). Доказательство следует из леммы 2.1, та# как легко видеть, что для'ф! [ж] и ф2 Ы может быть построено одно и то же множество РУ. Следствие 2.4. ф} [ip] = ф2 [ip] для всех we^W тог- да и только тогда, когда ф! [z] = ф2 [z] для всех zE=.T. Из леммы 2.2 для сечений D (z) p|PF следует Предложение 2.5. Пусть zEE Т\ W; фх [ip] = = ф2 [^р] для всех we^D (z) П W тогда и только тогда, когда ipi [я] =-ф2 [я] для всех х е {и}иДХ2)- Следствие 2.6. фх [ip] =ф2 [ip] для всех w Ez W тог- да и только тогда, когда фх [z] =ф2 Izl для всех z^T. 3. Строение множеств Poss. Приведем обычные опреде- ления множеств Poss ([1], [3]). Рассмотрения п. 2 позво- ляют характеризовать эти множества несколько иначе,
118 И. Н. ВРУБЛЕВСКАЯ Poss гр есть множество всех позиций zЕЕ Т таких, что существует w ЕЕ W, для которого ZEE w игр [гр] 0. Poss грг есть множество всех позиций z е= Т таких, что существует грЕ)грг, для которого Poss гр (см. [1]). Rel гр (Rel грг) есть совокупность всех информационных множеств U таких, что U П Poss 0 (U П Poss гр* =£= 0). Очевидно, Poss гр — (J w- W ~ ф, [w]>0 (3-1) Отсюда и из леммы 2.2 для сечений D (z) П W вытекает Предложение 3.1. Poss гр есть множество всех позиций zeeT, для которых гр [z] 0. Поэтому p,[z] = c(z) 2 р,(л) = е(г) 2 И (я)- 71 П п [z]>0 zePoSS п Лемма 3.2. Длялюбых^и zee Т следующие утверж- дения равносильны: 1) грг Ы 0; 2) существует л такое, что л||грг 0; 3) существует гр нэгр1 такое, чтоtp[z]^>0. Доказательство. Если грг [z] ^>0, то, очевидно, можно подобрать л>, с л* [z] >0. Следовательно, будет л ||грг [г] = с (z) грг [и] Плф]>0, т. е. справедли- во 2), а тогда и 3): гр = лл Если справедливо 3), то по (2.1) гр* [z]>0. Таким образом, имеют место представления Poss грг = J Poss гр — (J w — (J w, ф W, Ф W “ ФЭФ* ФЭФ* Ф*[ад]>0 Ф М>о (3-2) Отсюда, из предложения 3.1 и леммы 3.2 вытекает Предложение 3.3. Poss грг есть множество всех позиций zeeT, для которых^1 [z] 0. Поэтому п^[г]>0 zePoss п*
ЭКВИВАЛЕНТНОСТЬ СТРАТЕГИЙ 119 Условия, приведенные в предложениях 3.1, 3.3, могут быть приняты за определения соответствующих множеств Poss. Отметим еще некоторые соотношения. 3.4. Poss [Г = (J Possjt\ рЛ (л* )>0 Действительно, z ЕЕ Poss рг означает, в силу предложе- ния 3.3, р1 [z] е> 0. Значит, 0 < pi [z] = 2 И* О1*), пг zePoss яЛ т. е. существует лг с рг (лг) > 0 и z£ Poss лг. Отсюда Не1р?= (J Rel л\ р* (я* )>0 3.5. Possp== U Poss л = U Poss л. п п Н (^)>0 рЛ(тЛ)>0 г==1,..., п Действительно, z ЕЕ Poss р означает по предложению 3.1 р [z] 0. Значит, 0 О [z] = c(z)S n(rt)> п * zePoss - т. е. существует л с р(л) > 0 и z Е Poss л. 3.6. Из предложения 3.1, (2.1) и предложения 3.3 вытекает: п Poss г|/ = 0 Poss *фг. г=1 Сделаем несколько замечаний. Г тг'*’ 3.7. Пусть = х G 7” П Poss у е / 1 {х). Тогда ф’ (х, Vx) = . Действительно, по предложению 3.3
120 И. Н. ВРУБЛЕВСКАЯ • >0 И . П vV Ку = ________= (а;, ^). i 4’г[ж] JJ ф’(«, vxt) з ' Кх' t&rt : 3.8. Пусть № — произвольный набор альтернатив г'-го игрока, N — произвольный набор личных альтернат П ' . i, тив, N = (J N\ Скажем, что N1 активно для гр\ если | г==1 J * Г Лг * * । для грг = I будет грг (х, ух) >> 0 при всех vx е N\ а для гр = р? существует я* с р? (лг) > 0, для которого N* актив- но; N активно для г|), если Nlc^N активно для гр при всех i =1,..., п. Обозначим через |гр| или |гр| совокупность всех !' альтернатив, каждая из которых активна для гр или^р со* j п ответственно; | гр | = U | гр |, | рл| = U |Л*Ь г=1 Я* ^(яг)>0 Таким образом, zee Poss гр тогда и только тогда, когда {vpx<z активно для гр11); z Ei Poss гр тогда и только I хеТ^ ~ тогда, когда {vx}x<z активно для гр. i 3.9. Из предложения 3.3 и леммы 3.2 следует, что I Розвгр1 есть множество всех позиций zee Г таких, что суще- j ствует л, для которого z ее Poss л ||грг, т. е. достаточно под- | ставлять л?’ вместо более общих грл - 4. Критерии эквивалентности. Приведем обычное определение эквивалентности ([1], [2]), распространив его и на стратегии разных типов. На основании п. 2 получим критерии, характеризующие эквивалентность более явно; они могут быть приняты за определение эквивалентности стратегий. ? .--------------- Здесь содержится предложение 1 из [1]. ! I
ЭКВИВАЛЕНТНОСТЬ СТРАТЕГИЙ 121 % эквивалентно *ф2» если ipi [w] = гр2 [w] для всех w ЕЕ W. гр} эквивалентно гр}, где гр} и гр} произвольных типов , если гр[| гр} эквивалентно гр||гр} Для всех гр. Лемма 4.1. Пусть гр} и гр} произвольных типов и zEET. Пусть п || гр} [z] = л || [z] для какого-нибудь л такого, что z ЕЕ Poss л^’, j=f=i. Тогда гр||гр} [z] = гр||гр} [z] для любого гр. Доказательство. Для л таких, что z ЕЕ Poss л^’, имеем л Ц гр* [z] — с (z) П [2] -гр* [z] — с (z) • гр* [z]. (4.1) Поэтому ‘ФЦЧ’хИ = c(z) П [z]-1]4 [z] = П чр[з].л||$ [z] = == П [zj • rt||l|4 [z] = П [z]-c (z) 1|>2 [z] = [z]. fan Отсюда следует Лемма 4.2. Пусть гр} и гр} произвольны и z ЕЕ Т. Тогда гр||гр} [z] = грЦгр} [z] для всех гр тогда и только тогда, когда л||гр} [z] = л|[*ф2 [z] для всех л. Таким образом, получим еще одно утверждение о доста- точности подстановки л^ вместо гр*: Предложение 4.3. Произвольные гр} и гр2 экви- валентны тогда и только тогда, когда л ||гр} эквивалентно л ||гр} для всех л. Используем теперь результаты п. 2. Из следствия 2.6 следует Предложение 4.4. грг эквивалентно гр2 тогда и только тогда, когда грх [z] = гр2 [z] для всех zEET. Предложение 4.5. Произвольные гр} и г|?2 экви- валентны тогда и только тогда, когда гр} [ш] =гр2 [iz?l для всех w ее W. Доказательство, гр} эквивалентно гр2 означа- ет, что для любого w имеем л||гр} [ud = тт||гр2 [ip] для всех л. Взяв такое л, что ip^Poss л\ / =^= I, по (4.1) получим гр} [ю] =гр2 [ip]. Обратно, еслидля любого^ имеем гр} [ip] =
122 И. Н. ВРУБЛЕВСКАЯ = фз 1^1» то ^Н'Ф! (^1 = л||ф2 [м>] для любого w и всех л, так как для л с Poss л^ЕЭ*Р, / =/= г, можно пользоваться (4.1), а для остальных л обе части равенства равны 0. Отсюда и из следствия 2.4 вытекает Gji е д^с т в и е 4.6. Произвольные ф! и фз эквива- лентны тогда и только тогда, когда ф! [и] = фз Ы для всех z EzT. Критерии 4.5 или 4.6 можно принять за определение эквивалентности стратегий. Заметим, что на основании (3.1), если ф1 эквива- лентно ф2, то Poss ipi = Poss , а тогда и Rel фх = Rel ф2. 5. Эквивалентность стратегий произвольных типов. Дадим ряд критериев эквивалентности различных страте- гий. Из предложения 4.5 и (3.2) получим: еслиф^ эквива- лентно то Poss ф* = Poss ф*? (5.1) а тогда и Rel ipi = Rel фз. Л ?, J = l,2. Для эквива- э лентности тр* и ф* необходимо и достаточно, чтобы Теорема 5.1. Пусть ф^ = Poss ф| = Poss ф* и ф* (х, ух) = ф| (х, ух) для х^Т{ П Poss ф^ Доказательство. Необходимость. По (5.1) Poss'ipJ = Роззфз • В силу замечания 3.7 для х П T’fePoss ф} и у е У"*1 (я) имеем Из следствия 4.6 ф| [г/] = фЦу] и ф| [я] = ф^ [я], следо- вательно, ф* (х, уУ) = ф* (х, v£). Достаточность. В силу предложения 3.3 ф! Ы 0 равносильно ф2Ы 0 для всех z Е= Т. Следовательно, для weW имеемф£ [гг] = 0 ифз [ip] = 0 одновременно. Для I 1
ЭКВИВАЛЕНТНОСТЬ СТРАТЕГИЙ 123 ip е W П Poss ф) по (3.2) имеем w с: Poss ф). Поэтому Фх = П ф£ (t, v?) = П Фг (t, v?) = ф| [м>]. t<w. t<w. Из предложения 4.5 следует эквивалентность. Теорема 5.2. Пусть ф{ — Гл* Для эквивалентности фг и лг необходимо и достаточно, чтобы Poss ф^ cz Poss лг. Доказательство. Необходимость следует из (5.1). Достаточность. Если Poss фг cz Poss л1, то фг мо- жет выбирать на Тг П Poss л1 последовательно только те же альтернативы, что и лг; значит, Poss фг = Poss лг и ф4(^, vx) = лг (х, ух) для хеУ1 П Poss л\ По теореме 5.1 ф эквивалентно л. /,/ = 1,2.Если Rel i|>i = j = Rel фг и ф! (U, vu) = фг (U, vu) для U ЕЕ1Г П Pel ф), то Poss ф1 = Poss фг и, следовательно, Фх (х, ух) = Лемма 5.3. Пусть ф} = = Ф*(я? vx) для х е Г fl Poss ф}. Доказательство. Если х ЕЕ Poss ф^ то по заме- чанию 3.8 активно для фЁ Каждое такое z при- 2(=Тг надлежит Uz П Poss ф*; значит, Uz G Rel ф* = Rel ф^.. Так как ф| и ф* на Rel ф^ совпадают, то {y*}z<x актив~ но также для ф| т. е. ЕЕ Poss ф^. снова в силу за- мечания 3.8. Значит, Poss ф* = Poss ф*. Отсюда и из теоремы 5.1 получим г л* Следствие 5.4. Пустьф^ = |, / == 1, 2. Для эквива- лентности ф* и ф* необходимо и достаточно, чтобы Rel Ф* = Rel Ф* и ф| (U, Уи) = фга(СЛ Уи) для U G Rel ф!.
124 И. Н. ВРУБЛЕВСКАЯ Содержащийся здесь критерий эквивалентности л| и Лг составляет утверждение теоремы 1 из [1], критерий эк- вивалентности и ^2 — теоремы 4 [4]. Теорема 5.5. 1. Чтобы рг было эквивалентно лг, необходимо и достаточно, чтобы рг см вшивало лишь л\ эквивалентные лг. 2. Чтобы рг было эквивалентно рг, не- обходимо и достаточно, чтобы i Рг [М для всех z^T1 П Poss рг Р Gb v) - ^[г] в^х Poss ру 3. Чтобы рг было эквивалентно рг, необходимо, чтобы S (и4 — р*) (л*) = О для всех zEET, и достаточно, ni zePoss _ чтобы 2 (И* —г Н*) (л*) О &м всех w и* wsPoss пг Доказательство.1. Необходимость. По (5.1) Poss р* = Poss л1. В силу соотношения 3.4 Poss р* = U Poss л*; р?(я*)>0 следовательно, Poss лг cz Poss лг. По теореме 5.2 лг экви- валентно лг. Д остаточность. В силу предложения 4.5, так как л* эквивалентно л1, для любого w ЕЕ W имеем р* [гг?] = 2 р* (л*) л^ [w] = S Н* (n*) IW1 ~ lwl S И* (л*) = «г я* п* = Л1 [&’]. По предложению 4.5 рг эквивалентно лг. 2. Необходимость следует из (5.1), замечания 3.7 и следствия4.6 — в случае zee Тг Q Poss рг, и из замеча- ния 3.7 и следствия 4.6 — в случае zeeT'^ Poss Достаточность. Покажем сначала, что в каж- дом из двух случаев получим Poss р* = Poss |Зг. Пусть х— некоторая позиция и х1,..., хк — все позиции из Тг, последовательно предшествующие х.
ЭКВИВАЛЕНТНОСТЬ СТРАТЕГИЙ 125 а) Случай справедливости формулы для всех z Тг f| П Poss р\ Если x^PosspS то по (3.2) я с: Poss р? и по предложению 3.3 p* [z] > 0 для всех z х. Следовательно, на основании формулы, v^)>0 для I = 1,..», к, т. е. рг[^13>0, и по предложению 3.3 х ЕЕ Poss р1. Если #e£Possp\ обозначим через s наибольший номер, для которого i,sGEPosspi ($ найдется, так как х1 ЕЕ Poss р? всегда). Имеем р/ [#s] >0, а р* [^v*8] =0; рг (zs, v) опре- деляются по формуле, следовательно, рг (#s, v*s) = 0, т. е. х Poss р*. б) Случай справедливости формулы для всех z£E £ Г f] Poss ₽*. Если X е Poss pi, ТО X1 е Poss pi И pi (х1, V^)> 0 для I =1,..., к. Применяя формулу последователь- но, начиная от v*, видим, что каждый числитель, в ча- стности последний, положителен, т. е. рЧ#л]>0. На Xй основании (2.2) и предложения 3.3 з: ЕЕ Poss р\ Если /r^tPossP*, обозначим через s наибольший номер, для которого xs ее Poss Р^ Имеем рг (xs, — 0, ЕЕ Poss рг cz czPosspi.noaTOMy вформуле для v*s знаменатель положите- лен, а числитель равен 0, т. е. [Г = 0. На основании (3.2) и предложения 3.3 ^^zPosspi. Таким образом, в обоих случаях из предложения 3.3 следует, что рг [id == 0 == pf [w] для u? е£ Poss р/ = Poss рг. Для шее Poss рг = Poss рг, так как по (3.2) wczPoss р\ имеем „ Нг[М1 ₽*[»1 = П Р*(г.<>= П-Т-СТ-^'М Z<W. Z<w И *• J ZGT* z&T* на основании (2.2) и факта рг Ы = 1 для нижнего z^ В силу предложения 4.5 pi эквивалентно [Р. 3. Необходимое условие является расшифровкой утвер- ждения 4.6, достаточное условие — расшифровкой утвер- ждения 4.5. 6. Смешанные стратегии и стратегии поведения. Каж- дая смешанная стратегия рг определяет стратегию
126 И. Н. ВРУБЛЕВСКАЯ поведения f> j, [1], [2]: нЧ^еКе! л*, л*(У) = у] [?[tf SRel лЧ [V [л4 (U) = у] для U (= Rel р*, для U Rel рА Каждая стратегия поведения 0г определяет смешанную стратегию p*t [1]: 1^(0 = П Стратегией поведения, соответствующей смешанной стра- тегии р|ъ является исходная рг (лемма 3 [1]). Очевидно, (л1) 0 тогда и только тогда, когда [л*| cz cz | Рг | (п. 3.8). Следовательно, |p|i| cz | Р* |. Обратное вклю- чение очевидно. Таким образом, | р,^ | = | р* |. Легко видеть, что |p^| cz |цг|. Обратное неверно, см., например, рис. 1, где | *1(О)= 1, ( *1(0) = 2, | *1 (Л) = 2, ( *1(Л) = 1, рЛ = *1 + **, информация полная. Альтернатива | |хг|, но 2А^|₽^|- В [ рЛ | есть неактивные для Pjj альтернативы. Каждая такая альтерна- \У тива принадлежит U е Rel р,\ неактив- на для всех ** с рЛ (л1) > 0 и Rel л* Э U и активна для некоторого л* с Н{(*^)>0 и Rel л^С7. Обозначим их множество через | рЛ |; имеем | рЛ | cz | р/1 и Рис. I. ==|р,{|\|р). Очевидно: 1. ₽* = лг тогда и только тогда, когда Рр। = лг. 2. Если р.’ = лг, то = лг. Теорема 6.1. Если — лг, то р.* = лг. Доказательство. Покажем, что р1 смешивает лишь лг, совпадающие с л* на всех U GElV. Рассмотрим
ЭКВИВАЛЕНТНОСТЬ СТРАТЕГИЙ 127 U Rel (Г; 1 = ₽;нг7, ? (U))= 3. nV). n\U)^n\U) Единицу может дать лишь сумма по всем л*, для которых р*(л*)^>0. Поэтому для всех л* с р,*(л*)^>0 будет лг(С7) = лг(?7), т. е. рг смешивает лишь л\ совпа- дающие с лг на всех U Rel [?. Рассмотрим U ^Rel рг; (U, n\U)) = 1; следова- тельно , S. н*(л*)= S i -1 п . . UeRel"2 UeReU* тс* (U)~n\U) Таким образом, для любого U ЕЕ Rel р* для всех л* с р* (л*) 0: если t/eReln1, то л{(17) = г?(С7). (*) Поэтому достаточно доказать, что для Z/EERelp,* и любого л* с р*(л*)>0 будет U еРе!л*. Существует x^EiU A Possp,*; следовательно (из соот- ношения 3.4), существует л* с р*(л*)^>0 и ЕЕ Poss л*. Пусть zi, ...,£&— все позиции из Уг, последовательно предшествующие х, и zk+1 = х. Имеем z.EEPossTt* Zj ЕЕ Poss р,*, / = 1, . . ., к+ 1 (по (3.2)); значит, в силу замечания 3.8 лг (z.) = Vzj+1, J = 1,. . ., к; Zi — нижняя позиция, Zi ЕЕ Poss л* для всех л*; следовательно, по (*) для UZ1 для всех л* с р*(л*)>0 будет яг (Z1) = лг (Zj) = лг (Zr) = V*. Значит, z2 ЕЕ Poss л* для всех л* с р*(л*)^>0. Снова по (*) для UZi для всех л* с р*(л*)>0 будет лг (z2) = лг (^2) = (^2) == V*’ и так далее. Получим ж ЕЕ Poss л1, т. е. U ЕЕ Rel л* для всех л* с р?(л*)>0, что и требовалось. Теорема 6.2. рг эквиваленщно
128 И. Н. ВРУБЛЕВСКАЯ Доказательство. Для любого weW положив Ujy = W\ {U}u<VJ. Используя замечание 3.8, получим1) = s s п т л* (t/))= тгг я* Е/еиг we Poss яг we Poss пг = S П pi(^,ni(t^))= n P{(tf,v£)x я* Пецг U<w, n\U)==v™ U<wt Ueu* X 2 П p*(£7, л*(г7))=р*[гг>] П (СЛ, v) = p* [гр], VettW ueuyu так как 2 ₽’(t/-, v) = 1. В силу предложения 4.5 [х*$ и рг vu эквивалентны. Таким образом, |хг эквивалентно рг тогда и только тогда, когда рэквивалентно [х^. Имеем ₽г [z] — р,^ [и], положим ₽г(лг) = |х^ (лг). Теорема 6.3. Если, -ф}, / = 1, . . ., к, эквивалентны, то 1рг — S M’h г&е > О и 2 = 1, эквивалентно j=i. любому гр}0, /оЕ= {1, .. АО- Доказательство. Так как рг (лг) = [х^ (лг), в гр* вместо всех гр} типа ₽г можно подставить [х*$. Если сде- лать эту замену, то грг можно рассматривать как комби- нацию соответствующих jx}, и для любого w^W имеем [w] = (3 = 3 (S (дг) л1 [w] = ‘ / ni S’=l * • ... — S (3 С’1*)') М = 2 Ij (лг) лг [w] = ni ;==1 J—1 ... ,k. k , = 2 3 hj (я’)n' м = Е н! (И = S I wi - 7=1 71 г i х) лг | цгу — ограничение отображения.
ЭКВИВАЛЕНТНОСТЬ СТРАТЕГИЙ 129 fc В силу предложения 4.5 это равно 2 Мк I»] = < 1^1 > и снова по предложению 4.5 фг эквивалентно ф}0. Теорема 6.4. Poss ргс= Poss [Г*. Доказательство. Если х ЕЕ Poss рг, то в силу соотношения 3.4 х s Poss л1 для некоторого л* с рг (лг) > 0. Пусть Zj,..., zk — все позиции из Р, последовательно предшествующие х, и zy для / == 1,..., к\ z: ЕЕ Poss?T по (3.2); поэтому Uj ЕЕ Rel я1 cz Rel рг (по соотношению 3.4) и р* ЦУуЕЕ Rel лг] > 0 для j — 1,..., к. Имеем и - п ₽;< v-j); Р-, (Zj, V-.) = р*, (t/,, вычисляются по . соответствующей U ЕЕ Rel р1 формуле, лг(СЛ) =лг (z)—v^ (замечание 3.8). Таким образом, и чис- лители и знаменатели положительны; следовательно, каж- дый множитель положителен и [я] >0. В силу предложения 3.3 хEEToss fJjj. 7. Случай полной памяти. Говорим, что игрок i имеет полную память, если Poss л* Q Р= (j Ве1л2 Q Т1 для всех л\ (Как известно, это равносильно следующему условию: для любых U, FgU\ если U <7, то VczD (U, v) для некоторого v.) Положим рг {U} = рг Rel лг]. Всегда рг[я] p2{i7} для х е U. Чтобы игрок i имел полную память, необходимо и достаточно любое из условий: 1. Possp2 Q P=(U Ке1рг) П Тг rrh. всех рг. 2. xEEPossp2 (х ЕЕ Poss л2) тогда и только тогда, когда £/xGERelpj (£7хЕЕКе1л*) для всех р1 (всех л*) и всех х^ Т\ 3. х^ Posspi (хее Poss л1) тогда и только тогда, когда yGEPossp1 (у ее Poss л*) для всех р* (всех л*) и всех х, у, U таких, что х, yEEUEzVf. 4. р* {U} = р* [я] для всех р* и всех х. U таких, что яе/7е1Г. Позиционные игры
130 И. Н.ВРУБЛЕВСКАЯ Равносильность полной памяти и 1 следует из соотно- шения 3.4; 2 и 3 равносильны 1; 4 равносильно 2. Очевидно, для zEE?n имеем zv ЕЕ Poss лг тогда и только тогда, когда zee Poss лг и лг (z) = v. Таким образом, если игрок i имеет полную память, то из условия 4 и теоремы 5.5 следует, что любое р,г эквива- лентно рн, тогда и Poss р? = Poss Pjj. Если игрок i не имеет полной памяти, то по условию 3 в структуре содер- жится какая-нибудь из двух изображенных на рис. 2 схем. Рис. 2. В каждом случае легкой построить р? л! + -i- , для оторого Poss Poss Р'1- Тогда не [может бытьк и эквивалентности рг и р^ Таким образом, получаем теорему Куна[[1]: ^эквива- лентно Р^г для всех р,г тогда и только тогда, когда игрок i имеет полную память. Аналогично: Poss рг = Poss Pj^ для всех р,* тогда и только тогда, когда игрок i имеет полную память. 8. О точке равновесия. В связи с замечанием 3.9 и предложением 4.3 приведем здесь для полноты еще заме- чание о достаточности употребления а? вместо общих фЛ Рассмотрим произвольную игру с функцией выигрыша й; ф есть точка равновесия игры, если Яг(ф) > Яг(ф ||фг) для всехфг и для каждого игрока i. На основании теоремы 6.2 и следствия 4.6, полагая Р* (л*) = |1’г (Л*) И $ (л) = П (лг),
ЭКВИВАЛЕНТНОСТЬ СТРАТЕГИЙ 131 можно записать ар* [z] = [z], и поэтому $ [z] = StyC™)31 lzb n Отсюда получим, что для ожидаемой функции выиг- рыша Нг($) = S i(w) ф [w] weW справедлива и формула (в [2], стр. 50,— для р) я Используя это представление, получим: для каждого i имеем Нг (ф) Нг (ф ||ф2) для всехф1 тогда и только тогда, когда £Р (ф) > Яг(ф || лг) для всех пг (в [2], стр. 30, — для р). Таким образом, достаточно определять точку рав- новесия с помощью лг; определения ее в [1] ив [3] равно- сильны. ЛИТЕРАТУРА [1] Кун Г. У., Позиционные игры и проблема информации, см. настоящий сборник, стр. 13—40. * [2] Воробьев Н. Н., Конечные бескоалиционные игры, Успс* хи матем. наук 14, выл. 4 (1959), 21—56. [3] Б е р ч Б. Дж., Об играх с почти полной информацией, см. настоящий сборник, стр. 72—93. [4] Кораблева Л. А., Дипломная работа, 1958, Мат.-мех. факультет ЛГУ. 9*
ФИНИТАРНЫЕ ИГРЫ1) Дж. Р. Исбелл Университет Джорджа Вашингтона; Бюро военно-морских исследований Введение В этой статье формулировки известных теорем приме- няются к новым определениям. В результате обнаружива- ется, что позиционные игры в смысле фон Неймана—Куна в действительности охватывают более широкий класс игр, чем считалось ранее. Все наши теоремы сводятся к утвер- ждению о наличии у определенных классов игр ситуаций равновесия в тех или иных классах стратегий; в связи с этим мы должны достаточно тщательно описать соответ- ствующие классы игр. Прежде всего, мы снимаем ограничение Куна [11] о том, что партия не может проходить через информационное мно- жество более одного раза. Для обеспечения разрешимости получающихся при этом игр нужно допускать стратегии, являющиеся вероятностными смесями стратегий поведения; говоря точнее, если ограничиваться стратегиями обычного вида (т. е. смесями чистых стратегий), то мы находим фор- мальное решение, однако игрок, возможно, смог бы улуч- шить свое положение при помощи непосредственной локаль- -1) Isbell J. R., Finitary games, Contributions to the theory of games, vol. Ill, Princeton, 1957, 79—96. Эта статья представляет собой часть докторской диссертации автора в Принстонском университете; поддержана (частично) Бюро военно-морских исследований при Университете Джорджа Вашинг- тона по контракту № 700NR41904. Она была представлена (частично. Американскому математическому обществу 28 февраля 1953 г)
ФИНИТАРНЫЕ ИГРЫ 133 ной рандомизации. Два рецензента настоящей статьи предложили интерпретации для этого нового положения вещей. Первая из них заключается в том, что ходы осуще- ствляются при помощи некоторых рандомизирующих устройств. По поводу каждого хода посредник запраши- вает у такого устройства его решение. Перед партией каж- дый игрок назначает установки своих устройств — по одной установке для каждого из своих информационных множеств. Таким образом, ему нужно по одному устрой- ству для каждого его информационного множества; однако любое устройство в течение партии может действовать более одного раза. Такое положение может возникнуть, если решения следует осуществлять быстрее, чем может дейст- вовать человек (например, при перехвате баллистической ракеты); легко также представить себе причины, по кото- рым могло бы оказаться невыполнимым вмонтирование в машину запоминающего устройства (например, ограниче- ния на вес). Вторая интерпретация ближе к предложенному Куном [11] понятию стратега (а также к первоначальной интер- претации автора). Ходы будут совершаться личными аген- тами, не понимающими игру в целом, но способными выпол- нять предписанную им рандомизацию. Так как эти агенты обладают памятью, нужно иметь отдельного агента для каждой позиции; но для всех агентов, соответствующих одному и тому же информационному множеству, дейст- вует одно предписание. Это могло бы случиться из-за того, что в критической обстановке центральное управле- ние слишком занято, чтобы анализировать все локаль- ные условия, или просто из-за перегруженности средств связи. Каждая из этих интерпретаций предполагает, что лежа- щая в основе игры структура удовлетворяет ограничению Куна. По некоторым причинам игрок не может с выго- дой для себя использовать всю информацию, имеющуюся в этой основной структуре. Из-за этой невозможности он что-то теряет (информация его противников считается фиксированной); однако он потерял бы еще больше, если бы ограничился смесями чистых стратегий. Дру- гими словами, он достигает лучшего для себя резуль-
134 ДЖ. Р. ИСБЕЛЛ тата при помощи частичной децентрализации своих ре- шений. Формальное доказательство существования ситуаций равновесия представляет собой некоторую переработку соответствующих результатов Дрешера, Карлина и Шеп- ли [2]. Во-вторых, мы следуем введенному Куном понятию фактор-игры [11] и разлагаем конечную игру в ее (един- ственный) композиционный ряд, состоящий из минимальных фактор-игр. В-третьих, мы допускаем бесконечные позиционные игры той же природы, что и конечные, при- чем бесконечно продолжающимся партиям приписывается нулевой выигрыш. В-четвертых, мы разлагаем такие фи- нитарные игры в композиционные ряды и затем в стоха- стические формы. Стохастические игры Шепли [12] обра- зуют подкласс стохастических форм финитарных игр; однако последние следует отличать от «инфинитарных игр», в которых бесконечным партиям приписываются ненулевые выигрыши, и от обобщенных стохастических (рекурсивных) игр Эверетта [4]. Наконец, в статье содержатся некоторые сведения о программных играх. Важность подобных игр ограничива- ется в основном той областью, в которой они возникли,— моделированием некоторых тактических задач. Программ- ная игра включает, как правило, две группы неоднород- ных сил; для каждого типа оружия выбирается враже- ская цель или распределение его огня между несколькими целями. Через некоторое время одна единица будет выве- дена из строя, и для продолжения процесса будут вы- браны новые стратегии. Функция выигрыша здесь дробно- линейна. Такие тактические модели рассматривались на- ми в [9]. Здесь мы приводим для дробно-линейных функ- ций выигрыша теорему существования, которая понадо- бится нам в [81 (вторая часть диссертации автора). Можно также рассматривать подобную игру как единственный ход, не принадлежащий какому-либо игроку, а раз- деленный между всеми игроками; развивая эту идею, мож- но продолжать строить позиционные игры из таких ходов. Мы завершаем статью крагк м описанием такой опера- ции построения и намечаем доказа ельство соответствую- щей теоремы существования.
ФИНИТАРНЫЕ ИГРЫ 135 § 1. Конечные игры Как обычно, мы употребляем термин «игра» для обо- значения некоторого неполного набора правил. Определяя класс допустимых стратегий, мы тем самым получаем функ- цию, сопоставляющую стратегиям случайные процессы; эту функцию также можно было бы назвать игрой. Определение. Конечной игрой Г = Г\у для ко- нечного множества игроков N ={1,..., п} называется упорядоченная пара (<?, Я); игровая структура G есть упорядоченная тройка (К, Р, J), а выигрыш Н — упоря- доченная пара (С, F). При этом: (а) Дерево игры К есть конечное частично упорядочен- ное множество позиций, обладающее наименьшей позицией О и такое, что для любой позиции хе^К существует ровно одна максимальная цепь от 0 до х, называемая отрезком партии, приводящим в х. Максимальная позиция назы- вается окончательной х). Позиции, непосредственно сле- дующие за позицией х, называются альтернативами в х. В каждой позиции, не являющейся окончательной, дол- жно быть не менее двух альтернатив. (б) Разбиение по игрокам Р есть разбиение множества всех неокончательных позиций на п 4~ 1 множество оче- редности PQ, Р1?..., Рп. Позиции из множества Ро назы- ваются позициями случая, а позиции из Р„ i^> 0,— лич- ными позициями игрока i. • (в) Информация J есть упорядоченная пара (U, Q) разбиений. Информационное разбиение U представляет собой подразделение разбиения Р; его элементы называ- ются информационными множествами. Если х и у — позиции из одного информационного множества, то дол- жно существовать взаимно-однозначное соответствие меж- ду альтернативами в х и альтернативами в у. Разбиение по выборам Q устанавливает такое соответствие; элементы Q называются выборами * 2). Для каждого выбора q должно существовать такое uEL U, что # содержит ровно одну аль- тернативу для каждой позиции из и. Тогда говорят, что г) Соответствующий отрезок называется партией. (Прим, ред.) 2) Или альтернативами информационного множества. (Прим, ред.)
136 ДЖ. Р. ИСБЕЛЛ q есть выбор над и; если то q есть выбор над Р{. Объединение Q равно К \ {0}. (г) Правило посредника С есть функция, сопоставляю- щая каждому информационному множеству u cz некото- рое распределение вероятностей на выборах над и. (д) Целевая функция F есть функция на окончательных позициях; ее значения суть вещественные неотрицатель- ные ^-мерные векторы. Это определение является видоизменением определе- ния Куна [11]. Мы переместили термин выигрыш с F на Я, чтобы облегчить обобщение на бесконечные игры. В ко- нечной игре случайные ходы могут совершаться с любыми независимыми распределениями вероятностей, причем их изменения не оказывают серьезного влияния на стратеги- ческую природу игры. Конечно, предполагается, что игро- кам известно правило посредника, равно как и все осталь- ные элементы этого определения. Мы приняли здесь предложение Дэлки [1] о наведении информационной структуры и на позиции случая. Это означает, что некоторые позиции случая могут «склеи- ваться», так что на альтернативах каждой из них должно использоваться одно и то же распределение вероятностей. Такое положение представляется отвечающим действи- тельности; например, в нескольких различных точках дерева игры могла бы быть перетасована и сдана одинако- вым образом колода карт. Мы не принимаем более сильное предложение Данна и Оттера [3] о допущении общих не независимых правил посредника: нам представляется, что соответствующих реальных ситуаций не существует. Используемая нами форма допускает, что игроки могут получать о случайных выборах информацию, являющую- ся в каком-то смысле неполной; так, случайная позиция мо- жет иметь пять альтернатив, три из которых лежат в од- ном информационном множестве. Разумеется, игру, которую можно описать в одной из этих форм, можно описать и в любой другой (за исключе- нием требования Куна, Дэлки и Данна — Оттера о том, что партия не может пересекать информационное множе- ство по двум позициям). Однако классы игр, построенных на данной игровой структуре, будут в разных формах различными.
ФИНИТАРНЫЕ ИГРЫ 137 Основным типом стратегии в наших рассмотрениях яв- ляется стратегия поведения. Пространством стратегий игрока i служит топологизированное с помощью пото- чечной сходимости пространство всех функций $, аргумен- тами которых являются информационные множества uczP^ а значениями 5 (и) — распределения вероятностей на вы- борах над и; иными словами, это есть пространство всех функций, определенных на выборах над Р{, значениями которых являются вещественные неотрицательные числа, дающие единицу при суммировании по каждому информа- ционному множеству. Пусть — множество всех выборов над Р^ пусть Qu для каждого означает множество всех выборов над и. Определение.’ Симплексом коэффициентов Su называется абстрактный симплекс всех вероятностных векторов на Qu. Пространство стратегий есть декарто- во произведение X исР4 Элементы пространства стратегий называются стратегиями поведения, а их координаты — коэффициентами поведения. Стратегия поведения представляет собой таблицу || || коэффициентов поведения; каждое есть вероят- ность А-го выбора в /-м информационном множестве игрока i. Чтобы реализовать эту стратегию, игрок снаб- жает каждое из своих информационных множеств и,- некоторым случайным механизмом М-}. Когда встречается позиция из множества и-}, посредник запрашивает соот- ветствующий механизм о его выборе. С самого начала игрок устанавливает все механизмы таким образом, чтобы механизм М. выбирал к с вероятностью s}*. (Если будут использоваться только стратегии поведе- ния, то может оказаться достаточной и более простая схема разыгрывания; однако в общем случае требуется некоторая схема, подобная описанной.) Для описания случайного процесса, в который превра- щается игра, когда все игроки выбирают свои*стратегии поведения, нужно ввести некоторые обозначения. Пусть правило посредника С представляется в виде матрицы $° = ||$#||. Обозначим множество всех оконча-
138 ДЖ. Р. ИСБЕЛЛ тельных позиций через Z. Вероятность прийти в позицию х равна произведению, взятому по отрезку партии от 0 до ж, вероятностей однозначно определенных выборов, требую- щихся для того, чтобы остаться на этом отрезке. Обозна- чим это выражение через Рг (х) = П^. Конечно, индексы X i, к зависят от нескольких переменных; однако в целом их набор определяется позицией х. Тогда математическое ожи- дание выигрыша будет вектор-функцией Е = 3Pr(Z)F(Z). Z Обозначим через f-ю компоненту функции выигрыша (целевой), а через Ег — ожидание f-ro игрока. Имеем Ei (?, . . ., Sn) = 2 (z) П 4m. Постоянные F{ (z) И 4m 7 Z n можно включить в выражение Sn Zzi(^), где Д равно, z ;=1 с точностью до постоянного множителя, произведению тех S%r, ВХОДЯЩИХ В Рг (и), ДЛЯ КОТОрЫХ р — /. Мы преобразуем в пространство векторов ($0) == = р3 (PiZ (//)). Тогда выигрыш VSinw Z М будет полилинейным, и теорема Какутани о неподвижной точке [10] обеспечивает существование ситуаций равнове- сия в выпуклом замыкании преобразуемого множества. Возьмем это выпуклое замыкание. Для того чтобы реализовать выпуклую комбинацию стратегий поведения/следует рандомизировать до начала партии по формальным выпуклым комбинациям Sam5m m и использовать выбранное sJmQ для рандомизации в течение партии. В изложенной выше схеме матрицы s7m служат как бы шкалами установок для рандомизирующих устройств. Первоначальная идея такой трактовки игр принадле- жит Дрешеру, Карлину и Шепли [2], которые, однако, не применяли ее к позиционным играм. Пусть дана конечная игра Г^. Определим на множестве Sj преобразование следующим образом: Tj ($7) есть вектор xiz с компонентами fz (s3). Обозначим Tj (s>) = р3,
ФИНИТАРНЫЕ ИГРЫ 139 Л; GO = Piz, т}; (5) = 7? . Будем называть j-м простран- ством моментов Mj выпуклое замыкание множества Rj. По известной теореме Фенхеля [5] каждая точка из Mj является выпуклой комбинацией не более чем п|И| то- чек х) из компактного связного множества Т?7. Прежде чем доказывать существование ситуации рав- новесия, следует дать ее определение. Для этого нужно определить три других типа стратегий. Смешанной стра- тегией игрока i называется вероятностная мера на боре- левских подмножествах множества Чистая стратегия— это такая стратегия поведения, все координаты которой равны нулю или единице. Линейной стратегией называется смешанная страте- гия, приписывающая множеству всех чистых стратегий единичный вес. Определение. Ситуацией равновесия относи- тельно какого-то класса стратегий называется такой п- набор стратегий (по одной на каждого игрока), что ни один игрок не может увеличить математическое ожидание своего выигрыша, изменив свою стратегию на другую стратегию из допустимого класса. Общим положением является следующее. Для любого множества допустимых стратегий ситуация равновесия в этом множестве является также ситуацией равновесия в выпуклом замыкании этого множества. В самом деле, если игрок не может улучшить свое положение при помо- щи любого элемента из допустимого множества своих стра- тегий, то тем более он не может его улучшить, используя смесь этих элементов. (При фиксированных стратегиях противников в результате выбора игроком некоторой вы- пуклой комбинации своих стратегий получится в точности такая же выпуклая комбинация математических ожида- ний выигрышей для комбинируемых стратегий.) Поэтому ситуация равновесия относительно стратегий поведе- ния (чистых стратегий) является также ситуацией равно- весия относительно смешанных стратегий (линейных стратегий). Однако ситуации равновесия относительно линейных стратегий всегда существуют. Чтобы это доказать, заме- r) |Z| — число элементов множества Z. {Прим, ред.)
140 ДЖ. Р. ИСБЕЛЛ чаем, что если игроки ограничиваются линейными стра- тегиями, то в двух позициях из одного и того же информа- ционного множества невозможно произвести различные выборы. Это обстоятельство позволяет построить обычную игру (в смысле Куна и других авторов, где каждая пар- тия пересекает информационное множество не более одного раза) следующим образом: 1) Если у > х в одном и том же информационном мно- жестве, удаляем все позиции > у, требующие выборов, отличных от выбора в х. 2) Затем заменяем каждый такой у (единственной) оста- ющейся, непосредственно следующей за у позицией z > у. В результате получается игра в обычном смысле, и можно перейти к известной теории [11]. Доказательство существования ситуаций равновесия в смешанных стратегиях, по существу, не отличается от сделанного Какутани первоначального применения своей теоремы о неподвижной точке [10]. Согласно этой теореме отображение компактного выпуклого подмножества про- странства^, переводящее точки в выпуклые множества и имеющее замкнутый график, обладает неподвижной точ- кой, т. е. существует точка, принадлежащая своему обра- зу х). Соответствующая область есть М — декартово про- изведение п пространств моментов Мр Если p = (pj)EE И, то обозначим через У* (р) подмножество множества Мь состоящее из тех точек гг, для которых достигается макси- мум Et(pl,. . .,г\. . .,рп) = ЗпгП p[z. z Mi Множество (р) при каждом р является максимизирую- щим множеством для линейной функции, и, следовательно, оно непусто, выпукло и замкнуто. Положим Y (р) = = ХУг(р)- Далее, дополнение к графику отображения Y открыто. В самом деле, если у ^Y (р),т. е. уг не лежит в максимизирующем множестве У Др) при некотором f, то 2]г/|гП р{г<шах —8 _______________ z г х) По этому поводу см. [6], а также статью Боненбласта и Кар- лина в сборнике «Бесконечные антагонистические игры», М., Физ- доатгиз? 1963. (Прим, перев.}
ФИНИТАРНЫЕ ИГРЫ 141 для некоторого е 0, и поэтому некоторая окрестность пары (р, у) целиком состоит из точек вида (г, а), где а1^ (г). Следовательно, можно применить теорему Ка- кутани, и существует точка р = (р*), в которой ни .один из игроков не может улучшить своего поло- жения. Тем самым до- казана. Теорема 1.1. Ко- нечная игра обладает ситуацией равновесия в смешанных стратегиях. На рисунке изобра- жен простейший при- мер, который мы могли найти для иллюстрации необходимости введения смешанных стратегий, не являющихся линей- ными. Здесь изображена антагонистическая иг- ра ; у каждой окончатель- ной позиции указан выигрыш игрока I в ней, равный вы- игрышу игрока II, взятому с противоположным знаком. Стратегия игрока II очевидна. Можно проверить, что игрок I получает 9/16 рандомизацией между == 3/4, х2 = О, х9 = 1/4, ух =0, у2 = 1} и {х-х = 0, х2 =*3/4, = 1/4, Ух = 1, у2 = 0} с равными вероятностями и что это един- ственная оптимальная стратегия. Никакая линейная стратегия не может дать игроку I больше 1/2, и ника- кая стратегия поведения не может дать ему боль- ше 25/64. Можно назвать конечную игру линейной, если ни один отрезок партии не пересекает никакое личное информа- ционное множество дважды. При этом условии игра бу- дет игрой в смысле Куна, и, следовательно, имеет место лемма 3 Куна [И]: для любой стратегии поведения^ существует такая линейная стратегия, при которой вероят- ность каждой альтернативы, выбранной игроком i, тако- ва же, как и при Иначе говоря, пространство момен- ов Мг натянуто на линейные стратегии.
142 ДЖ. Р. ИСБЕЛЛ Теорема 1.2. Линейная игра имеет ситуацию рав- новесия в смешанных стратегиях, содержащую только ли- нейные стратегии. Доказательство. Согласно классической тео- рии существуют линейные ситуации равновесия. На осно- вании леммы Куна в линейной ситуации равновесия ни один игрок не может улучшить своего положения при по- мощи смешанной стратегии, так как он не может улучшить его при помсщи стратегии поведения, а последнее потому, что по определению он не может улучшить своего поло- жения при помощи линейной стратегии. Проведем это рассуждение подробнее; однако после- дующие доказательства будут проводиться в описательной форме. Пусть s1,..., sn — линейные стратегии для всех п игроков, образующие линейную ситуацию равновесия. Допустим, что некоторая выпуклая комбинация и1 = 3 стратегий поведения игрока i такова, что Ei (s[| иР) = Д (s1, .. ., и\ . .sn) > Ei (s). Тогда в силу линейности для некоторого v} будет (s). По лемме Куна существует линейная стра- тегия у\ для которой Е^ (s||yf) —EilsWv}). Но это про- тиворечит предположению. Принадлежащее Куну [11] доказательство существо- вания в игре с полной памятью ситуации равновесия в стратегиях поведения применимо и здесь, так как игра с полной памятью линейна. Однако можно подойти к этому вопросу несколько иначе. Прежде всего, игрок i имеет полную память, если для любых х, у EEzPt и х <Z У имеем: 1) х и у принадлежат различным информационным множествам и и v, 2) каждому элементу z из v предшествует некоторый элемент w из и, так что 3) выбор в w, лежащий на отрезке партии от Одо z, таков же, как выбор вх, лежащий на отрезке партии от Одо у. Таким образсм, игрок помнит в позиции у все, что он знал в х, и помнит свой выбор, сделанный в х. Тогда частич- ное упорядочение позиций индуцирует частичное упоря- дочение нформационных множеств игрока i. В самом де-
ФИНИТАРНЫЕ ИГРЫ 143 ле, соотношения х< у,х^и, у ЕЕ у исключают возможность соотношений z <f w pjin zEE.v,w ЕЩ так как в противном случае должен был бы существовать друг ой элемент а Е^, для которого а < z < w, а тогда а и z не удовлетворяли бы условию 1). Теорема 1.3. Если игрок i имеет полную память, то множество выпукло. Доказательство. Произвольная выпуклая ком- т бинация р = S где является образом й=1 стратегии поведения s, определенной следующим обра- зом. Обозначаем = || s*b ||. Для каждого Ли для каж- дого информационного множества пусть есть про- изведение коэффициентов slcd по всем информационным мно- жествам ccPi, предшествующим а; здесь d есть номер вы- бора, производимого вей лежащего на отрезке партии от 0 до а. При2 = 0 возьмем ваъ произвольно; для к положим __ к к Соответствующая формула легко проверяется. Говорят, что игра разложима в позиции х* если любое личное информационное множество, пересекающее дерево, которое состоит из всех позиций у х, содержится в этом дереве. Подыгра конечной игры Г имеет своим игровым деревом поддерево дерева игры Г; остальные элементы для подыгры определяются при помощи ограничения. Если наименьшей позицией поддерева является х, соответствую- щую подыгру можно обозначить через ГЛ. Проведенное Куном [11] исследование подыгр полностью применимо и в этом случае. Однако вместо понятия фактор-игръг мы будем пользоваться более простым понятием. Определение. Конечным участком I называется упорядоченная пара (G, Н), где G — (конечная) игровая структура, Н — упорядоченная пара (С, F)\ С есть правило посредника в G и F — функция на окончатель-
144 ДЖ. Р. ИСБЕЛЛ ных позициях, значениями которой являются неотрица- тельные векторы или конечные участки (в каждом случае) для игроков G. Рассмотрим сначала наименьший класс, удовлетворяю- щий этому определению. Определение. Композиционным рядом конечной игры Г = Го называется частично упорядоченное мно- жество в конечных участков, определяемое следующим образом. ЭлементыЕЕ ® находятся во взаимно-однознач- ном соответствии с подыграми Гх игры Г . Для каждого Гх игровое дерево элемента Ц есть множество всех позиций у ЕЕ Гх таких, что если х <С z у, то Г неразложима в z. Игровая структура и правило посредника для 1Х являются ограничениями соответствующих объектов для Г игровым деревом элемента 1Х. Целевая функция F* для 1Х определяется так: если z есть окончательная позиция и в 1Х и в Г, то F* (z) = = F (z); в противном случае Г разложима в z, и тогда F*(z) ~IZ. Множество ©частично упорядочено при помо- щи отношения <j именно, 1Х<С 1У в том и только в том слу- чае, когда х <Z У- Стационарной стратегией игрока i в игре Г называется такая функция о на ©, что о (/х) пред- ставляет собой смешанную стратегию игрока i в 1Х. Теорема 1.4. Конечная игра имеет ситуацию рав- новесия в стационарных стратегиях. Доказательство. Эта теорема, по существу, совпадает с теоремой 3 Куна [И]; приведем здесь вероят- ностное доказательство. Прежде всего, пусть игра Г разлагается в х на игру Гх и участок /0 (ни один из них не обязан быть неразложимым). В Гх существует ситуация равновесия q = (^’); она определяет для игроков матема- тические ожидания, которые можно подставить в целевую функцию для /0 в качестве ее значения в х. Это опреде- ляет игру /0> которая имеет ситуацию равновесия г = = (п). Рассмотрим ситуацию s _ ($*) в Г, полученную комбинированием q л г независимым образом х). Ни один из игроков не может увеличить математическое ожидание своего выигрыша, отклоняясь от своей стратегии из $, т) То есть составлением их декартова произведения {Прим, ред.)
ФИНИТАРНЫЕ ИГРЫ 145 при неизменяющихся стратегиях остальных игроков, так как он, конечно, не может увеличить свое ожидание в Гх, а если бы он мог выгадать в позициях, не следующих за х, то г не было бы ситуацией равновесия. Доказательство завершается по индукции таким же образом. § 2. Финитарные игры Конечный участок можно расширить, присоединяя к нему участки, которые являются значениями его целевой функции. Этот процесс продолжается и дает счетную (воз- можно, конечную) совокупность элементов, весьма сход- ную с игрой. Подобный объект, вообще говоря, не обязан иметь ситуацию равновесия; не обязательна даже возмож- ность окончания. Тем не менее в этой связи представля- ется разумным принять два предположения. Во-первых, для каждого игрока i каждая неоканчивающаяся партия имеет определенную цену не зависящую от конкретного течения партии. Во-вторых, возможные прибыли при /с-м ходе учитываются с самого начала игры с некоторой скидкой (к можно считать количеством лет в будущем) и затем ограничиваются величиной МД*', где М — некоторая постоянная и 0 < Д <Г 1. Первое из этих предположений, несомненно, является не вполне приемлемым, так как в течение партии могут иметь место непосредственные дей- ствия, не обрывающие партию, но оказывающие влияние на ее полезности для игроков. Можно считать допустимым ограниченный платеж при каждом ходе, в силу замечания, противоположного известному замечанию Мальтуса: ряд, мажорируемый рядом с общим членом кМ^к, сходится. В теории игр это замечание уже употреблялось с пользой у Шепли [12]. Отметим, наконец, что если только не иметь в виду торгов, то можно также вычесть величину так что цена бесконечно продолжающейся партии будет про- сто суммой получаемых промежуточных прибылей. Определение. Мальтузианской игрой Г назы- вается упорядоченная пара ((?, Я), где G = (Я, Р, J), Н = (С, F) подчинены условиям, определяющим конеч- ную игру, но видоизмененным следующим образом. Дерево игры К счетно, но число альтернатив в каждой позиции конечно; целевая функция F определена на всех позициях; Ю Позиционные игры
146 ДЖ. Р. ИСБЕЛЛ существуют такие вещественные положительные числа М и А, Д < 1, что все Fi (z) ограничены по абсолютной величине числом МА&, где к есть длина отрезка партии от О до z. Стратегия в этом случае представляет собой бесконеч- ную таблицу || (I со строками конечной длины, для кото- рой 2^1 = 1- Мы хотим применить теорему з Гликсберга [6] о существовании ситуаций равновесия от- носительно регулярных вероятностных мер для любой игры с непрерывной функцией выигрыша на конечном произведении компактных хаусдорфовых пространств. Тре- бование регулярности обеспечивает существование матема- тических ожиданий; но так как стратегии поведения допу- скаются, то такое равновесие сколь угодно устойчиво. Далее, пространство стратегий любого игрока, разу- меется, компактно в топологии произведения, в кото- рой последовательность {(6^)} сходится тогда и только тогда, когда сходится каждая координатная последова- тельность {biajQ}. Мальтузианское условие1) в действи- тельности обеспечивает непрерывность в этой тополо- гии. В самом деле, по любому е > 0 найдется такое к, что MAfc<^e(l — А)/2; следовательно, ожидание выигры- ша при ходах дальше А-го меньше в/2. Остается ожидание выигрыша в конечной игре, получающейся при прекраще- нии игры после к ходов; но это — непрерывная функция стратегий, поскольку она меняется в достаточно малых окрестностях меньше чем на е/2. Итак, имеем следующую теорему: Теорема 2.1. Мальтузианская игра имеет ситуа- цию равновесия. Мальтузианское условие сильнее, чем необходимое. Если определить финитарную игру при помощи ослабле- ния предыдущего определения до требования непрерыв- ности функции выигрыша в топологии произведения, то мы получим Следствие. Финитарная игра имеет ситуацию равновесия. г) См. предыдущее определение (Прим, ред.)
ФИЙЙТАРЙЫЕ ИГРЫ 147 Лемма Куна и, следовательно, теорема 1.2 переносятся на линейные финитарные игры. Для этого используется обычная теорема из теории меры: для любой последова- тельности {S1} пространств с вероятностной мерой суще- ствует единственная мера *) на их произведении X Яг, которая для любого конечного множества координатных индексов комбинирует данные меры независимым образом2). Для каждого игрока i возьмем конечное множество S1 для каждого из его информационных множеств пусть S'1 содержит по одной точке для каждого выбора над щ. Стратегия поведения || Ъц || естественным образом ин- дуцирует на каждом S'1 вероятностную меру; произведение мер, очевидно, дает требуемую линейную стратегию. Теорема 2.2. Финитарная игра, в которой ни одно информационное множество не пересекает отрезков партий дважды, имеет ситуацию равновесия в линейных стратегиях (относительно смешанных стратегий). Композиционный ряд не является обязательной наи- более отчетливо выраженной формой для общей финитар- ной игры. Вполне может произойти, что игрок будет мно- гократно играть один и тот же участок, получая выигрыш либо со скидкой, либо в полном объеме. Правда, допуска- ется возможность окончания игры в любой момент 3). В соответствии с этим подойдем к вопросу о разложении немного иначе. Мы, таким образом, воздержимся от опре- деления инфинитарных участков. Для данной финитарной игры Г определим частично упорядоченное подмножество D (Г) дерева игры Г как множество тех позиций х, в которых игра Г разложима. Определим в D (Г) отношение эквивалентности, считая х эквивалентным у, если между деревьями подыгр Гх и существует взаимно-однозначное соответствие <р, сохра- х) Она называется произведением мер. См. [13], § 38, теорема 2. (Прим, перев.) 2) То есть составлением их декартова произведения. (Прим, ред.) 3) Имеются две другие возможности такого рода. Либо выигрыш может быть нулевым, либо он может отсутствовать, если партия не выходит окончательноиз данного участка. В связи с последним слу- чаем оказывается возможным вполне удовлетворительно решать некоторые не финитарные игры [4]. 10*
148 ДЖ. Р. ИСБЕЛЛ няющее всю структуру этих подыгр, за исключением того, что может существовать такое вещественное положитель- ное число а ф 1, что ср переводит целевую функцию игры Гх в целевую функцию игры Гу, помноженную на а. Определим на множестве С (Г) классов эквивалентности множества 2? (Г) отношение предшествования 7?* следую- щим образом: [х] Я* [г/] тогда и только тогда, когда для некоторых представителей х^ [х], у^ [z/] имеет место х < у и не существует элемента z е D(Г), для которого х < z < у. Лемма. Введенная в Р(Г) эквивалентность явля- ется отношением эквивалентности. Если х и у эквивалент- ны, то существует единственное аху = 1/а^х, котором целевая функция игры Гх равна целевой функции игры Г^, умноженной1) на а. Если [я] 7?* [г/] в С (Г), то сущест- вует единственное п, обладающее следующим свойством: для любого элемента х ge [я] дерево игры Гх содержит п элементов yi,.. . , уп^[у] таких, что ни для какого z^D(T) не имеет места х <Z z <Z Уг\ кроме того, эквивалентность между хи х' переводит соответствующие им у^ друг в друга. Доказательство опускаем. Мы будем использовать С (Г) в качестве множества ин- дексов; для каждого z е С (Г) выберем какой-то элемент из z и обозначим его через х° (z). Определение. Стохастической формой @ фини- тарной игры Г называется упорядоченная тройка (5, R, О), где R есть отношение на множестве S, О — некоторый элемент из S. Элементы 12 множества S находятся во взаимно-одпозначном соответствии с элементами z е С (Г); R есть отношение, индуцированное отношением 7?*, a O=IZ()l где z$ представляет собой элемент [0] ^С(Г), содержащий наименьшую позицию 0 дерева игры Г. Каждое 72 есть упорядоченная пара (G, Н) — ((К, Р, J), (С, F*)). Здесь К — частично упорядоченное множество, изоморф- ное подмножеству X* дерева игры Гх, где х — любой эле- мент из z, состоящему из таких позиций у, что если х < w < у, то игра Г в w неразложима. Множества Р, J, С г) Если целевые функции игр Гх и Гу тождественно равны нулю, полагаем аху — 1.
ФИНИТАРНЫЕ ИГРЫ 14Р изоморфны соответствующим множествам из Гх для лю- бого xEz. Чтобы определить F*, выберем какой-нибудь изомор- физм р<-*р* между К и Если игра Гв р* разложима, то в качестве F*(p) берется упорядоченная пара (s', а), где z'e С (Г) — класс эквивалентности элемента р* и а ==а (р*, х° (г')). В противном случае полагаем 7%. (р) = = Г (р*), где F — целевая функция игры Г. Множества Iz являются участками игры Г. Произвольное множество I является участком в том и только в том случае, если суще- ствует некоторая финитарная игра Г, для которой I есть ее участок. Стационарной стратегией в финитарной игре называется такая функция на множестве ее участков, зна- чениями которой являются смешанные стратегии в игро- вых структурах соответствующих участков. Т е о р е°м а 2.3. Финитарная игра имеет ситуацию равновесия в стационарных стратегиях (относительно смешанных стратегий). Доказательство. Снова опираемся на теорему Гликсберга и с той же топологией (топологией произведе- ния). Стационарные стратегии соответствуют замкнутому подпространству пространства стратегий поведения, сле- довательно, существует относительная т) ситуация равно- весия. Если бы игрок i мог выгадать, изменив свою стратегию на нестационарную и используя стратегию s при одном появлении некоторого участка и s' — при другом, причем эти два появления имеют целевые функции F и aF, то либо его ожидания имели бы вид t, at, либо в одном из этих случаев он поступал бы лучше. Во всяком случае он не уменьшил бы своего выигрыша, используя каждый раз лучшую стратегию. При этом стратегии остальных игроков остаются фиксированными. Последо- вательно применяя это рассуждение ко всем появлениям всех участков, получаем противоречие с наличием отно- сительного равновесия. Однако могут существовать нестационарные ситуации равновесия, в которых любой игрок, пытающийся из- менить свою стратегию на стационарную, потеряет на этом. Ч В подпространстве. (Прим, ред.)
150 ДЖ. Р. ИСБЕЛЛ Принимая все это во внимание, было бы естественно определить стохастическую игру как игру, все участки которой имеют конечные игровые деревья. Шепли [12] провел особое исследование антагонистических стохасти- ческих игр; Эверетт [4] исследовал игры такого же вида, в которых ожидаемый выигрыш ограничен, но не стремится к нулю с увеличением числа ходов. (Это составляет лишь небольшую часть результатов Эверетта в [4].) В обоих случаях ожидание представляет собой дробно-линейную функцию стационарных стратегий; в рассмотренном Эве- реттом случае знаменатель ее может обращаться в нуль; тогда числитель также равен нулю, и ожидание в действи- тельности есть нуль. В общем случае^ ожидание имеет разрыв — скачок, Отметим, что для любо^ полиномиальной, соответ- ственно рациональной,^ алгебраической функции (в соот- ветствующих переменных, включая и причудливые при- меры Гликсберга и Гросса [7]) существует конечная, соответственно стохастическая, игра, имеющая эту функ- цию своей функцией выигрыша. Представление игры в позиционной форме часто сводят к представлению ее в терминах целевой функции на де- картовом произведении пространств стратегий. Простран- ство стратегий определяется как выпуклое подмножество гильбертова пространства последовательностей, компактное в слабой топологии. Обычно это — пространство моментов или мер, представляющих смешанные стратегии в фини- тарной игре. Целевая функция часто является полили- нейной; на основании теоремы Гликсберга о неподвижной точке [6] можно утверждать, что при такой функции имеется ситуация равновесия. Ниже приводится более сильный результат, который будет использован в [8]. Программные игры возникают естественным образом в некоторых моделях военных действий [9]. Имеется не- сколько единиц сил разного рода, не ожидающих подкреп- лений и ведущих огонь друг по другу. Говоря более фор- мально, система находится в данном состоянии и может перейти затем в любое из состояний Alv.., А™; все hi имеют определенные цены для каждого игрока. Каждый игрок должен выбрать программу, т. е. некоторый элемент про- странства стратегий (например, набор вероятностных мер,
ФИНИТАРНЫЕ ИГРЫ 151 представляющих пропорции, в которых следует распреде- лять огневую мощь различных единиц его сил). Пусть г;— программа j-го игрока, Р (t) — вероятность того, что в момент времени t не произошло перехода из одного * со- стояния в другое, Qi (t) — вероятность перехода в состоя- ние к моменту времени t. Предположим, что ^1 = (^ + 2г.«!)/>(<), <1> где а} — постоянные. Таким образом, предполагается, что действия программ независимы и связаны линейной дифференциальной зависимостью. Если предположить, что не все вероятности перехода равны нулю, то отношение вероятности перехода в состояние к вероятности пе- рехода в состояние hk не зависит от времени и дается формулой (2) Поэтому, если обозначить выражения в (2) через соот- ветственно рк, и цены состояний h{ через то вектор вы- игрыша будет ............rn)wi г ........ г (3) Это — дробно-полилинейная функция; поэтому, как сей- час будет указано, для нее имеется ситуация равновесия. Определение. Программной игрой называется вещественная n-мерная вектор-функция Р на произведе- нии п пространств стратегий 5П..., 5П, имеющая вид где Р (я1,..., хп) = Р(х) = (P1(x)i..., Рп(хУ), 2 П/д (j) (***) 0 3
152 ДЖ. Р. ИСБЕЛЛ здесь аир пробегают конечные множества, все ъ — непрерывные линейные функции, причем функции g строго положительны. Определение. Ситуацией равновесиям программ- ной игре называется такой га-набор стратегий (я1,..., хп), что Pi (х1, . . .,хп) — max Pi . . .,у\ . . хп). Тео рема 2.4. Программная игра имеет ситуацию равновесия. Доказательство опускаем; оно аналогично доказатель- ству теоремы 1.1. Соответствующее отображение!/1 здесь задается выражением Л(^) = {у*\ y'^Si, Pi{x\ . . .. .,хп) = max}. Вместо теоремы Какутани используется ее обобщение, принадлежащее Гликсбергу [6]: замкнутое отображение компактного выпуклого множества, переводящее точки в выпуклые множества, имеет неподвижную точку. В заключение дадим краткое описание одной общей игровой модели, содержащей обычные личные ходы и программные ходы, а также случайные ходы. Между про- чим, и личные и случайные ходы являются частными слу- чаями программных ходов. Разбиения по игрокам нет. Каждый игрок может действовать во всех позициях. Таким образом, каждый игрок должен обладать информационной структурой на всем дереве игры. Каждый игрок имеет для каждого из своих информа- ционных множеств щ пространство стратегий Для каж- дой позиции т определим Хшкак декартово произведение пространств стратегий Хь принадлежащих тем информа- ционным множествам щ, которые содержат т. Таким об- разом, в X™ имеется по одному множителю Хг для каж- дого игрока. Обозначим через пространство вероят- ностных распределений на альтернативах позиции т. Задана непрерывная функция ЯЛ1, переводящая X"* в
ФИНИТАРНЫЕ ИГРЫ 153 380 Ут1). Наконец, на множестве всех окончательных позиций задана целевая функция F; в играх п лиц значениями F являются вещественные тг-мерные векторы, а в антагони- стических играх — вещественные числа (представляющие величину платежа второго игрока первому). Резюмируем сказанное. Позиционная программная игра п лиц состоит из (1) конечного дерева игры К, (2) п информационных разбиений U' = {17}} на К, (3) компактных хаусдорфовых пространств X} всех информационных множеств U], (4) непрерывных функций Нт для каждой позиции т, переводящих Хт в У*>, как описано выше, (5) указанной выше целевой функции F. Ясно, что указание некоторой точки в каждом X} опре- деляет стохастический процесс, управляемый вероятно- стными распределениями, которые являются соответ- ствующими значениями функций Нт; далее, каждая ком- понента функции F будет иметь при этом процессе мате- матическое ожидание, причем это ожидание Е (F(x})) будет непрерывной функцией семейства {х}}. Согласно общей теореме Гликсберга о неподвижной точке [6], для существования ситуации равновесия при функции Е (F (•)) большего и не требуется. Напомним хорошо из- вестный факт, что ситуации равновесия в антагонистиче- ской игре суть как раз пары оптимальных стратегий для обоих игроков. Существо приведенного определения и описания дока- зательства, возможно, несколько затемнено их формой. Можно резюмировать его следующим образом. Хорошо известно, что при некоторых ограничениях значениями целевой функции игры могут быть другие игры. В этой г) Точка х £= X™ вполне определяет все относящиеся к делу параметры, которымц управляют игроки. В результате получается одпошаговый стохастический процесс, результатом которого являет- ся распределение вероятностей на альтернативах, а не одна альтер- натива, как в конечных или финитарных играх. Ход из позиции т можно сделать чисто случайным ходом, сводя к единственной точке. В этом случае нужно видоизменить информационное разбие- ние; осуществление деталей мы предоставляем читателю.
154 ДЖ. Р. ИСБЕЛЛ статье мы хотели именно подчеркнуть принцип: позиция- ми игры могут быть другие игры. С этой точки зрения приведенное выше определение просто предлагает подобранный список ограничений, уже показавший свою пригодность. Здесь возникает интересная задача нахождения более слабых ограничений, которой мы здесь заниматься не будем. ЛИТЕРАТУРА [1] Д э л к и Н., Эквивалентность информационных схем и су- щественно определенные игры, см. настоящий сборник, стр. 41—71. [2] Дрешер М., Карлин С., Шепли Л., Полиноми- альные игры, сб. «Бесконечные антагонистические игры», Физматгиз, 1963. [3] Dunne J., Otter R., Games with equilibrium points, Proc. Nat. Acad. Sci. USA 39 (1953), 310—314. [4] E v e r e 11 H., Recursive games, Contributions to the theory of games, vol. Ill, Princeton, 1957, ,47—78. [5] F e n c h e 1 W., Kriimmung und Windung geschlossener Raumkurven, Math. Annalen 101 (1929), 238—252. [6] Г л и к с б e p г И., Дальнейшее обобщение теоремы Каку- тани о неподвижной точке с приложением к ситуациям равно- весия по Нэшу, сб. «Бесконечные антагонистические игры», Физматгиз, 1963. [7] Гликсберг И., Гросс О., Замечания об играх на квадрате, сб. «Бесконечные антагонистические игры», Физмат- гиз, 1963. [8] I s b е 1 1 J., Absolute games, Contributions to the theory of games, vol. IV, Princeton, 1959, 357—396. [9] Исбелл Дж., Марлоу У., Игры на уничтожение, сб. «Применение теории игр в военном деле», «Сов. радио», 1961, 9—49. [10] Kakutani S., A generalization of Brouwer’s fixed point theorem, Duke Math. Journal 8 (1941), 451—459. [И] Кун Г. У., Позиционные игры и проблема информации, см. настоящий сборник, стр. 13—40. [12] S hap ley L. S., Stochastic games, Proc. Nat. Acad. Sci. USA 39 (1953), 1095—1100. [13]* X а л м о ш П., Теория меры, ИЛ, M., 1953. [14]* С ha rues A., Cooper W. W., Programming with linear fractional functionals, Naval. Res. Logist. Quart. 9, № 3-4 (1962), 181-186; 10, № 3 (1963), 273, 274.
ТЕОРЕТИКО-МНОЖЕСТВЕННЫЙ ПОДХОД К ПООЧЕРЕДНЫМ ИГРАМ1) К. Берж ПРЕДИСЛОВИЕ Дж. фон Нейману первому пришла идея использовать самые современные достижения математического анализа для теории игр двух лиц. Со времени появления его фун- даментальной работы [1] его результаты постоянно улуч- шались, особенно А. Вальдом, С. Карлином, Г. Вейлем, Л. С. Шепли [2]. Тем не менее исследования проводились всегда со строго локальной точки зрения, высказанной Нейманом, и глобальные проблемы, заложенные в структуре игры, казалось, не замечались. В теории фон Неймана пооче/?едтшяиг/?абылабыописа- на следующим образом. Два игрока, которых Mitf назовем А и В, делают по очереди выбор среди нескольких возмож- ных альтернатив, называемых ходами. Ходы, возможные в данный момент, зависят от ранее осуществленных ходов в согласии с законом, который можно представить при по- мощи дерева следующего вида (см. рисунок на стр. 156). Вначале игрок А выбирает ход среди Р (1), Р (2), Р (3), Р (4). Если он, например, выбрал Р (1), то В смо- жет затем осуществить один из ходов Р (И), Р (12), Р (13). Каждой концевой ветви дерева приписывается коэффици- *) Berge Claude, Sur une theorie ensembliste des jeux alternatifs, Journal de mathematiques pures et appliquies 32, 2 (1953), 129—184. Переводятся главы I и II. Диссертация, представленная на факультет наук в Париже 2 февраля 1952 г. на соискание степени доктора математических наук.
156 К. БЕРЖ ент % положительный или отрицательный, называемый вы- игрышем А; если К положительно, то говорят, что А вы- игрывает X; если X отрицательно — А проигрывает |% |. В настоящей статье мы представляем действительные выборы игроков не в виде «ходов», а в виде произвольных объектов, называемых «позициями игры»; когда А выбе- рет позицию х19 В сможет выбрать позицию яг2 в множе- стве Г#!, зависящем только от и т. д. Игра прекратит- ся только в том случае, когда позиция игры будет принад- лежать некоторому взвешенному множеству К, л ее вес будет выигрышем, положительным или отрицательным, игрока А. Это новое описание действительно является обобще- нием, так как мы отбрасываем три гипотезы, которые предс- тавляются основными в теории фон Неймана, а именно: 1) каждый игрок выбирает элемент х в некотором мно- жестве, которое не является обязательно конечным и даже счетным; 2) продолжительность игры не ограничивается фикси- рованным заранее числом и; 3) позиции х игры не обязательно определяются мно- жеством предшествующих позиций. С теоретической точки зрения заметим, что рассужде- ния здесь приобретают большее изящество, так как схема становится глобальной (игра представляется не деревом, а многозначным отображением Г); с практической точки зре- ния становится тривиальным метод предварительного
ТЕОРЕТИКО-МНОЖЕСТВЕННЫЙ ПОДХОД К ИГРАМ 157 упрощения Крентеля, Мак-Кинси и Куайна [3], без которого вычисления в некоторых играх были бы запу- танными: единственным упрощением здесь будет такой пересмотр первоначального определения элемента «по- зиция», чтобы отождествить эквивалентные позиции. Мы рассматриваем поочередные игры, т. е. игры, в кото- рых два игрока играют по очереди, но это ограничение несу- щественно: действительно, заметим, что все обычные пози- ционные х) игры могут быть сведены к случаю поочередных. Глава I. Обратные и сопряженные трансформаторы. Так как отношение Г является трансформатором, следует изучить предварительно некоторые общие свойства тран- сформаторов. Эта вспомогательная глава будет, главным образом, развитием двух заметок [4], [5], в которых мы определяем присоединение и обращение; только для боль- шей общности мы предполагаем здесь, что область опре- деления представляет собой некоторую полуструктуру, простую или нет, для чего необходимо ввести такие новые понятия, как ядро и антиядро. К тому же это обобщение не является чисто теоретическим, так как мы встретимся в следующей главе со структурами не простыми (структура- ми циклов). Глава II. Абсолютные поочередные игры, или изучение правил игры. Из алгебры трансформаторов, изложенной в главе I, сразу же получаем различные операции над игра- ми: обращение, присоединение, произведение, суперпо- зиция и т. д. * Эта алгебра игр позволит нам изучить внутренние свойства позиций ничейных, выигрывающих или про- игрывающих. Множество выигрывающих позиций каждого игрока будет даваться алгебраической формулой, и игры будут классифицироваться по структуре их правил. Мы рассматривали абсолютные поочередные игры, т. е. игры без оценивания множества К окончательных пози- ций, так как изучение этих игр является полностью гло- бальным. Но очевидно, что задачи, возникающие при изу- чении правил игры, будут такими же и для относительных игр, и решаются они таким же образом. 2) В популярном смысле слова. {Прим, ред.}
158 К. ПЕРЖ Глава III *)• Относительные поочередные игры, йлй изучение выигрыша. Если множество окончательных позиций взвешено (относительные игры), то возникает также и задача локального порядка: задача наилучшего выигрыша (или наименее худшего проигрыша), который каждый игрок может гарантировать в данный момент. Чтобы решить ее, нужно привести игру к нормальной форме, которая совпадает с нормальной формой в смысле классической теории. Иначе говоря, мы вновь стано- вимся здесь на точку зрения фон Неймана, однако мы исхо-. дим из более общего определения, поэтому не вводим двух основных гипотез его теории, а именно: Гипотеза I. Множества Гх являются конечными множе- ствами для каждой позиции х. Гипотеза II. Продолжительность партии ограничена фиксированным заранее числом. Отбрасывание гипотез I и II ставит новые проблемы; мы увидим, в частности, что основная теорема фон Ней- мана может быть тогда неверной. В этой главе мы строго определяем точную верхнюю границу всех тех «выигрышей, которые один из игроков априори имеет возможность превысить до некоторого фиксированного им момента»; напротив, мы не знаем почти ничего о точной верхней границе выигрышей, которые он имеет возможность превысить «рано или поздно», эта еще не решенная задача зависит от теории трансфинитных чисел. Глава IV. Неймановские поочередные игры, или изу- чение информации. Вводя некоторые дополнительные гипотезы для трансформатора Г, получаем категорию игр, называемых неймановскими, в которых игроки А и В могут играть, не зная полностью позицию; основная зада- ча, которая при этом возникает,— это выяснить, явля- ется ли игра вполне определенной. Эта задача ставится в особенности для игр, называе- мых «стратегическими», в которых позиция задается парой распределений Р(х) w.Q(y) (на данных множествах X и У), выбираемых соответственно игроками А и В. Фон Нейман [6], который предполагал, что множества X и У конечны, г) Начиная отсюда, перевод не делается. (Прим, перев.)
ТЕОРЕТИКО-МНОЖЕСТВЕННЫЙ ПОДХОД К ИГРАМ 159 доказал в 1937 г. следующую важную теорему: любая стратегическая игра вполне определена. Затем Билль [7] и Вальд [8] распространили по непре- рывности этот результат на множества X и Y другого типа, но все еще ограниченные. В этой главе нашей основной целью будет расширение этих критериев и применение их к неограниченным множе- ствам X и У. Именно таким образом мы обобщим теоремы Билля и фон Неймана. Мы особо остановимся на важном случае, когда X и У являются счетными множествами. Здесь переход от ко- нечного случая к бесконечному будет значительно облег- чен при помощи известных результатов о гильбертовом пространстве. ГЛАВА I ОБРАТНЫЕ И СОПРЯЖЕННЫЕ ТРАНСФОРМАТОРЫ В ПОЛУСТРУКТУРАХ § 1. Полуструктуры. Во всем этом исследовании речь будет идти только о структурах в полном смысле сло- ва; структурой называется семейство множеств D та- кое, что (1) из ех е D следует (J ех G D; х (2) из ек е D следует х Пересечения и объединения берутся по произвольному семейству индексов X. D называется полуструктурой, если выполняется толь- ко (1): из е D следует (J е= D. х Множество е из D называется минимальным множе- ством, если оно не содержит других множеств из D, кроме самого себя и пустого множества 0, которое всегда можно считать принадлежащим D. D называется простой структурой, если любое множе- ство из D является объединением минимальных мно- жеств. Например, подмножества интервала образуют про- стую структуру, минимальными множествами которой яв- ляются точки. По любой полуструктуре/) можно построить
160 К. БЕРЖ простую структуру 6, рассматривая все объединения мини- мальных множеств из D. Множество {D} = U *х называется максимальным множеством полуструктуры D. § 2. Трансформаторы. Рассмотрим на семействе мно- жеств DA отношение Л, ставящее в соответствие каждому множеству е из DA определенное множество Ае. Будем говорить, что А есть трансформатор, если 1) Da является полуструктурой; 2) A (U^a) = U Аех (где ех е DA)\ 3) А 0 = 0 (где 0 — пустое множество). Da есть область определения трансформатора А. Множества вида Ае также образуют полуструктуру Ад, называемую областью значений А. Отношение Л называется регулярным трансформатором в DA, если из Ае± = Ае2 (^, е2(= DA) следует ^1 — ^2* Как и для структур в обычном смысле, имеем следую- щий результат: Теорема!. Если А — трансформатор, то из ^cz^ следует Ае± cz Ае2. Если, кроме того, А — регулярный трансформатор, то из Aer cz Ае2 следует ех cz е2. Действительно, тот факт, что Л является гомоморфиз- мом в полной полуструктуре, ничего не изменяет в обыч- ном доказательстве [9]. Согласно этой теореме, если имеем e^DA, П e^DA, А то можно написать Л (Пех)с=ПЛ^. Будем говорить тогда, что трансформатор Л явля- ется изовалентным в DA, если, кроме того, 1) Da есть структура; 2) Л ((Ш - (Wx.
ТЕОРЕТИКО-МНОЖЕСТВЕННЫЙ ПОДХОД К ИГРАМ 161 Термин «изовалентность» объясняется аналогией с теорией линейных операторов. В самом деле, мы доказали, что можно установить взаимно-однозначное соответствие между изовалентными линейными операторами и иэова- лентными трансформаторами [4]. § 3. Обращение трансформатора А. Мы рассматрива- ем здесь задачу обращения А для любой полуструкту- ры DA, для этого необходимо ввести несколько предвари- тельных понятий. Пусть дано множество $, тогда множества Е из DA такие, что АЕ И $ ~ 0, очевидно, образуют полуструк- туру N ($), которую мы назовем ядром полуструктуры DA (по отношению к трансформатору Л). Заметим, что если/Эд является структурой и если£\— множества из N ($), то имеем Л(П£х)П^с=(ПЛ£х)П^^0 и N ($) также является структурой. Удалим из DA все множества вида е - Е' U Е" *(£" е РА, Е" е W)> Е'=£е, Е"=^0). Из оставшихся множеств ех, беря их объединения все- ми возможными способами, можно образовать полуструк- туру N ($), которую мы назовем антиядром полуструк- туры DA (по отношению к трансформатору А). Если полуструктураDA простая, определение антиядра упрощается; действительно, множество Е принадлежит N ($) в том и только в том случае, когда оно является объ- единением минимальных множеств, не принадлежа- щих N ($). Мы можем теперь определить обращение А -1 трансфор- матора А. Это есть отношение, которое сопоставляет лю- бому множеству е объединение А~ге множеств Ех из полу- структуры dA = N ({Ад}) таких, что АЕХ cz е> Отсюда немедленно следует, что А e^D А для любого е, что ех ZD е2 влечет А~1е1 о А~1е2 и что Л-х0 = 0. 11 Позиционные игры
162 К. БЕРЖ Лемма х). Каждому множеству Е изВА соответствует множество Е из N ($) такое, что АЕ О = &Ё О- Действительно, рассмотрим все множества ех из DA,c>o- держащиеся в Е, и удалим те из них, которые имеют вид — (E^Ez DA, Е^ее N (ё), E\=f=ex, E\=f=0). Можно всегда предполагать, что Ех само не является удаленным множеством, если принять за Ех объединение всех множеств из_7У ($), содержащихся в ех. Возьмем теперь в качестве Е объединение всех неудаленных мно- жеств ех.; Ё е N ($), и можно написать 4£HMlMeXi)(U = = и n £) U( U (АЕ'Х П £)) и ((М п ^)). Следовательно, АЁ = АЕ (]<£. Т е’о р е м~а А-*А zd I* 2) в dA, и АА"1 — I в Ал. Во всей остальной области А Аг1 cz I. Действительно, каково бы ни было е, имеем А А"1е = А ( U Ех) = U АЕ\ cz е. (1) АЕХСе E\^dA Если, кроме того, е£Е&А, то е — АЕ. Можно всегда считать, что Е ЕЕ N ($) и согласно лемме заменить Е на Е. Тогда по определению обращения Е cz А^е, х) Утверждение леммы справедливо не для всех множеств* Подробнее об этом см. заметку Н. Н. Воробьева на стр. 183. (Прим, перев.) 2) I — тождественное отношение. (Прим, ред.)
ТЁОРЁТЙКО-МНОЖЁСТВЕННЫЙ ПОДХОД К ИГРАМ 163 откуда по теореме 1 § 2 АЕ cz AA~*e. Сравнивая с (1), получаем е ~ АА~ге в Да, ч. и т. д. Кроме того, = A~re zd Е в dA ч. и т. д. Теорема2. Если А является регулярным трансфер* матором в DA, то е = АЕ равносильно Е = А^е, е ЕЕ Да- Действительно, предположим, что А регулярен в DA, и рассмотрим в ДА множество е = АЕ; так как DA — dA, Е с? А-'е. Если Е =j= А^е, то нашлось бы множество % из DA, не содержащееся в Е и такое, что Е U 8 cz А-'е. Учитывая предшествующую теорему, имеем A (Z?jJ $) cz АА^е — е, или АЕ (JA$ cz АЕ, или же А% cz АЕ. Но согласно теореме 1 § 2 мы имели бы тогда $ cz Е, что противоречит предположению. Обратно, если Е = А^е, где е ЕЕ Дд, то по теореме 1 АЕ = AA~re = е. Если А и В являются регулярными трансформато- рами, то теорема 2, в частности, дает (ЛЯ)-1 = В-'А-\ Теорема 3. Если А — регулярный трансформатор в dA, то Л*1 есть регулярный трансформатор в ДА. Действительно, А ( U А-'еь) = U АА-'ъ - U = А (Л"1 (J ех). Так как А регулярен в dA, 11*
164 К. БЕРЖ Так как к тому же Л'1 0 — 0, А-1 является транс- форматором. Кроме того, из Л-1^ = Л-1£2 следует е± — АА~1е1 — ЛЛ-1е2 = е2, и А"1 также регулярен. Следствие. Немедленно получается, что можно применить теорему 2 к Л'1, который является регулярным трансформатором в ДА: е — АЕ равносильно Е — А~ге, и, следовательно, е = (А-^Е (Е е dA). Таким образом, если трансформатор Л регулярен в dA, то (Л-1)"1 = А в dA. § 4. Замыкание множества Е из dA. Замыканием (по отношению к А) множества Е (EzdA) назовем множество <fE — А~\АЕ. Из предшествующего немедленно следует: 1) &Е Е, каково бы ни было Е (ее dA); 2) из Ei о Е2 следует fE1^DfE2; 3) f = $Е. Таким образом, & является отношением замыкания в топологическом смысле, и мы получаем следующие хоро- шо известные свойства. Теорема 1. F (U ^х)-=> U Это вытекает из экстенсивности х) &. Теорема 2. $Е есть наименьшее замкнутое мно- жество, содержащее Е. Замкнутым назовем такое множество F, для которого = F. Таким образом,^# замкнуто (по 3)) и содер- жит Е (по 1)): f(fE) = (А-1А)(А-1А)Е = А-ЧАЕ = fE. Наконец, если множество F± замкнуто и содержит Е, то и, значит, fFi fE, Л О FE, ч. и т. д. х) ZD Е. (Прим, ред.)
ТЕОРЕТИКО-МНОЖЕСТВЕННЫЙ ПОДХОД К ИГРАМ 165 Теорема 3. Пересечение любого, конечного или бес- конечного, семейства замкнутых множеств является зам- кнутым множеством. Действительно, если Fx, F2,... замкнуты, то для лю- бого к QFnc2F}: или f (П Fn) с F*. Следовательно, Г(П^п)с= f|Fn. С другой стороны, в силу экстенсивности имеем обрат- ное включение, и & ( П Р'п) = П Fn, ч- и т. д. Заметим, что трансформатор А регулярен на замкну- тых множествах, так как если AF± = AF2, то A~1AF1 = A~1AF2 и - F2. §5. Трансформатор, сопряженный трансформатору А. Сопряженным трансформатором Л* для трансформатора А назовем такое отношение, которое ставит в соответствие множеству е объединение А*е минимальных множеств из N (е) х). В частности, для любого е имеем: A*e^dA, (где 8А есть простая структура, построенная по полуструк- туре Da). Теорема 1. Л* является трансформатором в любой полуструктуре. Действительно, если е — 0, то для любого множества из Da ______________ АЕх[\е = 0, х) Следует заметить, что если А представляет собой обобщение для множеств многозначной функции f (х), то А* представляет собой обобщение обратной функции /~х (х). Наоборот, Л"1 представляет собой новое отношение, которое можно было бы назвать сильным обращением многозначной функции /. С алгебраической точки зрения /(-1) обладает такими же интересными свойствами, как и’/*"1. Можно сравнить, например, свойства замкнутых множеств е (таких, что /-1/е = е) и свойства устойчивых множеств е (таких, что /е == е), так как доказано, что является отношением замы- кания (что неверно для f"1})*
166 К. БЕРЖ а тогда {7V (е)} = 0 и Л*0 = 0. Далее, A* (JeA) есть объединение минимальных мно- жеств Ех таких, что АЕХ П ¥= 0 по крайней мере для одного значения kQ. Отсюда и, следовательно, Л* — трансформатор. Теорема 2. Если А — изовалентный трансфор- матор в dA, то А* cz Л"1 в ДА. Действительно, если бы это было не так, то существо- вало бы минимальное множество Е^ из dA такое, что 1) АЕхфе\ 2) ЛЕХП^0. Предположим, что е = А% есть множество из Дд и что трансформатор Л изовалентен; тогда предыдущие соот- ношения принимают вид: 1) Еьф$; 2) Е^]$^0. Но тогда Г) $ было бы непустым множеством, отлич- ным от Е\ и содержащимся в минимальном множестве Е\, что неверно. Теорема 3. Если для любого Е^ ЕЕ 6Б имеем, что ВЕх принадлежит бд, то (АВ)* — В*А*. Заметим, что если 2? ЕЕ 6д, то соотношение АЕ Л е=Ь0 эквивалентно Е(]А*е=Н0. (Пересечение и сопряженный трансформатор находятся между собой в том же отношении, что скалярное произве- дение и сопряженный оператор.)
ТЕОРЕТИКО-МНОЖЕСТВЕННЫЙ ПОДХОД К ИГРАМ 167 Таким образом, имеем эквивалентные соотношения: ЕхП(-4В)*е^=0, АВЕ^е^0, BE\(\A*e=f=0, Е^В*А*е=}=0. Последовательно беря в качестве минимальные мно- жества из 8В, устанавливаем требуемое соотношение; также последовательно проверяем, что (4П)* - (Л*)п, Теорема 4. (Л*)* = А в 6А. Действительно, если Е е S4, то имеем эквивалентные соотношения: B\QAE=f=0, А*Е^Е + 0, Ei(]A**E^0, откуда следует, что 4** — 4 в б4. г л а в А II АБСОЛЮТНЫЕ ПООЧЕРЕДНЫЕ ИГРЫ § 6. Описание. Мы имеем абсолютную поочередную игру, когда два игрока 1 и 2 выбирают поочередно элемент из данного множества X, называемого множеством позиций игры, причем если 1 выбрал позицию х1?2 может выбрать позицию х2 в множестве Г^х, зависящем только от хг, затем 1 выбирает в свою очередь элемент х3 в множестве Г\г2, зависящем только от х2, и т. д. Как только позиция х попадает в данное множество К± — соответственно К2,— игра прекращается, и говорят, что х — позиция мата для 2 — соответственно для 1 — или что игрок 1 — соот- ветственно 2 — выиграл, В игре в шахматы, например, можно взять в качестве позиции набор положений всех фигур вместе с указанием, какой игрок имеет право играть, или имеет ход.
168 К. БЕРЖ Через Хг обозначим множество альтернатив т) игрока 1, т. е. позиций, в которых ход принадлежит игроку 2. В большинстве игр, как, например, в шахматах, К± cz ХА, Я2 cz Х2, но это несущественно. В обычной игре в поддав- ки имеем наоборот: Kr cz Х2, К2 cz Мы здесь не предполагаем даже, что цели, преследуе- мые обоими игроками, несовместны, т. е. что К1(]К2 = 0. § 7. Фундаментальный трансформатор игры. Фунда- ментальным трансформатором игры называется отноше- ние Г такое, что Гх есть множество позиций, которые мо- гут непосредственно следовать за позицией х. Если е — множество позиций, не пересекающееся с К = КА (J К2, то положим Ге = J Гх. Множества е образуют структуру Z)r, для которой Г есть трансформатор. Полуструктура Дг называется структурой игры, Г-1е есть множество позиций х, которые перейдут в какую-то позицию из е после совершения хода (так как Гх=^=0, Txcz е); Г*е есть множество позиций х, которые могут предшествовать какой-нибудь позиции из е (так как ГхП е =/= 0). Наконец, будем говорить, что структура игры на дан- ной полуструктуре D (DczDr) изовалентна (или регу- лярна), если трансформатор изовалентен (или регуля- рен) в D. Замечание 1. Для того чтобы игра была регуляр- на всюду (т. е. во всем Dr), необходимо и достаточно, чтобы за каждой позицией следовали и ее собственные позиции (т. е, позиции, которые не следуют ни за какими другими позициями). Это условие необходимо, так как если бы rxczTe и х (=£ е, то существовали бы два множества е и ej х такие, что Ге = Г (ej х), и игра не была бы регулярной. Оно также достаточно, так как если из rxczzTe сле- дует хе=£ и если имеем равенство ГеА — Ге2, то из хе ех следует rxczTe2, откуда х^е2, следовательно, еА = е2. х) В оригинале слово «coup». Ал есть множество позиций, полу- чающихся после хода игрока 1. {Прим, ред.)
ТЕОРЕТИКО-МНОЖЕСТВЕННЫЙ ПОДХОД К ИГРАМ 169 Замечание 2. Для того чтобы игра была изова- лентной всюду, необходимо и достаточно, чтобы каждая по- зиция х однозначно определяла все позиции, которые ей предшествуют в игре. Условие необходимо, так как если игра изовалентна всюду, имеем для Гж П Ту = Г (х П у) = Г0 = 0. Оно достаточно, так как если Тх(}Ту — 0 для х =f= у, то Гб1 П Ге2 = ( (J Гж) П ( U Гг/) = (JEr х€Ев1 уЕЕвг xEEeiQe2 ИЛИ Г^1 П Г^2 = Г (^1 П ва). Когда игра всюду регулярна, из теоремы 3 § 3 следует, что Г-1 —- регулярный трансформатор в структуре игры Дг; когда игра всюду изовалентна, Г* — регулярный и изовалентный трансформатор в Аг и Г"1 = Г* в Аг. § 8. Изучение ничейных позиций. Существует четыре вида ничейных позиций: 1° Позиции соглашения. Это позиции из Кг[\К2, кото- рые являются позициями равенства, когда каждый из игро- ков достигает цели, которую он себе ставил. 2° Позиции пата. Это, по определению, позиции х из X \ №) такие, что Гх = 0. Множество их обозначается через J; = J Хг является множеством позиций пата игроку 2. Они также являются позициями равенства, так как ни один из игроков не достиг цели, которую он себе ставил. 3° Псевдоциклические позиции. Наконец, позиции и со- ответствующая партия являются ничейными, если игроки вынуждены все время возвращаться в позицию игры, нахо- дящуюся во вполне определенном множестве е, не^пере- секающемся с К и с J. Если один из игроков, например 2, может при жела- нии удерживать позицию игры в е, будем говорить, что е есть псевдоцикл для 1, и обозначим объединение этих псев- доциклов через Сг. К = {Прим, ред.)
170 К. БЕРЖ Алгебраически е является псевдоциклом для 1, если Г (е A Xi) cz е, Г (е А Х2) П е 0, т. е. если еАХгсГ-^еАХ.), еАХ2сГ*(еПХ1). Псевдоциклы для 1 образуют подструктуру Dx в £>г, и мы имеем Ci — {2?i}, С2 = {D2} х). 4° Циклические позиции. Это позиции псевдоцикличе- ские одновременно для 1 и для 2. Если позиция игры цик- лическая, то соответствующая партия будет ничейной, так как она никогда не может окончиться. Алгебраически е будет циклом, если оно является под- множеством X, не пересекающимся с J\jK и таким, что Ге с: е. Ц иклы образуют структуру Z)o, которая является од- новременно подструктурой для Dx и для D2; она явля- ется, впрочем, произведением DxxD2 структур Dx и D2. Цикл можно увеличить, если взять его замыкание. Дей- ствительно, fe = Г^Ге также является циклом, так как если. Ге cz г, то Г^Ге = ГГ”‘1Ге = Ге cz е cz fe. Согласно теореме 2 § 4 fe является циклом большим и замкнутым. Пересечение замкнутых циклов будет замкнутым цик- лом, так как оно является циклом и замкнуто (теорема 3 § 4). Замкнутые циклы играют важную роль, так как игро- ки никогда не смогут ввести в них позицию игры, если она там уже не находилась. г) Со и Z>2 — для игрока 2. (Прим, ред.)
ТЕОРЕТИКО-МНОЖЕСТВЕННЫЙ ПОДХОД К ИГРАМ 171 Заметим, наконец, что {/)0} является циклом, который нельзя увеличить с помощью замыкания; следовательно, это замкнутый цикл. § 9. Обобщения изовалентности. Чтобы изучить* свой- ства различных ничейных позиций, введем несколько но- вых определений. Если 7) х и /)2—две полуструктуры, то их суперпозиция D1xD2 состоит, по определению, из множеств вида е^ез feEDi, e2E^D2) и их объединений. Это, следовательно, полуструктура; если к тому же Dr и£>2 — структуры, toD1xD2 будет структурой. Пусть, дей- ствительно, е и е' — два множества из DrxD2] имеем (^1П^))п(и«а<)) = = U ((ei А£]) А (^2А ^2))ее D2, Дополнение D для D состоит, по определению, из множеств вида Се = {D} \ е, где e^D. Если/) — струк- тура, то D также будет структурой, и, следовательно, D XD также есть структура. Будем говорить, что игра квазиизовалентна в полу- структуре Z), если из = 0 (где е19 e2EzD) следует = 0. Изовалентная игра является также квазиизовалентной, но обратное неверно. Например, игра квазиизовалентна в структуре Dq циклов, но она, вообще говоря^ не изовалент- на в этой структуре. Будем говорить, что игра вполне изовалентна в Z), если она квазиизовалентна в DxD\ чтобы доказать, что игра, вполне изовалентная в/), будет также изовалентной в D, достаточно установить соотношение Ге А Ге' = Г (е П И U [Г (е А ^') А Г (е' П Се)], (1) а это получается немедленно, если развернуть запись: Ге П Ге' = [Г (е f| И U Г (е f] Се')] П [Г (е А е') U Г (е' f) Се)]. Следует отметить, что соотношение (1) аналогично соот- ношению для объединений Ге U Ге' = Г (е А е') U [Г (е П Се') U Г (е' ("] Се)]. (2)
172 К. БЕРЖ Замечание. Легко видеть, что свойства изова- лентности, квазиизовалентности и полной изовалент- ности совпадают, если D является точечной структурой. Более общо, предположим, что/) = /); если трансфор- матор Г изовалентен в D и если (в1ПС<)П(е2ПСе;) = 0, то имеем Г (ех П Ce'J П Г (е2 П Се2) Г (ех Q Се[ А е2 П Се'2) = Г0 = 0, и Г вполне изовалентен в D. Если, далее, трансформатор Г квазиизовалентен в Z), то ясно, что полуструктура/) (такая, что/) — /)) являет- ся структурой, и из формулы (1) следует, что Г изовален- тен в /). Таким образом, если D = Л, то изовалентность, ква- зиизовалентность и полная изовалентность в D являются одним и тем же свойством. Теорема!. Если игра регулярна в полуструктуре D, то D XD имеет пустое ядро*, кроме того, если игра вполне изовалентна в D, справедливо и^обратное утверждение. Действительно, если бы DXD имело непустое ядро, существовало бы по крайней мере два множества е и е' из D таких, что Г(еАСе') = 0 (efW^0). Тогда согласно формуле (2) Ге' == Г (е П И U Г (е П Се') (J Г (е' А Се) = Г (е U е') -Ге ]J Ге', откуда Ге' зэ Ге. Если при этом трансформатор Г регулярен в D, то мы получили бы согласно теореме 1 § 2 е' zd е, что неверно, так как по предположениюе А Се' =4=0. Следовательно, DXD имеет пустое_ядро. Обратно, покажем, что если DXD имеет пустое ядро, то Г не может быть одновременно вполне изовалентным и не регулярным в D.
ТЕОРЙТИКО-МНОЖЕСТВЕННЫЙ ПОДХОД К ИГРАМ 173 Пусть ег и е2 — два множества из D такие, что = — Ге2. Предположим сначала, что е^е2; е3 = г2 \ ei принадлежит DxD, и мы имеем 14 — 14 U 14* Если трансформатор вполне изовалентен в D, то Г4пг4 - 0. Следовательно, Так как DxD не имеет ядра, то е3 — 0 и ег — е2. Если теперь не предполагать, что е± зэ е2, то тем не менее будем иметь Г 4 U е2) = Ге2, Г 4 U = 14. Тогда согласно предыдущему U е2 ~ #2, и е2 = С1- Получается, что в любом случае из 14 = Ге2 следует ех == е2, и, следовательно, игра регулярна в D, ч. и т. д. Из этой теоремы немедленно получаем: для того чтобы всюду изовалентная игра не имела позиций пата, необхо- димо и достаточно, чтобы она была всюду регулярна. Наконец, по аналогии с хорошо известной теоремой из теории групп можно также утверждать: гомоморфизм структуры на структуру, являющуюся своим собственным дополнением, который имеет пустое ядро, является изо- морфизмом структуры. Т е о р е м а 2. Если игра изовалентна в D, то соответ- ствующая структура игры Д является структурой*, кроме того, если игра регулярна в D, то справедливо и обратное. Первая часть теоремы очевидна; докажем, что если Д есть структура, то трансформатор Г, регулярный ъБ, бу- дет обязательно изовалентен в Б. По предположению 14 П Ге2 = ге (^еР), поэтому ге СЗ 14,
174 К. БЕРЖ откуда $ с: е± по теореме 1 § 2, а также £ <= ег П е2. Отсюда г^пг^гасг^п^). Но так как Г — трансформатор, имеем также обрат- ное включение и, следовательно, равенство, и Г изовален- тен в D. Из этой теоремы немедленно получаем: для того чтобы во всюду регулярной игре структура игры Дг являлась структурой, необходимо и достаточно, чтобы игра была всюду изовалентной. Теорема 3. Если игра регулярна в структуре DJ), то эта структура содержит только замкнутые цик- лы, и обратно. Если игра регулярна в DQ, то для трансформатора Го-1, обратного для Г и определенного только на Z>0, выпол- няется, согласно теореме 3 § 3, равенство Г'Тг = Г^Те = е (е е Д>). Следовательно, любой цикл из Z>0 замкнут. Обратно, если любой цикл из Z)o замкнут, то из ра- венства Гв! = Ге2 (где elf e2^D0) следует Г-1Г^Х = Г-1Ге2 и ех ~ е2, и трансформатор Г регулярен в Z)o. Следствие 1. Если игра вполне изовалентна в Dq, то структура DQ содержит только замкнутые циклы. Действительно, теорема 1 показывает, что тогда игра регулярна в/)0, так как, ввиду того что {Z>0} не содержит позиций пата, DQ X DQ имеет пустое ядро. По теореме 3 Z>0 содержит только замкнутые циклы. Следствие 2. Если структура DQ является своим собственным дополнением, то она содержит только замкну- тые циклы. Действительно, игра квазиизовалентна в Z>0. Если D = = 25О, то она также вполне изовалентна в DQ и по сделан- 1) См. § 8. {Прим, ред.)
Теорётико-мйожественный подход к играм 175 ному выше замечанию DQ содержит только замкнутые циклы. § 10. Правильные альтернативы. Правильной альтерна- тивой для игрока 1 назовем такую позицию из Х±1 чтр 1 может выиграть, что бы впоследствии ни делал игрок 2. Обозначим через Gr (п) множество тех правильных аль- тернатив г), которые могут дать мат в п ходов, или множе- ство выигрывающих позиций порядка п. Gi (п) есть множество таких позиций я, что ГясзГ*^! (п — 1) (Гя =/= 0); таким образом, Gx (и) - Г-1!1* Gx (п - 1) - (Г-1!1*)" Gx (0). Тогда множеством правильных альтернатив для 1 будет 2) G, - [Z + Г-1!1* + (Г-1!1*)2 + ...] Gr (0), или, символически, z-r-ir Если как в шахматах, то имеем Gx (0) = Кг. Если Кг о Х2, как в игре в поддавки, то Gr (0) есть множество таких позиций х, что Гх =/= 0 и Gx (0) = Г"1 Кг. Таким образом, имеем общую формулу Gi= Ттггчг 1(^1ПХ1)иГ-1(^1ПХ2)]. (1) Заметим, что так как множество Gi (п) = Г-Т* Gi (п - 1) принадлежит dp при п 0, то можно взять его замыка- ние; по теореме 1 § 3 имеем fGr (п) = Г-1 (ГГ^)Г* Gj (п - 1) с= Г-1!1* Gx (п - 1) - = Gt(n). т) Для игрока 1. (Прим, ред.} 2) Если А и В —два отношения между множествами, полагаем, как обычно, (4 + В)е = Ае (J Be.
176 К. БЕРЖ Но по экстенсивности & имеем также обратное включе- ние, и, следовательно, JGi (fl) = («). G± (п) есть замкнутое множество, и 6'1 аналогично множеству типа FQ в топологическом пространстве. Если начальная позиция игры xQ (ее Х2) принадлежит Gg1), то будем говорить, что игра несправедлива для 1. § И. Неправильные альтернативы. Неправильной альтернативой для 1 назовем такую позицию из Х±, что 1 может проиграть, что бы он ни делал впоследствии. Множество неправильных альтернатив 2 3) содержит, кроме позиций из К2 П такие позиции х, что Гя П G2 =f= 0. Следовательно, (2) Также Gi = Г-¥>2и (ЯхПХх). (2') Формулы (2) и (2') выражают двойственность между символами Р и G, Г* и Г-1, Кг и К2. Мы используем впоследствии эту двойственность; в частности, из (1) выводим двойственное соотношение Л = Т-г*г^1(^2 А Хх) и г* П Ха)]. (Г) § 12. Теорема о поочередных играх. Формулы (2) и (2') содержат результат, обычно известный под названием теоремы о поочередных играх, которую мы попытаемся уточнить. Теорема. По крайней мере для одного из игроков существует способ или наверняка выиграть, или сделать пат самому себе. или помешать игре окончиться. Действительно, предположим, что это не так. По предположению, 1 не может стремиться привести позицию игры в Кг = U т) Сг — для игрока 2. {Прим, ред.) 2) Для игрока 1. {Прим, ред.) 3) Рг — для игрока 2. {Прим, ред.)
ТЁОРЁТЙКО-МПОЖЁСТВЕННЫЙ ПОДХОД К ЙГЁАМ 177 а 2 не может стремиться привести позицию в = J\ и К2, * Пусть G' и Р' ~ множества правильных и неправиль- ных альтернатив соответственно* Тогда начальная позиция xQ не может быть ни пра- вильной альтернативой для 2, ни неправильной альтер- нативой для 2. По формуле (2) из xQ Р2 следует х0 Г* Gx, или Также по формуле (2') из х0 G2 следует xQ Г-ЛРХ, или ГхофР^ Получается, что 1 выберет хг такое, что хг (jg Gt и, если 1 пожелает этого, жх^Рх; это как раз условия, кото- рым удовлетворяет xQ; тогда, если 1 и 2 захотят играть, избегая Рг и Р2, то они всегда смогут это сделать, и игра никогда не прекратится, пока один из игроков не сможет получить позицию мата или пата, ч. и т. д. Рассмотрим, например, хорошо известную игру «Волк и овцы» [10], где нельзя продолжать игру бесконечно и где имеется только три возможных результата: 1) овцы запирают волка в месте его выхода — мат волку (KJ; 2) волк не заперт, когда у овец кончились возмож- ности играть,— мат овцам (К2); 3) овцы запирают волка, но не в месте его выхода — пат волку (Jx). Теорема о поочередных играх указывает тогда априори, что или овцы имеют способ наверняка выиграть, или же волк может выиграть либо свести партию к ничьей. Так как эта игра не имеет позиций соглашения, эти две альтернативы несовместимы; впрочем, опыт легко показывает, что игра несправедлива для волка. § 13. Игры восстановления. Каждой поочередной игре с фундаментальным трансформатором Г можно сопоста- 12 Позиционные игры
178 к. БЕРЖ вить другую поочередную игру с трансформатором Г' = = Г*. Г* я есть множество таких позиций у, что Гу Q х =4= 0, т. е. хЕДГу. Таким образом, ясно, что мы просто имеем «перевернутое» направление в правиле игры. Речь идет о том, чтобы для 1 восстановить предшествующую позицию из множества а для 2 — позицию из множества. К2, начиная с некоторой начальной позиции xQ, принадлежа- щей {dr}- Если Г = Г*, игра называется симметричной; ее пра- вило совпадает с правилом соответствующей игры восста- новления. Рассмотрим, например, игру фехтования; хотя она в своем течении не является, собственно говоря, по- очередной игрой, но ее можно как угодно «приблизить» поочередной игрой, которая является симметричной. Теорема 1. Симметричная игра не может быть зсюду изовалентной. Это следует из замечания 2 § 7. Теорема2. Для того чтобы симметричная игра была всюду регулярной, необходимо и достаточно, чтобы каждый игрок был вынужден все время совершать один и тот же ход. Действительно, если игра всюду регулярна, любая по- зиция х имеет, согласно замечанию 1 § 7, собственную следующую за ней позицию у, которая не может быть пози- цией мата или пата (так как яЕЕГу). ЕслигЕзГу и z=f= х, то имеем у ЕЕ Гг, что противоречит предположению, что у — собственная позиция для х. Значит, Гу = {х} и, так как х есть также собственная позиция, Гя ={у}; следо- вательно, х и у — единственные возможные позиции игры. Обратно: очевидно, что такая игра всюду регулярна. Теорема 3. Игра восстановления не имеет позиций пата, за исключением, быть может, начальной пози- ции х0. Доказательство очевидно. Теорема 4. Для того чтобы игра восстановления имела циклические позиции, необходимо и достаточно, чтобы х0 не было ни позицией пата, ни элементом из
Теоретико-множественный подход к играй 170 Условие необходимо, так как если е' — цикл, то Г*е' с е\ откуда xQ (ЕЕ е . Тогда х0 не является позицией пата, так как она Ацик- лическая. Так как х0, Г*;г0, (Г*)2я0,... содержатся в е', мы имеем также для любого п (г*)* яоп*' = 0, и xQ не принадлежит ни одному из множеств [(Г*)п]* К’. Но по теоремам 3 и 4 § 5 [(Г*)п]* = [(Г*)*]п = Гп, и х^ не принадлежит множеству К' = К' и ГК' и РК' и ... Условие достаточно, так как имеется по крайней мере следующий цикл: е = ^оиГ*жо и(Г*)% U ••• Мы приводим эти результаты, впрочем очень простые, для того, чтобы показать, в чем состоит «алгебра игр». Из других «соотношений» между двумя данными играми, очевидно, можно было бы получить аналогичные теоремы, но, по-видимому, их систематическое изучение здесь не- своевременно. § 14. Суперпозиция игр. Пусть две игры (Гх) и (Г2) определены своими фундаментальными трансформаторами Гх и Г2. Их суперпозицией будем называть игру (ГхХГ2), определяемую фундаментальным трансформатором I\ X X Г2: (ГххГ2)^= Ц (ГХ^ПМ. Отметим, что структура игры ДГ1ХГ2 является под- полуструктурой В ДГ1 X Дгя. Мы уже рассматривали произведения и суммы тран- сформаторов: Г1Г2£ = Гх (Г2е), (Гх + Г2)г = Гхв J Г2е. 12*
180 К. БЕРНС Суперпозиция является новой операцией, которая име- ет особое значение при изучении правил игры. Свойство 1. Суперпозиция дистрибутивна по от- ношению к сложению. Действительно, имеем [(Гх+г;)х(г2 + г;)]в- и кг^иг^)п (г2хиг;х)]. хее Каждый член этого объединения можно записать в виде (г^пади (г^пади (г^пвд, откуда (Гх + г;) X (Г2 + г;) = Гх X г2 + Г1Х г; + г; X г2 + + г; х г;. Свойство 2. Суперпозиция ассоциативна и ком- мутативна. Это следует из того, что (ГхХ(Г2хГ3)) е = U(rx^fir2^n Г3я). хее Таким образом, суперпозиция Гх X Г2 имеет те же свойства, что произведение Гх • Г2 и, кроме того, комму- тативна. (Игры образуют, следовательно, коммутативное кольцо.) Теорема 1. (Гх X Г2)* = Гг* X Г2*. Действительно, если хЕЕ (Гх X Г2)*е, то Гхх П Г2#р|е=£=0, и за х может следовать в игре (Гг) и в игре (Г2) по край- ней мере одна общая позиция у. Так как ХЕНГ* у, х ЕЕ Г*у, имеем U Г*у П Г*г/= (Г* хГ2)е. у& Так как то же рассуждение можно провести в обратном порядке, теорема доказана.
ТЕОРЕТИКО-МНОЖЕСТВЕННЫЙ ПОДХОД К ИГРАМ 181 Отсюда следует, что если игры (Гх) и (Г2) симметричны, то игра (I\ X Г2) также симметрична, так как (1\ ХГ2)* = Г» х Г? = I\ X Г2. Заметим, что никакое аналогичное соотношение невоз- можно для обращения. Таким образом, нельзя решить простым способом и в общем виде задачу о справедливости для игр: «Если дана игра (Гх), несправедливая для 1, то тре- буется охарактеризовать игры (Г2), которые в суперпози- ции с первой давали бы игру, не являющуюся уже не- справедливой». Лемма. (Гх X Г2)е с: Г2е. Действительно, можно записать Г^П Г2е = ( U х.) П Г2 ( U = ( U 14) П ( U 14), или Г1<?ПГ2е = (ГхХГ2)^и и.(Г1^ПГ2^). Теорема 2. Игра (Гх х Г2)7бу5ет изовалентной в структуре D, если по крайней мере__одна из игр (Гх) или (Г2) изовалентна в структуре D \D. Действительно, по формуле (1) § 9, учитывая пре- дыдущую лемму, получаем (Гх X Г2)е П (Г1 х Г2)е = (Гх х Г2)(е П е ) (J 7?, где R = (ГХ хГ2)(еПСв')П (Гх X Г2)(е'ПСе). Если, например, игра (Гх) изовалентна в D х D, то ГЛеПСеЭПЛ (e'ftCe) = Г.0 = 0. Отсюда R = 0,и игра (Гх х Г2) изовалентна в D. В частности, из этой теоремы видно, что если тран- сформатор Г\ изовалентен на подмножествах множества Е, то Гх X Г2 также изовалентен на этих подмножествах. Замечание. Если использовать понятие полной изовалентности, то можно получить более общее утвержде- ние, в котором предположение будет более слабым, а за- ключение более сильным, чем в предшествующей теореме^
182 К. БЕРЖ Пусть трансформатор Гх квазиизовалентен в D. Рас- смотрим в D два непересекающихся множества е и е. Имеем (Гх х Г2)^П(Г! X Г2)е сГхеQ Гхе Г)Г2еГ| Г2в/ = 0. Следовательно, Гх х Г2 квазиизовалентен в D. Заменяя D на D получим указанную теорему: Если игра (Гх) вполне изовалентна в D, то (Гх х Г2) вполне изовалентна в D. Объединяя этот новый результат с теоремой 1 § 9Г получаем: Игра (Гх х Г2) регулярна в D, если игра (Гх) вполне изовалентна в D и если D \D имеет пустое ядро. ЛИТЕРАТУРА [1] V on Neumann J., Morgenstern О., Theory of games and economic behavior, Princeton, 1944. [2] Contributions to the theory of games, Princeton, 1950. [3] К r e n t e 1 W. D., McKinsey J. С. C., Quine W. V., A simplification of games in extensive form, Duke Math. J. 18 (1951), 885. [4] Berge C., Sur 1’isovalence et la regularite des transforma- teurs, C. R. Acad. Sci. 231 (1950), 1404. [5] Berge C., Sur 1’inversion des transformateurs, ibid. 232 (1951), 134. [6] Von Neumann J., (Jber ein okonomisches Gleinchungs- system, Math. Kolloquiums 8 (1937). [7] Ville J., Traite du calcul des probabilites et de ses applica- tions (E. Borel), t. IV, vol. 2, Paris, 1937. [8] W a 1 d A., Foundations of a general theory of sequential decision functions, Econometrica 15 (1947). [9] Бир кг оф Г., Теория структур, ИЛ, М., 1950. [10] К г a i t с h i k, Theorie mathematique des jeux, Bruxelles, 1930.
К ВОПРОСУ ОБ ЭНДОМОРФИЗМАХ полных ПОЛУСТРУКТУР МНОЖЕСТВ Н. Н. Воробьев Ленинградское отделение Центрального экономико-математического института Пусть R — некоторое множество, a D — семейство его подмножеств, содержащее пустое подмножество 0 и об- разующее относительно теоретико-множественного сло- жения полную (верхнюю) полуструктуру. Сумму всех элементов D обозначим через {D}. Отображение А полной полуструктуры D в себя на- зывается эндоморфизмом D, если А0 = 0 и А и= и Аек, D. X X Очевидно, AD тоже является обладающей нулем пол- ной полуструктурой подмножеств У?. Пусть <£ cz R. Введем согласно [1] понятия ядра N (ё) и антиядра N ($) множества % относительно эндоморфиз- ма А, обозначив через N ($) подполуструктуру D, со- стоящую из всех eE^D, для которых Ае — 0, и от- неся к 7V ($) все элементы eE^D, для которых из е = er (J е2 и e2EzN (ё) следует е = а также все суммы таких эле- ментов. N ({7)4}) обозначается через d&. Для каждого eE^AD положим А^е= J /. А/се Пример. Пусть R есть множество натуральных чи- ’ сел, a D состоит из всех множеств видаеп={п, п 4-1,..J1), 4 Как обычно, под {а, 0, . . .}мы понимаем множество, состоя- щее из элементов а, 0 и т. д.
184 Н. Н. ВОРОБЬЕВ всех множеств вида еп = {0, п, п 4-1,...} (п =1, 2, ...) и пустого множества 0. Положим Аеп = 0 и Аеп — е'4 Очевидно, D является полной полуструктурой с нулем, а А — ее эндоморфизмом. Полуструктура DA состоит здесь из е[ и 0,так что {ZM} = е'. Очевидно, N ({DA}) = а с?а состоит только из пустого множества, и потому по Е = не найдется в такого элемента Е, для которого бы выполнялось AEftei —AE^e'i. Кроме того, АА-Ч^А U / = ^0=0=^< Приведенный пример опровергает лемму и второе утверждение теоремы 1 § 3 [1]. Вместе с тем при некоторых налагаемых на hjjciijk- туру D ограничениях эти предложения оказываются спра- ведливыми. Пусть EEzD и Dr — некоторая полная подполуструк- тура D. Положим E/Dx = II ееЕ esPi Очевидно, E/D^geD и EID^cziE. Уравнение Е - X U (Я/^х) всегда имеет решения (например, X =Е). Т е о р е м а. Если Е является минимальным решением уравнения E = XU(W)) (1) в D, то E^N(8) и АЕ(]ё = АЁ(]$. _ Доказательство. Предположим, что Е TV($)7 Тогда в D существует такое Et =/= Е, что Е = Et и Ё2, где Ez&f ($). Очевидно, Е% с: Е; поэтому E^czEIN (&),
ЭНДОМОРФИЗМЫ ПОЛНЫХ ПОЛУСТРУКТУР МНОЖЕСТВ 185 и, следовательно, Е = Ег U Е2 U (E/N($y) = Ег U (EfN^), что противоречит минимальности Ё. Значит, Кроме того, АЕ Л 8= А (£ и М=(АЕ П Я) U (E/N(8)) Л £), а так как EJN (%) SBN (8), последнее слагаемое справа пусто, и теорема доказана. Следствие 1. Если полуструктура D удовлетво- ряет условию минимальности (т. е. если всякое непустое подмножество D имеет хотя бы один минимальный элемент), то при любых Ef=zD, $ cz R и эндоморфизме А существует такое E^N ($), что АЕ[\$ ~АЁ(\% . Для доказательства достаточно в качестве Е взять ми- нимальное решение уравнения (1). Следствие 2. Если полуструктура D образует полную структуру относительно операций теоретико- множественного сложения и пересечения, то при любых EeeD, %(Z1R и эндоморфизме А существует такое Е GE TV(g’), что АЕ{\% = АЕ{\$. Для доказательства заметим, что если {Еа,...}— мно- жество всех решений уравнения (1), то пересечение ПЕа а также является его решением и притом, очевидно, мини- мальным. Кроме того, по условию flEa€E£>. а Следствие 3. Если А — изоморфизм D в себя (т. е. такой эндоморфизм, что из Аех =Ае2 следует е± = — е2), то при любом E^D существует такое Е^Ейд, что АЕ(] {AD} =Л£П М#}. (2) Доказательство. Ввиду того, что А — изо- морфизм, из АЕ = 0 следует Е = 0. Так как, далее, при любом Е, очевидно, АЕ cz {AD}, то равенство АЕ Q {AD} = = 0 может иметь место лишь при Е = 0. Значит, в на- шем случае N {{AD}) состоит только из пустого множества, так что E/N ({AD}) также пусто. Поэтому уравнение (1) приобретает вид Е = X и имеет лишь одно решение, кото- рое тривиальным образом минимально.
186 Н. Н. ВОРОБЬЕВ В теореме 2 § 3 [1] было доказано, что если при эндоморфизме А по любому EeD найдется такое что" выполняется (2), то дляеЕЕ/М АА~ге = е. Следовательно, это соотношение имеет место в условиях люб ог о^ из пер ечис л енных^ следствий. ЛИТЕРАТУРА [1] !> е р ж К., Теоретико-множественный подход к поочередным / и рам, см. настоящий сборник, стр. 155—182.
СУММЫ ПОЗИЦИОННЫХ ИГР1) Дж. Милнор Принстонский университет и корпорация РЭНД Многие обычные~игры, такие, как шахматы и шашки, имеют некоторую дополнительную структуру/ кроме той, которая необходима, чтобы определить их теоретико- игровые свойства. В такой игре под позицией будет пони- маться просто физическое расположение фигур на доске без указания того, какому игроку принадлежит очередь хода 2). В этих играх в каждой позиции определяется мно- жество возможных ходов для каждого игрока, несмотря на то, что в действительности только один из них будет ходить из этой позиции при каждой отдельной партии дан- ной игры. В этой статье будет определена и ; рассмотрена одна операция сложения для игр, имеющих указанную структуру. Рассматриваемые игры могут быть описаны*следующим образом. Имеется конечное множество возможных пози- ций Р и начальная позиция р0Е^Р. Для каждого рЕ^Р и каждого игрока i =1, 2 задано множество возможных альтернатив 3) Мг (р) cr Р. Эти множества должны Milnor John, Sums of positional games, Contributions to the theory of games, vol. II, Princeton, 1953, 291—301. Подготовка этой статьи была поддержана (частично) корпора- цией РЭНД. 2) Это не совсем точно. Шахматы, например, дополняются сле- дующим правилом. Если некоторая «конфигурация» в смысле фи- зического расположения фигур на доске вместе с указанием игрока, которому принадлежит очередь хода, повторяется три раза, то игра считается ничьей. Чтобы это учитывать, необходимо опреде- лять позицию как расположение на доске вместе с множеством кон- фигураций, имевших место после последнего необратимого хода. 3) В оригинале употребляется термин «move». (Прим, ред.)
188 ДЖ. МИЛНОР удовлетворять следующему условию конечности. Каждая цепь позиций ръ Для которой / = 1,2,3,..., должна быть конечной. В частности, пас pEzMi (р) "'не- возможен. tB каждой позиции р, в которой один из игро- ков не имеет возможных ходов (т. е. множества альтерна- тив Мг (р) или М2 (р) пусты), другой игрок тоже не должен иметь возможных ходов т). В таких позициях определяются функции выигрыша кг (р) ~ —к2 (р). Начиная с позиции р0, игроки ходят поочередно до тех пор, пока один из них не сможет больше ходить, и тогда каждый получает свой выигрыш. Информация полная, и случайных ходов нет. Для каждого игрока i и позиции р обозначим через Vi (р) значение игры для I при условии, что в р очередь хода принадлежит Z-му игроку. Оно характеризуется системой уравнений Vi(р) = ki (р), если Mi (р) = 0, Vi (р) = Мах (— i>3-i (pi)), если (р)=£0. Р^М^р) Очевидно, имеют место неравенства V1 (р) > — V2 (Р1) ДЛЯ Р! е Мг (р), Vz(P)> — Vi(Pi) ДЛЯ PiSM2(p). Если в одном из неравенств (1) имеет место равенство, то альтернатива рх называется оптимальной альтернативой, а ход в нее — оптимальным ходом. Значение гДбт) игры G определяется равенством (G) = (р0), где р0 есть начальная позиция игры G. Побуждением J (р) игрока ходить в позиции р будет называться тот выигрыш, который он имел бы, предпочи- тая в р ходить, а не пасовать, если бы ему был предостав- лен такой выбор. Таким образом, если игрок 1 ходит в позиции р и оба игрока играют оптимально, то выигрыш х) Это требование не слишком сильное, так как для его выпол- нения достаточно добавить к игре некоторые фиктивные ходы и позиции. Например, в шахматах в положении пата может быть до-? бавлен ход снятия всех фигур с доски.
СУММЫ йозйцйойных ИГР 189 Игрока 1 будет равен Vr (р). Если бы игрок 1 пасовал, то его выигрыш был бы равен — и2 (р). Следовательно, вы- игрыш, который он имеет, предпочитая ходить самому, чем предоставлять первый ход игроку 2, дается симметрич- ным выражением j (р) = (р) + (р)- (2) Суммой игр G я G' называется игра, в которой игрок при каждом ходе имеет выбор: или ходить в G и пасо- вать в G', или пасовать в G и ходить в G', и в которой он стремится максимизировать сумму своих выигрышей х). Таким образом, позиция р -f- р' в G + G' есть пара пози- ций (р, р')ЕИР хР', а возможные альтернативы суть М(.Р +р') =Mi(p) xp'UP хМ4(р')- Заметим, что сложение игр является ассоциативной и ком- мутативной операцией. Для получения каких-либо сведений о (Р + р') и J (р 4- р') нужно построить некоторые специальные стра- тегии в игре G + G', выражающиеся через известные стра- тегии в играх G и G'. Таким образом, чтобы получить верхнюю границу для иг (р р'), нужно построить неко- торую стратегию для игрока 2. Определим ее следующими правилами: а) Всегда совершать ход, являющийся оптимальным в G или G'. Ь) Если можно, ходить в той игре, в которой игрок 1 только что ходил 2). Если игрок 1 ходит в позиции р + р', а игрок 2 сле- дует правилам а), Ь), то возможны два случая. Если игрок 2 может всегда следовать правилу Ь), то, рассматривая только ходы, совершенные в игре G, видим, что в G -f- G' игроки ходят поочередно. Так как игрок 1 ходил первым, а игрок 2 совершал оптимальные ходы, выигрыш игро- *) Вообще, выигрыш в сумме игр можно было бы определить равенством fa (р + р') = Д (fa (р), fa (р')), где Д — любая функ- ция, монотонная по каждой из переменных. Таким же образом мо- гут быть определены обобщенные суммы трех и более игр. z) Следующее правило также было бы достаточным: Ъ') Если можно, ходить в игре с большим побуждением.
<90 ДЖ. МИЛНОР ка 1 в игре G будет не более (р). Аналогично, его выиг- рыш в [О'будет не более Следовательно,Jв этом случае vi Ср + ?')< (?)!+ »i (р'). Может[случитьсядГтак, что в какой-то момент игрок 2 не сможет следовать правилу Ь), так £как игра, в которой игрок 1 только что совершил ход, закончилась. В этом случае, рассматривая только ходы, совершенные в другой игре от начальной позиции р или р', видим, что игрок 2 вынужден либо ходить два раза подряд, либо совершить первый ход. Если это происходит в позиции р1У то пока- жем, что выигрыш игрока 2 увеличится на J (р-^ и выиг- рыш игрока 1 будет ограничен величиной (р) и-^р')— — Пусть, например, игрок 1 закончил игру G', со- вершив ХОД В ПОЗИЦИЮ p'v И В ПОЗИЦИИ рг 4- р' должен хо- дить игрок 2. Так как в обеих играх игроки ходили по- очередно и игрок 2 ходил оптимально, мы (применяя повторно неравенства (1) для игрока 1 и соответствующие неравенства для игрока 2) получаем: V1 (Р1) < »1 (р), V1 (Р1) < (р'). Так как игра G' закончена, выигрыш игрока 1 в G' равен кг (/?') = (/?'). А поскольку игрок 2 будет совер- шать оптимальные ходы в G, выигрыш игрока 1 в G будет не более —- v2 (/?х). Поэтому Vi (р + р') < — (Th) + vt (pj) = — J (рг) + Pj (Pj) + + (/>') < — J(Pi) + (p) + Pl (p'). Введем обозначение: Z>= Max {0, —J (Pi), —J(p')}. Pl&p, Мы доказали, что (Р +Р'Х (р) + РХ (р') +D. Считая, что игрок 1 использует такую же стратегию, полу- чаем: Р1(р) — »i(p') — D \ — ^2 (?) + (?') — В J Р1
523 СУММЫ ПОЗИЦИОННЫХ ИГР 191 Во многих играх побуждение может быть отрицатель- g ным и поэтому D не равно нулю. В шахматах, например, w положение, при котором игрок принужден ходить, хотя он хотел бы спасовать, называется цугцвангом. Для 'Таких игр приведенные выше неравенства являются очень сла- быми, и в дальнейшем мы будем рассматривать только иг- ры, в которых Ji(p) 0 для всех р^Р. Для этих игр D = = 0, и, таким образом, мы получаем следующее соотно- шение, являющееся основным для оставшейся части статьи: - ъ ш+».(/)}<1,1 {р+р,)< 1,1 {р>+1,1 {р,} <3) В частности, используя равенство (2), получаем следующее «метрическое» неравенство: IAp) — J (р')\ < J (р +р') < J (р) + J (/). (4) Так как левая часть этого неравенства неотрицательна, при построении сумм игр свойство неотрицательности J (р) сохраняется. Две игры G и G' будем называть эквивалентными, G^G', если для любого G" удовлетворяется условие (G + G") = v. (G' + G"), причем все три игры должны удовлетворять условию неот- рицательности J (р) для всех р&Р. Очевидно, что это от- ношение есть отношение эквивалентности й что суммы эквивалентных игр эквивалентны. Можно сделать два возражения против такого опреде- ления эквивалентности игр. Во-первых, оно не симметрич- но относительно двух игроков. Во-вторых, не видно эф- фективного способа установить, эквивалентны ли две данные игры. Оба этих возражения будут устранены тео- ремой 1. О Для обобщенной суммы в подстрочном примечании на стр. 189 тем же методом мы получили бы Л (F1 (р), - VZ (р )) | Г1 + р/) fi (г?1 Vi fl (— (Р), Vl (р )) ) Обе эти формулы остаются верными, если переставить индексы 1 и 2. Аналогичные неравенства имеют место для обобщенных сумм трех и более игр.
192 ДЖ. МИЛНОР Обозначим через — G игру, получающуюся из G пере- становкой игроков, так что v± (— G) = v2 (G) и J (— G) = — J(G). Позиция в —G, соответствующая позиции р, будет обозначаться через — р. Рассмотрим игру G 4- G), которую можно сокращенно записать в виде G — G. Из того, что игрок, который ходит вторым, может, симметризуя свои ходы, действовать по крайней мере так же хорошо, как первый, следует, что v± (G — G) О, у2 (G — G) 0. Так как J (G — G) 0, то имеем иг (G - G) = v2 (G — G) == 0. (5) Теорема 1. Следующие три условия эквивалентны: a) G~G'; b) v2 (G + G") = v2 (Gf + G") для всех G"; с) (G - G') = v2(G — G') = 0. Покажем сначала, что v^G + G' ') < (G' 4- G") для всех G" тогда и только тогда, когда (G — G') 0. Под- ставив G" = — G' в первое из этих двух неравенств, получим v. (G - Gf) < Vi (Gf - G') = 0. Обратно, из (3) и (5) следует, что если (G — G') <^0, то (G + G") = Vi (G + G") - vs-i (Gf - G') < < Vi «G+G") +(G'-G')) =Vi ([Gf +G") + (G - G'))< vi + &') + Vi (fi — *4 Vi № +^,Z)‘ Теорема следует из этого утверждения и из того, что Vi (G — G') — v3_i (Gr — G). Например, если имеет место а), то v-l (G — G') < 0 и vx (G' — G) = v2 (G — G') < 0. Так как J (G — G') 0, то выполняется c). Нетривиальный пример двух эквивалентных игр дан на рисунке 1. Вершины обозначают позиции, стрелки обоз- начают возможные ходы, при этом сплошные стрелки — для игрока 1, а пунктирные — для игрока 2. Указан вы- игрыш игрока 1. Из теоремы 1 следует, что игра G эквивалентна ну- левой игре (игре с одной позицией и нулевым выигрышем) тогда и только тогда, когда (G) = (G) = 0.
СУММЫ ПОЗИЦИОННЫХ ИГР 193 Из равенства (5) следует, что G — G ~ 0, так что игра — G действительно является обратной для игры G. Следова- тельно, классы эквивалентности игр образуют абелеву группу по сложению. Представляют интерес некоторые подгруппы этой груп- пы. Симметричные игры — игры, в которых игроков мож- но переставлять,—харак- теризуются свойством G>—' Сили G-f- G~0. Дру- гими словами, они обра- зуют подгруппу элемен- тов порядка 2. Другая подгруппа со- стоит из тех игр, которые удовлетворяют условию J (G) = 0. То, что они об- разуют подгруппу, сле- дует из неравенств (4) и равенства J (G) G). Из (4) также следует, что фактор-группа игр по моду- лю игр с нулевым побуждением является метрической группой с метрикой J. Сама эта подгруппа изоморф- на группе вещественных чисел по сложению, причем изоморфизм осуществляется при помощи (G) или v2 (G). Предположим, например, что игры G и G' удовлетворяют условиям J (G) (G') = 0 и (G) = v1 (G'). Тогда (G) = <£') = — (G) и 0 = vr (G) - v. (G') = v. (G) - v2 (- G') < <^(G-G')<^(G) G') =vAG) +MG') =0. Следовательно, v± (G — G') = 0 и аналогично v2 (G — G') = 0, откуда G~ G'. В частности, G и G' эквивалентны игре, имеющей только одну позицию, в которой игрок 2 выплачивает игроку 1 величину v1(G). Основная задача при изучении сумм игр заключается в описании оптимальных стратегий для суммы двух или более игр в зависимости от знаний о слагаемых играх. Некоторые сведения по этому вопросу дает теорема 2, однако получение точного ответа представляется довольно трудным. ^3 Позиционные игры
194 ДЖ. МИЛНОР Часто может оказаться, что оптимальные ходы в сумме двух игр не являются оптимальными в слагаемых играх. Пример дан на рис. 2. Рис. 2. Теорема 2. Если в некоторой позиции Р Ц- Р' аль- тернатива Ру ЕЕ Мг (р) является оптимальной для игрока 1, то Vy (р) (ру) и v2 (p-у) z;2 (/?).' Кроме того, для позиции р' должныудовлетворяться неравенства (р) + (Pi) < J (р') < (Р1) + v2 (р). Эти неравенства получаются из равенства Vy (р 4- р') ~ = — v2 (Pi + /О, которое устанавливает, что Ру 4- р' является оптимальной альтернативой для игрока 1 в позиции р 4~ р', и из неравенств (3), примененных к (Р + р') и v2 (рх +р'). Для того чтобы лучше понять значение этих неравенств, дадим некоторые новые определения. Функция потери (ру \р) = (р) 4- v3^ (ру) дает вели- чину, на которую альтернатива р± £= (р) отличается от оптимальной. Ее основным свойством, которое следует из (1), является ri(p1\p)'^0, где равенство имеет место тогда и только тогда, когда альтернатива ру оптимальна. Функция прибыли (рг | р) = узЧ (/?) — (у?3) дает величину, на которую ход в позицию р± ЕЕ (р) лучше, чем пас. Ее основным свойством является gi (Р1|р) < J (р), где равенство имеет место только для оптимальных ходов. Это следует из уравнения gi (Р1|р) = /(р) — гМр). Ход в позицию рг -|- р' е М\ (р -|- р') будет называть- ся сен-те *), если ________________J (Pi) > J (Р')- !) Термин заимствован из японской игры «Ходи».
СУММЫ ПОЗИЦИОННЫХ ИГР 195 Ход сен-те стремится заставить противника ходить в той же игре. Число (Pi. Р') = max (О, J (р') — J (Pi)) дает величину, на которую ход в позицию рг 4- р' е= ЕЕМ^р 4-/?') отличается от хода сен-те. Это —- неотрицатель- ная величина, равная нулю только для ходов сен-те. Ис- пользуя эти три величины, можно переписать теорему 2 следующим образом. Теорема 2'. Если альтернатива рг 4- р' ЕЕ ЕЕМ^р4-р') является оптимальной, то имеют место сле- дующие неравенства: Г1 (Pl |р) < min (J (pj, J (р')), 81 (Pi, Р') < gi (Pi\p)- Грубо говоря, первое неравенство показывает, что ход, который не оптимален в G, может оказаться оптимальным в G 4- G' только тогда, когда он ведет в позицию с боль- шим побуждением и когда игра G' имеет большое побуж- дение. По-видимому, желательно приводить противника в позицию, в которой обе игры имеют большое побужде- ние, и для достижения этой цели может оказаться целе- сообразным совершить ход, не оптимальный в G. Второе неравенство показывает, что ход, не являю- щийся ходом сен-те, может быть оптимальным в G 4- G' только если он гораздо лучше, чем пас; это*неравенство показывает также, что ход сен-те не может быть хуже, чем пас. Следующие неравенства описывают поведение функции потери и функции прибыли при образовании сумм игр. Они непосредственно следуют из (3), в дальнейшем ис- пользоваться не будут и включены только для полноты изложения: Г1 (А I Р) — min (J (/>!), J (//)) Г1 (Р1\Р) + «1(Р1, p')~J (р) <г1(р1 + р’\р + р') < < ri (Pi | р) + J (?'), gi(pi\p)—J(p')] . , ,, , Agi(Pi\p)+J (р'), gi(Pi\p)—J(p) J gl P1 р‘р + р^ Ui(pi|p)+7(Pi). 13*
196 ДЖ. МИЛНОР Следующая теорема характеризует те ходы в игре, кото- рые могут оказаться оптимальными в некоторой сум- ме игр. Теорема 3. Следующие три условия эквивалентны: а) альтернатива р± — р М± (р — р) оптимальна; Ь) альтернатива р± 4~ Р' (р 4- р') оптимальна при некотором р'; с) альтернатива рх 4- р" ЕЕ М1 (р -4 р") удовлетво- ряет неравенству gr (рг 4- р" | р 4- р") > 0 для всех р№. Полагая р' = — р, получим, что из а) следует Ь). Если альтернатива рг 4- р' оптимальна для р 4- р', то (Pi + Р") + (р' “ Р") оптимальна для (р + р") 4- +(р'-~р")- Так как ход в позицию рг+р" оптимальный в не- которой сумме игр, из теоремы 2 следует, что он дает неотрицател ную прибыль. Поэтому из Ь) следует с). Если р" = — р, то из с) получаем соотношение о < £1 (Pi - Р 1Р - Р) = vz(P — Р) - р) = = — vz(Pi~ Р)< ViiP — Р) = О, которое показывает, что р± — р оптимальна для р — р, и доказательство завершается. Следующее утверждение можно рассматривать как обратное к (3). Теорема!. Если игрок 1 должен ходить в позиции р р' и если он совершает первый ход в игре G, то для любой позиции игры G G' выигрыш к± в этой игре удов- летворяет неравенствам V1 (р) + (р’) — 2rl — 2sl < < *4^1 (Р) У2 (Р ) + 2 + Ss2, где первые два суммирования берутся по всем ходам, совер- шенным игроком 1 в данной партии, а последние два — по всем ходам, совершенным игроком 21). Таким образом, если игрок 1 сможет всегда совершать ходы, которые являются оптимальными в G или G', и сен-те, то он достигнет верхней границы и± (/?) 4- и± (р') для своего выигрыша. Если игрок 2 сможет всегда со- вершать оптимальные ходы сен-те, то он достигнет нижней х) В этой теореме неотрицательность J не требуется, так как теорема опирается только на (1).
СУММЫ ПОЗИЦИОННЫХ ИГР 197 границы г?! (р) — и2 (р') (или — v2 (р) Ц- (/?'), если пер- вый ход совершается в (?')• Из того, что эти два случая обычно несовместимы, следует, что часто бывает невозмож- но совершать ходы в (? -)-(?', которые являются одновре- менно оптимальными в G или G', и сен-те. Докажем только первое неравенство, так как доказа- тельство второго аналогично. Пусть игрок 1 совершает ход в позицию pi + р' е Мг (р 4- р') и игрок 2 отвечает ходом в позицию р2 р2 , где или pL = р2, или р' = р2 . В первом случае имеем Pl = Р2. У2 (Р') > — Vj. (р’2), V1 (Pi) + (р«) = vt (рх) + Vt (р'2) > (pj) — v2 (р') = = ”1 (Р) + (р') — (Pj.\p) — (J (р') —J (Pi))* Во втором случае Р' = р\, (р2), (Ра) + (р'а) = Р&Ра) + (р') > — (Pi) + (р') = = (р) + (Р') ~ (Pi |р) — 0. Объединяя эти два неравенства, получаем vi (Ра) + »1 (Рг) > (Р) + (Р') — (Р1.\р) — Si (pi,p'). Написав соответствующие неравенства для каждого хода игрока 1 в данной партии игры и объединив их, мы полу- чим требуемое неравенство. (Если игрок 2 следует стра- тегии а) и стратегии Ь') из подстрочного примечания на стр. 189, то легко показать, что в этом выражении будет иметь место равенство. Это дает другое доказательство соотношения (3).)
СРЕДНЯЯ ПАРТИЯ ДЛЯ СУММ позиционных ИГР1) О. Ханнер Стокгольмский университет § 1. Введение. В 1953 г. Милнор рассмотрел некоторый класс позиционных игр двух лиц и определил понятие сум- мы таких игр [1]. Он исследовал оптимальные стратегии для этих сумм игр и получил некоторые их свойства, за- висящие от свойств слагаемых игр. В этой статье мы рассмотрим некоторые другие страте- гии для сумм игр. Они, вообще говоря, не являются опти- мальными. Однако можно оценить разницу, которую игрок получает, используя одну из этих стратегий вместо оптимальной. В сумме п экземпляров одной и той же игры эта разница ограничена для всех п. Следовательно, в сред- нем эта разница мала для больших п. § 2. Описание рассматриваемых игр. Следуя, по сущест- ву, Милнору [1], мы описываем эти игры следующим об- разом. Каждая игра имеет конечное множество позиций Р. Имеется два игрока и А2. Для каждого р е= Р и каж- дого игрока Ai, i = 1, 2, задано множество возможных альтернатив 2) Mi (р) cz Р. Для каждого р либо Мх(р) и М2 (р) содержат по крайней мере по одной позиции, либо оба эти множества пусты. В последнем случае р называет- ся окончательной позицией. Для любой цепи р0, рь ...,рг, ^Hanner Olof, Mean play of sums of positional games, Pacific J. Math. 9, № 1 (1959), 81—99. 2) В оригинале «move». (Прим, ред.}
СРЕДНЯЯ ПАРТИЯ ДЛЯ СУММ ПОЗИЦИОННЫХ ИГР 199 где pj+1 е Мг (р?) J М2 (pj), должно иметь место р7 =f= =1= рк, если J =/= к. Максимальное число I шагов во всех таких цепях, начинающихся с р0 = р, будет обозначаться через I (р). Тогда из Pi е (р) J М2(р) следует I (рх) < I (р), (2.1) Заметим, что пас р е= М (р) невозможен. Позиции, в кото- рых I (р) = 0, являются окончательными позициями. Для каждой окончательной позиции определены функ- ции выигрыша к± (р) = — к2 (р). Они должны удовлетво- рять приведенному ниже условию. Игроки начинают в некоторой позиции и ходят по очереди, пока не достигает- ся некоторая окончательная позиция. Тогда каждый иг- рок получает свой выигрыш. Для каждого игрока Аг и позиции р пусть vi (р) есть значение игры для Аь если его очередь ходить в этой по- зиции. Это значение задается уравнениями: Щ (р) = ki (р), если I (р) = О, Vi (р) = max {— 1>3_{ (pi) | pi е (р)}, если I (р) > 0. ' ' Из (2.1) следует, что эти формулы определяют vi (р) индукцией по I (р). Числа ki (р) определены в окончательных позициях р. Потребуем, чтобы они были заданы так, что (р) + (р) > 0 для каждого р Р, (2.3) « Так как значение игры в позиции р для А{ есть (р), если игрок имеет ход *), и есть — v3^ (р), если имеет ход дру- гой игрок, величина (р) 4- v2 (р) является прибылью игрока от владения ходом. Неравенство (2.3), следователь- но, утверждает, что ходить по крайней мере так же хоро- шо, как пасовать (если бы это допускалось). § 3. Суммы игр. Определим теперь сумму двух игр G и 6?'. Позицией в сумме игр G 4- G' является пара (р, р') ЕЕ ЕЕ Р X Р'. Ход в G -j- G' состоит из хода в одной из игр G и G' и паса в другой. Таким образом, альтернативами в позиции Р 4~ р' = (р, р') являются Mi (р + р') = Mi (р) х р' и? х м{ (р'). !) То есть имеет очередь хода. (Прим, ред,)
200 О. ХАННЕР Отметим, что Я 1(р + р') = I (р) + I (/). (3.1) I В частности, сохраняется свойство, что в цепи из еле- | дующих друг за другом позиций все позиции различны. | Позиция р + р' является окончательной тогда и только I тогда, когда и р и р' являются окончательными позиция- | ми. В окончательных позициях определим (р 4- р') ра- | венством | kt (Р + р') = kt (р) + (/). (3.2) I Если две игры удовлетворяют условию (2.3), то еще I не очевидно, что этому условию удовлетворяет их сумма. | Это было доказано Милнором [1] и будет также получено 1 здесь в § 8 как следствие теоремы 1. J Очевидно, что сложение игр является ассоциативной 1 и коммутативной операцией и что формулы, аналогия* Я ные формулам (3.1) и (3.2), имеют место для сумм любого 1 конечного числа игр. Ход в сумме нескольких игр состоит < из хода в одной из них и паса во всех остальных. § 4. Основная задача. Нашей задачей будет дать хоро- шие стратегии для сумм игр, исходя из свойств слагаемых ч игр. Прежде всего нужно определить, какие стратегии | мы будем считать хорошими. 1 Один подход к этой задаче состоит в следующем. Рас- | смотрим п экземпляров игры G и возьмем их сумму nG. 1 Пусть все они начинаются в одной и той же позиции р. i Значение игры для суммы игр есть vi (пр), где пр означает | р -f-... + Р- Что происходит со средним значением 1 vi (пр) In, когда п стремится к бесконечности? Оказывает- > ся, что это число стремится к пределу mi (р), который мы * назовем средним значением игры G в позиции р. В следую- j щих параграфах^мы покажем,44то^^ (р) удовлетворяет j соотношениям • т, (р) + m2(p)>0, F (4.1) ' т-i (?) < v{ (р). (4.2) Если в (4.2) заменить i на 3 — i и использовать (4.1), то получим —>з-< (р)К Щ (/?). (4.3) к
СРЕДНЯЯ ПАРТИЯ ДЛЯ СУММ ПОЗИЦИОННЫХ ИГР 201 Итак, (р) лежит между величинами (р) и — узн(р), которые представляют собой значения игры для Ait когда игра начинается в позиции р игроком Аг или игроком А3_^ соответственно. От хорошей стратегии мы теперь потребу- ем, чтобы она обеспечивала по крайней мере (p)t Из (4.3) видно, что, хотя такая стратегия не может гаранти- ровать (р), тем не менее Аг получит больше, используя ее, чем пасуя (если бы это допускалось). Существование предела величины (пр)1п может быть доказано непосредственно с помощью неравенства, вы- веденного Милнором (см. [1], стр. 191): Vi (р) — 1>3-Х (р') < Vi (Р + Р') < Vi (Р) + Vi (pz). Мы получаем Vi ((т + ri)p)^ Vi (тр) + Vi (пр), откуда следует существование предела для (пр)/п (ср. [2]). Ниже будет использован другой подход к этой задаче, также приводящий к числу (р). Когда игрок должен ходить в сумме игр, он выбирает одну игру, скажем G, и совершает в ней ход. Тем самым он теряет возможность совершить ход в каждой из остальных игр. Если цену этой возможности положить равной t, то естественно срав- нить это положение с тем случаем, когда игрок должен ходить в G и выплачивать другому игроку величину t, совершая ход. Это приводит к играм и <?*, определен- ным в следующем параграфе. При таком подходе величи- на тщ (р) определяется индукцией по I (р), т. е. конечным процессом, а не предельным переходом. Некоторые обозначения на рисун- ках. Приводя примеры игр на рисунках, используем следующие соглашения. Позиции изображаются точками, а ходы указываются соединяющими их отрезками. Ход игрока А± изображается отрезком, идущим вниз налево, ход А2 — отрезком, идущим вниз направо. В оконча- тельной позиции записывается величина кг (р), а во вся- кой другой позиции — два числа (т, о), где т = т1 (р) и а = а (р) определяются в следующем параграфе. Если не оговорено иное, игра начинается с наивысшей точки как из начальной позиции.
202 О. ХАННЕР Пример 1. Пусть G — игра, изображенная на рис. 1; рассмотрим сумму п экземпляров игры G. Сначала пусть все игры начинаются в р2. Тогда, очевидно, прибли- зительно в половине игр Аг получит 7, а в остальных 3. у I о Следовательно, среднее значение т1 (р2) равно —~— — 5. Аналогично получаем т1 (р3) = —1. Если все игры на- чинаются в позиции р1? то можно доказать, что оптималь- ная партия для обоих игроков заключается в выборе ходов из позиций рь р2, р3 в этом по-. р fyt) рядке предпочтения. Таким об- разом, если оба играют опти- мально, то сначала они совер- шат Х°Д из Pi во всех играх. /\ После этих лг ходов игроки на- / \ / \ чинают действовать из позиций 7 3 0 ~3 Р2 в тех играх, где А± совер- шил ход из pv Наконец, разы- Рис- 1- грываются оставшиеся игры с позициями р3. Около х/4 игр будет заканчиваться в каждой из четырех окончатель- ных позиций. Поэтому среднее значение т1 (pj равно (7-4-3 -[-О —2)/4 = 2. Порядок предпочтения позиций ръ Ръ, Рз должен быть сравним с числами а (рх), о(р2), о(р3), которые определяются в следу- ющем параграфе. Как указано на рис. 1, а (рх) = 3, а (р2) = = 2, а (р3) = 1. Число а (р) яв- ляется, по существу, ценой хода из позиции р. Пример 2. Изменяя в предыдущем примере одно из значений выигрыша, мы полу- чим игру, изображенную на рис. 2. Рассмотрим опять партию в сумме п экземпля- ров этой игры. Если все игры начинаются в рп то опти- мальной партией является теперь выбор ходов из позиций рп Ръ, Рз в следующем порядке предпочтения: р2, рх, р3 — в соответствии с тем, что а (р2) = 5, а (рх) = 4, а (р3) — 1. Поэтому, если А± ходит из рг в р2 в некоторой игре, то А2 будет немедленно ходить в той же игре. Таким обра- Р;(3,4) Рис. 2.
СРЕДНЯЯ ПАРТИЯ ДЛЯ СУММ ПОЗИЦИОННЫХ ИГР 203 зом, все игры, за исключением, может быть, только одной, закончатся в позиции с выигрышем кг (р) = 3. Значит, mi (Pi) = 3. Только если А2 имеет первый ход, одна игра закончится в другой окончательной позиции, с выигры- шем кг (р) — 0. § 5. Игры Gt и G*. Пусть G есть игра, удовлетворяю- щая, как обычно, условию (2.3). Пусть t — вещественное число > 0. Если I (р) = 0, положим для i — 1, 2 Щ (?; 0 = К (р), (р) = кг (р), б (р) = 0. Для каждого р с I (р) 0 определим четыре функ- ции от t: и± (р; Z), и2 (р; t), (р; t), v2 (p; t) — и три числа: (р), т2 (р) и о (р). Они должны удовлетворять следующим условиям (5.1) — (5.7): (5.1) Каждая из функций щ (р; t) и (р; f) непрерыв- на для > 0 и имеет производную всюду, кроме конеч- ного числа значений t. В каждом интервале между этими особыми значениями каждая функция линейна с произ- водной 0 или —1. Для t, больших всех особых значений, функция щ (р; t) имеет производную, равную —1, а (р; t) имеет производную, равную 0; Vi(p-, 0) = Vi(p); (5.2) Ui (р; t) = max {— (px; t) | рг (= (p)} —f, (5.3) MP!0) = Vi(p); (5.4) б (p) = min {t 11 0, (p; t) -f- w2(p;*Z) — 0}; (5.5) Mp) = Mp; o(p)); (5.6) . при o< t < c (p), Мр, )~|m.(p) при £><s(p). Ниже мы увидим, что эти условия относятся к двум играм Gt и G*. Но сначала покажем, что они определяют наши функции и числа с помощью индукции по I (р). При I (р) =0 функция (р; t) постоянна и равна (р), следовательно, она удовлетворяет условиям (5.1) и (5.2). Пусть I (р) 0, и пусть для каждого р± с I (pj <С I (р) и, в частности, для каждого рг ее Мг (р) уже опре- делена (рх; Z), удовлетворяющая (5.1) и (5.2). Тогда из (5.3J можно определить щ (р; t). Из (5.1) для каждого
204 О. ХАННЕР Узн (Pi, t) немедленно получаем (5.1) для щ (р; t), а из (5.2) для каждого (рх; t) и из (2.2) получаем (5.4). Из (5.4) и (2.3) имеем иг (р; 0) + и2 (р; 0) > 0, и из (5.1) для щ (р; t) имеем ux (р; t) + и2 (р; t) -> — со при Рис. 3. t ->оо. Следовательно, так как щ (р; t) непрерывна, множество из (5.5) непусто, и а (р) определяется и будет > 0. Тогда^(5.6) и (5.7) определят (р) и (р; 0- То, ur(p;t):ACF, -uz(p;t)'-ВСЕ, v^p^t)'• АСЕ, -oz(p;t)-BCE Рис. 4. что (р; t) удовлетво- ряет (5.1) и (5.2), сле- дует из соответствую- щих фактов для щ (р; t). Таким образом, индук- ция оправдана. Пример 3. На рис. 4 изображены функции ux(p; t), (ptf), (р; t), —v2(p; t) и величины т1 (р) и а (р) для игры, приве- денной на рис. 3. Из свойств (5.1) — (5.7) следуют некоторые дальнейшие формулы. Так как известно лишь, что условия (5.1) — (5.7) верны при I (р) 0, мы должны отдельно проверять случай I (р) — 0 каждый раз, когда получаем формулу, имею- щую смысл также и в этом случае. Заметим, что функ- ция щ (р; t) не определена при I (р) = 0. Так как из (5.1) следует, что щ (р; t) есть убываю- щая функция, (5.6) и (5.7) дают Щ (р; t) = шах {щ (р; t), т< (р)}. (5-8)
СРЕДНЯЯ ПАРТИЯ ДЛЯ СУММ ПОЗИЦИОННЫХ ИГР 205 Отсюда, в частности, Щ (р; t) > mi (р). В силу (5.5) и (5.6) mi (р) + т2 (р) = 0. Легко проверить, что (5.9) и (5.10) верны I (р) = 0. Для любого р они дают Vi (р; t) + v2 (р; t) 0. Из (5.2) и (5.9) получаем Щ (Р) > пц(р). (5-9) (5.10) также при (5.Н) (5.12) Так как производная от р{(р; t) равна 0 или —1, при tx t2 имеем 0 < Vi (р; ti) — Vi (р; t2 — tr. Из этого неравенства при tr = 0 и t2 (р), используя (5.2), (5.6) и (5.7), получаем Р«(р)<т{(р) + о(р). (5.13) (5.12) и (5.13) верны также и при I (р) = 0. Для любого р они дают нижнюю и верхнюю границы для vi (р). Теперь можно определить упомянутые выше игры Gt и G*. Обе игры определены для каждого £ > 0. Они иг- раются на позициях игры G. Игроки ходят по очереди. Но каждый раз, когда игрок совершает ход в новую пози- цию в игре G, он должен выплачивать величину t дру- гому игроку. Таким образом, при больших t совершение хода будет дорого стоить. Поэтому вводим новую воз- можность. Когда Ai имеет ход в Gh ему разрешается вместо совершения хода прекратить игру. В игре G* имеется та же возможность во всех позициях, кроме на- чальной, в которой начинающий игру игрок обязан в действительности ходить (и платить t). Когда прекра- щает игру в р, он получает (р). Тогда по (5.10) Лзч получает m3_^(p). Значение игры Gt в р равно (р; t), а значение игры б?*, начинающейся в р, равно щ (р; t). Это получается по индукции из (5.3) и (5.8).
206 О. ХАННЕР При больших t невыгодно начинать в игре G*. На- чинающий игрок совершит ход и выплатит t, а другой игрок после этого немедленно прекратит игру. Поэтому при достаточно больших t начинающий игрок всегда будет проигрывать. Таким образом, G* не удовлетворяет (2.3). Однако игра Gt, как видно из (5.11), удовлетворяет (2.3). Действительно, мы ввели число (р) и возможность прекращения игры именно с целью сохранить это свой- ство. Число (/?), определенное равенствами (5.5) и (5.6), есть значение игры G* с начальной позицией р, когда t становится настолько большим, что иметь первый ход в G* становится невыгодным. Наименьшее из таких t есть о (/?). § 6. t-оптимальные ходы. Назовем ход в G t-onmu- малъным, если он оптимален в Gt, Таким образом, ход в позицию рг ЕЕ Mi (р) t-оптимален, если щ (р; 0 = — уз-г (а; 0 — t. (6.1) Ai имеет t-оптимальный ход в позиции р, если у. (р; t) = щ (р; t). Таким образом, из (5.7) мы полу- чаем следующий важный результат. Если о (р) t и если р не является окончательной позицией, то всегда су- ществуют t-оптимальные ходы для обоих игроков. Если о (р) t, то мы имеем (/?; t) = (/?), и оп- тимальным действием в Gt является прекращение игры ври получение величины (/?). Рассмотрим теперь последовательность позиций • • • ..., pi, получающуюся, когда игроки играют по очереди и совершают t-оптимальные ходы. Если о (pz) t, то t-оптимальные ходы в pt существуют. Поэтому последо- вательность можно продолжить, и так можно поступать, пока не достигнем позиции р с о (р) t. Предположим, что это уже выполнено, так что о (рг) t. Мы хотим получить некоторые формулы для 1щ (рк), 0 к /. Так как все ходы в этой последовательности t-оптимальны, игрок, играя в Gt, не может получить больше от прекращения игры в позиции рк, к I, чем от хода в позицию Таким образом, если А{ совер- шает первый ход и если мы положим (р0; t) = v, то
СРЕДНЯЯ ПАРТИЯ ДЛЯ СУММ ПОЗИЦИОННЫХ ИГР 207 будем иметь тг (Ры) < если 0 2 к <4 Z, (6.2) тг (р2к+1) v + Ъ если 1 2ft 4- 1 <4 Z, (6.3) где величина 4-Z в (6.3) есть сумма, которую должен иметь Aif если игра прекращается после нечетного числа ходов, в качестве компенсации за то, что он совершил на один ход больше, чем Л3_{, так как каждый игрок платит Z, если он ходит в Gt. Так как о (рг) t, оптимальным дей- ствием в pi в игре Gt является прекращение игры. Следовательно, тщ (pi) — v, если I четно, (6-4) тгц (pi) = v -р Z, если I нечетно. (6-5) Формулы (6.2) — (6.5) можно также получить из (6.1). Так как все ходы Z-оптимальны, имеем (Ро, t) = — ^3—i (Pl, t) — t = = vi(p2; f) =— v3-.i (p3; t) — и отсюда будут следовать (6.2) — (6.5), если мы используем (5.9) и (5.10) и то, что при o' (Pi) С t из (5-7) имеем т, (рг) = Vj (pt; t) для / =1,2. Пример 4. Игра, изображенная на рис. 5, пока- зывает, что в (6.2) и (6.3) может иметь место строгое нера- венство. Все ходы, которые ведут из pQ в р5, являются 1-оптимальными, и v = v (р0; t) =1. Пусть теперь Z-оптимальные ходы совершает в Gt только один из игроков. Он получит по крайней мере столько, сколько тогда, когда и другой игрок совершает Z-оптимальные ходы. Таким образом, можно получить некоторые формулы, соответствующие формулам (6.2) — (6.5). Объединим их в двух леммах. Лемма 1. Пусть р0, р1?..., рг -— такая последо- вательность позиций в G, что р2к+1 ЕЕ (р2к), где ход в позицию р2к+1 есть t-оптимальный ход из р2к, и что
208 О. ХАННЕР Р2*+2 ЕЕ M3-i(P2/t+i)- Тогда, если щ (р±; t) = v, то имеем: mi > V + (6-6) если и I четно. (6.7) Лемма 2. ПустьpQ, рх,..., Pi —такая последователь- ность позиций в G, что p2k+2 G Мзч> (т?2&+1) и Рглч-i (р2к), где ход в позицию р2к+2 есть t-оптимальный ход из р2к+1. Тогда, если (pQ; t) = v, то имеем: mi Ы < v< (6.8) m. (P^ v + С если $(Pi)^t u l нечетно. (6.9) § 7. Средние стратегии для сумм игр. Переходим те- перь к нашей основной теме — суммам игр. Теорема 1. Пусть игры Gr,..., Gn имеют началь- ные позиции q^-.., qn. Положим (21) + ••• + (?п)»] о = max {о (qr) 11 г •< п}. Тогда, если Ai начинает в позиции q± 4~ ••• + Яп в + ^п, то значение vi (gx -|-... gn) для удо- влетворяет неравенствам + • • • + < mi + <5- Доказательство проводится индукцией по I (^ + ... + qn). Если I (^ + ... + qn) = 0, то все qT являются окончательными позициями, и теорема пря- мо следует из т{ (qr) — кг (qr) и о (qr) =0. В силу (2.1) после одного или нескольких ходов из пози- ции qi+-^ + qn мы попадаем в некоторую позицию Р1+ + Рп с (Р1 + ... +Рп) < I (?1 + •.. + ЯпУ Следовательно, при доказательстве теоремы можно пред- полагать, что она верна для всех позиций, получаемых из + Яп после одного или нескольких ходов. Исходя из соображений симметрии, можно провести доказательство, считая i— 1,т. е. что А± совершает первый ход. Тогда нам нужна для него такая стратегия, которая
СРЕДНЯЯ ПАРТИЯ ДЛЯ СУММ ПОЗИЦИОННЫХ ИГР 209 гарантирует ему величину тпп и для Л2 такая стратегия, чтобы не мог получить более чем т1 4- о. Эти стратегии могут быть описаны вместе. (а) Совершать всегда о-оптимальный ход в одной из игр Gn. ((3) За исключением первого хода, ходить в той игре, в которой другой игрок только что ходил. Вообще говоря, следовать этой стратегии в течение всей партии не всегда возможно, так как не во всехпозициях существуют о-оптимальные ходы. Поэтому эта стратегия должна использоваться в течение некоторого периода в начале партии. В позиции на конце этого периода будет использоваться индуктивное предположение. Длина пе- риода зависит от совершенных ходов. Укажем две воз- можности при окончании периода1). (Yi) Другой игрок играет в игре 6?г, и это приводит к позиции рг с о (рг) <*• (у2) Достигаются позиции pr, 1 г п, для которых а (рг) < Мы должны показать, что игрок может следовать (а) и (Р), пока не наступит (ух) или (у2). Во-первых, Аг всегда может совершить свой первый ход. Действительно, по определению и существует такое qr, что а (qr) = а; сле- довательно существует а-оптимальный ход в Gr. Для всех дальнейших ходов игрок, следующий указанной стратегии, должен ходить из позиции рГ1 котирую другой игрок только что получил. Тогда, если не имеет места (ух), то о (pr) > ff и в позиции рг существует о-оптимальный ход. Следовательно, игра может быть продолжена, пока не наступит (ух) или пока игрок, следующий указанной стратегии, не закончит всю игру-сумму, придя в окон- чательную позицию. Тогда о (рг) — 0 для всех игр Gr и выполняется (у2)« Следовательно, можно следовать (а) и (Р), пока не наступит (уг) или (у2). Чтобы можно было использовать индуктивное пред- положение, нужно сравнить с тг (Pi) + ... + (рп), г) Предполагается, что по крайней мере один из игроков сле- дует указанной стратегии. {Прим, ред.) 14 Позиционные игры
210 О. ХАННЕР где рг есть позиция в Gr на конце периода. Сначала срав- ниваем т1 (qr) с (рг) для каждого г. Следовательно, мы интересуемся ходами в течение периода, совершаемы- ми в Gr. Отметим, что если по крайней мере один из игроков следует указанной стратегии, то из условия (0) вытекает, что эти ходы совершаются игроками пооче- редно. Таким образом, для каждой игры Gr можно при- менить леммы 1 и 2 предыдущего параграфа при t = о. Так как а > а (<?г), то число v = о) в этих леммах равно т^г). Пусть сначала Л i следует указанной стратегии. Обозна- чим через рг позицию в Gr на конце периода. Тогда, если ход в позицию рг совершается игроком Л2, то, так как Аг следует (0), этот ход — последний в периоде, и независимо от того, кончается этот период при (yj или при (у2), получаем а (рг) а в этой игре Gr. Используем (5.10) для qr и рг, 1 г п, и применим лемму 1 при i = 1 и лемму 2 при i = 2. Тогда из (6.6), (6.7), (6.8) и (6.9) со- ответственно вытекают следующие четыре формулы, за- висящие от того, кто совершает первый и последний ходы в Gr: mi (Рг) > (?г) + °» — первый и последний ходы, (7Л) тщ (Рг) > Gfr)» — первый ход, А2 — последний ход, (7.2) mi (рг) mi (Яг)> Л2— первый ход, Аг — последний ход, (7.3) (Рг) > mi (#г) “ Л2 ~~ первый и последний ходы. (7.4) Добавим тривиальное равенство mi (Рг) = mi (?г), если в Gr не совершен ни один ход. (7.5) Формулы (7.1) — (7.5) можно объединить в одну формулу тМ>™М + lir<5 — l2r<s, (7.6) где lir — число ходов, совершенных в течение периода иг- роком Ai в Gr. Просуммируем неравенства (7.6) по всем г. Тогда (Р1) + ... + пц (рп) > TOj + ZjO — Z2a, (7.7) где h — число ходов, совершенных А^ в течение периода.
СРЕДНЯЯ ПАРТИЯ ДЛЯ СУММ ПОЗИЦИОННЫХ ИГР 211 Если число ходов в периоде четно, то имеем 1г = 12. А19 совершающий первый ход в периоде, должен также совершать и первый ход после периода (если вообще воз- можен какой-нибудь ход). После окончания периода Лх может играть так, что обеспечивает себе v1(p1 4- ... 4- рп). По индуктивному предположению это выражение > mi (Pi) + ••• + mi (Рп)> а последнее > т1 в силу (7.7). Следовательно, мы показали, что может играть из позиции + ... 4- qn, так, чтобы обеспечить себе т19 и левое неравенство нашей теоремы в этом случае дока- зано. Теперь нужно рассмотреть также случай, когда период содержит нечетное число ходов. Тогда, так как Ах совер- шает первый ход, он также совершает и последний ход, и период оканчивается не при (ух), следовательно, при (у2). Таким образом, а (рг) а для каждого Gr. В этом случае Z24~l. А± может играть после окончания пери- ода так, что обеспечивает себе величину— v2(PiA-_\~Рп)- По индуктивому предположению из а (рг) о и (7.7) получаем — v2 (л + •••+ Р„)>— ^2 (?х) —т2 (pn)— max {б(рг)}> > — т2 (/\) —• ••— w2 (Р„) — б = = (pj +... + т1 (рп) — б > > 1П1. Следовательно, левое неравенство теоремы доказано также и в этом случае. Для доказательства правого неравенства предполагаем, что А2 следует указанной стратегии. Тогда по (0) А± совершает первый ход в каждой игре Gr (если вообще имеются ходы в игре Gr в течение периода). Из леммы 2, при 1, в зависимости от того, кто совершаем послед- ний ход в Gr, получаем: mi(Pr) Л2 —последний ход, (7.8) (Pr) < mi А1~ последний ход. (7.9) Рассуждая, как и выше, мы получаем формулу, подоб- ную (7.7), а именно: (Pi) + ••• + (Рп) < (7.Ю) 14*
212 О. ХАННЕР Если период содержит нечетное число ходов, то Zi = 12 4-1. Тогда А2 совершает первый ход после периода (если вообще возможен какой-нибудь ход). По- этому он может играть так, что А± получит не более —v2 (pi +рп). Из индуктивного предположения и из (7.10) имеем — ^2 (^1+ • •• + Рп)< —те8(Р1) —W2(P„) = = (р,) + • • • + (рп) < <Cmi4~ б, так что правое неравенство в этом случае доказано. Наконец, если период содержит четное число ходов, то = Z2 и период заканчивается при (у2), так что а (рг) о. Тогда Аг получает не более *4 (/4 + ••• + рп), и из индук- тивного предположения и из (7.10) следует Мл + • • • + ЛгХ (л)+ < т! (л) + ГП1 + б, • + те1(Рп) + тах<°(л)Х • + W-i(P„) + a< и правое неравенство доказано также и в этом случае. Этим завершается доказательство теоремы 1. В приведенном доказательстве стратегия, определяе- мая условиями (а) и (0), используется только в течение не- которого периода в начале партии. После окончания этого периода мы применяем индуктивное предположение. Но это означает, что мы начинаем отсчитывать новый период и затем снова используем (а) и (0). Продолжая таким об- разом, получаем следствие из доказательства теоремы 1. Теорема 2. Сделаем те же предположения, что и в теореме 1. Пусть один игрок Ак следует стратегии, удовлетворяющей перечисленным ниже условиям (а) — (d). Тогда совершающий первый ход игрок А^ получит не менее mi при k = i и не более пц 4- а при к = 3 — i. (а) Разбить ходы, совершаемые двумя игроками, на периоды. (Ь) Пусть для каждого периода т есть максимум из всех о (рг) в позицияхрг в начале этого периода. При этом х, определенном для периода, всегда в течение этого периода совершать х-оптимальные ходы.
СРЕДНЯЯ ПАРТИЯ ДЛЯ СУММ ПОЗИЦИОННЫХ ИГР 213 (с) За исключением первого хода в периоде, играть в той игре, в которой только что сыграл другой игрок, (d) Начинать отсчет нового периода в одном из следую- щих двух случаев: (dj другой игрок ходит в Gr в позицию рг с о (рг) т, (d2) во всех Gr, 1 г п, достигаются позиции рг с О' (Рг) < т. Стратегии, удовлетворяющие условиям (а) — (d) этой теоремы, будем называть средними стратегиями, § 8. Свойства величин т^р) и сг(р). Используя тео- рему 1, легко доказать, что сумма игр, удовлетворяющих условию (2.3), также удовлетворяет (2.3) (доказано Мил- нором ([1 ], стр. 191)). Действительно, по теореме 1 vi(9i+... + 9n)>7n.. Так как т± (qr) 4- т2 (qr) = 0 при каждом г, получаем mi + т2 = 0- Следовательно, . + qn) + . + qn) О, а это и есть (2.3) для Gr + ••• + <?п. Таким образом, G± 4- ... 4- Gn является игрой описан- ного в § 2 вида. Поэтому можно применить § 5 и опреде- лить, например, ui(ql 4- ... 4- qn-, t), пц (^ 4- ... 4- qn) и а ($1 + ••• + 9п)* Теорема 3. Пусть игры Gr,,,,, Gn тчинаются в позициях qn. Тогда тг (q1 + . . . + qn) = т. (qj 4- ... 4- (?n), (8.1) б (^ 4- . .. 4- qn) < max {б (qj 11 < г < п}. (8.2) Правые части в этих формулах суть как раз гщ и а соответственно, определенные в теореме 1. Доказательство. Нам понадобится следую- щая лемма. Лемма 3. и1 (?х + • • • 4- ?п; <5) = т., если I 4- . .. + qn) > 0. Прежде чем доказывать эту лемму, убедимся в том, что из нее следует теорема 3. Если I (q± 4- ... 4- qn) ~ 0, то (8.1) и (8.2), конечно, верны. Если I (дх 4— 4- qn) 0,
214 О. ХАННЕР то из леммы 3, так как 4- т2 — 0, получаем ui (#i + ••• 4~ Чп\ + u2 (#i 4~ ••• + Qnt = Cl- Тогда из (5.5) следует (8.2). Из (5.5) и из того, что щ (^i 4~... qn\ t), i =1,2, суть убывающие функ- ции от t, также видно, что они постоянны в интервале + +?п), <?)• Тогда (8.1) следует из (5.6) и леммы 3. Доказательство леммы 3. Рассуждение похоже на доказательство теоремы 1. Без ограничения общности можем положить 1 = 1. Сделаем индуктивное предположение, что теорема 3 верна для всех позиций Pi + ••• + Рт получаемых из q± 4~ ••• + qn после одного или нескольких ходов. Докажем, что ui(qi + ... + qn', ^)>mi, (8.3) tti(gi + ... + gn; (8.4) Ясно, что эти неравенства дают лемму 3. Число wi(<Zi + ... + qn', а) является значением игры (6\ 4~... 4- Gn)% для Лр Для доказательства (8.3) и (8.4) определим в этой игре стратегии для Ах и А2: следовать условиям (а) и (0) из доказательства теоремы 1; если другой игрок не прекращает игру в некоторой позиции, продолжать до появления (ух) и тогда прекратить игру. Когда игра прекращается в позиции 4~... 4-pn, At получает т1 (z>i4~--- + Рп)- Если при этом А± совершил ходов, а А2 совершил /2 ходов = /2 или = /2 4- 1), то А± заплатил а игроку Л2 и получил от него /2 а. Сле- довательно, в результате А± получает mi (Pi + ••• + Рп) + h На основании индуктивного предположения приме- няем теорему 3 и получаем, что это равно mi (Pi) + ••• + т1 (Рп) + Z2or. Таким образом, для доказательства (8.3) и (8.4) нужно только проверить справедливость (7.7) и (7.10), когда Лх и Л2 соответственно используют указанную здесь стра- тегию.
СРЕДНЯЯ ПАРТИЯ ДЛЯ СУММ ПОЗИЦИОННЫХ ИГР 215 Пусть следует этой стратегии, и пусть рг есть по- зиция в Gr в момент прекращения игры. Тогда, если ход в позицию рг совершает Л2, то, так как следует (0), это есть последний ход, совершенный перед прекращением игры игроком Лг Следовательно, имеет место (ух) и о (рг) о для игры Gr. Доказательство формул (7.1) — (7.4) такое же, как в теореме 1, и (7.7) снова будет их следствием. Следова- тельно, мы построили для A j стратегию в (<?i 4-... 4- Gn)*, обеспечивающую ему mv Таким образом, (8.3) доказано. Аналогично, если А2 следует этой стратегии, прове- ряем (7.8) и (7.9), откуда получаем (7.10). Таким образом, мы построили такую стратегию для Л2 в (G\4- ... 4- ^п)*» что Лт получает т±, Это доказывает (8.4). Таким обра- зом, лемма 3, а следовательно, и теорема 3 доказаны. Теорему 3 можно рассматривать как усиление теоре- мы 1. Действительно, теорема 1 получается из теоремы 3 просто применением (5.12) и (5.13) для р = q± 4- ... 4~ Чп- Пусть теперь игры G1?..., Gn являются п экземпляра- ми одной и той же игры G, и пусть Рц..., рп соответствуют р в G, Вместо р14- ... + ?п будем писать пр. По теореме 1 (?) < (^?) < nfni (?) + <5 (?)• Разделим на п, и пусть п ->оо. Тогда из (5.10) получаем следующий результат. Теорема 4. Два выражения -^-v^np) и А- (— y3-i (пр)), представляющие собой среднее значение игры для Л$ в сумме п одинаковых игр, когда этот или другой игрок имеет первый ход, стремятся при п —> оо к одному и тому же пределу т-, (р). Эта теорема оправдывает название «среднее значение» для числа гщ (/?). Название «средние стратегии» для стра- тегий, описанных в теореме 2, выбрано потому, что они гарантируют среднее значение игроку, совершающему первый ход. По теореме 3 имеем nil (j\ + • • • + Рп) = т. (pj + ... + т. (Рп), (8.5)
216 О. ХАННЕР и из (5.10) и (5.12) получаем — ?3-i (р) < mi (р) < Vi (р). (8.6) Покажем, что два свойства (8.5) и (8.6) определяют 1щ(р) однозначно. Пусть для всех р определено т (р), удовлет- воряющее (8.5) и (8.6). Мы получаем — p3_i (пр) < пт (р) < (пр). Разделим на п, и пусть п —> оо.Тогда из теоремы 4 полу- чаем т (р) = mi (р), что и доказывает единственность тщ (р). § 9. Оба игрока используют средние стратегии. Теорема 5. Пусть в сумме + ••• + Gn °^а иг~ рока следуют средней стратегии, описываемой свойства- ми (а) — (d) теоремы 2. Тогда (1) игроки будут отсчитывать одни и те же периоды; (2) в каждом периоде оба игрока будут совершать все свои ходы только в одной из игр Gr; (3) число т, определенное в (Ь) теоремы 2, является убы- вающей функцией от периода; (4) если к тщ (q±) +... + Щ (qn), где qr есть началь- ная позиция в игре Gr, 1 г п, прибавить х для каж- дого хода, совершаемого игроком А,, и —г для каждого хода, совершаемого игроком А3^, где т определяется по (Ь) для периода, содержащего этот ход, то получим вы- игрыш игрока А}. Доказательство. Если мы покажем, что пер- вый период оканчивается одновременно для обоих игро- ков, то (1) доказывается по индукции. Когда оба игрока играют в своих первых периодах, из (с) следует, что они оба ходят в одной и той же игре, скажем Gs. Тогда при г =/= s имеем pr == qr для всех позиций рг + ... + рп, получаю- щихся в течение периода, и поэтому о (рг) о, гф s, так как о (qr) и по определению о (теорема 1). Таким образом, если для одного игрока имеет место (dx), то (d2) также имеет место, и так как (d2) симметрично по от- ношению к двум игрокам, то первый период будет одним ц тем же для обои?: игроков. Это доказывает (1).
СРЕДНЯЯ ПАРТИЯ ДЛЯ СУММ ПОЗИЦИОННЫХ ИГР 217 Поскольку известно, что игроки отсчитывают одни и те же периоды, то (2) является простым следствием (с). А (3) следует из того, что каждый период заканчивается при (d2). Для доказательства (4) достаточно показать, что еели в Gr qr есть позиция в начале периода ирг — позиция в кон- це того же периода, то независимо от того, начинает пе- риод или Азч, имеет место равенство (pj + • • • + mi (рп) = т. (9j) + • • • + т. (qn) + l.x—ls_.x, (9.1) где Ц — число ходов, совершенных Л4 в течение этого периода. Так как pr = qr при г s, где G8 — игра, в ко- торой совершаются все ходы в течение периода, (9.1) переходит в mi (Р,) = т. (qs) + Цх — 13_.Х. (9.2) Если первый ход в периоде совершает Aif то (9.2) следует из (6.4) и (6.5). Действительно, эти две формулы доказаны для случая, когда оба игрока совершают £-оп- тимальные ходы, пока не достигается позиция pt с о (Pi) t. Полагая t ~ т в нашем случае, на основании (d2) мы получаем, что для позиции р8, последней в пе- риоде, а (рв) < т. Если первый ход в периоде совершает то (9.2) доказывается при помощи замены i на 3 —- i. Формула, полученная таким путем, превращается в (9.2), если вос- пользоваться равенством mi (р) + т3_4 (р) — 0. Таким образом, теорема 5 доказана. Так как т убывает, из (4) теоремы 5 следует, что выигрыш игрока Ai является суммой величины = ~ mi(<h) + ••• + ^г(^п) и некоторой последовательно- сти убывающих по модулю знакопеременных величин. Если Ai ходит первым, то первый член последовательности положителен и равен о = max {о (#г)}, и поэтому сумма членов последовательности > 0 и и Л4 получит по крайней мере тп{ и не более + о. Этот последний ре- зультат содержится, конечно, в теореме 2. Теорема 2 со- держит даже большее, так как она утверждает, что сред7 няя стратегия всегда гарантирует некоторую величину,
218 О. ХАННЕР даже если она используется против игрока, следующего любой стратегии, в частности оптимальной стратегии. § 10. Некоторые примеры. Условия (а) — (d) теоремы 2 определяют, вообще говоря, не единственную стратегию. Имеются еще некоторые выборы, которые игрок может использовать для получения возможно более хорошего результата. Так, в одной и той же игре могут быть различ- ные т-оптимальные ходы, и, когда должен быть совершен первый ход в периоде, может оказаться несколько игр, содержащих т-оптимальные ходы. В связи с этим, возмож- но, стоит заметить, что т-оптимальный ход может оказать- ся даже в позиции р с о (р) т. Число т определяется как максимум величин о (pr), 1 г п, в начале пе- риода, однако не обязательно начинать период в одной из игр, для которых о (рг) достигает этого максимума, т-оптимальные ходы могут быть также и в других играх. Пример 5. Рассмотрим игру, изображенную на рис. 6. Ход в позицию р! ЕЕ М2 (р) является ^-оптималь- ным для А2 даже при 4 < t 5. Действительно, для этих значений t имеем и2 (р; t) = v2 (р; t) = тп2 (/?), так что ^-оптимальный ход для А2 должен существовать. Если некоторая позиция должна появиться при оп- тимальном разыгрывании, то неважно, является ли эта позиция начальной позицией игры или позицией, полу- чившейся в течение партии. Дело обстоит не так, когда используются средние стратегии. Пример 6. Сравним игру, изображенную на рис. 6, которую начинает А2, с игрой, изображенной на рис. 7, которую начинает Аг. Если А2 совершил ход в* позицию /?! на рис. 6, то положение для Аг будет таким же, как тогда, когда он начинает из на рис. 7. Однако, играя по средней стратегии, он будет поступать в этих двух случаях по-разному. На рис. 6 Аг играет в течение какого-то периода с т = 1. Поэтому он совершит 1-оп- тимальный ход в позицию р%. На рис. 7 он как раз начи- нает период с т = 6 и ходит в позицию р2. Это различие можно объяснить следующим образом. Ход, рекомендуемый средней стратегией, должен быть хорошим ходом, если он совершается в сумме п экземпля- ров данной игры. Легко видеть, что в сумме п экземпляров игры на рис. 6 ход в позицию р3 является правильным от-
СРЕДНЯЯ ПАРТИЯ ДЛЯ СУММ ПОЗИЦИОННЫХ ИГР 219 ветом на ход игрока А2 в позицию pv Если всегда ходит в позицию р2, то он получает только около 5--у + + 1*-^- = Зп, хотя (р) — 4. В сумме п экземпляров игры на рис. 7 ход в позицию р2 является правильным. Если А! всегда ходит в позицию р3, то он получает ОКОЛО (— 6)~ + 7~ + 3 =----ХОТЯ Л72! (/?1) = 0. В известном смысле свойство (4) теоремы 5 означает, что цена совершения хода равна числу т для периода, содержащего этот ход, где т есть max {о (/>г)} в начале этого периода. Можно попытаться изменить правила для средней стратегии, потребовав, чтобы каждый ход со- вершался в позиции р с наибольшим о (/>)•. Следующий пример показывает, однако, что такая стратегия не гаран- тирует среднего значения. Пример 7. Рассмотрим сумму игр, изображенных на рис. 8. Пусть А± начинает и играет в левой игре, а А2 отве- чает в правой игре. Тогда о (р) = 7 в левой игре и о (р) = = 6 в правой игре. Но если Аг будет играть в левой игре, в которой о (р) наибольшее, он получит только 14 + + (—6) = 8, что меньше чем среднее значение 4 + 5 = == 9. Действительно, второй ход игрока А± совершается в периоде с т = 2. Следовательно, если он следует (a)—(d), то он должен совершить 2-оптимальный ход в той игре, в которой другой игрок только что сделал ход, т. е. он должен играть в правой игре. Тогда он получит по край- ней мере 6 -|- 4 = 10, что больше среднего значения 9.
220 О. ХАННЕР В последнем примере мы покажем, что оптимальный ход в сумме игр не обязан быть ^-оптимальным для какого- нибудь t в той из слагаемых игр G, в которой он совер- шается. Следовательно, такой ход может никогда не ре- комендоваться средней стратегией. Рис. 9. Пример 8. Оптимальный ход для Аг в сумме игр, изображенных на рис. 9, есть ход в позицию в левой игре. Ход по средней стратегии есть ход в правой игре. Ход в позицию не является ^-оптимальным в левой игре ни при каком t. ЛИТЕРАТУРА [1] Милнор Дж., Суммы позиционных игр, см. настоящий сбор- ник, стр. 187—197. [2] П о й а Г., Сеге Г., Задачи и теоремы из анализа, том I, М., Гостехиздат, 1956.
СИГНАЛЬНЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ В ОДНОМ КЛАССЕ БЕСКОНЕЧНЫХ ПОЗИЦИОННЫХ ИГР Л. А. Петросян Ленинградский государственный университет В ряде работ по конечным позиционным играм факти- чески решается следующая структурная проблема: выде- лить среди всех стратегий игрока некоторый, по возможно- сти более узкий класс и доказать эквивалентность любой стратегии игрока некоторой стратегии из этого класса (см,, например, [1], [2], [3]). В[4], где впервые было введено понятие бесконечной позиционной игры, указывается на существенное разли- чие между конечными и бесконечными позиционными иг- рами. В частности, в [4] построен пример бесконечной по- зиционной игры с полной информацией, для которой не- верна теорема Цермело — Неймана. Там ^ке делались попытки выделить класс бесконечных позиционных игр с полной информацией, для которых эта структурная тео- рема остается справедливой. Целью настоящей работы яв- ляется исследование вопроса о том, в какой мере струк- турные результаты [1], [2] остаются верными для беско- нечных позиционных игр. § 1. Одно пространство последовательностей Будем рассматривать пространство 91 последователь- ностей {Х^} (i = 1, 2,...), каждый из членов которых способен принимать лишь конечное число значений. Вве- дем на 91 топологию посредством указания фундамен- тальных систем окрестностей для каждой точки прост- ранства.
222 Л. А. ПЕТРОСЯН Пусть имеется точка х = (ях, х^..., яЛ,...)е 21; тогда множество точек Y = №1, Уг,-->Уп>--)} <= 21 будем называть окрестностью точки х ранга г, если У1 = У* = я2,..., Ут = Окрестности ранга г будем обозначать через Ur (х). Лег- ко понять, что класс всех Ur (я), г — 1,..., п,..., обра- зует фундаментальную систему окрестностей точки х. Таким образом, наше пространство превращается в топо- логическое /^-пространство. Лемма 1. Элементами минимального кольца R, натянутого на класс всех фундаментальных окрестностей пространства 21, являются конечные объединения непере- секающихся фундаментальных окрестностей из 21. Доказательство. Докажем, что полученный путем конечных объединений фундаментальных окрест- ностей из 21 класс М представляет собой кольцо. Тогда, очевидно, М будет и минимальным кольцом, удовлетво- ряющим условиям леммы. Для доказательства заметим, что всякое множество А £= М может быть представлено в виде объединения конечного числа непересекающихся фундаментальных окрестностей одного ранга. Действитель- но, так как А есть конечное объединение непересекающих- ся фундаментальных окрестностей, среди этих окрест- ностей есть окрестности наибольшего ранга. Пусть это будут окрестности {U1 (я)}. Всякая окрестность, имею- щая ранг r< Z, представима в виде суммы (J U (у..), где Уг ЕЕ Ur (у). Будем считать, что все множества Л ЕЕ М уже представлены таким образом. Тогда для всех Л, В ЕЕ М тривиально проверяется, что Л J В М, А\В ее М. Докажем, например, что Л\В £ М. Для этого предста- вим множества Л и В в виде объединения фундаменталь- ных окрестностей одного ранга. Если Л 0, то утверждение очевидно.
СИГНАЛЬНЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 223 Пусть теперь А ("| В =/= 0 и Так как A Q В =/= 0, для некоторых х, у ЕЕ 21 должно быть Ul(x) П U1 (у)=1= 0. Отсюда следует, что U1 (#)* = = U1 (у), т. е. при вычитании просто выбрасываются не- которые окрестности ранга Z, и М. Лемма 2. Пусть на классе всех фундаментальных окрестностей задана вероятностная мера р. Тогда она допускает единственное продолжение до минимального <5-колъца, содержащего базу пространства 91 (класс фун- даментальных окрестностей). Доказательство. Всякое множество А ЕЕ R представимо в виде объединения конечного числа непере- секающихся окрестностей из базы пространства 91. Пусть п т А = U Л, А = 0 Bj 1 1 будут некоторые два представления одного и того же мно- жества А, Тогда для всех i = 1, 2,..., п т п А=и(лгт в3=и(^пл). 1 1 где А{ П Bj принадлежит базе пространства 91. Так как [1 — мера на базе 91, должно быть п пт * г=1 г=1 ;=1 т т п 7=1 г=1 Отсюда следует, что если А ЕЕ В, А1,...,Ап принад- лежат базе пространства 91 и Аг Q Aj = 0, i j, п _ ZL А = (J Ait то равенство р(Л) = 2 однозначно оп- 1 г=1 ределяет на R некоторую функцию множества р. Из самого определения функции р следует, что она конечно-адди- тивна и совпадает с р на классе всех фундаментальных окрестностей. Ясно также, что этими двумя свойствами функция р определяется однозначно. Покажем, что р
224 Л. А. ПЕТРОСЯН счетно-аддитивна на R, Пусть {Л{} — некоторая после- довательность непересекающихся множеств из R, объе- динение которыхЛ также принадлежит R. Каждое из Л{ в свою очередь представляет собой объединение конеч- ного числа непересекающихся множеств из базы про- странства 31: = и л^-, [1 (л.$) “ 3 и j з Положим сначала, что множество А принадлежит базе пространства 31. Поскольку множества не пересе- каются, а функция ц счетно-аддитивна на базе простран- ства 51, то и (Л) = и (Л) = 32р(л„) = 2Й(Л4). i j i Если же Л Е^, то Л представимо в виде суммы конеч- ного числа фундаментальных окрестностей из 31: А = 0 Вт, т й(Л) = 2й(вга) = 22И(жпвта) = m mi = 23й(ЖП5т) =ЕЙ(Ж). г т i Имея меру на кольце R, мы, пользуясь теоремой о про- должении меры [5], продолжим ее на минимальное a-кольцо, содержащее R. § 2. Описание позиционной структуры С Пусть задана бесконечная позиционная структура С с конечным числом альтернатив в каждом информацион- ном множестве. Перенумеруем информационные множества {U{} z-ro игрока следующим образом: 1. Через и\ обозначим информационное множество, содержащее самую левую из позиций (дерево ориенти- ровано) {х : (/l (х) = J и{) -> Z == min}, где f (х) — порядок вершины х в структуре С.
СИГНАЛЬНЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 225 2. Через обозначим информационное множество, содержащее самую левую из позиций (дерево ориенти- ровано) {Х-. (f(x) = x0, хе(С\и ^Г)П = min}? Тогда левая стратегия /-го игрока может быть изобра- жена в виде последовательности *^г (» ^2 > • • •» »•••)> где на к-м месте стоит альтернатива, выбираемая в к-м информационном множестве. Пространство стратегий {л$} является частным случаем пространства 21, рас- смотренного в § 1. Задавая на пространстве стратегий игро- ка вероятностную меру pq так, как это делалось в § 1, мы превращаем его в пространство с мерой ({л^}, где Si — минимальное a-кольцо, порожденное базисом пространства {л^}. Рассмотрим теперь пространство партий S в струк- туре С. Его элементами являются последовательности 5 = (Хо, ^,..., Хп,..,), в которых каждая из координат может принимать конеч- ное число значений. Легко видеть, что, вводя соответствую- щим образом топологию в S, мы можем превратить его в топологическое пространство, являющееся частным слу- чаем пространства 21 из § 1. Фундаментальная система окрестностей в S будет обо- значаться через U (хк) = {/; х0 = x'Q, хг = хк = 4}- Каждая ситуация (л^..., лп) определяет единственным образом течение партии. ‘Легко заметить, что для того, чтобы seU (хк), необходимо и достаточно, чтобы пози- ция хк была возможной при стратегии л$ при всех i — 1,... п. Множество стратегий /-го игрока, при которых по- зиция хк возможна, представляет собой некоторое к- цилиндрическое множество в пространстве {л{}. Вся- кое такое множество (обозначим его через л?) принадле- жит Si, и, следовательно, на нем определена мера |иц (л?). 15 Позиционные игры
226 Л. А. ПЕТРОСЯН Пусть игроки используют смешанные стратегии р!,.. тогда каждая фундаментальная окрестность U (х) получает естественным образом вероятность |x[tz («)] = П Hi (л?). г==1 Распространив меру р на 5, превратим пространство S в пространство с мерой (5, 5, р). Пусть игроки используют стратегии поведения рх,... рп, ассоциированные со смешанными стратегиями pj,... ..., pn [ 1 ]. Ситуация (Pi,..., |3П) в стратегиях поведения опре- деляет вероятностную меру р на фундаментальной систе- ме окрестностей. Продолжая меру Р] до минимального о-кольца, порожденного базой пространства S, получим новое пространство с мерой (S, S, р). § 3. Теорема Куна о стратегиях поведения Обобщим теорему Куна на древовидно упорядочен- ные ориентированные структуры С. Теорема. Для того чтобы (5, 5, И) == (5, 5, р), необходимо и достаточно, чтобы в С игроки имели полную память. Доказательство. Необходимость немедлен- но следует из [1]. Достаточность. Пусть х — некоторая по- зиция в структуре С, и пусть fk (х) = х0. Произведем уре- зание Ск дерева С до уровня к. При этом за новые ин- формационные множества примем множества Ск Q Структура Ск есть структура некоторой позиционной игры. При описанном урезании структуры С всякая стратегия тц (xi, . . . ? х^, • • •)
СИГНАЛЬНЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 227 перейдет в некоторый конечномерный векгор jtj = (^i, • • x'r^, Определим в новой игре Ск (здесь и в дальнейшем, во из- бежание путаницы, мы будем обозначать структуру и со- ответствующую ей игру одним и тем же символом) сме- шанные стратегии следующим образом: где $ — фундаментальная окрестность ранга г любой точки с — х{, Х2 = х\ ,..., Ху — хгг. Через |3j, р2 »••• ..., рп мы будем обозначать усеченные стратегии поведения, соответствующие усеченным смешанным стратегиям qni, qn2, • Ситуация в смешанных стратегиях порождает на пространстве партий усеченной игры Sk вероятност- ную меру ц/с. Из того, что структура С имеет полную па- мять, следует, что и структура Ск будет иметь полную память, и по теореме Куна для конечных позиционных структур мы будем иметь ₽* (х) = |/ (ж). Однако у» (гг) = П ( 2 q ) = П |л (л*) = р(С7(х)), г=1 г=1 т. е. равенство Р (£7 (х)) — р (U (х)) верно для любой позиции х из С. В § 1 мы показали, что вероятностная мера в пространстве 91 определяется единственным образом своими значениями на базе этого пространства. Следовательно, любые две меры |л1 и ц2, равные между собой на множествах, принадлежащих базе пространства 21, равны между собой и на всех множествах, принадлежащих минимальному о-кольцу, порожденному базой этого пространства. Таким образом, (5,5, ) = (5, 5,₽). Теорема доказана. 15*
228 Л. А. ПЕТРОСЯН § 4. Сигнальные и составные стратегии Пусть Нг — класс сигнальных информационных мно- жеств i-ro игрока в игре со структурой С. Предположим, что информационные множества из Н при упорядочива- нии по способу, указанному в § 2, имеют номера Zc 1 кп . ! Тогда всякая Я-частичная стратегия i-ro игрока примет ! вид i / г i i \ ] б — X]t2, • • •, • • •)• ' Пользуясь методом, предложенным в §§ 1 и 2, обращаем j пространство Я-частичных стратегий в пространство с ; мерой J (Si, Si, 7i (Pi)). Лемма. В структуре С (о{) для всех ог i-й игрок имеет полную память. Доказательство ничем не отличается от доказатель- | ства аналогичной леммы для конечных позиционных струк- ) тур в работе [2]. Пусть (p,i), fei (Oi) ] — составная стратегия i-го игрока в структуре С, Ситуация в составных стратегиях, порожденная ситуацией в смешанных стратегиях, опре- деляет вероятностную меру на пространстве партий 5, обращая его в пространство с мерой (5, 5, р). Пусть р — мера на пространстве партий, порожден- ная ситуацией в смешанных стратегиях (рх,..., рп). Теорема. Для всех позиционных структур С j имеет место j (5, 5, р) == (5, 5, р). Доказательство теоремы аналогично доказательству теоремы из § 3, и мы его опускаем. ;
СИГНАЛЬНЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 229 ЛИТЕРАТУРА [1] Кун Г. У., Позиционные игры и проблема информации, см. настоящий сборник, стр. 13—40. [2] Thompson G., Signaling strategies in n-person gamea, Ann. of Math. Studies, № 28 (1953). [3] Воробьев H. H., Расчлененные стратегии в позиционных играх, Проблемы кибернетики, вып. 7, 1962. [4] G а 1 е, Stewart, Infinite games with perfect information, Ann. of Math. Studies, № 28 (1953). [5] Халмош П., Теория меры, ИЛ, 1953.
ЕЩЕ ОДНО ОБОБЩЕНИЕ ТЕОРЕМЫ КУНА Л. А. Петросян Ленинградский государственный университет Доказана теорема Куна для игр, структура. которых задав! ся с помощью некоторой вектор-функции g (х, у, z) *). При этом функция g (х, у, z) должна быть прямоугольной. В более общем случае можно приближенно находить зна- чения игр, используя игры с прямоугольными порож- дающими функциями. § 1. Определение В дальнейшем рассматриваются антагонистические игры двух лиц, продолжительность которых То ограничена и не зависит от выбора стратегий. Положим ДП-2“ПГО, п-1,2,..., (1.1) T = jbn, 7 = 1, 2,..., 2п (1.2) (Т — время, оставшееся до окончания партии). Пусть в пространстве Rn задано конечное множество Y (и соответственно Z); точки у ее Y (z ЕЕ Z) будем назы- вать управляющими переменными игрока I (II). Позиция игры задается точкой х m-мерного евклидова простран- ства Rm. Далее, нам даны также функции / (х, у, z) и g (х, у, г), где / — вещественная функция, a g — вектор- функция той же размерности, что и х. Мы будем пред- полагать функции f и g непрерывными, удовлетворяю- щими равномерно по у, z условию Липшица по х, что оз- х) Определение прямоугольной функции см. на стр. 235.
ЕЩЕ ОДНО ОБОБЩЕНИЕ ТЕОРЕМЫ КУНА 231 начает существование такой константы К. что для всех х, х',у, z выполняются неравенства: |/ (х, у, z) — / (х’, г/, z)|< х — ж'|, (1.3) I g (х, у, z) — g (х', у, Z) К КI X — х' <1.4) Введем теперь разностное уравнение, которое будем назы- вать структурным уравнением игры: ^•+1 = ^4- (1-5) ж0 = с, y,(=Yx.czY, Zj<=ZXj<z.Z, x^Rm. Уравнение (1.5) описывает изменения позиции во време- ни. Эти изменения происходят в моменты времени /Дя (/ - 1, 2,..., 2П). Всякую последовательность {я0, а^,..., ^п}, получен- ную из (1.5), мы будем называть партией игры. Отрез- ки последовательности вида {я0, х^..., хк}, где к 2П, будем называть отрезками партий. Информационная структура игры определяется заданием разбиений на от- резках партий. Пусть = {(х0, %i, • • •, я.;)}, 7 < 2П, — множество всех отрезков партий длины/, которые могут быть получены при всевозможных подстановках управ- ляющих переменных из множеств Yx. cz У и Zx. cz Z (j — 1, 2,..., 2n) соответственно. Пусть, далее, ж = и э Под информационными множествами игрока I (II) мы будем понимать любые элементы разбиения U (5В) на пространстве X, которые обладают следующим свойством: для любого £7 ЕЕ U (У ЕЕ ЗВ) существует такой индекс I, о< t<2\ что и е$<(7е$|). Объясним причину введения такого, несколько не- обычного, информационного разбиения. Обычно инфор- мационное разбиение говорит об информации игроков в игре п определяется правилами игры. Наше информа- ционное разбиение устроено таким образом, что игроки помнят всю цепь пройденных позиций, если они знают окончательную позицию, т. е. они помнят путь, приводя-
232 Л. А. ПЕТРОСЯН щий в каждую из позиций, в которых в данный момент находится игра. Другое важное обстоятельство заклю- чается в том, что игроки помнят время, в течение кото- рого происходила игра. Последнее свойство информации исключает наличие изовалентной информации, а первое устраняет неопределенность, возникающую при определе- нии игры из-за наличия цепей, т. е. отрезков партий с од- ной и той же окончательной позицией. Полный выигрыш игрока I будет иметь вид 2п 3 Уг> *ч)> (1.6) г=1 а до момента / з 3 &nf (З'г» ^г)* i=l Перейдем теперь к определению стратегий игроков. Стра- тегией игрока I называется однозначное отображение U на Y. Аналогично определяются и стратегии игрока II. Теорема 1. Каждой паре стратегий л, v соответ- ствует один и только один элемент пространства пар- тий ЖТ(2пу Каждый элемент пространства партий мо- жет быть получен использованием некоторой пары стра- тегий. Доказательство. По определению множества Жт0 — это множество всех тех партий, которые полу- чаются из (1.5) при всевозможных выборах значений у{ из множества Ух. и, соответственно, zi из Zx.. Пусть даны две стратегии л, v; тогда каждая такая пара опреде- ляет последовательность ^0, х^п по закону ^г+1= &ng(Zi, С/{), V (^: CZ 7^),’ здесь gz U (7) означает, что U (7) содержит отрезки партий с концами хг. Так как в каждый момент времени Л (£/$• J i CZ tZ$) GE Yx. j v (IV cz Vi) e zXi,
ЕЩЕ ОДНО ОБОБЩЕНИЕ ТЕОРЕМЫ КУНА 233 то всякая последовательность я0,..., х^п является после- довательностью игры, ибо может быть получена реше- нием системы (1.5) при соответствующем выборе у^ и и первая часть теоремы доказана. Обратно, пусть дана некоторая последовательность xQl а^,..., #2п, являющаяся последовательностью игры. Определим стратегии л, v таким образом, чтобы в ин- формационных множествах, содержащих отрезки этой последовательности, выбирались альтернативы, при ко- торых оказывалось бы возможным получение следую- щей позиции. Такие л, v действительно существуют, что следует из их определения. Доказательство теоремы закон- чено. Игра происходит следующим образом. Начальная по- зиция игры задана. Игроки выбирают, соответственно, свои стратегии л и v. В каждый момент- времени они со- вершают одновременно выборы, продиктованные их стра- тегиями в информационных множествах U е U и V ЕЕ 2В. Новая позиция определяется соотношением ^г+1 = Л (UХ{ CZ UV (Vl Xi CZ F)). Как обычно в теории игр, проблема заключается в отыс- кании таких стратегий, которые реализуют значение игры. Очевидно, что для большинства игр такая задача не разрешима в классе чистых стратегий. Смешанными стратегиями мы назовем вероятностные меры jjij и Цп на чистых стратегиях игрока I и, соответ- ственно, игрока II. Под следом Рп стратегии л мы будем понимать неко- торое подмножество пространства X, элементы которого возможны при использовании игроком I стратегии л [3]. Аналогично определяется след Pv для некоторой стратегии v игрока II. Следом смешанной стратегии мы назовем мно- жество U Рп {ц (л) =/= 0}. ТС Аналогично определяется РИ11. Мы будем говорить, что информационное множество ^7 Е И существенно при использовании игроком I стра-
234 Л. А. ПЕТРОСЯН тегии л, и писать U Rel л, если оно пересекается с т. е. если р. п и =/= 0. Соответственно V GE SB существенно для v, если/\ Q V =^=0. Точно так же U Rel если fl U =£= 0, 7Rel|in, если PHl[]V=f=0. § 2. Игры с полной памятью Определение. Игра называется игрой с полной памятью для игрока I (и соответственно II), если из того, что U Rel л (К Rel v), следует, что U е= Рп (7 ЕЕ Р^- Под стратегией поведения игрока мы будем понимать любую систему распределений вероятностей, заданных для всех его информационных множеств на управляющих переменных, находящихся под его контролем в этих множествах. Каждая стратегия поведения определяет некоторое ве- роятностное распределение на чистых стратегиях игрока (смешанная стратегия) [1], [3]. Пусть дана смешанная стратегия Под поведением, соответствующим данной смешанной стратегии Ццц), мы будем понимать следующее распределение вероятностей на управляющих переменных каждого информационного множества: .tTr ч МЯ1 л = t/Rel л) п , h V) = -------Hi (я I у Rel л)-’ есЛИ U G Rel Я’ (2.1а) b(U, у) = |лх (л | л (U) = у), если U Rel л для игрока I и ,/т. \ Hn(v|v(V) = z,VeRelv) ( ’ pjj (v | V Rel v) ’ (2.16) b (V, z) = p.11 (v | v (F) = z), если V Rel v для игрока II.
ЕЩЕ ОДНО ОБОБЩЕНИЕ ТЕОРЕМЫ КУНА 235 Набор поведений b (U, у), Ь (7, z) для всех U и V является стратегией поведения и называется стратегией поведения, соответствующей данной смешанной страте- гии |х1(П). Пусть л& есть класс смешанных стратегий, которому соответствует одна и та же стратегия поведения Ь. Пусть &' — некоторая стратегия поведения, тогда она опреде- ляет распределение на пространстве {л} (смешанная стра- тегия) pz такое, что pi (= Лу, т. е. pi есть стратегия из (2.1) для Определение. Функция g (х, у, z) называется прямоугольной, если при каждом фиксированном х множе- ство {(у, z): g (х, у, Z) = с} П Yx х Zx является прямоугольником в пространстве Y X Z при любых векторах с. Лемма 1. Пусть дана некоторая партия я0... ...#2n — W.llw — класс стратегий игрока I, при которых этот игрок в информационных множествах, содержа- щих отрезки партии W, выбирает такие альтернати- вы, что W оказывается возможным. Nw — аналогичный класс стратегий игрока II. Равенство Р (IT) = pi (П^) рп (Nw) (2.2) имеет место для всех рт и рп в том и только в том случае» если функция g (х, у, z) прямоугольна. Доказательство. Всякая партия W одно- значно определяется начальной позицией х0 и век- торами: g (ж0, У, z) = с0, g у, Z) = с1г g (®2п, У, z) = с2п, (2.3) причем р (Р7) — У pt (л: W Poss л) рп (у- W Poss v | л). (2.4) Если функция g (х, у, z) является прямоугольной, то
236 Л. А. ПЕТРОСЯН второй множитель в (2.4), как это следует из (2.3), не за- висит от л, и для всех л имеет место равенство Ни ({^}• W Poss v | л) = ни (Nw). (2.5) Из (2.5) получаем (2.2). Ясно, что если функция g (х, у, z) не прямоугольна, то при некотором х настоящее утверждение, вообще го- воря, неверно. Лемма доказана. Заметим, что новое определение полной памяти при- водит к тому, что упорядоченная форма игры с полной памятью в нашем смысле не будет игрой с полной па- мятью по Куну, поэтому теорема Куна [3] требует дока- зательства. Обозначим через ц меру на пространстве X, инду- цированную смешанными стратегиями, и через £ —- меру на Ж, индуцированную стратегиями поведения рг и Рп- Другими словами, пространству Ж соответствуют два пространства с мерой (Ж,И) и(Ж,₽). Т е о р е ма 1. Если функция g (х, у, z) прямоугольна, то для того, чтобы (Ж, ц) = (Ж, Р), где р —мера, соот- ветствующая ц, необходимо и достаточно, чтобы игроки имели полную память. Прежде чем перейти к доказательству теоремы, сфор- мулируем две леммы. Лемма 2. Пусть у — последний выбор игрока в партии W, и он совершается в такой позиции хг, что и. Положим Т1 (W) = {л | и Rel л, л (U) = у ->3 z, хм = хг + + An g (xif у, z) е W}, аналогично определяем (Ж). Тогда для всех л (v) и всех W имеет место ) = I Л в противоположном случае. Доказательство см. в [1], [3].
ЕЩЁ ОДНО ОБОБЩЕНИЕ ТЕОРЕМЫ КУНА 237 Лемма 3. Пусть хг — ж0, . . ., xtEEU, Xм- = х‘о, . . . U, 7eU, £ = {л | U Rel л, л(U) = у—> gz, xi + (хй У, z) = Xi+i}, 7* = {л | 7Rel л}. Тогда S = Т. Доказательство см. в [1 ], [3]. Доказательство теоремы. Доста- точность. Пусть игра имеет полную память. Нам нужно доказать, что Р (Ж) - и (Ж) для всех W (= $т0. (2.6) Если партия W содержит позицию, в которую можно по- пасть только из несущественного информационного мно- жества одного из игроков, то обе части выражения (2.6) равны нулю. Вычислим вероятность перехода Ai из пози- ции ЕЕ W в позицию xi+1 ЕЕ W при использовании обоими игроками стратегий поведения и рп. Очевидно, что л=2 bj (U, у) Mi (Г, {Z}/у), y^xi+l Poss У где {z} I у — множество тех z, для которых при данном у имеем xi+1 = х{ -j- Дп g (xif у, z). Поэтому мы можем написать 2П Р(1У) = П г—1 Из прямоугольности g (х, у. z) следует, что Ьгп (^ т)-Ьгп(7, {Z}) и A = 6ji(7, {z})b^U,{y}), где {z} = {z: ZEE Xi+i Poss z}, {y} = {y- y^xMPossy},
238 Л. А. ПЁТРОСЯН И ЪУи,{у}) = S Ь\и,у), Poss у bn(V,{z}) — 3 ^(V.z). Poss Z Отсюда имеем 2n Р(ИЭ=П b^U, {y})bh(V, {z}). 1=1 По лемме 3 числитель каждого из сомножителей bii (U9 {z/})&i (F, {z}) равен знаменателю последующего, и останется только Р(Ж)=И1 (7\ (Ж)) (ГП(Ж)). Однако по леммам 1 и 2 это равно ц (Ж). Достаточность доказана. Необходимость см. в [1], [3]. Можно легко привести пример игры с полной памятью, структура которой задается непрямоугольной функцией g (х, у, z)9 для которой теорема не имеет места. Пример. Игра происходит в два шага. На каждом шаге игроки одновременно совершают выборы из множе- ства (1.2). Размерность основного пространства равна 1, т. е. движение происходит по прямой, х0 — начальная позиция, Х1 = хо + kg (жо> У< Z)’ (У> z) s [1, 2] X [1, 2], х2 = хг + kg (х, у, z), (у, z) s [1, 2] X [1, 2]. Функция g (я*, у, z) не зависит от xi и задается следующей матрицей: 1 2 1 О О 2 0 1 т. е. ^(1,1) = 0, g(l, 2) = 0, g (2, 1) = 0, g (2, 2) = 1
ЕЩЁ ОДНО ОБОБЩЕНИЕ ТЁОРЁМЫ КУНА 239 (эта функция, очевидно, не прямоугольная, так как (2, 2) {(у, z): g (у, z) ~ 0}). Каждый из игроков имеет по 8 чистых стратегий: = (1, 1, 1), л2 = (1, 1, 2), л3 “ (1» 2, 1), л4 - (1, 2, 2), л5 = (2, 2, 2), лб - (2, 2, 1), л7 - (2, 1, 2), л8 = (2, 1, 1), vx =(1, 1, 1), v2 = (1, 1, 2) v3 = (1, 2, 1) - (1, 2, 2) v5 - (2, 2, 2) - (2, 2, 1) v7 - (2, 1, 2) v8 = (2, 1, 1) где на первом месте стоит выбор в х0,^на втором месте — выбор в позиции = х0 и на третьем — в позиции х1=£= х0. Графически игру можно пред- ставить, как на рисунке. Мы предполагаем, что игроки имеют самое мелкое информацион- ное разбиение, т. е. каждое инфор- мационное множество состоит из одного-единственного отрезка партии. Пусть первый игрок применяет,смешанную стратегию = 7 °. °-0)- а второй -11111111 I*11 ~ ’ 8’ 8’ 8 ’ "8 ’ 8’ 8’ 8 Г Подсчитаем вероятность партии (х0, х±, х2) — (я0, xQ, в смешанных стратегиях pq и рц. Она равна 8’ 2^8’ 2^ 2 ' 4 4 ’
240 Л. А. ПЕТРОСЯН Вычислим соответствующие стратегиям ptj и цп поведения: = М*о, 2) = 1; М'-о, 1) = |; tn (Го, 2) = -1; &I (Го, Го, 1) = ; &г (г0, г0, 2) =; 1 1 Ъи (^0, #о, 1) = у ; Ьп (^о, ^0, 2) = у ; 3 (W7) = 3 (^о^з) 3 (£оад/.7оХо) = = [L 1 _1_ L ЛИА М _ А з __ 9 ~ \ 2 + 2 ’ 2 ш ’ 2 / Т 8 ~ 32 ’ т. е. ц (И7) =/= р (Ж), и теорема 1 неверна. Замечание 1. Для одновременной игры п игро- ков можно, соответственно видоизменив определения §§ 1, 2, доказать теорему Куна в предположении, что функ- ция g, которая теперь уже будет функцией п + 1 век- торной переменной — одной позиционной и п управляю- щих,— является ^-мерной прямоугольной функцией. Замечание 2. Можно рассмотреть модель, в ко- торой игра не имеет ограниченной продолжительности и заканчивается достижением некоторой границы Ъ (х) в пространстве Rm. В этом случае, дословно используя метод, предложенный в [4], мы сможем обобщить теоре- му 1. Заметим, что тогда на функцию / (х, у, z) должно со быть наложено требование 2 Уъ zi)<C 00 Для все~ 1 возможных z0, а^,..., хп,..., уь или же выигрыш следует задать на партиях. Замечание 3. Можно доказать теорему 1 в предположении, что при каждом фиксированном х функ- ция g (ж, I/, z) является прямоугольной кусочно-постоян- ной функцией, принимающей конечное число значений, и стратегии в каждый момент задают отображение в лю- бую точку бесконечных множеств Y и Z соответственно. Доказательство теоремы 1 при этом повторяется до- словно, с той разницей, что смешанные стратегии из конечных распределений превратятся в обычные вероят- ностные меры, а стратегии поведения будут уже мерами соответственно на пространствах У, Z.
ЕЩЕ ОДНО ОБОБЩЕНИЕ ТЕОРЕМЫ КУНА 241 § 3. Приближение общих игр играми, структура которых порождается прямоугольными функциями В настоящем параграфе мы рассмотрим вопрос о том, насколько суживается класс игр, если мы будем рас- сматривать только игры, структуры которых порождают- ся прямоугольными функциями. Нам понадобится следую- щая лемма (доказательство см. в [2]). Лемма. Пусть даны матрицы [ad и [&d одина- ковых размеров. Пусть Vai [a^-J — значение игры с мат- рицей [ad, a Vai [&d — значение игры с матрицей [Ьц]. Тогда, если для всех i, j — bid <е, (3-1) то | Vai [ad]— val [&d |<s. Перейдем теперь к доказательству некоторых вспо- могательных теорем. Пусть нам дана некоторая функция g (х, у, z), кото- рая при каждом фиксированном х непрерывна на замкну- том единичном квадрате. В дальнейшем будем считать, что Y X Z = [0, 1] X [0, 11. Рассмотрим игры из §§ 1, 2, задаваемые такой функ- цией, и будем обозначать эти игры через (Jg1 U, Го). Теорема 1. Для каждой непрерывной и заданной при каждом фиксированном х на замкнутом единичном квадрате функции g (х, у, z) существует последователь- ность прямоугольных функций {gn (х, у, z)}, сходящаяся к ней равномерно на [0, 1] X [0, 1] при каждом фикси- рованном х. Доказательство. Так как при каждом фик- сированном х функция g (х, у, z) непрерывна на замкну- том квадрате, она равномерно непрерывна на нем. Поэтому для каждого 8 > О существует такое 6 > О, что, как только \у — /|< S, I z— z'l < 6, имеем | g у, Z) — g (х, у', z')| < 8. 16 Позиционные игры
242 Л. А. ПЕТРОСЯН Возьмем последовательность еп 0, стремящуюся к ну- лю. Пусть 8п — соответствующая последовательность 6. Разобьем наш квадрат на некоторое количество равных квадратов с диагоналями, меньшими или равными бп. Пусть число таких квадратов равно т2. Обозначим через максимальные значения функции g (х, у, z) на замы- кании каждого из получившихся квадратов. Пусть аг, а2,..., атг — различные иррациональные чи- сла, обладающие тем свойством, что разность никаких двух из них не может быть рациональным числом. Для каждого ак существует такое рациональное число Рк’ что &к Рк (Мц &ni -р 6n). Ввиду требования, наложенного на числа ..., ат2, числа рк + ак при различных к не равны между собой. Перенумеруем т2 квадратов числами 1, 2,... ..., т2 и определим кусочно-постоянную на [0, 1] X [0, 1] функцию gn (х, у, z) — ак + рк, если г/, z принадлежат &-му квадрату (при этом можно согласовать значение функции gn (х, у, z) на границах квадратов таким обра- зом, чтобы функция gn (х, у, z) была однозначной). Оче- видно, для этой функции будем иметь I gn (*, У, Z) — g (х, у, Z) | < 6П равномерно по всем у, z при каждом фиксированном х. Так как 8П стремится к нулю, то lim gn(x, у, z) = g(x, у, z) П->00 равномерно по у, z при каждом фиксированном х. Кроме того, из построения функции gn (х, у, z) следует, что она прямоугольна. Теорема 1 доказана. Теорема 2. Пусть {хт}, т = 0, 1, 2,..., 2П,— партия в игре (Jg1 U, ЗВ, 70); тогда для каждого 8 О найдется такая прямоугольная функция ~g, что» для каж- дой партии найдется такая партия {^т}, что Лп|<8 для т = 0, 1,. .2П.
ЕЩЁ ОДНО ОБОБЩЕНИЕ ТЕОРЕМЫ КУНА 243 Доказательство. Пользуясь теоремой 1, по- строим функцию g (х, у, z) так, чтобы I g (х, у, z) — g (х, у, Z) К еъ ех > 0. Под позициями хк в дальнейшем будем понимать позиции из игры, порожденной именно этой функцией и с той же •амой начальной позицией. Докажем сначала по индукции следующее неравенство: | хт | ’ (3*2) где К — константа Липшица для g (я, у, z), | я0 Яо | ~ Пусть имеет место (3.2); докажем тогда, что 1т г 1«Г₽ (K + Dm^-i Действительно, ^m+l -'m+1 | | xm | + + 1 ^ng (xm> y> z) — &ng (xm, У, z) I < И I ^ng (хт) У> z) ^ng (xm> У> z) | ~f“ 4“ | ^ng (xm> У» Z) ^ng У i z) | * (7Г + 1Г+1_1 _ •% Ei -----[- A Si------------h 8i — _ (K+ — 1 +X(A- + l)m+1— К + K __ fil ---------------------------- = _ (/C+l)m+2—1 -61 K Индуктивное предположение доказано, а это означает, что если положить 61 ” ™аХ (^ + 1)т+1-1’ “ (ТС+1)2п+1-1 ’ К -----К------ то получим утверждение теоремы. Теорема 2 доказана. 16*
244 Л. А. ПЕТРОСЯН Пусть даны игры (7g, U, SB, То) и (/-, U, SB, То). Введем расстояние между партиями этих двух игр {А}) = max \хг~ xj. 0<г<2п Из теоремы 2 следует, что для данного е > 0 можно найти такую прямоугольную функцию g, что для каждой пар- тии {хг} найдется такая партия {^}, что P({^i}> {^i}) 6. (3.3) Пусть $0?£ есть однозначное отображение, ставящее в соот- ветствие каждой партии {xj партию {xj по правилу (3.3) при достаточно малом 8 0. Это отображение при достаточно малом е 0 будет взаимно-однозначным вви- ду конечности числа партий в играх (Jg, U, SB, То) и (/-, U, SB, То). Если, кроме того, ®e(Ug) = U-g, ug^ug, u-^n-g, ^(Ve-) = vg, vgGE$tg, то это отображение порождает взаимно-однозначное отоб- ражение стратегий, и мы назовем его отображением игры. Теорема 3. Пусть ®£ — отображение игры, тогда _ | / (ПЛ) — / (ПК) | < ЛТе. Доказательство следует из того, что функ- ция / (х, у, z) удовлетворяет условию Липшица и теоре- мы 2. Пусть SK£ есть отображение игры. Приведем игры (Jg, U, SB, То) и (J-, U, SB, То) к матричной форме (это возможно, так как игры конеч- ны). Ввиду взаимной однозначности отображения ®£ число строк и столбцов в соответствующих матрицах бу- дут равны (они будут иметь одинаковую размерность). По теореме 3 значения элементов будут отличаться не более чем на Me, но тогда по лемме | Vai (Jg, U, SB, То) — Vai (J-, U, To) | < Me.
ЕЩЕ ОДНО ОБОБЩЕНИЕ ТЕОРЕМЫ КУНА 245 Предположим теперь, что игра (Jj, U, $S5, То) имеет полную память; тогда ввиду прямоугольности функции g (х, у. z) для нее верна теорема 1 § 2, и мы можем найти ее значение, используя только класс стратегий поведения. Другими словами, для тех игр, для которых отображение 2Ве приводит к играм полной памяти, мы имеем возмож- ность приближенно находить значения в стратегиях по- ведения соответствующих прямоугольных игр. ЛИТЕРАТУРА [1] Воробьев Н. Н., Конечные бескоалиционные игры, УМЫ 14: 3—4 (1959), 21—56. [2] В о р о б ь е в Н. Н., Романовский И. В., Игры с за- прещенными ситуациями, Вестник ЛГУ, № 7 (1959). [3] Кун Г. У., Позиционные игры и проблема информации, см. настоящий сборник, стр. 13—40. [4] Л. А. Петросян, Сигнальные стратегии и стратегии пове- дения в одном классе бесконечных позиционных игр, см. на- стоящий сборник, стр. 221—229.
ЭКВИВАЛЕНТНОСТЬ СМЕШАННЫХ СТРАТЕГИЙ И СТРАТЕГИЙ ПОВЕДЕНИЯ В СЧЕТНОЙ ПОЗИЦИОННОЙ СТРУКТУРЕ') И. Н. Врублевская Ленинградское отделение Центрального экономико-математического института Теорема Куна [1] об эквивалентности смешанных стра- тегий стратегиям поведения для игр с полной памятью доказана для конечных позиционных игр. В настоящей статье этот же факт доказывается для бесконечно про- должимой позиционной игры с дискретным временем и счетным множеством альтернатив в каждой позиции. 1. Рассмотрим упорядоченную [2] не более чем счет- ную позиционную структуру* 2): в каждой позиции имеется не более чем счетное число альтернатив, и каждая партия имеет не более чем счетную длину; число игроков и, полной информации не требуется, имеет место изова- лентность [2]. Можно считать, что все случайные пози- ции принадлежат одному 0-му игроку. Из счетности множества всех позиций следует, что и информационных множеств не более чем счетное число. Сечением назовем такое множество позиций, что каждая партия пересекается с ним один и только один раз. Из *•) Об этой работе было сделано сообщение на VII Всесоюзном совещании по теории вероятностей и математической статистике, 1963 г. 2) Позиционная структура — позиционная игра без функции выигрыша; все элементы структуры здесь те же, что и для конечного случая, кроме указанного далее свойства счетности.
ЭКВИВАЛЕНТНОСТЬ СМЕШАННЫХ СТРАТЕГИЙ 247 изовалентности следует, что любое информационное мно- жество есть подмножество какого-то сечения — подсе- чение, 2. Стратегия поведения [У игрока i (i = 1, 2,..ч п) есть семейство {fP (Z7) | U ЕЕ 1Г} дискретных вероятно- стных мер рг (U) на множестве альтернатив Нц информа- ционного множества U. Обозначим через р° (х) для Е 11° дискретное веро- ятностное распределение на Ях; пусть, далее, X — множество всех позиций, х0 — начальная позиция, [х, у] для х у — отрезок партии между х и у, включая их; Хг (i = 0, 1,..., п) — множество всех позиций Его игрока; IT (х) (i ~ 0, 1, ..., п) — совокупность всех £7 ЕЕ 1Г таких, что U х, это — конечное семейство; hy — альтернатива, ведущая в х из U, точнее, из некото- рого z Е U и z<^x-, xh — позиция, следующая за х при выборе альтернативы А; л1 (i = 0, 1,..., п) — чистая стратегия Его игрока; Пг ~ {лг} = П Нц, Обозначим П* = {л11 л{ (U) = hu,U Ez W (ж)}. Очевидно, П* = Пд для х GE X1, у xh, (К, 1/1\ {г/})П х* = 0. Обозначим через р,0 вероятностную меру»на 0-алгеб- ре в П HUt однозначно определенную вероятностными Ней0 распределениями р° (U) [3]; ц° определена, в частности, на Пх. Смешанной стратегией рг Его игрока (i = 1, 2,..., п) назовем любую вероятностную меру на произвольном кольце подмножеств множества Пг , содержащем все множества Пх, х Е X, ото кольцо является алгеброй [3]. Так как меру с кольца можно продолжить до порож- денного им п-кольца единственным образом [3], можно считать, что р,г определена на некоторой о-алгебре, со- держащей Пх для всех х El X. Следовательно, цг опре- делена, в частности, на множествах Пу = U Пх и Пк = x^U п
248 И. Н. ВРУБЛЕВСКАЯ = и П* для всех и ё 1Г и h^Hu, Очевидно, х&и А ПЬЛг =0 Для hr =/= h2 и Пу = J Пуп. h^H и 3. Ситуация р — (р°, р1, рп) есть вероятностная мера п на а-алгебре в П = II П\ именно, р является произве- 2=0 дением мер рг [3]; в частности, на измеримом прямоуголь- 71 П нике Пх = П Пх имеем |л(Пх) = П р,г(Пж). Очевидно, Пж 2=0 i=0 и Пу для любых х, у ЕЕ X или не пересекаются, или одно содержится в другом. г Положим В,г(С7, h) = — для таких U G ХГ v 7 рг(Пу) (i = 1, 2, ..., zz), что рх (Пу) =/= 0, а для остальных U ЕЕ XV пусть (U) есть произвольное дискретное ве- роятностное распределение на Hv. Так как рг — мера, сле- довательно, счетно-аддитивна, смешанная стратегия рг порождает стратегию поведения |3^,г однозначно с точ- ностью до тех Е7, где рг (Пу) = 0. В свою очередь стратегия поведения (z = 1, 2, ..., п) порождает смешанную стратегию p^t — произведение мер |У(^) I3L 4. Пусть / есть естественное отображение множества П на множество всех партий S. Для любого х е X обозна- чим через S (х) множество всех партий, проходящих через х, и будем называть такое множество элементарным, а х — его основанием. Очевидно, /-1 (S (х)) = Пх. Семейство подмножеств множества S, состоящее из всех множеств, имеющих вид не более чем счетной суммы элементарных множеств с основаниями, образующими «ограниченное по времени» подсечение, есть кольцо. Поэтому кольцо (алгеб- ра) R, порожденное всеми элементарными множествами, содержится в этом кольце. Таким образом, любое А ЕЕ R имеет указанный вид; /~1(Л), являясьне более чем счет- ной суммой непересекающихся множеств вида Щ, принад- лежит нашей о-алгебре в П; следовательно, для него
ЭКВИВАЛЕНТНОСТЬ СМЕШАННЫХ СТРАТЕГИЙ 249 определена р (/-1 (Л)). Положим (Л) = р (/-1 (Л)); есть вероятностная мера на алгебре R. На основании счет- ной аддитивности/?^ однозначно определяется своим зада- нием на элементарных множествах. 5. Скажем, что ситуации р£ и р2 эквивалентны, если и совпадают на элементарных множествах. Тогда из сделанного выше замечания и из однозначной продол- жимости мер [3] /?И1 и р^2 совпадут и на порожден- ной о-алгебре S (R), Заметим, что достаточно было бы по- требовать совпадения р^ и р^2 на элементарных множест- вах с основаниями «не ближе» некоторого ограниченного сечения, так как тогда они совпадали бы и на всех элемен- тарных множествах. Скажем, что pl эквивалентно pl (или рг), если для любого р имеем и || pl эквивалентно р || р| (р || рг). Так как |л(пх) = п ицп;)^(п‘), j—Q то pl эквивалентно pl (или рг) тогда и только тогда, когда pl (Пх) = Иг (Пх) (соответственно = рг (П*)). 6. определяет i-вероятность каждой позиции х: рг [я] —. П рг (СЛ, hy) = рг(Щ); произведение здесь и&и* (х) конечное; р* также определяет /-вероятность позиции х\ рг [ж] = рг (П£). Таким образом, р,г эквивалентно рг тогда и только тогда, когда для всех х G= X имеем рг [я] = |Зг Г#]. Здесь также было бы достаточно совпадения для всех х не ближе некоторого ограниченного сечения. Лемма, р? эквивалентно |Зг тогда и только тогда, когда они связаны формулой для всех х ЕЕ Хг таких, что рг [я] =£= 0. Доказательство обычное. Формулу полу- чаем из эквивалентности, поднимаясь к х последователь- но по предшествующим позициям из Хг и учитывая заме- чание, что Щ ~ П^ для промежуточных позиций у.
250 И. Н. ВРУБЛЕВСКАЯ Обратно, для х таких, что рг [я] =£= 0, имеем р* [г/] =/= 0 для у Д х, и, следовательно, из формул, сокращая сосед- ние равные значения рг и учитывая, что значение рг для нижней позиции i-ro игрока есть 1, получим р* [я] — = рг[ж]. Для х таких, что рг [я] == 0, рассматривается самое верхнее z<^x, для которого рг lz] 0 (такое най- дется); ясно, что z ЕЕ Хг. Далее, 3 |V [zh] = 3 H4zh]. h^Hz h(=Hz P [zh]^0 Следовательно, у Иг [^] _ . Д -1’ T* e’ 3 a тогда на остальных h e Hz h^Hz будет |Зг (z, h) = 0, и, значит, рг [я] = П Рг(г, == 0 z^X* 2<Х 7. Определение полной памяти игрока обычное: игрок i имеет полную память, если для любых U, Fe U Д V, найдется hv ЕЕ Hv такое, что U cz D (yhuy Если игрок i имеет полную память, то = Щ для х е. U е W. Следовательно, р1 (П^) - р1 (Щ) и (U, h) = — рг (х, h), т. е. выражается нужной формулой. Таким образом, имеем следующую теорему: Теорема. Если в счетной позиционной структуре игрок i имеет полную память, то для любой его смешанной стратегии рг существует непустой класс эквивалентных ей стратегий поведения, представителем которого являет- ся порожденное (ЗД ЛИТЕРАТУРА [1] Кун Г. У., Позиционные игры и проблема информации, см. настоящий сборник, стр. 13—40. [2] Б е р ж К., Общая теория игр нескольких лиц, Физматгиз, 1961. [3] X а л м о ш П., Теория меры, ИЛ, 1953.
СМЕШАННЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ В БЕСКОНЕЧНЫХ ПОЗИЦИОННЫХ ИГРАХ 1) Р. Дж. Ауман Иерусалим, Еврейский университет § 1. Введение Рассматриваются бесконечные позиционные игры — не обязательно с полной информацией,— в которых может быть континуум альтернатив в некоторой позиции или во всех позициях; эти игры могут также иметь партии неогра- ниченной или даже бесконечной длины. Наша цель— определить понятие смешанной стратегии для таких игр и использовать это определение для доказательства соот- ветствующего обобщения теоремы Куна об’оптимальных стратегиях поведения в играх с полной памятью [8]. Наши методы также приводят к решению принципиальной зада- чи, поставленной Мак-Кинси под названием «игры на пространстве функций» [12, стр. 401—403]. В качестве побочных результатов мы получаем, что наше доказательство теоремы Куна не использует доволь- но громоздкой модели «дерева» для позиционных игр, что оно явно использует условные вероятности (которые Ку- ном использовались неявно) и что оно явно показывает, что если в игре игрок имеет полную память, то он может ограничиваться стратегиями поведения (это также содер- х) Aumann R. J., Mixed and behavior strategies ih infinite extensive games, Advances in games theory, Princeton, 1964, 627—650.
252 Р. ДЖ. АУМАН жится неявно в доказательстве Куна). Наше доказатель- ство длиннее и сложнее, чем у Куна; это объясняется тем, что возникают некоторые вопросы в связи с несчет- ным характером игры; наши рассуждения в случае конеч- ных игр были бы значительно короче. § 2. Примеры Приведем четыре примера, которые обосновывают даль- нейшие рассуждения и указывают на некоторые встречаю- щиеся трудности. В первом примере имеется два игрока, «нападающий» и «защищающийся» (для конкретности можно считать на- падающего бомбардировщиком). Нападающий начинает иг- рать, выбирая некоторое действие (например, направле- ние, курс полета). Защищающийся имеет некоторое уст- ройство (например, радар) для определения выбранного нападающим действия, и он принимает решение о своем действии на основании той информации, которую полу- чает от этого устройства. Но устройство является несовер- шенным; оно дает лишь видимое направление движения нападающего х, которое имеет известное вероятностное распределение около истинного его направления z (это распределение может зависеть от z). Таким образом, за- щищающийся получает некоторую, но не полную инфор- мацию о действии нападающего. Обозначим через X множество всех возможных види- мых действий нападающего, т. е. множество возможных состояний информации защищающегося. Обозначим через У множество действий, имеющихся в распоряжении за- щищающегося. Очевидно, чистая стратегия защищаю- щегося является отображением X в У. Как обстоит дело с его смешанными стратегиями? Если множества X и У конечны, то и чистых стратегий имеется только конечное число, так что никакой трудности при определении сме- шанных стратегий не возникает. Однако во многих слу- чаях наиболее подходящей моделью была бы такая, в ко- торой X и У являлись бы, например, экземплярами1) еди- ничного интервала. В этом случае еще можно определить х) В оригинале «copies». (Прим, перев.).
СМЕШАННЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 253 некоторые классы смешанных стратегий; например, мож- но смешивать конечное или счетное число чистых страте- гий, или можно брать фиксированное непрерывное рас- пределение в У независимо от того, какую мы имеем ин- формацию, т. е. можно смешивать континуум чистых стратегий, каждая из которых есть постоянное отображе- ние X в У. Но является ли это наилучшим, что можно сделать? Не можем ли мы смешивать континуум чистых стратегий, которые не являются постоянными? Смешанную стратегию можно понимать как вероятно- стное распределение, т. е. как меру в множестве всех чистых стратегий. Но прежде чем определять меру в не- счетном пространстве, нужно определить в нем измери- мую структуру1), т. е. указать, какие подмножества из- меримы. И отнюдь не ясно, как это должно быть сделано в нашем случае, или даже какой вид измеримой структуры в пространстве чистых стратегий следует считать «подхо- дящим» для наших целей. В качестве второго примера достаточно процитировать Мак-Кинси [12, стр. 401]: «В игре четыре хода: на первом ходе игры игрок I вы- бирает вещественное число х^ на втором ходе игрок II, зная хг, выбирает вещественное число yt; на третьем ходе I, зная у19 но забыв х19 выбирает вещественное число х2; и на последнем ходе II, зная и х21 но забыв х±1 выбирает вещественное число у2. (Выигрыш является некоторой функцией четырех переменных: хг, х2, у± и*^2.) Чистая стратегия игрока I есть упорядоченная пара {а, /}, где а — вещественное число, а / — функция одной вещест- венной переменной (она зависит от учистая стратегия игрока II есть упорядоченная пара {g, h}, где g — функ- ция одной вещественной переменной (зависит от а h — функция двух вещественных переменных (зависит, от Уг И ж2)... Очевидно, функция выигрыша для игры описанного здесь вида не обязана иметь седловую точку2), и, следо- 2) Под измеримой структурой понимается класс всех измеримых подмножеств пространства. {Прим, перев.) 2) Седловая точка — ситуация равновесия в чистых стратегиях в антагонистической игре. {Прим, перев.)
254 Р. ДЖ. АУМАН вательно, естественно предполагать, что игроки будут применять смешанные стратегии...» Трудности, которые Мак-Кинси далее описывает, в точ- ности соответствуют тем, о которых мы говорили в связи с первым примером. В третьем примере участвует понятие сверхигры дан- ной игры G. Под сверхигрой понимается такая игра, каждая партия которой состоит из ряда повторяющихся партий игры G; выигрыш на «сверхпартии»х) обычно определяется как в том или ином смысле среднее выигры- шей на отдельных партиях. Сверхигра и связанные с ней понятия * 2) получили значительное отражение в литерату- ре; отчасти это объясняется тем, что сверхигры появляют- ся естественным образом в приложениях, а отчасти тем, что анализ сверхигры иногда приводит к выводам о ра- циональном действии в отдельной партии 3). Сверхигры обычно исследуются на основе пошагового рассмотрения; именно, предполагается, что каждый игрок принимает решение о своей стратегии для каждой из со- ставляющих игр отдельно. Эти «локальные» стратегии могут зависеть или не зависеть от результатов предыдущих составляющих игр, а также могут быть чистыми или сме- шанными; однако возможность смешивания ряда чистых «глобальных стратегий» для всей сверхигры обычно не используется, что существенно облегчает анализ сверх- игры. Сверхигру можно рассматривать как позиционную игру, в которой ходом является выбор чистой стратегии для составляющей игры. Очевидно, сверхигра является игрой с полной памятью: в каждой составляющей партии каждый игрок помнит все, что он знал в предыдущих со- ставляющих партиях. Когда мы ограничиваемся при ана- лизе сверхигры рассмотрением смешанных стратегий лишь для составляющих игр, мы тем самым рассматриваем в сверхигре только стратегии поведения. Если применима теорема Куна о стратегиях поведения в играх с полной х) Партия и окончательная позиция соответствуют друг другу. (Прим, пер ев.) 2) Такие, как понятие стохастической игры. 3) См. [12, рассуждение внизу стр. 157]; также [1] и [2, § 10].
СМЕШАННЫЕ СТРАТЕГИЙ И СТРАТЕГИИ ПОВЕДЕНИЯ < 255 памятью1), то мы не теряем общности при таком сужении области стратегий. Но в своей первоначальной формули- ровке она касается лишь того случая, когда исходная игра конечна и повторяется только конечное число раз. Вулф [15, стр. 15] указал, что теорема Куна может быть распространена на игры с бесконечной длиной партий, и легко видеть, что можно также допускать счетное число альтернатив в некоторых (или во всех) позициях. Подлин- ные трудности возникают, когда в некоторых позициях может быть континуум альтернатив; в случае сверхигры это соответствует игре G с континуумом стратегий. В чем важность сверхигр для игр с континуумом стратегий? Предположим, что мы хотим рассмотреть сверхигру для кооперативной исходной игры. Чтобы проанализировать эту сверхигру должным образом, нуж- но формализовать для каждой составляющей игры пред- варительные торги. Такая формализация должна вклю- чать континуум чистых стратегий, представленных на торги,— например, мы имеем уже континуум в множестве коррелированных стратегий, которые могут быть предло- жены игроком на рассмотрение коалиции, которую он желает образовать2). Таким образом, удовлетворитель- ный анализ кооперативной сверхигры нельзя проводить без предварительного доказательства аналога теоремы Ку- на для непрерывного случая. Фактически именно эта за- дача послужила первоначально причиной настоящего ис- следования. Чтобы привести последний пример, начнем с напоми- нания формулировки теоремы Билля [14]: каждая анта- гонистическая игра на единичном квадрате с непрерыв- ной функцией выигрыша имеет оптимальные смешанные стратегии и, следовательно, обладает значением. Итак, в игре на единичном квадрате каждый игрок выбирает точку в единичном интервале [0,1], ничего не зная о точ- ке, выбранной другим; выигрыш есть функция двух х) Теорема Куна утверждает, что в игре с полной памятью каж- дая смешанная стратегия т имеет эквивалентную стратегию пове- дения, т. е. стратегию поведения, которая дает тот же выигрыш (всем игрокам), что и т, независимо от действий других игроков. 2) См. [1, § 6] или [2, § 10].
256 Р. ДЖ. АУМАН выбранных точек. Фокс [5] поставил вопрос: может ли результат Билля быть распространен на многоходовые игры с неполной (частичной) информацией, в которых каждый ходсостоит из выбораточки в единичном интервале? В таких играх игроки поочередно выбирают точки у{Ег. GE [0, 1], скажем, для i =1, ..., 2п. После f-ro хода игрок, для которого наступает очередь делать (i 1)-й ход, информируется о значении ..., у^), где — вещест- венная функция. Выигрыш есть / (z/1? ..., у2п), где / — непрерывная вещественная функция. Отметим, что про- странство чистых стратегий, скажем, игрока I есть & = [0, 1 ] X F3 х ... X где Ft — множество всех функций, определенных в области значений ф^и со зна- чениями в [0, 1]. Цель работы [5] состоит в доказательстве того, что, вообще говоря, результат Билля на такую ситуацию не распространяется и значение может не существовать. Конечно, прежде чем это может быть сделано, должно быть определено понятие смешанной стратегии. Если каждое имеет конечную область значений, то каждое Fit а поэтому также и ^Г, есть произведение конечного чис- ла экземпляров интервала [0,1]; следовательно, в этом слу- чае смешанные стратегии могут быть определены как мно- гомерные функции распределения. Однако если область значений функции есть континуум, то совсем не ясно, как определять смешанные стратегии. Один из примеров Фокса, в котором и и / непрерывны, имеет как раз этот вид. Фокс определяет смешанные стратегии как конечные смеси чистых стратегий. Но это вообще не удовлетвори- тельно, особенно когда желательно показать, что игра не обладает значением. Действительно, существует при- мер игры на единичном квадрате, которая имеет значение 0, если в качестве смешанных стратегий допускаются про- извольные распределения, но для которой sup inf выигры- ша есть —1, если ограничиваться конечными смесями чистых стратегий (см. [9], стр. 118). Априори вполнемогло бы быть, что опровергающие примеры из [5] перестают быть таковыми, если допускается более широкий, более естественный класс смешанных стратегий. В действитель- ности оказывается, что этого не происходит, так как до-
СМЕШАННЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 257 казательство, по-видимому, не использует существенным образом указанный ограниченный характер смешанных стратегий. Это скорее утверждение, а не доказательство, которое не является удовлетворительным; есть основание считать, что до сих пор еще не было определения смешан- ной стратегии, подходящего для таких игр. § 3. Смешанные стратегии Рассмотрим более подробно первый пример предыду- щего параграфа; пусть X и У суть экземпляры х) единич- ного интервала. Нужно рассмотреть вероятностные распре- деления в X и в У, а это, как отмечено в предыдущем па- раграфе, требует определения в них измеримых структур. Любая такая измеримая структура должна быть достаточ- но богатой для того, чтобы позволить определить вероят- ность любого интервала; это означает, что она должна содержать все борелевские множества. Обозначим через I единичный интервал, на котором задана измеримая структура, состоящая из всех борелевских множеств, и пусть далее до конца статьи * 2) X и У являются экземпля- рами пространства I. В дальнейшем будем часто писать «т-» вместо слова «измеримый». Предположим, что защищающийся выбрал стратегию /, т. е. отображение X в У, и что действие случая и страте- гия нападающего индуцировали некоторое вероятностное г) В оригинале «copies of the unit interval». {Прим, перев.) 2) Мы выбрали наименьшую структуру, которая удовлетворяет нашим потребностям. Чрезмерно богатая структура разбивает сама себя. Например, если структура в X состоит из всех подмножеств, то единственными мерами в X будут чисто атомические (при конти- нуум-гипотезе [13, стр. 107]); если она состоит из всех измеримых по Лебегу подмножеств, то единственными мерами будут суммы абсолютно непрерывных и чисто атомических мер (следовательно, исключаются все меры с сингулярной неатомической компонен- той). Таким образом, мы видим, что расширение семейства измери- мых множеств сверх некоторого уровня в действительности сокра- щает множество годных мер. Если потребовать, чтобы измеримыми были все интервалы, то наибольшее множество мер получается, если считать, что структура состоит из всех борелевских множеств. (За- метим в этой связи, что в [12, стр. 403] имеется досадная опечатка, где вместо «измеримое по Лебегу» следует читать «борелевское».) 17 Позиционные игры
258 Р. ДЖ. АУМАН распределение в X. Стратегия /, действуя на этом Х-распределении, должна индуцировать распределение в У. Делает ли она это? Пусть В cz У — некоторое борелев- ское множество. Вероятность того, что защищающийся выберет элемент из В, равна Р{х : f (х) ЕВ} =Р{/-1(^)}. Если /-1 (В) не измеримо в X, то последнее выражение не имеет смысла. Это же справедливо для всех m-подмно- жеств В из У. Для того чтобы получить индуцированное распределение в У, мы потребуем, чтобы /-прообраз любого измеримого множества в У был измеримым в X. Другими словами, требуется, чтобы отображение / было измери- мым. Так мы переопределяем чистую стратегию защищаю- щегося; это уже не произвольное отображение X в У, а m-отображение х). Обозначим через Yx множество всех m-отображений X в У. Смешанная стратегия тогда должна быть вероятност- ной мерой в Yx, причем это множество отображений долж- но быть снабжено «подходящей» измеримой структурой У?. Определим отображение ср: Yx х X ->У равенством ф (/, х) = f(x). Пусть снова мы начинаем с распределе- ния в X, и пусть защищающийся выбрал некоторую сме- шанную стратегию; мы хотим найти индуцированное рас- пределение в У. Для m-множества В cz У вероятность того, что защищающийся выбирает элемент из В, равна Р {(/, х):)(х)^В}=Р {(/, х): ф (/, я) ЕЕ В} = Р{^(В)}. Как и раньше, мы заключаем, что структура R должна быть выбрана так, чтобы ф было т-отображением. Но, как мы показали в [3], структуры R, для которой это т) Это переопределение чистой стратегии является следствием требования, чтобы распределения в X индуцировали распределения в Y. Кроме интуитивной желательности, это, как будет видно позже, абсолютно необходимо для формального анализа. Возможно, самым неотразимым интуитивным аргументом все же является то, что нуж- но сделать так, чтобы пара стратегий нападающего и защищающе- гося индуцировала распределение выигрыша, например, так, чтобы можно было каждому выигрышу нападающего соотнести положи- тельную вероятность.
СМЕШАННЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 259 имеет место, не существует; никакая структура в Yx не является в этом смысле «подходящей»! Мы попытались определить смешанные стратегии ;сак распределения (т. е. вероятностные меры) в Yx и столкну- лись с трудностями. В действительности эти трудности могут быть преодолены, по крайней мере частично (см. [4]) . Мы считаем все же, что более удобным и более естест- венн ым является совершенно иной подход. Вспомним интуитивный смысл смешанной стратегии: это — метод выбора чистой стратегии при помощи какого-то случай- ного, рандомизирующего устройства. Физически можно бросать монету и в согласии с выпавшей стороной выби- рать соответствующую чистую стратегию; если требуется рандомизировать континуум чистых стратегий, то можно воспользоваться континуальным колесом рулетки. Мате- матически, случайное устройство — множество сторон мо- неты или точек на краю колеса рулетки — представляет собой пространство с вероятностной мерой, называемое иногда пространством выборок; смешанная стратегия есть отображение этого пространства выборок в множество всех чистых стратегий. Другими словами, то, что мы здесь имеем, есть точно случайная величина, значениями которой являются чистые стратегии. Первоначально мы пробовали действовать с чем-то, соответствующим рас- пределению этой случайной величины; теперь предпола- гаем использовать саму случайную величину.* Обозначим через Q пространство с мерой, которое полу- чается, если в I ввести лебегову меру. Все наши прост- ранства выборок будут экземплярами пространства Q. Интуитивное оправдание этого состоит в том, что каждое «реально действующее» случайное устройство есть или «дискретное», или «непрерывное», или же их комбинация, т. е. соответствующее пространство выборок должно быть конечным или счетным, или же экземпляром пространства I (не обязательно с лебеговой мерой) г). Все такие слу- чайные устройства могут быть представлены случайными величинами, пространства выборок которых действитель- но являются экземплярами пространства Q. *) Физически, конечно, все пространства выборок дискретны и даже конечны; однако часто удобно использовать непрерывную или счетную модели. 17*
260 Р. ДЖ, АУМАН В нашем примере поэтому нужно определять смешан- ную стратегию как отображение Q в пространство Yx всех чистых стратегий. Можно ожидать, что не все такие отображения будут «подходящими» в качестве смешанных стратегий по причине уже знакомого условия, что сме- шанная стратегия и распределение в X должны индуциро- вать распределение в У. К счастью, соответствующим ус- ловием не является требование, чтобы определенная выше смешанная стратегия была измеримым отображением, а то это снова вызвало бы задание измеримой структуры в Yx. Чтобы установить корректное условие, вспомним, что для каждого отображения Q в Yx существует соответствую- щее отображение Q х X в У; отображению / : Q -+YX соответствует отображение g: Q х X ->У, определяемое равенством g (о, х) ~ / ((о)(гг). Корректным условием для смешанной стратегии будет требование, чтобы это соот- ветствующее отображение было яг-отображением. Таким образом, мы определяем смешанную стратегию как т-отображение Q х X в Y. Здесь это определение смешанной стратегии применяет- ся только к очень упрощенной схеме, рассмотренной в пер- вом примере введения. Однако оно может быть распростра- нено без труда и на более сложные многоходовые игры, как это будет i оказано в § 5. § 4. Позиционные игры В этом параграфе формально определяется вид пози- ционных игр, который будет использоваться в дальней- шем. Сначала даются определения, затем обсуждается их интуитивный смысл и их отношения к другим определе- ниям в литературе. Назовем m-пространство стандартным 1),если оно ко- нечно или счетно с дискретной структурой (т. е. все под- множества измеримы), или изоморфно2)/. Большинство m-пространств, «встречающихся на практике», являются стандартными; например, любое борелевское подмно- х) Такое использование этого слова введено Макки [11]. 2) Изоморфизм, есть взаимно-однозначное соответствие, кото- рое измеримо в обоих направлениях.
СМЕШАННЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 261 жество всякого евклидова пространства или гильбертова пространства стандартно. Определение. Игра с точки зрения отдельного игрока, или просто игра, определяется (1) последовательностью (конечной или бесконечной) Ylf Y2, ... стандартных m-пространств, называемых про- странствами альтернатив х); (2) соответствующей последовательностью Хх, Х2, ... стандартных m-пространств, называемых информационны- ми пространствами*, (3) множеством Z, называемым множеством стратегий противников*, (4) последовательностью отображений & : Z х Fi X . . . X называемых информационными отображениями, которые для каждого фиксированного z е Z являются m-отобра- жениями Ух х ... X Уг_1 в Хг; (5) стандартным m-пространством Н, называемым про- странством выигрышей; (6) отображением A: Z х Ух X У2 X ... ->Я, называемым функцией выигрыша. Предполагается, что функция выигрыша является т-отображением*для каждо- го фиксированного z ЕЕ Z. Говоря более наглядно, игра разыгрывается следую- щим образом. Прежде всего, каждый из противников наше- го выделенного игрока (включая случай) выбирает стра- тегию; набор этих стратегий есть элемент z из Z. Затем наш фиксированный игрок информируется о значении g± (z); это значение есть элемент из Хх, который представ- ляет состояние информации нашего игрока перед его пер- вым ходом. Теперь наш игрок выбирает элемент уг из Yr. Затем он информируется о значении g2 (*, Я1); это — элемент из Х2, основываясь на котором данный игрок дол- жен выбрать элемент у2 из У2. Затем он информируется о х) Употребляемый автором термин «действие» (action) мы перево- дим термином «альтернатива». {Прим, перев.)
262 Р. ДЖ. АУМАН значении g3 (z, у, у2) и т. д. Выигрыш определяется как функция стратегии z, выбранной противниками, и альтер- натив у19 у2, ..., выбранных нашим игроком. Обычно оказывается удобным считать пространство выигрышей Н евклидовым пространством, размерность которого рав- на числу игроков. Однако это не всегда должно быть так г), и, так как в дальнейшем мы не пользуемся никаки- ми конкретными свойствами пространства Я, оставляем Н произвольно общим, Заметим, что до сих пор мы не предполагали, что наш игрок помнит что-либо относительно того или иного хода, кроме того, что ему сообщается значением отображения gi. Это становится правдоподобным, если представить себе, что выборы элементов у2, ... делаются различ- ными агентами нашего игрока, которым не дано возмож- ности сообщаться друг с другом. Отображения g и h предполагаются т-отображениями по переменным yi на обычном основании, именно для уверенности, что распределения в пространствах области определения индуцируют распределение в пространстве области значений. Этого не требовалось для переменной z, чтобы избежать необходимости определять измеримую структуру в пространстве стратегий Z, что, как мы уже видели, приводит к трудностям. Таким образом, полу- чаемые результаты справедливы для каждого z отдельно. В частном случае могло бы оказаться возможным интег- рировать по некоторым компонентам для z (например, принадлежащим случаю); это может быть сделано без труда после того, как установлены результаты для фикси- рованного Z. Приведенное выше определение является компромисс- ным между нормальной и позиционной формами игры. Игра сохраняется как позиционная для нашего выделен- ного игрока, но нормализуется для остальных игроков. Даже для конечных игр предпочтительно доказывать тео- рему об играх с полной памятью для одного отдельно взято- го игрока; процесс нормализации игры для остальных иг- х) Например, для некоторых целей удобно рассматривать вы- игрыш в сверхигре просто как последовательность выигрышей в от- дельных партиях, и это оказывается лучше, чем среднее (в некотором смысле) этих выигрышей.
СМЕШАННЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 263 роков позволяет нам сосредоточить все внимание на един- ственном игроке и, таким образом, упрощает доказатель- ства. Не все конечные позиционные игры в смысле Куна 48] (или в более общем смысле Исбелла [7]) подпадают под это определение; однако сюда включаются все игры с пол- ной памятью, так же как и все конечные позицион- 4 ные игры в смысле фон • Неймана и Моргенштер- • " ZV4, 4^» на [10]. Условием того, чтобы игра поКунуподхо- дила под наше определе- ние, является возможность «упорядочения» игры по времени для рассматриваемого игрока. Например, игра на приведенном здесь рисунке не подходит под наше определение, если информацион- ные множества А и В принадлежат одному и тому же игроку, но подходит под него, если они принадлежат раз- ными игрокам1). Конечно, возможность упомянутого упо- рядочения не эквивалентна, вообще говоря, полной памяти (но является ее следствием). Большинство моделей позиционной игры, использо- ванных различными авторами, подобны модели Куна, и те же самые замечания относятся к ним. Определим теперь в нашей модели игры с * полной па- мятью. Определение. Игра называется игрой с полной памятью 2), если существуют такие последовательности т-отображений и] : Yj, /<О, и что Ujgi(z, Z/1, . . -, г/i-l) = У/ г) Этот пример взят из [8]. 2) Точнее, выделенный игрок имеет в игре полную память. {Прим. ред.)
264 р дж. АУМАН И t}gi (z, г/1, . . ., yi-1) = gj (z, Уъ .. ., yj-t) *). Грубо говоря, и есть отображение, при помощи которо- го игрок помнит, что он прежде делал, a t есть отображе- ние, при помощи которого он помнит, что прежде знал. Заметим, что мы привели аналитическое определение игр с полной памятью, которое, сохраняя полную общ- ность, избегает громоздкой геометрической модели дерева. Это оказалось возможным при помощи механизма нор- мализации игры для всех игроков, кроме одного. § 5. Формальны? определения смешанной стратегии и стратегии поведения; теорема Куна Можно предполагать, не теряя общности, что все и являются экземплярами пространства 1* 2); так как если какое-нибудь из них лишь конечно или счетно, то всегда можно добавить к нему континуум одинаковых элементов; декартовы произведения хХг и xYi будут обозначаться соответственно через X и Г3), а их элемен- ты — через х — (#!, х2, ...) ъу = (ух, у2, ...). Напомина- ем, что название «пространство выборок» означает экземп- ляр пространства Q. Пространства выборок будут обозна- чаться через Q, О, йх и т. д., а меры в них — соответст- венно через к, ХД и т. д. Здесь и в следующих трех параграфах слово «подмноже- ство», примененное к m-пространству, будет всегда озна- чать «измеримое подмножество»; и В с У, если Y есть тп-пространство, будет означать «В есть т-подмножество пространства У». Определение. Смешанной стратегией называет- ся последовательность т = (тх, т2, ...) т-отображений т^. й X Х|->У^, где Q есть фиксированное пространст- т) При этом/конечпо, предполагается, что все отображения ui и tj игроку известны. (Прим, ред.}] 3 2) Определения I и Q см. в § 3. 8) Следует тщательно различать жирные буквы X, Q, к и т. д. и обычные буквы X, Q, % и т. д.
СМЕШАННЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 265 во выборок. Стратегией поведения называется такая смешанная стратегия &, что для bi и Ь; (•, я?) суть взаимно независимые случайные величины ЕЕ и X] ЕЕ X; произвольные) х). Каждая тройка (со; m, z), состоящая из элемента про- странства выборок, смешанной стратегии и стратегии про- тивников, однозначно определяет элемент v (со; m, z) из Г; v — (г?х, г?2, ...) определяется рекуррентно ра- венством = т*(со, g^z, У1, .. Рг-1)). Грубо говоря, v есть последовательность фактически вы- бираемых в процессе игры альтернатив. Кроме того, каж- дая пара (m, z) однозначно определяет распределение (т. е. меру) [х в Г; оно определяется для В czY равенством ц (В) = ц (В; ш, z) = X {со: v (со; m, z) В}. Таким образом, ц есть распределение случайной величи- ны v {•; т, z). Две смешанные стратегии называются эквивалентными, если для каждого z ЕЕ Z они определяют одно и то же распределение в Y. Теперь можно сформулировать следующую теорему. ТеоремаКуна. Б игре с полной памятью каждая смешанная стратегия имеет эквивалентную ей стратегию поведения. ♦ § 6. Леммы для доказательства теоремы Куна Так как мы будем широко пользоваться условными ве- роятностями, когда вероятность условия обращается в нуль, дадим краткий обзор свойств таких условных вероят- ностей. Пусть Q — пространство^ выборок с мерой X, Y — экземпляр пространства и у: есть т-ото- бражение. Для произвольного Гс й и j/ Е У мы интере- суемся условной вероятностью Г при условии v (со) = у. Заметим, что условие v (со) = у вполне может иметь веро- ятность нуль, т. е. может быть Z{co: г (со) = у} — 0, возмож- но, даже для всех у. Однако можно доказать (см. [6], стр. 202—204), что для каждого у имеется существенно х) В § 9 это определение обсуждается.
266 Р. ДЖ. АУМАН единственная1) вероятностная мера в Q, обозначаемая2) че- рез cond К (-| v (со) = у) 3), такая, что для каждого В a Y и Г с Q имеем cond X (Г | и (со) = у) d^v"1 (у) = X (р"1 (В) Q Г). (АО) в Формула (АО) есть аналог обычной «формулы полной веро- ятности» в элементарной теории вероятностей. То, что cond % (-1 г? (<х>) — у) , есть вероятностная мера, следует из факта, что пространство Q стандартно (см. [6], стр. 206, п. 5); это единственное место, где используется стандарт- ность. Пусть Q, X, Y и v взяты, как выше, Y' — экземпляр /, g: Q X У ->У' есть ^-отображение, В' cz У' и В а У. Л е м м а А. При указанных выше условиях cond X ({со : g (со, у) е В'} | и (о) = у) d^v"1 (у) — в = X {со : g (со, v (со)) е В' и и (со) ее В}. Замечание. Необычным свойством интеграла в левой части равенства является то, что подмножество из Q, для которого берется условная вероятность, т. е. множество {со: g (со, у) ЕЕ В'}, зависит от у. Если бы cond % не было определено существенно единственным образом как вероятностная мера (например, если бы Q не было стандартным), то этот интеграл не имел бы смысла, так как cond X могло бы тогда определять произвольное зна- чение для каждого у. Лемма утверждает, что, так как имеется условие v (со) = у, можно подставить v (р) вместо у с левой стороны от знака ] и затем получить правиль- ный ответ с помощью (АО). *) В действительности cond X определяется однозначно только с точностью до множества ?/-овс (Хр“х)-мерой 0. Новее наши утвер- ждения будут справедливы для любого отдельного варианта меры cond X, так что отдельный выбор может быть сделан произвольно. 2) Мы надеемся, что наше обозначение для условных вероятно- стей, хотя оно несколько необычно, достаточно прозрачно для того, чтобы не вызвать путаницы. Имеются значительные основания для использования этого обозначения, а не одного из обычных. 8) Обозначение, очевидно, происходит от «conditional» — услов- ный. (Прим, перев.)
СМЕШАННЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 267 Доказательство. Пусть С о Q X Y опреде- лено равенством С = g-1 (Bf). Полагая С? — {со: (со, у) ЕЕ ЕЕ С}, мы получаем, что лемма А равносильна следующему: cond X (CY | v (со) = у) dkv~1 (у) = в — X {со : (со, v (со)) еС и р (со) ЕЕ В}. (А1) Обе части формулы (А1), как функции от С, являются ме- рами в Q X У (так как cond X есть мера в Q для каждого у). Следовательно, достаточно доказать (А1) для того случая, когда С есть прямоугольник Г X А в Q X У. В этом слу- чае левая сторона (А1) превращается в cond X (Г | v (со) = у) dKv~r (у) == AQB = Х{Г П ^(АПВ)} = = X {со : to б—- Г и и (со) А и и (со) ЕЕ В} ~ = X {со : (со, v (со)) ЕГ х Л и v (со) еВ} = — X {со : (со, и (о))) С и и (со) е В}. Это доказывает (А1), если С есть прямоугольник. Тем са- мым (А1) и, следовательно, лемма А имеют место в общем случае. Вернемся теперь к нашей игре. Прежде всего введем некоторые дальнейшие обозначения. Положим У— Ухх ... ... X У^. Аналогично для у Y получим у{ =*= (ух, .., у$). Если В± с“ У1? В2 cz У2, то полагаем В^ — Вг X ... ... xBi и В = X В2 X... Знак В всегда будет сохранять- ся для прямоугольника такого вида. Рассмотрим смешанную стратегию m с пространством выборок Q, стратегию z противников и последовательность ЕЕ У. Тогда для каждого i = 1,2,... можно определить последовательность # = (г?1, vl2, ...) =# (со, у; т, z) ин- дуктивно следующим образом: 1*Л Ы.; (со, g} (z, -wj-i)) для 7 <О, для ;>гх). 1) = (v\, . .V*), у^ = у.х ... X Yk для i, wA. =(Р1,... . . ., и^). (Прим, перев.)
268 Р. ДЖ. АУМАН i Имеем Vх = v, v\ = m^co, gi (z, yi-1)'), и это есть решение | на i-м шаге, если на предыдущих шагах было выбрано I у^. Обозначим (г?|, через (для к Г). Заметим, | что Vj зависит только от у^, а не от всей последовательно- | сти у, так что вместо v (co, у\ т, z) можно написать | г?} (со, yui; m, z). Так как т и z будут фиксированы в боль- | шей части этих рассуждений, будем обычно писать I v} (ф»?/г-1) и опускать.явное указание т и z. Выражение | г>}( •, у^-лГ1 (Bj) означает {со: г?} (со, у^ЕИ Bj}. Для после- 1 дующих ссылок отметим, что | V?1 (®> (?/г-1, Vi (®, 1Л-1))) = Vj (<й, . (Bl) I Далее, вспоминая, что у фиксировано, определяем по- следовательность X, кУ1, ку2, ... мер в Q следующим ) образом: (Г) = cond \ti-t (r I Vi ^i-1) = 2/i) (конечно, ЛУ(1 означает %). Лемма В. Пусть ..., Вк cz Yk. Тогда § • • • § ( • - Vl-d 1 (Ук) • ^Vi-ivi ( • , Уг-1) 1 (Уг) = Вк “ ’ ^~1) 1 (^)> где Bl = Вг X . . . X Вк. Доказательство. Используем обратную ин- дукцию по i. База при i ~ к имеется непосредствен- но. Для индуктивного перехода (из i + 1 следует i) мы имеем $ $ • • • $ = $ ViY4B^)d%v._X(-,i/i-iY4yi)== вг Bi+l Вк Вг = cond ({о: и*1 (со, (у^, у^) е В^1} | ^(®, ^_х) = = Уд dk^vi (•, 2/i-t)(уд- аИ '
СМЕШАННЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 269 Применяя лемму А для А, ~ В — Въ Y=Yit B' = B{+1, g= %+1(-, (2/4-1, •)), Г' = Г*Д p = pi(-,2/i-i), мы получаем, что последнее выражение равно 1 : ^+1 (®> (2/4-1, vi (®, 2/4-1))) G ВГ1 И Pi (a, 2/i_x) GE Bi}, и из (В1) получаем, что это равно ’ Vk (0)’ ЗА-i) £= ^а}- Это завершает индукцию. Следствие С. Пусть Br cz Y19 ..., Вк cz Yk. Тогда § • • • § ^v^G/i) = Bt Bk Следствие D. Пусть / есть т-отображение Yk в множество вегцественных чисел. Тогда $•••$/ (2/&) ^^n-ipfc (‘ ’ 2^-iF1 (Ул) • • • dlv~^ (У1) = в, Вк = f(Vk')dkV? (V*)' вк Доказательство. Если f есть характерис1И“ ческая функция прямоугольного параллелепипеда в Yk1 то это вытекает из следствия С. Общий случай получается обычными методами. § 7. Дальнейшие леммы Целью этого параграфа является доказательство того, что семейство распределений может быть «обращено» и приводит к семейству случайных величин; точное утверж- дение содержится в лемме F ниже. Нам понадобится
270 Р. ДЖ. АУМАН следующая лемма, утверждающая, что одно распреде- ление может быть обращено и даст одну случайную ве- личину. Л е м м а Е. Пусть f — такая неубывающая полунепре- рывная сверху функция г) на I, что f (0) > 0 и f (1) = 1. Для 0 у 1 полагаем Jsup {х : / (х) у}, если {х : / У} непусто, ( 0 в противном случае. Т огда (1) /-1 неубывающая, (2) /-1 полунепрерывна сверху, (3) /-1 (0) > о, /-1 (1) = 1, (4) (Л1)"1 = /. Доказательство непосредственное, и мы его опустим. Пусть теперь X и Y — экземпляры /, а ЗВ есть o'-коль- цо m-множеств в Y. Пусть £: ЗВ X X -> Q является ото- бражением, которое измеримо в X для каждого фиксиро- ванного В ЕЕ ЗВ, и есть вероятностная мера на ЗВ для каждого фиксированного х е X. Л е м м a F. При описанных выше условиях существует семейство случайных величин, распределения которых за- даются при помощи Р; точнее говоря, существует такое т-отображение b: Q X X ->У, что X {со: Ъ (со, х) ЕЕ В} ~ р (В, х) для каждого х ЕЕ X и В ЕЕ ЗВ. Доказательство. Для у €= Y полагаем л (х, у) = [3 ([0, J/1, х). Пусть лх = л (х, •); лх есть неубывающая полунепрерыв- ная сверху функция от у, так что по лемме Е она имеет вполне определенную обратную, которую обозначаем Ьх; положим Ъ (со, х) ~ Ьх(со). Лемма F1. Функция & (со, •) измерима (по Борелю) по х для каждого фиксированного со. х) То есть f (х) — limsup / (у) = lim/О/). у^х+
СМЕШАННЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 271 Доказательство. Для В ЕЕ ЗВ нужно показать, что {х\ Ъ (со, х) ЕЕ Б} измеримо в X. Достаточно доказать это, когда В имеет вид [0, у0). Тогда {х : Ъ (со, х) е [0, г/0)} = {х : sup {у : л (х, у) < со} < у0} = {х : а такое рациональное г<у0> что п(х, г)^>со} = — J {х : л (х, 7м) со} = U {х : £ ([0, г], х) со} = г<Уо г<уп = объединение борелевских множеств = борелевское мно- жество. Это завершает доказательство леммы F1. Покажем далее, что b измерима по двум переменным одновременно. Для этого достаточно доказать, что мно- жества вида [г/0, 1] имеют измеримые прообразы. В этом случае b-1 [z/o, И = {(°Х х): b (со, х) у0} =- {(со, х): (V рацио- нального 5), ($^> СО => Ь (5, х) yQ)} = (из-за полунепрерывности b сверху) = Q {(со, х) : (Ь (5, х) у0) или ($ < со)} == = П ({(«, х) : b(s, х)^у0} и {(0), X) : ($<со)})- = П ((Q X {х : Ь($, ^)>z/o}) U ([*, 1] X X)), S а последнее множество — борелевское в й хД (по лем- ме F1). Наконец, покажем, что X {со: b (со, х) ЕЕ В} = Р (В, х). Это достаточно доказать для того случая, когда В имеет вид [0, у]. Тогда X {со: Ь (со, х) е [0, г/]} = Х{со:6 (со, х) у} = = sup {®: Ьх (®) <С у} = Ъ'х (у). Но Ьх — лй1, так что Ь~^ = лж (по лемме Е). Следовательно, X {со: 6(<о, х) е [0, у]} = Ьх1 (у) = лх(у) = л(х, у) = = Р ([0, у], х), и доказательство леммы F закончено.
272 Р. ДЖ. АУМАН § 8. Доказательство теоремы Куна Зафиксируем т; требуется найти эквивалентную стра- тегию поведения, которую будем обозначать через д. Сна- чала определяем распределения Pi случайных величин Ь{ (•, х) и только потом сами случайные величины. Для В с: Yi и х ЕЕ полагаем Pi (В, х) ••= cond X ({о : mi (со, х) ЕЕ В} | (со, t\^ (х)) = = (ж) I... I тх (со, («)) = U1 (х)). Выражение справа можно истолковать как итерирован- ную условную вероятность, подобно тому как это дела- лось при определении Л?Л. Чтобы подчеркнуть отмечен- ное сходство, заметим, что Зс (В, gi (z, уЬ1)) = , y{_i; m, z)-1 (B). (KI) Пусть £2X, Q2, ... — последовательность экземпляров Q. Согласно лемме F можно найти такие отображения bi', X Xi —что Pi (*, х) являются распределения- ми величин^ (•, х), т. е. такие, что {(Oi : bi (со, х) е Б} = (В, х). (К2) Пусть Q = Qx X Q2 X заметим, что Q также есть экземпляр Q; определим стратегию поведения bf. Q х X Xi ->Ki равенством &i(<0, Xi) = &;(CDi, Xi), где о = (сор co3, ...)• Пусть B± с: В2 cz Y2, ...; для каждого п полагаем В* = Вп X Yn+1 х ... Чтобы устано- вить эквивалентностьт и &, достаточно доказать, что |1(B*; т, z) = |A(B*; b, z) (КЗ) для каждого z Ez Z и каждого п и для произвольного вы- бора Bi. Обозначим (сор ...,соп) через соп. Заметим прежде всего, что vn (со; 6, z) зависит только от соп, а не от всего со. Дейст- вительно, если определить wn (о>п) рекуррентно равенством ^п(®п) = М®П> ?n(2, Wn_i(G)n_i))),
СМЕШАННЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 273 где wn = (м>1,.. wn), то = (®n) = vn (®; Ь, z). (К4) Впредь будем использовать v исключительно для m (если не указываеюя явно иное); таким образом, v (со) будет означать v (со; ж, г), аналогично для v} и т. д. Доказательство (КЗ) проводится индукцией по п; ос- нование индукции получается легко (при п = 1). Для ин- дуктивного перехода (из п следует п + 1) заметим, что (^п) “ И z) вследствие (К4), где Хп = X ...X %п; кроме того, KVn(Bn) = |Л (В*; т, z). Так как по индуктивному предположению обе правые части равны друг друГу, равны также и обе левые; но так как это верно для всех Вп Уп, имеем (К.5) как меры в Yn. Следовательно, Н (5n+i; &, z) = X {®: wn+i(<on+1) е Вп+1} = = Хп+1 {©п+1« (e>n+i) (ЕЕ Вп+1 и wn (<оп) ЕЕ Вп} — = ^п+1 {^п+1 : bn+i (®n+i, gn+i (z, wn (®n))) s Bn+i и wn(®„)sBn} = = 5 X,n+1 {(On+1: &n+l(®n+l, S'n+lCz, ^n(®n))) w"1 (-Bn) (EE (G)n) ~ = 3n+l(Bn+l, gn+i(z, yn))d'knw^(.yn) = Bn 18 Позиционные игры
274 Р. ДЖ. АУМАН (вследствие (К2) и замены переменных уп ^ w (соп)) ~ ^vnVn+i (’ ’ Уп) 1 (-®n+i) dhvn (уп) — Вп (вследствие (К1) и (К5)) — ^ynvn+i (*, Un) 1 (В.1) d'kyn__l х Бп х Vn ( • , Уп-iT1 (уп). . . dkv? (yi) = (на основании следствия D) = dhynvn+1 (•, уп) 1 (z/n+i) • • • B1 Вп ВП+1 . . . dhvx (У1) — ^^n+i (-Вп+1) — (на основании следствия С) = н (5*+1; ж, z). Это завершает доказательство теоремы Куна. § 9. Замечания к определению стратегии поведения Выражаясь образно, игрок, использующий стратегию поведения, «откладывает переход своих мостов, пока не доберется до них», т. е. он рандомизирует независимо при каждом случае выбора, а не руководствуется единственной на все выборы рандомизацией, произведенной до начала партии. Таким образом, стратегия поведения есть семейст- во независимых случайных действий для выбора альтерна- тив, по одному на каждое возможное состояние информа- ции. Прямой перевод этого интуитивного понятия на математический язык дает последовательность отображе- ний bf. Q X Xi ->У$, где отображения bi( •, х) — взаимно независимые случайные величины для различных х, даже когда мы имеем дело с одним i. Здесь имеется некоторое от- личие от определения в § 5, где требовалось только, чтобы bi ( •, х) были независимы для различных i, т. е. игрок
СМЕШАННЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 275 рандомизировал независимо на каждом этапе и до того, как получена информация об этом этапе, а не после. Требование, чтобы величины Ь*( •, х) были независимы- ми для различных х — даже для фиксированного i,— оз- начало бы, что должно быть несчетное множество взаим- но независимых ограниченных случайных величин на одном и том же пространстве выборок; и кроме частного случая, когда почти все из них вырождены (постоянны), это фак- тически невозможно (когда выражение «пространство выборок» используется в нашем ограниченном смысле, ко- торый соответствует интуитивному представлению о слу- чайном устройстве). В самом деле, пусть {Ьх} есть несчет- ное семейство ограниченных невырожденных взаимно независимых случайных величин на пространстве выборок Q и сх = Ьх — математическое ожидание (Ьх). Тогда из независимости следует, что сх взаимно ортогональны в гильбертовом пространстве L2 (Q), и из того, что Ьх не вырождены, следует, что сх не равны нулю тождественно. В результате мы получаем несчетное число ненулевых взаимно ортогональных элементов пространства L2 (Q), и, следовательно, L2 (Q) имеет несчетное число измерений. Но, как известно, размерность этого пространства счетна, что и доказывает наше утверждение. Может показаться, что из сказанного вытекает невоз- можность всякого естественного аналога теоремы Куна для непрерывного случая. Различие это, однако, об- манчиво, и в действительности наша теорема остается в силе. Мы видели, что случайные величины (•, х) должны обязательно быть коррелированы, когда х изме- няется в просто из-за мощности Х{. Однако эта кор- реляция совершенно не относится к игре и не может влиять на выигрыш. Действительно, распределение выигрыша за- висит только от распределений отдельных ( •, х) и не зависит от какого-либо из совместных распределений (это следует из § 8). Другими словами, случайные величины bi (•, х) коррелированы (для фиксированного i и изме- няющегося х) совсем не потому, что эта корреляция необ- ходима для имитации действия данной смешанной стра- тегии ш; в самом деле, если бы она была необходима (как это может быть, когда в игре нет полной памяти), то этот вид корреляции внутри этапов не мог бы достигнуть требуемой 18*
276 Р. ДЖ. АУМАН цели х) и следовало бы обратиться к корреляции между этапами. Эта корреляция скорее является несущественной чисто математической чертой, мало относящейся к делу. Сказанное можно выразить еще и по-другому: по- скольку величины (•, х) имеют свои распределения, они могут быть выбраны как угодно, без какой-либо связи друг с другом, кроме того, что в результате должна быть одновременно измерима и по со и по х. Хотя Ь{( •, х) должны быть коррелированы, для нас не имеет значения, какую форму принимает эта корреляция. Заметим, наконец, что можно было бы определить стра- тегии поведения как отображения, переводящие элементы из в распределения на совершенно так же, как в [8]. При таком подходе предположения о независимости подразумевались бы в формуле для выигрыша при исполь- зовании стратегии поведения, и рассматриваемый вопрос не возник бы вообще. Мы предпочитаем наш подход, так как он подчеркивает естественную связь между смешан- ной стратегией и стратегией поведения. ЛИТЕРАТУРА [1] Aumann R. J., Acceptable points in general cooperative n-person games, Annals of Math. Studies, № 40, Princeton (1959), 287—324. [2] Aumann R. J., The core of a cooperative game without side payments, Trans. Amer. Math. Soc. 98 (1961), 539—552. [3] Aumann R. J., Borel structures for function spaces, Illi- nois J. of Math. 5 (1961), 614-630. [4] A u m a n n R. J., On choosing a function at random, Ergodic theory Academic Press, 1963, 1—20. [5] F о x M., Some zero sum two-person games with moves in the unit interval, Рас. J. Math. 10 (1960), 1235—1242. [6] X а л м о ш П., Теория меры, ИЛ, 1953. [7] Исбелл Дж. Р., Финитарные игры, см. настоящий сбор- ник, стр. 132—154. [8] Кун Г. У., Позиционные игры и проблема информации, см. настоящий сборник, стр. 13—40. [9] К u h n Н. W., Lectures on the theory of games, Princeton • University Lecture Notes, 1952 (mimeographed). [10] V о n Neuman J., Morgenstern O., Theory of games and economic behavior, Princeton University Press, 1944, 1953. x) См. выделенное курсивом утверждение выше.
СМЕШАННЫЕ СТРАТЕГИИ И СТРАТЕГИИ ПОВЕДЕНИЯ 277 [11] Mackey G. W., Borel structures in groups and their duals, Trans. Amer. Math. Soc. 85 (1957), 283—295. [12] Мак-Кинси Дж., Введение в теорию игр, Физматгиз, 1960. [13] Sierpinski W., Hypothese du continu Chelsea, 1956. [14] V i 1 1 e J., Sur la theorie generale des jeux ou intervieht I’habilite des joueurs, Note in traite du calcul des probabilites et de ses applications by E. Borel, vol. IV, Fascicule II, Appli- cations aux jeux de hasard, 1938, 105—113. [15] W о 1 f e P., Editor, Report of an informal conference on re- cent developments in the theory of games, Princeton University, 1955 (mimeographed).
О ТОПОЛОГИЧЕСКИХ ИГРАХ1) А. Р. Пирс Колледж королевы Елизаветы, Лондон 1. Топологическая игра — это такая игра, в которой позициями являются точки некоторого топологического пространства; множество возможных альтернатив (ходов) для любой такой точки непрерывно зависит от этой точки. Партия может начинаться в произвольной точке про- странства, и в каждой точке указано, который из игроков имеет очередь хода. Партия оканчивается при возникнове- нии позиции, в которой множество альтернатив для игро- ка, имеющего в этой позиции очередь хода, пусто. Выиг- рыш каждого игрока зависит от множества позиций, со- держащихся в партии. Понятие топологической игры введено Бержем [1], [2]. В пп. 2 и 3 приводятся некоторые предварительные оп- ределения. В п. 4 дается определение топологической игры и устанавливаются топологические свойства множества тех начальных позиций, в которых какой-то игрок может гарантировать себе выигрыш некоторой определенной сум- мы (теоремы 1—4). Теоремы 1 и 2 развивают теоремы Бержа. Эти результаты используются в п. 6 при дока- зательстве существования оптимальной стратегии для некоторого игрока (теорема 5). В п. 5 приводятся два при- мера, ограничивающих возможности усиления теоремы 2. 2. Разбиением множества X называется такое семейст- во непустых взаимно непересекающихся подмно- г) Р е а г s A. R., On topological games, Proc. Cambridge Philos. Soc. 61, № 1 (1965), 165—171.
О ТОПОЛОГИЧЕСКИХ ИГРАХ 279 жеств множества X, что X = J Пусть {XJ — i^I разбиение множества X, и для каждого iEE / пусть Xi есть топологическое пространство. Подмножество А множест- ва X называем открытым тогда и только тогда, когда А П Xi открыто в Xi для каждого i. Это определяет топо- логию в X, и если X имеет такую топологию, оно назы- вается топологической суммой семейства {XJ. Если X — топологическая сумма семейства {XJ, ю каждое Хх одно- временно открыто и замкнуто в X. Многозначное отображение множества X в множество Y есть отображение Г: X -+Р (У), где Р (У) — семейство всех подмножеств множества У. Если Л Е Р (У), положим Г+А — {х\ Гх =/= 0, ГхсА}, Г"Л = {х: Гх П A =/=0}. Если X, У — топологические пространства и Г — много- значное отображение X в У, то Г называется непрерыв- ным, если для каждого открытого множества U из У мно- жества Г+и и Г~и открыты в X. 3. Игра на множестве X для игроков (1), (2), (п) определяется 1) разбиением {7V+, N~} множества N игроков; 2) разбиением {Хп Х2, ..., Хп} множества X; 3) многозначным отображением Г множества X в себя, таким, что ГХ^ Q Х{ = 0 для i = 1, 2, . . .* н; 4) лг-ограниче иными вещественными функциями /1? ... ..., fn на X. Точки из X являются позициями игры, и партия может начинаться в любой позиции. Если х Е Xi? то в позиции х имеет ход (i)-fi игрок. Партия с начальной позицией х0 развивается следующим образом: если х0 Е Xi, игрок (i) выбирает позицию хг в множестве Гх0; если хх ЕЕ Xj, игрок (/) выбирает позицию х2 ЕЕ Гх1? и т. д. Если в течение партии достигается позиция х с Гх = 0, то эта партия заканчивается в х. Таким образом, партия есть последо- вательность х0, хх, ... с Xi Е Гх0, х2 Е Гх! и т. д. Если такая последовательность конечна и имеет k + 1 элемент, то говорят, что партия имеет длину к (последний элемент
280 A. P. ПИРС хк должен удовлетворять условию = 0). Если длина каждой партии игры конечна, игра называется локально конечной. Если S — множество позиций какой-либо пар- тии, то выигрыш игрока (i) в этой партии есть sup {/г (х): xEzS} или inf {/Дж): х ЕЕ^} соответственно, для (i) ЕЕ N+ или (Z) ЕЕ N~- Цель каждого игрока-— получить возможно больший выигрыш. Говорят, что игрок (i) гарантирует у (у — вещественное число) в начальной позиции ж, если он может добиться, чтобы, независимо от действий других игроков, его выигрыш во всех начинающихся в х партиях был больше или равен у. Если игрок может обеспечить себе выигрыш больше у во всех начинающихся в х партиях, то говорят, что он строго х) гарантирует у в позиции х. к. Предположим, что в приведенном выше определе- нии каждое Xi является топологическим пространством, X — топологической суммой семейства {Хх, ..., Хп} и Г— непрерывным многозначным отображением X в себя. Игра называется топологической снизу для игрока (/), если, кроме того, вещественная функция Д полунепрерывна сни- зу. Игра называется топологической сверху для игрока (i), если /{ полунепрерывна сверху. Теорема!. Если игра является топологической сни- зу для (1) ЕЕ N+, то множество позиций, в которых (1) может строго гарантировать выигрыш у, открыто в X. Доказательство. Обозначим через GY мно- жество начальных позиций, в которых (1) может ' -пого гарантировать у. Тогда (Хх n r-GY) и и n r+GY) cz Gy. 7=2 С помощью трансфинитной индукции для каждого порядко- вого числа а построим такое открытое множество G (а), что G (а) cz Gy. Пусть G (0) = {х-. (ж) > у}. г) В оригинале «strictly». В [1, стр. 19] следовало бы вместо «строго» употребить слово «сильно», что согласуется с [2], где «fortement» синонимично «strongly». {Прим, перев.)
О ТОПОЛОГИЧЕСКИХ ИГРАХ 281 Так как полунепрерывна снизу, G (0) открыто; кроме того, G (0) cz GY. Допустим, что мы уже определили откры- тые множества G (0) cz Gy для всех порядковых чисел Р <С а. Если а — предельное порядковое число, положим G(a)= U G(₽). 3<а Очевидно, G (а) открыто и G (а) cz Gy. Если а — непредельное порядковое число, т. е. а = = а' + 1, положим G(a) = G(a') U (Хх Л Г“С (a')) U U (X; Л Г+Й(а')); G (а') открыто по индуктивному предположению, а Хх П П Г-G (а') и Xj Q r+G (а') (у = 2, ri) открыты, так как X есть топологическая сумма {Хх, ..., Хп} и Г непре- рывно. Следовательно, G (а) открыто. Кроме того, G (а) tz cz Gy, так как G (a') cz Gy и (Хх П Г-£(а')) и U (X; n r+G(a'))cz i==2 с: (Хх Л r-GY) и U (X; п r+GY) cz GY. j=2 Таким образом, для каждого порядкового числа а мы имеем открытое множество G (а) и G (а) cz GY. Трансфи- нитная последовательность {G(a)} возрастает; следователь- но, она должна в конце концов стабилизироваться, т. е. мы имеем G (a0) = G (a0 + 1) = ... для некоторого а0. Пусть G' = X \ G (а0). Если х^Е G' [\ Х±, то Г я cz G'; если же х GE G' 0 Х;, где / ф 1, то Гх Q G' ф 0. Поэто- му если партия начинается в точке из G', то независимо от действий игрока (1) игроки (2), (3), ..., (п) могут до- биться, чтобы позиция игры никогда не попала в G (а0). Но G (а0) zd G (0) = {х: Д (х) у}. Следовательно, если х е= G', то х Gy, и, значит, GY czz G (a0). Но G (a0) cz GY, и, таким образом, GY= G (a0). Следовательно, GY открыто в X. Теорема 2. Пусть игра локально конечная и тополо- гическая сверху для (1) £= N+, и пусть множество Хо =
282 A. P. ПИРС — {x\ Гх~ 0} открыто. Тогда множество позиций, в ко- торых (1) может гарантировать выигрыш у, замкнуто. Доказательство. Определим некоторое от- крытое множество X (а) для каждого порядкового числа а. Пусть X (0) = Xq = {х\ Г я — ф}. Тогда X (0) открыто. Теперь допустим,что мы уже построили открытые множест- ва X (0) для всех порядковых чисел 0 а. Если а — пре- дельное порядковое число, то положим Х(а)= U Хф); Р<а это множество открыто. Если а имеет непосредственное предшествующее число а', положим X (а) - X (а') U Г+Х (а'); это множество также открыто, так как Г непрерывно. Таким образом, с помощью трансфинитной индукции мы получаем для каждого порядкового числа а открытое мно- жество X (а). Заметим, что если 0 а, то X (0) cz X (а). Обозначим через Fy множество позиций, в которых (1) может гарантировать у. Тогда (Xi П Г-/\) JJ и (X;ur+7\)cz^. Определим для каждого порядкового числа а такое мно- жество F (а), что 1) F (а) cz Fy; 2) если 0 < а, то F (0) cz F (а); 3) если 0 < а, то F (а) П X (0) = F (0) Q X (0); 4) F (а) Q X (а) замкнуто в X (а). Пусть F (0) = {х\ (х) > у}; 7^ (0) cz Fy\ F (0) замкну- то в X, так как полунепрерывно сверху, и, следователь- но, F (0) Q X (0) замкнуто в X (0). Допустим, что уже построены множества F (0), удовлетворяющие условиям 1)—4), для всех порядковых чисел 0 < а. Если а — предельное порядковое число, положим ^(«)= и ^(Р)-
О ТОПОЛОГИЧЕСКИХ ИГРАХ 283 Очевидно, условия 1) и 2) выполняются. Если |3' < а, то F (а) р X ([$') = Q (F (3) f| X (3')). Если 3<а ₽ < то F ф) Q X ф') cz F ф') П X (Р'), и если р' < < Р < а, то F (Р) Q X ф') = F ф') П X ф'). Следова- тельно, F (а) П X (Р') = F (Р') Q X (Р'), и 3) выполняет- ся. Если х е X (а) и х F (а), то х е X (Р) для некото- рого Р а и х F (Р). Но F (Р) П X (Р) замкнуто в X (Р); следовательно, существует такая открытая окрест- ность U точки х в X (Р), что U П F (Р) = 0. Так как X (Р) открыто в X, U открыто в X, и так как U cz X (р) cz cz X (а), то U является открытой окрестностью точки х в X (а). X (р) П F (а) = X ф) (] F ф), и, следовательно, U есть такая открытая окрестность точки х в X (а), что U Л F (а) — 0. Таким образом, 4) выполняется. Если а имеет непосредственно предшествующее число а', положим F (а) - F (а') U (Хх Л V~F (а')) U U (X, Л Г+77 (а')). j=2 Условие 1) выполняется, так как F (a') cz Fy и (Хх П Г"/7 (а')) U U (Х;ЛГ+77(а'))с= 7=2 с: (Xi П r-FY) U U (X; f>r+FY) cz FY. 7=2 Очевидно, 2) выполняется. Пусть Р' < а. Если ф') и Гя =^=0, то Гя cz X (Р) для некоторого р < Р'. Поэтому, если х {X (Р') П (Хх р Г~ F (а')), то П {X (р) П F (а')} 0 для Р < Р' < а'. Следовательно, ^еХ(Р') n (Xi п Г-77 (Р)) CZ X (Р') п n F (Р + 1) CZ X (Р') П F (Р'). Аналогично, если / =^= 1, X (Р') Л (Х^ П Г+77 (a')) cz X (Р') П F ф').
284 A. P. ПИРС Кроме того, X (₽') n F (a') = X (P') П F (₽'). Таким образом, X(P') П Л*) = Х(Ю П m U (*i n r-F(a')) U UU(X7nr+^(a'))]-X(3')n^(3'), т. e. 3) выполняется. Наконец, пусть x EE X (a) и C=£ F (a). Если хЕ^Х(а'), то xtfzF(d), и, так как F (a') Q X (а') замкнутой X (а'), существует такая откры- тая окрестность U точки х в X (а'), что U Q F (а') — 0. Так как X (а') открыто в X и U cz X (a') cz X (а), U является также открытой окрестностью точки х в X (а), а так как X (a') П F (а) = X (a') Q F (а'), имеем U р| F (а) — ф. Если х ЕЕ (X (а) \ X (a')) П Х1? то Vx cz (X (а') \ F (а')). Множество X (а') \ F (а') откры- то в X (а') и, следовательно, открыто в X. Xr Q Г+ (X (а') \ F (а')) есть открытая окрестность точки х, не пересекающаяся с F (а). Если х ЕЕ (X (а) \ \ X (а') ) CI х}, то ГЖП(Х(а')\Г(а'))=/=0 И Х; П Г~ (X (a')\F(a')) есть открытая окрестность точки х, не пересекающаяся с F (а). Следовательно, если х ЕЕ X (а) и х F (а), то существует открытая окрестность точки х в X (а), не пере- секающаяся с F (н). Значит, F (а) П X (а) замкнуто в X (а), и 4) выполняется. Таким образом, с помощью трансфинитной индукции для каждого порядкового числа а можно так построить множество F (а), что будут выполняться условия 1)—4). Но наша игра локально конечна, значит, X = X (а0) для некоторого порядкового числа a0 ([1], стр. 31). Итак, F (а0) есть замкнутое множество, и если a а0, то F (а) = F (a) Q X (а0) = F (а0). Положим . F' = X \ F (а0). Если х е F' П Xi, то Vx czz F'\ если же х£^ F' f]Xj, где J =/= 1, то Г^П F'=^= 0. Поэтому, если партия начи-
О ТОПОЛОГИЧЕСКИХ ИГРАХ 285 нается с позиции из F', то независимо от действий (1) игроки (2), (3), ..., (п) могут добиться, чтобы позиция игры никогда не попала в F (а0). Но F (а0) id F (0) = = {^: А (х) у}, значит, Fy с: F (а0). A F (а0) с; Fy по построению, следовательно, F (а0) = Fy. Таким обра- зом, доказано, что Fy замкнуто. Заметим, что так как Г непрерывно, Г+Х открыто. Но Хо = X \ Г+Х, следовательно, Хо замкнуто. Это озна- чает, что в теореме 2 требуется, чтобы Хо было и открыто и замкнуто. Теорема 3. Если игра топологическая сверху для (1) £= N~, то множество позиций, в которых (1) может гарантировать у, замкнуто. Доказательство. Обозначим через Я¥ мно- жество начальных позиций,в которых (1) не может гаранти- ровать у. При помощи рассуждений, аналогичных тем, ко- торые использовались при доказательстве теоремы 1, мож- но построить такое открытое множество Н, что {х: (х) < у} с: Яс: Я7, и что если х^ Н' f| Хх, где Я' = X \Я, то Гх f| Я' =£= ф, если же х е Н' f| Xj (j =j= 1), то Гх с: Я'. Поэтому если партия начинается в позиции из Я', то (1) может добиться, чтобы позиции из Я никогда не достигались. Следовательно, если Fy — множество на- чальных позиций, в которых (1) может гарантировать у, то Fy zd Н'. Но Ну zd Я и Fy Q Яу = 0; следовательно, Fy — Я', т. е. Fy есть дополнение открытого множества и, значит, замкнуто. Теорема 4. Пусть игра локально конечная и тополо- гическая снизу для (1) ЕЕ К~, и пусть множество Хо откры- то. Тогда множество позиций, в которых (1) может стро- го гарантировать выигрыш у, открыто. Доказательство. Обозначим через Ку мно- жество начальных позиций, в которых (1) не может строго гарантировать у. Изменяя немного рассуждения, исполь- зованные при доказательстве теоремы 2, можно показать, что Ку замкнуто. Но если Gy есть множество начальных позиций, в которых (1) может строго гарантировать у, то Gy = Х\Ку, и, следовательно, Gy открыто. 5. Приведем теперь два примера, показывающих, что предположения теоремы 2 не могут быть заметно ослаблены. Первый пример показывает, что если Хо не открыто, то
286 A. P. ПИРС заключение теоремы неверно, даже если в игре существует граница длин всех партий. П р и м е р 1. Рассмотрим игру двух лиц на пространст- ве, являющемся топологической суммой двух экземпля- ров Хх, Х2 интервала (—1, т] вещественной прямой. Пусть (х; i) обозначает точку х^И Х^ и пусть Г(я— If/), *=/=/, если х^>0, r<I;i)=t 0 если х 0. Пусть (1) е= N+ и J1, если и [0 в противном случае; /х полунепрерывна сверху, так что игра топологическая сверху для (1)ееХ+. Множество начальных позиций, в которых (1) может гарантировать единичный выигрыш, есть { (я; 1): 0 я 1, 2 3, ...}J U { (я; 2): 1 < х 2, 3 х 4, ...}, и оно не замкнуто. Второй пример показывает, что заключение теоремы 2 может оказаться неверным, если игра не локально ко- нечна. П р и м е р 2. Пусть X — топологическая сумма Хх и Х2, где Xi — вещественная прямая, а Х2 — топологичес- кая сумма двух экземпляров Y, Z вещественной прямой. Пусть 1), (х; 2), (х\ 0) обозначают точку х соответст- венно из Хх, У, Z. Пусть Г (ж; 1) = {(ж; 0)} и {(у; 2): | х — !/|< 3 | ж|}, Г (х\ 2) = |(у; 1): | х — у |< 11 х |} , Г (х\ 0) = 0 (так что Хо = Z). Предположим, что (1) е= N+ и что /х (х; 0) = 1 для | > 1 и = 0 в противном случае. Эта игра — топологичес- кая сверху для (1) е= Х+, и Хо одновременно открыто и замкнуто, однако она не локально конечна. Множество
О ТОПОЛОГИЧЕСКИХ ИГРАХ 287 позиций из Хг, в которых (1) может гарантировать еди- ничный выигрыш, есть ОО г Л | и {(ж; 1): I х I > = {(ж; 1): | х | > 0}, и оно не замкнуто. Но X есть топологическая сумма Хг и Х2, так что множество начальных позиций, в которых (1) может гарантировать единичный выигрыш, не замкнуто. 6. Стратегия игрока (i) есть такое однозначное отобра- жение о множества Хг \ Хо в X, что бхЕЕГх для всех £ЕЕХ4\Хо. Набор стратегий для всех игроков и начальная позиция определяют некоторую партию игры. Говорят, что стра- тегия о игрока (1) гарантирует ему у в начальной позиции х, если всякий раз, когда партия начинается в х и (1) использует стратегию о, он получает выигрыш больше или равный у, независимо от стратегий других игроков. Если х ЕЕ X, положим ср (х) = sup {у : я Е Fy}, где Fy есть множество позиций, в которых (1) может гаран- тировать у . Стратегия игрока (1) называется оптималь- ной, если она гарантирует ему ф (х) в начальной позиции для всех х G X. 4 Пусть 2 обозначает множество стратегий игрока (1). Так как каждая стратегия игрока (1) есть отображение Хг \ Хо в X, S CZ Х*^<>. Введем в 2 относительную топологию, индуццрованную топологией произведения. Тогда имеет место следующая Теорема 5. Предположим, что имеется или (а) локально конечная игра, топологическая сверху для (1)G N+, в которой Хо открыто в X, или (Ь) топологическая сверху игра для (1) Е N~. Если Гя бикомпактно для всех х G Xi \ Хо, то множество оптимальных стратегий игрока (1) непусто и замкнуто в S. Доказательство. Прежде всего заметим, что S бикомпактно. Действительно, Z = П Тх,
288 A. P. ПИРС и так как Гя бикомпактно в X для всех £ ЕЕ \ Хо, 2 бикомпактно по теореме Тихонова. Обозначим через Sy множество стратегий, при которых (1) может гарантировать у в любой начальной позиции из Fy. Очевидно, Sy =/= 0 при Fy =£= 0. Sy замкнуто в 2. Действительно, пусть (Т£2, о Sy. Тогда для некото- рого П Fy имеем о (х){£ Fy. Но при условиях (а) или (b) Fy замкнуто (теоремы 2, 3), так что существует та- кая открытая окрестность N точки ох в X, чтоТУ Q Fy — = 0. Если М (о) = {т: те 2, rx^N}, то М (о) есть открытая окрестность элемента о и М (о) П Sr = 0. Следовательно, Sr замкнуто в 2. Для х0 ее X рассмотрим семейство {^гу <р (я0)}. Пусть Ti < < ... < Тп < Ф (ж0)- Тогда х0 е для каждого i и Fyi =э Р-.1г тэ ... о F^n. Предположим, что F^k П (-Xi \ Хо) =/=0 и что к п есть наибольшее целое число, для которого это справедливо. Тогда для /с < / < п имеем Г/^П (X i \ Хо) — 0 и = 2. Пусть о?{ £ S-ft для 1 i к, и рассмотрим стратегию с G 2, определяемую для х е= Хх\Х0 следующим об- разом: V, SX — ^Х, ОхЖ, x&F^, x^Fyi\FyM x£Fy,. (г = 2.........к — 1), Тогда <т ё= П ... П Следовательно, для каждого х0 s X семейство {£т: у <С Ф (жо)} состоит из непустых замкнутых множеств и обладает свойством конечного нересечения х). Положим S (х) = П *5\; 5 (ж) — непус- 7<Ф (X) тое замкнутое множество. Рассмотрим теперь семейство {5 (х): х Е~ X}. Пусть хг, ..., жп е X. Если ф(жт) — тахф (ж,), то 5 (жто) а l<i<n с: 8 (х^. Значит, {5 (ж): х X} есть семейство не- пустых замкнутых множеств со свойством конечного пересечения. Пусть 5 = f) 8 (х). Тогда 5 непусто и зам- х) То есть пересечение конечного числа элементов семейства непусто. {Прим, пере в.)
О ТОПОЛОГИЧЕСКИХ ИГРАХ 289 кнуто в 2 . Но S есть как раз множество оптимальных стратегий игрока (1). В самом деле, если о ЕЕ S (х), то а ЕЕ Sy для всех у (р (х), и, следовательно, о гаранти- рует ср (х) игроку (1), если партия начинается в х. Таким образом, если бЕЕ fl S(x), то о — оптимальная стра- хах тегия. Обратно, если о — оптимальная стратегия для (1), то о гарантирует игроку (1) ср (х), если партия начинается в х; следовательно, б ЕЕ П Это справедливо для Y<cp (х) всех х^.Х; значит, <з (= <5" = П П $у хеХ Y<cp(x) ЛИТЕРАТУРА [1] Берж К., Общая теория игр нескольких лиц, Физматгиз, 1961. [2] В е г g е С., Topological games with perfect information, Con- tributions to the theory of games, vol. Ill, Princeton, 1957, 165—178. 19 Позиционные игры
ОБ ИГРЕ, НЕ ОБЛАДАЮЩЕЙ ЗНАЧЕНИЕМ г) М, Са/йон* 2), Ф. Вулф3) Институт перспективных исследований Принстонского университета § 1. Введение Цель настоящей статьи состоит в том, чтобы показать, что один из основных результатов теории бесконечных игр — теорема Гликсберга [2] о полунепрерывных функ- циях выигрыша — в некоторых направлениях не поддает- ся обобщению. В § 2 приводится игра на квадрате (вариант непрерыв- ной игры Блотто4)), которая не обладает значением, а функция выигрыша этой игры топологически даже проще, чем в классическом примере, принадлежащем Биллю [6]. Скарф и Шепли [5] применили теорему Гликсберга к це- лому ряду позиционных игр. Естественно поставить во- прос: является ли условие полунепрерывности функции выигрыша одинаково важным для полной определенности всех таких игр? В § 3 для того, чтобы ответить на этот воп- рос, мы покажем, что любая игра на квадрате может быть представлена в виде позиционной игры с сохранением X)S i о n М., Wolfe Ph., On a game without a value, Con- tributions to the theory of games, vol. Ill, Princeton, 1957, 299—306. 2) Поддержана военно-воздушными силами США через Управле- ние научных исследований испытательной группы по усовершенство- ванию и развитию материальной части военно-воздушных сил, по контракту № AF 18 (600) — 1109. 3) По контракту с Управлением военно-морских исследований. 4) См., например, Линейные неравенства и смежные вопросы, ИЛ, 1959. (Прим, ред.)
ОБ ИГРЕ, НЕ ОБЛАДАЮЩЕЙ ЗНАЧЕНИЕМ 291 свойства обладать или не обладать значением. В § 4 мы, переписав пример из § 2 в виде позиционной игры, обна- ружим, что получается «игра типа погони», которая значе- нием не обладает. § 2. Игра на квадрате Теорема Гликсберга гласит: если А и В — компактные множества и К — полунепрерывная сверху (снизу) функ- ция на Л X В, то sup inf \\ Kdfdg — / ё J J = inf sup \ \ Kdfdg y ё i где f и g принимают значения из множеств всех вероятност- ных боре левых мер, заданных соответственно на множествах А и В. Пример, ограничивающий возможность распространения этой теоремы, представляет игра на единичном квадрате (О х 1, 0 < г/ < 1), имеющая функцией выигрыша (рис. 1) ' —1, К (х, у) = если х << у <С х + т > 1 если х = у или у = х + -j » во всех остальных случаях. Заметим, что, в отличие от примера Билля, эта функ- ция К принимает значения соответственно + 1» —1 на двух открытых множествах и обращается в нуль на их дополнении. Очевидно, что она не является полунепре- рывной ни сверху, ни снизу. (Напомним, что функция F полунепрерывна сверху (снизу), если для любого чис- ла с множество {Р | F (Р) с} ({Р|Р (Р) с}) открыто.) 19*
292 М. САЙОН, Ф. ВУЛФ Покажем, что Kdfdg = ^^ 3 inf sup К df dg = 4- • g f M 7 (1) Пусть / — какая-либо вероятностная мера на [0,1], Если Ф 41) <4. положим yf = 1. Если же /([°4))>4 то выберем такое S 0, чтобы /([«. 4—*))>4- j и положим yf = у — S. В каждом из случаев легко про- верить, что inf^Ad/dg<^A(a:, yf)df(x)^^-. С другой стороны, если / выбрано так, что /({0}) = /({|}) = /({1})-у, то для всех у {К(х, y)df(x) = ±[K(O, у) + К (1 + Следовательно, доказано первое из равенств (1). Далее, пусть g — какая-либо вероятностная мера на [0, 1]. Если g ([0, 1)) то положим хе = 1. Если g ([0,1)) <4 у, то g ({1}) > у, и в этом случае положим xg = 0, если /Го 1 \\ 1 g \1°’ 2/)^ 7 ’
ОБ ИГРЕ, НЕ ОБЛАДАЮЩЕЙ ЗНАЧЕНИЕМ 293 если же Ф 4))>т. * то выберем 6 О так, чтобы /Гп 1 1 g([°, 2~й))>У. и положим xs — у — 6. В каждом из случаев легко про- верить, что sup^Xd/dg>^K(a:g, j/)dg(y)>y. С другой стороны, если g выбрано так, что £({!}) = у. то для любого X $ К (х, у) dg(y) = 1 [я (х, А) + 2К (х, 1) + 4К (X, 1)] < | • Таким образом, доказано второе из равенств (1). Описанную игру можно рассматривать как непрерыв- ную игру Блотто следующим образом. Игрок А должен направить силы х в наступление на один из двух горных перевалов и силы 1 — х в наступление на другой. Игрок В должен направить силы у для обороны первого перевала и силы 1 — у для обороны второго, на котором уже рас- положены постоянные оборонительные силы в размере у. Один игрок платит другому единицу на каждом перевале, если его силы на этом перевале меньше сил противника, и ничего не платит, если их силы равны. Таким образом, выигрыш равен В(х, у) = sgn(z — !/) + sgn([l— х] — [у — 2/]). Легко проверить, что 1 + В (х, у) = К (х, у), так что 2 выигрыш в этой игре ограничивается снизу числом —т о
294 М. САЙОН, Ф. ВУЛФ (максимин игры), а сверху числом — у (минимакс игры). Любопытно, что непрерывная игра Блотто, в которой у игрока А участвуют силы х, а — хиуВ — силы у, Ь — у (без резервов), всегда обладает значением [3]. § 3. Приведение к позиционной игре В этом параграфе мы хотим привести рассмотренную выше игру на квадрате к позиционной игре. С этой целью рассмотрим некоторый класс позиционных бесконечных антагонистических игр и покажем в общем случае, как привести любую игру на квадрате к игре из этого класса. Сначала определим структуру игр Г, которые мы бу- дем рассматривать. Пусть игроки А и В выбирают нуль или единицу не- зависимо от выбора противника1). Полная партия р игры Г состоит, таким образом, из последовательности нулей и единиц, причем члены с нечетным номером выбираются игроком Л, а члены с четным номером — игроком В, Чи- стая стратегия игрока представляет собой последователь- ность из нулей и единиц. Если лх = (а\, х2,...), л2 = = (Ун У— чистые стратегии, использованные соот- ветственно игроками А и В, то получается партия Р = Р К, Л2) = (®v ylt х2, у2,...). (2) На рис. 2 дано представление начальной части этой игры в виде дерева (см. [4]). Пусть теперь Р — множество всех партий игры Г. Обозначим через h (р) платеж игрока В игроку А в ре- зультате партии р ЕЕ Р. Пусть П — множество всех чистых стратегий одного из игроков. Ввиду (2) выигрыш h на Р можно определить как некоторую функцию К, заданную на П X П, полагая h (%, z2, z3, z4,...) = = К ((^, и3,...), (z2, ...)). Пусть (как в [1]) базисом топологии в Р служит семейство таких множеств, кото- рые в представлении игры Г в виде дерева состоят из всех партий, проходящих через данную вершину, т. е. из всех последовательностей, имеющих данный началь- *) При этом игроки помнят все собственные ходы. (Прим, перев.)
ОБ ИГРЕ, НЕ ОБЛАДАЮЩЕЙ ЗНАЧЕНИЕМ 295 ный отрезок. Это эквивалентно топологизации Р посред- ством покоординатной сходимости. Если П топологизи- ровать также с помощью покоординатной сходимости и использовать топологию произведения для П X П, то отображение П X П на Р, определенное равенством* (2), будет гомеоморфизмом и, следовательно, выигрыш h на Р будет наследовать любое топологическое свойство Рис. 2. функции Л” на П х П. Следовательно, для того чтобы описать игру Г с помощью некоторых топологических свойств выигрыша h, нужно только установить эти свой- ства для соответствующей «нормальной формы» этого выигрыша, т. е. для функции X. Перейдем теперь к приведению игры на квадрате, имеющей в качестве функции выигрыша ограниченную и измеримую по Борелю функциюЛГ, к игре, заданной на П X П. Для любой такой функции К построим функцию К на П X П следующим образом. Пусть Т отображает каждое л = гг2,...) ЕП в та- кую точку единичного интервала, для которой л является 00 ее двоичным представлением (именно ^2“г). Для ль <=1
296 М. САЙОН, Ф. ВУЛФ л2 G* П положим К (лх, л2) = К (ТХ, Гл2). Очевидно, что преобразование Т непрерывно; следова- тельно, отображение П X П на единичный квадрат, оп- ределенное как (л1? л2) -> л2), также непрерывно. Таким образом, функция К измерима по Борелю на П X П. Более того, если К непрерывна или полунепре- рывна, то такой же является функция К. В дальнейшем под ц2 мы будем понимать перемен- ные, пробегающие все вероятностные меры, заданные на борелевских множествах из П, а под /х, /2 — переменные, пробегающие все вероятностные меры, заданные на боре- левских множествах единичного интервала. Теорема. sup inf К dpi d|i2 — sup inf К dfa df2 Hi Ha fi ft U inf sup $ A = inf SUP $ $ % dfa. df* Ha Hi fa /i Доказательство. Докажем только первое ра- венство; второе доказывается аналогично. Обозначим че- рез L и R соответственно левую и правую части первого равенства. Сначала покажем, что L R. По заданному е О выберем ц? так, чтобы inf \ К (Л1, я2) (л1) = inf \ X dp/J dfp,2 > L — 8. яз На Для всех борелевских множеств А определим как fi (4) = р® (Т-1 (Л)). Пусть теперь для любого у страте- гия л2 такова, что Тл2 = у. Тогда1) § К (х, у) df^ (х) — (х, Тл2) df® (х) = = § К (Тл1, Тл2) СМ = § К_(Я1, л2) Jp,® (Л1) > L — 8. ИЛ *1953 * напРимеР’ X а л м о ш, Теория меры, стр. 161, теорема 3,
ОБ ИГРЕ, НЕ ОБЛАДАЮЩЕЙ ЗНАЧЕНИЕМ 297 Таким образом, R inf И К (х, у) df° (х) dfe (у) = inf К (х, у) df^ (ж) > /з у V * — 8. Так как 8 произвольно, L R. Для того чтобы показать, что R, выберем /? так, чтобы было выполнено неравенство inf К (х, у) dfo (х) R — 8. У J Определим р,? так, чтобы для всех борелевских множеств А Pi (Г-М) = /? (Л). Единственная трудность возникает из- за того, что преобразование Т не взаимно-однозначно. Однако только для счетного множества точек вида ш х = ^множество Т 1 [х] имеет более чем один элемент; в этих случаях имеется два элемента. Для любого такого х выберем один элемент л из Т-1 [я] и обозначим счетное множество всех л, выбранных таким образом, через Q. Пусть (1? (Л) = (Т (А \ Q)) для любого борелев- ского множества А С П. Тогда, во-первых, отображение А ~^Т (Л\й) переводит борелевские множества в боре- левские: так как если А замкнуто (а следовательно, компактнох)), то Т (Л) также замкнуто, и так как Т (А)\Т(О) С Т (Л\Й) С Т (Л), то множество Т (Л\Й) отличается от Т (Л) не более чем на счетное мно- жество и поэтому является борелевским; легко про- верить также, что это отображение сохраняет разности и счетные объединения. Немедленно получаем, что р° является вероятностной мерой на П и что р,? (Г"1 (Л)) = = (Л) для всех борелевских множеств Л, так как Т (Т-1 (Л)\£2) = Л. Как и раньше, видим, что L > inf К (Л1, л2) <2pJ (Л1) = inf К (7%, Тл2) б7р° (лх) = 712 "2 = inf § К (х, у) df® (х) R — 8. у v *) Пространство П компактно, так как оно является произве- дением двоеточий.
298 М. САЙ ОН, Ф. ВУЛФ § 4. Позиционные игры Обращаясь к играм на последовательностях из § 3, обозначим через Уг и У2 такие не пересекающиеся множе- ства, состоящие из конечных последовательностей нулей и единиц, что никакой элемент из У! не является началь- ным отрезком для элемента из У2 и наоборот. Пусть Р± (Р2) есть множество всех партий, содержащих некоторый элемент из Yr (У2) в качестве начального отрезка. (В представлении игры в виде дерева У! и У2 являются та- кими непересекающимися множествами вершин, для ко- торых никакая вершина одного множества не следует ни за какой вершиной другого, а Р± (Р2) есть множество всех партий, проходящих через одну и ту же вершину из У1 С^)*) Множества Рг и Р2 не пересекаются по построе- нию и, являясь объединением окрестностей, открыты. Пусть функция выигрыша h на Р определена равенством + 1, если рЕЛ, й(р) = |—1, если (3) О во всех остальных случаях. Рассматривая каждый элемент из YT или У2 как позицию, достигнутую за некоторый конечный промежуток вре- мени, можно считать, что эта функция выигрыша заста- вляет партию этой игры окончиться, как только она по- падает в позицию из Y\ или У2, и в этом случае выигры- вает партию соответственно игрок А или игрок В. Во всех остальных случаях получается ничья. Эта формулиров- ка служит моделью двусторонней игры погони, в которой или игрок А может уничтожить игрока В, или игрок В может уничтожить игрока А, или оба они могут избежать уничтожения. Следует иметь в виду, что обращение в нуль функции выигрыша во всех «неоканчивающихся» партиях настоль- ко приближает игру к конечной, что обеспечивает ее пол- ную определенность. Действительно, если У2 конечно, то и Р\Рх и Р2 замкнуты, так что для любого числа с множество {р | h (р) с} замкнуто. Таким образом, h и, следовательно, соответствующая нормальная форма выигрыша — функция К — на П х П полунепрерыв-
ОБ ИГРЕ, НЕ ОБЛАДАЮЩЕЙ ЗНАЧЕНИЕМ 299 ны снизу. Из теоремы Гликсберга [2] (так как П ком- пактно) следует, что в этом случае позиционная игра об- ладает значением (аналогично, если конечно). Однако преобразование игры из § 2 к позиционной ипре приводит к выигрышу типа (3), так как прообразы от- крытых подмножеств квадрата, на которых выигрыш ра- вен соответственно +1 или —1, открыты в Р. Использо- вание теоремы § 3 показывает, что эта игра не обладает значением. ЛИТЕРАТУРА [1] G а 1 е D., Stewart F. М., Infinite games with perfect information, Contributions to the theory of games, vol. II, Ann. of Math. Studies, № 28, Princeton (1953), 245—266. [2] G 1 i c k s b e r g I. L., Minimax theorem for upper and lower semicontinuous payoffs, The RAND Corporation, Research Me- morandum RM-478, October 1950. [3] G г о s s 0. A., W a g n e r R. A., A continuous Colonel Blotto game, The RAND Corporation, Research Memorandum RM-408, June 1950. [4] Кун Г. У., Позиционные игры и проблема информации, см. настоящий сборник, стр. 13—40. [5] S с а г f Н., S h а р 1 е у L. S., Game with information lag, The RAND Corporation, Research Memorandum RM-1320, Au- gust 1954. [6] V i 1 1 e J., Sur la theorie generale des jeux ou intervient 1’ha- bilete des joueurs, Traite du Calcul des Probabilites et de ses Ap- plications, par E. Borel et collaborateurs, Paris, 1938, vol. 2, fasc. 5, 105—113.
Приложение СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ А. Валъд ОГЛАВЛЕНИЕ . 1 Предисловие............................................ 301 Глава 1. Общая задача статистического решения; опреде- ления и предварительное рассмотрение . . . 303 ? § 1.1. Постановка задачи статистического решения . 303 § 1.2. Следствия принятия определенной решающей функции.......................................... 317 § 1.3. Допустимые решающие функции и полные клас- , сы решающих функций.......................... 323 1 § 1.4. Байесовское решение и минимаксное решение I задачи принятия решения..................... 324 § 1 5. Отношение к старым теориям............... 328 § 1.6. Интерпретация задачи принятия решения как антагонистической игры........................... 335 § 1.7. Замечания о некоторых идеях и результатах предполагаемой теории............................ 340 Глава 2. Антагонистические игры с бесконечным множе- ством стратегий........................................ 344 § 2.1. Условия полной определенности игры........ 344 § 2.2. Теоремы о топологии в пространствах смешан- ных стратегий.................................... 366 § 2.3. Свойства минимаксных стратегий............. 370 § 2.4. Допустимые стратегии и полные классы стра- тегий ........................................... 373
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 301 Глава 3. Развитие общей теории статистических решаю- щих функций..............................................378 § 3.1. Формулировка некоторых допущений, касаю- щихся задачи принятия решения...................... 378 § 3.2. Слабая естественная компактность пространства решающих функций................................... 394 § 3.3. Естественная сепарабельность пространства Q 412 § 3.4. Полная определенность задачи'' принятия реше- ния, рассматриваемой в виде антагонистической игры............................................... 414 § 3.5. Теоремы о байесовских и минимаксных реше- ниях задачи принятия решения....................... 416 § 3.6. Теоремы о полных классах решающих функций 430 Глава 4. Свойства байесовских решений в случае, когда случайные величины независимы и одинаково распределены, а стоимость испытания пропор- циональна числу наблюдений.............................. 434 § 4.1. Общая теория............................... 434 § 4.2. Применение общей теории к случаю, когда про- странства О п D1 конечны........................... 455 Глава 5. Применение общей теории к некоторым частным случаям................................................. 460 § 5.1. Рассмотрение некоторых непоследовательных задач принятия решения............................. 460 § 5.2. Рассмотрение некоторых специфических задач последовательного принятия решения.......... 496 Литература.............................................. 518 ПРЕДИСЛОВИЕ В этой книге излагаются основы недавно разработан- ной общей теории статистических решающих функций. В основном она выросла из нескольких предыдущих пуб- ликаций автора об этом предмете и содержит существенное расширение и обобщение идей и результатов, приведен- ных в ранних статьях. Важным продвижением за пределы старых результатов является трактовка планирования эксперимента как части общей задачи решения. Еще около десяти лет тому назад имевшиеся статисти- ческие теории, если не считать немногих разрозненных результатов, были ограниченными в двух важных отноше- ниях. Во-первых, предполагалось, что испытание выпол- няется за один шаг. Во-вторых, задача решения ограничи- валась вопросами проверки гипотез и оценок значений
302 А. ВАЛЬД и интервалов. Общая теория в том виде, в каком она при- ведена в этой книге, свободна от указанных ограничений. Она предусматривает возможность многошаговых испыта- ний и охватывает общую проблему выбора из многих ре- шений. Короткая историческая заметка о развитии теории, приведшем ее к современному состоянию, дана в § 1.7 гла- вы 1. Первая глава посвящена формулировке общей пробле- мы решения и различных основных понятий. Показывает- ся, что задачу решения можно интерпретировать как анта- гонистическую игру в смысле теории игр фон Неймана. Во второй главе рассматривается обобщение нейманов- ской теории антагонистических игр, и эти результаты ис- пользуются затем в главе 3 для построения теории стати- стических решающих функций. В главе 4 приводится ряд дальнейших результатов для случая независимых и одинаково распределенных случай- ных величин. В главе 5 рассматривается частично, в целях иллюстра- ции общей теории, ряд частных вопросов, представляю- щих известный самостоятельный интерес. На протяжении всей книги общие идеи и результаты подчеркиваются в большей степени, чем конкретные ме- тоды или аппарат. Для понимания книги необходимы не- которые сведения из теории вероятностей, в том числе о вероятностных распределениях в бесконечномерных про- странствах. Поскольку статистические концепции и идеи развиваются в книге с самых азов, какое-либо предвари- тельное знание статистики не является необходимым, хотя и желательно. Знание элементарного анализа и некоторое знакомство с основами теорий множеств, меры и интегри- рования будет достаточным математическим базисом для чтения книги. Я благодарен Дж. М. Дж. Феллу, Е. Л. Леману, М. Ло- еву, Ц. Стайну и Дж. Вольфовицу за чтение рукописи и ценные указания и замечания. Книга была написана при финансовой поддержке Бюро Морских Исследований, и я хотел бы выразить мою благодарность за щедрую по- мощь. При подготовке рукописи к печати большую по- мощь оказала миссис Е. Боукер, и я пользуюсь этой воз- можностью, чтобы поблагодарить ее за тщательную работу.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 303 ГЛАВА 1 ОБЩАЯ ЗАДАЧА СТАТИСТИЧЕСКОГО РЕШЕНИЯ; ОПРЕДЕЛЕНИЯ И ПРЕДВАРИТЕЛЬНОЕ РАССМОТРЕНИЕ * § 1.1. Постановка задачи статистического решения 1.1.1. Стохастический процесс, рассматриваемый»за- даче статистического решения. Всякая задача статисти- ческого решения формулируется в связи с некоторым сто- хастическим процессом. Под стохастическим процессом мы понимаем конечный или бесконечный набор слу- чайных величин, обладающих совместной функцией распределения. Мы ограничимся случаем, когда стоха- стический процесс состоит из счетного множества случай- ных величин. Итак, мы примем, что стохастический процесс задан последовательностью X = Ш (i = 1, 2,...) случайных величин. Пусть F (х) рдя всякой последовательности х = {xi} = 1» 2,...) вещественных чисел означает вероятность одновремен- ного выполнения неравенств xi для всех це- лых положительных значений г, т. е. F (ж) есть функ- ция распределения X. Задача статистического решения, связанная со стохастическим процессом X, возника- ет только тогда, когда F (х), функция распределения X, не вполне известна. Характеристической чер- той всякой задачи статистического решения яъяя- ется предположение о том, что неизвестное распре- деление F (х) принадлежит некоторому заданному клас- су Q функций распределения. Класс Q рассматри- вается как данные задачи статистического решения; этот класс зависит от исследуемого процесса и связанной с ним задачи и, вообще говоря, изменяется вместе с ними. В большинстве задач класс Q является собственным подмножеством класса всех возможных функций распреде- ления.
304 А. ВАЛЬД Нередко в статистических задачах делается предполо- жение о независимости и одинаковой распределенности случайных величин Х2,... Если, кроме этого, о рас- пределении F (х) ничего больше не известно, то класс Q состоит из всех функций распределения F (х), которые могут быть представлены в виде ^(г) = ПС(4 1=1 где G (у) может быть произвольной одномерной функцией распределения. В некоторых задачах постулируется толь- ко независимость случайных величин Хг, Х2,... Класс Q является тогда классом всех функций распределения F (х), которые могут быть представлены в виде оо 1=1 где G{ (Ж|) — произвольные одномерные функции рас- пределения. Большая часть современной статистиче- ской литературы имеет дело с задачами, когда Q является конечнопараметрическим семейством функций распре- деления. Например, если случайные величины Хх, Х2,... за- ведомо независимы и распределены по одному и тому же нормальному закону, но среднее и дисперсия этого общего нормального закона неизвестны, то Q есть дву- параметрическое семейство функций распределения. Приведем другой простой пример параметрического класса Q. Пусть известно, что для данных значений хт, принимаемых соответственно случайными ве- личинами Хх,..., Хт, условное распределение величины Хт+1 (т = 1, 2,...) нормально со стандартным отклоне- нием о и средним ахт + |3, где значения постоянных а, Р и о неизвестны. Пусть также известно, что Хг распреде- лено нормально со средним 0 и стандартным отклонением а. Тогда Q будет трехпараметрическим семейством функ- ций распределения. 1.1.2. Пространство возможных решений при окон- чании испытаний. Задача статистического решения встает каждый раз, когда мы встречаемся с некоторым множе- ством альтернативных решений, одно из которых должно
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 305 быть выбрано, причем степень предпочтительности тех или иных возможных решений зависит от неизвестного распределения F (х) случайной величины X. Как будет видно далее, какое именно из возможных решений должно быть выбрано, определяется, вообще говоря, только после некоторых испытаний. Под испыта- нием мы понимаем выполнение наблюдений над некото- рыми из случайных величин последовательности {XJ. Так как рассматриваемое здесь решение выносится по- сле окончания испытаний, мы будем называть его окон- чательным решением, чтобы отличать его от решения, как продолжать испытание, которое будет рассматри- ваться в следующем пункте. Мы будем употреблять сим- вол d* для обозначения окончательного решения и сим- вол D1 для обозначения пространства всех возможных окончательных решений dZ1). Во всякой задаче принятия решения будет задано пространство D\ элементы кото- рого d* представляют возможные окончательные реше- ния. Пространство D1 следует рассматривать как данное в задаче принятия решения и изменяющееся вместе с ней. В качестве иллюстрации рассмотрим следующий про- стой пример. Пусть партия промышленных изделий, со- стоящая из N единиц, подвергается приемочному конт- ролю. Пусть, кроме того, каждое изделие зачисляется в одну из двух категорий, дефектных или годных, при этом доля дефектных изделий в партии неизвестна. Мы при- пишем значение 1 дефектному изделию и 0 — годному. Два возможных окончательных решения рассматривае- мой здесь задачи — принять или отвергнуть партию. Очевидно, степень предпочтения принятия или неприня- тия партии будет зависеть от доли р дефектных изделий в ней. Вообще говоря, можно определить такое значение р0, что принятие партии будет предпочтительнее при Р <С Ро, а непринятие — при р р0- Задача принятия решения возникает, когда полная проверка партии 1) Пока что речь идет лишь о множестве окончательных реше- ний. Однако в дальнейшем на этом множестве будет определена мет- рика, превращающая его в топологическое пространство, (Прим, перев.) 20 Позиционные игры
306 А. ВАЛЬД слишком дорога х) и мы должны принять или отвергнуть партию на основании ограниченной случайной выборки, взятой из нее. Для этой задачи пространствосостоит из двух элементов: d{ и d2, где означает решение принять партию, a d2 — решение ее отвергнуть. Стохастический процесс, связанный здесь с задачей принятия решения, состоит из конечной последовательности {XJ (i = 1,..., TV) случайных величин, соответствующих последовательным случайным извлечениям без возвращения (Х{ соответ- ствует i-му извлечению). Совместное распределение вели- чин Х1?..., XN определяется следующим образом: всякое Xi может принимать только значения 0 и 1; вероятность того, что = 1, равна р; условная вероятность того, что Хт = 1, если Х± = а^,..., Хт^ = хт_-^ равна т—1 pN— 2 ______i=l N — т + 1 Таким образом, Q в этой задаче есть однопараметричес- кое семейство функций распределения, единственным не- известным параметром которого является р. Испытание, состоящее в обследовании т изделий, извлеченных из партии, означает наблюдения, которые производятся над первыми т случайными величинами Л^,..., Хт. (X- Обычно можно сопоставить каждому элементу dl про- странства D* такое подмножество (о с й, что решение dl может быть интерпретировано как решение принять гипотезу о том, что истинное распределение F (х) вели- чины X является элементом из <о. Например, в рассмот- ренном случае решение d* может быть интерпретировано как решение принять гипотезу о том, что р <С р0, & d2 — как решение принять гипотезу о том, что р > р0. Пусть для произвольного F ЕЕ й и для произволь- ных двух решений df, d2 ЕЕ справедливо одно (и только одно) из следующих трех утверждений: (1) d{ предпоч- г) Или даже принципиально в данных технических условиях невозможна (например, если проверка изделия связана с его унич- тожением). {Прим, перев.)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 307 тительнее, чем d[, если F истинно; (2) d% предпочтитель- нее, чем d{, если F истинно; (3) ни одно из решений d\ или d\ не предпочтительнее другого, если F истинно. Решение d* ЕЕ можно назвать оптимальным отно- сительно элемента F ЕЕ Й, если не существует решения из которое предпочтительнее d* в предположении, что F истинно. Сопоставим каждому решению dl множество всех элементов F ЕЕ й, относительно которых d* оптимально. Обычно можно интерпретировать d* как решение принять гипотезу, что истинное распределение F является элементом <od/, предполагая, что (ddt=f=0. В большинстве задач множество codf будет непустым для всякого d*. Однако существуют не лишенные интереса задачи, в которых <od?=0 для некоторых d* и приведен- ная интерпретация d* становится бессмысленной. В боль- шинстве задач, рассматривавшихся до сих пор в стати- стической литературе, всякое решение d* ЕЕ D1 опреде- ляется первоначально как решение принять гипотезу, что F ЕЕ ю, где о — некоторое подмножество Й. Хотя это, несомненно, самый важный из рассматриваемых слу- чаев, но мы не хотим ограничивать общность наших ис- следований наложением таких условий на природу эле- ментов из D*. 1.1.3. Пространство возможных решений, касающих- ся способов продолжения испытаний на произвольном данном шаге. Как упоминалось в п. 1.1.2, под испыта- нием мы понимаем выполнение наблюдений над некото- рыми случайными величинами последовательности {XJ (i = 1, 2,...). Предполагается, что над каждой случай- ной величиной производится не более одного наблюде- ния. Это предположение не ограничивает общности на- ших рассмотрений. Предположим, например, что ста- тистик производит г (г 1) независимых наблюдений над скажем Xu,..., Xir; тогда Хг может быть заменено конечным множеством независимых и одинаково распре- деленных случайных величин Xu,..., Xir и xit может рас- сматриваться как единственное наблюдение над Х^1). х) Более общо, последовательность {Х$ может быть заменена двойной последовательностью {Y^} (i, / = 1, 2, .. .) случайных ве- 20*
308 А. ВАЛЬД Мы будем допускать выполнение испытания в не- сколько шагов. Первый шаг состоит в выборе некоторого конечного множества случайных величин из последова- тельности и наблюдения их значений. После того, как первый шаг оказывается завершенным, осуще- ствляется второй шаг путем выбора конечного множества из оставшихся случайных величин последовательности {Х{} и наблюдения их значений, и т. д. Если испытание заканчивается на к-м шаге, то мы будем говорить, что испытание выполнено в к шагов. Испытания в несколь- ко шагов часто предпочтительнее испытаний с единствен- ным шагом, так как в многошаговых испытаниях выбор наблюдаемых случайных величин на каждом следую- щем шаге может быть произведен с учетом уже на- блюденных значений, полученных на предшествующих шагах. Прежде чем начинать испытания, статистик сталкивает- ся со следующим вопросом выбора для первого шага ис- пытания: какую конечную группу элементов последова- тельности {XJ он должен наблюдать? Таким образом, всякое решение, относящееся к первому шагу испытания, может быть описано конечным множеством целых положительных чисел которые попарно раз- личны. Множество {ц,..., ik} представляет собой реше- ние произвести наблюдение над каждой из случайных величин Х{1,..., Xik. Рассмотрим теперь какой-либо из следующих шагов испытания, когда к его началу уже произведены наблю- дения над (и только над этими случайными ве- личинами). Тогда всякое возможное решение продолжить испытание далее на один шаг может быть описано конечным подмножеством множества /г}, где J означает множество всех целых положительных чисел. Если — некоторые элементы из , /г}, личин, где распределение У{= {У^} (/ = 1, 2, . . .) совпадает с рас- пределением X = {Xj} (j = 1,2, . . .), а случайные величины У1, У2, . . . независимы. Двойная последовательность {Уц} может быть затем преобразована в простую последовательность Z — {ZJ, и мы можем рассматривать Z как стохастический процесс, связанный с данной задачей принятия решения.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 309 то множество {At,..., hm} представляет собой решение на- блюдать xhm. Здесь может встать вопрос, почему один шаг испыта- ния может состоять более чем из одного наблюдения! На первый взгляд кажется более резонным выбирать каждый раз для наблюдения только одну случайную величину и производить дальнейший выбор случайных величин в зависимости от наблюденного значения именно этой слу- чайной величины. Существуют, однако, ситуации, когда такая процедура оказывается слишком дорогой и прак- тически невыполнимой. Например, если производство наблюдений требует продолжительного времени (как это часто встречается в сельскохозяйственных испыта- ниях), то выбор для наблюдения только одной случай- ной величины может потребовать для завершения испы- тания столь продолжительного времени, что результат испытания будет почти обесценен. Могут быть также и другие причины, по которым одновременное наблюдение более чем одной случайной величины оказывается более желательным. Пусть De — пространство1) всех возможных решений о первом шаге испытания, т. е. De есть пространство всех конечных (непустых) подмножеств множества J. Таким образом, всякое de е= De есть просто конечное (непустое) подмножество множества J. После того как были произве- дены наблюдения над случайными величинами Xip...,Xife (и только над ними), пространство всех воз- можных решений о следующем шаге испытания, если испытание вообще продолжается, состоит из всех эле- ментов de De, которые являются подмножествами множества У\{г19..., £Л}. В качестве иллюстрации рассмотрим следующий при- мер. Пусть элементы последовательности {XJ (г = = 1, 2,...) независимы; те из них, которые имеют нечет- ные номера, распределены нормально со средним 0Х и дисперсией 1, а те, что с четными номерами, распределе- ны нормально со средним 02 и дисперсией 9. Значения х) См. сноску !) на стр. 305. (Прим, перев,)
310 А. ВАЛЬД параметров 0Х и 02 предполагаются неизвестными. Пусть пространство решений D1 состоит из двух элементов: d{ и где означает решение принять гипотезу Я, состоящую в том, что < 02, а 4 — решение отверг- нуть гипотезу Н. Так как все Х-ы с нечетными номерами, равно как и все те, что с четными, распределены одинаково, вопрос о том, как производить испытание, сводится к следующему: сколько Х-ов с нечетными номерами и сколь- ко с четными следует наблюдать в первый шаг испытания? После выполнения первого шага вопрос состоит опять в том, сколько Х-ов с нечетными и сколько с четными но- мерами должно быть взято для производства второго шага испытания, и т. д. Так как стандартное отклонение X с нечетным номером есть 1, а с четным — 3, интуитив- но ясно, что естественно наблюдать большее число Х-ов с четными номерами, чем с нечетными (если предпо- лагать, что стоимость наблюдения значения Х£ не зави- сит от i). 1.1.4. Решающие функции. Мы можем теперь опре- делить понятие решающей функции. Сначала дадим опре- деление решающей функции частного типа, так называе- мой нерандомизированной решающей функции. Пусть D = £)(0 j De, т. е. D состоит из всех элементов d* ЕЕ D1 и всех элементов de е= De. Далее, определим как О' I) О?,...;,.. Функция d (х\ $!,..., 5Л) называется неран- домизированной решающей функцией, если (1) это однозначная функция, определенная для всех целых положительных значений к, для всяких значений выборки х и для всякой системы непересекающихся множеств s1: целых положительных чисел; (2) значение функции d (х; sk) не зависит от тех компонент хг выборки х, для которых число i не содержится в каком-либо из множеств s1?..., sk, (3) она постоянна при к = 0 (эту постоянную мы бу- дем обозначать через d (0)); (4) для к 1 значение функции d (х; $ь..., sk) мо- жет быть произвольным элементом из 2){1,..., ir, где {z’i,..., ir} есть теоретико-множественная сумма sA.: {t’i, .. . , ir} = U Sj', М
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 311 (5) при к — 0 значение d (х\ sk), т. е. значение d (0), есть произвольный элемент из D. Такая решающая функция может быть использована для однозначного определения правила производства испытания и для выбора окончательного решения df. Это может быть сделано следующим образом: если d(0)^D\ то испытаний не производится вовсе и окончательное реше- ние d (0) уже выбрано. Если d (0) =de=s1=(i1,..., ir)EzDe, то наблюдения производятся над случайными величи- нами ,..., Xir и вычисляется значение функции d (х\ s^. Если d (х; sj ее D\ то испытание прекращается и окон- чательное решение d (х; sr) принято. Если d (х; EzDe, т. е. de= $2 = (/р..., /п)> то производятся наблюдения над Xjt ,..., Х]п и вычисляется значение d (х; $2). Если d (х; 61, $2)е=/)*, то испытание заканчивается с оконча- тельным решением d (х; $2). Если же d (х; s2) ЕЕ De, то наблюдения производятся над соответствующим множе- ством случайных величин, и т. д. Пусть CD — некоторое борелевское тело 1) подмножеств пространства D, которое содержит в качестве элементов все конечные и счетные подмножества/). Под вероятност- ной мерой б на пространстве D мы будем понимать вероят- ностную меру, определенную на всех элементах борелев- ского поля CD. Пусть А — пространство всех вероят- ностных мер б. Для произвольного подмножества {iH. .ik} cz J обозначим через А^,. . .,$fc Kjracc всех ве- роятностных мер б, для которых б (/)$,>• fy) = 1* Функция б sft), значения которой являются элементами А, называется рандомизированной решаю- щей функцией, если (1) это однозначная функция, определенная для произ- вольного целого положительного к, произвольной конеч- ной системы непересекающихся множеств 51?..., sk це- лых положительных чисел и для произвольной выборки х; г) Класс С подмножеств пространства А называется борелев- ским телом, если (1) пустое множество принадлежит С; (2) если не- которое подмножество а множества А принадлежит С, то его допол- нение также принадлежит С\ (3) сумма последовательности {а*} (£ = 1, 2, . . .) подмножеств А, принадлежащих С, также принад- лежит С.
312 А. ВАЛЬД (2) она является постоянной 6 (0), когда к = О1); (3) 6 (х; sk) е ir, если г > 1, где {ip..., ir} есть теоретико-множественная сумма s1?. . sk, а б (0)Е А; (4) значение функции 6 (х\ Sp..., sk) не зависит от тех компонент х{1 для которых i не содержится в каком- либо из множеств sk. Ясно, что рандомизированная решающая функция становится нерандомизированной, если при любых зна- чениях Л, Sp..., sk и х вероятностная мера б {х\ Sj,..., sfc) приписывает вероятность 1 одному из элементов D. Та- ким образом, нерандомизированная решающая функция может рассматриваться как частный случай рандомизи- рованной2). Рандомизированная решающая функция 6 (х; sfc) также может быть использована для одно- значного определения процедуры производства испытаний и выбора окончательного решения. Сначала выбирает- ся элемент d^D при помощи случайного устрой- ства, сконструированного так, что распределение вероят- ностей выбираемого элемента d есть б (0). Если так выбранное d является окончательным решением то это решение d* принимается, и никаких дальнейших испы- таний не производится. Если d = de = sx = (?"i,..., £r) De, то производятся наблюдения над Xi]L, . . ., Xir и вычисляет- ся значение б (х; sx). Далее используется вероятностное распределение б (х; s) для выбора d^D. Если так вы- бранное d принадлежит D*, то испытание заканчивается соответствующим окончательным решением. Если же это есть элемент Z)e, то наблюдения производятся над соот- ветствующим множеством случайных величин, и т. д. Эта процедура отличается от аналогичной процедуры в нерандомизированном случае лишь тем, что на каждом шаге вместо выбора определенного элемента d статистик выбирает вероятностную меру б на£>, после чего элемент d выбирается при помощи случайного устройства, ко- торое осуществляет нужное распределение б. г) Точнее, при к = 0 значение б (0) является фиксированной случайной величиной. {Прим, перев.) 2) Выражения «выбор с вероятностью 1» и «выбор наверно» мы будем употреблять как синонимичные.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 313 Представляется целесообразным принять, что б (х; sA.) = б (ж; s',..., s'), если теоретико-множе- ственная сумма Si,..., sk равна сумме $!,..., s'r. Мы, однако, не будем налагать такого ограничения на б по причинам, которые будут изложены в главе 3. В дальнейшем термин «решающая функция» будет упстребляться для обозначения как рандомизированной, так и нерандомизированной решающей функции, так как последняя является частным случаем первой. Для всякого 7)* cz D мы будем обозначать вероятность того, что d ЕЕ 7)*, через б (7)* [ х\ sx,..., sA), если б (х\ sx,..., sk) есть вероятностная мера на 7), и через б(7)*|0), если этой мерой является б (0). Важен частный случай, когда используемая решаю- щая функция б (х; Si,..., sk) такова, что испытание на- верно выполняется за один шаг. Это будет иметь место, когда б (7Эе | 0) = 1 и б (7)* | х\ = 1 при любых х и sx. Мы можем иначе охарактеризовать этот случай, говоря, что мы решаем заранее (т. е. до начала испытаний), какие именно случайные величины последовательности {Xi} будут наблюдены в течение всего хода испытания. Это — классический «непоследовательный» случай. Ре- шающая функция б (х; Si,..., sk) будет называться последо- вательной, если при применении и испытании она с по- ложительной вероятностью приводит к выполнению испы- пытания более чем в один шаг. 1.1.5. Убытки от возможного неверного окончатель- ного решения и стоимость испытания. Статистик сталки- вается с проблемой выбора конкретной решающей функ- ции б (х; Sj,..., sfe) для выполнения испытания и вынесе- ния окончательного решения. Однако, чтобы быть в со- стоянии судить об относительном достоинстве той или иной решающей функции, необходимо располагать ин- формацией (1) об относительной степени предпочтения данной функции по сравнению с различными dt^Dt, если известно истинное распределение F случайной ве- личины X; (2) о стоимости испытания. Степень предпочтения данной гипотезы всем осталь- ным d* ЕЕ при известном F может быть выражена не- отрицательной функцией W (F, dl), называемой весовой
314 А. ВАЛЬД функцией, которая определена для всех элементов F ЕЕ Q и для всех элементов d* Для произвольной пары (F, cF) значение W (F, d*) выражает убыток, к ко- торому приводит принятие окончательного решения d*, если F есть истинное распределение X. Мы будем гово- рить, что d* есть правильное окончательное решение, когда F истинно, если W (F, = 0. Если W (F, d*) >0, то будем говорить, что d* есть неверное окончательное ре- шение при истинном F. Окончательное решение d{ называется предпочитаемым другому окончатель- ному решению d\ при истинном F, если W (F, <" <W(F,d$. Весовая функция W (F, dl) является одним из условий задачи принятия решения. В некоторых проблемах, од- нако, бывает трудно задать численную весовую функцию W (F , d*), например, когда d* означает принятие или непринятие некоторой научной гипотезы. Даже в тех случаях, когда нет принципиальных трудностей в при- писывании численных значений W (F, d*) для любых F и d*, фактическая весовая функция может оказаться слишком сложной, и тогда желательно заменить ее более простой функцией. Мы будем говорить, что весовая функция W (F, d1) простая, если она принимает только значения 0 и 1. Во многих статистических задачах для практических целей достаточно рассмотрения только простых весовых функций. В тех задачах, где приписыва- ние определенных численных значений убыткам при окончательных решениях представляется затруднитель- ным, обычно не возникает трудностей в конструировании простой весовой функции, так как последняя требует только, чтобы для всякого F элементы d* Е= D1 были раз- делены лишь на две категории — неверных и правильных решений. Если может быть построена численная весо- вая функция W (F, d*), но мы хотим заменить ее простой весовой функцией W* (F, d*) из соображений простоты, то мы можем поступить так: для всякого F выберем произ- вольно положительное число с (F) и положим = п₽и ^(^)<C(F)> 11 при W(F, d‘)>c(F).
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 315 В качестве иллюстрации рассмотрим пример из п. 1.1.2. В этом примере пространство D1 состоит из двух элементов d{ и d2, где d{ означает решение принять партию, a d2 — решение ее отвергнуть. Так как доля р брака в партии есть единственный параметр, от кото- рого зависит F, мы можем в весовой функции W (F, d*) заменить F на р. Рассмотрим следующую весовую функцию: О для С1(Р — Ро) Для p>pQ; W(p, d{) = А (<b(Po~P) ДЛЯ 7?<Po, W (p, d2) =] I 0 для р>ро. Часто оказывается возможным выбрать постоянные р0, сг и с2 так, чтобы получаемая весовая функция выражала шкалу предпочтения для практических целей достаточно хорошо. Если мы хотим заменить указанную весовую функцию простой весовой функцией W* (р, то мы выбираем два значения рт и р2 (р± <С Ро Рг) и полагаем f (О W* (р, 4) = при р<р2, при р>р2; ту* (р, 4) = при Р^Р1, при Р>Р1. Если рг и р2 выбраны подходящим образом, то такая про- стая весовая функция для практических целей часто удовлетворительна. Стоимость испытания может зависеть от номеров слу- чайных величин, выбираемых для наблюдений, от фак- тически наблюденных их значений, а также от шагов, из которых состояло испытание. В связи со сказанным будем обозначать эту стоимость через с (х; sn..., sk), где (1) испытание было проведено в к шагов; (2) i-й шаг испытания состоял в наблюдении случай- ных величин Xj для всех j е= (3) х есть наблюденная выборка.
316 А. ВАЛЬД Конечно, стоимость с (х\ не зависит от тех компонент выборки х, для которых i не входит ни в одно из множеств Интересным частным случа- ем является тот, когда стоимость испытания зависит только от числа сделанных наблюдений и пропорцио- нальна ему. Функция стоимости такого типа будет назы- ваться простой функцией стоимости. Во многих задачах окажется возможным аппроксимировать функцию стои- мости простой функцией стоимости. 1.1.6. Постановка задачи принятия решения. Мы мо- жем сформулировать теперь общую задачу принятия решения. Она может быть поставлена следующим об- разом. Пусть даны: (1) стохастический процесс {XJ; (2) класс Q распределений, причем известно, что ис- тинное распределение F случайной величины X является элементом Q; (3) пространство D1 возможных окончательных ре- шений; (4) весовая функция W (F, d*), определенная для всех элементов Fe и всех элементов d* ее D1, и (5) функция стоимости с (х; sk) испытания. Задача состоит в нахождении решающей функции S (х; 5Л), которую можно принять для выполнения испытания и вынесения окончательного решения. Принятие той или иной решающей функции стати- стиком может быть обозначено термином «индуктивное поведение», так как он однозначно определяет проце- дуру осуществления испытания и вынесения окончатель- ного решения. Таким образом, сформулированная задача принятия решения может быть названа задачей индуктив- ного поведенияг). В попытке решения поставленной выше задачи при- нятия решения первым существенным шагом является установление некоторых принципов, которые должны привести к полному или хотя бы частичному упорядоче- х) Термин «индуктивное поведение» был введен Нейманом [38]. (Номера в скобках соответствуют номерам в библиографии в конце книги.)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 317 нию всех возможных решающих функций с точки зрения их соответствия целям индуктивного поведения. Это бу- дет сделано в §§ 1.2 и 1.3 при помощи введения понятий равномерно лучшей решающей функции и допустимой решающей функции. § 1.2. Следствия принятия определенной решающей функции 1.2.1. Функция риска. Введем сначала некоторые обо- значения, которые окажутся удобными. Пусть sx,...,5r — непересекающиеся подмножества J, а 5 — последова- тельность sr} этих подмножеств. Для любой последовательности х = {х^ (г = 1, 2,...) вещественных чисел мы будем пользоваться обозначе- нием б (х; s) наравне с б (х\ sr), а с (х; s) наравне с с (х; Яр..., sr), т. е. будем полагать б (х; Si,..., sr) = б (ж; s), (1.1) с (х\ sx,..., sr) = с (я; 5). (1.2) В соответствии с обозначением (1.1) для всякого D* cz D мы будем считать символы б (D* | х\ sr) и б (Z>* | х; s) синонимичными обозначениями вероятности того, что при пользовании решающей функцией б, вы- полнении испытания в г шагов соответственно над мно- жествами $!,..., случайных величин и при наблюден- ной выборке х решение d будет принадлежать множест- ву Z)*. Будем иногда пользоваться символом de не только для обозначения элемента Z)e, но и для обозначения того подмножества множества J, которое состоит из номеров случайных величин, подлежащих наблюдению в соответ- ствии с решением de. Это нас не приведет к недоразуме- ниям. Если принята решающая функция б s), а х — {х^ — наблюденная выборка, то вероятность выполнения ис- пытания в к шагов при первом шаге, соответствующем dev при втором шаге, соответствующем при /с-м шаге, соответствующем и при окончательном реше-
318 А. ВАЛЬД нии, принадлежащем подмножеству Dl cz D1, дается формулой = d(^|O)d(4|^; di)t>(de3\x-, deudl)... ... 6 (4 I х; di, . .. , dLl) S (ТУ I x; ^, . . ., dl). (1.3) Для случая к =^= 0 правая часть (1.3) сводится к б (5'| 0). Вероятность того же события, когда принята только решающая функция б (z/; $), а наблюденная выборка х не фиксирована и когда F есть истинное распределение, равнах) q (di, . .. ,4, 1 F, 6) = J p (di, ..., dl, ТУ | x, 6) dF(x), M (1.4) где M обозначает полное пространство выборок (т. е. М есть совокупность всех последовательностей х). Таким образом, вероятность того, что окончательное решение окажется элементом Df при использовании б и истинном распределении F, дается формулой P(Z)'|^,6)=2 3 <?(<&..., 4,^1 Л д). (1.5) ,i=0 4..4 Значит, математическое ожидание убытка W (F, d') при использовании б и истинном распределении F равно п (F, d) = $ W (F, d*) dP (D* I F, d). (1.6) Ъ Интеграл в (1.4) имеет смысл только в том случае, когда р (dev . .. , d^, Dl\x, б) есть измеримая функция. Точные условия измеримости, обеспечивающие существование этого интеграла, равно как и интегралов, которые встретятся в дальнейших форму- лах этой главы, будут установлены в главе 3.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 319 Математическое ожидание стоимости испытания при тех же условиях1) есть 00 а=14...,4 м X р (di..... dl. /У| х; б) dF (х). (1.7) Сумма математических ожиданий убытка W (F. d*) и стоимости испытания называется риском. Таким обра- зом, риск дается формулой г (F. 6) = rt (F, б) + r2 (F. б). (1.8) Риск г (F. б) называется простым риском, если соот- ветствующие весовая функция и функция стоимости простые. Представляется целесообразным судить о ценности произвольной данной решающей функции б0 с точки зре- ния индуктивного поведения, всецело на основе свя- занной с ней функции риска г (F. б0). Это уже позволяет частично упорядочить решающие функции по их допу- стимости для индуктивного поведения. Ясно, если цен- ность решающей функции определяется исключительно на основе ее функции риска, то решающую функцию бх следует считать более предпочтительной, чем решающую функцию б2, если справедливы следующие неравенства: г (F. 6Х) < г (F. б2) (1.9) для всех F Q и г (F, 6Х) < г (F, 62) (1.10) хотя бы для одного F е= й. Если оба эти неравенства справедливы, то мы будем говорить, что бх равномерно лучше, чем б2. В качестве иллюстрации рассмотрим кратко следую- щий простой пример. Пусть Хх, Х2,... — независимые х) Формула (1.7) справедлива, если вероятность выполнения испытания за конечное число шагов равна 1. Иначе окажется, что Г2 {F. б) — оо, так как в главе 3 будет принято, что стоимость бесконечно большого числа наблюдений равна оо. Стоимость нуле- вого числа наблюдений принимается равной нулю.
320 А. ВАЛЬД нормально распределенные случайные величины с дис- персией 1 и общим средним 0, значение которого нам неизвестно. Предположим, что пространство D1 окон- чательных решений состоит только из двух элементов d\ и d^, где di есть решение Цринять гипотезу Н о том, что 9 <Z 0, а 4 — решение отвергнуть Н. В этом слу- чае Q является однопараметрическим семейством рас- пределений, так как каждое FeeQ определяется конкрет- ным значением 9. Мы примем, что стоимость испытания пропорциональна числу наблюдений и что весовая функ- ция W (9, d*) задана следующим образом: t (° при 9< р, при 9>р; при 9<^—р, при 9> — р, где р — некоторое фиксированное положительное число Таким образом, в рассматриваемом случае мы имеем простую весовую функцию и простую функцию стои- мости. Рассмотрим теперь конкретные решающие функции бх и б2, определенные так: бх (0) приписывает вероятность 1 элементу de = — (1, 2,..., 9), а бх (а^,..., xQ; (1, 2,..., 9)) приписывает вероятность 1 одному из решений d[ или dl, смотря по тому, будет ли х — у (#! + ... + Хд) 0 или 0; вероятностная мера б2 (0) приписывает вероятность 1 решению de = (1, 2,..., 9), а б2 (^,..., Хд\ (1, 2,..., 9)) приписывает вероятность 1 решениям d^ или d\, смотря по тому, будет ли медиана х выборки Хд) 0 или > °- Таким образом, если принята решающая функция то статистик производит наблюдения xi над (i == 1, 2,..., 9) и принимает Я, если х 0, или отвергает Н, если X 0. Если принято б2, то делаются такие же наблюдения и гипотеза Н принимается, если х 0, и отвергается, если х 0.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 321 Вычислим функции риска, связанные с бх и 62. Пусть G {у) нормальная функция распределения, т. е. у____ G(y) = -±=\e 2 dt. (1.11) Y /Л V Ясно, что вероятность принять окончательное решение d{ при истинном 6 и использовании 6Х определяется через р (4|е, 6Х) = g (-зо), (1.12) а вероятность того же события при истинном 6 и ис- пользовании 62 — через 9 Р (d{ 10, d2) = 2 C’(G (- О,)’ (1 - G (0))Ч (1.13) ;=5 Риск, связанный с (i = l, 2), равен, таким образом, г (6, = $г + Р(4\е, St), 9с, 9С4-Р(4[0, 6{), если 0<^— р, если —р^0^р, если 0^> р, (1.14) где с — стоимость одного наблюдения, а Р — = 1 — Р (4|0, Очевидно, г (0, Sj) = г*(0, 62) при | 0| р. Можно убедиться в том, что г (0, бх) г (0, 62) при [ 01 р. Значит, решение равномерно лучше реше- ния S2. Решающие функции и 62 — классического типа, так как испытания, соответствующие обеим этим функ- циям, выполняются за один шаг. Хотя функция стоимо- сти, принимаемая в этом примере, не зависит от числа шагов, в которое осуществляется испытание, но сведе- ние к риску возможно и в этом случае, если применять решающую функцию, для которой вероятность осуще- ствления испытания более чем за один шаг положи- тельна. Рассмотрим, например, решающую функцию б3, опре- деленную так: S3 (0) приписывает вероятность 1 решению de = (1, 2, 3, 4), б3 (а^, х2, х3, х4; (1, 2, 3, 4)) приписы- 21 Позици иные игры
322 А. ВАЛЬД вает вероятность 1 решению de — (5, 6, 7, 8, 9), если — а<С — (^i + + хз + <С вероятность 1 реше- t 1 нию d1? если (хх + х2 + х3 + я4) — а, и вероят- t 1 ность 1 решению d2, если (хг + х2 + х3 + х4) а, где а — данное положительное число. Положим, далее, б3 (я^,..., Xq-, (1, 2, 3, 4), (5, 6, 7, 8, 9)) = б4 (1, 2,..., 9)). Ясно, что математическое ожидание стои- мости испытания, связанного с б3, будет меньше, чем связанного с б2, причем это существенно для|0|^>&. С другой стороны, если а достаточно велико, то средний убыток W (0, d*) при б3 будет практически совпадать со средним убытком при бР __ 1.2.2. Характеристика действия. ВероятностьР (Dl\F, б) того, что окончательное решение окажется элементом данного подмножества Dl с: D1 при истинном/7 и приня- той решающей функции 6, оказывается, если б фиксиро- вано, функцией двух переменных D1 и F. Для произ- вольного фиксированного б0 назовем функцию Р (Df ( F, б0) характеристикой действия решающей функции б0 от- носительно окончательного решения. Пусть q d{ | F, б) означает q (df,..., dek, Df | F, 6), где q d°, В1\Р,Ь) есть функция, определенная в (1.4). Таким образом, # (df,..., d{ | F; б) есть вероятность при истинном F и принятом б того, что испытание выпол- нится за k шагов, причем первый шаг — в соответствии с df,..., Л-й шаг — в соответствии с df. Для произволь- ного данного б, скажем б0, функция q (df,..., df | F, б0) бу- дет зависеть только от k, d^,..., d^ и F. Эта функция будет называться характеристикой действия решающей функ- ции б0 относительно испытания. Характеристика действия относительно окончатель- ного решения однозначно определяет математическое ожи- дание значения W (F, dl) для произвольной весовой функции W (.F, dz) (см. формулу (1.6)). Характеристика действия относительно испытания однозначно определяет среднюю стоимость испытания для произвольной дан- ной функции стоимости в том случае, когда стоимость
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 3'23 испытания с (х; d{,..., d£) не зависит от х, т. е. когда с (х; = с (di,..., этот случай встречается во многих приложениях. § 1.3. Допустимые решающие функции и полные классы решающих функций Решающая функция 6 называется допустимой, ес- ли не существует другой решающей функции 6*, которая равномерно лучше 6, т. е. если не существует решаю- щей функции 6*, удовлетворяющей следующим двум усло- виям: r(F, б*)< г (F, 6) (1.15) для всех F ее & и г (F, 6*) < г (F, 6) (1.16) хотя бы для одного F е Q. Класс С решающих функций 6 называется полным, если для всякого 8 С можно найти такое б* ЕЕ С, что б* равномерно лучше, чем б. Полный класс С называется минимальным полным классом, если никакой его собственный подкласс не яв- ляется полным. Если минимальный полный класс суще- ствует, то он должен совпадать с классом Со всех допу- стимых решающих функций. Это может быть показано следующим образом. Пусть Ct — минимальный полный класс. Ясно, что Со с: Пусть существует б' ей С'1\С0. Тогда существует решаю- щая функция б", равномерно лучшая, чем б'. Так как Сг есть минимальный полный класс, должно быть б"^ (\. Но тогда найдется такое б'" ЕЕ (\, которое равномерно лучше, чем б", и потому также равномерно лучше, чем б'. Последнее, однако, невозможно, так как Сх есть мини- мальный полный класс. Значит, Сх — С$. Если класс Со всех допустимых функций полон, то он, очевидно, является минимальным полным классом. Так как не существует минимальных полных классов, от- личных от Со, необходимым и достаточным условием суще- ствования минимального полного класса является полно- та Со. 21*
324 А. ВАЛЬД Как будет показано в главе 3, класс Со будет полным при весьма общих предположениях. Исключения по- являются, например, когда пространство D1 неполно в следующем смысле: существует такая последовательность {d*} (i = 1, 2,...), что lim W (F, d\) — W (£), но не сущест- вует такого элемента d\ что W (F, dl) = W (F). Понятия допустимости и полного класса играют перво- степенную роль в теории решающих функций. Они бу- дут изучаться в главе 3. § 1.4. Байесовское решение и минимаксное решение задачи принятия решения 1.4.1. Решающие функции, которые минимизируют некоторый средний риск (байесовское решение). Пусть — борелевское поле подмножеств Q, содержащее все конечные и счетные подмножества Q. Под вероят- ностной мерой £ на Й будем понимать вероятностную ме- ру, определенную для всех элементов Вопрос о вы- боре С& будет рассмотрен в главе 3. Вероятностную меру g на Q будем называть также априорным распределением на Q. Если априорное распределение £ на й существует и известно статистику, то решающая функция, для кото- рой средний риск (средний в смысле априорного рас- пределения S), т. е. $r(F, d)dg = r*(g, б), (1.17) принимает наименьшее значение, может рассматриваться как оптимальное решение. Решающая функция б0, мини- мизирующая г* (|, 6), т. е. решающая функция, для ко- торой г* (L б0) < г* (g, 6) (1.18) при всех б, называется байесовским решением относи- тельно априорного распределения £. Пусть — конкретное априорное распределение, ко- торое приписывает вероятность 1 элементу F ЕЕ Q. Тогда
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 325 мы, очевидно, имеем г (Л 6) - г* (Ef, 6). (1.19) Таким образом, мы можем интерпретировать значение г (F, 6) как значение г* (SF, 6). В дальнейшем мы будем писать г (£, б) вместо г* (£, б), а г (F, б) будет использо- ваться синонимично с г (gF, б). Это может быть сделано без какой-либо опасности недоразумений. Во многих статистических задачах существование ап- риорного распределения не может быть постулировано, а в тех случаях, когда существование априорного распреде- ления можно предположить, оно обычно неизвестно статистику, и поэтому байесовское решение не может быть определено. Основной причиной рассмотрения байе- совских решений здесь является то, что они приводят к некоторым основным результатам главы 3. Там будет показано, что при некоторых весьма слабых условиях класс всех байесовских решений относительно всех воз- можных априорных распределений является полным классом. Пусть (i = 1, 2,...) последовательность ап- риорных распределений и б0 — решающая функция. Бу- дем говорить, что б0 есть байесовское решение относи- тельно последовательности {£J, если lim (inf г б) - г (^, до)) — О, (1.20) г—>оо 5 л где символ inf означает, как обычно, инфимум относи- S тельно б. Мы будем говорить, что решающая функция б явля- ется байесовским решением в узком смысле, если суще- ствует такое априорное распределение £, что б есть байесовское решение относительно Решающая функ- ция б будет называться байесовским решением в широ- ком смысле, если существует последовательность {^} априорных распределений, относительно которой б есть байесовское решение. Одним из основных результатов главы 3 является доказательство того, что при весьма общих условиях класс всех байесовских решений в широком смысле
326 А. ВАЛЬД является полным классом. Там будет также показано, что при некоторых дальнейших ограничениях класс всех байесовских решений в узком смысле также есть полный класс. Рассмотрим следующий простой пример. Пусть Q со- оо стоит из двух элементов 7^ и F2, где/^ = П Л (Ж;) (*= 2), 7=1 а (и) — заданное одномерное распределение с плотно- стью рг (и). Пространство решений £>* состоит из двух элементов d{ и dl, где d{ означает решение принять гипо- тезу, что истинное распределение F есть F^i = 1, 2). Пусть gt — априорная вероятность того, что истин- но (i — 1, 2). Примем, что испытание было проведено в один шаг и состояло из т наблюдений, т. е. что наблюда- лись значения случайных величин Х1,...,Хт. Пусть убы- ток от неверного окончательного решения (т. е. от принятия гипотезы, когда она не является истинной) равен 1. Тогда байесовским решением должна быть ре- шающая функция, заданная следующим образом. После взятия выборки х1,...,хт апостериорная вероятность ги- потезы состоящей в том, что F есть , равна о- — _____________________ъ ™__________ h — | 2) im giPi^i) .. . Pi^m) + gzPz&i) • . . Рг(хт) v Если glm > g2m, то принимаем если gim<g2m, to принимаем Я2; если glm = g2m, то некоторое случайное устройство должно сделать выбор между Н± и Н2. Неравен- ства g2m J| glm эквивалентны неравенствам Р1т %2 где Pim = pt (х^...р{ (хт). Значит, решающее правило может быть сформулировано следующим образом: если --2m j>— , то принимаем Н2: если Z>2W , Pirn F Pirn g2 Я Jr 2т о а „ х; если----= —, то произвольное случаи- Р]т ное устройство делает выбор между Нг и Н2. Пусть бс обозначает указанное байесовское решение при = с.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 327 Из результатов главы 3 будет следовать, что класс всех байесовских решений бс, соответствующих всем неотрицательным значениям с, является полным классом, считая, что испытание ограничивается одним шагом, состоящим из т наблюдений. 1.4.2. Решающие функции, минимизирующие макси- мальный риск (минимаксные решения). Решающая функ- ция б0 называется минимаксным решением задачи при- нятия решения, если она минимизирует максимум г (F, б) относительно F, т. е. если sup г (F, б0) sup г (F, б) (1.21) F F для всех б, где символ sup означает как обычно, супремум F относительной. В общейтеории решающих функций, разви- ваемой в главе 3, большое внимание минимаксному реше- нию уделяется по двум причинам: (1) минимаксное ре- шение представляется, вообще говоря, разумным реше- нием задачи принятия решения, если априорное распре- деление в Й не существует или неизвестно статистику; (2) теория минимаксных решений, играет важную роль в получении основных результатов, относящихся к пол- ным классам решающих функций. Существует тесная связь между байесовскими и ми- нимаксными решениями. В главе 3 будет показано, что при довольно общих условиях минимаксное решение является также байесовским решением. Более точно, минимаксное решение есть при некоторых слабых огра- ничениях решение, байесовское относительно наименее благоприятного априорного распределения. При этом априорное распределение £0 называется наименее бла- гоприятным, если для всех £ имеет место inf г(§0, 6)>inf r(g, б). 8 8 В ряде случаев минимаксное решение может быть легко получено нахождением некоторой априорной ве- роятностной меры и такого байесовского решения г) Более подробно об этом см. в п. 5.1.1.
328 А. ВАЛЬД 6^ относительно g, что sup г (F, 8%) = г (£, б^). Очевидно, б^ является минимаксным решением, а § — наименее благо приятным априорным распределением. § 1.5. Отношение к старым теориям 1.5.1. Проверка гипотезы, рассматриваемая как ча- стный случай общей задачи принятия решения. Под ги- потезой мы понимаем утверждение, что неизвестное рас^ пределение F случайной величины X есть элемент дан- ного подмножества со cz й. При любом непустом со cz Q мы будем через обозначать гипотезу о том, что F £=• со. Задача проверки гипотезы Н является частным случаем общей задачи принятия решения. В случае проверки ги- потезы Н пространство D* окончательных решений со- стоит из двух элементов d{ и где d{ означает решение принять гипотезу Я, а 4 ~ решение ее отвергнуть. Теории проверки гипотез, развитые в течение послед- них тридцати лет Фишером, Нейманом и Пирсоном и их школами, имеют дело почти исключительно со случаем, когда испытания производятся в один шаг, т. е. когда чис- ло и вид наблюдений в течение всего процесса проверки определены заранее (до ее начала). Другими словами, выбор статистика ограничен решающими функциями б, которые удовлетворяют следующему условию: б (De | 0) = 1 и б | z/; — 1 для произвольной последовательности у вещественных чисел и для всякого подмножества cz I. Следует также заметить, что проблема планирования эксперимента в трактовке Фишера [18] и его школы содер- жится как частный случай в нашей формулировке про- блемы принятия решения. Если испытания выполняют- ся в один шаг, то эта проблема планирования сводится к решению (до того, как приступать к испытаниям), сколь- ко наблюдений и какого рода следует произвести в тече- ние всего процесса испытаний. Иными словами, проблема планирования эксперимента сводится к вопросу о вы- боре значения б (0) решающей функции. В качестве ил- люстрации рассмотрим следующий пример.Предположим, что мы интересуемся исследованием урожайности т
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 329 сельскохозяйственных культур г^,..., vm. Предположим также, что для целей испытания доступен участок зем- ли, состоящий из иг2 делянок {/>г} (?, / = 1,..., т), и что каждая культура может быть посажена на любом из уча- стков р{ . Проблема планирования, встающая здесь, состоит в том, как разместить культуры по различным делянкам. Пусть случайная величина Xvii означает урожайность, получаемую с делянки /?i;, если на ней посажена культура vk. Таким образом, всего для нас воз- можны здесь т3 случайных величин X^k (i, j, k — l,...,m). Так как мы можем наблюдать только т2 из них (куль- тура может соответствовать любой делянке), проблема планирования состоит здесь в том, какое подмножество из т2 случайных величин множества {Х^к}, состоящего из т3 случайных величин, мы должны выбрать для наблю- дения. Но это и есть в точности вопрос о выборе значе- ния S (0) принимаемой решающей функцией S. Подмноже- ство 5, содержащее т2 случайных величин из данного множества называется латинским квадратом г), если для произвольных значений любых двух из трех ин- дексов i, j, к существует ровно один элемент XVk из S, соответствующие индексы которого принимают именно эти два значения. Решение проблемы планирования, предложенное Фишером, состоит в случайном выборе латинского квадрата из множества всех возможных ла- тинских квадратов. Каждый латинский квадрат являет- ся, таким образом, элементом de пространства De. Пусть N — общее число возможных латинских квадратов. Тог- да решение Фишера проблемы планирования может быть выражено в наших понятиях и терминах так: мы выби- раем в качестве S (0) распределение вероятностей в De, для которого полагаем 6(de|0) = 1 16 М _ 1-уу"? если а есть латинскии квадрат, 0, если de не является латинским квадратом. г) См., например, Фишер [18]. См. также Холл М., Комби- наторный анализ, пер. с англ., ИЛ, 1963. (Прим, ред.)
330 А. ВАЛЬД Быть может, интересно отметить связь между некоторы- ми понятиями предлагаемой общей теории решения (в приложении к проверке гипотез) и соответствующими понятиями теории Неймана — Пирсона *). Ограничимся для этой цели нерандомизированными решающими функ- циями, в соответствии с которыми испытание выполняет- ся в один шаг путем наблюдения первых N случайных величин последовательности {XJ, так как только этот случай и рассматривается в теории Неймана — Пирсона. В этом случае 6 (0) приписывает вероятность 1 элемен- ту de = (1, 2,..., N) и достаточно определить значение б (х, 5), когда <*? есть множество (1, 2,..., N). Так как б — нерандомизированная решающая функция, a Я* состоит из двух элементов d{ и d2, решающая функция б может быть выражена функцией d xN\ оп- ределенной для всех вещественных чисел х± ,..., х1Ч, и может принимать только значения d{ и d*2 в каждой точ- ке х^). Если xN — наблюденные значения Xi,..., XN соответственно, то мы принимаем проверяе- мую нами гипотезу Я, если d ..., xN) = d{, и отвер- гаем ее, если d(x1,,.t, xN) = d2. В теории Неймана — Пирсона множество всех значений выборки х ~ х^}, для которых мы отвергаем Я, называется критической областью. Таким образом, выбор критической области в теории Неймана — Пирсона эквивалентен в нашей терми- нологии выбору решающей функции. Пусть гипотеза Я, которую мы проверяем, состоит в том, что FgEoj. В тео- рии Неймана — Пирсона вероятность того, что Я от- вергается, когда истинно F, не являющееся элементом со, называется мощностью критической области относитель- но F. Таким образом, мощность есть функция F, опре- деленная для всех F со. Вероятность отвергнуть Я, когда истинно некоторое ^£(0, называется объемом критической области относительно F. Таким образом, объем есть функция от F, определенная для всех F ЕЕ со. Понятия мощности и объема являются частными слу- чаями понятия риска в общей теории решения. г) См., например, [35] и [37].
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 331 Действительно, пусть W (F, dl) определяется следую- щим образом: f 0, если F ЕЕ со, W (F, di) = I j, если р (0. , fl, если F ЕЕ со, W (F. d2) = | о, если Fe£co. Мы видим, что в нашем случае W (F, d2) есть простая ве- совая функция. Мы можем здесь пренебречь стоимостью испытания, так как ограничиваем выбор статистиком ре- шающих функций так, что средняя стоимость испытания есть одна и та же постоянная. Тогда простой риск, соот- ветствующий описанной простой весовой функции, равен объему критической области, если 7^ ЕЕ со, и есть единица минус мощность, если F со. В теории Неймана — Пирсона выбор критической об- ласти подчинен некоторым условиям, налагаемым на функцию объема, вроде того, что функция объема должна быть равна некоторой постоянной а или быть ограничен- ной сверху предписанной постоянной а. Наложение таких ограничений на некоторую часть функции риска может представляться желательным, когда ошибки из-за воз- можного неверного окончательного решения разбиваются на классы ошибок совершенно различного смысла (напри- мер, один тип ошибок может привести к потере жизни, а другой — к материальным потерям). Обитая теория ре- шения, развиваемая в главе 3, остается приложимой так- же и тогда, когда выбор решающей функции подчинен тем или иным ограничительным условиям, налагаемым на вероятности ошибок некоторого типа. Это имеет место благодаря тому, что класс ® решающих функций 5, кото- рым ограничен выбор экспериментатора, не предполагает- ся классом всех решающих функций. Класс S) может быть произвольным классом, удовлетворяющим некоторой си- стеме условий. Эта система условий остается соблюден- ной, если ограничительные условия упомянутого типа на- ложены на функцию риска. В последние годы был развит последовательный методг) проверки гипотезы Н. В этой теории преодолевается огра- !) См., например, [65].
332 А. ВАЛЬД ничение, состоящее в том, что испытание должно выпол- няться в один шаг. Однако в ней предполагается, что (1) всякий шаг испытания состоит из единственного наблю- дения и (2) случайная величина Хг наблюдается на Ем шаге. Первое ограничение еще не приводит к потере общ- ности, если принять, что стоимость проверки зависит лишь от общего числа наблюдений, но не от числа шагов, в ко- торые эта проверка выполняется. Второе ограничение бо- лее серьезно, так как не оставляет свободы выбора для наблюдения случайной величины на каждом шаге испыта- ния. В том частном случае, когда случайные величины Х2, ... независимы и распределены одинаково, второе ограничение также не умаляет общности. 1.5.2. Оценки распределений и интервалов, рассматри- ваемые как частные случаи общей задачи принятия реше- ния. Задача оценки распределения состоит в решении на основе результатов испытаний, какой элемент F ЕЕ Q должен быть взят в качестве оценки истинного (но неизвест- ного) распределения величины X. Пусть d# для всякого F означает окончательное решение принять F в ка- честве нашей оценки истинного распределения. Итак, зада- ча оценки распределения является частным случаем общей задачи принятия решения, характеризуемая тем фактом, что// состоит из элементов dp, соответствующих всем FE& Теория оценок распределений, развитая Фишером и другими, в течение последних тридцати лет1) имела дело почти исключительно со случаем, когда испытания выпол- нялись за единственный шаг путем наблюдения первых N случайных величин в последовательности {XJ. Может оказаться интересным установление связей между некото- рыми понятиями современной теории решения и соответ- ствующими понятиями теории оценок Фишера и его шко- лы. Для этого мы ограничимся нерандомизированными решающими функциями б, в соответствии с которыми ис- пытания производятся в один шаг путем наблюдения зна- чений Хх, ...» Х^. В этом случае нерандомизированная решающая функция б может быть выражена функцией 1)См., например, [15] и [16].
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 333 d (rrx, ..., xN), определенной для всех вещественных зна- чений xlt хм. Для произвольной выборки (х1ч ..., xN) значение d (rq, xN) есть элемент d* EzD1, и статистик принимает окончательное решение d (хх, ..., xN), где хг есть наблюденное значение Хг (г = 1, ...,7V). Мы примем также, что Q является конечно-параметрическим семейст- вом функций распределения F, т. е. что всякий элемент F может быть описан как система конкретных значений ко- нечного числа параметров, скажем 0Х, ..., Qk. Для нашего рассмотрения достаточно будет рассмотреть случай, когда существует только один неизвестный параметр 0. Мы бу- дем пользоваться символом W (9, 0*) для обозначения W (F, dp*), где 9— значение параметра, соответствующее F, а 9* — соответствующее F*. Таким образом, W (9, 9*) есть убыток, имеющий место, когда 9 истинно, а 9* при- нимается в качестве оценки распределения величины 9. Решающая функция d (х±, ..., хм) может быть представле- на такой вещественной функцией 9* ..., xN), что зна- чение 9* (xv ..., xN) принимается как наша оценка распре- деления 9, если х±, ..., хм — наблюденные значения слу- чайных величин Хх, ..., Xn- В теории оценок распределения функции 9*(гг1, ..., хм) также называются оценками. Так как стоимость испытания не зависит от выбора оценки 9* (х1ч ..., хм), мы будем пренебрегать ею при вычислениях риска, связанного с оценкой 9* (я?!, ..., xN), Тогда риск является просто математическим ожиданием величины W (9, 9* (хх, хм)) при истинном 9. Предположим, что W (9, 9*) = (9* — 9)2. Тогда риск является просто вторым моментом оценки относительно истинного значения пара- метра 9. Если 9* (хх, xN) является несмещенной оцен- кой, т. е. если математическое ожидание величины 9* Хм) равно истинному значению параметра9, то риск становится равным дисперсии оценки. Значительная часть литературы об оценках распределений посвящена изучению несмещенных оценок с минимальной дисперсией, которые называются эффективными оценками. Эта теория может рассматриваться как частный случай общей теории решения, когда W (9, 9*) задано как (9* — 9)2. Минималь- ная дисперсия не является единственным возможным кри- терием «наилучшей» оценки. В литературе рассматрива- лись и различные другие определения «наилучшей» оценки.
334 А. ВАЛЬД Большинство этих теорий также может рассматриваться как частные случаи общей теории решения, соответствую- щие некоторым частным способам выбора весовой функ- ции И7 (6, 6*). Например, Питмен [41] рассматривал зада- чу о нахождении оценки 0* (а^, ..., х^), для которой мак- симизируется вероятность того, что | 0* (яд,..., xN) — 0 | с, где с 0г). Это эквивалентно задаче о мини- мизации риска, если W (0, 0*) определить следующим об- разом: ( о 1У(е,е-)= . при | 0 — 0* | с, при | 0 — 0* I J> с. Задача об оценке интервала также является частным: случаем общей задачи решения. Нам достаточно рас- смотреть случай, когда Q является однопараметрическим семейством: функций распределения. Пусть 0 — неизвест- ный параметр. Задача оценки интервала может быть сфор- мулирована следующим образом. Пусть С — данный класс интервалов. Например, С может быть классом всех интервалов, или классом интервалов заданной длины, или классом интервалов, длина которых не превосходит некоторой заданной величины, и т. д. Задача состоит в том, чтобы на основе результатов испытания решить, какой элемент С должен быть принят в качестве оценки интервала 0. Для произвольного элемента I пусть dj означает окончательное решение принять I в качестве оценки интервала 0. Таким образом, задача об оценке интервала является частным случаем общей задачи принятия решения, где D1 состоит из элементов й/, со- ответствующих всем элементам I заданного класса С ин- тервалов. В теории оценок интервалов, развитой Нейманом 2), единственным рассмотренным случаем является тот, когда испытание осуществляется в один шаг путем наблюдения первых N случайных величин последовательности {XJ. Э Питмен [41, стр. 401] называет оценку 9* «лучшей», если ве- роятность неравенства | 0* — 0 | с максимальна для всех положи- тельных с. 2) См., например, [38].
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 335 В этом случае всякая нерандомизированная решающая функция 6 может быть выражена через функцию интерва- ла I (хг, ..., xN), сопоставляющую элемент I еС каждой выборке (#!, xN). Правило тогда состоит в том, чтцбы принять окончательное решение d\ (яь ..., xN), где х±, ... xN — наблюденные значения. Весовая функция может быть представлена как функция W (6, /), зависящая от истинного значения параметра 0 и интервала /, принятого в качестве интервала оценки 0. Мы не обращаем внима- ния на стоимость испытания, так как она не зависит от выбора решающего правила, если испытание выполняет- ся путем наблюдения значений Х1?..., XN за один шаг. Тогда риском, связанным с данной оценкой интервала I является просто математическое ожидание величины W (0, I (Х1?..., XN)). Простой выбор W (0, /) состоит в том, чтобы положить W (0, /) — 1 при 0 е=£ I и W (0, I) = 0 при 0 е= I- Тогда риск, связанный с данной оценкой интервала I (а^,..., xN), равен вероятности того, что интервал I (Xr,..., XN) не покроет истинного значе- ния параметра. Нейман называет интервальную функ- цию I (#!, ..., х^) доверительным интервалом, если веро- ятность того, что I (Х1?..., Хх) покроет истинное значе- ние параметра, равна фиксированному значению у неза- висимо от того, каково истинное значение параметра. Фиксированное число у называется доверительным коэф- фициентом, связанным с доверительным «интервалом I (хг, ..., Если весовая функция W (0, I) определена, как выше, и если I (х±, ..., xN) есть доверительный интер- вал с доверительным коэффициентом у, то риск, связан- ный с I (хг, ..., xN), равен 1 — у. § 1.6. Интерпретация задачи принятия решения как антагонистической игры 1.6.1. Определение антагонистической игры в нормаль- ной форме. Теория игр была развита фон Нейманом [55]. В п. 1.6.3 будет показано, что задача принятия решения может рассматриваться как антагонистическая игра, и поэтому теория таких игр приложима к статистической задаче принятия решения. Точное определение игры было дано фон Нейманом. Мы не будем его здесь приводить, так
336 А. ВАЛЬД i как для целей статистических приложений оказываются достаточными только так называемые игры в нормальной форме. Как было показано фон Нейманом, всякая игра может быть приведена к нормальной форме. Нормальная форма антагонистической игры определяет» ся фон Нейманом так* Имеются два игрока I и II и веще- ственная функция К {а, Ъ) двух переменных а и Ъ, где а мо- жет быть произвольной точкой некоторого пространства Л, а Ъ—произвольной точкой пространства В. Игрок I выби- рает точку аЕ^А, а игрок II — точку ЬеВ, причем каждый из них делает свой выбор независимо от поведе- ния другого. Игрок I выигрывает тогда сумму К (а, Ь), а игрок II — сумму — К (а, &). Очевидно, игрок I стремит- ся максимизировать К (а, &), а игрок II — минимизиро- вать К (а, &). Элемент a Ez А называется чистой стратегией игрока I, а Ъ ЕЕ В— чистой стратегией игрока II. Смешанная стратегия игрока I определяется так: вместо выбора кон- кретного элемента а^А игрок I выбирает вероятностную меру определенную на борелевском теле 21 подмно- жеств А, и точка а выбирается тогда при помощи случай- ного устройства, сконструированного так, что для произ- вольного а ее 21 вероятность того, что выбранный эле- мент а будет содержаться в а, равна £ (а). Аналогично смешанной стратегией игрока II называется вероятност- ная мера ц, определенная на борелевском теле 25 под- множеств В, и элемент Ъ выбирается при помощи случай- ного устройства так, чтобы для всякого Р ЕЕ 55 вероят- ность того, что й ЕЕ Р, была равна ц (Р). Математическое ожидание выигрыша К (а, Ъ) тогда будет К*(Ъ, Т])=$ $A’(a, b)d£dr\. (1.22) В А Мы можем теперь интерпретировать К {а, Ь) как значе- ние X* (£а, г)ь), где и Ць — вероятностные меры, припи- сывающие вероятность 1 соответственно а и Ъ. В дальней- шем мы будем писать К (£, ц) вместо К* (£, ц). Далее, К (а, Ь) будет использоваться как синоним К (Еа, ць); К (а, ц) — как синоним К (£о, ц) и К (g, Ъ) — как сино- ним К (|, ць). Это можно делать, не опасаясь недоразуме-
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 337 ний. Функция К (|, ц) называется функцией выигрыша игры. 1.6.2. Минимаксные, минимальные, максимальные и допустимые стратегии. Стратегия £0 игрока I называется минимаксной стратегией, если infTHSo, ц) (1.23) для всех Аналогично стратегия ц0 игрока II- называется минимаксной стратегиейх), если sup К (g, Цо) < sup К (£, ц) (1-24) £ 5 для всех ц. Минимаксные стратегии играют фундаменталь- ную роль в теории игр двух лиц, как будет показано в гла- ве 2. Стратегия ц0 игрока II называется минимальной отно- сительно стратегии £ игрока I, если К (|, По) = min К (|, и). (1.25) п Ясно, что если ц0 есть минимальная стратегия относитель- но то ц0 является оптимальным способом действий игро- ка II, если игрок I пользуется стратегией £. Стратегия игрока I называется максимальной отно- сительно стратегии ц игрока II, если К (£0, П) = шах К (g, ц). (1.26) £ Если игрок II пользуется стратегией ц, то £0 есть опти- мальный способ действий игрока I. Стратегия ц0 игрока II называется минимальной отно- сительно последовательности {gj (i = 1,2, ...) стратегий игрока I, если lim (А (^, цо) - inf К ц)) = 0. (1.27) г-*оо 71 Аналогично определяется максимальная стратегия £0 игро- ка I относительно последовательности {тц} стратегий иг- рока II. 2) В современной литературе по теории игр такие стратегии игрока II принято называть максими иными. (Прим, перев.) 22 Позиционные игры
338 А. ВАЛЬД Стратегия ц называется минимальной в узком смысле, если существует такая стратегия £ игрока 1, что страте- гия ц минимальна относительно Стратегия ц называется минимальной в широком смысле, если существует такая последовательность {EJ стратегий игрока I, что ц мини- мальна относительно Аналогично определяются максимальные стратегии в узком и широком смысле. Стратегия т)! игрока II называется равномерно лучшей, чем стратегия ц2, если К (I, Л1) < К (L ц2) (1.28)- для всех стратегий £ и если при этом thX^Q, Л2) (1.29) хотя бы для одной стратегии Аналогично стратегия игрока I называется равномерно лучшей, чем стратегия если К (£г, ц) > К (£2, ц) (1.30) для всех т] и если при этом к а1,\)>^(ич) (i.3i) хотя бы для одной стратегии ц. Стратегия £ игрока i (i = I, 11) называется допусти- мой, если не существует стратегий игрока i равномерно лучших, чем £. Класс С стратегий игрока i (г = I, II) называется полным, если для всякой стратегии, не принадлежащей С, существует стратегия из С, которая равномерно лучше. 1.6.3. Задача принятия решения, рассматриваемая как антагонистическая игра. В задаче принятия решения статистик стремится минимизировать риск г (F, б). Риск, однако, зависит от двух переменных F и б, а статистик может выбирать только решающую функцию, но не истин- ное распределение F. Истинное распределение F выбира- ется, так сказать, природой, а выбор природы статистику неизвестен. Значит, возникающая здесь ситуация весьма похожа на ситуацию в антагонистической игре. В самом деле, задача принятия решения может быть интерпретиро- вана как антагонистическая игра, если установить следую- щее соответствие.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 339 Антагонистическая игра Игрок I Игрок II Чистая стратегия а игрока I Пространство А чистых страте- гий игрока I Чистая стратегия Ь игрока II Пространство В чистых страте- гий игрока II Выигрыш К (а,Ъ) Смешанная стратегия g игрока I Смешанная стратегия т) игрока II Выигрыш К (£, я) Минимаксная стратегия игро- ка II Минимаксная стратегия игро- ка I Минимальная стратегия игрока! I Допустимая стратегия игрока II Задача принятия решения Природа Статистик Выбор природой истинного рас- пределения F Пространство Q Выбор решающей функции 6 статистиком Пространство 3) всех возмож- ных решающих функций 6 Риск г (F, 6) Априорное распределение £ в Q Вероятностная мера ц, опреде- ленная на борелевском теле под- множеств пространства г(?’ Минимаксное решение задачи принятия решения Наименее благоприятное апри- орное распределение в Q Байесовское решение Допустимая решающая функция Представляется возможным ограничиться рассмотре- нием только нерандомизированных решающих функций как чистых стратегий статистика. Выбор пространствен- ной меры (смешанной стратегии) в пространстве всех не- рандомизированных решающих функций, как это может быть показано, эквивалентен выбору некоторой рандоми- зированной решающей функции S. Для целей развития общей теории, как это сделано в главе 3, представляется, однако, более удобным рассматривать сами рандомизиро- ванные решающие функции как чистые стратегии. При этом для статистика окажется возможным не рассматри- вать вовсе смешанные стратегии, ибо, как будет показано в главе 3, выбор вероятностной меры ц в пространстве 3) эквивалентен выбору определенного элемента 3 Е ®. Аналогия между задачей принятия решения и антаго- нистической игрой представляется полной во всех отно- шениях, кроме одного. Если ясно, что статистик стремится 22*
340 А. ВАЛЬД минимизировать риск r(F, 6), то едва ли мы можем сказать, что природа желает максимизировать г (F, 6). Тем не менее, поскольку выбор природы статистику неиз- вестен, быть может, не лишено основания, чтобы статис- тик вел себя так, как будто природа желает максимизиро- вать риск. Однако, даже если и не стоять на такой точке зрения, теория игр все-таки сохраняет фундаментальную важность для задачи статистического решения, потому что, как это будет показано в главе 3, эта теория приво- дит к основным результатам, касающимся допусти- мых решающих функций и полных классов решающих функций. Теория антагонистических игр была развита фон Ней- маном для случая конечных пространств А и 5, т. е. для того случая, когда оба игрока имеют в своем распоряжении только конечное число стратегий. В задачах статистичес- кого решения, однако, соответствующие пространства Q и 2) имеют, вообще говоря, бесконечное множество эле- ментов. В следующей главе теория антагонистических игр распространяется на случай, когда игроки имеют в своем распоряжении бесконечно много стратегий. § 1.7. Замечания о некоторых идеях и результатах предлагаемой теории Около десяти лет тому назад разработанные статисти- ческие теории, кроме некоторых отрывочных результатов, были ограничены двумя важными направлениями: (1) рас- сматривались только такие решающие функции, для кото- рых испытание осуществляется за один шаг; (2) задача принятия решения была ограничена задачей проверки гипотез и задачей оценки распределения и интервала. Среди немногих ранних результатов, не связанных огра- ничением (1), может быть указан метод двойной выборки Доджа и Ромига [14]. В соответствии с их схемой реше- ние о том, производить или нет вторую выборку, прежде чем выносить окончательное решение, зависит от исхода наблюдения над первой выборкой. Потребность в много- шаговом испытании обнаружилась задолго до того, как появилась какая-либо систематическая теория, рассмат- ривающая такие испытания. Это было убедительно показа-
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 341 но в практике прошлого при проектировании длительного испытания, состоящего из нескольких последовательных шагов. Весьма интересным примером такого рода являет- ся серия выборок переписи площадей, занятых под джут в Бенгалии, выполненная под руководством Махаланоби- са [31]. При этом брался ряд предшествующих выборочных переписей, и информация, содержащаяся в этих выбор- ках, использовалась для проектирования окончательной выборки из всех площадей, занятых под джут. Возможность распространения теории проверки гипо- тезы Н путем допущения трех окончательных решений: принятия Н, непринятия Н и отсутствия определенного выбора между Н и не-Я—рассматривалась фон Нейманом и Пирсоном [34] еще в 1933 г. «Решающий» характер испы- тания и процедуры оценки был подчеркнут фон Нейманом, назвавшим принятие частного испытания для процедуры оценки «индуктивным поведением»1). Основные идеи общей теории нерандомизированных решающих функций, когда испытания осуществляются за один шаг и когда пространство D1 окончательных ре- шений является произвольным пространством, были впер- вые обрисованы автором в статье 1939 г. [56]. В этой статье были введены понятия весовой функции и функции риска 2) и изучалась природа байесовского и минимаксно- го решений. Результаты этой статьи были существенно рас- пространены, и в 1945 г. была обнаружена связь с теори- ей игр [59], однако предположение об одношаговости испытания еще оставалось. Существенный прогресс в теории многошаговых испы- таний был достигнут в течение второй мировой войны в свя- зи с развитием последовательного анализа 3). Эта теория имеет дело главным образом с задачей проверки гипотезы (D* содержит только два элемента) без определения верх- т) См., например, [38]. 2) Идея приписывания веса различным неверным решениям рас- сматривалась уже фон Нейманом и Пирсоном в 1933 г. [34]. Принцип минимакса также упомянут в [34] как возможный подход к задаче принятия решения. 8) См., например, [48] и [65].
342 А. ВАЛЬД него предела числа шагов в испытании. Принималось, однако, что i-й шаг испытания состоял из единственного наблюдения над Xi (i = 1, 2, ...). Итак, если испытания осуществлялись в п шагов, то они состояли в наблюдении над Xt, ..., Хп. Число шагов испытания, конечно, являет- ся случайной величиной, так как оно зависит от полу- ченных наблюденных значений. Основная часть теории состоит в развитии так называемого последовательного ме- тода отношения вероятностей, частного последовательного метода проверки гипотез. Статьи, посвященные дальней-, шему развитию последовательного анализа, были опубли- кованы в течение последних нескольких лет рядом авторов в США и Англии; отметим Анскомба [2], Эрмитажа [3], Бернарда [6], Бартлетта [8], Блекуэлла [10—12], Бюрма- на [13], Гиршика [19—21], Мостеллера [21], Сэвиджа [46], Штейна [49—52], Штокмана [53], Вальда [57, 60— 71] и Вольфовица [69, 71, 73—75]. Очень интересная статья Бартки [7] может рассматри- ваться как предшественница последовательного анализа. В этой статье схема многократной выборки применяется для прдверки среднего и биномиального распределения. В 1945 г. Штейн [49] опубликовал в высшей степени интересную работу о двойной выборке для получения до- верительного интервала фиксированной длины для мате- матического ожидания в случае нормального распределе- ния при неизвестной дисперсии. Его метод особенно интересен, так как доверительные интервалы фиксирован- ной длины не могут быть получены при помощи какого-ли- бо метода с однократной выборкой. Концепция полного класса решающих функций была введена Леманом, и первые результаты, относящиеся к таким классам, принадлежат ему [30]. Он получил ми- нимальный полный класс решающих функций в следую- щем частном случае: случайные величины Х±, ..., Хп име- ют совместную плотность вероятности / (а^, ..., хп, 0), ко- торая известна с точностью до значения одного параметра 0 (т. е. Q есть однопараметрическое семейство распреде- лений). Испытания производятся в один шаг путем наблю- дения значений Х1Ч ..., Хп. Функция f (хг, ..., хп, 0) удов- летворяет, по существу, условиям, указаннымфон Нейма- ном [37] для обеспечения существования равномерного на-
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 343 иболее мощного несмещенного критерия (условия вклю- чают выполнение некоторого дифференциального равенст- ва относительно функции / (#1, хп, 0)). Рассматривается задача проверки гипотезы о том, чтоб равно заданному 0о. Вскоре после того, как появилась статья Лемана, автор получил общие результаты, относящиеся к полным классам решающих функций, в трех последовательных ра- ботах [66, 67, 70], первая из которых рассматривает не- последовательный случай, а вторая и третья — последова- тельный. Было показано, что при весьма общих условиях класс всех байесовских решений является полным. Общая теория непоследовательных решающих функций содержится в статье автора [59] и распространяется на последовательный случай в двух последовательных статьях от 1947 г. [67] и 1949 г. [70]. Эти статьи рассматривают общую задачу принятия решения, где испытание может выполняться в произвольное число шагов, однако пред- полагается, что i-й шаг испытания состоит из единствен- ного наблюдения над случайной величиной Штейн [52] впервые сформулировал модель статисти- ческой решающей процедуры, включающей планирование эксперимента (выбор подлежащих наблюдению случайных величин), как часть задачи принятия решения. Его схема, однако, ограничена в нескольких отношениях. Простран- ство Q и пространство D* окончательных решений предпо- лагаются конечнымих). Кроме того, предполагается фиксированным верхний предел для общего числа наблюде- ний, которые могут быть произведены. Задача, рассмот- ренная Штейном, связана с задачей, рассматриваемой в на- стоящей книге, однако отличается от нее и является более частной. Он ограничивается задачей нахождения решаю- щей функции, оптимальной в том смысле, что при некото- рых, посторонних для существа дела условиях, налагае- мых на вероятности вынесения неверного решения, эта функция минимизирует математическое ожидание стои- мости испытания, если истинным распределением являет- ся конкретный элемент FQ е= Q. Основной его результат !) В действительности не предполагается, что Q конечно, но тео- рия, развитая Штейном, такова, что в ней участвует лишь конечное число элементов Q, а остальная часть пространства Q не принима- ется во внимание.
344 А. ВАЛЬД состоит в указании достаточных условий для того, чтобы решающая функция была оптимальной в этом смысле. Вопрос о том, когда решающая функция этим условиям удовлетворяет, он оставляет открытым. В ряде частных случаев, однако, он доказывает, что такие решающие функции существуют. Настоящая книга выросла в значительной степени из нескольких предшествующих статей автора об общей тео- рии решающих функций [59, 66, 67, 70] и содержит су- щественное распространение и обобщение идей и резуль- татов, изложенных в этих статьях. В частности, отброше- но ограничение, состоящее в том, что i-й шаг испытания состоит из единственного наблюдения над это дает воз- можность рассматривать планирование эксперимента как вариант задачи принятия решения. г л а в А 2 АНТАГОНИСТИЧЕСКИЕ ИГРЫ С БЕСКОНЕЧНЫМ МНОЖЕСТВОМ СТРАТЕГИЙ § 2.1. Условия полной определенности игры 2.1.1. Проблема полной определенности игры и введе- ние естественной метрики. Распространяя сформулиро- ванное фон Нейманом для конечных пространств страте- гий определение на произвольный случай1), мы будем говорить, что игра является вполне определенной, если sup inf К (£, ц) = inf sup К (£, ц), (2.1) £ -п ti £ где символ sup означает супремум по £, a inf — инфимум £ 71 по ц. Общее значение левой и правой частей этого равенст- ва называется значением игры. Вопрос о полной определен- ности игры имеет в теории игр большое значение по сле- дующим причинам. Если игра является вполне опреде- ленной и оба игрока пользуются минимаксными страте- гиями (если, конечно, такие стратегии существуют), то ни один из игроков не может улучшить свое положение в игре за счет выяснения стратегии своего противника; иными г) См. раздел 14.5.1 в [55].
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 345 словами, ни один из игроков не получает какого-либо моти- ва для отказа от собственной минимаксной стратегии, даже если он точно узнает стратегию противника. Таким образом, для вполне определенных игр использование минимаксных стратегий создает вполне стабильное поло- жение и минимаксные стратегии можно считать хорошими стратегиями. С другой стороны, если равенство (2.1) не имеет места, то такого стабильного положения не сущест- вует, т. е. независимо от выбора игроками своих стратегий хотя бы один из них может улучшить свое положение в игре, узнав стратегию своего противника. Основная теорема, доказанная фон Нейманом1), утвер- ждает, что если пространства Л и В чистых стратегий игро- ков конечны, то равенство (2.1) всегда соблюдается, т.е. игра всегда является вполне определенной. Игра с бесконечным числом стратегий, однако, может уже не быть вполне оп- ределенной, как это видно из следующего простого приме- ра. Пусть А и В являются каждое множеством всех нату- ральных чисел. Положим К (а, Ь) = 1, О, —1, если а &, если а = Ь, если а<^Ь, Можно легко проверить, что для этой игры sup inf К (^, ц) = — 1 и inf sup К (5, rj) = 1. £ V) -П 5 Таким образом, равенство (2.1) здесь не имеет места. Необходимые и достаточные условия полной определен- ности игры были приведены автором в работе [58] для случая, когда пространства А и В состоят из счетного мно- жества элементов. Частный случай пространств, с конти- нуальным множеством элементов рассматривался Вил- лем в работе [54]. Он рассматривал случай, когда А и В являлись ограниченными замкнутыми интервалами на вещественной оси, а К (а, Ь) — непрерывной функцией а и Ъ. Он доказал, что в этом случае игра также оказыва- ется вполне определенной. Более общий результат был Ч См. раздел 17.6 в [55].
346 А. ВАЛЬД получен автором позднее в работе [67]. Условия полной определенности, которые приводятся здесь в пн. 2.1.3, 2.1.4 и 2.1.5, несколько выходят за рамки ранее опубли- кованных результатов. Для того чтобы придать точный смысл соотношению (2.1) в случае бесконечных пространств А и В, определим борелевское тело 91 тех подмножеств пространства А и борелевское тело 93 тех подмножеств пространства В, для которых определены соответственно вероятностные меры £ и т]. Мы определим борелевские тела 91 и 93 при помощи естественной метрики в пространствах А и В. (Естест- венное) расстояние б а2) между двумя элементами аг и а2 из А определяется посредством равенства б (аь а2) = sup | К(ai, b) — К (a2t b) |. (2.2) ъ Аналогично естественное расстояние между двумя элемен- тами Ь± и 62 из В определяется соотношением *) б (Ьъ 62) = sup | К (a, bi) — К (а, 62) |- (2.3) а Введенное в А, так же как ивВ, расстояние удовлетво- ряет аксиоме треугольника* 2), однако может оказаться, что два различных элемента А или В имеют между собой расстояние нуль. В этом случае мы можем заменить перво- начальные пространства А и В пространствами А* и 5*, определенными следующим образом. Введем для каждого элемента йеА множествоаа всех элементов А, отстоящих от элемента а на расстоянии 0. Очевидно, для различных а2 Ez А множества аЛ1, ааз либо не пересекаются, либо совпадают. Пространство А* оказывается тогда прост- ранством всех подмножеств вида аамножества А. Пусть а* иа2 — два различных элемента А*. Тогда в А найдутся * * такие два элемента и а2, что = ай1, а2 = аа2, и мно- г) Аналогичное определение расстояния, порожденное некото- рой функцией двух переменных, использовалось Хелли в [24] в связи с линейными пространствами. Он называл его «полярной функцией расстояния». 2) Говорят, что 6 удовлетворяет неравенству треугольника, если для произвольных трех точек пространства а±, а2и as имеет ме- сто неравенство б (ai, а2) + б (а2, а9) о (аг, а3).
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 347 жества аО1 и аа2 не пересекаются. Положим 6 (а*, а*) = = б (a1? а2). Пространство В* и метрика в нем определя- ются аналогичным образом. Расстояние между двумя раз- личными элементами А* или В* всегда положительно. В теории игр приходится иметь дело только с пространст- вами А* и В*. В дальнейшем мы будем считать, что любые два различных элемента А или В отстоят друг от друга на положительном расстоянии1). Принятие этого предполо- жения не означает потери общности, так как пространства А и В всегда могут быть заменены соответственно на про- странства А* и В*. Таким образом, расстояния, определяе- мые формулами (2.2) и (2.3), определяют в пространствах А и В метрики. Определения расстояний, приведенные в соотношениях (2.2) и (2.3), можно распространить на пространства сме- шанных стратегий. Положим б (51, 52) - sup IК (L, П) - К (g2, 1]) I (2.4) И 6 (Пх> Пг) = sup | К (£, тп) — К (£, г|2) |. (2.5) £ Особенный интерес представляют борелевские тела 911 и Я5Х, где 9k означает наименьшее борелевское тело под- множеств А, содержащее все открытые в смысле метрики (2.2) подмножества А, а — наименьшее борелевское тело подмножеств 5, содержащее все открытые подмноже- ства множества В. Ясно, что все счетные подмножества А и В являются элементами соответственно 911 и 951. Из сказанного в п. 2.1.4 будет видно, что если простран- ство А или В сепарабельно в смысле своей естественной метрики, то рассмотрение всякого борелевского тела под- множеств 91 (соответственно 35), отличного от 9k (9&i), будет лишено интереса. Однако для несепарабельных про- странств стратегий рассмотрение борелевских тел, от- личных от 9k и 35г, может оказаться полезным, как это будет следовать из сказанного в п. 2.1.5. Когда далее мы 2) Это предположение соответствует идентификации действий, приводящих во всех условиях к одинаковым последствиям, причем в данном случае последствия вполне определяются выигрышем. (Прим, перев.)
348 А. ВАЛЬД будем говорить о некотором подмножестве А (или 5), мы всегда будем понимать под этим один из элементов борелев- ского тела 31 (соответственно 53). Пусть 910 — наименьшее борелевское тело, содержа- щее все счетные подмножества Л, и пусть 53О — наимень- шее борелевское тело, содержащее все счетные подмно- жества В. Мы будем рассматривать только такие борелев- ские тела 91 и 53, которые содержат в качестве подтел соответственно тела Э10 и Всякая теорема или лемма, установленная в этой главе, предполагается справедливой для 31 = 91х и *55 = 95!, если только не оговорено противное. Пусть С — А X В — декартово произведение прост- ранств А и 51), и пусть (5 обозначает наименьшее борелев- ское тело подмножеств С, содержащее декартово произве- дение каждого из элементов 91 на каждый из элементов 55. Здесь мы ограничимся играми, для которых функция выигрыша К (а, Ъ) является ограниченной ©-измеримой функцией а и Ь. В следующем пункте мы докажем несколь- ко лемм, которыми воспользуемся в дальнейшем для выво- да условий полной определенности игры. Интерестно отметить, что если 31 = 911, 53 = 55i и одно из пространств А или В сепарабельно, то функция К (а, Ь) всегда ©-измерима. Например, пусть А сепарабельно, а у есть подмножество С, содержащее все те точки (л, Ь), для которых К (а, Ь) г, где г — заданное вещественное чис- ло. Покажем, что у ЕЕ ©• Пусть а — подмножество А, состоящее из всех точек а, для которых существует такой элемент Ъ ЕЕ В, что (а, Ь) ЕЕ у. Ясно, что а является откры- тым подмножеством А. Пусть S(a, р) обозначает для любого положительного р замкнутую сферу в Л с центром в а и радиусом р, т. е. S (а, р) есть совокупность всех точек а', расстояние которых от а не превосходит р. Для произ- вольного подмножества a' cz а пусть |3 (а') есть множество всех таких точек Ь ЕЕ В, для которых декартово произведе- ние а' X Ъ является подмножеством множества у. Ясно, что для всяких аир, для которых S (а, р) с: а, множество Р (5 (а, р)) является открытым. Пусть а* — счетное мно- жество, плотное в а. Рассмотрим подмножество у* cz С, х) См. стр. 82 работы [44].
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 349 определенное равенством Т*=2(6’(а,р)хР(5(а,р))), а, Р где суммирование производится по всем парам (а, р), для которых а ЕЕ а*, р рационально, a S (а, р) является под- множеством а. Так как для каждой пары (а, р) множество 5 (а, р) X Р (8 (а, р)) принадлежит ©, множество у* также является элементом Очевидно, у* содержится в у. Покажем теперь, что у* = у. Пусть (а0, bQ) ЕЕ у. Нам остается доказать только, что (а0, &0) ЕЕ у*. Очевидно, существует такое положительное р0, что 8 (а0, р0) х X 8 (Ьо, р0) является подмножеством у, где S (Ь, р) обоз- начает замкнутую сферу в В с центром в Ъ и радиусом р. Следовательно, существуют такой элемент ЕЕ а* и такое рациональное положительное число р1? что S (а1? pj cz cz S (a0, p0) и aQ EE 8 (ax, p^. Очевидно, множество 5 (a, px) X P (8 (a19 рч)) содержит точку (a0, &0). Так как 8 (ai> pi) X P (8 (alf px)) является подмножеством у*, точка (а0, 60) должна быть элементом у*. Это завершает доказательство нашего утверждения, что функция К (а, Ъ) является ©-измеримой, если одно из пространств А или В сепарабельно. 2.1.2. Некоторые леммы. В дальнейшем символ будет обозначать для всякого подмножества a cz Л вероят- ностную меру £ на Л, для которой % (а) =1. Аналогично цз будет обозначать для каждого Р cz В вероятностную меру ц на 5, для которой ц (Р) =1. Докажем следующую лемму. Лемма 2.1. Пусть {aj (j = 1,2,...) — последова- тельность таких подмножеств множества Л, что щ cz cz ai+1 ua = U Тогда имеет место равенство 2=1 lim sup inf К (£a., ц) = sup inf К (£a, ц). (2.6) 2—*OO £a, 7] £ 7] '2 a Доказательство. Очевидно, при i -> оо пре- дел sup inf А(£а.,ц) существует и не может превосхо- £а. Ч ’
350 А. ВАЛЬД дить величину правой части (2.6). Положим lim sup inf К (Ц, ц) = р (2.7) i-*oo £а. Ш г И sup inf К (got, т|) = р + 6 (д>0). (2.8) £а 71 Допустим, что 6 0. Тогда существует такая вероятност- ная мера на А, что Ш-П)>р + 4 (2.9) для всех т]. Пусть — вероятностная мера, определен- ная следующим образом: для каждого a* cz щ мы пола- гаем £,<“*) = Жг <2Л0) Тогда, поскольку lim g* (ос\ <*$) = 0, а функция К {а, Ь) г—>оо равномерно ограничена, мы имеем ИтЛ^°{)-П) = Ш,'П) (2.И) г—>оо равномерно по всем ц. Значит, для достаточно большого i имеет место неравенство inf 7<(й{, п)>р+4-« (2.12) Это, однако, невозможно ввиду соотношения (2.7). Поэто- му S — 0, и лемма 2.1 доказана. Если поменять игроков ролями, то лемма 2.1 окажется переформулированной следующим образом. Лемма 2.2. Пусть {|3J (г = 1, 2, ...) — последова- тельность таких подмножеств множества Б, что cz с pi+1 и р = и Рй Тогда lim inf sup К (g, = inf sup К (g, i] ). (2.13) i-*oo £ ^3 £
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 351 Докажем теперь следующую лемму. Лемма 2.3. Неравенство sup inf К (£, ц) inf sup К (£, ц) (2.14) S 7J 7] £ всегда имеет место. Доказательство. Очевидно, имеет место не- равенство К& ц)< sup (g, ц). (2.15) £ Следовательно, inf К (£, ц) < inf sup К (g, ц). (2.16) 7) f\ E, Это дает нам sup inf К (g, т]) < inf sup К (§, ц), (2.17) 5 7) 7) E, и наша лемма доказана. Доказательство это по существу то же самое, какое было дано фон Нейманом [55] для слу- чая конечных пространств А и В. Лемма 2.4. Если существует такое подмножество a cz Л, что supinf #(£а, ц) = inf sup К (£, ц), (2.18) £а 7] 7] £ то игра является вполне определенной. Доказательство. Предположим, Ато сущест- вует подмножество а с Л, для которого имеет место (2.18). Очевидно, sup inf К (g, ц) > sup inf К (ga, ц). (2.19) 5 7) ?а 71 Отсюда и из соотношения (2.18) мы получаем sup inf К (с, ц) > inf sup К (£, ц). £ 71 71 £ (2.20) Из леммы 2.3 следует, что в (2.20) должен иметь место знак равенства, и лемма доказана. Меняя игроков ролями, мы получаем следующую лемму.
352 А. ВАЛЬД Лемма 2.5. Если существует такое подмножество Р cz В, что inf sup К (£, t] ) = sup inf К (£, Tj), (2.21) £ -n то игра вполне определена. 2.1.3. Случай, когда пространство стратегий одного из игроков условно компактно. Мы рассмотрим сейчас слу- чай, когда одно из пространств А или В условно компакт- но в смысле естественной метрики, заданной одним из соотношений (2.2) или (2.3). Метрическое пространство С называется условно компактным, если всякая последо- вательность {ci} (i =1,2, ...) элементов С имеет подпо- следовательность Коши, т. е. подпоследовательность {с^} с тем свойством, что lim d(Ci. , q. ) = 0, jl, J2->OO где 6 (ck, Ci) обозначает расстояние между точками ck и Ci х). Теорема 2.1. Если одно из пространств А или В условно компактно, то условно компактны оба эти про- странства. Доказательство. Предположим, что прост- ранство А условно компактно. Тогда для каждого 81 О существует конечное подмножество а множества А, ег плотное в А. (Подмножество а называется ь-плотным в А, если для каждой точки а Е А существует такая точка а ЕЕ и, что б (а, а') 8.) Если мы заменим пространство А его ерплотным подмножеством а, то метрика в про- странстве В в смысле соотношения (2.3) изменится. Пусть ба(6х, b2) обозначает новое расстояние, если А заменено на а. Так как множество а конечно, из определения ба (6Х, Ь2) следует, что для всякого е2 0 существует конечное под- множество Р (82) множества В, которое е2-плотно в В в смысле метрики ба (6Х, 62). Очевидно, 1 б (^, 62) - ба (6П Ъ2) | < 2ег (2.22) Следовательно, множество р (s2) должно быть (s2 4- 2) Или, иными словами, подпоследовательность, сходящуюся в себе. (Прим, иерее.)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 353 плотным в В в смысле первоначальной метрики. Так как числа и 82 можно выбрать произвольно малыми, мы на- ходим, что для каждого б О существует конечное под- множество р cz В, которое б-плотно в В в смысле перво- начальной метрики б 62). Но это равносильно услов- ной компактности * х), и теорема 2.1 доказана. Теорема 2.2. Если одно из пространств А или В условно компактно, то игра вполне определена. Доказательство. Предположим, что простран- ство А условно компактно. Тогда в соответствии с теоре- мой 2.1 пространство В также условно компактно. Пусть е — некоторое положительное число. Ввиду условной / компактности пространств А и В мы можем разбить А и В на конечное число непустых попарно не пересекающихся множеств, диаметр которых не превосходит 8. Пусть А19 ..., Ак — непустые множества для A, a В19 ..., Bt — для В, удовлетворяющие этим двум условиям, т. е. к I А = и А. В = U Bjt (2.23) 2=1 j=l множества ..., Ак, В19 ..., Bi попарно не пересекаются и диаметр каждого из них не превосходит 8. Пусть а^ — некоторая точка из Ait а Ь~ из В; (i — 1, ...,&; / = 1, ...,Z), и пусть а обозначает конечное множество {а-^ ..., ак}, а Р — конечное множество {Ьг, ..., bt}. Поставим в соответ- ствие каждой вероятностной мере £° на А вероятностную меру положив Й (а$) = £° (А^) (i =1, ...?&). Анало- гично поставим в соответствие всякой вероятностной мере т]° на В вероятностную меру т$, определенную как т)з (bj) = т)° (Bj) (j =1, I). При этом мы имеем для всех т] |Я(£0, П)1<6 (2.24) и для всех g 1#(L 7]°) - К (ё, ц|)Ке- (2.25) Из формулы (2.24) без труда выводится, что sup inf К (g, ц) — 8 < sup inf К (ga, ц) < sup inf К (£, ц). 5 -Л 5a V 5 *1 (2.26) х) См., например, стр. 143 в [23]. 23 Позиционные игры
354 А. ВАЛЬД Из формулы (2.25) получаем, что sup inf К (£я, л) < sup inf К (£«, л<з) < 5а *1 5а Пр <sup inf К (la, л) + е. (2.27) Е, -П. Из уравнений (2.26) и (2.27) следует, что sup inf К (I, л) — е < sup inf К (L, р ) < 5 fl «а sup inf К (la, Л) + е- (2.28) Е ч ’ Аналогичным образом можно получить неравенство inf sup К (I, л) — е < inf sup К (I , л„) < Ч 5 4g Еа * inf sup К (I, р) + е. (2.29) На основании теоремы фон Неймана для конечных j пространств имеем I sup inf К (1а, Лд) = inf sup К (1а, л„). (2.30) Ввиду того, что s может быть взято сколь угодно малым, теорема 2.2 следует из формул (2.28), (2.29) и (2.30). В заключение этого пункта мы докажем несколько теорем, относящихся к изменению значения игры, если заменить первоначальные пространства А и В некоторыми их подмножествами соответственно аир. Далее, для вся- кого подмножества а с А и всякого подмножества р cz В игрой относительно (а, Р) будем называть игру, которая получается при замене пространств А и В соответственно ; на а и р. Мы будем предполагать, что борелевские тела 21 и 23 остаются при этом без изменений1). Таким образом, замена А (5) на а (р) означает просто, что игрок I (II) мо- « жет воспользоваться любой вероятностной мерой % (?]), определенной на тех элементах 21 (25), для которых > I (а) (Л (0)) равно 1. ! Теорема 2.3. Если одно из пространств А или В условно компактно, то для произвольного 8 0 сущест- *) Это равносильно требованию, чтобы а£?21 и £(=25. [Прим, перев.)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 355 вует такое конечное подмножество ас А и такое конеч- ное подмножество |3 cz В, что значение игры относительно (А, В) отличается от значений каждой из игр относитель- но (а, В), (Л, Р) и (а, Р) не более чем на е. Доказательство. Пусть подмножества А19 *..., Лл и В19 ..., Bi выбираются, как и при доказательстве тео- ремы 2.2. Пусть, таким образом, а = {аь ..., ак} и р = == {&г, ..., bi}, где «{еЛ{ и 6; ее В,. Из формулы (2.26) и теоремы 2.2 следует, что значение игры относительно (а, В) отличается от значения игры относительно (Л, В) не более чем на а. Аналогично выводится, что значение игры относительно (Л, Р) отличается от значения игры относи- тельно (Л, В) не более чем на 8. Неравенство (2.28) и теорема 2.2 показывают, что это же справедливо и для игры относительно (а, Р). Этим теорема доказана. Т е о р ем а 2.4. Если одно из пространств, например А, конечно, то для любого е О существует такое конеч- ное подмножество Р cz В, что число точек, содержащихся в р, не превосходит числа точек, содержащихся в А, а зна- чение игры при замене В на Р изменяется не более чем на е. Доказательство. На основании теоремы 2 3 существует такое конечное подмножество Р* cz В, что при замене В нар* значение игры изменяется не более чем на е. Если Р* содержит больше точек, чем А, то, в соответст- вии с теоремой Капланского [27], мы можем заменить р* на такое подмножество р cz: Р*, что значение игры относи- тельно (А, Р) будет то же, что и относительно*(Л, р*), где Лир состоят из одинакового числа элементов. Это дока- зывает следующую теорему. Теорема 2.5. Если одно из пространств, например Л, состоит из т точек (т<^оо) и если В компактно, то существует такое конечное подмножество Р tzz В, что Р содержит не более т точек и значение игры при замене В на Р не изменяется. Доказательство. Пусть {ej (i =1,..., п) яв- ляется последовательностью таких положительных чисел, что lim 8i = 0. 1—>ОО На основании теоремы 2.4 существует такое Р$ cz В, что р$ содержит не более т точек и значение игры при замене 23*
356 А. ВАЛЬД В на 0$ изменяется не более чем на е. Ясно, что существует такая подпоследовательность {1} последовательности {i}, что число точек, содержащихся в 0^, равно фиксиро- ванному числу тг, не зависящему от /, и точки в 0,.. при i -> оо сходятся к некоторым предельным точкам. Пусть 0 — предел 0^. при j ->оо. Ввиду того, что значение игры относительно (Л, 0$.) сходится к значению игры от- носительно (Л, 0), значение игры относительно (Л, 0) рав- но значению игры относительно (Л, В). Этим теорема до- казана. 2.1.4. Случай, когда пространство стратегий одного из игроков сепарабельно. Пространство С называется сепара- бельным, если существует счетное подмножество у cz С, плотное в С, т. е. подмножество у с тем свойством, что для любой точки с Е С существует такая последовательность {q} точек в у, что lim q = с. г->оо Сепарабельность одного из пространств Л или В не влечет, вообще говоря, сепарабельности другого, как это видно из следующего примера. Пусть Л — множество на- туральных чисел, а В — множество всех подпоследова- тельностей множества Л. Положим К (а, Ъ) — 1, если a Ez b, и К (а, Ь) ~ — 1 в противном случае. Здесь Л сепарабельно, а В нет, так как расстояние между любыми двумя элементами^ равно 2, а самих элементов — несчет- ное множество. Теорема 2.6. Если одно из пространств А или В (пусть А) сепарабельно и а — плотное х) подмножество Л, то класс всех вероятностных мер £а, в. класс всех таких вероятностных мер на Л, для которых £(а) = 1, плотен в классе всех вероятностных мер в смысле метрики, опре- деленной в (2.4). Доказательство. Пусть ех,..., вп, ... — после- довательность положительных чисел с пределом 0. Так как Л сепарабельно, существует такая последовательность {aip ..., ai;,} (Ё — 1, 2, ...; i2 — 1, 2, ...; ...; ik = 1, 2, x) В смысле метрики, определенной в (2.2). (Прим, перев.)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 357 к = 1, 2, ...) подмножеств Л, что выполняются сле- дующие условия: (1) множества tkj и не пересекаются при / =#= /*; (2) LI ait..= Oil,..., (3) и ач = ii (4) диаметр .....г не превосходит ел.; (^) ^ги...,гк ~ a П ..г^=^=0« Для каждого набора к, ..., ik положим ЕЕ • Для каждой вероятностной меры g° и для любо- го к пусть go обозначает вероятностную меру, для которой g° ,г7<) ПРИ всех значениях ..., ik. Ясно, что |Я(£>, (2.31) для всех ц. Следовательно, П) = ^(1°, П) (2.32) ?г—>оо равномерно по р. Теорема 2.6 является непосредственным следствием из (2.32). Если А сепарабельно, то существует счетное подмно- жество а, плотное в А. Тогда из теоремы 2.6 следует, что класс дискретных вероятностных мер на А плотен в классе всех вероятностных мер. (Вероятностная мера называется дискретной, если существует такое счетное множество асЛ, что g(a) = 1.) Таким образом, если Л сепарабель- но и если игра вполне определена, то значение этой игры не зависит от выбора борелевского тела 91, если, конечно, предполагать заранее, что 91 содержит все счетные под- множества Л. Значит, если Л сепарабельно, то с точки зре- ния значения игры несущественно, какое именно борелев- ское тело выбрано, лишь бы оно содержало все счетные подмножества Л, а К (а, Ь) была бы измеримой в смысле К функцией, где 6 — борелевское тело, определенное в конце п. 2.1.1. Выбор в качестве 91 наименьшего боре- левского тела, содержащего все открытые подмножества
358 А. ВАЛЬД А, представляется поэтому в случае сепарабельности А удовлетворительным во всех отношениях (в особенности потому, что функция К всегда измерима в смысле (S при условии, что = 55^. Таким образом, рассмотрение слу- чаев, когда борелевское тело 91 отлично от gjj, не пред- ставляет интереса. Теорема 2.7. Пусть А сепарабельно. Пусть {а$} — такая последовательность подмножеств А, что каждое из множеств щ условно компактно, cz ai+1 (i =1, ...) и 00 а = U плотно в А. Тогда необходимым и достаточным г=1 условием полной определенности игры является равенство lim inf sup К (ga., ц) — inf sup К (%, ц). (2.33) г—>оо 7] -П £ Доказательство. В соответствии с леммой 2.1 мы имеем lim sup inf К (ga., ц) = sup inf К (ga, ц). (2.34) i-*00 Ea. 7] 7) Так как щ условно компактно, игра относительно (с^, В) является вполне определенной, т. е. sup inf К (ga., n) = inf sup К (£ар n). (2.35) Из (2.34) и (2.35) мы получаем lim inf sup К (Ц, т]) = sup inf К (ga, rj). (2.36) г-*0О 7) £a 7) Из теоремы 2.6 следует, что sup inf К (ga, т]) — sup inf К (g, t]). (2.37) Sa S 7) , Равносильность (2.33) полной определенности игры не- посредственно вытекает из (2.36) и (2.37). * Если поменять ролями игроков, то теорема 2.7 немед- ленно приводит к следующей теореме. Теорема 2.8. Пусть В сепарабельно и {f}J — после- довательность таких подмножеств В, что условно ком- I оо пактны, cz |3{+1 u Р = J Рг плотно в В. Тогда необ- j г=1 1
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 359 ходимым и достаточным условием полной определенности игры является lim sup inf К (g, Цр.) = sup inf К (g, ц). (2.38) i->oo £ Ир/, £ f\ , Теорема 2.9. Если одно из пространств А или В (пусть для определенности А) сепарабельно и игра вполне определена, то (1) существует такое счетное подмножество a cz Л, что игра относительно (а, В) вполне определена и ее зна- чение равно значению игры относительно (Л, В); (2) для любого s 0 существует такое конечное под- множество ае cz Л, что значение игры относительно (ае, В) отличается от значения игры относительно (Л, В) не более чем на е. Доказательство. Предположим, что Л сепа- рабельно и что игра является вполне определенной. Ввиду сепарабельности Л существует последовательность а = = {а.} (i =1,2,...) элементов Л, плотная в Л. Из теоремы 2.6 следует, что значение игры относительно (а, В) равно значению игры относительно (Л, В), и утверждение (1) доказано. Пусть а* — множество, состоящее из первых I элемен- тов последовательности а. Ввиду полной определенности игры на основании теоремы 2.7 мы получаем lim inf sup A^(ga., т]) = inf sup К (£, ц) = ♦ i->co 7) £a. 71 £ = sup inf К (Z, Л)- (2.39) £ -n Для произвольного подмножества a* cz Л и произволь- ного (3* cz В обозначим через v (a*, р*) значение игры, если Л заменено на а*, а В — на |3* при условии, что игра относительно (a*, f}*) является вполне определенной. Так как игра относительно (оц, В) вполне определена, соотно- шение (2.39) означает, что limp(aH B) = v(A, В). (2.40) г->оо Таким образом, при любом е 0 существует такое нату- ральное i, что р (аъ В) - р(Л, В) |< е. (2.41)
360 А. ВАЛЬД Это завершает доказательство теоремы 2.9. Теорема 2.10. Если оба пространства А и В сепа- рабельны и игра вполне определена, то (1) существуют такие счетные множества a cz Л и Р cz В, что v (А,В) = у (а, В) = v (Л, р) = v (а, Р); (2) для любого е 0 существуют такие конечные под- множества ае cz Л й ре cz В, что каждое из значений v (ае, В), v (А, ре) и v (ае, ре) отличается от v (А, В) не более чем на е. Доказательство. Из теоремы 2.9 следует, что существуют такие счетные подмножества a cz Л и Р cz В, что игры относительно (а, В) и (Л, р) вполне определены и v (а, Б) = v (Л, Р) = v (Л, В). (2.42) Для произвольных а* cz Л и р* cz В, очевидно, имеют место следующие неравенства: sup inf К (ga*, П) < sup inf К (ga*, т^*) < ^a* * £<x* sup inf К (|, T]8*), (2.43) 5 -Пд* inf sup К (£a*, Л) < inf sup К (ga*, T]^) < 71 5a* 5a* <infsupjfif(£, т|р»). (2.44) Tip* 5 Заменяя в (2.43) и (2.44) a* и p* соответственно на a и p, мы получаем, что ввиду (2.42) — (2.44) игра относительно (a, Р) вполне определена и v (a, Р) = v (Л, В). Этим (1) доказано. Пусть ае — конечное подмножество Л и ре — конеч- ное подмножество В, причем 1 v (а£, В) — v (А, В) К е, |^(Л, р£) — v (Л, В) | < е. (2.45) Существование таких подмножеств следует из теоремы 2.9. Заменяя а* и р* в (2.43) и (2.44) соответственно на ае и ре, мы из (2.43) получаем, что v (ae, В) < v (а8, ре) < v (Л, ре). (2.46)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 361 Утверждение (2) является непосредственным следствием из (2.45) и (2.46), и доказательство теоремы завершено. 2.1.5. Общие пространства стратегий. Рассмотрим те- перь общий случай, когда пространства стратегий являют- ся несепарабельными. В случае сепарабельности прост- ранства стратегий мы видели, что класс всех дискретных вероятностных мер плотен в классе всех вероятностных мер. В случае несепарабельных пространств это не обяза- тельно так. Мы, однако, будем рассматривать задачу о полной определенности игры при том ограничении, что смешанная стратегия игрока должна либо быть сама дис- кретной, либо быть пределом последовательности дис- кретных вероятностных мер в смысле метрики, вводимой соотношениями (2.4) и (2.5). С точки зрения приложений эти ограничения существенными не являются. Теорема 2.11. Если смешанные стратегии игрока I могут быть только дискретными вероятностными мерами или же пределами таких мер в смысле естественной метри- ки, то необходимым и достаточным условием полной опре- деленности игры является существование такой последова- тельности а = {aj (i =1, 2, ...) элементов А, что lim inf sup К (5аГ ц) = inf sup К (5, ц), (2.47) i-*oo -n 7) E, где щ = {ax, ..., aj. Доказательство. Ввиду ограничения, нало- женного нами на смешанные стратегии, существует после- довательность {£{} дискретных вероятностных мер, для которых lim inf sup К (5i, ц) = sup inf К (5, ц). (2.48) г->оо 71 Ц 5 71 Так как все вероятностные меры дискретны, для каждо- го i существует такое счетное 6q с А, что 5г (б^) = 1. °0*” — Пусть a = [j at. Тогда из (2.48) следует, что г—1 sup inf К (5a, Л) = SUP inf & Л)* (2.49) £а -П £ 71 Расположим элементы множества а в некоторую упоря- доченную последовательность. Пусть a = {a<} (i =1,
362 А. ВАЛЬД 2, ...). Ввиду того, что всякое множество сц = {ах, ..., конечно, игра относительно (ай В) является вполне опре- деленной, т. е. inf sup К (£а., т]) = sup inf К (Ц, г|). (2.50) 1,1 £04 £04 Тогда из леммы 2.1 следует, что j 41 lim inf sup К (§a., p) = sup inf К (ga, rj) = г->оо и £a. £a 7) == sup inf К (g, T]). (2.51) 1 л Необходимость нашего условия вытекает теперь непосред- ственно из (2.51). Для доказательства его достаточности возьмем в качестве a = {aj последовательность, удовлет- воряющую (2.47). Ясно, что для этой последовательности имеют место равенства (2.50) и первая часть равенства * (2.51). Тогда из леммы 2.4 следует, что игра является вполне определенной, и достаточность условия доказана. Перемена ролей игроков в теореме 2.11 приводит к сле- дующей теореме. Теорема 2.12. Если смешанные стратегии игрока II являются дискретными или пределами дискретных ве- роятностных мер в смысле естественной метрики, то необходимым и достаточным условием полной определен- ности игры является существование такой последователь- ности Р = {bi} элементов В, что lim sup inf К (£, = sup inf К (£, т|), (2.52) г->оо Е, % -Л где = {bi,..., bi}. Докажем теперь следующую теорему. Т е о р ем а2.13. Если пространство смешанных стра- тегий одного из игроков (скажем, игрока I) ограничено замы- канием (в смысле топологии, порожденной естественной метрикой) множества дискретных вероятностных мер и если игра является вполне определенной, то существует такое счетное подмножество а с А, что V (а, Б) = v (А, Б),
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 363 и для произвольного 8 О существует такое конечное ag cz Л, что | v (ag, В ) — v (Л, В) | 8. Если пространство смешанных стратегий каждого из иг- роков заключено в замыкании множества всех дискретных вероятностных мер и если игра вполне определена, то су ществуют такие счетные a cz Л и р cz В, что v (а, *В) = и (Л, р) = v (а, Р) = и (Л, В), и для любого 8 О существуют такие конечные cz Л и Ре cz В, что все значения р (ае, В), v (Л, ре), v (а£, ре) отличаются от и (Л, В) не более чем на 8. Доказательство. Предположим, что прост- ранство смешанных стратегий первого игрока лежит в за- мыкании всех дискретных вероятностных мер и что игра вполне определена. Тогда, в соответствии с теоремой 2.11, существует последовательность a = {aj элементов Л, для которой имеет место (2.47). Тогда limp (at, В) = р(Л, В). (2.53) г->оо Из теоремы 2.7 и соотношения (2.47) непосредственно сле- дует, что игра относительно (а, В) вполне определена и что lim и (ай В) = v (а, В). (2.54) г->оо « Первая часть теоремы 2.13 является непосредственным следствием из (2.53) и (2.54). Для доказательства второй части этой теоремы примем, что пространство смешанных стратегий каждого из игроков лежит в замыкании класса всех дискретных вероятностных мер и что игра является вполне определенной. Пусть аир — счетные подмножест- ва Л и В, а as и Ре —- конечные подмножества Л и В, для которых v (а, В) = р (Л, р) = v (Л, В) (2.55) и I V (а£, В) — V (Л, В) I < 8, | V (Л, Ре) — V (Л, В) | < 8. (2.56) Существование таких подмножеств следует из первой час- ти теоремы.
364 А. ВАЛЬД Тогда из(2.43), (2.44)и(2.55)вытекает,что игра относи- тельно (а, Р) является вполне определенной и что v (а, (3) = == v (Л, В). Кроме того, из (2.43) и (2.44) следует, что у(а8, В)<р(а£, р£)<у(Л, ₽е). (2.57) Значит, |^(ае, ₽е)-у(Л,В)|<8. (2.58) Это завершает доказательство теоремы. Если снять ограничения, налагаемые на* смешанные стратегии, то, как показывает следующий пример, заклю- чения теорем 2.11, 2.12 и 2.13 не обязаны оставаться в си- ле. Пусть каждое из пространств А нВ является открытым интервалом (0,1). Тогда каждый элемент А и каждый эле- мент В может быть записан как двоичная дробь, т. е. как последовательность нулей и единиц х). Для каждого нату- рального к пусть Sk — подпоследовательность последо- со вательности S всех натуральных чисел, причем 5 = J $к к—1 и подпоследовательности Sk попарно не пересекаются. Положим К (а, Ь) = — 1, если существует такое нату- ральное к, что = bi для всех i е= Sk, где {aj — двоич- ное представление а, а {Ьг} — двоичное представление Ь. Во всех остальных случаях положим К (а, Ь) =1. Пусть £° — равномерное распределение на интервале (0, 1), т. е. 5° (а) есть лебегова мера множества а. Ясно, что К (£% b) = 1 (2.59) для всех 6. Поэтому К а°, ц) = 1 (2.60) и для всех ц. Следовательно, если 01 есть класс всех под- множеств (0,1), измеримых по Лебегу, то мы имеем sup inf А(£, ц) = inf sup A (g, ц) -- 1. (2.61) £ fi fi Пусть теперь a = {aj (i = 1, 2. ...) —- последовательность элементов А и {«<•}(/ =1, 2, ...)—-двоичное представ- г) Чтобы сделать двоичное представление единственным для двоичных рациональных точек открытого интервала (0, 1), мы условимся брать то представление, которое содержит бесконечно много нулей.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 365 ление Пусть bQ есть элемент В, двоичное представле- ние которого {bQj} (/ = 1,2,...) определено следующим образом: bQr = акг для всех г ЕЕ Sk (к =1,2, ...). Ясно, что К^,Ь,) = -1 тождественно относительно |а. Значит, для произвольного счетного подмножества а мы имеем sup inf К (ga, т|) = inf sup К ц) = — 1. (2.62) Это противоречит заключениям теорем 2.11, 2.12 и 2.13. Из (2.62) вытекает, что если все стратегии £ являются дискретными вероятностными мерами на Л, то sup inf К (£, ц) = — 1. £ ъ С другой стороны, inf sup К (%, ц) остается равным еди- ъ £ нице, даже если ограничить выбор £ областью дискрет- ных вероятностных мер х). Таким образом, если игрок I ограничивает свой выбор дискретными мерами, то игра не будет вполне определенной. Если такого огра- ничения нет, то выбор в качестве 21 наименьшего борелев- ского тела, содержащего все открытые подмножества 4, уже не был бы удовлетворительным, так как всякое под- множество А открыто, и, таким образом, 21 было бы клас- сом всех подмножеств 4, которые излишне сузили бы класс всех возможных вероятностных мер ввиду общего условия аддитивности, наложенного на |. Каждое под- множество 4 открыто, потому что расстояние между лю- быми двумя элементами 4 равно 2. Это можно показать следующим образом. Пусть и {а2 } (/ =1, 2, ...) — двоичные представления аг и а2. Пусть Ьо — элемент В, двоичное представление которого {b^} (j =1,2, ...) удов- летворяет следующим условиям. Обозначим через г наи- меньшее натуральное число, для которого ац =f= a2j хотя бы при одном значении / ее Sr. Положим bQj = для всех j ЕЕ Sr. Для произвольного к =/= г положим Ь^к = г) Легко проверить, что для произвольного т) существует такой элемент аЕЛ, что К (а, ч) — 1.
366 А. ВАЛЬД = 1 — a2]i, где ]к является наименьшим числом в Sk. Для всех остальных целых / значение определяется произвольно с тем единственным условием, что последова- тельность {60;} должна содержать бесконечно много нулей. Тогда мы имеем К (а1? 60) = — 1 и К (а2, bQ) = 1. Поэтому 6 (а1? а2) = 2. § 2.2. Теоремы о топологии в пространствах смешанных стратегий 2.2.1. Два определения сходимости в пространствах смешанных стратегий и их связь. Естественная метрика в пространствах смешанных стратегий была введена в п. 2.1.1 (см. (2.4) и (2.5)). Будем говорить, что последо- вательность {^} вероятностных мер на А сходится в естественном смысле к вероятностной мере £0, если limd (£i, £о) = 0, где б обозначает расстояние, определенное г->со равенством (2.4). Естественная сходимость вероятностных мер в пространстве В определяется аналогично. Другое определение сходимости в пространствах сме- шанных стратегий, более соответствующее обычному пред- ставлению о сходимости, состоит в следующем. Будем го- ворить, что последовательность {^} вероятностных мер на А сходится в обычном смысле к вероятностной мере £0, если для произвольного открытого подмножества асЛ, гра- ница которого в соответствии с мерой £0 имеет вероят- ность 0, должно быть limgi(a) = &)(a). г->эо Обычная сходимость в пространстве смешанных стра- тегий второго игрока определяется аналогично. Теорема 2.14. Если пространство А сепарабельно и если {£$} (i = 1, 2, ...) является такой последователь- ностью вероятностных мер на А, что сходится к £0 в обычном смысле, то сходится к и в естественном смысле. Доказательство. Пусть {^} — последователь- ность вероятностных мер на А, сходящаяся к £0 в обычном смысле. Для произвольного б О существует такая по- следовательность {aj (i =1, 2, ...) попарно не пере-
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 367 секающихся непустых открытых подмножеств Л, что оо _ дня любого i диаметр 04 не превосходит 6, (J aL = А 7=1 и ?о («г \ °ч) = 0 (* = 1’ 2,...). Здесь ai означает замы- кание щ. Пусть аг — некоторая точка из ai и (п* = = 0, 1, 2, ...) —- вероятностная мера, приписывающая ту же вероятность, что приписывает оц, т. е. (а^ = = In (аг)- Ясно, что lim£* == в обычном смысле, и на п-»-оо основании равномерной ограниченности К (а, Ь) мы име- ем сходимость lim Я (Г, Л) = К (£0*,П) (2.63) тг—>оо равномерно относительно ц. Так как диаметр сц не превос- ходит S, мы имеем \К (£, п)-К(^, п)|<б (2.64) для всех т) и для I — 0, 1, 2, ... Так как, наконец, 6 может быть выбрано произвольно малым, из (2.63) и (2.64) сле- дует, что lim К (|п, т]) = К (g0, п) (2.65) п->оо равномерно по ц. Но (2.65) эквивалентно сходимости Нп к £0 в естественном смысле, и теорема 2.14 доказана. 2.2.2. Компактность пространства смеп/Ънных стра- тегий, когда пространство чистых стратегий компактно. В этом пункте мы докажем, что если пространство А чис- тых стратегий игрока компактно, то пространство всех его смешанных стратегий также компактно как в естест- венной, так и в обычной топологии. Достаточно доказать компактность пространства всех смешанных стратегий в обычной топологии, так как, в соответствии с теоремой 2.14, отсюда будет следовать его компактность в естест- венной топологии. Точнее говоря, докажем следующую теорему. Теорема 2.15. Если А компактно и если {%п) — по- следовательность вероятностных мер в А, то последова- тельность {£п} обладает подпоследовательностью, которая
368 А ВАЛЬД сходится в обычном смысле к предельной вероятностной мере * 2). Доказательство. Предположим, что А ком- пактно, и пусть {^} (к — 1,2, ...) — сходящаяся к нулю последовательность положительных чисел. Пусть Ах, ..., Ami — такие попарно не пересекающиеся открытые под- множества 4, что Ах Q ... U Ат1 = А, а диаметр каждого Ai не превосходит 2). Вообще, пусть {А^^Л]} = = 1, ..., тр, ] =1, ..., к) — система, состоящая из тгт2... ...тк открытых и попарно не пересекающихся подмножеств А, для которых — — ,U Ai2...ife== А^...^ (* = 2,3,...), (2.66) и диаметр А^...^ не превосходит &к. Пусть, кроме того, множества А^..^ выбраны так, что ^(X..ife\^-..ift) = 0 (2.67) для всех значений лг, *, и, ..., г&. Пользуясь известным диагональным процессом, мы можем сконструировать такую подпоследовательность {Ц} (/ =1, 2, ...) последовательности {£п}, что lim j->oo (Aib..^) будет существовать при произвольных *, ii,..., Для каждого подмножества ас А пусть %* (а) обо- значает предел ^п. (а) при; —> оо при условии, что этот пре- дел существует. Таким образом, мы можем написать lim^.(Ail,...,ife)=g*(Ai3,...,ifc). (2.68) Так как Ц (А^,,..,^) = (Ailf..„ift), мыимеем g* (А^,...,^) =- = (Ailt.,.,ift). Для каждого открытого множества a cz А пусть £ (а) обозначает наименьший верхний пре- дел для (Р) относительно р, где р может быть суммой х) Близкая по содержанию теорема была доказана Крыловым и Боголюбовым [28]. Их определение сходимости в пространстве вероятностных мер несколько отличается от используемого здесь. 2) Как и всюду в этом параграфе, мы используем символ а для обозначения замыкания а.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 369 любого конечного числа множеств вида Л|ъ...,< , которые содержатся в а. Ясно, что | (а) 0, | (Л) = 1 и £ (ai 4- + «2) =5 (ах) + % (а2) для любых открытых и непере- | секающихся подмножеств ах, а2. Пусть {aj (j = 1,2,..?) — последовательность открытых непересекающихся под- множеств А. Пусть р — сумма конечного числа таких мно- ___________________ со j жеств , что Р содержится в a = Q 04. Так как А к г==1 компактно, из леммы Бореля о покрытиях следует, что Р будет содержаться в сумме конечного числа элементов последовательности {aj. Из этого в свою очередь следует, что /оо \ £2 ц и 4 = 2 u«i). 4=1 ' г=1 Функция меры | (а) может быть распространена обычным образом на все элементы наименьшего борелевского тела, содержащего все открытые подмножества А. Пусть a — такое открытое подмножество Л, что g(a\a) =0. (2.69) Для каждого^ натурального к пусть рл есть сумма всех тех множеств А^,..^ , которые пересекаются с а, но не содержатся в а. Так как £ (а \ а) =0, мы доджны иметь КтГ(М = 0. (2.70) fc->00 Для произвольного к пусть ук — сумма всех тех Л которые содержатся в а. Ясно, что (Т/r U Р#) > Snj (#) СГй)* (2.71) Поэтому Г (n и К) > ЙМп; (а) > Кт Ц (а) > Г (Т*)« (2.72) J-*o° ;->оо Ввиду ТОГО, ЧТО ^(Т»иМ>Н«)>5*Й (2.73) 24 Позиционные игры
370 А. ВАЛЬД И lim (Г (n U ₽А) - Г (Т*)) = 0, (2.74) /<.-*00 из (2.72) следует limL.(a) = g (а), (2.75) j->oo и теорема 2.15 доказана. 2.2.3. Сепарабельность пространства смешанных стра- тегий, когда пространство чистых стратегий сепарабель- но. Целью этого пункта является доказательство следую- щей теоремы. Теорема 2.16. Если пространство чистых страте- гий, игрока i сепарабельно, то пространство его смешан- ных стратегий также сепарабельно в смысле естественной топологии. Доказательство. Предположим, что А сепа- рабельно. Пусть а0 — некоторое счетное плотное под- множество А. Из теоремы 2.6 следует, что множество всех вероятностных мер g, для которых £ (а0) =1, плотно в множестве всех £. Множество всех вероятностных мер £, для которых £ (а0) — 1, сепарабельно в смысле обычной топологии. Значит, ввиду теоремы 2.14 множество всех £, для которых | (а0) == 1, сепарабельно и в смысле есте- ственной топологии. Следовательно, пространство всех вероятностных мер % должно быть сепарабельным в смы- сле естественной топологии, и теорема 2.16 доказана. § 2.3. Свойства минимаксных стратегий1) В этом параграфе мы рассмотрим и докажем некоторые теоремы, относящиеся к минимаксным стратегиям. Т е о р е м а 2.17. Если £0 является минимаксной стра- тегией игрока I и если игра вполне определена, то яв- ляется максимальной стратегией в широком смысле. Аналогично, если т]0 является минимаксной стратегией игрока II и игра вполне определена, то *q0 является ми- нимальной стратегией в широком смысле. х) Большая часть результатов этого параграфа была установле- на и доказана фон Нейманом для конечных пространств стратегий. См. §§ 17.8 и 17.9 в [55].
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 371 Доказательство. Предположим, что игра вполне определена и является минимаксной страте- гией игрока I. Пусть {тц} (i = 1,-2,...) — последователь- ность таких стратегий игрока II, что lim sup К (£, Цг) = inf sup К (В, ц). . (2*76) г->оо £ ъ Е, Так как g0 — минимаксная стратегия, мы имеем inf К (go, П) = sup inf К (g, т]). (2.77) 7) £ 7) Значит, sup К (g, ip) > к (go, ip) > sup inf К (g, n). (2.78) £ £ 7) Так как игра вполне определена, из (2.76) и (2.78) сле- дует, что lim [sup К (g, тр) — К (|о, тр)] = 0. (2.79) г->оо £ Следовательно, £0 является максимальной стратегией в широком смысле. Вторая часть теоремы доказывается аналогично. Теорема 2.18. Если игра вполне определена и если £0 и По являются соответственно минимаксными стратегиями игроков I и II’, то есть максимальная стратегия относительно ц0, По — минимальная страте- гия относительно и ф К (£о, т]э) = min max К (£, ц) = max min К (£, ц). (2.80) 7) £ Е, 7) Доказательство. Так как стратегии £0 и ц0 являются минимаксными стратегиями, должно выпол- няться следующее неравенство: max min К (g, п) = min К (g0, П)< к (Во, По) < £ 7) 7) maxA'(g, т]0) = minmaxff (g, т]). (2.81) Z 7) £ Так как игра вполне определена, из (2.81) вытекает, что min К (Во, И) = & (Во, По) = шах К (|, ц0), (2.82) 7) ~ £ и теорема доказана. 24*
372 А. ВАЛЬД Теорема 2.19. Если игра вполне определена и и По ~ минимаксные стратегии игроков I и II, то = (А \а0) По СВ\р0) - 0, (2.83) где а0 — множество всех элементов а$ ЕЬ А, для которых К (До, По) = max#(а, По), а а ро— множество тех bQ ЕЕ В, для которых #(£о, Ь0)-тт#(Ь, Ь). ъ Доказательство. Ясно, что для всякой ве- роятностной меры g, для которой | (А\а0) > 0, должно быть К (£, По) < max К (а, По) = К (|0, По), а Следовательно, £0 (Л\а0) = 0. Аналогично устанавлива- ется, что т)0 (#\Р0) = 0- Будем говорить, что пространство# слабо компактно1), если из каждой последовательности {t)J вероятностных мер на В можно выделить такую подпоследовательность {Пгу} и указать такую вероятностную меру т]0, что lim inf К(1, тц.) > К (|, т]0) (2.84) j->OO для всех % . Это свойство более слабое, чем компактность. Даже существование подпоследовательности {т^.} и та- кой меры т)0, что lim#(g, ПгЭ = т]0) ;~>оо для всех £, является более слабым свойством пространства, чем его компактность 2), ибо компактность требует, чтобы эта сходимость была равномерной по Случай, когда В слабо компактно в указанном выше смысле, играет важ- 2) Термин «слабая компактность», используемый здесь, не имеет никакого отношения к аналогичному термину, употребляемому в литературе в связи с множествами функций. См., например, [72]. 2) Имеется в виду компактность в смысле естественной тополо- гии. {Прим, перев,)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 373 ную роль в теории статистических решающих функций. В главе З станет видно, что пространство стратегий ста- тистика при весьма общих предположениях является слабо компактным. Теорема 2.20. Если пространство В слабо ком- пактно, то существует минимаксная стратегия для игрока II. Доказательство. Пусть {тц} — такая после- довательность вероятностных мер на В, что lim sup К (g, тр) = inf sup К (£, ц). (2.85) i-*oo Е, -n Е, Последовательность {тц} с этим свойством, очевидно, существует. Так как В слабо компактно, существуют такие подпоследовательность {ц;?.} последовательно- сти {?]*} и вероятностная мера ц0, что liminf Цо) (2.86) i->oo для всех £. Из (2.85) и (2.86) следует, что sup К (£, т]0) = inf sup К (£, т|). С п £ Таким образом, ц0 есть минимаксная стратегия, и теоре- ма доказана. § 2.4. Допустимые стратегии и полные классы стратегий 2.4.1. Минимальный полный клаЬс стратегий. В п. 1.6.2. были определены понятия допустимой стратегии и полного класса стратегий. Полный класс С стратегий называется минимальным полным классом, если никакой его собственный подкласс не является полным. Т е о р ем а 2.21. Для каждого игрока существует не более одного минимального полного класса стратегий. Если минимальный полный класс стратегий существует, то он должен совпадать с классом Со всех допустимых стратегий. Доказательство опускается, так как оно приведено в § 1.3 в связи с решающими функциями.
374 А. ВАЛЬД Нетрудно привести примеры игр, в которых класс допустимых стратегий не является полным. В частности, нетрудно построить игру, в которой класс допустимых стратегий будет пустым. Например, пусть А состоит из единственного элемента а, а В — из элементов по- следовательности {Ь{} (Z — 1,2,...). Пусть К (а Ь{} ---L Ясно, что в этом случае игрок II допустимых стратегий не имеет. Теорема 2.22. Если А сепарабельно, а В слабо компактно, то класс всех допустимых стратегий игрока II является полным х). Доказательство. Предположим, что А сепара- бельно, а В слабо компактно, и класс всех допустимых стратегий игрока II не является полным. Тогда существует такая недопустимая стратегия что всякая стратегия ц, равномерно лучшая, чем Tji, также не является допу- стимой. Так как стратегия т]г недопустима, существует хотя бы одна стратегия ц2 равномерно лучшая, чем тц. Так как стратегия ц2 также не является допустимой, должна найтись равномерно лучшая, чем т]2, стратегия т]3 , ит. д. В итоге мы получаем такую последовательность стратегий {т].} (j =1,2,...), что ц, равномерно лучше, чем т)*, для / i. Ввиду слабой компактности В существует стратегия rjco+i равномерно лучшая, чем каждый из эле- ментов последовательности {t]J. Но тогда существует стратегия r}w+2 равномерно лучшая, чем Цо+х- Продолжая этот процесс трансфинитно, мы получаем такое вполне упорядоченное несчетное множество S стратегий ц, что каждый его элемент равномерно лучше, чем все предше- ствующие. Так как А сепарабельно, существует последователь- ность {«J элементов А, плотная в А. Таким образом, 2) Эта теорема сходна с теоремой Цорна о частично упорядочен- ных множествах, но не может быть выведена из нее, ибо Цорн прини- мает, что всякое упорядоченное подмножество имеет в системе верхнюю грань, тогда как в нашем случае только каждое счетное упорядоченное подмножество имеет такую грань. Наша теорема, однако, может быть выведена (без дополнительного использования тран- фннитной индукции) из более общих результатов Мильгрема [32], которые охватывают теорему Цорна как частный случай.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 375 если т]' и ?]" — две стратегии, причем т]" равномерно лучше т]', то существует такое i, что К (а^ т]") < <Z К (di , т]')- Для произвольного i пусть Si есть вполне упорядоченное подмножество S, заданное следующим образом. Элемент ц ЕЕ 51 принадлежит тогда и только тогда, когда существует элемент г/ ЕЕ 5, являющийся непосредственным предшественником т], и К (а^ р) <С <С К (сц, т]'). Ясно, что Ц — где S' -—множество всех таких элементов, которые имеют в S непосредствен- но предшествующий элемент. Так как S' несчетно, долж- но существовать такое i, что Si несчетно. Ясно, что для любых двух элементов rf, rf ЕЕ из которых т/ пред- шествует т]", мы имеем К т]') > К т]"). Но это невозможно, и теорема доказана. 2.4.2. Теоремы о полных классах стратегий. В этом пункте мы докажем несколько теорем о полных классах стратегий. Сначала докажем следующие две теоремы. Теорема 2.23. Если пространство А сепарабель- но, а пространство В слабо компактно, то игра вполне определена. Доказательство. Так как А сепарабельно, существует такая последовательность {aj подмножеств А, что щ cz a^+i, множества щ условно компактны и сумма со U «I — ОС г=1 плотна в А. Игра относительно (ab В) вполне определена. Пусть т]| —- минимаксная стратегия в игре относительно (аъ В). Ввиду слабой компактности В такая минимаксная стратегия существует. Поэтому sup К Qa щ) = inf sup К (ga., р). * Ч (2.87) Так как В слабо компактно, тельность (/ =1,2,...) и стратегия р0, для которых существуют подпоследова- последовательности {тр} lim inf К (g, ip .) > К (£, т]о) У->со f2.88)
376 А. ВАЛЬД при всех £. Из (2.87) и (2.88) следует, что для всякого целого положительного г sup К (£а ц0) < lim inf sup К (ga , тр ) < Ч Ч 1 < lim sup К (|Я{., тр ) = 3-o° t. Ъ 3 г3 = lim inf sup К (£„t., T]) = 3-xx> 4 za i гз = lim inf sup К (|ap ц). (2.89) i~>oo я Поэтому, так как lim sup К (gar, no) = sup К (ga, т]о), ^ar £<x должно быть inf sup К (ga, n) < lim inf sup К (gap n)- , (2.90) 7) i->oo -n £ Очевидно, левая часть (2.90) не может быть строго мень- ше правой части (2.90), т. е. должен иметь место знак равенства. Теорема 2.23 является непосредственным след- ствием этого заключения и теорем 2.6 и 2.7. Теорема 2.24. Если пространство А сепарабель- но, пространство В слабо компактно и выбор игрока II ограничен классом С вероятностных мер т], который со- держит все дискретные вероятностные меры т) и при этом не нарушает свойства слабой компактности, то игра вполне определена и ее значение то же самое, что и зна- чение первоначальной игры. Доказательство. Пусть С — класс всех ве- роятностных мер, удовлетворяющих условиям теоремы. Нетрудно проверить, что соотношения (2.87) и (2.90) остаются в силе для мер и» пробегающих С. Значит, игра остается вполне определенной и при условии, что П ЕЕ С. Пусть последовательность {aj определена, как и при доказательстве теоремы 2,23. Из теоремы 2.3 сле- дует, что значение inf sup К (ga., п) остается неизменным, * если ограничить выбор н элементами С. Отсюда и из
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 377 (2.90) получаем, что значение игры не изменится от ука- занного ограничения в выборе ц. Теорема доказана. Теорема 2.25. Если А сепарабельно, а В слабо компактно, то для игрока II класс минимальных в широ- ком смысле стратегий является полным. Доказательство. Пусть А сепарабельно, В слабо компактно, а ц0 — стратегия игрока II, которая не является минимальной в широком смысле. Введем новую функцию выигрыша ТГ* (а, Ь), положив К* {а, Ъ) = К (а, Ь) — К (а, ц0). (2.91) Ясно, что если заменить К на ТГ*, то пространство А остается сепарабельным, а пространство В — слабо ком- пактным. Таким образом, игра, соответствующая функ- ции ТГ* (а, Ь), вполне определена. Пусть — мини- максная стратегия игрока II в игре с функцией выигры- ша ТГ* (а, Ъ). Ввиду слабой компактности В такая минимаксная стратегия существует. Так как для всех g К* (I, Цо) = 0, мы должны иметь для всех £ /Г* (£, Л1) < 0. Но К* (|,т]) =ЛГ(М) -К{1, По). Следовательно, тга, тихтг а, ц0) (2.92) (2.93 (2.94) (2.95) для всех В соответствии с теоремой 2.17 стратегия rji является минимальной в широком смысле, если заменить ТГ на ТГ*. Но всякая стратегия, минимальная в широком смысле в игре с функцией выигрыша К*, должна быть минимальной в широком смысле и в игре с функцией выигрыша К. Так как стратегия ц0 не является мини- мальной в широком смысле, в (2.95) хотя бы для од- ного g должен иметь место знак строгого неравенства. Таким образом, стратегия Ц! равномерно лучше стра- тегии ц0, и теорема доказана. Теорема 2.26. Если А компактно и В слабо компактно, то минимальные в узком смысле стратегии игрока II образуют полный класс.
378 А. ВАЛЬД Доказательство. Пусть А компактно, В сла- бо компактно и ц0 — стратегия, не являющаяся мини- мальной в узком смысле. Рассмотрим функцию выиг- рыша /Г* (а, Ь) — К (а, Ъ) — К (а, ц0). Ясно, что если заменить К на К*, то пространство А остается компак- тным, а пространство В—слабо компактным. Пусть тц— минимаксная стратегия при функции выигрыша К*. Тогда, так как равенство К* (£, ц0) = 0 выполняется тождественно относительно мы имеем К* a, Th) = К (|, П1) - К (L Яо) < 0 (2.96) тождественно по Пусть — минимаксная стратегия игрока I при функции выигрыша К*. Такие минимакс- ные стратегии существуют, так как А компактно. Тогда, в соответствии с теоремой 2.18, является минимальной стратегией относительно при функции выигрыша К* (а, 6). Очевидно, останется минимальной стратегией по отношению к если функцией выигрыша станет К, Так как стратегия ц0 не минимальна в узком смысле, должно быть К (£, Tji) ф (£> Ло) хотя бы для одного Отсюда и из соотношения (2.96) и следует теорема 2.26. глава з РАЗВИТИЕ ОБЩЕЙ ТЕОРИИ СТАТИСТИЧЕСКИХ РЕШАЮЩИХ ФУНКЦИЙ § 3.1. Формулировка некоторых допущений, касающихся задачи принятия решения 3.1.1. Допущения, касающиеся пространства Q до- пустимых функций распределения F. При развитии об- щей теории решающих функций представляется необхо- димым принять некоторые допущения относительно про- странства Q, весовой функции W (F. (В), пространства D* окончательных решений, функции стоимости испытаний и относительно решающих функций б, которые доступны статистику. Допущения, которые мы будем делать, до- вольно слабы и не ограничивают сколько-нибудь серьезно приложимость теории к практическим задачам. В этом параграфе мы сформулируем некоторые допу- щения о пространстве Q. Введем сначала несколько
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 379 определений. Будем говорить, что стохастический про- цесс {XJ (i =1,2,...), по поводу которого встает за- дача статистического решения, дискретен, если для вся- кого целого положительного г существует такое счет- ное подмножество М* r-мерного пространства выборок Мг, что для всех выборка (жх,..., хг) с вероят- ностью 1 принадлежит М*. Здесь числа обозначают наблюденные значения (i = 1,..., г). Будем гово- рить, что стохастический процесс {Хг} абсолютно непре- рывен, если для всякого F GE Q и любого целого поло- жительного г совместное распределение случайных вели- чин Хх,..., Хг имеет плотность. Допущение 3.1. Стохастический процесс {Xt} (i =1,2,...), фигурирующий в задаче статисти- ческого решения, является либо дискретным, либо аб- солютно непрерывным. С точки зрения приложений это допущение не яв- ляется особенно ограничительным, так как в большинстве встречающихся в практике задач стохастический процесс {Х^ действительно является либо дискретным, либо аб- солютно непрерывным. По определению, если процесс {Хг} дискретен, то для каждого натурального I существует такое счетное подмножество Si на вещественной прямой, что вероятность того, что наблюденное значение случайной величины Х{ будет принадлежать 5{, равна единиц# для всех F. Пусть элементами Si являются ailf ai2,... С точки зрения теории статистических решений не играет роли, какие именно значения приписаны случайным величинам Х^ В частности, мы можем положить ац = ]{]'—1, 2,...), не нарушая при этом общности задачи. В связи с этим до конца главы мы будем в дискретном случае считать, что случайные величины Хг принимают только натуральные значения. Для формулировки следующего допущения относи- тельно Q введем понятие регулярной сходимости на Q. Пусть Mr — некоторое подмножество r-мерного про- странства выборок Мг. Обозначим через Р (M*\F) вероят- ность того, что в условиях распределения F выборка, состоящая из наблюдений х^..., хг соответственно над
380 А. ВАЛЬД Xi,..., Xr, принадлежит Af*. Будем говорить, что после- довательность Fi сходится регулярно к F$, если для лю- бого натурального г мы имеем lim Р (М* | = Р (М* | Fo) (3.1) г->оо равномерно по всем Af*. Определенная так сходимость называется регулярной в отличие от других видов сходимости, которые будут рассмотрены далее. Допущение 3.2. Пространство Q относитель- но регулярной сходимости является сепарабельным. Покажем, что допущение 3.2 является следствием до- пущения 3.1. Мы привели здесь оба допущения, потому что некоторые результаты этой главы остаются справед- ливыми, даже если постулировать только допущение 3.2 (см., например, теорему 3.3). Для вывода допущения 3.2 из допущения 3.1 опре- делим для каждого натурального г на множестве й мет- рику tr, положив tr (Fl, Ft) = sup IP (M* I Ft) - P (M* I Ft) I, где M* — произвольное подмножество r-мерного коор- динатного пространства выборок Мг с координатами хг. Покажем, что сепарабельность Q в смысле ре- гулярной сходимости вытекает из сепарабельности Й в смысле метрик tr при любом г. Предположим, что Й сепарабельно в смысле метрик tr для любого г. Тогда для каждого г существует после- довательность {Fri} (i =1,2,...) элементов й, плотная в Й в смысле метрики tr. Пусть F — произвольный эле- мент й и {ег} (г =1, 2,...) — последовательность по- ложительных чисел, для которых limsr = 0. Ясно, что Г->00 для всякого г существует такое натуральное гг, что tr (F, Frir) 8Г. Так как расстояние tr (F', F") при воз- растании г не убывает, мы видим, что в смысле регуляр- ной сходимости (3.1) lim Fr ~ F. Так как двойная после- г->оо
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 381 довательность {/\} (г, i =1, 2,...) плотна в Й в смысле регулярной сходимости, сепарабельность й доказана. Докажем теперь сепарабельность й в случае дискрет- ного случайного процесса. Как было только что устано- влено, для этого достаточно показать, что й сепарабельно в смысле tr при всяком г. Пусть йг — класс всех совмест- ных распределений Хх,..., ХГ9 где может принимать только натуральные значения. Очевидно, сепарабель- ность й в смысле tr будет доказана, если мы докажем сепарабельность в этом смысле множества йг. Пусть Q* — множество всех элементов F йг, для которых выполняются следующие два условия: (1 ) для любого множества натуральных чисел сх,...,сг вероятность совмещения событий Хг =с1,...,Хг = сг является рациональным числом, и (2 ) существуют г таких целых чисел их,..., иГ1 кото- рые могут зависеть от F, что вероятность каждого собы- тия Хг щ равна нулю (Z =1,..., г). Очевидно, й? содержит только счетное множество элементов и, как это можно легко проверить, й? являет- ся подмножеством, плотным в Йг в смысле tr. Это завер- шает доказательство допущения 3.2 в случае дискрет- ного процесса. Для доказательства допущения 3.2 в случае абсолют- ной непрерывности процесса обозначим через йг сово- купность всех абсолютно непрерывных распределений Хх,..., Хг. Достаточно доказать, что йг сепарабельно в смысле метрики tr. Сепарабельность йг в смысле tr можно установить сле- дующим образом. Пусть И1)~ мг — P(xlt . .£r|F2) |d#i, . . dxr, где p xr |F) обозначает плотность распределения в Mri соответствующую функции распределения F. Из- вестно, что йг сепарабельно в смысле t* (см., например, [5], стр. 12 и 228). Так как £*> tr, сепарабельность в смы- сле t* влечет сепарабельность в смысле tr. Это завершает
382 А, ВАЛЬД доказательство того, что допущение 3.2 является след- ствием допущения 3.1. 3. 1.2. Допущения, касающиеся весовой функции PF(jF, d*) и пространства 1У окончательных решений. Как было разъяснено в пункте 1.1.5, для произвольного F s Q и любого d* е D* значение W (F, cF) выражает потери, обусловленные вынесением окончательного ре- шения d* при истинном распределении F. Допущение 3.3. Вес W (F, d*) является огра- ниченной функцией F и d*. Введем при помощи функции W (F, d*) на простран- стве естественную метрику. (Естественное) расстояние между элементами d{ и d2 при этом определяется выра- жением а (4, 4) = sup IW {F, 4) - W (F, |. (3.2) F Допущение 3.4. Пространство D* компактно в смысле естественной метрики, задаваемой весом, __ В дальнейшем под измеримым подмножеством мы будем понимать элемент наименьшего борелев- ского тела подмножеств D\ содержащего все открытые подмножества D*. Под измеримыми подмножествами D =Dl J DG будем понимать те подмножества, пере- сечение которых с D* измеримо. Когда мы будем гово- рить о подмножестве D, мы всегда будем иметь в виду измеримое подмножество, даже если это и не оговорено особо. Всякое конечное пространство, очевидно, компактно. Поэтому для конечного пространства D1 допущение 3.4 выполняется автоматически. Например, допущение 3.4 выполняется во всякой задаче испытания гипотезы Н, так как при этом пространство D1 состоит только из двух элементов d{ и d{, где d{ обозначает решение принять гипотезу Н, а 4 — решение ее отвергнуть. Существуют, однако, задачи статистического решения, рассматривав- шиеся в литературе, для которых в их обычной форме допущение 3.4 не выполняется. Пусть, например, рас- сматриваемый стохастический процесс состоит из един- ственной случайной величины Хх, a Q является клас- сом всех нормальных распределений с единичной дис-
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 383 Персией. Пусть, далее, задача состоит в оценке неизвест- ного среднего 0 в распределении на основе единственного наблюдения над Хг Обозначим через dl* окончательное решение, состоящее в оценке неизвестного среднего ве- личиной 0*. Тогда D* состоит из элементов соответ- ствующих всевозможным вещественным значениям 0*. Пусть весовая функция W (0, dl*) равна (0 — 0*)2. Оче- видно, пространство D* не является компактным. Оно, однако, может быть сделано компактным, путем ограни- чения области значений 0 и 0* некоторым конечным замкнутым интервалом. С точки зрения практических приложений такое огра- ничение не является существенным, так как в большин- стве практических задач представляется возможным указать конечный замкнутый интервал, относительно которого априори известно, что он содержит истинное значение параметра 0. В большинстве задач, связанных с оценками параметров или оценками интервалов, ситуация упрощается. Если первоначальная форма задачи и не удовлетворяет допущению 3.4, то обычно оказывается возможным ограничить область значений неизвестного параметра замкнутым ограниченным множеством в про- странстве всех его значений. Представляется возможным развитие теории на основе некоторого ослабления допущения 3.4, которое выпол- нялось бы для большинства задач, связанных с оцен- ками 1). Однако для простоты мы здесь этого делать не будем. Всякое ослабление допущения 3.4 приводит к заметному усложнению доказательств основных теорем. 3. 1.3. Допущения, касающиеся функции стоимости испытания. Как было определено в пункте 1.1.5, выра- жение с (х\ 5Х,..., sfe) (3.3) означает стоимость испытания, если наблюденной выбор- кой является х, испытание производилось в к шагов, а j-й его шаг состоял в наблюдениях значений случайных х) Это, впрочем, было сделано в статье [70], но развитая там теория относится к тому частному случаю, когда на i-м шаге про- изводится только одно наблюдение над случайной величиной
384 А. ВАЛЬД величин Xj, где j Функция с (х; sk) опреде- лена для всех последовательностей х = {хг} (i = 1, 2,...), любого натурального к и любой системы непересекаю- щихся непустых множеств Sj,..., sk натуральных чисел. Разумеется, стоимость не зависит от компонент если i не содержится в каком-либо из множеств sk. Если Sj,..., sk — непересекающиеся подмножества последовательности натуральных чисел и если s обо- значает последовательность {Sj,..., sk}t то, как и в п. 1.2.1, символ с (х; s) будет использоваться наравне с с(х; s1?..., sA), т. е. с (х; Si,..., sk) = с (х; s). (3.4) В дальнейшем буквой s мы будем обозначать конечную последовательность попарно не пересекающихся непу- стых множеств натуральных чисел. Допущение 3.5. Функция стоимости с (х; s) удовлетворяет следующим трем условиям: (1) с (х\ s) О для всех х и s, и с (х; sx,..., sA, sA+i) >с(х; st,..., sA); (2) для любого заданного s стоимость с (х; s) либо является ограниченной функцией х, либо с (ж; s) = оо тождественно по х\ (3) существует последовательность положительных чисел {cm} (тп = 1, 2,...), для которых lim ст = оо и тп->оо с (x;s) ст для всех х и для всех s= {Sj,..., sA.}, если тео- ретико-множественная сумма s1?..., sk содержит не менее т элементов. Причина допущения возможности того, что при не- которых значениях s стоимость с (х; s) может тождествен- но обращаться в оо, состоит в том, что в определенных ситуациях некоторые значения s практически могут оказаться невозможными х). Если, например, время, тре- бующееся для выполнения одного этапа эксперимента исключительно велико, то никакое значение s= {si,...,sA} при k 1 встретиться не может, что и отражается принятием c(£;s) = оо при А^>1. Может случиться также, что наблюдение над Х$ может быть произведено !) Точнее, неосуществимыми. (Прим, персе.)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 385 только после того, как было произведено наблюдение над Это отражается принятием с (х; 51?..., sj = оо вся- кий раз, когда j является элементом теоретико-множе- ственной суммы $х,..., sk1 a i не принадлежит S. Так как цель статистика состоит в минимизации рис- ка, приписывание значения оо некоторым значениям функции с (х; s) (например, значению 5°) эквивалентно ограничению его выбора такими решающими функциями, для которых выполнение эксперимента в соответствии с наблюдениями над случайными величинами из s° будет иметь вероятность нуль. Общая теория может быть сведена к тем или иным частным случаям путем принятия дальнейших допуще- ний о функции стоимости в дополнение к перечисленным под рубрикой 3.5. Например, если положить с (х;^,= = оо для &^>1, то общая теория сводится к класси- ческому случаю, когда испытание выполняется в один шаг. Если, кроме того, положить с(х\ = 0, когда является подмножеством первых N чисел, и с (х\ sx) = = оо в противном случае, то общая теория сводится к то- му частному случаю, когда выбор статистика ограничи- вается решающими функциями, в соответствии с кото- рыми испытание выполняется за один шаг путем наблю- дения значений первых N случайных величин _Х\,..., Х^. Если стоимость испытания с (х\ sk) зависит толь- ко от х и от теоретико-множественной суммы U ••• U то для всякой решающей функции б (х; s) (см. п. 1.1.4, опре- деление решающей функции) существует другая решаю- щая функция б* (х*, $), для которой, в соответствии с б* (х\ s), каждый шаг испытания состоит только из од- ного наблюдения и Г (F, б*) < г (F, б) для всех F, где г (F, б) обозначает риск, когда F явля- ется истинным распределением величин X = {XJ и б — принятая решающая функция^ (см. определение риска в п. 1.2.1). Таким образом, если стоимость испы- тания удовлетворяет перечисленным выше условиям, то общая теория сводится к частному случаю, при котором выбор статистика ограничен такими решающими функ- циями, для которых каждый шаг испытания состоит из 25 Позиционные игры
386 А. ВАЛЬД единственного наблюдения. Именно этот случай и рас- сматривался до сих пор в теории последовательных крите- риев статистических гипотез (см., например, 165]). 3.1.4. Допущения, касающиеся пространства решаю- щих функций, находящихся в распоряжении статистика. Прежде чем сформулировать ограничения, которые будут накладываться на решающие функции, выбираемые ста- тистиком, введем понятие сходимости в пространстве всех решающих функций. При этом дискретный и абсолютно непрерывный случай мы будем рассматривать отдельно. Если стохастический процесс X = {XJ дискретен, то мы будем говорить, что последовательность {SJ (j = 1,2,...) решающих функций сходится к решающей функции S при f->oo, если1) Пт6{(Р*|О) = дор*|О), КтбД/)* |х; $) = б0 (D* |#; $) г->оо . ' . при всех х и s и для всякого открытого подмножества/)? cz gzZ), граница которого, в соответствии с распределецием б0 (х*, $), имеет вероятностную меру нуль. При этом то- пология в пространстве D определяется следующим об- разом. Как отмечалось в п. 1.1.4, D =De J 2/. Под топо- логией в D* мы понимаем топологию, определяемую есте- ственной метрикой, введенной в D1 (см. 3.2)). Элементы de ЕЕ D* рассматриваются как изолированные точки множества D. Таким образом, всякий элемент de является открытым подмножеством 2), граница которого пуста. Мы можем определить сходимость в абсолютно непре- рывном случае при помощи равенств (3.5). Это опреде- ление сходимости оказывается, однако, в непрерывном случае слишком сильным, и мы заменим его несколько более слабым. В п. 1.2.1. было введено обозначение р (d{ ,..., dly Dl\x, 6) (см. равенство (1.3)) вероятности того, чта испытание осуществится в к шагов, соответ- ствующих df,..., df, и что. окончательное решение d* принадлежит подмножеству 2/ cz 2/, когда х есть на- блюденная выборка, а 6 — принятое правило решения. 1)По поводу определений символов в (3.5) см. пи. 1.1.4 и 1.2.1.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 387 Для к = 0 символ p(di,...,dft, Dl | х, 6) обозначает ве- роятность того, что испытание неосуществимо и что окон- чательное решение принадлежит множеству D1. Пусть р (di dl | х, б) обозначает соответствующую условную вероятность. Для всякого подмножества S = ir} множества всех натуральных чисел пусть Rs обозначает некоторое подмножество r-мерного пространства выборок с компо- нентами xit,..., xir. Положим P(d?.....d!,7)‘|Ps,d) = = \ P(dl, . .., dl, D* |x, ^dxi,, .. ., dxir (3.6) «8 И p (<&..., ^|д8,б) = — P (dl, ..., dl \x, S)dxi„ ..., dxir, (3.7) где S ={1^..., ir} есть теоретико-множественная сумма множеств d\,..., d* в (3.6) и множеств dl,..., dl-.^ в (3.7). При к — 0 левая часть (3.6) по определению равна 6 (D‘ | 0). При к= 1 левая часть (3.7) сводится к 6 (dl | 0). Если стохастический процесс абсолютно непреры- вен, то мы будем говорить, что • lim 6{ = &0, (3.8) 7->ОО если существует последовательность ...........к } (Щ = = 1,..., г-; j =1, т; т =1,2,...) подмножеств D*, для которых limP(d?.....dl, Dl...... 1Я8, d{) = i->oo m _ = P(dl, ..„dlDl^JHs, do) (3.9) И lim P (df, . .., dl | Ps, d() - P (dl,..., dll П8, do) (3.10) i-*O0 при всех к, di,..., dl, и при всяком ограничен- ном множестве Rs и последовательностях ...t к^}, для 25*
388 А. ВАЛЬД которых выполняются следующие три условия: и Ч = D*, U Dk,..........km = Dk....(3.11) Dk..................попаРно пересекаются, (3.12) диаметр .......k при m -> оо сходится к нулю рав- номерно по 4,..., кт. Мы будем называть последовательность {Pl, . } под- множеств, удовлетворяющих условиям (3.11) — (3.13), покрывающей сетью подмножества D1. Определенная выше сходимость в пространстве ре- шающих функций называется регулярной сходимостью в отличие от естественной сходимости, которая будет рассмотрена далее. Прежде чем сформулировать ограничения, которые будут наложены на класс всех решающих функций, вве- дем понятие выпуклости. Будем говорить, что множество 3) решающих функций выпукло, если для любых двух эле- ментов бг, 62 е ® и любого положительного а 1 су- ществует такое бе®, что при всех k, d* и лю- бом подмножестве Бг cz D* выполняются следующие со- отношения: p(dt, ...,deh\x- б) = = <*p(deu ..., 4 |я; 6Х) + (1 — a)/?(di, .. d*\x; 62), £(^,...,^,^1^6)== (3.14a) = ap(<%, ..., 4, D* \x-, dx) + (1 — a)p(4.ft, Df\r', d2). (3.146) Из этих соотношений следует, что a = (4+i|z; 4,...,4) = _ «р (4......4+11fii) + (j — а) р (4> • • •> 4+х I х'> 6з) ар(4,.... 41 х> 61) + (1 — «)р(4> • • 41 (3.14в)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 389 и 6 (& IХ-, d{, .... 4) = ар (dev . . 4, 5г | Si) + (1 — а) р (<%, .. dek, D* | г; S2) ...........41^; Si) + (l-a)p(4....| ^; 62) . ’ (3.14г) знаменатель в двух последних дробях отличен от нуля. Таким образом, для всякого D* cz D J De со- отношения (3.14a) и (3.146) определяют единственным образом значение б (Р* | х; df, ..., df) при условии, что р (df,..., df | х;8) =f= 0. Если же р (df,..., df | х,8) = 0, то для нас безразлично, какое значение приписано б (Р* | х; df,..., df), так как это не влияет на величину риска г (£, б). Ясно, что (3.14в) и (3.14г) не только не- обходимы, но и достаточны для (3.14а) и (3.146). Очевидно, использование смешанной стратегии ц (т. е. вероятностной меры на пространстве всех допусти- мых решающих функций б), приписывающей стратегиям бх и б2 соответственно вероятности а и 1 — а, равносиль- но использованию чистой стратегии б, удовлетворяющей условиям (3.14а) и (3.146). В общем случае также можно легко показать, что всякая смешанная стратегия эквива- лентна некоторой чистой стратегии б. Если пространство ® решающих функций б выпукло и замкнуто (в смысле регулярной сходимости), то всякая дискретная смешанная стратегия ц (вероятностная мера, при которой некоторое счетное подмножество простран- ства 30 имеет вероятность 1) эквивалентна чистой страте- гии 6е 2). Мы можем теперь сформулировать допущения, ка- сающиеся класса ® решающих функций. Допущение 3.6. Класс 3) решающих функций должен удовлетворять следующим условиям: (1) 3) является выпуклым; (2) 3) является замкнутым подмножеством в смысле регулярной сходимости в пространстве всех решающих функций; (3) для любого s — {sr,..., sk} существует такое на- туральное число ск, зависящее только от к, что для про- извольного б Е= 3) мы имеем б (de| х; s) = 0, если только
390 А. ВАЛЬД de не является подмножеством конечного множества {1, 2,..., с*}; (4) если с (х; df,,.., df) = оо тождественно по х, то p(d!, ...,df\x\ d) = 0 для всякого х и любого элемента 6 Е2); (5) решающая функция 6 есть элемент 3), если суще- ствуют такое So GEE ® и такое d^GE D\ что для любых х и s мы имеем либо 6 {х\ s) = б0 (#; $), либо 6 (do | х, s) =1. Условие (5) постулировано для того, чтобы обеспе- чить возможность усечения всякого S ЕЕ 3). Этот процесс усечения будет далее использован при доказательстве некоторых лемм и теорем (см., например, лемму 3.2). Класс 3\ всех решающих функций, удовлетворяю- щий условиям (3) и (4) допущения 3.6 для данной по- следовательности {ск}, как легко проверить, удовлет- воряет и условиям (1), (2) и (5). Решающие функции, принадлежащие перечисленным в п. 3.1.3 классам, удовлетворяют допущению 3.6. В частности, все решающие функции, в соответствии с ко- торыми испытание осуществляется в один шаг путем наблюдения над N случайными величинами Хх,..., удовлетворяют допущению 3.6. Это допущение выпол- няется также для всех решающих функций, для которых i-й шаг испытания состоит в единственном наблюдении над Xi (i = 1, 2,...). Отметим причины, по которым мы не делаем предпо- ложения, что 6 (х; =6 (х; si,..., si), (*) если теоретико-множественные суммы Sj J ...|JsA. и 5i U ••• U5r равны. Это предположение привело бы к трудностям в абсолютно непрерывном случае, ввиду того что множество 3) в множестве всех решающих функ- ций должно быть замкнутым. Определим теперь такую последовательность {S{} (i = 0, 1, 2,...) решающих функ- ций, что в смысле регулярной сходимости lim = So, i->oo причем (г 1) удовлетворяют предположению (*), а 60 — нет.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 391 Пусть D1 состоит из двух элементов и a eft означает решение произвести наблюдение над X- . Область значений есть сегмент [0,1]. При i 1 ре- шающая функция 8г определяется следующими равен- ствами: dt(deiio)=4’ мло)=ц, &i(de2\x; del) = [1, если 4- -Г; 1 для некоторого четного к, 10 в противном случае, Si (de31X- del) = 0, Si (D* IX-, del) = 1 — 6i (T21 x\ dei), б, (del | x; de2) = ( к к ] 1 11, если — —т— для некоторого четного А, 10 в противном случае, Si(de3|«; de2) = 0, 6Д1ф;<Г2) = 1 — Si(<7el|z; <Г2), 6i(de3|.r; de\ de2) = к к I 1 1, если т— для четного к и — . к к 4-1 , у ^2 <С —1— для некоторого нечетного к, .0 в противном случае, ^(D^x; del, de2) = 1 —Si(t?e3|.r; del,'de2), S{ (de31 .t; de2, del) = S< (deS | x; del, de2), Si (Z>‘ | A de2) = Si (Z>! | de2, Z1), S{ (£>' | x; del, de2, de3) = S{ (D* | x; de2, del, de3) = 1 и для произвольного 5 Si(4|^;S)= lSi(Z/|z;S) (/ = 1,2). Для произвольного 5 = { sk}, для которого S (rr; 5) еще не определено приведенными выше равенствами и условием (*), мы положим Si (d| I я:; з) = 4 0 = 1,2).
392 А. ВАЛЬД Легко видеть, что последовательность 8i сходится при г-»оо к 6), где решающая функция бэ определяется равенствами: 60 (de* 10) = do (de210) = 1 So (de21x- del) = I, So (dj-l x-, del) = | (7 = 1,2), 60 (del | ж; de2) =±, So(dH*; <*e2) =4 (/ = 1,2), S0(de3|rc; t7el, de2) =1, S0(^|a:; del, de2) = ± (/ = 1,2), So (de31 x- de2, del) = 0, So(dlj।x, d°2, del) =1 (/ = 2)> dei, de2, de3) = 1 (7 = 1,2). Распространение определения 60 {x\ s) на те значе- ния 5, для которых эта функция на основании перечи- сленных равенств еще не определена, может быть сдела- но подобно тому, как это делалось для 64 (я; s) {i 1). В то время как 8г при i > 1 удовлетворяют условию (*), решающая функция б0 этому условию не удовлетво- ряет. 3.1.5. Допущения об измеримости. В этом пункте мы отметим несколько условий измеримости, обеспечиваю- щих существование интегралов, которые появляются в формулировках, связанных с определением функции риска (см. п. 1.2.1). Пусть М — бесконечномерное пространство выборок, т. е. М является совокупностью всех последовательно- стей х = {хг}. Пусть В — наименьшее борелевское те- ло, содержащее все множества точек х, удовлетворяю- щих отношениям х ai G = 1» 2,...), где ai — вещественные числа или + сю- Пусть, далее, Н — наименьшее борелевское тело подмножеств множе- ства Q, содержащее все подмножества Q, открытые в смысле сходимости, определенной в (3.1). Пусть, на- конец, Т — наименьшее борелевское тело подмножеств D = Dl J £>е, открытых в смысле топологии простран- ства Z), определенной в п. 3.1.4.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 393 Под произведением Н X Т мы будем понимать наи- меньшее борелевское тело подмножеств декартова про- изведения й X /), содержащего все декартовы произве- дения членов Н на члены Т. Аналогично определяется произведение Н X Я. * Только подмножества множеств Q, D и М мы будем считать (соответственно) измеримыми в смысле (Я), (Т) и (5). Сделаем следующие допущения об измеримости. Допущение (ц^. Функция W (F, dl) является (Н X Туизмеримой. Допущение (ц2)- Для всякого натурального т функция fm(xi,..., хт \ F), рассматриваемая как функция х и F, (Н X В)-измерима. При этом fm (а^,..., xm{F) обозначает элементарную вероятность в совместном распределении Хг,..., Хт, если истинным распределением X является F х). Допущение (ц3). Для всякого D* cz Т и любого s ~ sk} функция б (Z>* | х\ s) является (Вуизме- римой. Допущение (ц4). Для всякого s = s^} функция стоимости с (х; s) является (Вуизмеримой. Справедливость этих допущений об измеримости бу- дет предполагаться до конца книги, даже если это и не оговорено специально. Докажем теперь, что перечисленные условия гаран- тируют измеримость в смысле Н функции риска г (F, б) при любом 6. * Рассмотрим сначала абсолютно непрерывный слу- чай. Из допущения (ц3) следует, чтор (di,..., dl, б), как функция х, является Д-измеримой. Следовательно, на основании допущения (ц2) q d%, Dl | F, б) су- ществует и, как функция/7, Я-измерима2 * *). Отсюда следует, х) Если стохастический процесс дискретен, то fm (.гх, . . xm\F) обозначает вероятность события Xi — х±, Хт ~ хт. Если сто- хастический процесс абсолютно непрерывен, то fm(xi, . . xm\F) есть функция плотности. 2) Интеграл в (1.4) можно записать в виде ф(.г, F) dB (х) М и применить теоремы 9.3 и 9.10 книги Сакса ([44], глава III); В (х) означает меру Бореля.
394 А. ВАЛЬД что существует вероятность Р (D*1 F, ё) (определенная в (1.5)), Я-измеримая, как функция F. Ввиду компактности D* интеграл (см. формулу (1.6)) П {F, б) = W (F, d*) dP Ф11F, б) Dt может быть представлен как предел функций (F, 6) при i ->оо, где иг Гц (F, 6) = 2 W <F’ dii) Р (Ч1 F, б), 7=1 щ — натуральное число, d\j^D\j и D\j ЕЕ Т. Так как функция W (F, dij) является измеримой, функция (/, 6) также Я-измерима, а потому Я-измерима и функ- ция т\ (F, 6). Из допущений (ц3) и (ц4) следует, что произведение с (x\d\,,.., d^) р (dj,..., dt,Dl\ х, б), как функция х, В- измеримо. Отсюда и из допущения (ц2) следует, что ин- теграл 2) jj с(х; d{, . .., d{) p(d{, . . dt, D'\x, 8)dF(x), м как функция F, является Я-измеримым. Значит, функ- ция r2 (F, S) также должна быть Я-измеримой. Поэтому и г (F, 6) = (F, 8) + r2 (F, 8) является Я-измеримой функцией. Доказательство того, что функция г (F, 8) яв- ляется Я-измеримой в дискретном случае, аналогично, причем вместо интегралов рассматриваются суммы. § 3.2. Слабая естественная компактность пространства решающих функций 3.2.1. Компактность пространства решающих функ- ций в смысле регулярной сходимости. Основной задачей настоящего пункта является доказательство компактно- сти пространства 3) в смысле регулярной сходимости, 2) Интеграл можно записать в виде ф (х, F) dB (.г). М
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 395 определенной в п. 3.1.4. В следующем пункте этот ре- зультат будет использован для доказательства слабой естественной компактности пространства 25. Говоря более точно, докажем следующую теорему. Теорема 3.1. Если допущения 3.1—3.6 справедлив вы, то пространство 35 решающих функций компактно в смысле регулярной сходимости, определенной в п. 3.1.4 х). Доказательство. Рассмотрим сначала слу- чай, когда стохастический процесс X = {X} дискретен. Как было выяснено в п. 3.1.1, в этом случае мы без огра- ничения общности можем принять, что значениями слу- чайных величин Xj являются натуральные числа. Для всякого 5 = {$!,..., sk} пусть Ds обозначает подмножество D, состоящее из всех элементов d* EzD*' и таких элемен- тов de ^De, для которых de cz {1, 2,..., ck}, где cs — натуральное число, выбранное в соответствии с усло- вием (3) допущения 3.6. Ясно, что б (Ds\ х; s) ~ 1 для всякого и при любых X и 5. Так как Ds содержит только конечное число элементов вне Df, йз допущения 3.4 следует, что Ds компактно. Значит, если {6J (i ~ = 1, 2,...) — последовательность элементов D, то по лю- бым заданным х и s найдется такая подпоследователь- ность {i,} (/ = 1, 2,...) последовательности {i} и такая вероятностная функция б (Р|х, $), определенная на всех измеримых подмножествах D* cz D, что lim 6iy (£>* | x; s) = 60 (Z>* | x; s) « (3.15) 7—>oo при всяком открытом подмножестве Z)* cz D, граница которого, в соответствии с вероятностной функцией б0, имеет вероятность 0. Подпоследовательность {i-} может зависеть от х и s. Однако так как имеется только счет- ное множество элементов $ и так как для всякого данного s компоненты ХР---, Xim, от которых зависит значение б (х, s), могут принимать только счетное число значений, известный диагональный процесс может быть исполь- зован для получения фиксированной подпоследовательно- х) Эта теорема тесно связана с известными теоремами о «сла- бой» компактности множества функций. См., например, теорему 17 Ь (стр. 33) в книге [72].
396 А. ВАЛЬД сти {ij} (не зависящей от х и $), для которой (3.15) вы- полняется. Таким образом, в дискретном случае теоре- ма доказана. Для доказательства этой теоремы в абсолютно непре- рывном случае возьмем подпоследовательность {£>} (/ = 1, 2,...) последовательности натуральных чисел, вы- бранную так, что для любых df,..., dek и любого куба Т8 с рациональными вершинами в конечномерном про- fc странстве выборок, соответствующем S (S — J df), 1 вполне аддитивная функция Р (df,..., df, Д*| Ts, 6i?.), определенная на всех измеримых подмножествах A* cz D\ сходится к вполне аддитивной функции Н (Az| df,-, d?f, 7’Sr), т. e. lim P (di...d^Z^ T8, i>i}) = Ji (Z‘ | di, .... 4, Ts) (3.16) ;->-oo для всякого открытого подмножества Z* cz для ко- торого ц (Zz\Zfdf ,...,df, Ts) =0. Так как df,..., dl и Ts могут принимать только счетное множество значений и так как пространство всех вероятностных мер на ком- пактном множестве компактно (теорема 2.15), подпосле- довательность {1} с требуемым свойством может быть построена при помощи диагонального процесса. Для произвольного заданного подмножества A* cz D1 и для заданных df,..., df- функция ц (A^df,..., df, Ts), определенная для всех рациональных кубов Т8, может быть продолжена до вполне аддитивной функции ц (A*df,..., df, 7?s), определенной на всех измеримых по Борелю подмножествах Rs пространства выборок, соот- ветствующего S. Мы будем пользоваться символом Р (Rs | df,..., df, Af) синонимично с ц (Af | df ,..., df, 7?s), т. e. будем полагать Р (Rs | d{,... , dl, Д') = и (Д' | d{.dl, Rs). (3.17) Эти обозначения особенно удобны при фиксированных Д', di,..., dl.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 397 Выберем покрывающую сеть {£>£,... , кт}, удовлет- воряющую следующим условиям: а) любой элемент Dlkl.из покрывающей сети со- держится в множестве ZL ... ?. , где Zfel ... % —открытое ядро1) множества , a Zkt.....к — замыкание ..и ; ш (б ) для любого элемента 1)^.к покрывающей сети и произвольных /, б?*, , dk и Т$ выполняются равенства И(Д,...fcjn\Zt.,Am|dL...I^,7,s) =0 И Р (dt.. . , dek, .ьт \ z(..... ,ьт I rS) б{.) = 0. Из (3.16), (3.17) и условия (б) следует, что limP (dt,..., \Ts,bi) = j->oo J = P{T8\der..................(3.18) Поскольку это равенство имеет место при всех Ts, оно выполняется и для всякого измеримого ограниченного подмножества Rs, т. е. j-*OO т J = P(Ts|dL...)dLZ)L...:U- <3-19) Нетрудно убедиться в том, что подпоследовательность {ij} может быть выбрана так, что, кроме (3.16), для не- которой функции множества Р (Rs | di,..., dk) выполняет- ся и следующее соотношение: lim Р (df, ..., dek | RSt dj = P (Rs | di,..., dem). (3.20) J—>co J В этом равенстве S обозначает теоретико-множественную сумму di,..., dfc.x, в то время как в (3.19) — сумму «У-, 4- г) Точка d* принадлежит открытому ядру множества А*, если существует сфера с центром в d* и с положительным радиусом, содержащаяся в Д*.
398 А.. ВАЛЬД Установим теперь некоторые свойства функций мно- жеств P(R8\d{.....dl, Dl-t...J и P (Rs |di,..., dl). Очевидно, P(Rs\di,...,dl) >0, (3.21a) P(PS|<4, 4,....fcjn)>0; £Р(Я8|(П,...,.<4,^,.....fcJ = = P(/?s|de1,..,4,4....(3.216) Поскольку P (di,..., 4_1, Dl|x, d<) + SP (di,... , dek\x, 00 = 4 = p(<4.....4-xl^.dO, последнее соотношение остается в силе, если заменить х на 7?s, а р на Р. Из (3.19), (3.20) и из того, что d£ при за- данных di,..., d®-! может принимать только конечное число значений (условие (3) допущения 3.6), следует, что я')+ SP(Ps|dei,...,^) = 4 = Р (Rs\di,..., dl^). (3.21в) Пусть Z — произвольный элемент последовательности {Zk ..... fcm}, a {Zi} — такая подпоследовательность последовательности {Zkl..,,.km}. что элементы {ZJ суть непересекающиеся множества, и У ZJ= Z. Тогда в силу счет- з ной аддитивности функции множества р, (Д* | df,..., dk. Ts) получаем P(Ts\di,...,dek,Z) = %P(Ts\di, ...,dl,Z\ (3.21г) j Для любых <4» • • •, dl и любого подмножества Д'с D1 функции множеств Р (Rs | di.dek,^)nP(Rs\di.....dek)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 399 абсолютно непрерывны. Следовательно, для лю- бых df, .. . , dl и Д* существует такая пара функций р* (х | df, .. . , d/e, Дг) и р (х | df, . . . , dfc), что \р- (х \d{,. . ., dek, Д') = Р (Rs | 4, ..., 4, Д') (3.22) Rs и С /)(Ж|4,...,4) = Р№|4,...,4). (3.23) «s Из (3.21а) и (3.21г) следует, что почти для всех х выпол- няются следующие условия: /(®|4,...,4,U........U>0’ Ж4,...,4)>о, (3.24а) •s р* {x\delt. .. , dek, Dkt ...,к) = = /(x|4,...,4,£>L.....fcm), (3.246) p* (* | d{.4-1, £>')+' S p (И 4, •••, 4) = 4 = p(x|4,...,4_1) (3.24b) p*(x\d{, ...,4,Z) = S/H[4,..:,4,Z})) (3.24r) j где под Z понимаются те же множества, что и в (3.21г). Из условия (б) непосредственно следует, что соотношение р*(*| 4....4, Dl,...kj = р*(®|4, • •4,4,.....km)= = p-(^|4,....,4,41,...,km) (3.24д) имеет место почти при всех х. Легко выбрать функции р и р* так, чтобы условия (3.24а) — (3.24д) выполнялись для всех х.
400 А. ВАЛЬД Положим для любых х, di,..., dl и любого открытого подмножества Zl cz D1 (не обязательно из последователь- ности {Zkt..цт}) p(x\d{.....4, Z‘) = supp* (x|4,..., 4, z*f), (3.25) z*( где Z*f может быть суммой любого конечного числа эле- ментов из последовательности {Z^,...^}, замыкание ко- торой Z** является подмножеством из Z*. Для любых х, di,..., dl функция р (х| dei,..., dl, Z1) может быть про- должена до вполне аддитивной функции множества р (х/ dl,..., dl, А*), определенной на всех измеримых под- множествах А* пространства D*1). Из (3.24г) и (3.25) сле- дует, что р (* 14......4,4.....U = / (* I4, • • •, 4, 4„..., fem). (3.26) Поскольку S-.-2WI4...............4,4....fcm) = = /(х|4,• • •, 4, #г) = р(*|4, .... 4,/>'), из (3.26) вытекает, что P^\d{........^,Zt1Clt..„1Cm\Zkl,..„km)=Q. Следовательно, p(x\dl, ...,dek, z4,.*m) = /(*14........4,.......»m). (3.27) Пусть So — функция, определяемая равенствами Л It- r7e de\ - ....Д<) (3 do (A I x, 4, ..., 4) - ....(3.28) !) Доказательство этого факта содержится в доказательстве теоремы 2.15.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 401 и мм*;dt,. <з.29> P(x\dev . . . , 4) Еслир (x [df,..., df,) = 0, то положим 6Э (d/e+1 [я; dl,..., df) =0 и 60 (d*\ x;dl,..., dl) = 1 при некотором заданном d* G Из (3.28) следует, что для любых х, dl,..., d£ функ- ция множества б0 (Д*|я; dl,..., dl) неотрицательна и вполне аддитивна. Из (3.24в), (3.28) и (3.29) мы полу- чаем di,..., 4) + S dL 4+i (3.30) Следовательно, 60 есть решающая функция. Очевидно, что р (dl, ... , dl | х, do) = P (x | dl, .. . , dl) (3.31) и p (di,... ,dek,^\x,83) ^P(x\ di, ...,dt Д1). (3.31a) Сходимость 6i. к 60 при j -> оо является непосредствен- ным следствием этих двух равенств, а также равенств (3.19), (3.20), (3.22), (3.23) и (3.27). Это завершает дока- зательство теоремы 3.1. 3.2.2. Доказательство слабой естественней компакт- ности пространства решающих функций. Пусть {б{} (i = 1, 2,...) — последовательность решающих функций. Будем говорить, что эта последовательность сходится в смысле естественной сходимости к 60, если limr(jF, ^) = r(F, do) (3.32) г-*оо равномерно по F. Из этого равенства следует, что lim г (Z, бг) = г (I, б.) г-*оо равномерно по всем априорным распределениям g. Если, кроме того, соотношение lim inf г (g, dt) > г (g, do) (3.33) г-*оо 26 Позиционные игры
402 А. ВАЛЬД выполняется для всех £, то будем говорить, что б{ слабо сходится в смысле естественной сходимости. Мы будем говорить, что пространство 2) всех ре- шающих функций, имеющихся в распоряжении стати- стика, компактно в смысле слабой естественной сходи- мости, если для каждой последовательности элементов {6J(Z = 1,2,...) из 25 найдется такой элемент б0 ® и такая подпоследовательность {6$.} (/ = 1, 2,...) после- довательности {6J, что lim inf г (£, 6J > г (£,б 0) (3.34) У—>оо для всех В этом пункте мы докажем следующую тео- рему. Теорема 3.2. Если имеют место допущения 3.1—3.6, то из регулярной сходимости 6$ к б0 следует слабая естественная сходимость к б0. Далее, если имеют место допущения 3.1—3.6, то пространство 2) решающих функций компактно в смысле слабой естествен- ной сходимости. Доказательство. Второе утверждение тео- ремы 3.2 следует из теоремы 3.1 и первой части теоремы 3.2. Поэтому достаточно доказать первое утверждение этой теоремы. Пусть {6J — такая последовательность решающих функций, что lim б^ = б> в смысле регулярной сходимо- сти. Пусть | — некоторая априорная вероятностная мера на Q. Если lim inf г (|, б|) = ею, г-*оо то первая часть теоремы 3.2, очевидно, доказана. Поэто- му достаточно рассмотреть вероятностные меры *£, для которых lim inf г (^, б$Х оо. г—>оо Но в этом случае мы можем ограничиться рассмотрением такой подпоследовательности {6^} последовательности {6J, что lim г (|, 6{.) = lim inf г (1, д{). >оо J г—*оо
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 403 Следовательно, при доказательстве первой части теоре- мы 3.2 достаточно рассмотреть вероятностные меры для которых г (g, б^ является ограниченной функцией Л Во всем дальнейшем доказательстве мы будем рассмат- ривать только такие последовательности. Дискретный случай. Пусть {6J — после- довательность элементов Ж, а £ — такая априорная ве- роятностная мера, что г (£, 6^) является ограниченной функцией от г (i > 1), причем сходится при i->oo к б0 в смысле регулярной сходимости. Из теоремы 3.1 следует, что теорема 3.2 будет доказана, если мы уста- новим, что lim inf г (g, 60 > г U, б0). (3.35) г->оо Пусть D1 — произвольное открытое подмножество мно- жества D\ граница которого при любых df,..., d^ и х имеет нулевую вероятность по мере б0 (#; df,..., d^). Из регулярной сходимости б{ к б0 следует, что lim р (rfL .. . , 4, & | х. 60 - р (d!, . . . , 4, W, бо). (3.36) г-*со Пусть fm (^j,..., хт | F) есть вероятность того, что хг = ...,хт == хт при истинном распределении F. Далее, пусть fm (Xi, ... , хт I g) = fm (хи. .. ,xm\F)d%. (3.37) Таким образом, fm (жх,..., жт||) есть вероятность того, что Хг = х1ч...,Хт = хт при априорном распределении £. Пусть qРг|£, d)= _ = S p(de1,...,dl,Dt\x,d)fm(x1,...,xm\l), (3.38) Х1Э ... ,Хт где т — такое натуральное число, что все с^при i = содержатся в {1,..., т}. При к = 0 левое выражение в (3.38) полагаем по определению равным б (D1 | 0). Из (3.36) следует, что lim q (d{,... , dl, D* I L di) = q (d{, ...^1,77 [%, do). (3.39) i-*oo 26*
404 А. ВАЛЬД Из условия (3) допущения 3.5 и ограниченности г (£, 6t) следует, что для всякого положительного р су- ществует такое натуральное кр, зависящее только от р, что вероятность того, что число шагов к испытания при апри- орном распределении £ на Q и решений функции пре- взойдет кр, будет не меньше чем 1 — р. Это значит, что *р 3 3 ^,Z/|£A)>l-p (г>1). (3.40) &~° dte,.... dek Из условия (3) допущения 3.6 следует, что для всякого / множество возможных значений dj конечно. Из этого и из соотношений (3.39) и (3.40) следует, что ]ip 3 3 £>'|Мо)>1-р. (3.41) fcx=0 яе .е dl......dk Так как р может быть выбрано произвольно малым, мы из (3.40) и (3.41) получаем, что оо S S <7(^,...Х,Я%бг) = 1 » “к (; = 0, 1,2,...). (ЗЛ2> Пусть MS, d; di,..., dl) = = $ $ W (F,dl)dq(di,...,dl,Dt\F,b)dl, (3.43) ft Dt и пусть Ml, 6; di,..., dl) = 2 c(x-,d{, ...,<%) x Xi,..., Xm X p(di.....dl,Dl\x, d)fm(xlt... , xm I £), (3.44) где m таково, что df содержится в {1,..., m} при i = 1,... Из (3.42), (3.43) и (3.44) следует, что МЛ)=3 3 3 r^t^di...........dl) (3.45) j=l Л=0 ... (г = 0, 1, 2, ...).
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 405 Так как W (F, dl) — непрерывная функция от d‘, а про- странство Р' компактно, из (3.39) вытекает, что lim \W(F,dt)dq(de1,...,dl,Dt\F,di) = i-oo Dt = W(F, d,)dq(de1........4, P'|F,60). D* Так как функция W (F, d*) ограничена, из последнего соотношения и (3.43) вытекает, что lim П (В, S- df, .. . , dV) = П (В, So; d{,..., dl). (3.46) i—*oo В соответствии с условием (2) допущения 3.5 для любых величина с (х*, df,..., d£) либо тождественно по х обращается в оо, либо является ограниченной функци- ей х. Так как г (£, 6^ является ограниченной функцией I, должно быть ,p(dl,...,dl,Dl\x,^) = Q (i>l) для всех тех х, для которых с (х\ dl..., dl) = оо, за ис- ключением, может быть, точек х = хт}, для ко- торых fm (^х,..., хт] £) = 0. Отсюда, принимая во внима- ние (3.36), мы имеем р (di, ...,dek, Р‘|ж, д,) = 0 также и для всех тех х, для которых с (х; d?,..., dek) = оо. Но тогда из (3.36) и (3.34) следует, что limr2(§, S- dl.. . , 4) = r3(g, d0; dl..., 4). (3.47) i—>oo Неравенство (3.35) является непосредственным следствием соотношений (3.45), (3.46) и (3.47). Это завершает доказа- тельство теоремы 3.2 в дискретном случае. Абсолютно непрерывный случай. При доказательстве теоремы в абсолютно непрерывном случае мы воспользуемся следующей леммой. ’ Лемма 3.1. Пусть (5) (i = 0, 1, 2,...) — не- отрицательная, вполне аддитивная функция множества, определенная на всех измеримых подмножествах S r-мерного пространства выборок Мг,
406 А. ВАЛЬД Пусть Т. (5) < V (S) (3.48) для всех S (г = 0, 1, 2,...), где V (5) есть лебегова мера множества S. Пусть g (х^..., хг) — такая неотрица- тельная функция, что 5 , xr)dx^. . ., dxr оо. (3.49) Тогда, если lim 7\ (5) = Го (£), (3.50) г-*оо то lim £ g (жх,. г-*оо у Мг , хг)дТг = g(xu . . . , жг) dT (3.51) мг Доказательство. Пусть Мгс — сфера в Мг с центром в начале координат и радиусом с. Очевидно, Отсюда и из (3.48) получаем, что 0 (3.53) lim Г \ g(xlt ..., xr)dTi — V Ч с 4 равномерно по г. Следовательно, наша лемма будет до- казана, если мы установим, что lim £ g(%i,. . . , xr)dTi = g(#i, .. . , xr) dTQ (3.54) i-*OO 1Z 1LT Mr,c Mr,c для любого конечного с. Пусть [g(Ti,. . . , хг), если g (.Г1, ... , хг) И1, • • • 1 хг) — j (0 в противном случае. Так как gA) dx±. . . dxr = 0, г,с
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 407 из (3.48) следует, что lim £ (g — gA)dTi = 0 (3.55) Л^°° mJ Г» с равномерно по г. Таким образом, наша лемма будет до- казана, если мы сумеем показать, что для любого с > 0 и любого А < 0. Пусть Sj —- множест- во всех точек в МГгС, для которых (/- 1) в <gA <j8, (3.57) где 8 — заданное положительное число. Мы имеем 3(7- 1) 8 5 <^<3/8 (3.58) ’ 8/ Мг,е 1 Si (i = 0, 1, 2, ...). Так как для каждого 8 переменная j может принимать только конечное число значений, а 8 может быть выбра- но произвольно малым, лемма 3.1 непосредственно сле- дует из (3.50) и (3.58). Покажем теперь, что достаточно доказать теорему 3.2 для любого конечного пространства Dl. С этой целью предположим, что теорема 3.2 верна для любого конеч- ного пространства окончательных решений, но что суще- ствует такое бесконечное компактное пространство оконча- тельных решений//и такая последовательность решающих функций {6$} (i = 0, 1, 2,...), что Итб^ = б0 в смысле регу- лярной сходимости и lim inf г (g, fy) = г (g, бэ) — р (3.59) г—>оо для некоторого £ (р > 0). Так как lim 6$ = б0, существует г~>оо _ покрывающая сеть//, т. е. последовательность .... & } (kj = 1,..., r7; J = 1,..., т\ т = 1, 2,...) подмножеств множества удовлетворяющих соотношениям (3.11)—
408 А. ВАЛЬД (3.13), и притом такая, что имеют место (3.9) и (3.10). Таким образом, lim Р (4,..., 4, Di......lc\Hs,di) = i-.co т = .....(3.60) и lim Р (4......4 |HS, 6i) = Р(4, •., 41PS, до), (3.61) г->оо где S в (3.60) означает теоретико-множественную сумму di,..., d£, а в (3.61) — dp..., dLi- Пусть т0 — некоторое фиксированное значение тп; рассмотрим соответствую- щую конечную последовательность ................} подмно- жеств Z/. Пусть h — число элементов в этой конечной по- следовательности. Выберем по одной точке из каждого элемента последовательности {DV . к } и обозначим # Wo выбранные точки через di,..., dh, а множество всех то- чек di,..., dh через D*. Пусть Si — решающая функция, определенная следующим образом: d{ (de | х; s) (<Г |Ъ; 8), (41 х; 8) = (D^ .... | х- s) (3.62) (г = 0, 1, 2,...), где 4 — элемент последовательности 4}, содер- жащийся в Di.....* . Очевидно, из (3.60) и (3.61) следует, ЧТО lim = 6 . (3.63) i->oo Для данного е 0 и достаточно большого т0 мы, оче- видно, имеем |г (ё, Si)-г a, Si)|<8 (3.64) для i = 0,1, 2,... Так как для конечного D1 наша теорема по предполо- жению верна, мы имеем lim inf г (g, d|) > г (£, d0). (3.65) i-*oo
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 409 Выбирая 8 р/3, мы из (3.59), (3.64) и (3.65) выводим противоречие. Таким образом, достаточно доказать тео- рему 3.2 для конечного D1. В оставшейся части доказа- тельства мы будем полагать, что D* состоит из точек d!,..., d^. « Пусть S — {/i,..., ir} обозначает теоретико-множе- ственную сумму df,..., d£, и пусть / (х; S | F) — сов- местная плотность распределения величин Xit ,..., Xir, соответствующая элементу F Е Тогда, если £ есть априорное распределение на й и применяется решающая функция 6, то вероятность того, что испытание будет выполнено за к шагов в соответствии с d? ,..., d£, а окон- чательное решение будет равно d^, задается выражением q(del,...,dek,dtu\^,^ = = 5 p(de1,...,dek,dtu\x-,^f(x-,S\l)dx, (3.66) где Mg обозначает r-мерное декартово пространство с ко- ординатами хи ,..., xir и f S | £) = / (х; S | F) dl. Равенство (3.66) может быть переписано в виде q(d{.....4,4|g, «) = = $ f{x-S\$dP(dek, ... (3.67) Ms где функция множества P определена в (3.6). Так как при i -> оо сходится к 60 в смысле регулярной сходи- мости, мы имеем limP(dL..., 4, 4| Rs, «i) = р(<%,....4, 41 RS, 6). <«*00 (3.68) Из (3.67), (3.68) и леммы 3.1 следует, что lim q (d!,. .. , 4, 4| В, d<) = q (^, • • • , 4, 4| I, У). (3.69) i->oo Аналогично дискретному случаю, из условия (3) до- пущения 3.5, из ограниченности г (|, 6{) (г > 1) и из
410 А. ВАЛЬД равенства (3.69) следует, что S S ..............dl, 15,60 = 1 (3.70) к=0 <4..d® (г = 0,1,2,...). Пусть ^(5,6; 4,...,4) = = f $Ж(^,4)?(<П,...,4,4|ЛдИ£ (3.71) u==1 о и r2(g, d;dl...4) = (3.72) = $ с(х\ D‘|x,d)/(x;S|g)d.r, MS где S ~ {ix,..., ir} есть теоретико-множественная сумма df,..., a Ms обозначает r-мерное декартово простран- ство с координатами xit xir. Из (3.69) и (3.71) сле- дует, что limrx(g, 6t; de19 . .. , dek) = n (g, d0; de19 . . .9der i->oo (3.73) Равенство (3.72) может быть записано в виде r2(g,S;4,...,4) = = $ с (ж; 4, ..., dl)f (х; S\l)dP (d{.<%, D* I Rs, d). (3.74) Из (3.70) следует, что r (I, di) = S § S Ml, d; ...........4) (3.75) j=l fc=o de.de (г = 0,1, 2, ...). В силу регулярной сходимости 6^ к 60 мы имеем limP(4,...,4,= ....4, D* I Rs, So).
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 411 Покажем теперь, что limr2(l, dj; dL ... , d£) = r2 (g, d0; df,..., dj). (3.77) г-*оо * В соответствии с условием (2) допущения 3.5 при лю- бых фиксированных df,..., dl и к функция стоимости c(#;df,...., df) либо тождественно по я равна оо, либо яв- ляется ограниченной функцией х. Из ограниченности г (£, б|) по i (i 1) следует, что q(di.....<%, D*1 g, di) = 0 (i>l) (3.78) при любых df,..., df, для которых тождественно по х с (х; d{,..., d^) — оо. В силу (3.69) это остается верным и при i = 0. Таким образом, в равенстве (3.75) мы можем ограничиться суммированием по тем значениям df,..., df, для которых с (я; df,..., df) является ограниченной функ- цией от х. Но тогда из (3.74), (3.76) и леммы 3.1 следует, что limr2 (g, d- df,... , df) = r2(g, d0; df,... , df). (3.79) i-»oo Первое утверждение теоремы 3.2 является непосредствен- ным следствием (3.73), (3.75) и (3.79). Второе же ее утверждение следует из первого и из теоремы* 3.1. Доказательство теоремы 3.2, приведенное выше в дис- кретном и в абсолютно непрерывном случаях, непосред- ственно устанавливает справедливость следующей тео- ремы. Теорема 3.2а. Если выполнены допущения 3.1 — 3.6, если допустимыми являются только те решающие функции 6, для которых с вероятностью 1 число шагов испытания не превосходит заданного натурального к0, и если для всех S стоимость с (х; s) является ограни- ченной функцией от х, то lim 6$ — 60 в смысле регуляр- г~»оо ной сходимости означает, что limr(£, d^) = r(£, 6Q) для всех | (сходимость не обязательно равномерна по £).
412 А. ВАЛЬД § 3.3. Естественная сепарабельность пространства Q Для всякого натурального т обозначим через 3)т множество всех решающих функций б, Являющихся элементами 5) и обладающих тем свойством, что при применении решающей функции б вероятность проведе- ния испытания не более чем за т шагов равна 1. Элементы множества мы будем обозначать через бт. При дан- ном т мы будем рассматривать следующие четыре мет- рики в пространстве Q: Pi (F1? F2) = sup^ | P (R | F.) - P (7? | F2) I, (3.80) где R — любое подмножество m*-мерного пространства (#! xm*), a m* зависит от т и обладает тем свойством, что для любого б™ е S)m вероятность наблюдения вели- чины Xi при i > равна нулю. Существование конеч- ного т* с указанным свойством следует из условия (3) допущения 3.6. Символ Р (R\F) обозначает вероятно- стную меру на множестве R при истинном распределе- нии F; р2 (Flf F2) = sups™ I г (Л, 6W) - г (F2, 6w) |, (3.81) Рз (Л, ^2) = I W (F1( d‘) - W (F2, d*) |, (3.82) P4 (^i? ^2) = Pi (Fь ^2) + рз (T^i, F2). (3.83) Расстояние p2 F2) мы будем называть естественным расстоянием между Fr и F2 относительно 2)т. Мы дока- жем следующую теорему. Теорема 3.3. Если имеют место допущения 3.2—3.6, то для любого натурального т пространство Q сепарабельно в смысле естественной метрики р2 (Fr, F2). Доказательство. Из допущения 3.2 следует, что Q сепарабельно в смысле метрики рх (F^ F2). Покажем теперь, что Q сепарабельно также в смысле метрики р4 (Л, F2). Так как по допущению 3.4 D1 ком- пактно, из теоремы 2.1 следует, что Q условно компактно в смысле метрики р3 (F^ F2). Следовательно, для любого е 0 существует разбиение Q на конечное число таких нёпересекающихся множеств йг, что согласно мет-
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 413 рике р3 диаметр (i = 1, 2,..., г) не превосходит 8. Так как Q сепарабельно в смысле метрики р1? существует счетное подмножество с: всюду плотное в согласно метрике р4 (i = 1, 2,..., г). Пусть со — теоре- тико-множественная сумма (Oi,..., сог. Очевидно, что со счет- но и 28-плотно в Q в смысле метрики р4. Так как е мо- жет быть сколь угодно малым, сепарабельность Q в смы- сле метрики р4 доказана. Теорема 3.3 будет доказана, если нам удастся вывести, что из сводимости lim Fo в метрике р4 следует схо- 7->оо димость lim Рг = PQ в смысле метрики р2. Пусть г->оо {Pi}(i = 1, 2, . ..) — последовательность, для которой lim Pi = Fq в смысле метрики р4. Тогда г-*оо lim W (Fi, d*) — W{F0, d*) (3.84) г—>oo равномерно no d* и ИшР(7?|Л) = Р(/?|^о) (3.85) г->оо равномерно по всем подмножествам R т*-мерного декарто- ва пространства координат #х,..., #w*. При фиксированных хт* обозначим через хт*, бт) условное математическое ожидание для W (Ft, d*) при применении решающего правила 8т (I = — О, 1,...). Обозначим также через L (х^,., хт*, 8т) условное математическое ожидание стоимости испыта- ния при наблюденных значениях х1,..., хт* случайных величин Хх,..., Хт* и при применении решающей функ- ции 8т. Ясно, что г(Р>,8т) = $ Hi(x1,...,xm,,8m)dFi + Мт* + J L(x1,...9x^,8m)dFi, (3.86) где Мт* есть тп*-мерное декартово пространство коор- динат х19 ..., хт*. Из (3.84) следует, что lim (xi, ... , хт*, Sw) = Hq (#i, .. „, хт*, 6™) (3.87) г-*оо
414 А. ВАЛЬД равномерно по xlt. .. , %т*, 6W. Следовательно, lim [Нг (хъ . .. , xm*, д’") — Яо(*1, ... , жт., 6т)]с?^=0 l-*°° мт, (3.88) равномерно по 6m. Так как Но и L равномерно ограни- чены *), из (3.85) следует, что lim § Но dFi — Яо dFo мт. мт. lim § L dFi — § L dF0 i—*оо дж т^г шт мт* (3.89) (3.90) равномерно по 6т. Следовательно, из (3.86), (3.88), (3.89) и (3.90) мы по- лучаем limr (F^ 6™) = J HQdFQ+ J Ltf0’-r(Fe,«m) (3.91) ^°° мт равномерно no 6m. Это завершает доказательство теоре- мы 3.3. § 3.4. Полная определенность задачи принятия решения, рассматриваемой в виде антагонистической игры При доказательстве полной определенности задачи ста- тистического решения нам придется воспользоваться сле- дующей леммой. Лемма 3.2. Если имеют место допущения 3.1 — 3.6, то для всякого положительного е найдется такое натуральное т&, зависящее только от е, что inf г (g, 6т) < inf г (g, 6) + 8 (3.92) §7П 8 для любого т^тг и для любого априорного распределения £ на Q. Доказательство. Обозначим через п число наблюдений, произведенных в течение всего испытания, 1) Равномерная ограниченность L следует из условия (2) допу- щения 3.5 и условия (4) допущения 3.6.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 415 а через prob {n>zns| 6} вероятность неравенствам > тг при априорном распределении £ на й и при применении решающей функции 6. Пусть Wo — верхняя граница W (F, dF), ат& — такое натуральное число, что c(a:;S)>_’ (3.93) для любых X и для любых 5 — {$1? ..., 5А.}, для которых 5 = U ••• U содержит по меньшей мере mz элемен- тов. Существование такого значения mz вытекает из усло- вия (3) допущения 3.5. Пусть 6Х — любая решающая функция из 2). Следует рассмотреть два случая: (a) prob{n>m£|g, 61}>8/1Уо, (б) prob{n>m£|g, Si}<8/1^0. Из (3.93) следует, что в случае (а) мы имеем г (g, 6J > > Wo. В этом случае обозначим через 62 правило, при кото- ром мы принимаем окончательное решение d* без проведе- ния наблюдений. Очевидно, что г (£, 62) Wo и» следова- тельно, г (£, 62) г (£, 61). В случае (б) определим 62 следующим образом: 62 (ж; s) = 6Х (х; s) для всех х и всех 5 = {51, ..., 5^.}, для которых сумма S = 51 U ... U sk со~ держит менее mz элементов; 62 (dj | х; s) == 1 всякий раз, когда S содержит не менее mz элементов при любом фик- сированном do из D*1). Очевидно, что при применении ре- шающей функции 62 число шагов испытания не может превзойти mz, Так как prob {n > | g, 6Х} е/ГК0, мы имеем (L 62)<га, 61)+ 8. (3.94) Тем самым лемма 3.2 доказана. Мы теперь в состоянии доказать следующую теорему. Теорема 3.4. Если имеют место допущения 3.1—3.6, то задача принятия решения, рассматриваемая как ан- тагонистическая игра, вполне определена, т. е, имеет место равенство sup inf г (g, 6) — inf sup r (g, 6). (3.95) 4 ь 5 £ x) Из условия (5) допущения 3.6 следует, что 62 (Е
416 А. ВАЛЬД Доказательство. В главе 2 было показано, что антагонистическая игра вполне определена, если прост- ранство А стратегий игрока I сепарабельно в смысле естест- венной метрики, а пространство В стратегий игрока II слабо компактно в смысле естественной метрики (теоре- ма 2.23). Если мы применим этот результат и теорему 2.24 к задаче статистического решения, то из выпуклости 3) [условие (1) допущения 3.6] х) и теорем 3.2 и 3.3 будет следовать, что sup inf г (g, 6m) = inf sup r (g, 6™). (3.96) £ Из леммы 3.2 следует, что для любого е^> 0 существу- ет такое натуральное число те, что для т тг sup inf г (g, б) <>sup inf г (£, 6m) sup inf r (g, 6) + 8. (3.97) * 8 ът £8 Из (3.96) и (3.97) выводим sup inf r Q, б) + 8 > inf sup r (£, 6m) > Inf sup r (£, 6). (3.98) £8 £ 8 Так как 8 может быть сколь угодно малым, из (3.98) следу- ет, что sup inf г (£; б) > inf sup г (£, б). (3.99) £8 8 2, Теорема 3.4 является непосредственным следствием (3.99) и леммы 2.3 главы 2. § 3.5. Теоремы о байесовских и минимаксных решениях задачи принятия решения В этом параграфе мы докажем несколько теорем, касаю- щихся байесовских и минимаксных решений. Теорема 3.5. Если имеют место допущения 3.1— 3.6, то для всякого априорного распределения £ найдется -1) Как было замечено в п. 3.1.4, выпуклость^ при выполнении условия (2) допущения 3.6 влечет, что любая дискретная смешанная стратегия экспериментально эквивалентна чистой стратегии 6 £
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 417 решающая функция 6^, являющаяся байесовским решением относительно т. е. r(g, dO = infr(g, 6). (3.100) 8 Эта теорема является непосредственным следствием теорем 3.1 и 3.2. Мы будем говорить, что lim = £0 в обычном смысле, г—>оо если lim & (со) = So (to) (3.101) i-*oo для всякого подмножества ю с й, которое открыто в смыс- ле естественной метрики Р (Л, Ft) = sup I г (Ft, 6) — г (Ft, 6) I 8 и граница которого имеет вероятностную меру 0 при рас- пределении £0. Докажем теперь следующую теорему. Теорема 3.6. Пусть lim = £0 в обычном смысле. Если при этом выполняются допущения 3.1—3.6, то lim inf г (|ь 6) = inf г (|q, б). (3.102) {->оо 8 8 Доказательство. Пусть для всякого нату- рального т подмножество 2)т множества S) состоит из тех элементов б, для которых с вероятностью 1 испытание про- водится не более чем за т шагов. Пусть р (Л, F2, т) = sup | г (Л, Sm) - г (F2, б™)|, (3.103) где б™ ЕЕ S)m- Очевидно, р (Fv F^ т) < р (Flt Ft). (3.104) Таким образом, всякое подмножество о» с: Q, открытое в смысле метрики р (Ft, F2, т), открыто также и в смысле метрики р (Ft, Ft). Отсюда следует, что lim Si = So в обыч- {—>00 ном смысле также и тогда, когда 3) заменено на®™. В соот- ветствии с теоремой 3.3 пространство й сепарабельно 27 Позиционные игры
418 А. ВАЛЬД в смысле метрики р (Fx, F2, т). Следовательно, примени- ма теорема 2.14 х), и мы получаем: limr(U Sw)-r(U 6m) (3.105) i->oo равномерно по 6m. Из последнего соотношения получает- ся, что lim inf г (£ь Sm) — inf r (|0, 6W). (3.106) г—>oo 3772 Теорема 3.6 непосредственно следует из (3.106) и лем- мы 3.2. Теорема 3.7. Если выполнены допущения 3.1—3.6, то существует минимаксное решение, т. е. существует такая решающая функция 60, что swpr(F, 60) •< sup г (Т7, S) (3.107) F F для любых 6. Доказательство. Пусть {6J (i = 1, 2, ...) — последовательность таких решающих функций, что lim sup г (У7, 6$) — inf sup г (F, 6). (3.108) г->оо F 5 F Из теорем 3.1 и 3.2 следует, что существуют такая подпо- следовательность {£,} (/ =1, 2, ...) последовательности {/} и такая решающая функция 60, что lim inf г (F, 6J>r(F, 6>) (3.109) j-*oo для всех F. Имея в виду (3.108), мы получаем lim inf г (Т7, &.) <; inf sup г (F, д). (3.110) S F Следовательно, r(F, So) inf sup г (F, S) 5 F x) Для применения в нашем случае теоремы 2.14 необходимо, чтобы г (F, 6т) была ограниченной функцией от F и dm. Но это сле- дует из условия (2) допущения 3.5 и условий (3), (4) допуще- ния 3.6.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 419 для всех F, и поэтому supr(F, SnXinf sup r(F, S). (3.111) F 8 F * Очевидно, что в предыдущем соотношении должен стоять знак равенства, и теорема 3.7 доказана. Т е о р е м а 3.8. Если выполнены допущения 3.1—3.6, то всякое минимаксное решение является байесовским ре- шением в широком смысле. Доказательство. Пусть 60 — минимаксное решение, a {£J — такая последовательность априорных распределений, что lim inf г 6) = sup inf г (g, S). (3.112) i—>oo 8 £ 8 Так как б0 — минимаксное решение, мы имеем supr(F, So) = inf sup r (g, S). (3.113) F 8 £ Следовательно, в силу теоремы 3.4 имеем supr(F, So) = lim inf г (gf, S), (3.114) F i-*oo 8 и поэтому r (g , do) < lim inf r (h, d). (3.115) i—>oo 8 * Теорема 3.8 является непосредственным следствием (3.115). Теорема 3.9. Пусть имеют место допущения 3.1 — 3.6, и пусть £0 — наименее благоприятное априорное рас- пределение; тогда всякое минимаксное решение является байесовским решением относительно £0. Доказательство. Пусть £0 — наименее бла- гоприятное априорное распределение, т. е. £0 удовлетво- ряет соотношению inf г (£о, б) = sup inf г (£, S). (3.116) 8 £8 Пусть 60 — минимаксное решение. Тогда sup г (F, So) = inf sup г (£, S). (3.117) F 8 £ 27*
420 А. ВАЛЬД Следовательно, в силу теоремы 3.4 мы получаем r(lo> 60)<supr(F, 60) = infr(|0, 6), F 8 (3.118) и наша теорема доказана. Теорема 3.10. Пусть £0 — наименее благоприят- ное априорное распределение, 60 — минимаксное решение, а ы — множество всех элементов F ЕЕ Q, для которых r(F, й0) <sup г (F, 60). F Тогда, если выполнены допущения 3.1 —3.6, то £0 (со) = 0. Доказательство. Из равенства (3.118) имеем sup г (F, й0) = inf г (|0, й). (3.119) F 8 Очевидно, что из последнего равенства следует sup г (F, fi0) = r(U Йо). (3.120) F Но (3.120) может выполняться только в том случае, ког- да £0 (со) = 0. Этим наша теорема доказана. Мы будем говорить, что элемент f Е Q вырожден относительно априорного распределения если существу- ет такое подмножество со элементов из Q, что <о содержит F, открыто в смысле естественной метрики Р Fz) = sup | г (Fi, d) — r (Fz, й) | 8 И g((d) = 0. Теорема 3.11. Пусть g0 — наименее благоприят- ное априорное распределение, б0 — минимаксное решение, и пусть выполнены допущения 3.1—3.6. Тогда г (F, й0) = max г (F, й0) (3.121) F для всех F, которые не вырождены относительно £0. Доказательство. Предположим, что сущест- вует невырожденный относительно £0 элемент F и r(F0, й0) < sup г (F, й0). F (3.122)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 421 Тогда существует такое открытое подмножество со [в смыс- ле естественной метрики р (F^ F2)], содержащее Fo, что r(F, 60)<supr(^, So) (3.123) F для всех Fe о. Так как FQ относительно не вырожден, мы имеем (О)) > 0. (3.124) Неравенства (3.123) и (3.124) противоречат теореме 3.10. Следовательно, неравенство (3.122) невозможно, и наша теорема доказана. Мы покажем теперь, что существует минимаксное реше- ние, являющееся пределом байесовских в узком смысле решений. Для этой цели нам понадобятся доказываемые далее леммы. Мы будем говорить, что решающая функция 6Х получе- на из решающей функции 60 усечением на m-м шаге ис- пытания, если № = (3-125) для всех к т и d{,. . .,dem)= 1. (3.126) Лемма 3.3. Пусть 8™ — решающая функция, полу- ценная из б0 усечением на т-м шаге, и пусть имеют место допущения 3.1—3.6. Тогда limr(g, S^) = r(g, So). (3.127) m-*oo Доказательство. Если вероятность того, что при применении 60 и при априорном распределении g испытание будет продолжаться бесконечно долго, поло- жительна, то г (£, 60) = оо и lim г(|, 6™) = оо. Таким 7П->ОО образом, достаточно рассмотреть случай, когда эта вероятность равна нулю. Пусть (£, 6, d{, ... dfy и г2 (£, 6, df, d£) определены, как в (3.34) и (3.44).1) г) Равенства (3.34) и (3.44) относятся к дискретному случаю- Очевидно, что соответствующие формулы верны и в абсолютно не- прерывном случае.
422 А. ВАЛЬД Мы имеем 2 оо г& «о)= s з S г,(?, do, (3.128) ft=0 d*.4 Очевидно, 2 777—1 SS 3 r?(L d„ dl d™)< j—1 fc=o e ,e dp..., (b 2 m <S S S г;(1, do, d{,..., 4) + Лп^о, (3.129) J=1 R=0 ,e e dp..., dk где Wo — верхняя граница W (F, dl), a Pm — вероят- ность того, что при применении решающей функции 60 и априорном распределении £ испытание будет выполнено более чем за т шагов. Так как вероятность бесконечного продолжения испытания равна нулю, мы имеем limPm = 0. (3.130) 777—>СО Л е м ма 3.3 следует из (3.128), (3.129) и (3.130). Лемма 3.4. Пусть {^}(f=0, 1, 2, ...) — такая последовательность априорных вероятностных мер, что lim sup | г (gp dw) — r(g>, 6™)| = 0 (3.131) г-*0О §777 для m=l, 2, .... Тогда, если имеют место допущения 3.1—3.6, то для всех решающих функций б0 имеем lim inf г (gp do) > г (g0, д0). (3.132) г->оо Доказательство. Пусть {gj (i = 0, 1, ...) — последовательность вероятностных мер, для которой вы- полнены условия леммы 3.4. Пусть д0 — решающая функ- ция, ад™ — решающая функция, полученная из д0 усечени- ем на m-м шаге испытания. Из (3.131) следует, что lim г &, d^)-r(U S™). (3.133) i ->co Если lim inf r (£p d,) = oo, i-»oo
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 423 то лемма 3.4, очевидно, верна. Следовательно, достаточно рассмотреть случай, когда lim inf г (£, 60X00. i->oo Пусть {ij} (7 = 1, 2, ...) —такая подпоследовательность последовательности {/}, что limr(giy, 6 ) = lim inf г (gb 60 <00. (3.134) г—>оо Пусть — вероятность того, что испытание будет завер- шено не более чем за т шагов, если применяется решаю- щее правило 60, а — априорная вероятностная мера. Из того, что г 60) — ограниченная функция от /, мы имеем limPm = 0 (3.135) m—>со равномерно по /. Следовательно, для любого s 0 найдет- ся такое натуральное число зависящее только от е, что б™)<г(Ц, 6о) + 8 (3.136) для всех т mz. Из (3.133) и (3.136) следует, что limr(L, 60)>г(|ъ б?1)-8 (3.137) ;->оо ♦ для всех т т^. Следовательно, в силу леммы 3.3 мы имеем limr(L, 60)>г(^, 60-8. (3.138) 7-»оо J Так как предыдущее неравенство справедливо при всех 8 0, лемма 3.4 доказана. Лемма 3.5. Пусть (i =0,1,2,...) — такая по- следовательность априорных вероятностных мер, что lim s, (<й) = go (®) i->oo для любого открытого множества со, граница которого име- ет вероятность 0 в смысле мер £0. [Термины «открытый» и
424 А. ВАЛЬД «граница» понимаются здесь в смысле следующего определе- ния сходимости на при i —> сю последовательность Fi сходится к FQ, если lim Рг = F$ в смысле регулярной г—>оо сходимости (см. равенство (3.1)) и если lim W (Fif d*) — г-*оо = W (Fq, d*) равномерно no с?.] Тогда, если имеют место допущенияЗЛ—3.6, то последовательность {gJ(i = O, 1, 2,...) удовлетворяет условию (3.131) предыдущей леммы. Доказательство. Пусть {g$} (i — 0, 1, 2, ...) — последовательность вероятностных мер, удовлетворяющих допущениям леммы 3.5. Пусть для любого натурального т р (Fn F2, т) - sup | г (F2, Sm) — r (F, dm) | (3.139) 5m И p(g', g", m)^sup|r(g',Sm)-r(g", 6m)|. (3.140) dm При доказательстве теоремы 3.3 мы показали, что из сходимости в смысле определения, данного в лемме 3.5, следует сходимость при всех т в смысле метрики (3.139). Пусть mQ — некоторое натуральное число и соо — такое открытое в смысле метрики р (Fx, F2, т0) подмножество й, что граница соо (в смысле метрики р (F1? F2, m)) имеет ве- роятностную меру нуль в смысле g0. Так как из сходи- мости в смысле определения, данного в лемме 3.5, следует сходимость по метрике р (F^ F2, mQ), множество соо будет от- крытым и в смысле леммы 3.5 и граница соо в смысле леммы 3.5 является подмножеством границы соо в смысле метрики р (^i, ^2, то)- Поэтому в условиях леммы 3.5 мы имеем limgjcoo) = to(coo)- Более общо, lim (со) = (со), если г->оо г—>оо существует такое натуральное число т, что со откры- то в смысле метрики р (Fx, F2, т) и граница со (в смысле метрики р (F1? F2, m)) имеет вероятностную меру нуль в смысле g0. Лемма 3.5 следует из теоремы 2.14 главы 2. Лемма 3.6. Пусть выполнены допущения 3.1—3.6; тогда существует такая фиксированная последователь- ность вероятностных мер {gj, что для любого натурально- го т последовательность {gj плотна в смысле метрики (3.140) в пространстве всех g. Доказательство. Из теоремы 3.3 мы имеем, что й сепарабельно в смысле метрики (3.139). Тогда из
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 425 теоремы 2.16 следует, что пространство всех g сепарабель- но в смысле (3.140). Следовательно, для всякого натураль- ного т существует последовательность {^ } (I = 1, 2, ...), которая плотна в пространстве всех £ в смысле метрики (3.140). Последовательность содержит все %im и, оче- видно, удовлетворяет лемме 3.6. Теорема 3.12. Пусть — вероятностная мера на й, приписывающая вероятность 1 элементу F ЕЕ Q. Пусть (i = 1, 2, ...) — такая фиксированная последо- вательность вероятностных мер на Q, что для любого на- турального т последовательность {^} плотна в простран- стве всех (j = 1, 2, ...) и всех (где F — любой эле- мент из Q) в смысле метрики (3.140). Тогда, если выполнены допущения 3.1—3.6, то существуют такое минимаксное решение б0 и такая последовательность {б;-} (/ = 1,2, ...) решающих функций, что lim б: = 6», и для всех j У-*оо решение б,- является байесовским относительно некото- рой вероятностной меры £$, являющейся линейной комби- нацией конечного числа элементов последовательности Доказательство. Пусть б? — минимаксное ре- шение задачи принятия решения при условии, что выбор £ ограничен линейными комбинациями от ..., с неот- рицательными коэффициентами, т. е. б, удовлетворяет условию maxr(gb б5)<тахг(^, 6) * (3.141) для всех б. Ограничение, наложенное на выбор £, делает задачу принятия решения эквивалентной антагонисти- ческой игре, в которой чистыми стратегиями первого игрока являются £х, ..., Поэтому б; должно быть байесов- ским решением относительно некоторой линейной ком- бинации величин ..., Пусть б0 — предел некото- рой сходящейся подпоследовательности последователь- ности {6j}. Из теоремы 3.2 и (3.141) следует, что г) sup г (^ б.)) < sup г (I, б) (3.142) г i г) Доказательство (3.142) по существу не отличается от доказа- тельства теоремы 2.23.
426 А. ВАЛЬД для всех b. Из леммы 3.4 следует, что supr(£{, d)==supr(F, d). (3.143) i F Следовательно, б0 — минимаксное решение, когда на выбор не наложено никаких ограничений. Теорема доказана. Представляется интересным выбор некоторой конкрет- ной последовательности {£J, плотной при всех т в смысле метрики (3.140) в пространстве, состоящем из всех Ц и всех %f* Пусть {7^} — последовательность элементов из Й, плотная в й в смысле метрики (3.139) для любого на- турального т. Пусть — вероятностная мера, приписы- вающая вероятность 1 элементу Тогда при всех нату- ральных т последовательность {^} плотна в смысле метрики (3.140) в множестве всех Можно также выб- рать последовательность {^} (I = 1, 2, ...) таким обра- зом, чтобы (F,-) > 0 для всех /, S (Т7;) = 1 и {10 была бы при любых т плотной в смысле метрики (3.140) в пространстве, состоящем из всех и |F. Сформулируем одно дополнительное допущение, кото- рое даст нам возможность доказать некоторые более стро- гие теоремы. Допущение 3.7. Пространство й компактно в смысле регулярной сходимости, определенной в п, 3.1.1. Если lim = Fq в регулярном смысле, то г-*оо lim W dl) = W (Fo, d*) (3.144) г-*оо равномерно no всем d*. Теорема 3.13. Пусть {gj (f = 0, 1, ...) — такая последовательность априорных вероятностных мер, что lim (со) = I (со) г—>оо для всякого открытого подмножества со (в смысле регуляр- ной сходимости в Й), граница которого (в смысле регуляр- ной сходимости в Й) имеет вероятность нуль по мере £0.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 427 Тогда если имеют место допущения 3.1—3.7, то (a) limr(g,dm) = r(g9, бт) i->oo равномерно по 6т для всех т, (б) lim inf г (^, б) = inf г (g9, 6), г—*оо 8 8 (в) lim inf г (|й 6)>r(g9, б). г-*оо Доказательство. Пусть {gj — последова- тельность вероятностных мер, удовлетворяющая услови- ям нашей теоремы. Утверждение (а) является непосред- ственным следствием допущения 3.7 и леммы 3.5. Из него следует, что lim inf г &т) = inf г (g0, П- (3.145) г->оо Ът 8Ш Утверждение (б) является непосредственным следствием (3.145) и леммы 3.2. Утверждение (в) следует из (а) и лем- мы 3.4. Теорема 3.14. Пусть имеют место допущения 3.1—3.7, тогда существует наименее благоприятное ап- риорное распределение. Доказательство. Пусть {gj — такая последо- вательность вероятностных мер, что lim inf г (^, 6) = sup inf г (£, д). (3.146) г->оо 8 £8 Из теоремы 2.15 следует, что существуют такая подпосле- довательность {I.} (j = 1, 2, ...) последовательности {i} и такая вероятностная мера £0, что lim L. (со) = (со) (3.147) 7*->оо J для любого открытого множества со (в смысле регулярной сходимости на Q), граница которого имеет вероятность нуль согласно £0. Следовательно, используя теорему 3.13, мы получаем lim inf г (£•$., 6) —infr(g), д). (3.148) j->oo 8 ' 8
428 А. ВАЛЬД Из (3.146) и (3.148) следует, что Во является наименее бла- гоприятным априорным распределением, и наша теорема доказана. Т е о р ема 3.15. Если имеют место допущения 3.1 — 3.7, то всякое байесовское в широком смысле решение 60 является байесовским решением в узком смысле. Доказательство. Пусть 60 — байесовское ре- шение относительно последовательности вероятностных мер G — 1» 2, ...). Пусть {Si} (i = 1, 2, ...) — подпосле- довательность последовательности {SJ, а So — такая вероят- ностная мера, что limS'i(co) = So (со) для всякого открытого множества со (в смысле регулярной сходимости), граница которого имеет вероятность нуль согласно So- Из теоре- мы 3.13 следует, что lim inf г (Si, 6) = inf г (So, 6). (3.149) i—>оо 8 8 Так как So — байесовское решение относительно последо- вательности Si, мы имеем lim [г (Sb So) — inf г (Sb S)J = 0. (3.150) i-*oo 8 Из (3.149) и (3.150) мы заключаем, что lim г (Вь 6.)) = inf г (Во, б). (3.151) г—>со 8 Из утверждения (в) теоремы 3.13 следует, что lim г (Вь 6а) > г (В,,, б,). (3.152) г->оо Теорема 3.15 получается как непосредственное следст- вие из (3.151) и (3.152). Теорема 3.16. Если имеют место допущения 3.1 — 3.7, то предел последовательности байесовских решений в узком смысле сам является байесовским решением в узком смысле. Доказательство. Пусть {SO (i = 1, 2, ...) — последовательность вероятностных мер и {6J (Z == 0,1, ...) — такая последовательность решающих функций, что для всех i > 0 решение 6| является байесовским относительно
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 429 и lim 6$ = 6). Тогда существуют такая подпоследователь- i-юо ность {/,} (/ = 1, 2, ...) последовательности {i} и такая ве- роятностная мера £0, что lim g,. (<о) = g0 (®) ;->оо для всякого открытого множества со (в смысле регуляр- ной сходимости на Q), граница которого имеет вероятность нуль согласно £0. Из теоремы 3.13 следует, что lim г (L , ) = inf г (§0, 6). (3.153) Пусть 6™ — решающая функция, определенная следую- щим образом: W(x; dj, ...,4) = дДж; d£) (3.154) для к т и бГ (do к; 0 = 1, (3.155) где do — некоторый фиксированный элемент из D*. Пусть Pjm — вероятность того, что при применении 6^. в апри- орном распределении Ц. испытание будет состоять не более чем из т шагов. Так как г (Ц, 6^.) — ограниченная функ- ция от /, мы имеем limPJw = 0 , (3.156) 7П->ОО равномерно по /. Отсюда следует, что для всякого 8 О существует такое натуральное ms, зависящее только от в, что 69<Г(Ц, \) + 8 (3.157) для всех т т&. Отсюда и из (3.153) мы выводим, что lim sup г (gj, d£)< inf г (go, 6) + s (3.158) 7~*оо 3 8 для всех т тг. По теореме 3.13 имеем lim [г (g{ д?) - г (^, дП] = 0. (3.159) 2—*ОО J J J
430 А. ВАЛЬД Следовательно, lim sup г (go, 6™)<infr(g3, 6) + e (3.160) j—*oo 3 S для m > mz . Очевидно, limSr- 6™. (3.161) J->OO 3 Поэтому из теоремы 3.2 мы получаем lim inf г (g0, дГ) > г (g., б™)- (3.162) г->оо 3 Из (3.160) и (3.162) следует, что r(^, dn<infr(£o, 6) + е (3.163) для т mz. По лемме 3.3 имеем lim г (go, б™) = г(£0,б0). (3.164) гп~*со Из (3.163) и (3.164) следует, что г (g0, б0) — inf г (g0, 6) , Б и наша теорема доказана. § 3.6. Теоремы о полных классах решающих функций Понятия допустимой решающей функции и полного класса решающих функций были введены в § 1.3. В этом параграфе мы введем некоторые дополнительные понятия полноты и докажем несколько теорем о полных классах решающих функций. Пусть 2)' — заданное подмножество множества 2) всех решающих функций, которые могут быть выбраны стати- стиком. Класс С решающих функций называется полным относительно ЗУ, если для любого б, принадле- жащего 2)', но не принадлежащего С, найдется такое б*, принадлежащее С, что б* равномерно лучше, чем б. Класс решающих функций С называется существенно полным относительно 2)', если для любого б Е 2" найдется такое б* ЕЕ С, что г (F, б*) г (F, б) для всех F1). х) Это определение существенной полноты совпадает с опреде- лением, данным в [66]. В [67] термин «полный класс» означает в на- шей терминологии существенно полный класс.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 431 В дальнейшем в этом параграфе через 25ь мы будем обо- значать класс всех решающих функций б, принадлежа- щих 25, для которых г (F, б) является ограниченной функцией от F. Теорема 3.17. Если имеют место допущения 3.1 — 3.6, то класс всех байесовских решений в широком смысле полон относительно 3)ъ. Доказательство. Пусть б0 — некоторый эле- мент 25ь, не являющийся байесовским решением в широ- ком смысле. Пусть РИ* (F,d‘) - W(F, dl) - г (F, б0). (3.165) Очевидно, допущения 3.1—3.6 останутся в силе, если мы заменим W (F, (F) на весовую функцию W* (F, d*). Поэтому все теоремы, доказанные при допущениях 3.1 — 3.6, могут быть применены к задаче принятия решения с весовой функцией Ж* (F, dl). Пусть бх — минимаксное решение, получающееся при замене W (F, df) на W* (F, d*). Существование минимаксного решения следует из теоремы 3.7. В соответствии с теоремой 3.8 бх есть байесовское ре- шение в широком смысле х). Следовательно, поскольку б0 не является байесовским решением в широком смысле, по крайней мере для одного F должно иметь место нера- венство г (F, бх) г (F, б0). (3.166) Пусть г* (F, 6) — функция риска, когда веЬовая функ- ция задана в виде W* (F, dl). Очевидно, г* (F, 6) = г (F, б) — г (F, б0). (3.167) Следовательно, г* (F, б0) = 0 тождественно по F. Так как решение бх минимаксное, мы должны иметь для всех F г* (F, бх) = г (F, бх) - г (Fx, б0) < 0. (3.168) Из (3.166) и (3.168) следует, что бх равномерно лучше б0, и теорема 3.17 доказана. г) Если решающая функция является байесовским решением в широком смысле при весовой функции W* (F, d*), то она сохраняет это свойство при замене W*(F, <&) на W (F, d*), и наоборот.
432 А ВАЛЬД Под замыканием С класса решающих функций С мы будем понимать следующий класс: 6еС тогда и только тогда, когда 6 является элементом С либо пределом (в смысле регулярной сходимости) последовательности элементов из С. Т е о р е м а 3.18. Пусть у — класс априорных вероят- ностных мер £, для которых существует такое конечное подмножество w с Q, что £ (со) =1. Пусть Су — класс байесовских решений (в узком смысле) относительно эле- ментов у. Тогда, если выполняются допущения 3.1—3.6^ замыкание Сч множества Сч существенно полно относи- тельно Доказательство. Пусть д0 — произвольный элемент 3)ъ, и пусть W* (F, d*) = W (F, d*) - W (F, б0). Как было указано ранее, допущения 3.1—-3.6 сохраняют силу при новой весовой функции W* (F, d*). Так как у содержит в качестве своего подмножества множество всех из теоремы 3.12 следует, что существует минимаксное решение задачи принятия решения 6Х, соответствующее W* и являющееся элементом Сг. Поскольку равенство г* (F, б0) = 0 выполняется тождественно по F, мы имеем г* (F, бх) = г (F, Sx) - г (F, б0) < 0 (3.169) для всех F, Следовательно, теорема 3.18 доказана. Теорема 3.19. Пусть § — класс всех априорных вероятностных мер %, обладающих тем свойством, что для любого не принадлежащего g, существует такая после- довательность {£$} (i = 1, 2, ...) элементов из g, что lim ((d) = g ((d) для всех подмножеств со из Й. Пусть г-»оо Сх — класс, состоящий из всех решающих функций, которые являются байесовскими (в узком смысле) ре- шениями относительно элементов £. Тогда, если имеют место допущения 3.1—3.6, замыкание множества существенно полно относительно 3)ь. Доказательство. Пусть б0 — некоторый эле- мент S)b, а Ж* (F, d*) и г* (F, 6) определены, как раньше. Если lim (со) = (со) для всех подмножеств со cz й, 2—>СО то сходится к |0 по метрике (3.140) даже после за- мены г (£, 6т) на г* (g, S"»). Следовательно, из теоремы
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 433 3.12 следует, что существует минимаксное решение задачи принятия решения 6Р соответствующее W* и являющее- ся элементом Поскольку г* (F, 60) = 0 тождественно по F для всех F, должно быть г* (F, 6Х) = г (F, SJ - г (F, 60) < О, и теорема 3.19 доказана. Теорема 3.20. Если имеют место допущения 3.1 — 3.7, то класс всех байесовских решений в узком смысле полон относительно 35ь. Эта теорема является непосредственным следствием теорем 3.17 и 3.15. Класс решающих функций, рассмотренный в теоре- мах 3.17 и 3.20, становится минимальным полным клас- сом при исключении всех недопустимых байесовских реше- ний. Условия, при которых байесовское решение является допустимым, еще полностью не изучены; тем не менее представляют некоторый интерес следующие замечания. Мы будем говорить, что решающие функции и 62 экви- валентны, если г (F, 6j) = г (F, 62) при всех F. Очевидно, что если все байесовские решения относительно заданной априорной меры % эквивалентны друг другу, то любое байесовское относительно % решение допустимо. Аналогич- но, если {gj (Z = 1, 2, ...) — заданная последовательность априорных вероятностных мер и если все байесовские ре- шения относительно {^} эквивалентны, то всякое байесов- ское решение относительно {^} допустимо. Можно привести простое достаточное условие допустимости байесовского решения в узком смысле в случае, когда выбор экспери- ментатора ограничен решающими функциями 8™, при ко- - торых число шагов испытания не может превзойти т. Очевидно, г (F, 8т) является непрерывной функцией от F по метрике р (Fr, F2, т), заданной в (3.139). Пусть £ — такая априорная вероятностная мера, что £ (со) 0 для любого открытого в смысле метрики р (T^i, F2, т) подмно- жества со множества Q. Тогда всякое байесовское относи- тельно | решение должно быть допустимым. Предположим противное: пусть 6Х и 62 — байесовские относительно | решения и S2 равномерно лучше Si. Тогда существует такой элемент FQ Й, что г (FQ, 62) г (Fo, В силу 28 Позиционные игры
434 А. ВАЛЬД непрерывности г (F, 6) по F существует такое открытое множество со, содержащее Fo, что г (F, б2) г (^, б^ для всех F со. Однако тогда будет г (£, б2) <Z г (£, бх), что противоречит тому, что 6i и б2 являются байесовскими ре- шениями относительно одного и того же ГЛАВА 4 СВОЙСТВА БАЙЕСОВСКИХ РЕШЕНИЙ В СЛУЧАЕ, КОГДА СЛУЧАЙНЫЕ ВЕЛИЧИНЫ НЕЗАВИСИМЫ И ОДИНАКОВО РАСПРЕДЕЛЕНЫ, А СТОИМОСТЬ ИСПЫТАНИЯ ПРОПОРЦИОНАЛЬНА ЧИСЛУ НАБЛЮДЕНИЙ1) § 4.1. Общая теория 4.1.1. Вводные замечания. В этой главе мы будем иметь дело исключительно со случаем, когда случайные величи- ны Х15 Х2, ... независимы и одинаково распределены, а стоимость испытания пропорциональна числу наблюде- ний. Так как в этом случае стоимость испытания зависит только от общего числа произведенных наблюдений, мы можем, как это было отмечено в п. 3.1.3, ограничиться рассмотрением таких решающих функций б, для которых каждый шаг испытания состоит ровно из одного наблю- дения. Далее, так как случайные величины Х2, .... независимы и одинаково распределены, мы можем, не теряя общности, предположить, что i-e испытание состоит в наблюдении над случайной величиной Х{ (г = 1, 2,...). Обозначим через d\ решение совершить наблюдение над Х{. Тогда наше условие, налагаемое на б, можно выра- зить следующим образом: б (ZX|O) = б (<П|0), б(£>е|я; dl ...,4) = 6(4+1|^;di, (4.1) (г = 1,2,...)- Во всей главе мы ограничимся рассмотрением решающих функций б, удовлетворяющих (4.1). Иногда мы будем х) Большая часть результатов этой главы изложена в опубли- кованной ранее работе Вальда и Вольфовица [71].
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 435 пользоваться символами 6 (1 10) и 6 (i 11 соответственно вместо 6 (d{ \ 0) и 6 (df+11 х; d£, ..., df), т. е. 6(110) = 6 (с/Ц 10), (4.2) б(г + 1 |^,. . - б(4+1| X’ dl). Таким образом, б (110) есть вероятность наблюдения над а б G + l I •••, xi) — условная вероятность наблю- дения над случайной величиной Xi+1 при условии, что на предыдущих шагах испытания наблюдались значения случайных величин Х±. ..., равные соответственно Для каждого подмножества Dl cz D1 мы будем вместо символа б (Б1 | х\ d[, ..., rff) пользоваться символом S (£>' | Xi). Для любого Рей обозначим через / (я{ | F) «элемен- тарный» закон распределения Х^ при истинном распреде- лении F. Иными словами, если функция распределения F абсолютно непрерывна, то / | F) есть плотность Хь а если F дискретна, то / (xJF) означает вероятность собы- тия Xi = Пусть /* (Xi | F) — функция распределения Х^ т. е. yf(t\F)dt * (4.3) в абсолютно непрерывном случае и f(t\F) (4.4) t<X^ в дискретном случае. Если | — априорная вероятностная мера на Й, то при заданных значениях первых т случайных величин хг. ... ..., хт апостериорная вероятность множества co czQ опреде- ляется по формуле xlt.. .,хт) = -------------------(4.5) рЫП../(*т| F)d^ 28*
436 А. ВАЛЬД Обозначим через W (£, dl) выражение PF(g, d#) = ^W(F, d^dl. (4.6) Ввиду компактности пространства D* минимум min W очевидно существует. d* Для всякого неотрицательного целого т обозначим через Sw решающую функцию, для которой с вероятностью 1 общее число наблюдений не превосходит т. Для всякой априорной меры на й положим pro(g) = infr(g, Г), (4.7) р(Б) = inf г (%, d). 8 В частности, p0(g) = inf г (l, б.,) — min W (g, c?f). (4.8) 8* d< В следующем пункте мы подробнее изучим функции р (У и pm (Ю- В этой главе будет предполагаться, что выполнены допущения 3.1—3.4, даже если это особо не указывается. Допущение 3.5 выполняется автоматически, а допущение 3.6 заменяется допущением о том, что используются только решающие функции S, удовлетворяющие (4.1). 4.1.2. Свойства функций р (£) и рт (§). В этом пункте мы докажем несколько теорем о функциях р (£) ирт (£). Т е о р е м а 4.1. Справедлива следующая рекуррентная формула: оо Pm+i(B) = min Гро (g), § pm(ga)<7/*(a|g) + с] (4.9) (т = О, 1, 2,...), где ga(<o) = g(®|g, а), (4.10) /*(a|g)=$/*(a|F)rfg.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 437 Доказательство. Обозначим через рХ (?) {т =1, 2, ...) инфимум г (£, 6) по б на множестве тех б, для которых с вероятностью 1 число наблюдений не ме- нее единицы и не более т. Очевидно, pm+1(g) = min[p0(g), p*+1(g)b (4.11) Обозначим через р*(£|а) инфимум условного риска по б (условное математическое ожидание стоимости испыта- ния) при априорной вероятностной мере на й, наблю- денном значении равном а, и при решающих функци- ях б, для которых с вероятностью 1 число наблюдений не менее единицы и не более т. Очевидно, Р^+1(5|«) = Рт(Ва) + с. (4.12) Поскольку оо р*+1(£) = $ pJ^GWW), (4.13) —оо равенство (4.9) следует из (4.11) — (4.13). Т е о р ем а 4.2. Функцияр (£) удовлетворяет уравне- нию оо p(g) = min[po(g), р (£а) df*(a 11) + с]. (4.14) Мы опускаем доказательство этой теоремы,. поскольку оно в основном не отличается от доказательства теоре- мы 4.1. Т е о р ем а 4.3. Имеют место следующие неравенства: Ж2 0<рт(1)-р(Ю<^г (т = 1,2,...), (4.15) где через Wo обозначена точная верхняя граница W (F, d*). Доказательство. Пусть {б^} (i = 1, 2, ...) — последовательность таких решающих функций, что limr(g, б,) = р(?). (4.16) г-*оо Обозначим через (5) вероятность того, что при при- менении решающей функции б$ и при априорном распре- делении £ на Q будет произведено не более чем т
438 А. ВАЛЬД наблюдений. Так как р (£) <; Wo и так как г(^)>стР^), (4.17) из (4.16) следует, что lim sup Pi(4.18) г-*оо Cfn Пусть б™—решающая функция, полученная из 6* следующим образом: бГ (1 [ 0) — fy (110), бГ (г + 11 . . . .. хг) = (г + 1 | . . ., хг) для r<m, 67 (D* | 0) = — d^D11 0) и d™ (D* | х19 ..., xr) = di(Dl |xlt . .., хг) для всех подмножеств Dl cz Df и всех г<^т, и d™ (do\xi, ...,хт) = = 1, где с?о—фиксированный элемент//. Очевидно, г (g, б?) < г (g, б.) + Pi (g) Wo. (4.19) Из (4.16), (4.18) и (4.19) следует, что lim sup г (^, б™) < р (|) + — ‘ (4.20) г—>оо Поскольку рт(£) не может превзойти выражения, стояще- го в левой части неравенства (4.20), правая сторона (4.15) следует из (4.20). Левая часть (4.15) очевидна, и доказа- тельство нашей теоремы завершено. Непосредственным следствием теоремы 4.3 является равенство г) limpm(&) = p(&) (4.21) 771—>ОО равномерно по Байесовское решение относительно априорной вероят- ностной меры £0 может быть непосредственно описано через функции р (£) и р0 (£) следующим образом. Если р (£0) = р0 (£0), то не производится никаких наблю- дений и принимается окончательное решение для кото- рого Wo, 4) = ро(£о)- г) Доказательство (4.21) в явном виде содержится в статье Эрроу, Блекуэлла и Гиршика [4].
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 439 Если р0 (g0) > р (g0), то производится наблюдение над Хг и вычисляется апостериорная вероятностная мера = £(<*> | So, #i), соответствующая g0 и х±. Если р (gX1) =p0(gX1), то испытание завершается и принимается окончательное решение d\ %ля которого ичи rf') = Po(U). Если же p(gX1) <С ро (£xj, то производится наблюдение над значением х2 случайной величины Х2. В общем случае, если уже произведены наблюдения хг, хт, то делают дополнительное наблюдение, если Р ( ^Xlt... ,Ход) Ро (U, • • • >^772.) * и испытание завершается надлежащим решением, если Р (£xi.хт) — Ро (Вхь..., Хтп), где через gX1„.,Xw обозначена апостериорная вероятност- ная мера, соответствующая g0, xv ..., хт. Если выбор статистика ограничен решающими функ- циями S™, для которых с вероятностью 1 общее число наблюдений не превосходит т, то построение байесовско- го решения относительно заданной априорной вероятност- ной меры g0 может быть легко осуществлено с помощью функций ро (g), pi (g), ...» pm (g) следующим образом. Если pm (g0) =ро(£о), то принимается надлежащее окончательное решение без совершения испытаний. Если pm (g0) < p0(g0), то наблюдается значение х± слу- чайной величины Х± и вычисляется апостериорная веро- ятностная мера gX1. Еслир(gX1) = ро (gX1), то испытание заканчивается надлежащим окончательным решением. Если Pm-i (SxxX Ро (Bxt), то наблюдается значение х% случайной величины Х2* Вообще, после наблюдения зна- чений х1у ..хк (к^т) испытания продолжаются до тех пор, пока выполняется неравенство pm_fc (gX1,..., Х]() <С ..........xfc), а прекращаются с надлежащим оконча- тельным решением, если pm_fe(gX1..xA.) = po(U..xfc). При начальной функции р0 (g) функции рх (g), ... ...,рто (I) могут быть определены последовательно на каж- дом шаге с помощью рекуррентных формул (4.9).
440 А. ВАЛЬД Рекуррентный метод построения байесовских решений в случае, когда число наблюдений не превосходит т, был описан также Эрроу, Блекуэллом и Гиршиком [4]. Хотя их метод применим также и к нелинейным функциям стои- мости, число шагов, требуемых в их методе, имеет поря- док т2 (вместо т) из-за того, что решение, соответствую- щее г 4-1 (г т), не может быть получено за один шаг непосредственно из решения, соответствующего г, а нахо- дится в результате некоторого рекуррентного приема, на- чинающегося с т = 1. Теорема 4.4. Пусть и — две такие вероят- ностные меры на Q, что х) для всех со; тогда р (У<(1 + е) р (52). (4.23) Доказательство. Из (4.22) следует, что Г Qi, б) < Г (U б)(1 + 8) (4.24) для всех б. Следовательно, (4.23) должно быть выполнено. ../Эта теорема позволяет вычислить простую и часто ис- пользуемую нижнюю границу выражения $ p(5a)d/*(a|g), (4.25) —00 встречающегося в (4.14). Нижняя граница для (4.25) мо- жет быть найдена следующим образом. Для всякого ве- щественного а пусть 8а — такое неотрицательное число, что 2) _______________ <4-26> х) Отношение в левой части (4.22) при gi (®) = 0 и g2 (со) = О предполагается равным 1. Это замечание касается также и других аналогичных отношений, встречающихся дальше. 2) Для 8а допускается и несобственное значение оо.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 441 для всех со. Тогда оо оо $Р(Ва)<*/*(а|£)> $ Ж#*(а|В) = —оо —оо оо = Р(В) $ (а II). (4.27) Поскольку еа>0 и р0 (В) > Р (В), мы, очевидно, имеем ОО Р(В) $ оо >р(|)-[1- J rf/*(a|g)]p.,(£). (4.28) —ОО Следовательно, мы получили неравенство 00 оо С p(ga)J/*(a|B)>p (В) —Ро (В)[1- J L J 1 ~г ва —оо —оо (4.29) Верхняя граница для (4.25) может быть получена заменой р на р0, т. е. оо оо $ Р (Ba) #* («| В) < $ Ро (Ba) df* (а I £). (4.30) —00 —оо Границы, приведенные в (4.29) и (4.30), могут ока- заться полезными для построения байесовских решений, так как имеет место следующая теорема. Теорема 4.5. Если оо рДВ)> $ Po(Ba)<?/*(a| В) + с, (4.31) —оо то р(ВХро(В)- Если оо Ро(£) Г1— \ rTVd/*(alg)]<c’ <4-32) L J 1 ~г Ba J тор (?) =р0 (&.
442 А. ВАЛЬД Эта теорема непосредственно вытекает из (4.14), (4.29) и (4.30). С ее помощью мы сможем определить, будет ли р(£)<ро(Ю или р (Ю =ро(Ю всякий раз, когда g удовлетворяет (4.31) или (4.32). Этот критерий оказывает- ся особенно полезным в том случае, когда класс вероят- ностных мер g, для которых (4.31) и (4.32) не имеют места, узок. Следующая теорема о непрерывности вытекает непос- редственно из теоремы 3.6 главы 3. Теорема 4.6. Пусть {& (г = 0,1,...) (4.33) — такая последовательность вероятностных мер на Q, что lim gi (®) = g0 (со) (4.34) г->со для всех подмножеств w с Q. Тогда Итр(^) = р(5о). (4.35) г-*оо 4.1.3. Характеристика байесовских решений. Для любой вероятностной меры g на Q должно выполняться одно из следующих трех условий: рэ(5)<Сг(£> в) для всех б, для которых 6(110) = 1; (4.36) г (5, S) для всех для которыж б (11 0) = 1, Ро (1э) I / мм а (4.37) (= о) по крайней мере для одного о, для которого d (110) = 1; Ро (g) >> г (g, б) по крайней мере для одного б, , для которого 6(1 ]0) = 1. ' Обозначим через р* (g) инфимум г (g, б) по тем б, ко- торые удовлетворяют ограничению б (1|0) =1. Из общей теоремы существования, доказанной в главе 3 (теорема 3.5), следует, что существует такая решающая функция б*, что р* (Ю =r(g, б*) и б* (1|0) =1. (4.39)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 443 Из (4.39) следует, что условия (4.36), (4.37) и (4.38) эквивалентны соответственно условиям р0 (I) <С Р* (В)> Po(g) =р*ф ир0Ш>р*(|). Мы будем говорить, что вероятностная мера !• на Q есть первого типа, если она удовлетворяет (4.36), второго типа, если она удовлетворяет (4.37), и третьего типа, если она удовлетворяет (4.38). Поскольку апостериорная вероятностная мера, определенная в (4.5), также является вероятностной мерой на Й, всякая апостериорная вероят- ностная мера также будет принадлежать к одному из трех указанных типов. Обозначим для любой выборочной точки х и решающей функции б через т (х, б) то наименьшее неотрицательное целое число, при котором 6 (т + 11 хг, ..., хт) = 0; в слу- чае т = 0 имеем: 6 (т 11 ..., хт) превращается в б (110). Докажем теперь следующую теорему, характери- зующую байесовские решения. Теорема 4.7. Для того чтобы решающая функция б0 была байесовским решением относительно заданного априорного распределения g0, необходимо и достаточно, чтобы для любой выборочной точки х (исключая, конечно, множество меры 0 по мере £0) выполнялось одно из следую- щих трех условий: (а) для любого т<^т (х, б0) апостериорная вероятност- ная мера g (со 110, хъ ..., х^ либо второго, либо треть- его типа (при т = 0 эта апостериорная вероятностная мера превращается в априорную вероятностную меру g0). Если мера £ (со | £0, хг, ..., хт) третьего типа, то S(m + 1 |Xi, ..., хт) = 1; (б) при т = т (х, б0) апостериорная вероятностная мера £ (со | £ 0, хъ •••, хт) либо первого, либо второго типа; (в) при т = т (х, 8Q) имеем бо (Aclt..., хт } х1) • • • 1 хт) ~ 1 > где Dxt ,, х — множество всех тех элементов d* GE D* для * 7П которых w (g(®|go, хг,..., хт), d‘] = = min W (о | go, xt,..., xm), d*]. d*
444 А. ВАЛЬД Доказательство. Достаточность условий (а), (б) и (в) очевидна. Для доказательства необходимости условий (а), (б) и (в) допустим, что решающая функция 60 не удов- летворяет по крайней мере одному из условий (а), (б) и (в) на множестве М* выборочных точек х, вероятност- ная мера которого Р (М*, £0) положительна, т. е. Р (М* До) - $ Н dF (х)] До > 0. (4.40) Q ['М* J При любом 6 множество М* измеримо по Борелю, так что вероятность (4.40) всегда существует. Измеримость М* может быть получена из допущений об измеримости в п. 3.1.5 следующим образом. Пусть М* — множество тех х, для которых не выполнено условие (а), М* — множе- ство тех х, для которых не выполнено условие (б), и М* — множество тех х, для которых не выполнено условие (в). Достаточно показать, что каждое из множеств М* (i = = 1, 2, 3) измеримо. Обозначим через Ми подмножество М*f рдя которого первое нарушение соответствующего условия происходит при выборочных значениях хи..., xt. Нам достаточно показать, что M*t измеримо для всех i и t. Измеримость М3* следует из того, что функции т (х, 6) и б (DX1.Хт |#1,..хт) являются измеримыми по Борелю функциями от яг,,..., хт. Чтобы показать измеримость M*t и Л/Й, достаточно установить, что мно- жество выборочных значений xt, ряя которых я?х, ..., X/) есть типа i (i = 1, 2, 3), измеримо. По- следнее, несомненно, имеет место, когда р0 [£ (co|g0, хх,..., ...,zf)] ир* [£(со|£о, х1У..^ ^)] являются измеримыми по Бо- релю функциями от переменных х19..., xt. Из допуще- ний об измеримости в п. 3.1.5 следует, что функция р [£ (со||0, я\,..., ^)] измерима по Борелю. Из (4.9) и (4.21) вытекает, что функция р [£ (co| g0, я?х,..., xQt)] так- же измерима по Борелю. Измеримость р* [£ (со 110, хх,... ...,я:/)] следует из равенства Р* [?(co|So,^i,.. -,^)] = оо = с+ $ Р [Б (®| • .,xt,a)]df*[a |g (со| go,«i,..rrt)b —00
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 445 Следовательно, мы доказали, что М* измеримо по Борелю. Для любого хЕ^М* обозначим через t (х) наименьшее неотрицательное целое число, для которого соотношения (а), (б) и (в) нарушаются при конечной выборке хцХ). Очевидно, что если хЕ^М*, то всякая выборочная точка у, для которой у1=х1,..., УцХ)=хцХ), также принадле- жит М*.Таким образом, с каждой выборочной точкойхееМ* связано цилиндрическое подмножество Af*czM*, состоя- щее из тех точек у, у которых первые t (х) компонент равны соответствующим компонентам х. Очевидно, что М* может быть представлено как сумма таких непересекаю- щихся цилиндрических множеств. Пусть ж0 — некоторая точка из М* и — соответствующее цилиндрическое подмножество множества М*. Для решающей функции б, для которой б (i я?) 0 при i =0, 1,... ...,Z (я0) — 1, обозначим через г (£0, б, я?,..., хц^) услов- ный риск при априорной вероятностной мере £0 на Q, при применении решающей функции б и при условии, что результаты первых t (ж0) наблюдений равны соответствен- но я?,..., Другими словами, г (£0, 6, Ж?,..., Хцр*)) означает условное математическое ожидание потери W(F плюс условное математическое ожидание стоимости испытания при априорной вероятностной мере на при применении решающей функции б и прц полученных наблюдениях я?,..., Хц^. Покажем теперь, что существует такая решающая функция 61, что г (U 6J < г (U б0). (4.41) Выберем такую решающую функцию б1? что для всех xtfzM* имеют место равенства «1Ж • • •> = (* = 1,2,...) (4.42) и д (г + 1 (жх,. . Xj) — 60(i + 1 |«i,.. ., Xi) (г = 1, 2, ...). (4.43) Для любого х€ЕМ* решающая функция удовлетворяет
446 А. ВАЛЬД написанным выше равенствам при t <4 t (х). Далее, бг удовлетворяет условиям (а), (б), (в) нашей теоремы. Оче- видно, что такая решающая функция бх существует. Пусть — некоторая точка из ЛР; рассмотрим условный риск X»,.. (4.44) Поскольку б5 удовлетворяет условиям (а), (б) и (в), мы можем легко убедиться в том, что г (Во, 61, *?, .. .,^°(х0)) = mm г (g0, б, х°, ..., x°t(x9)), (4.45) где минимум берется по тем решающим функциям б, для которых б (i 4-11 я?,..., xi) 4> 0 при i t (х°). (4.46) С ДРУГОЙ СТОРОНЫ, ПОСКОЛЬКУ б0ПрИ Выборке (#?,..., Х^(хо) не удовлетворяет одному из условий (а), (б), (в), мы видим, что г (Во, 6о, х°,. . .,^(xO))>minr(go,6,^,. ..,rro(xo)), (4.47) 8 где минимум берется по решающим функциям б, удовлетво- ряющим (4.46). Неравенство (4.41) следует из (4.40), (4.45) и (4.47). Это завершает доказательство теоремы 4.7. Класс С вероятностных мер на Q называется вы- пуклым, если для любых двух элементов и |2, при- надлежащих С, и любого положительного А, < 1 вероят- ностная мера % = 4- (1 — X) g2 является элементом С. Для любого элемента обозначим через Cidt класс тех вероятностных мер £ типа i (i =1, 2, 3), для которых W (£, 4) = min W (I, <?'). d‘ (4.48) Пусть Докажем теперь следующую те- орему. Теорема4. 8. Для любого элемента dl классы Сг dt и Cdt выпуклы. Доказательство. Пусть и £2 — Два элемен- та из Cldt. Тогда для любой решающей функции б, для
СТАСТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 447 которой 6 (110) = 1, имеем W (^, dl) < г б) и РГ (£2, dl) < г (g2, б). (4.49) Пусть g = 4- (1 — Х)^2, где X — положительное число, меньшее 1. Очевидно, W (g, dl) = MV (gx, с?') + (1 - K)W (g2, d1) (4.50) r (g, 6) = Ar (U 6) + (1 - A)r (g2, 6). (4.51) Из (4.49), (4.50) и (4.51) мы получаем W (g, d‘) < r (g, d) и W (g, d') = min W (g, d*). (4.52) Следовательно, g принадлежит Cldt, и выпуклость Cldt доказана. Таким же образом может быть доказана и вы- пуклость Cdt. При этом достаточно только в (4.49) и (4.52) заменить знак на Теорема 4.9. Пусть — некоторый элемент из Cldt, а £2 — некоторый элемент из dt- Тогда для любого положительного Л 1 вероятностная мера £3 = + + (1 — Х)£2 является элементом С± dt. Доказательство. Пусть g2 и £3 — вероят- ностные меры, удовлетворяющие условиям теоремы 4.9. Очевидно, W (gx, d') < г (gx, 6) и Ж (g2> d') < г (g2) 6) * для всех тех б, для которых б (1 | 0) = 1. Отсюда, из (4.50) и (4.51) следует, что W (g3, dl) < г (£, б) для всех б, для которых б (11 0) = 1. Поскольку РГ (g3, dz) = min PF (£3, <?), а* £3 принадлежит^^, и наша теорема доказана. Будем говорить, что множество L вероятностных мер £ и Q является линейным многообразием, если для любых двух вероятностных мер и |2, принадлежащих L, и для любых вещественных а, для которых + + (1 — а) является вероятностной мерой, g =а^ -|-(1 — а) g2
448 А. ВАЛЬД также принадлежит L. Линейное многообразие L назы- вается касательным к Cdt, если пересечение L и C2dt не- пусто, а пересечение L и Cldt пусто. Для любых решающих функций б и любых dl EzD1 обозначим через L (6, dl) линейное многообразие, состоя- щее из всех вероятностных мер, удовлетворяющих урав- нению W (g, d#) = г (g, б). (4.53) Теорема 4.10. Пусть £0 — некоторый элемент из C2dt, а — такая решающая функция, что б0 (110) = 1 и W (£0, = r (£о> б0). Тогда линейное многообразие L (б0, dl) касательно к Cdt. Доказательство. Очевидно, что является элементом L (б0, d*). Таким образом, пересечение L (б0, ^) иСм* непусто. Для любого элемента имеем d<) <r(Si, б) (4.54) при любом б, для которого б (1|0) =1. Следовательно, W&, ^)<г(^, б0), (4.55) и поэтому не может быть элементом// (б0, d*). Это дока- зывает нашу теорему. 4.1.4. Случай, когда Xi может принимать только два значения. В этом пункте мы более подробно рассмотрим тот частный случай, когда может принимать только два значения, скажем 0 и 1. Пусть — априорная вероят- ностная мера, a gi, — апостериорная вероятностная мера после наблюдения i нулей и j единиц. Вероятностная мера £00, очевидно, сводится к априорной вероятностной мере £0. Предположим, что существует такое натуральное т, что Po(U.i)<c и p0(gim)<c (г, у — 0, (4.56) Из (4.56) следует, что Р (^mj) ~ Ро (Smj) ® Р (^гпг) ~ Ро (^гт) 7 = 0, 1, 2, . . ., т). (4.57) Применяя формулу (4.14) к нашему частному случаю, мы
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 449 получаем рекуррентную формулу Р (lij) = min [р0 (£у), РаР + (1 — Ра) р (Sum) + с]. (4J58) где через обозначена вероятность получения значения 1 при одном испытании и при априорной вероятностной мере т. е. Ра = \ f (11F) dhj- (4.59) С помощью (4.57) и рекуррентной формулы (4.58) значения р (^) могут быть последовательно определены для всех (f, у), для которых i т — 1, j т — 1. Дейтвитель- но, (4.57) и (4.58) дают значения р (gm_i,7) и р (^,m-i) для i т — 1 и /X — 1- После того как определены значения p(gm_M), ир (£i.m-i), рекуррентная формула (4.58) может быть использована для вычисления р и р (£i,m_2) (i т — 2 и j т — 2), и т. д. Байесовское решение может быть выражено через р (Si?-)(z, / т) еле дующим образом. Если р (|00) =ро(£оо), то принимается окончательное решение d\ при котором W (£00, d*) = —— ро (Soo)- Если р (g00) < р0 (g00), то испытание продолжа- ется до тех пор, пока р (^) <С ро (£г)- Как только впер- вые окажется р = р0(^), испытание прекращается принятием окончательного решения d\ при котором W (^ , d*) =р0 (£ц)- Из (4.57) следует, что испытание бу- дет закончено парой (j, /), для которой i X т и Jт- Поскольку Xi может принимать только два значения: О и 1, всякая функция распределения F случайной вели- чины Хг описывается неотрицательным числом р 1, которое равно вероятности события Хг = 1. Поэтому в весовой функции W (F, dl) мы можем заменить F на р, т. е. обозначить через W (р, d1) потери в случае, когда истинная вероятность события Х^ = 1 равна р и принима- ется окончательное решение d*. Пространство Q теперь оказывается сегментом [0, 1]. Представляет интерес исследование условий, обеспе- чивающих существование натурального т, удовлетворяю- щего (4.56). В связи с этим мы докажем следующую тео- рему. 29 Позиционные игры
450 А. ВАЛЬД Теорема 4.11. Для существования натурального числа т, удовлетворяющего (4.56), достаточно выполнения следующих трех условий*. (1) априорная вероятностная мера приписывает по- ложительную вероятность всякому открытому подмноже- ству сегмента [0, 1]; (2) если limpi = pQ1 то lim W (pif dl) = W (pQt dl) co /->oo равномерно no d*; (3) для любого p существует такое окончательное ре- шение d* что W (р, dl) — 0. Доказательство. Допустим, что условия (1), (2) и (3) выполнены. Для любого положительного е обоз- начим через pij (е) апостериорную вероятность того, что р лежит в интервале — е, » при условии, что было наблюдено i нулей и / единиц. Можно легко вы- вести, что из (1) следует: ИтРъ(е) = 1 2->ОО равномерно по j и (е) = 1 (4.60) (4.61) равномерно по i. Пусть d\j — окончательное решение, для которого W(-TC7 ’ ^) = 0- (4-62) Существование такого окончательного решения следует из условия (3). Пусть, далее, ТУ.Де) — max W (р, d\j), (4.63) р где максимум берется по р из интервала —8» у jpy + е^. Из (4.62) и условия (2) следует, что равномерно по i и j lim (е) = 0. е-*0 (4.64)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 451 Очевидно, для любого е О W (gy, 4.) < Рц (8) Жу (8) + (1 - Ру (8)) Жа, (4.65) где Wo — некоторая верхняя граница для W (р, d*). Из (4.60), (4.61), (4.64) и (4.65) следует, что limW(^-, 4) = 0 (4.66) i->oo равномерно по / и limPT(gy, 4) = 0 (4.67) ;-*оо равномерно по i. Поскольку р0 (^) W (^-, с4), тео- рема 4.11 следует из (4.66) и (4.67). Границы для со $ p^)df(a\^, —со указанные в (4.29) и (4.30), вычисляются особенно про- сто, если X} принимают значения, равные только 0 и 1. Для того чтобы это показать, рассмотрим случай, когда Q состоит из трех точек ръ р2 и p3l a D* состоит из d{, d\ и d3. Пусть , (1, если i =/= 7, W (Pi, d*-) = W{j = -L / . (4.68) ч [0, если I = ]. v 7 Любая вероятностная мера на Q может быть представ- лена вектором (g1, £2, £3), где через обозначена вероят- ность того, что гипотеза pi истинна. Очевидно, р0(^1 -maxjg1, g2, g3). (4.69) Обозначим через | £2, £3) апостериорную вероятност- ную меру при априорной вероятностной мере § и наблю- денном значении 0 в первом испытании. Аналогично обоз- начим через £ = (£х, |2, £3) апостериорную вероятностную меру при априорной вероятностной мере £ и наблюденном значении 1 в первом испытании. Тогда Г = и !’ = . (4.70) j=l 29*
452 А. ВАЛЬД Верхняя граница, полученная в (4.30), становится равной -оо Z—1 4=1 (4.71) Пусть тах(— —1)<8 и max (у——---------------(4.72) М ' Pj ' L,j \ 1 Pj J Теперь мы можем положить 8а = е, и нижняя граница, данная в (4.29), становится равной Р Ф - Ро Ш (1 - rk) = р ® - Ро га • (4-73> \ J- -р о/ 1 —ь Применяя теорему 4.5, мы получаем следующий результат: если 3 /3 Ро (I) > 3 Pff ) Ро (I) + 1 - S ) Ро (?) + с- (4-74) 4=1 / \ 4—1 / то р (В) < Ро (5); если Роа)т^О’ (4.75) то Р (5) =ро (Ю- Пример1). Метод, изложенный в этом пункте, при- менялся для нахождения байесовского решения в сле- дующей задаче. Пусть Хъ Х2,...— независимые и одинако- во распределенные случайные величины. Случайная ве- личина Xi может принимать значения, равные только 0 или 1; обозначим через р вероятность того, что Xi =1. Значение р неизвестно, и задача заключается в проверке 1 t гипотезы Н о том, что р <С -. Обозначим через d± решение принять Я, а через — решение отвергнуть Н. Мы х) Автор благодарен Мильтону Собелю за проведение вычисле- ний для этого примера.
Число единиц 5 g s Й F и 0 1 2 3 4 5 6 7 8 9 10 И 0 0,2500 0,0625 0,0156 0,0039 0,0010 0,0002 0,0001 0,0000 0,0000 0,0000 0,0000 1 0,0252 0,0212 0,0126 0,0039 0,0010 0,0002 0,0001 0,0000 0,0000 0,0000 0,0000 0,0625 0,1563 0,0508 0,0156 0,0046 0,0013 0,0004 0,0001 0,0000 0,0000 0,0000 0,0212 0,0265 0,0225 0,0141 0,0046 0,0013 0,0004 0,0001 0,0000 0,0000 0,0000 2 0,0156 0,0508 0,1035 0,0376 0,0129 0,0042 0,0013 0,0005 0,0001 0,0000 0,0000 3 0,0126 0,0225 0,0250 0,0210 0,0129 0,0042 0,0013 0,0005 0,0001 0,0000 0,0000 0,0039 0,0156 0,0376 0,0706 0,0273 0,0100 0,0035 0,0012 0,0004 0,0001 0,0000 4 0,0039 0,0141 0,0210 0,0225 0,0185 0,0100 0,0035 0,0012 0,0004 0,0001 0,0000 0,0010 0,0046 0,0129 0,0273 0,0489 0,0198 0,0076 0,0028 0,0010 0,0003 0,0001 5 0,0010 0,0046 0,0129 0,0185 0,0210 0,0161 0,0076 0,0028 0,0010 0,0003 0,0001 0,0002 0,0013 0,0042 0,0100 0,01£8 0,0343 0,0143 0,0056 0,0022 0,0008 0,0003 6 0,0002 0,0013 0,0042 0,0100 0,0161 0,0176 0,0136 0,0056 0,0022 0,0008 0,0003 0,0001 0,0004 0,0013 0,0035 0,0076 0,0143 0,0243 0,0103 0,0042 0,0016 0,0006 7 0,0001 0,0004 0,0013 0,0035 0,0076 0,0136 0,0143 0,0103 0,0042 0,0016 0,0006 0,0000 0,0001 0,0005 0,0012 0,0028 0,0056 0,0103 0,0173 0,0075 0,0031 0,0012 8 0,0000 0,0001 0,0005 0,0012 0,0028 0,0056 0,0103 0,0115 0,0075 0,0031 0,0012 0,0000 0,0000 0,0001 0,0004 0,0010 0,0022 0,0042 0,0075 0,0124 0,0054 0,0023 9 0,0000 0,0000 0,0001 0,0004 0,0010 0,0022 0,0042 0,0075 0,0094 0,0054 0,0023 0,0000 0,0000 0,0000 0,0001 0,0003 0,0008 0,0016 0,0031 0,0054 0,0090 0,0039 10 0,0000 0,0000 0,0000 0,0001 0,0003 0,0008 0,0016 0,0031 0,0054 0,0079 0,0039 0,0000 0,0000 0,0000 о,ооос 0,0001 0,0003 0,0006 0,0012 0,0023 0,0039 0,0064 0,0028 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0006 0,0012 0,0023 0,0039 0,0074 И .... .... .... .... .... .... .... .... 0,0028 * • . • « СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ
454 А. ВАЛЬД полагаем, что D*состоит из двух элементов^ и и что W (р, di) = 0 для p- 1 для p\ W(p, = • 0 для p 1 для p Стоимость испытания предполагается пропорциональной числу наблюдений. Пусть с = 0,004 — стоимость одного наблюдения. Пусть, далее, априорное распределение р будет прямоугольным распределением на [0, 1]. В таблице числа, записанные в нечетных строках, равны значе- ниям ро (5ij) Для ij = 0,1,..., 10 и значению ро (?юд1) = = Ро(5ц,г). Поскольку po(5ioj = po(5j,io)< с для 7 10, мы видим, что Р (510, j) = Ро (510, j) И р (5j,io) ~ Ро (5j,io) для / < 10. Используя рекуррентную формулу (4.58) при i = j =10 и заданном значении р0 (5ю,п) = ро (5п,ю)» находим, что р (5ю,ю) = Ро (5ю,на- значения p(U?) Для j, 7 =0,1,..., 10 записаны в чет- ных строках таблицы I, они получены повторным приме- нением рекуррентной формулы (4.58). Жирными линиями в таблице I обведены те пары чисел, в которых р (^-) <Сро (5ij)- Во всех остальных парах чисел мы имеем р (£г) = р0 Qv). Таким образом, байесовское ре- шение задается следующим правилом. Наблюдения продол- жаются до тех пор, пока пара (i, /) указывает на пару чисел внутри жирного контура, где i — число полученных ну- лей, а / — число полученных 1. Как только (/, /) указы- вает на пару чисел вне жирного контура, испытание прекра- щается. При окончании испытания следует принять Я, если i /, отвергнуть Я, если i /, и принять любое решение, если i =j.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 455 § 4.2. Применение общей теории к случаю, когда пространства й и _D* конечны 4.2.1. Случай, когда й состоит из двух элементов. В этом пункте мы применим общие результаты § 4.1 к частному случаю, когда Й состоит из двух элементов F± и F2, a D1 состоит из двух элементов d{ и d2. Здесь rf- означает окончательное решение принять гипотезу о том, что истинное распределение F есть Fi (i = 1, 2). Пусть . f = 0 для i == W (Flt d*j) = Wi} Г _ . , ? (4.76) v 2 " v (>0 для I =[=]. v 7 Априорная вероятностная мера задается теперь вектором g = (g1, £2), где компонента есть вероятность того, что истинное распределение F равно F: (i = 1, 2). Разуме- ется, Г > 0 и g1 + g2 = 1. Пусть — априорное вероятностное распределение, задаваемое вектором (1, 0), а — априорное вероятно- стное распределение, задаваемое вектором (0, 1). Очевид- но, Cdt^ содержит но не содержит g2, a Cdt. содержит £2, но не содержит Из теорем 4.6 и 4.8 следует, что и являются замкнутыми и выпуклыми множест- вами вероятностных мер g. Далее, мы, очевидно, имеем: m < т-z * (4.77) для всех %€ECdt и £W21 > m2 (4.78) для всех g GE Cdt. Пусть £0 = (£j, gf) — вероятностная мера, для которой (4.79) Из (4.77) и (4.78) мы получаем, что £20 для всех % ЕЕ Cdt. и для всех Поскольку множества Cdt и замкнуты и выпуклы, найдутся два таких положитель- ных числа h' и Л", что 0 1 (4.80)
456 А. ВАЛЬД и что класс Cdt^ будет состоять из всех для которых Д', а класс Cdt— из всех для которых £2 h". Из 2 теоремы 4.9 следует, что состоит из единственного элемента £, для которого %2 — h', a C2,dt состоит из един- ственного элемента для которого %2, = h". Применяя теорему 4.7, мы получаем следующую харак- теристику байесовского решения, соответствующего дан- ной априорной вероятностной мере. Пусть — апостери- орная вероятностная мера после совершения i наблюдений {i — 1, 2,...}, а £0 — априорная вероятностная мера. Если So <С то принять Нг. Если = h’, то произвести с по- мощью произвольного случайного механизма выбор между принятием Нг и наблюдением над Хг. Если h' £2 А", то произвести наблюдение над Xv Если £2 — h", то со- вершить с помощью произвольного случайного механизма выбор между принятием Н2 и наблюдением Х2. Если £2 ^>h", то принять Н2. Если предыдущая процедура закон- чится наблюдением над Хг, то вычислить и действовать далее аналогично описанному, с той разницей, что теперь 50 заменено на 51, а на Х2. Если это правило закан- чивается наблюдением над Х2, то вычислить £2, и т. д. Апостериорная вероятность гипотезы Н2 после i на- блюдений имеет вид Е/ — —j ~ . (4.81) to1 ^1)... Ж I Л) + toI Л>) • • • / to I f2) Описанное выше байесовское решение совпадает с пос- ледовательным критерием отношения вероятностей для проверки простой гипотезы Н± против конкурирующей П2. Последовательный критерий отношения вероятностей определяется следующим образом (см. [65]). Для любого натурального i пусть РП = / (*1 | А) . . ♦ / (%j I А) Рп 1 (*1 | Л) ... / I А) ’ Р20 __ । Р10 (4.82) (4.83)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 457 и А и В — две положительные константы (В Л). Про- цедура проведения испытания и принятия окончатель- ного решения совпадает с процедурой принятия описан- ного выше байесовского решения, где заменено на p2fy^ h' на В и А" на Л. Поскольку — строго монотонная функция от то описанное байесовское решение совпа- дает с последовательным критерием отношения вероятно- стей для произвольно выбранных значений констант Л и В. Приведенное определение последовательного критерия отношения вероятностей несколько отличается от данного в ранних работах (см. [65]). В [65] предполагалось, что В <С <Z 1 и 4>1, а здесь такого ограничения не делается. Далее, в [65] требовалось, чтобы испытание прекращалось, как только PzrJPim—A или В. Конечно, если вероятность того, что P2m/Pim = А или В, равна нулю, что обычно имеет место при абсолютно непрерывных распределениях, различие между этими двумя определениями последователь- ного критерия отношения вероятностей несущественно. Из теоремы 3.20 главы 3 следует, что класс всех бай- есовских решений для выбора между и Н2 полон. Поскольку всякое байесовское решение эквивалентно последовательному критерию отношения вероятностей, мы приходим к следующему выводу. Т е о р е м а 4.12. Класс всех последовательных крите- риев отношения вероятностей, соответствующий всевоз- можным значениям констант А и В, является полным клсссом решающих функций для выбора между гипотезами Нг и Н2 Ч. 4.2.2. Случай, когда й содержит более двух элемен- тов. Мы ограничимся рассмотрением случая, когда й состоит из трех элементов: Fr, F2 и F3, поскольку распро- странение на случай произвольного конечного числа эле- ментов очевидно. Пусть (— 0 при i — /, п . (г,/ = 1,2,3). v г п и (>0 при 1^=] г) Эта теорема следует также из оптимальности последователь- ного критерия отношения вероятностей, доказанной Вальдом и Воль- фовицем [69].
458 А. ВАЛЬД Всякое априорное распределение £ = (g1, £2, £3) может быть представлено в виде точки с координатами g1, %2 и £3. Множество всевозможных распределений £ заполнит треу- гольник Т с вершинами У2, V3t где — априорное распределение, Z-я компонента которого равна 1 (см. ри- сунок). Очевидно, вершина F* содержится в Cdt. Таким об- разом, по теореме 4.8 множество Cdt (i = 1, 2, 3) является выпук- лым подмножеством множества Г, piAL-l\Pz содержащим Vv / \ Если одна из компонент, ска- 'л/ жем равна нулю, то гипотезу /СХ Н% можно не рассматривать, и за- yL—2d-----L ^\у дача нахождения байесовских ре- 2 Р5 3 шений сводится к предыдущему случаю, в котором к = 2. Таким образом, определение граничных точек Р2,..., Ре множеств Cdt^ Cdt% и Cdt^ находящихся на границе треугольника Т, сводится к случаю к ~ 2. Покажем теперь, что если множества Cdt, Cdt^ и Cdt не пересекаются, тоС2>^ состоит только из граничных точек множества Cdt. Из теоремы 4.9 непосредственно следует, что множество C2dt должно быть подмножеством границы множества Cdt. Таким образом, нам нужно только пока- кать, что если g0 — граничная точка Cdt, то она принад- лежит Поскольку еCdte имеет место р0(Ц <р* (U- Пусть {gj (Z = 1, 2,...) — такая последовательность апри- орных мер, что lim = Ео и > 0) не содержится ни в каком из множеств Cdt> Cdt^ Такая последова- тельность существует, поскольку £0 — граничная точка Cdp а множества Cd/, Cd<, Cdf не пересекаются. Очевидно, ро (£г)>Р* Ui) при i = 1, 2,... Поскольку lim р0 (НО = р0 (|0), limp* (^) = р* (g0) (непрерывность функции р* (£) может быть доказана так же, как и непрерыв- ность р (£)), должно иметь место неравенство р0 (£0) >
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 459 > р * (go))* Следовательно, р 0(go) = р * (So)и является элемен- том С2^ Касательные к множествам Cdt, Cdt^ и Cd^ в точках Ръ Р2ч..., Р& могут быть построены следующим образом. Рассмотрим, например, граничную точку Рг множества Cdt (см. рис.), лежащую на отрезке VjV2. Пусть gx — веро- ятностное распределение, соответствующее точке Р±. По- скольку априорная вероятность Н3 по мере gx равна нулю, мы при построении байесовского относительно gx решения можем на Н3 не обращать внимания. Пусть бх — последо- вательный критерий отношения вероятностей при выборе между гипотезами Н1 и Н2, являющийся байесовским ре- шением относительно gx, и S (1|0) =1. Поскольку gx— граничная точка, такая решающая функция бх существует. Таким образом, мы имеем w (Ь, (2'1) = Г (^, dx) = inf г (&, б). (4.84) 8 Обозначим через вероятность принять гипотезу при истинной гипотезе и при применении решающей функции бх. Обозначим также через щ математическое ожидание числа наблюдений при истинной гипотезе Нг и применении 6Х. Тогда для любой априорной меры g мы имеем Г (£, бх) = S + С S . (4.85) i, У / И W (В, 4) = S (4.86) i Таким образом, линейное многообразней (Sx, dj) является просто прямой линией, задаваемой уравнением S ^у - S + сЗ g4. (4.87) Z z,; i Эта прямая линия проходит через Рх и по теореме 4.10 яв- ляется касательной к Cdt. Аналогично могут быть пост- роены касательные в точках Р2, Р3,..., Р6. Более общие результаты для конечных пространств Q ий\ допускающие нелинейные функции стоимости, были получены Эрроу, Блекуэллом и Гиршиком [4].
460 А. ВАЛЬД ГЛАВА 5 ПРИМЕНЕНИЕ ОБЩЕЙ ТЕОРИИ К НЕКОТОРЫМ ЧАСТНЫМ СЛУЧАЯМ § 5.1. Рассмотрение некоторых непоследовательных задач принятия решения 5.1.1. Непоследовательные задачи принятия решения, когда пространства Й и I)1 конечны. Под непоследователь- ной решающей функцией мы понимаем решающую функцию 6, при применении которой вероятность выполнения испы- тания за один шаг равна 1. В этом пункте мы будем рас- сматривать задачи принятия решения, в которых простран- ства Й и D* конечны, испытание проводится за один шаг и состоит в наблюдении над первыми N случайными вели- чинами из последовательности {XJ (i =1, 2,...). Пусть й состоит из /Д,..., a D* — из dj,,..., d^. Поскольку испытание проводится за один шаг и состоит в наблюде- нии значений случайных ве личин -X?!,...., XN, всякая решаю- щая функция 6 может быть представлена в виде вектор- функции 6 (яд,..., xN), имеющей и компонент 6Х (яд,... xN),..., 8U (яд,..., xN) и удовлетворяющей условиям: бДяд, . . .,я^)>0 (z = 1, . .., ы), S • • •> xn) = 1. z=l Здесь через яд обозначены наблюдаемые значения для а через 8г (х^..., х^) —вероятности принятия окон- чательного решения d\ при получении выборки (яд,...,яду). При данной выборке (жх,..., х^) выбор окончательного решения d* совершается случайно и притом так, что веро- ятность выбора d\ равна 6{(яд,..., х^). В том частном слу- чае, когда функции Sx (яд,..., х^) могут принимать только значения 0 и 1, мы имеем нерандомизированную решаю- щую функцию. Обозначим через Д (яд,..., х^) совместный элементарный вероятностный закон Хх,..., Х^ при истинном распреде- лении (т. е. Д (а?!,..., х^) обозначает плотность вероят- ности, если распределение 7Д абсолютно непрерывно, и
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 461 вероятность совмещения равенств для всех j N, если F дискретно). Обозначим через потери W (Fb d*) при истинном распределении Fi и окончательном решении d*. Поскдльку допустимыми являются только такие решающие функции, для которых испытание проводится за один шаг, состоя- щий в наблюдении над значениями стоимость испытания не зависит от выбора решающей функции и поэтому может не приниматься во внимание. Риск при истинном распределении F{ и при применении решающей функции 6 задается выражением r(^, d)=2 С . .,xN)dFi(xlt . . .,xN), (5.2) где MN обозначает пространство всевозможных выборок (#1,..., a Ft (^i,..., xn) — совместное распределение Xx,...,XN. Изучим теперь природу байесовских решений. Любое априорное распределение на Q можно представить в виде вектора £ = (£х,..., £fc), гДе 5* — априорная вероятность гипотезы Hi о том, что истинным распределением явля- ется распределение^. После получения выборки xn) апостериорная вероятность гипотезы задается фор- мулой — (i = 1, 2, .., *). (5.3) 3 • • •’ XN> i=t Апостериорный риск, связанный с окончательным реше- нием dj, т. е. апостериорное математическое ожидание значения W {F, d}) (определенное на основе апостериор- ного распределения на Q), задается выражением гД^1, . . .,xN) = 2 (/ = 1,. . и). (5.4) Z=1 Имеет место следующая теорема, характеризующая байесовские решения.
462 А. ВАЛЬД T e о p e м a 5.1. Для того чтобы решающая функция 6 была байесовским решением относительно заданной апри- орной вероятностной меры необходимо и достаточно} чтобы xw) = 0 (5.5) для всех выборок (ггь..., х^) (кроме, конечно, множеств g- меры нуль х)) и для всех j, для которых rj (ях,..., xN) > min [г! (xt,..., xN),..., ru(x1,...,xN)],(b.G) Доказательство этой теоремы очень просто, и мы его опускаем. Поскольку величина гД^,..., xn) пропорцио- нальна функции к . .,xN) • • •> xn), (5.7) Z=1 в теореме 5.1 можно заменить на Из теоремы 5.1 следует, что если для любой пары (i, /) множество выборок для которых выполняется равенство^ = t$, имеет g-меру нуль, то существенно един- ственным является следующее байесовское решение: принять окончательное решение где / есть наименьшее положительное целое число, удовлетворяющее уравне- нию tj — min tn). Любое другое байесовское реше- ние может отличаться от описанного только на множестве g-меры нуль. Применяя теорему 3.20 главы 3, получаем следующую теорему. Теорема 5.2. Класс всех байесовских решений б, соответствующих всевозможным априорным вероятностным мерам g, является полным классом решающих функций. В оставшейся части главы мы не будем различать ре- шающие функции б1 и б2, если б1 при всех F из Q отли- чается от б2 только на множестве выборочных точек ве- роятностной меры нуль. х) Под g-мерой подмножества R пространства выборок мы понимаем 2 dF^. i=l R
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 463 Если для любой вероятностной меры существует един- ственное байесовское решение, то класс всех байесовских решений является (к — 1)-параметрическим семейством решающих функций. Теоремы 3.7, 3.9, 3.10 и 3.14 главы 3 немедленно при- водят к следующей теореме. Теорема 5.3. Существуют такое априорное рас- пределение 5° = (I?,..., и такая решающая функция 6°, что (1) 6° есть байесовское решение относительно |°; (2) б° есть минимаксное решение, т. е. maxr(Fi, 6?) max г 6) при всех д; i i (3) для любого I, для которого $ 0, должно быть S°) =maxr(Fj, d°); з (4) 5° является наименее благоприятным априорным распределением, т. е. при всех £ inf fa t/r (Fit 6)] > inf [S &r(Fi’ fi)l • 5 LZ==1 5 4=1 J Из теоремы 3.9 следует, что основная трудность по- строения минимаксного решения состоит в нахождении наименее благоприятного априорного распределения £°. Мы будем рассматривать только множество байесовских решений относительно |°, которое обязательно содержит минимаксное решение. Байесовское решение б° относи- тельно £° будет минимаксным тогда и только тогда, когда r(F., б°) - maxr(Fj, д°) (5.8) з для всех I, для которых > 0. Для нахождения наименее благоприятного априорного распределения могут оказаться полезными следующие замечания. Для любого априорного распределения £ пусть 6^ есть байесовское решение, задаваемое следующим правилом: выбрать dy, где / — наименьшее целое число, для которого if (#i,..xN) = min [£i(£i, . . tu(xi* • • • xn)] -(5.9)
464 А. ВАЛЬД Рассмотрим средний риск г (1,ад = 2 ^). /==1 (5.10) Он зависит только от £2,..., Априорное распреде- ление 5° является наименее благоприятным, если оно мак- симизирует г (£, S0, т. е. если при всех | г@>, М>г(£> 60- (5.11) Таким образом, задача отыскания наименее благоприят- ного распределения сводится к задаче отыскания вероят- ностной меры для которой выполняется (5.11). Теперь мы применим теоремы 5.1, 5.2 и 5.3 к случаю, когда число элементов как в Q, так и в D* равно двум, а d} (j =1, 2) означает решение принять гипотезу Hj об истинности Fj. Поскольку решение принять гипотезу при истинном распределении Fявляется правильным ре- шением, мы полагаем Wn = W22 — 0, считая и РИ21 положительными. Тогда теорема 5.1 дает следующее необ- ходимое и достаточное условие того, чтобы решение 6 бы- ло байесовским относительно априорного распределения 61(лг1,..., xN) = 0, если 11 W12f, (яр..., xN) < g2VH21 X X /2(#i, • • •, %n) , и Si(^15..., xN) = 1, если W12fv{xr,..., > >^21/2( £п..., xn) (исключая, конечно, множества £-меры нуль). Если (^р..., xN)= ^W21f2 (#!,•••, ЗД), то 6г (яр..., xn) может быть произвольным числом из сег- мента [0, 1]. Мы будем говорить, что 6 есть решающая функция критерия отношения вероятностей, если существует та- кая неотрицательная константа h (допускается также значение h — 00), что 6i (#1, . . .. xN) ~ 0, как только di (^1, . . ., xn) — 1, как только /1 /2(^1,.. А (*1, •
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 465 Очевидно, всякое байесовское решение является решаю- щей функцией критерия отношения вероятностей (исклю- чая, конечно, множества £-меры нуль). Можно легко пока- зать, что справедливо и обратное: пусть 6 — решающая функция критерия отношения вероятностей; тогда суще- ствует такое априорное распределение £, что б является байесовским решением относительно Таким образом, класс всех байесовских решений совпадает с классом всех решающих функций критерия отношения вероят- ностей. Следовательно, класс всех решающих функций критерия отношения вероятностей является полным. Эти результаты очень близки к хорошо известной теоре- ме Неймана—Пирсона [37]. Нейман и Пирсон показали, что если 6—решающая функция критерия отношения веро- ятностей при некотором конечном положительном Л, то решающая функция б допустима, т. е. не существует равномерно лучшей решающей функции. Справедливость этой теоремы немедленно следует из того, что решающая функция критерия отношения вероятностей, соответствую- щая конечному положительному А, является байесовским решением относительно некоторого % с положительными компонентами. Теорема о полном классе обратна теореме Неймана—Пирсона. Если теорема Неймана— Пирсона показывает, что для допустимости функции б достаточно, чтобы она была решающей функцией критерия отношения вероятностей, то теорема о полном классе пока- зывает, что это также и необходимо. Представляет особый интерес тот частный случай, ког- да число элементов в D* равно числу элементов в Q и когда Приг=^Л (5Д2) (О при i = /. В этом случае мы можем трактовать d* как решение при- нять гипотезу Нг об истинности F{. Риск г б) равен тогда просто вероятности принятия неправильного реше- ния при истинном Fi и при использовании решающей функ- ции б. Теорема 5.4. Для положительности всех компонент наименее благоприятного распределения £ необходимы следующие условия: 30 Позиционные шры
466 А. ВАЛЬД (1) число элементов D* равно числу элементов £2; (2) величины Wij удовлетворяют (5.12); (3) существует такая решающая функция 6, что (Fь б) 1 при всех ц (4) если R есть подмножество MN, для которого dFi = 0 при некотором i, то \dFi = О для всех значений i. R R Доказательство. Пусть к — число элементов Q, а б° — минимаксное решение. Поскольку из условий теоремы следует существование решающей функции б, для которой г (/\, б) 1 при всех i, мы имеем г (Л, б°) < 1 (5.13) для i =1,2,..., к. Пусть £° — наименее благоприятная вероятностная мера. Тогда б°является байесовским решени- ем относительно |°. Предположим, что одна из компонент 5°, скажем Й, равна нулю. Из теоремы 5.1 следует, что во всякой решающей функции б = [бх (я^,..., x^),..., 6к(х19... ...,#iv)], являющейся байесовским решением относительно априорного распределения |°, первая компонента бх (жп... ...,^jv) равна нулю, исключая, конечно, множества ^°-меры нуль. Таким образом, в частности, б? (жх,..., xN) = 0, за исключением множества £°-меры нуль. Из условия (4) нашей теоремы следует, что множество R, на котором б? (жх,..., xN) =/= 0, должно удовлетворять условию f dFt = О R для i =1, 2,..., к. Следовательно, г (F\, б°) =1. Однако это противоречит (5.13), и наша теорема доказана. Если Q и D* содержат одинаковое количество эле- ментов и имеет место (5.12), то байесовское решение отно- сительно данной априорной вероятностной меры £ зада- ется следующим правилом: принять решение d*, где / — наименьшее целое число, для которого (Яь .. ., xN) = max (gi/1,. .., (5.14) Для каждого | обозначим через б? байесовское реше- ние, задаваемое описанным выше правилом. Если для ЛЮбоЙ ПОСТОЯННОЙ С МНОЖеСТВО ВЫборОК Xtf, для
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 467 которых Д /Д = с, имеет вероятностную меру нуль при всех Fi (i, 7, I =1,..., к), то существует единственное байесовское решение б^, точнее, всякое другое байесовское решение отличается от б^ только на множествах g-меры нуль. Допустим, что условия теоремы 5.4 выполнены и что для любого g решающая функция б^ является единствен- ным в этом смысле байесовским решением; тогда задача нахождения минимаксного решения сводится к нахожде- нию такой вероятностной меры g° на Q, что г (Л, М - Г б^о) - . . . - г (F]t, б^о). (5.15) Вероятностная мера g°, для которой выполняется (5.15), должна быть наименее благоприятной, и б^о будет мини- максным решением х). В качестве иллюстрации мы рассмотрим несколько про- стых примеров. Пусть N = 2, а случайные величины Хг и Х2 оди- наково распределены и независимы. Предположим, что Х{ может принимать только два значения 0 и 1, а множество Q состоит из двух элементов F± и F2. Пусть вероятность того, чтоХ| =1, равна V3 при гипотезе Н1 и равна 2/3 при гипотезе Н2. Положим Wn = W22 = 0 и W12 = РИ21 = = 1. Можно показать, что существует байесовское реше- ние б^о относительно вероятностной меры _g° = , для которого выполняется (5.15). Следователжно, g° — наименее благоприятное априорное распределение. Для того чтобы решающая функция б была байесовским реше- нием относительно g°, необходимо и достаточно, чтобы бх (0, 0) =1 и бх (1, 1) =0. (5.16) Значения бх (0, 1) и бх (1, 0) можно при этом выбрать произвольно. Очевидно, что не всякое байесовское реше- ние относительно g° является минимаксным решением. Например, если мы положим бх (0, 1) = б3 (1, 0) = а, где а — положительное число, отличное от х/2, то получив- шееся байесовское решение минимаксным не будет. Ми- нимаксное решение, как в этом легко можно убедиться, г) См. в связи с этим теорему (17 : D) на стр. 161 в [55]. 30*
468 А. ВАЛЬД задается байесовским решением, соответствующим дх(0,1) = 61(1, 0) = А_- & В качестве второго примера рассмотрим случай, когда N = 4 и случайные величины А,, Х2, Х3, Х4 независимы и распределены нормально с одной и той же дисперсией о2 — 4 и одинаковым средним. Допустим, что Q состоит из трех элементов Flt) F2 и F3. Среднее значение общего нормального распределения равно — 1 при'распределении F14 0 при распределении F2 и 1 при распределении F3. Пространство D1 состоит из трех элементов d*2 и d^. Пусть Wi; = 1 при i =f= j и Wi} — 0 при i = j. Для всякого априорного распределения £ обозначим через 6^ байесов- ское решение, задаваемое следующим правилом: б^Яр... ...,я4) =1,где/ — наименьшее натуральное число, при ко- тором Г’= max (В*, |2, £*), а —апостериорная вероят- ность гипотезы после наблюдения выборки Можно легко показать, что (i =1, 2, 3) зависит только от априорного распределения | и среднего значе- ния х. Можно показать, далее, что если при некотором значении х, например при значении х = с, мы име- ем = max (§1, g2, £3), то = max (§i, §2, §3) при всех х<^с. Аналогично, если — max (gj при x = с, то = max (gi)* при всех х с. Следовательно, сущест- вуют две такие постоянные с± и с2 (ci<^c2), зависящие только от |, что = max (£*) тогда и только тогда, когда х с, и %* ~ max (£*) тогда и только тогда, когда х с21)- Значит, решающую функцию 6^ можно определить следующим образом: 6i (^i,. . ., х4) = 1, 62 (Xi, . .., х4) = 1, 63 (#1,. . х4) = 1, когда когда X % clf <С X с2, когда х > с2. (5.17) х) Постоянные ci и могут принимать несобственные значе- ния — оо и оо.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 469 Поскольку множество всех выборок, для которых х равно заданной постоянной с, имеет меру нуль, байесовское решение существенно единственно. Пусть теперь сх и с2 — две произвольные постоянные, а 6Cl, с2 — решающая функция, задаваемая условиями (5.17). Можно показать, что существует априорное распределе- ние g, для которого 6^ тождественно равна 6Сь Са. Для того чтобы найти это £, надо решить два уравнения относитель- но компонент £: x>lci ^Пах(ь2С1, ^3Ci)j /д 18) ёЗС2 = max(|1C2, g2Ca). Здесь означает апостериорную вероятность при х = с г). Таким образом, класс всех байесовских решений совпадает с классом всех решающих функций бСпС2, соответствующих всевозможным значениям clf с2 (сх е2)* 2). Следовательно, класс всех решающих функций бС1,С2 является полным. Для нахождения минимаксного решения задачи приня- тия решения нам остается только найти два таких значе- ния cL и с2, что ^1 ^2» r (^i> ^clfc2) — г (^2» SC1, С2) = г (F 3, 6С1|С2). (5.19) Значения qи с2, удовлетворяющие (5.19), можно без труда найти с помощью таблицы нормального распределения. Они равны соответственно —0,803 и 0,803. Решая урав- нения (5.18), соответствующие этим значениям с± и с2, мы получим нужное априорное распределение £ = (0,203; 0,593 ; 0,203), являющееся наименее благоприятным апри- орным распределением для нашей задачи3). О Можно показать, что (5.18) всегда имеет решение. Если а < сг, то решение единственно. 2) Эта характеристика класса байесовских решений является частным случаем более общей характеристической теоремы, приве- денной в [48]. 3) Поскольку байесовское решение относительно данного g существенно единственно, предыдущее минимаксное решение дол- жно быть допустимым.
470 А. ВАЛЬД 5.1.2. Непоследовательная проверка гипотез, когда Q представляет собой параметрическое семейство функций распределения. В этом пункте мы рассмотрим случай, когда элементы F G Й могут быть описаны с помощью ко- нечного числа параметров 019..., 0fe. Тогда каждый элемент может быть представлен точкой 0 ==(01?..., 0fe), называемой параметрической точкой в /с-мерном декарто- вом пространстве. Множество всевозможных параметри- ческих точек 0 называется пространством параметров. Поскольку между элементами Q и элементами простран- ства параметров существует взаимно-однозначное соот- ветствие, то мы не совершим ошибки, если под Q будем понимать само пространство параметров. Для простоты мы ограничимся теми задачами, в которых элементы F ЕЕ. Q абсолютно непрерывны. Как и в п. 5.1.1, мы будем рассматривать только решающие функции б, для которых с вероятностью 1 испытание совершается за один шаг, состоящий в наблюдении над случайными вели- чинами Хп..., XN. Обозначим через / (^х,..., ^2v| 6) совме- стную функцию плотности Хх,..., XN при истинной парамет- рической точке 0. Возьмем некоторое подмножество со пространства пара- метров Q и предположим, что задача состоит в проверке гипотезы Н о том, что истинная параметрическая точка© принадлежит со. Тогда пространство D1 состоит из двух элементов d[ и d*2, где d{ означает решение принять Я, a dl — решение отвергнуть Н. О весовой функции W (0, df) мы предположим, что она неотрицательна и что W (0, d[) = 0 для всех 0Е w и W (0, d^ —0 для всех 0EEco = Q\co. Для простоты мы здесь будем рассматривать только простые весовые функ- ции W (0, dl), т. е. весовые функции, которые могут при- нимать только значения 0 и 1. Обозначим через со0 мно- жество всех тех точек 0, для которых W (0, dl) =1. Очевидно, соа является подмножеством со; соа мы будем называть зоной предпочтения принятия гипотезы Н. Далее, обозначим через сог множество тех точек 0, для кото- рых W (0, d[) =1. Очевидно, что множество сог является подмножеством со; мы будем называть его зоной предпочте- ния непринятия гипотезы Н. Множество со/\ (соа (J сог)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 471 называется зоной безразличия. Очевидно, что для всех 0 из со; ж(0, 4) = w (9, 4) =о. Решающую функцию 6 можно представить в виде ве- щественно-значной функции 6 (a?!,..., xN), удовлетворяю- щей при всех rr1?..., xN условию 0 б (#!,•••, 1. Ре- шающее правило задается следующим образом: после вы- полнения наблюдений xr,..., xN совершить случайное испы- тание, имеющее два возможных исхода 1 и 2 с вероятностя- ми б xN) и 1 — б xN). Принять Я, если результатом случайного испытания будет 1, и отвергнуть Я, если результатом будет 2. Поскольку стоимость испытаний не зависит от б, мы можем ее не рассматривать. Риск г (0, б) задается выра- жением /(ж[0)6 (x)dx, § / (х |0) [1 — б (я)] dx, 0, если 0 ЕЕ сог, если0ЕЕсоа, (5.20) если 0 ЕЕ coj. Здесь через MN обозначено множество всех выборок xN), a x — (x1,...,xN). В теории Неймана—Пирсона риск г (0, б) при 0 ЕЕ <оа называется уровнем критерия, al — г(0, б) при 0Е®Г называется мощностью критерия. Вероятностную меру £ на й можно задать с помощью функции распределения 5 (6) на Q. Если I (0) — априорное распределение, а х — {xr,..., xN) — наблюдаемая выбор- ка, то апостериорная вероятность произвольного подмно- жества со ЕЕ Q определяется формулой J /(Ив)^(О) Р (® I g, х) = £--------. (5.21) а Для того чтобы решающая функция б была байесов- ским решением относительно заданного априорного
472 Л. ВАЛЬД распределения £, необходимо и достаточно, чтобы б (г) =1, когда Р (юа | х) > Р («, | g, х), (5.22) и б (х) =0, когда Р (<л><х|В, х) Р (ыг | В, х), (5.23) кроме, конечно, множества £-меры нуль *). Поскольку ве- роятность Р (®|£, х) пропорциональна J /(ж|0) dl (0), СО условия (5.22) и (5.23) соответственно эквивалентны усло- виям б (х) = 1, когда § / (х 10) dl (х 10) dl (0) (5.24) И б (х) = 0, когда f (х |0) dl (0) f (х|0) dl (0). (5.25) СО со а г Для любого £ обозначим через 6^ то конкретное байесовское решение, для которого S (ж) = 1, когда § /(^|0) dl (0)> § /(x|0)d£(0), (5.26) % И 8 (%) == 0 в остальных точках х. (5.27) Если множество точек х, для которых выполнено равенство 5 / {X |0) dl (0) = $ f 'X10) dl (0), (5.28) “a имеет £-меру нуль, то это байесовское решение единственно, т. е. все другие байесовские решения отличаются от 6^ разве лишь на множествах £-меры нуль. Для того чтобы можно было применить теорию, разви- тую в главе 3, к задачам, изучаемым в этом пункте, мы наложим на класс плотностей / (х 10) некоторые ограниче- т) Под £-мерой подмножества R выборочного пространства мы понимаем / (х | 0) dx dl. Й R
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 473 ния, которые обеспечат соблюдение допущения 3.7 главы 3. Допущения 3.1 — 3.6 выполняются здесь без дополни- тельных ограничений на / (х|9). Мы сформулируем сле- дующее допущение. Допущение 5.1. Пусть {9*} (i = 0, 1, 2,...) — такая последовательность значений параметра, что lim 0j = 0°; тогда i->oo lim J f(x\&-) dx = 5/(«|90)^ (5.29) z->co Д R равномерно no всем подмножествам R пространства выбо- рок MN. В некоторых задачах проверка выполнения допущения 5.1 может оказаться нелегкой. В связи с этим полезна сле- дующая лемма. Лемма 5.1. Если функция f (rr 10) непрерывна по 0, то допущение 5.1 оправдано. Эта лемма непосредственно следует из некоторых ре- зультатов, полученных Роббинсом [43]. Роббинс показал, что для любой последовательности функций плотности {ft(x)} G == 0, 1» 2,...) сходимость по мере lim Д (х) = /о (х) I—>со эквивалентна сходимости (5.30) (5.31) lim fi (х) dx = /о (%) dx, /-*оо й В равномерной по всем борелевским множествам R. Мы будем говорить, что последовательность Д (х) сходится к f (х) по мере, если для любого 8 > 0 и любого множества R конечной борелевской меры множество 5<(/?,'е) всех х из R, для которых I А^) —/о(^)|>е, (5.32) удовлетворяет соотношению lim dx — 0. (5.33) z-*°° S,(R, е)
474 А. ВАЛЬД Как замечает Роббинс [43], можно показать, что если имеет место сходимость lim А (х) = f0(x) (5.34) почти всюду, то выполняется (5.30), но не наоборот. Кроме того, lim ]/г(ж) — /о (я) = О (5.35) MN эквивалентно (5.31). Поскольку г (0, б) = 0 тождественно по б и для любых 0 из со/, мы можем пренебречь зоной безразличия со/ и заменить Q теоретико-множественной суммой <оа и (Oj. Таким образом, в дальнейшем под пространством парамет- ров Q мы будем понимать теоретико-множественную сумму соа и (ог. В дальнейшем мы будем рассматривать только функции распределения % (0), для которых выполнено равенство $ + jj ед = 1. соа О)г Сформулируем теперь еще два допущения. Допущение 5.2. соа и сог являются замкнутыми подмножествами, к-мерного декартового пространства. Допущение 5.3. Q является ограниченным мно- жеством в к-мерном декартовом пространстве. Можно показать, что из допущений 5.1, 5.2 и 5.3 сле- дует допущение 3.7 главы 3. Определение регулярной сходимости в пространстве всех решающих функций б, приведенное в пункте 3.1.4, сводится к следующему. Пусть {6J (i = 0, 1, 2,...) — последовательность ре- шающих функций. Мы говорим, что lim6i = б0 (в регуляр- Z-*oo ном смысле), если сходимость lim б{ (х) dx = б° (х) dx (5.36) 1 R R
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 475 имеет место для всякого ограниченного подмножества 7? в выборочном пространстве MN. Пусть Сг — класс решающих функций 6, для которых при некотором g имеют место (5.24) и (5.25) (кроме/быть может, множеств х g-меры нуль). Далее, пусть С2 есть класс решающих функций б, для которых при некотором g выполнены (5.26) и (5.27). Очевидно, С2 является под- классом Cv Пусть — замыкание С\ (i = 1, 2) в смысле определения сходимости, данного в (5.36). Теорема 3.20 главы 3 дает нам следующие две теоремы. Теорема 5.5. Если справедливы допущения 5.1 — 5.3, то С1 является полным классом решающих функций. Теорема 5.6. Если справедливы допущения 5.1 — 5.3 и если для любого g (0) множество выборочных точек х, удовлетворяющих (5.28), имеет лебеговскую меру нуль, то С2 является полным классом решающих функций. Теорема 3.19 главы 3 дает следующие теоремы. Теорема 5.7. Класс Сх обладает следующим свой- ством. Для любого б Сг найдется такой элемент б* енСь что для всех 0 имеет место г (0, б*) г (0, б), т. е. класс С± существенно полон. Теорема 5.8. Если для любого g (0) множество вы- борочных точек х, удовлетворяющих (5.28), имеет лебегов- скую меру нуль, то С2 обладает следующим свойством. Для всякого б^С2 найдется такой элемент 8* ЕЕ С2, что г(0, б*) г (0, б) для всех ср, т. е. класс С2 существенно полон. Теперь мы коротко рассмотрим несколько простых при- меров. Пусть Xr,..., XN независимы и нормально распре- делены с единичной дисперсией. Математическое ожидание 0 неизвестно, и задача заключается в проверке гипотезы 0 < 0. Пусть множество соа задается неравенством 0 — р, а множество сог — неравенством 0 > р, где р — заданное положительное число. В этом случае условия (5.24) и (5.25) необходимые и достаточные для того, чтобы решающая функция б была байесовским решением относительно заданного априорного распределения g (0), сводятся к 6 (х^..., XN) = 1,
476 А. ВАЛЬД когда f ™~>^(0), (5.37) -ОО Р И 6(^1, . . Xtf) — О, когда ^/^-Т^^(0)<^е^-2^9,^(0)) (5.38) ' —ОО р где х — арифметическое среднее наблюдений xN. Можно легко показать, что существует такая постоянная с0, зависящая только от что неравенства (5.37) и (5.38) эквивалентны соответственно неравенствам х -р с0 и х^> cQ. Постоянная cQ равна — оо, если (0) = О, со и обращается в оо, если d% (0) — 0. р Для любой константы с обозначим через бс (а^,..., xN) решающую функцию, задаваемую следующим образом: 6С(^!, . . .,xN) = 1, 0, если х <^с, если х с. Поскольку множество выборочных точек, для которых х = = с, имеет лебеговскую меру нуль, всякое байесовское решение должно совпадать с бс (#!,..., х^) для некоторого значения с. Можно показать, что верно также обратное, т. е. для любого заданного с существует априорное распределение £ (0), относительно которого 6С (а^,...,^) является байесовским решением. Мы даже можем найти такое априорное распределение £ (0) с описанным выше свойством, что множество, состоя- щее из двух точек 0 = + р, имеет вероятность 1. Та- ким образом, класс С2 из теоремы 5.6 совпадает с классом всех решающих функций Sc(^1,..., xN), соответствующих
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 477 всевозможным значениям с г). Поскольку любая решающая функция 6, являющаяся пределом последовательности элементов из С2, сама принадлежит С2, мы имеем С2 = С2. Применяя теорему 5.8, получаем следующий результат: для любой решающей функции б существует такая постоян- ная с, что при всех 0 г (0, бс) < г (0, б). (5.39) Пусть £0 (0) — функция распределения, приписы- вающая вероятность V2 каждой из точек 0 = + р • Далее, пусть б0 — решающая функция следующего вида: б0 = 1, если х <2 0, и б0 = 0, если х > 0. Тогда б0 будет байесов- ским решением относительно £0. Поскольку г (р, б0) = г (— р, б0) = max г (0, б0), (5.40) о So (6) будет наименее благоприятным априорным распре- делением, а б0 — минимаксным решением. В качестве второго примера рассмотрим случай, когда Хх,..., Xn независимы и распределены нормально с общей дисперсией 1, однако гипотеза Н состоит в том, что неиз- вестное математическое ожидание 0 лежит в интервале (— р, р), где р — некоторое положительное число. Пусть зона соа задается неравенством |0| рх, а зона сог — нера- венством 101 >р2, где рх и р2 удовлетворяют условию Pi <С р Рг- Необходимое и достаточное условие того, чтобы решающая функция б была байесовским решением относительно заданного априорного распределения £ (0), задается равенством б Х^) = 1, когда $ е 2 ^(6)< } е 2 (7g(0), (5.41) |9|>р2 |9|<Р1 И б (^х,..., xN) = 0, х) Эта характеристика класса байесовских решений для данной задачи является частным случаем характеристической теоремы Собеля, относящейся к более широкому классу задач [48].
478 Л. ВАЛЬД когда $ (5.42) |9|>Р2 |9|<Р1 кроме, быть может, множеств лебеговской меры нуль. Обоз- начим через (£) интеграл, стоящий в левой части нера- венства (5.41), и через ф2 (х) — интеграл в правой части того же неравенства. Можно без труда убедиться в том, что оба выражения (х) и ф2 (х) произвольное число раз дифференцируемы по ~х под знаком интеграла. Поэтому |,4“ , (5.43) |91<Рх Из (5.43) немедленно следует, что <*2Ф1 (*) (х) ,г dx* dx* ' когда тр! (г) > ф2 (j). Очевидно, что если J rfg(6)>0 и $ ^(0)>О, |9|>Р2 |9|<Р1 то lim [ф1(з) — ф2(^)] = 00, (5.45) lim [ф1(я) — ф2(я)] = оо. Из (5.44) и (5.45) следует, что существуют две такие по- стоянные с± и с2, что сг с2 и Ч>1 (ж) — 1|>2 (ж) > 0 (5.46) при X с2 и ж с2 и Apj (ж) —1|)2 (ж) < О (5-47) при сг х с2. Постоянные сг и с2 могут принимать так- же несобственные значения — оо и -|-оо. Например, если
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 479 5 (0) = 1, то щ = — оо, с2 = ОО и (х) — ф2 (х) < |9|<Pi <С 0 при всех х. Аналогично, если ~ 1, то щ и с2 |9|>Рз равны оо и гр! (х) — ф2 (х) 0 для всех х. Для любых постоянных с1 и с2 (ех с2) обозначим че- рез 6CltC2 (a^,..., xN) решающую функцию, определенную следующим образом: 6CltC2 (а^,..., xN) = 0, если х < с3 или SC1>C2 xn) — 1 для всех остальных выборок. Поскольку множество выборочных точек, при которых х равно постоянной с, имеет лебеговскую меру нуль, байе- совское решение относительно заданного априорного рас- пределения £ (9) (существенно) единственно и совпадает с бС1>С2 при некоторых значениях щ и с2. Обратно, как легко может быть показано, для любых щ и с2 существует такое априорное распределение £ (6), что 6С1>С2 будет байесовским решением относительно % (0). Такое априорное распреде- ление будет существовать, даже если мы ограничимся рас- смотрением распределений | (0), приписывающих вероят- ность 1 множеству, состоящему из трех точек 0 = —р2, О, р2. Следовательно, класс С2 из теоремы 5.6 совпадает с классом всех решающих функций SCltC2, соответствующих всевозможным значениям щ и с2х). Замыкание С2 мно- жества С2, очевидно, равно С2. Из теоремы 5.8 мы полу- чаем следующий результат: для любой решающей функ- ции S существуют две такие постоянные сг и с2, что г (6Дпс2) < г (9, 6) при всех 0* 2). Для любого положительного «<Су обозначим через £а (0) априорное распределение, приписывающее веро- ятность а каждой из точек 0 = — рх и 0 = pi и веро- ятность у — а каждой из точек 0 = — р2 и 0 = р2. Из соображений симметрии следует, что существует такая х) Эта характеристика класса всех байесовских решений вместе с другими более общими результатами содержится в статье Собе- ля [48]. 2) Аналогичный результат получен Леманом [30] в случае испытания гипотезы 0 — 0О-
480 А. ВАЛЬД постоянная са, зависящая только от а, что байесовское решение относительно £а задается решающей функцией 6_Са Са. Далее, очевидно, что г(-0, 6-са, са) = Г (0. 6-са,са) (5.48) И max г (6, 6_Са> Ся) = max [г (ръ S_C(x> CJ, г (р2, й_Са, Са)]. (5.49) Можно легко показать, что существует такое значение а0, что Г (Рх, 6-сао, сао) = Г (р2) й_Сао, Саэ). (5.50) Очевидно, что £ао — наименее благоприятное априор- ное распределение, а &_сао,сао— минимаксное решение. 5.1.3. Непоследовательные точечные и интервальные оценки в случае, когда Q является параметрическим се- мейством функций распределения. Как и в п. 5.1.2, мы снова предположим, что любой элемент FeQ может быть представлен параметрической точкой 0 = (0А,..., 0А) ^-мерного декартова пространства, и для обозначения пространства параметров будем пользоваться символом Q. Мы снова будем рассматривать такие решающие функции 6, при которых испытание выполняется за один шаг наб- людением над значениями Хх,..., Для простоты мы предположим, что распределения ЕЕ Q абсолютно не- прерывны, и обозначим через / (атг,..., 2jv|0) совме- стную плотность величин Х1?..., XN при истинной пара- метрической точке 0. Сначала мы рассмотрим задачу точечной оценки. Для любой параметрической точки 0* обозначим через rfe* окончательное решение оценить истинную параметриче- скую точку 0 величиной 0*. Пространство D* состоит из всех элементов соответствующих всевозможным параметрическим точкам 0*. Мы будем пользоваться символом W (0, 0*) для обозначения W (0, eie*), т. е. W (0, 0*) — это потери, понесенные при истинной параметрической точке 0 и ее оценке. 0*. Решающая функция S может быть представлена в виде функции 6 (0[ xN) от 0 и жх,..., xN, значения
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 481 которой являются при всякой выборке (#i,..., Xn) функ- циями распределения на Q. После получения выборки (#!,..., я#) оценка 6* совершается случайно, и притом так, что вероятность того, что 0* будет принадлежать не- которому подмножеству со из Q, равна d&(01xlt..., xN)- Поскольку стоимость испытания не зависит от S и может, следовательно, не приниматься во внимание, риск задается выражением г (0,6) = $ Г$1У(0, е*)с/д(0*|ж)]/(я:|е)^, (5.51) М n где х ~ xN),& через MN обозначено пространство выборок. В главе 3 мы предположили, что пространство D* ком- пактно. Для того чтобы обеспечить компактность £>*, мы должны принять следующее допущение. Допущение 5.4. Q является ограниченным и зам- кнутым подмножеством k-мерного декартового простран- ства, a W (0, 0*) — непрерывная функция от обоих аргументов 0 и 0*. Из этого допущения и сформулированного ранее допущения 5.1 следуют допущения 3.1 3.7 главы 3. Пусть для любого вероятностного распределения £ — = I (0) на Q W (£, 0*) - $ W (0, 0*) dl (0). 4 (5.52) о Для любого априорного распределения I и любой выбо- рочной точки х обозначим через множество всех параметрических точек 0, для которых W(lXi 0) = miniy(L, 0*), (5.53) 0* где через 1Х обозначено апостериорное распределение на Q после наблюдения выборки х. Для того чтобы решающая функция 6 была байесов- ским решением относительно априорного распределения необходимо и достаточно, чтобы <26(0|ж)= 1, (5.54) “5, X 31 Позиционные игры
482 А. ВАЛЬД кроме, быть может, множества выборочных точек х ^меры нуль. Значительный интерес представляет частный случай, когда для любых £ и х множество состоит из един- ственного элемента. В этом случае байесовское решение относительно произвольного £ единственно (исключая, быть может, множества х ^-меры нуль) и тождественно равно решающей функции 6^ (0 | х^..., xN), приписываю- щей вероятность 1 параметрической точке 0?tX. Так как из допущений 5.1 — 5.4 следует справедли- вость допущений 3.1 — 3.7, то имеем следующую теорему. Теорема 5.9. Если выполнены допущения 5.1 и 5.4, то (1) существует наименее благоприятное распределение £ (0); (2) существует минимаксное решение] (3) класс решающих функций 8 (0 | xlf..., xN), удов- летворяющий при некотором ^тождественно по х) (5.4), является полным классом решающих функций, В качестве иллюстрации рассмотрим следующий при- мер. Пусть случайные величины Xlv.., XN независимы и распределены нормально с дисперсией 1. Задача заклю- чается в нахождении оценки для 0. Пусть W (0, 0*) = — (0 — 0*)2 и область возможных значений 0 представ- ляет собой конечный интервал [а, Ь](а Ь). В этом при- мере для любых £ и х множество со^|Х состоит из единст- венной точки 0£tX- Мы имеем b NxO- —W92 j ев 2 d5(0) С х = аь _ 1----------------= (Nx). (5.55) е ^x9- — N6'- Je а Очевидно, а (ТУж) ъ (5.56) для всех х. Выведем необходимое и достаточное условие выполне- ния равенства ф (t) = (t) при всех вещественных Л Для любого £ (0) пусть (0) — функция распределения,
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 483 для которой с — — 2V02 \е 2 ^(0) dl* (6) = ------------------ (5.57) Р — _L 2V02 Р (О <Р(0 ’ (5.58) для всех подмножеств со из Q. Очевидно, если гр (t) — = О), то ъ j 0ef9 (0) = ------------ etd dt* (0) где ф (t) — характеристическая функция 0 при распре- делении (0), т. е. <p(/) = jjet9^*(0), (5.59) а а ф' (t) — производная от ф (Z) по t. Таким образом, для того чтобы существовало такое гр (£), для которого гр (t) = гр? (£), необходимо, чтобы гр (t) = ф' (£)/ф (t), где ф (t) — характеристическая функ- ция случайной величины со значениями в* [а, Ь]. Для того чтобы доказать достаточность условия, допустим, что <PZ W Ф(0 ’ где Ф(О= $^^(0) а и (0) — функция распределения на Q. Тогда ь j 0eiO^i(O) = . (5.60) pi8rf$i(0) 31*
484 А. ВАЛЬД Пусть (0) — функция распределения, щая уравнению _1_W02 е5 (6) с nqz \е2 ^х(О) удовлетворяю- (5.61) Тогда из (5.60) следует, что я to— — N& \ 0е 2 <^2(0) W) = (5.62) а Следовательно, ф (t) = ф^2 (t), и достаточность нашего условия доказана. Таким образом, мы получаем следую- щее необходимое и достаточное условие существования априорного распределения £, для которого 6(01^,... ..., xN) было бы байесовским решением: S (Oja?!,..., xN) приписывает вероятность 1 точке 0 = ф (N%) (кроме, может быть, множеств лебеговской меры нуль), <р' (0 Ф(0 ’ Ф(0 (5.63) (5.64) где <р (0 — характеристическая функция некоторой слу- чайной величины и со значениями в [а, 6]. Поскольку в нашей задаче допущения 5.1 и 5.4, оче- видно, выполнены, из теоремы 5.9 следует, что класс всех решающих функций, удовлетворяющих условиям (5.63) и (5.64), полон. Интересно заметить, что функция ф (0 = t/N не удов- летворяет (5.64). Это следует из того, что равенство ф' (0 ф (0 = t/N возможно только тогда, когда ф (0 — производящая функция нормального распределения, но не распределений с конечным носителем. Поэтому решающая
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 485 функция 6 (01 xN), приписывающая вероятность 1 точке не будет допустимой решающей функцией. Можно также показать, что функция 6 (0| xN), равная 1 при а х bf равная а при х а и равная Ь при х 6, не будет допустимой решающей функцией. Причина этого несколько удивительного результата заключается в том, что мы ограничиваем область значений 0 конечным интер- валом. Если на область изменения 0 не наложено ни- каких ограничений, то можно показать, что функция 6 (0| х^), приписывающая вероятность 1 точке 0 = х, будет минимаксным решением задачи. Следующие два ' интересных примера минимаксных решений даны Ходжесом и Леманом. I. Минимаксная оценка математического ожидания биномиального распределения х). Пусть X — биномиаль- ная случайная величина, т. е. Aj 0х Пусть W (0, 0*) = (0 — 0*) 2. Тогда минимаксной оценкой 0 будет 0* (я) =--х + -i-A , 4 7 1 + Yn \ VN ' 2 } ’ (1 (х = 0, 1,..., N). prob {X = х} ~ где х — наблюдаемое значение X. Иначе говоря, мини- максная решающая функция приписывает вероятность 1 значению параметра 0* (х). Это можно показать следую- щим образом. Легко проверяется, что если 1 1 С± = -— и с2 = -------------------7^=— , + 2(1 +/А) то + с2 —0)2 = ----1 -. 4 (1 4- /ЛГ)8 независимо от 0. Следовательно, достаточно показать, что приведенная выше оценка является байесовской. Прямые вычисления показывают, что байесовская оценка, соот- ветствующая (0) = С,0а~'1 (1 — 0)£~х d0 (а, р 0), х) Рубин нашел минимаксную оценку среднего значения бино- миального распределения до Ходжеса и Лемана.
486 А. ВАЛЬД равна 0(я) - х 4- а а+P+^V Следовательно, 6* (х) = сгх + с2 — байесовская оцен- ка, соответствующая а = Р "jA/V/S. | II. Минимаксная оценка математического ожидания случайной величины, принимающей значения в [0, 1]. Пусть случайные величины Хх,..., XN независимы и оди- наково распределены на интервале [0, 1]. Их общее рас- | пределение предполагается полностью неизвестным. Пусть j Е (^i) 6’ и предположим, что задача заключается в I построении оценки для 0. Пусть W (0, 0*) = (0 — | — О*)2. Тогда минимаксной оценкой 0 будет где ----------------------------- х ~ ’ » а хг — наблюдаемое значение Xv Это можно показать | следующим образом. Поскольку рассматриваемая оценка J является минимаксной в случае, когда X принимает тиль- | ко два значения 0 и 1, достаточно показать, что риск при этой оценке ограничен сверху числом 1/[4 (1 + УN)2]. Но это следует из того, что Е (Ж.г + с2—~ 0)2 = + [(Ж — 1)0+ с2]2. 1 х Однако =4-[Е(^)-№]<Х(е_о^, что представляет собой дисперсию биномиального рас- пределения. Следовательно, риск принимает максимальное значение именно в случае биномиального распределения. Теперь мы вкратце рассмотрим задачу о доверительном интервале. Для простоты мы рассмотрим случай с един- ственным неизвестным параметром 0, т. е. к = 1. Для любого замкнутого интервала I на вещественной оси обоз- f
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 487 начим через окончательное решение принять гипотезу о том, что параметр 0 содержится в I. Пространство D* состоит из элементов d\, соответствующих всевозможным интервалам Iх). Всякий интервал I полностью определя- ется своей длиной I и серединой 0*. Обозначим через W (0, 0*, /) потери в случае, когда оценка истинного значения параметра 0 содержится в интервале с середи- ной 0* и длиной I. Решающая функция б может быть представлена в виде функции 6(0, Z| a?!,..., xN), которая при любой заданной выборке (я^,..., xN) является функцией распределения на пространстве всевозможных пар (0, Г). После получения выборки х1,..., xN выбор 0* и I осуществляется случай- но, причем при любых вещественных 0О и Zo собы- тию 0* < 0 и I <Z 10 приписывается вероятность (00? /о| XN). Поскольку мы стоимостью испытания пренебрегаем, риск задается выражением г(0, б) = J [ jj ТУ (0, 0*, Z) cZo (0*, ZI ж)] / (а-10) dx, (5.65) где через Q* обозначено пространство всевозможных пар (6*? Z). Сделаем следующее допущение. Допущение 5.5. Q является ограниченным замк- нутым подмножеством вещественной оси, aW (0, 0*, I) — непрерывная функция трех переменных 0, 0*, I. Из этого допущения и из допущения 5.1 следуют допу- щения 3.1—3.7 главы 3. Пусть W (I, 0*, Г) = $ W (0, 0*, I) dl (0). (5.66) Для любого априорного распределения I и для любой выборки х = (тх,..., xN) обозначим через D%x множество *•) *•) В некоторых задачах допустимые интервалы могут быть огра- ничены некоторым подклассом класса всех интервалов, как, напри- мер, класс всех интервалов, длина которых не превосходит заданного Числа или длина которых равна заданному числу и т. д.
488 А. ВАЛЬД всевозможных пар (О*, Z), для которых имеет место ра- венство w (gx, е, /) = min ir £х, е, I). 0,1 (5.67) Здесь — апостериорное распределение на Q после на- блюдения выборки х. Решающая функция б (0*, 11 х) является байесовским решением относительно данного априорного распределения £ тогда и только тогда, когда $ <26(0*, Z|x) = l (5.68) для всех х, за исключением, может быть, множеств ^-ме- ры нуль. В частном случае, когда при любом х множество содержит один элемент, байесовское решение относи- тельно £ единственно (кроме, может быть, множеств £-меры нуль). Поскольку допущения 3.1—3.7 главы 3 следуют из допущений 5.1 и 5.5, результаты главы 3 приводят к сле- дующей теореме. Теорема 5.10. Если выполнены допущения 5.1 и 5.5, то (1) существует наименее благоприятное распределение U0); (2) существует минимаксное решение; (3) класс всех решающих функций б (0, l\ zx,..., xN), удовлетворяющий (5.68) по крайней мере для одного является полным классом решающих функций. Рассмотрим следующий пример. Случайные величины Хх,..., XN независимы и распределены с общей плотно- стью /(ж{|9) = 1 для — у + о < aij < y-l-0 и / (хг (0)) ~ 0 ПРИ остальных X}. Пусть математическое ожидание 0 неизвестно, однако область возможных зна- чений 0 ограничена замкнутым интервалом [а, 6]. Для лю- бого вероятностного распределения % для Q и для любых вещественных а' и Ь' (а' Ь'), для которых пересечение [а, Ъ] и [а', &'] имеет положительную £-меру, обозначим через ъ' условное распределение 0 при условии, что область возможных значений 0 ограничена интервалом
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 489 [л', &']. Тогда для всякого подмножества со интервала [а', Ь'] имеем $ ^U'(6) (5.69) Пусть и = min (яр..., xN) и v = max (x^..., xN). (5.70) Можно показать, что апостериорное распределение на Q после выполнения наблюдений над выборкой х, при апри- орном распределении задается формулой U+-1 V - — (5.71) Для простоты предположим, что I может принимать одно-единственное значение Zo (0 < lQ -к-) и выбор ста- тистика ограничен выбором середины интервала 0*. Предположим, что весовая функция задается следую- щим образом: 1¥(0, 0*,ZO) = 0 при 0* — Zo О 0* + (0 — 0* 4- Z0)2 при 0 < 0* —*Z0, (0 — 0* — Z0)2 при 0>0* + Zo. (5.72) Для любого распределения £• (0) на Q мы имеем тогда W Q, 0*, Zo) = $ (0 - 0* + Z0)2 dl (0) + e<e*-zo + J (0 —0* —Z})2Jg(0). (5.73) o>o*+ze Обозначим для любых u, v через (^,u,v множество всех значений 0*, при которых потери W (I х х , 0*, Zo) V----------------------------------------- , u-|- — 2 2 минимальны. Тогда содержащееся в (5.68) необходимое
490 А. ВАЛЬД и достаточное условие для байесовского решения сво- дится к г) <76 (01 ^i,. . ., xN) — 1 , V (5-74) для всех х, кроме, может быть, множеств £-меры нуль. Пока не удалось найти простого способа характери- зации класса всех байесовских решений. Вместо того, чтобы его искать, изучим байесовские решения относи- тельно равномерного априорного распределения, которые обладают, как мы далее увидим, некоторыми интересными свойствами. Пусть £° (0) —- равномерное априорное распределе- ние, т. е. ?о(0) = |Ет (5.75) при любом 0 из интервала [а, &]. Пусть 0w r — середина общей части интервалов — у, w —и [^z, 6]. В случае, когда длина этого пересечения больше или равна 2Zo, можно показать, что состоит из единственной точки 0u>tJ. Если же длина пересечения меньше 2Zo, то <o^>UjW состоит из всех 0*, при которых интервал [0* — 10, 0* + Zo] покрывает рассматриваемое пересечение. При любом 0 е[а + 1, b — 1] вероятность того, что интервал — —~ , и + 4-1 содержится в [а, 6], равна 1. Тогда, если " & J г 1 длина интервала \и — у , и +у больше или равна 2Z0, л и + v то tiUtv равно -у—. Пусть So (0 | xN) — байесовское решение отно- сительно £°. Можно показать, что г (0, б0) постоянна для всех 0 из la + 1, Ь — 1]. Далее, можно легко показать, что шах г (0, S) равен значению г (0, б0) в интервале г) Аргумент I в 6 (0, I |ат1, . . ., xN) опущен, поскольку 6 рас- сматривается при фиксированном значении I = /0-
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 491 [а + 1, Ъ - 1]. lim (Ь-а)->оо Следовательно, Из этого следует, что [max г (0, д0) — г (|°, д°)[ = 0. о (5.76) и lim [max г (9, б0) — inf max г (0, 6)] = 0 (5.77) (Ъ—д)—>оо 9 8 9 lim [infr(|°, д)— sup inf г (|, д)[ — 0. (5.78) (Ь-а)-»оо 8 £8 Таким образом, при достаточно большой разности b — а распределение для всех практических целей можно счи- тать наименее благоприятным распределением, а б0 — минимаксным решением. 5.1.4. Непоследовательные задачи принятия решения в случае, когда JDf конечно и Q является параметрическим семейством функций распределения. Случай, когда D1 состоит из двух элементов, рассматривался в п. 5.1.2. Здесь мы будем иметь дело со случаем, когда D1 конечно, но состоит более чем из двух элементов. Пусть du- элементы пространства (и 2). Как и прежде, допу- стимыми будут только те решающие функции, при которых испытание выполняется за один шаг наблюдением над случайными величинами Хх,..., XN. Мы предполагаем, что для любой параметрической точки 9 = (0!,«.., 0А) соот- ветствующее совместное распределение абсолют- но непрерывно. Обозначим через £дг|0) совмест- ную плотность распределения величин Хх,..., XN при истинной параметрической точке 0. Пусть ИЛ(0) = W (0, (5.79) т. е. (0) — потери при истинной параметрической точке 0 и окончательном решении d\. Любая решающая функция б может быть представлена вектор-функцией 6 xN) с компонентами бх ..., xN),..., xN), удовлетворяющими условиям Si(3Ci, . . ., я^)>0, 3 dj^x, . . ., o:N) z= 1. (5.80) 1=1
492 А. ВАЛЬД Здесь б{ ,ajv) — вероятность выбора окончательного решения d\ при наблюденных выборочных значениях (#!,..., xN). Стоимость испытания не учитывается, и риск при истинном 6 и при применении решающей функции б определяется выражением и г(0, д)= 2 5 wi (0) si CO / (* 16) (5.81) i=l М jy где х — (хх,..., х^), a MN обозначает выборочное простран- ство (множество всех выборок х). Для любого распределения g (0) на Q обозначим через (g) математическое ожидание случайной величины Wi (0), т. е. ^(^)=$^(0)^(0). (5.82) Для любого априорного распределения g обозначим через апостериорное распределение на Q после наблюдения выборки х. Величину Ж{ (gx) мы будем называть апосте- риорным риском, соответствующим решению d\. Для того чтобы решающая функция б была байесов- ским решением относительно данного априорного распре- деления g, необходимо и достаточно, чтобы для всех вы- борочных точек х (кроме, быть может, множеств g-меры нуль) имело место равенство б{ (х) = 0, (5.83) как только Wi (gx) > Wj (gx) для некоторого /. Доказательство этого утверждения очень просто, и мы его опускаем. Сформулируем теперь следующее допу- щение. Допущение 5.6. Q является ограниченным и замкну- тым подмножеством камерного декартового пространства, и математическое ожидание (0) (i = 1,..., и) непре- рывно по 0. Из допущения 5.6 и допущения 5.1, сформулирован- ного ранее (см. п. 5.1.2), вытекают допущения 3.1 — 3.7. Допущения 3.1 — 3.6 выполняются без дополнительных условий на й и f (ж|0), когда функция (0) ограни- чена по 0 (I = 1, 2,..., и).
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 493 Обозначим через С класс всех байесовских решений; это означает, что решающая функция 6 принадлежит классу С тогда и только тогда, когда существует такое априорное распределение что б является байесовским решением относительно £. Обозначим также через С замы- кание С в смысле определения сходимости, сформулиро- ванного в (5.36). Применяя результаты главы 3, мы полу- чаем следующие две теоремы. Теорема 5.11. Если выполняются допущения 5.1 и 5.6, то (1) существует наименее благоприятное априорное распределение; (2) существует минимаксное решение, которое должно быть байесовским решением относительно любого наиме- нее благоприятного априорного распределения; (3) С является полным классом решающих функций. Теорема 5.12. Если функция W\ (0) ограничена (i = 1,..., и), то (1) существует минимаксное решение; (2) класс С обладает следующим свойством: для любого S, не принадлежащего С, найдется такой элемент S* из С, что г (0, 6*) г (0, S) для всех 0, т. е. С — сущест- венно полный класс. Рассмотрим следующий простой пример: случайные величины Хх,..., XN независимы и нормально, распределе- ны с дисперсией 1 и неизвестным математическим ожида- нием 0. Пусть а и Ъ — произвольные вещественные чис- ла и а Ъ. Гипотеза Нг заключается в том, что 0 а, Я2 — в том, что a <^Ъ, а Я3 — в том, что 0? > Ь. Пространство D* состоит из элементов dl и dl, где d\ означает решение принять гипотезу Нг. Пусть р — некоторое положительное число, меньшее (Ь — а)/2. Положим И7! (0) = 0 при 0 а + р, Wt (0) = 1 при 0 > а + р, РГ2 (9) = 0 при а — р < 0 < b + р, W2 (0) = 1 при всех остальных 0, W3 (0) = 0 при 0 — р, W3 (0) = 1 при 0 Ъ — р. (5.84)
494 А. ВАЛЬ Пусть £ — априорное распределение на Q, а gx — соот- ветствующее апостериорное распределение после наблю- дения выборки х = (X,..., xN). Очевидно, и\(Вх)= $ ^х(9), 9 >а+р = $ ^(б)+ $ ^(0), 9<а-р 9>Ь+р w3(U= $ d^(0). 9<b~p (5.85) Изучим теперь свойства множества тех х, для которых w. (U < w2 О (5.86) Это неравенство можно переписать в виде $ dgx(0)< $ d^(0) (5-87) a+P^9<b+p 9<а-Р ИЛИ J е^(в) -rNe’dg(0) < J ew»W~Twdg(0), а+Р<9 <Ь+р 9<а -р (5.88) где х — среднее арифметическое наблюдений Можно без труда показать, что множество значений х, при которых выполняется предыдущее неравенство, либо пу- сто, либо заполняет открытый интервал (— оо, с'), где с' — некоторая конечная постоянная или оо. Можно показать также, что если с' — конечная постоянная, то х — с' — единственное значение х, при котором левая и правая части неравенства (5.88) равны. Таким образом, множество х, при которых выполняется неравенство W\ (&х) <С ^2 (£х)> либо пусто, либо заполняет всю веще- ственную ось, либо существует такая конечная постоянная с', что Wy (U < W2 О W. (U) = Ж2 (U или W, (U> (£x) в соответствии с x<^c\ x = с' или x c'. Аналогично можно показать, что множество х, удов- летворяющих (£хХ W3 (£х), либо пусто, либо запол- няет всю вещественную ось, либо существует такая посто-
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 495 янная с", что Wx (£X)<S или = , или > W3 (£х) в зави- симости от того, будет ли ж < , или = , или > с". Следовательно, множество тех х, для которых Wx^Xmint^ О, (5.89) либо пусто, либо заполняет всю вещественную ось, либо существует такая конечная постоянная с*, что соотноше- ния <^, или —, или J> выполняются между обеими частями (5.89) в зависимости от того, будет ли х , или = , или с*. Аналогично можно показать, что множество значений х, для которых ^(LXminf^^), 1У2О, (5.90) либо пусто, либо заполняет всю вещественную ось, либо существует такая конечная постоянная е**, что соотноше- ния , = или выполняются в (5.90) в зависимости от соотношений х ^>, = или с**. Отсюда следует, что су- ществуют две такие постоянные сг и с2 (допускаются и не- собственные значения — оо и +оо), что W. (У < min [Ж2 (У, (|ж)] (5.91) П Ж2(£х)<тт[И\(и . (5.92) при С± X с2 и ^(^Хтш^ии HML)] (5.93) при X с2. Для любых постоянных сг и с2 (сг с2) обозначим через 6С*»С2 решающую функцию, обладающую следующим свойством: SJ1’С2 (я) ~ 1, если х <С сп (х) — 1, если х с2, и 631’С2 (#) = !, если х с2. Из пре- дыдущего следует, что байесовское решение должно совпадать с 6Сь С2 при некоторых значениях и с2 (до- пускаются значения — оо и + оо), кроме, быть может, множества х лебеговской меры нуль. Нетрудно доказать, что обратное тоже верно. Можно показать даже, что для любых постоянных сг и с2 (сх с2) существует такое апри-
496 А. ВАЛЬД орное распределение £ (0), приписывающее вероятность 1 множеству, состоящему из трех точек 0 = а — р, (a -j-b)/29 Ь + р, что 6С1»С2 является байесовским решением относи- тельно | (0). Таким образом, класс С всех байесовских решений совпадает с классом всех % соответствующих всевозможным значениям с± и с2 г). Поскольку замыка- ние С совпадает с С, из теоремы 5.12 следует: для любой решающей функции 8 найдутся такие две постоянные сг и е2 (сх с2), что г (0, бС1-С2) г (0, 6) для всех 0. § 5.2. Рассмотрение некоторых конкретных задач последовательного принятия решения 5.2.1. Вводные замечания. Задача выбора окончатель- ного решения d* после выполнения испытания по существу одна и та же как в последовательном, так и в непоследова- тельном случае. Рассмотрим, например, нахождение бай- есовского решения относительно заданной априорной меры £ на Q. Обозначим через апостериорную вероятност- ную меру на Й после завершения испытания. Окончатель- ное решение dlQ оптимально, если W (§х, принимает минимальное значение в точке d* — dj. Это имеет место как в последовательных, так и в непоследо- вательных задачах принятия решения. Основная труд- ность построения байесовских решений в последователь- ном случае заключается в отыскании оптимального пра- вила проведения испытания. Такая задача, очевидно, не возникает в непоследовательном случае, когда испытание проводится за один шаг наблюдением значений первых N случайных величин Хх,..., XN. Целью настоящего § 5.2 является рассмотрение спе- цифических задач, служащих иллюстрацией общей теории и включающих в себя трудности, возникающие при по- строении оптимальных правил проведения испытаний. 5. 2. 2. Двухшаговая процедура оценки математического ожидания в нормальном распределении. Будем рассмат- 1) Эта характеристика класса байесовских решений являет- ся частным случаем более общих результатов, полученных Собе лем [48].
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 497 ривать следующую задачу принятия решения. Случай- ные величины Хх, Х2,... независимы и распределены нор- мально. Дисперсия общего нормального распределения ряцв- на 1. О математическом ожидании известно, что оно рав- но либо — Д, либо Д, где Д — заданное положительное число. Таким образом, Q состоит из двух элементов Fr и F2, где Fx — распределение X = {XJ со средним — Д, а F2 —- распределение, соответствующее среднему Д. Пред- полагается, что пространство D1 состоит из двух элементов d{ и й2, где d\ означает решение принять гипотезу об истинности F{. Пусть . fl, если i=f=1, W(Fi,dj) — \n . (5.94) у/ [ 0, если i — Л Будем считать, что стоимость испытания пропорциональна числу наблюдений. Пусть с — стоимость одного испытания. Мы будем далее предполагать, что испытание может быть проведено не более чем за два шага, т. е. допустимыми являются только те решающие функции б, при которых с вероятностью 1 испытание происходит не более чем за, два шага. Поскольку случайные величины независимы и одинаково распределены, порядок их наб- людения несуществен, и мы, не теряя общности, можем предположить, что первый шаг испытания состоит в наб- людении над А\,..., Хт, а второй шаг — в наблюдении над Хт+1,..., Хт+п, где т и п — неотрицательные целые числа. Чтобы еще больше упростить задачу, мы предположим, что т задано заранее и не зависит от выбора статистика. Та- ким образом, выбор статистика ограничен выбором п* как функции от наблюдений хт. Решающая функция б может быть представлена те- перь в виде последовательности функций {б{ (хх,..., хт)} (г = 0, 1, 2,...) и функции б+ (я\,..., хт±п), определен- ной для всех вещественных значений хт+п и всех оо натуральных п. Функции неотрицательны, и 2 = 1 • г=0 Далее, б+ (^15..., хт+п) может принимать значения только между 0 и 1. При помощи этих функций решающий про- цесс осуществляется следующим образом. Сначала мы производим наблюдения хт. Для определения объема 32 Позиционные игры
498 А. ВАЛЬД п следующей выборки мы проводим случайный экспери- мент, приводящий к взятию выборки объема i с ве- роятностью £m) (i = 0, 1, 2,...). После полу- чения обеих выборок, состоящих из наблюдений хг,..., хт+п, случайно принимается окончательное решение, причем с вероятностью б+ (х1ч..., хт+п) принимается гипотеза о том, что истинное значение среднего равно А. Теперь мы изучим природу байесовских решений этой задачи. Обозначим через априорную вероятность того, что распределение (z — 1, 2) истинно. Обозначим также через апостериорную вероятность истинности = 1, 2) после выполнения т наблюдений, т. е. u1’ m -j- ym ’ (5.95) о _____ E,2e^ym m ^e~^ym + где У и •••‘Т хи (5.96) для любого натурального и. Обозначим через п объем второй выборки. После получения обеих выборока постери- орная вероятность истинности Fi станет равной m+n, где |itt< определяется выражением, получающимся из (5.95) при замене т на и. Для того чтобы решающая функция б была байесов- ским решением, очевидно, необходимо следующее. Для всех х (кроме, может быть, множества меры нуль) б+ (#1> . . ., Хт + п) “ 1 ПрИ ^2, т+п » (5.97) 6+(^1, . . хт+п) = 0 при g2j т+п <у. Поскольку мера множества выборок (х^..., хт^п), для которых g2, т+п ~ равна нулю, написанное условие опре- деляет б^ (я^,..., хт^п) единственным образом (с точностью до множества меры нуль). Таким образом, задача нахож-
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 49» дения байесовского решения сводится к подходящему вы- бору функций Si (^1,.-., (i = о, 1,...).Для того чтобы перейти к следующей задаче, нам нужно будет исследо- вать условный риск в случае, когда хти п заданьц а 6+ (яр..., xmvn) удовлетворяет (5.97). При данных хт и п пусть a (яр..., х^ п)~ условная вероятность принятия F2 при истинном распре- делении Flt а Р хт, п) —- условная вероятность, принять F± при истинном распределении F2. Таким обра- зом, выражение а (я^,..., хт, п) равно условной вероят- ности неравенства 12еАУт^п^>11е~^Ут+п (5.98} при истинном распределении а 1 - ₽(%,..., хт, п) равно условной вероятности (5.96) при истинном F2. Предыдущее неравенство можно переписать, скажем, так: e^m>^L = hm, (5.99) ^2, т где Zn = ?/m+n— V (5Л0°) Если п > 1, то условная вероятность неравенства (5.99} может быть просто выражена через нормальную функцию распределения со 1 2 G (t) ==—^==Л е~ * " du. ' (5.101) Без труда можно получить следующие равенства: а(хъ . . хт, п) = (">4) <5-102> L 2Д У п J И 1 — Р(«1, . • ; Хт, П) = С А] («>!)• L 2Д У п J (5.103} При п == 0, мы имеем {0 при 1 при Ат<1, (5.104) 32*
500 А. ВАЛЬД Поскольку $itm — апостериорная вероятность^ (i = 1,2) при данных хт, апостериорный риск при данных хт и п равен хт, п) = gi, та хт, п) + + h, m3 (^1, . • AZ) + с (m + п). (5.105) Для любых заданных значений х^..., хт нас будут интересовать значения п, при которых г хт, п) минимально. Очевидно, минимум г (#!,..., хт, п) по п можно брать только по значениям п \/с. Для каждой данной выборки (я^,..., ят) обозначим через N хт) множество натуральных п, при которых г (^х,..., хт,п) минимально. Таким образом, N (ухц,..., хт) является под- множеством множества всех натуральных чисел, не пре- восходящих 1/с. Для того чтобы решающая функция 6 была байесов- ским решением относительно данного априорного распре- деления В=(£1, £2), необходимо и достаточно, чтобы функ- ция 6+ (xj,..., #m+n) удовлетворяла (5.97) и (ц ят) = = 0 для любого I, не являющегося элементом N (а^,..., х^ (кроме, быть может, множеств лебеговской меры нуль). Если для каждой выборки (#!,.••, х^ множество N (яг,..., ят) состоит из единственного элемента, то суще- ствует (существенно) единственное байесовское решение. Для вычисления множества N (хх,.., хт) полезно рассматривать п как непрерывную переменную, т. е. предполагать, что п может принимать любые неотрица- тельные вещественные значения. Для натуральных зна- чений п определим формально а (а^,..., хт, п) и |3 (х^.., ...,хт, п) уравнениями (5.102) и (5.103). Частная производ- ная от г(х1,..., хт, п) по п равна dr (a?i, . ♦ хтч дп “ /ST6 1 / 10£ К» г—\2 Г-.10У>» +1 Д — £2т -_=0 2 \2дКп J ------ (5.106)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 501 Множество N хт) можно построить, вав корни уравнения Эг (ат, . . хт, п) __ п дп исследо- (5Л07> относительно п. Интересно заметить, что г (#!,..., хт, п) зависит толь- ко от ут = хг + ... +хт и п. Это непосредственно следует из равенств (5.102) — (5.105). Поэтому множество N (я^,..., хт) зависит только от ут = х± + ... + хт. Эта значительно упрощает табулирование N (хх,..., хт). По- скольку при любом п значение г (я?!,..., хт, п) может быть легко вычислено с помощью формул (5.102) — (5.105)г множество N (я?1?.., я:т) может быть построено лишь мето- дом проб и ошибок. Можно легко показать, что допущения 3.1— 3.7 главы Я в рассматриваемой задаче принятия решения выполнены. Таким образом, все результаты, полученные в главе 3, к этой задаче применимы. В частности, верны следующие утверждения: (1) класс всех байесовских решений относи- тельно всевозможных априорных распределений £ явля- ется полным классом решающих функций; (2) существует наименее благоприятное априорное распределение (3} существует минимаксное решение; (4) минимаксное реше- ние является байесовским решением относительно всех наи- менее благоприятных априорных распределений |. Покажем теперь, что = 44““ наименее бла- \ Z Z / гоприятное априорное распределение. Из соображений симметрии следует, что для любого априорного распре- деления £° имеем 7V(xi, . . ., хт) = N(—xlt . . ., — хт). Следовательно, существует такое байесовское относитель- но |° решение б0, что 6?(я?1, ..., хт) = S?(—я?г, ...,—хт). Далее, для любого байесовского относительно реше- ния 6° мы имеем ё^(я;1, . . ., xm^n)==lt если я* + • • • -F +п > 0, И 6+(Я1, . . ., хт+п) = о, если £].+ ••• ••• + #m+n<C0. Из соображений симметрии следует, что для любого байесовского относительно решения S0, для которого i>i(xi, . . хт) = (—xlf . . —хт), имеет место равенство r(Fi, S°)==r(Fa, 6°). (5.108}
502 А. ВАЛЬД Это равенство показывает, что £° = есть наименее благоприятное априорное распределение, и любое байе- совское относительно £° решение 6°, удовлетворяющее условиям Si (xn..., хт, ri) = 6| (— Яр..., — хт) (i = 0, 1, 2,...), должно быть минимаксным решением. Как ранее было за- мечено, г (а^,..., хт, п) зависит только от ут = + ... ... + хп и п. Таким образом, мы вместо г (х^..., хт, п) можем писать г (ут, п). Пусть P(2/J = min r(ym, п). (5.109) п Обозначим далее через (т) математическое ожидание р (Ут) при истинном распределении F^(i = 1, 2), т. е. положим л с ~ — (У™ + Ч’1(т) = жт^ ip(?/m)e т dym (5Л10) и оо 1 л (* - -— (У™ - тД)2 Тогда для любого априорного распределения | = (£п ?2) имеет место равенство min г (g, S) = giipi(m) + £2ф2(^). (5.112) 8 Если значение т может быть выбрано эксперимента- тором, то его оптимальные действия состоят в выборе зна- чения т, при котором правая сторона (5.112) становится минимальной. Тем не менее функции % (т) иф2 (т) вычис- лить трудно. Грубое приближение для (тп), конечно достаточное для практических целей, может быть полу- чено из р (ут) заменой ут на его математическое ожидание при Гц т. е. фх (т) ~ р (—?пД) и ф2 (m) ~ Р (тД)- (5.113)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 503 5.2.3. Последовательная процедура оценки математи- ческих ожиданий пары биномиальных распределений. В этом пункте мы рассмотрим следующую задачу принятия решения: пусть Х1? Х2,... — независимые случайные ве- личины, каждая из которых может принимать значения 0 и 1. Вероятность того, что = 1, равна р, когда i не- четно, и равна р*, когда i четно. Постоянные р и р* неизвестны, однако известно, что (р, р*) равно или (Pi,Pi), или (р2, р2), где Pi, р2, Pj , р2 —заданные положи- тельные числа, меньшие единицы. Мы предположим, что Р1Ч=Р2 и Pi =h Р*- Пусть Fi — распределение последова- тельности X = {Х^} при (р, р*) = (р{, рГ) (i = 1, 2). Таким образом, пространство Q состоит из двух элемен- тов и F2. Предположим, что пространство D1 со- стоит из двух элементов d{ и d2, где d\ означает окончатель- ное решение принять гипотезу истинности F{. Пусть f ( 1 при /=£=/, п (5.114) ' (0 при i = j. v ' Предполагается, что стоимость испытания пропорцио- нальна общему числу наблюдений и ни от чего более не зависит. Таким образом, если п — общее число выполнен- ных наблюдений, то стоимость равна сп, где с — стоимость одного наблюдения. Для обозначения случайной величины X2U1 (i = 1, 2,...) удобно пользоваться символом , а для обозначения случайной величины X2i — символом Аналогично будем писать уг вместо ж2и1 и вместо x2i. Поскольку стоимость испытания не зависит от числа его шагов, мы можем ограничиться рассмотрением только таких решаю- щих функций S, для которых каждый шаг испытания со- стоит ровно из одного наблюдения. Поскольку все У, так же как и все Z,— случайные величины, имеющие одинако- вые распределения, мы можем наложить еще одно огра- ничение на S: при p-наблюдении наблюдать значение с наименьшим еще не наблюденным номером f, а при z- наблюдении — наблюдать значение Zx с наименьшим еще не наблюденным номером i. При сделанных ограниче- ниях решающая функция может быть описана четырьмя
504 А. ВАЛЬД функциями 6i (z/j,.., ym- zx,..., zn) (i = 1, 2, 3, 4), удов- летворяющими условиям: МУь • • ym; zx,. . zn)>0, (5.115) 4 S Myi, • • M Ут> Zi, . . Zn) = 1. i =1 Здесь ...» ym*, Zi, . . zn) означает вероятность принять окончательное решение d\ (i = 1, 2) при наблю- дении выборки г/i, . . ут\ zu . . zn; 63(ylt . . ут; z3, • • •» zn) есть вероятность продолжения испытания наблюдением значения a • • •> ут> ^i, . . ., zn) есть вероятность продолжения испытания наблюдением значения zn+1. Функции определены также при т = = п = 0. Если т = п — 0, то 6$ равно вероятности соответствующего действия до начала испытания. Задача, рассматриваемая здесь, по характеру несколь- j ко отличаться от задач, рассмотренных в главе 4, по- скольку в главе 4 мы предполагали, что все случайные величины (i = 1, 2,...,) распределены одинаково. < Однако, как будет видно далее, большинство результа- тов главы 4 может быть применено и к настоящему случаю. Любое вероятностное распределение на Q можно опи- 1 сать некоторым числом Е, между 0 и 1, где £ — вероят- 4 ность гипотезы об истинности Fv Для любого Е, обозначим с. У1г’*’Ущ через Szo...zn апостериорное вероятностное распределение на Q (апостериорная вероятность истинности при апри- орном распределении | и наблюдении выборки (г/х,..., ут; zn). Если п = 0, то предыдущий символ пре- вращается в Zyi..Ут> Аналогично, если т == 0, то он превращается в £21.2п. Если тп=п = 0, то символ £z772n М превращается в £. Очевидно, т т п п S Уг m - S 5 2i п— S г. VI...vm = tPi (1-Р1) 1 (pl) 1 (1 — р!> 1 (5.116) ...гп а ’
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 505 где т т п п Г 2 Ух - 2 1/1 2 П- 2 Z. (1-Р1) 1 (Р;)1 (1-pJ) 1г + т т п п 2 Ух т - 2 у{ 2 Z1 п~ 2 Z. А + (!-&)?/ (1-Р2) 1 (Рр> (1_р;) х }. Для любого натурального к обозначим через 6fc решаю- щую функцию, при которой вероятность совершения более чем к наблюдений равна нулю. Как и в главе 4, положим pk(|) = Infr(&, &) (* = 0,1,2,...). (5.117) s'* Очевидно, р0 (g) = min (£, 1 — В). (5.118) Имеет место следующая рекуррентная формула: Pfc+i(£) = min [р0 (£), а0 (|) pk (|°) + at (£) pk (g1) + c, bo (B) ps (So) + bt (B) pk at) + c), (5.119) где ao(S) = S(l-Pi) + (l-S)(l-p2), (5.120) <h (B) = Ipi + (1 — B) Pi bo a) = в (i - p{)+(i - g)(i - Pp, (5.121) Доказательство этой рекуррентной формулы опущено, поскольку оно по существу не отличается от доказатель- ства соответствующей рекуррентной формулы, приведен- ного в главе 4 (см. теорему 4.1). Соотношение lim pk а) = Р (S) = inf Г а, Ь) (5.122) fc-»oo S может быть доказано точно таким же путем, как и соот- ветствующее равенство в главе 4 [см. уравнение (4.21)1.
506 А. ВАЛЬД Пусть допустимыми являются только те решающие функции 6, при которых вероятность того, что число наб- людений, необходимых для проведения испытания, пре- восходит наперед заданное число /с0, равна нулю. В этом случае для полного описания байесовских решений могут быть использованы функции р0 (g), pj (g), р2 (£),..., pfro(g). С этой целью мы определим три подмножества интервала [0, 1]: SUtll SUi2, 5U>3, зависящие только от параметра и, принимающего натуральные значения. Подмножество SUil определяется как множество всех значений £, для которых Ро ® > Ри (?); (5.123) — как множество значений £, для которых (?)Ptt—1 (?°) + «1 (?)р^ (S1) + С > > min [ро (?), Ьо (?) р^(?о) + (?) Pu_x (?1) + С]; (5.124) $щ з—как множество значений |, для которых Ьо(?)р^1(?о) + Ь1(?)рм_1(?) + ^> > min [р0 (|), йо (g) pu_t (g°) + аг (g) pu-1 (g1) + с]. (5.125) Для того чтобы решающая функция S, предписывающая вероятность 0 тому событию, что число наблюдений превы- сит /с0, была байесовским решением относительно априор- ного распределения £, необходимо и достаточно, чтобы выполнялись следующие условия: 51 (У1, • •’>Ут> если g2 ; Z1, . • Z„) = 0, zi, . . zn) = 0, (5.126) (5.127) 5-2 (У1, . • •> Уту если gz„ ...,Л> т; 5i(i/i ym;'zlt . . • •> zn) = 5з (2/i, • •2/m! zi, .. z„) = 0, если т + п < kQ и .Уь ...» Ут принадлежит Sk<!-m-n, (5.128) 1! 5з {yi, • • м Уту Z1, . . Zn) = 0, (5.129)
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 507 если т + п = kQ или если т + п <С kQ и vzm принад- лежит 15’/;о-ТП_П1 2? • • м Ут, 2Ъ . . ., Zn) = 0, (5.130) если т + п = кь или если т + п < kQ и ... ’ ?т принад- лежит ^/fo—7П—П, 3* Эти пять условий выполнены для следующего решаю- щего правила. Продолжать испытание, если т + п <^kQ и Szh ... zn принадлежит х (и только в этом случае). Если уже получена выборка (z/i,..., ут; z19..., zn) и приме- нение предыдущего правила требует выполнения допол- нительного наблюдения, то совершить ^-наблюдения, если Iz^ z™ лежит в и ^-наблюдение в противном случае. Если испытание закончилось получением выборки (У1т--,Ут> 2i,..., 2П), то принять решение d{, если 5zi’.7.’z™> >у, и d2, если U, ...,z^<y. Обозначим через 8г множество Sud при и — оо и Роо(£) = = р (£) (г = 1, 2, 3). Характеристика байесовских реше- ний для неограниченного числа наблюдений может быть дана в терминах множеств 8г. Решающая функция S яв- ляется байесовским решением относительно | тогда и только тогда, когда равенства (5.126) — (5.130) удовлет- воряются при замене к0 на оо и S^i на Рещающее пра- вило, удовлетворяющее этим условиям, определяется сле- дующим образом. Продолжать испытание, пока **’’ vzm принадлежит 5Х (и только в этом случае). Если наблюда- лась выборка (yi,...,ym; 21,.., zn) несли z™ принадле- жит 51, то совершить у-наблюдение, если при- надлежит 53, и ^-наблюдение в противном случае. Если уже получена выборка (z/x,..., ут; 2Х,..., zn) и z™ не принад- лежит S\, принять решение d{, если^’z™ » и в противном случае. Обозначим через 5* дополнение т. е. 5* состоит из значений g, не принадлежащих 5V Пересечение 5* с ин-
508 А. ВАЛЬД тервалом [0,1/2] в главе 4 обозначалось через Cdt, а пере- сечение с [х/2, И — через Cdt- Доказательство того, что множества Cdt. и Cdt% замкнуты и выпуклы, приведенное в главе 4, может быть проведено здесь без всяких изменений. Таким образом, Cdt и Cdt представляют собой замкнутые интервалы. Очевидно, что Cd^ содержит точку % — 1, a содержит точку £ = 0. Пусть а — максимальный элемент Cdt, а b — минимальный элемент Cdt. Очевидно 2 1 5Х является теоретико-множественной суммой интервалов [0, al и R?, 1]. Таким образом, = (а, Ъ). Можно показать, что пересечение множеств 52 и S3, S2S3, в точности равно теоретико-множественной сумме полуоткрытых интервалов [0, а) и (Ь, 1]. Доказательство этого мы опускаем, так как оно по существу совпадает с доказательством теоремы 4.9 главы 4. Используя предыдущие результаты, касающиеся при- роды множеств 5Х, S2 и S3, можно следующим образом опи- сать байесовские решения. Решающая функция б тогда и только тогда является байесовским решением, когда она удовлетворяет следующим условиям: (1) если апостериорная вероятность для Fr меньше а, то испытаниех) прекращается и принимаетсяокончательное решение d2; (2) если апостериорная вероятность для Fx больше Ь, то испытание прёкращается и принимается окончательное решение d^; (3) если апостериорная вероятность для Fr^> а и <^Ь, то совершается дополнительное наблюдение; (4) если совершается дополнительное наблюдение, то оно должно быть у-наблюдением, если апостериорная ве- роятность для Fr является точкой S3, и z-наблюде- нием, если эта апостериорная вероятность является точ- кой S2; х) Если испытание еще не началось, то апостериорная вероят- ность для Fi должна быть заменена на априорную вероятность для Л.
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 509 (5) если испытание прекращается в случае, когда апосте- риорная вероятность для Fx равна а (Ь) и а А^ то принимается окончательное решение d2 (й{). Пусть Si — пересечение с (a, b) (i = 2, 3); посколь- ку ни одна из точек £, принадлежащих (а, Ь), не при- надлежит пересечению S2S3, множества S'2 и S'3 не пере- секаются. Множество S2 состоит из тех точек g из (а, Ь), для которых а0 а) р (^) + р ап > ь} а)Ра0) + о (5.131) а множество 53 состоит из тех точек £ из (а, Ъ), для которых «о (&)р(^)+а1(^)р(В1) < Ш)р(ёо) + ВДр О (5.132) Природа множеств, определенных неравенствами (5.131), (5.132), еще не изучена. Не исключено, что эти мно- жества обладают простой структурой; по-видимому, они часто оказываются просто интервалами. Очевидно, что в рассматриваемой здесь задаче принятия решения допущения 3.1 — 3.7 главы 3 выполнены. По- этому к этому случаю применимы все результаты, полу- ченные в главе 3. В частности, верны следующие утверж- дения: (1) класс всех байесовских решений является полным классом решающих функций; (2) существует такое значение что | = В' является наименее благоприятным априорным распределением; (3) существует минимаксное решение, и всякое минимаксное решение является бай- есовским решением относительно любого наименее бла- гоприятного априорного распределения. Предыдущие результаты можно обобщить в двух на- правлениях. (1) Вместо предположения о том, что У-пере- менные и Z-переменные могут принимать только два зна- чения 0 и 1, мы можем перейти к любому (абсолютно непрерывному или дискретному) распределению У-пере- менных и любому распределению Z-переменных. (2) Вме- сто предположения о том, что последовательность {Х^ может быть разбита на две подпоследовательности так, что все случайные величины, принадлежащие одной и той 33 По зидионные игры
510 А. ВАЛЬД же подпоследовательности, имеют одинаковые распреде- ления, можно сделать и более общее предположение, при котором последовательность {XJ может быть разбита йа любое конечное число таких не пересекающихся подпосле- довательностей, причем случайные величины, принадлежа- щие одной и той же подпоследовательности, имеют одно и то же распределение. 5.2.4. Рассмотрение задачи принятия решения в слу- чае, когда Q состоит из трех прямоугольных распределе- ний. В качестве иллюстрации идей и понятий, содержа- щихся в общей теории принятия решения, мы рассмотрим здесь одну совсем простую задачу принятия решения. Пусть случайные величины Х19 Х2,... независимы, име- ют одно и то же прямоугольное распределение и прини- мают значения из некоторого единичного интервала. Сред- няя точка интервала 0 неизвестна, однако известно, что она может быть равна одному из трех чисел: — 1/4, 0 и 1/4. Таким образом, в этой задаче Q состоит из трех элементов. Пространство D* окончательных решений состоит из трех элементов: d2 и d^, где d\ означает решение отвергнуть гипотезу Нг о том, что 0 = —х/4; d2 означает решение от- вергнуть гипотезу Н2 о том, что 0 = 0, и означает реше- ние отвергнуть гипотезу Н2 о том, что 0 =1/4. Пусть . ( 1 при i = j, IV (Fit d ) = { n . , . v " [0 при i =/= 7, где через Fi обозначено распределение X = {Хг} при истин- ной гипотезе Н{, Иными словами, потери от принятия окончательного решения d\ при истинной гипотезе равны 1, а в противном случае — 0. Мы предполагаем, что стоимость испытания пропорциональна числу наблю- дений. Пусть с — стоимость одного наблюдения. Будем, далее, считать, что 0 < с Эта задача принятия решения является частным слу- чаем общей задачи принятия решения, рассмотренной в главе 4. Поэтому мы будем пользоваться терминологией и обоз- начениями главы 4. Априорное-распределение на Q зада- ется вектором £ = (I1, £2, £3), где означает априорную вероятность гипотезы (i == 1, 2, 3).
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 511 Пусть х = (#!,..., хт) — выборка, состоящая из т наблюдений — наблюденные значения Хг), a gx — апостериорное распределение при априорном распределе- нии g и наблюденной выборке х = (а^,..., жт). Очевидно, gx = g, если — V/rC х/< Для i — 1,..., т. Если min (^1,..., ят)<—х/4, то = 0. Если max (^,..., хт) > 1/^, то gi = 0. Поэтому, если min (я^,..., плитах (х-^... ..., хт) то мы можем принять окончательное решение без всякого (апостериорного) риска. При любой гипотезе Нг (г = 1, 2, 3) вероятность того, что наблюдение будет лежать вне интервала [—равна 1/2. Следовательно, при любом априорном распределении g вероятность того, что наблюдаемое значение случайной величины окажется вне интервала [—Va,], равна’•/г- Из этого следует, что если испытание продолжается до получения наблюдения вне [— у4, х/4], то математическое ожидание числа наблюде- ний равно 2. Следовательно, Р (g) < 2с, (5.133) где р (g) = inf г (g, 6) (см. п. 4.1.1). Минимальный риск Ро (&) (см. уравнение (4.8) п. 4.1.1), когда окончательное решение принимается без проведения испытания, равен Ро (g) = min (g1, g2, g3). (5.134) Поскольку до тех пор, пока ни одно из наблюдений не оказывается вне интервала!—х/4, х/4], апостериорное распре- деление gx совпадает с априорным распределением g, очевидно, что р (g) = min [ро (g), 2с] = min (gx, g2, g3, 2c). (5.135) С помощью функций p0 (g) и p (g) можно построить байе- совское решение. Мы должны рассмотреть следующие три случая. I. min (g1, g2, g3) 2c. В^этом случае байесовское решение описывается следующим образом. Совершать наблюдения до получения наблюдения вне инте рвала [—1Л, т/4 ]. 1 1 Если последнее наблюдение — у хп <С------, то при- нять решение Й3. 33*
512 А. ВАЛЬД Если хп<^ — х/2, то выбрать случайным образом либо d2, либо rfg. Если х/4 <С < х/2, то выбрать d{. Если хп J> */2, то произвести случайным образом выбор между d{ и d2. Используя обозначения, введенные в п. 4.1.1, мы можем это выразить так: б (i Ц- 1 | х^... х^ =1, если — r/4<^ min х^ <; max (яг,..., хг) и б (I + 1| х1? . . . , х^ = 0 в остальных случаях; 1^,..., хп)=0, если наблюдения х^..., хп оказываются вне значений, соответствующих гипотезе Н{. II. min (£\ £2, £3) = 2с. Для того чтобы решающая функция б была байесовским решением, необходимо и достаточно выполнение следующих условий (кроме, быть может, множества выборок, вероятностная мера которых при гипотезах Н2 и Н3 равна нулю): (1) б (d-|0) = 0 для любого i, для которого >min(^, g2, g3); (2) б | ^i, . . ., xr) — 0, если min (£x, £2, £3) и все . Г 1 11 наблюдения xlf . . ., xr лежат в интервале — у , ; (3) б (г + 1 | я1}. Ху) = 0, если наблюдения хх, ..., хг_х Г 1 11 лежат в интервале-----, а хг лежит вне интерва- г 1 11 Ла L 4 ’ 4 J ’ (4) б (dl| Xi, . . яп) = 0, если наблюдения .гг, . . ., хп_] г 1 11 I 1 11 лежат в — , а хп— вне — , но среди значений, соответствующих 1Ц. III. min (I1, £2, £3)<2с. В этом случае для того, чтобы решающая функция б была байесовским реше- , з нием, необходимо и достаточно, чтобы было 3«(б||0)- 1 1=1 и 6 (dj | 0) = 0 для любых /, для которых > min (g1, £2, £3). Пусть б0 — решающая функция, определенная сле- дующим образом: б (11 0) = 1; б (i + 11^,..., х{) = 1 при 1 1 — х^у для J = 1,..., г, 6(di|x1,..., хп) = 1, если наблюдения хп_х лежат в интервале [—х/4, х/4], а
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 513 I хп лежит вне [—х/4, VJ; при этом i — наименьший индекс, * при котором множество значений случайной величины, со- 1 ответствующее гипотезе Н{, не содержит хп. Очевидно, ’ г (О, б0) ~ 2с при 0 = —1/4, 0, х/4. Следовательно, еЪли < нам удастся показать, что б0 есть байесовское решение 5 относительно некоторого априорного распределения I то б0 будет минимаксным решением. Пусть с 1/Q. Тогда I б0 — байесовское решение относительно , у, ~). Поэтому б0 — минимаксное решение при с Пусть CQ — класс решающих функций б, удовлетво- ряющих следующим двум условиям (кроме, быть может, множества выборок вероятностной меры нуль при гипо- тезах Я1? Я2 и Я3): (1) если я^..., яп_х лежат в [— , а хп вне если (11 0) (2 | я^.-.б (м | Я!,..., яп_х) О, t то б (лг + 11 Яр..., яп) = 0 и 6(<4|яр..., хп) = 0 для всех г, для которых множество значений случай- ной величины, соответствующее гипотезе Я^ содер- жит хп. (2) существует такое натуральное число i 3, что б (dj/я!,..., яг) — 0 при любой выборке Яр..., яг, удов- летворяющей условиям: —Х/4<С С Для 7 — !»•••> г и б (110) б (2 | Я!)...б (r| Xj,..., яг)>0. Покажем теперь, что если Q<Zc<^r!^ то Со есть ми- нимальный полный класс решающих функций. Сначала мы покажем, что если б — байесовское решение относи- тельно априорного распределения £, то б является эле- ментом Со. Очевидно, б должно удовлетворять (1). По- скольку с г/6, найдется такое натуральное i 3, что V 2с. Байесовское решение б должно удовлетворять условию (2) для любого г, для которого £г 2с. Пока- жем теперь обратное. Пусть б — произвольный элемент из Со, т. е. б — произвольная решающая функция, удовлет- воряющая (1) и (2). Предположим, что (2) выполнено при г = г0. Обозначим через = (£j, Й» й) следующее апри- орное распределение: 1—4с и Й — 2с при / =/= г0. Очевидно, б является байесовским решением относитель-
I 514 А. ВАЛЬД но £s. Далее, поскольку все компоненты £c положительны, 6 должна быть допустимой решающей функцией. Следова- тельно, Со совпадает с классом всех байесовских решений, и любой элемент S ЕЕ Со является допустимой решаю- щей функцией. Из теоремы 3.20 следует тогда, что класс С о является минимальным классом решающих функций. 5.2.5. Последовательное точное оценивание среднего значения прямоугольного распределения с единичным ин- тервалом значений. В этом пункте мы рассмотрим следую-, щую задачу. Пусть случайные величины Х2,... неза- висимы, имеют общее прямоугольное распределение, принимают значения из некоторого единичного интервала, однако среднее значение 0 неизвестно (может прини- мать только вещественные значения). Таким образом, ! Q является однопараметрическим семейством функций рас- пределения. Задача заключается в нахождении оценки для О. Для всякого вещественного значения 0* обозначим t через 4*» окончательное решение оценить неизвестное 1 среднее 0 значением 0*. Поэтому D* состоит из эле- 1 ментов de*, соответствующих всевозможным веществен- 1 ным 9*. f Положим I W (0, 4*) = (0* - О)2. (5.136) I Стоимость испытания пропорциональна числу на- | блюдений. Обозначим через с стоимость одного наблюдения. Задача, рассматриваемая здесь, также представляет со- бой частный случай общей задачи, рассмотренной в главе 4. Здесь мы будем иметь дело с нахождением минимаксного решения. С этой целью построим сначала байесовское ре- > шение для случая, когда априорное распределение для 0 прямоугольно на отрезке [а, 6], гдеа<<&. Предположим, что уже получено т наблюдений Яр..., хт. 1 Пусть u = min (я?!,..., хт) и v — max (а?х,..., х^. (5.137) Тогда апостериорное вероятностное распределение для 0 будет прямоугольным на общей части интервалов [а, &] и *
СТАТИСТИЧЕСКИЙ РЕШАЮЩИЕ ФУНКЦИИ 515 — х/2» и + 1/2]. Обозначим через I (и, v) пересечение [а, Ь] и [v — х/2, и + Vs], через t (и, v) середину интер- вала I (u, v). Очевидно, что окончательным оптимальным решением является оценка 0 величиной t (и', г?'), где и' иг?'— значения и и г?, соответствующие окончанию испы- тания. Таким образом, задача нахождения байесовского решения сводится к задаче нахождения оптимального пра- вила прекращения испытания. Очевидно, что принадлежность £ к типу 1, типу 2 или типу 3 (определение типов 1, 2, 3 см. в п. 4.1.3) зависит только от длины I интервала значений случайной вели- чины Поэтому неотрицательную часть вещественной оси можно разбить на три непересекающихся множества Т?2 и7?3 так, что если I принадлежит Rit то распределение В принадлежит к типу i (I = 1, 2, 3). Обозначим через 1т длину интервала I (и, v) после со- вершения т наблюдений ях,..., хт (т= 1, 2,...). Обозна- чим через lQ длину интервала значений случайной ве- личины, соответствующей априорному распределению, т. е. lQ = Ъ — а. С помощью множеств 7?х, Т?2 и R3 бай- есовское решение можно построить следующим образом. На m-м шаге испытания (т = 0, 1,...) вычислить 1т. Если 1т принадлежит 7?х, то прекратить испытание и принять соответствующее окончательное решение. Если принадлежит R2, то выбрать случайным образом между совершением дополнительного наблюдения и принятием окончательного решения. Если 1т принадлежит R3 — совершить дополнительное наблюдение. Таким образом, задача построения байесовского решения сводится к опре- делению множеств Ru R2 и R3. Если испытание заканчивается на m-м наблюдении, то апостериорный риск связан с окончательным решением и равен апостериорному математическому ожиданию зна- чения [0 — t (и, г?)]2, которое просто равно 1т /12. Для определения множеств R19 R2 и R3 необходимо определить условное математическое ожидание случайной величины ^т+1/12 при условии lm = I, где I — заданное натураль- ное число (т = 0, 1, 2,...). Простые вычисления пока- зывают, что рассматриваемое условное математическое
516 А. ВАЛЬД ожидание равно Е (-%2-1 z---= И = тт - 4 ’ <5-138) когда О *С 1, и Е{ 12 Р"»= = IT 24Г ’ (5.139) когда Z ;> 1. Пусть q>(/) = 4-£(-%L-p-==z): (5.140) тогда /з Ф(0 = ^- (5.141) при I 1 и ’й“тг + > <5Л42> при Z > 1. Пусть I — длина интервала I (и, v) до совер- шения дополнительного наблюдения. Величина ф (Z) пред- ставляет собой просто ожидаемое уменьшение апостериор- ного риска, соответствующего окончательному решению, принятому при дополнительном наблюдении. Очевид- но, ф (Z) строго возрастает с возрастанием Z; поэтому уравнение Ф (Z) = с (с — стоимость одного наблюдения) (5.143) имеет ровно один корень. Пусть I = Z — корень этого уравнения. Поскольку ф (Z) — монотонная функция, а 1т (т = 0, 1, 2,...), мы можем легко получить, что состоит из всех значений I Z, Т?2 — из единственного значения Z, а 7?3 - из всех I Z. Таким образом, если априорное распределение на Q прямоугольно, то байесовское решение задается следую- щим правилом. На m-м шаге испытания вычислить зна- чение 1т. Если lm Z, то прекратить испытание и принять надлежащее окончательное решение. Если lm I, то
СТАТИСТИЧЕСКИЕ РЕШАЮЩИЕ ФУНКЦИИ 517 совершить дополнительное наблюдение. Если 1т = Z, то сделать случайным образом выбор между приняти- ем окончательного решения и дополнительным наблю- дением. Пусть б0 — решающее правило, задаваемое следующим образом. Совершается по крайней мере одно наблюдение, испытание заканчивается m-м наблюдением и число Vm берется в качестве оценки 0. При этом т определя- ется как наименьшее натуральное число, для которого »т + 1)< Л ит = min(Хх, . . ., хт), vm = тах(яъ . . ., хт). Покажем теперь, что б0 есть минимаксное решение на- шей задачи принятия решения. Очевидно, что функция г (0, б0) постоянна для всех значений 0. Пусть г0 — по- стоянное значение г (0, б0). Для любого натурального к обозначим через пря- моугольное распределение на йс областью значений [—к. &]. Пусть — байесовское решение относительно в соответствии с которым испытание заканчивается, как только lm Z. Для любого к max (2, Z/2) мы имеем г(0, бЛ) = г (0, 60) = г0 . (5.144) при 0<—= I— (к — 1), к —- 1]. Предыдущее равенство не- посредственно следует из того, что б0 совпадает с при [0|<Л-1. Предположим теперь, что решение б0 не минимакс- ное. Тогда существуют такая решающая функция 6* * и такое положительное число г0 г0, что г (0, 6*) < г* < г0 (5.145) для всех 0. Очевидно, lim sup г (В;., б*)«С г*. (5.146) /.-^00
518 А. ВАЛЬД Из (5.144) следует, что lim infr(£fc, 6л)>г0- 7<->оо (5.147) Поскольку 8к — байесовское решение относительно не- равенство (5.146) не может выполняться. Таким образом, мы получаем противоречие, и наше предположение о том, что решение б0 минимаксное, дока- зано. ЛИТЕРАТУРА [1] Albert G. Е., A note on the fundamental identity of se- quential analysis, Ann. Math. Stat. 18 (1947). [la] A 1 b e r t G. E., Correction to «А note on the fundamen- tal identity of sequential analysis», Ann. Math. Stat., 19 (1948). [2] Anscombe F. J., Linear sequential rectifying inspection for controlling fraction defective, Suppl. J. Roy. Stat. Soc. 8 (1946). [2a] Anscombe F. J., Goodwin H. J. and P 1 a c k e t t R. L., Methods of deferred sentencing in testing the fraction defective of a continuous output, Suppl. J. Roy. Stat. Soc. 9 (1947). [3] Armitage P., Sequential tests of student’s hypothesis, Suppl. J. Roy. Stat. Soc. 9 (1947). [4] A г г о w K. J., Blackwell D. and G i r s h i c k M. A., Bayes and minimax solutions of sequential decision problems, Econometrica 17 (1949). [5] Banach S., Theorie des operations lineaire, Monografje Matematyczne, Warszawa, 1 (1932). [6] Barnard G. A., Sequential tests in industrial statistics, suppl. J. Roy. Stat. Soc. 8 (1946). [7] Bartky W., Multiple sampling with constant probabi- lity, Ann. Math. Stat. 14 (1943). [8] В a r t 1 e t t M. S., The large-sample theory of sequential tests, Proc. Cambridge Phil. Soc. 42 (1946). [9] В 1 a c k w e 1 1 D. and G i r s h i c k M. A., On functions of sequences of independent chance vectors with applications to the problem of «Random Walk» in к dimensions, Ann. Math. Stat. 17 (1946). [10] Blackwell David, On an equation of Wald, Ann. Math Stat. 17 (1946). [11 ] В 1 a c k w e 1 1 David, Conditional expectation and unbia- sed sequential estimation, Ann. Math. Stat. 18 (1947). [12] Blackwell D. and Girshick M. A., A lower bound for the variance of some unbiased sequential estimations, Ann. Math. Stat. 18 (1947).
ЛИТЕРАТУРА 519 [13] Burman J. Р., Sequential sampling formulae for a binomial population, Suppl. J. Roy Stat. Soc. 8 (1946). [14] Dodge H. F. and Romig H. G., A method of sampling inspection, Bell System Tech. J. 8 (1929). [15] Fisher R. A., On the mathematical foundations of theore- tical statistics, Phil. Trans. Roy. Soc. A222 (1921). [16] Fisher R. A., Theory of statistical estimation, Proc. Cam- bridge Phil. Soc. 22 (1925). [17] F i s h e r R. A., The logic of inductive inference, J. Roy. Stat. Soc. 98 (1935). [18] Fisher R. A., The design of experiments, Oliver and Boud. London, 3rd ed., 1942. [19] Girshick M. A., Contributions to the theory of sequential analysis, I, Ann. Math. Stat. 17 (1946). [20] Girshick M. A., Contributions to the theory of sequential analysis, II, III, Ann. Math. Stat. 17 (1946). [21] G i r s h i к M. A., M о s t e 1 1 e r F. and Savage L. J., Unbiased estimates for certain binomial sampling problems with applications, Ann. Math. Stat. 17 (1946). [22] H a r r i s T. E., Note on differentiation under the expectation sign in the fuodamental identity of sequential analysis, Ann. Math. Stat. 18 (1947). [23] Хаусдорф, Теория множеств, M., ОНТИ, 1937 (1935). [24] Helly Е., Ober Systeme linearer Gleichungen mit unend- lich vielen Unbekannten, Monatshefte Math. Physik 31 (1921). [25] H e r b a c h L. H., Bounds for some functions used in sequen- tially testing the Mean of a Poisson distribution, Ann. Math* Stat. 19 (1948). [26] К a c Mark, Random Walk and the theory of brownian mo- tion, Amer. Math. Monthly 54 (1947). [27] Kaplansky I., A contribution to von Neumann’s theory of games, Ann. Math. 46 (1945). [28] К г у 1 о f f N. and Bogoliouboff N., La theorie gene- rale de la mesure dans son application a 1’etude des systemeS dynamiques de la mecanique non-lineaire, Ann. Math. 38 (1937). [29] Лефшец С., Алгебраическая топология, M., ИЛ, 1949 (1942). [30] Lehmann Е. L., On families of admissible tests, Ann. Math. Stat. 18 (1947). [31] M a h a 1 a n о b i s P. C., A sample survey of the acreage under jute in bengal with discussion of planning of experiments, Proc. 2nd Indian Stat. Conf., Calcutta, Statistical Publishing Society, 1940. [32] Milgram A. N., Partially ordered sets, separating systems and inductiveness, Reports of Mathematical Colloquium, 2nd Series, Issue 1, University of Notre Dame Press, Souts Bend, Ind., 1939. [33] Nandi H. K., Use of well known statistics in sequential analysis, Sankhya 8, Pt. 4 (Jine 1948).
520 А. ВАЛЬД [34] Neyman J. and Pearson E. S., The testing of sta- tistical hypotheses in relation to probability a priori, Proc. Camb. Phil. Soc, 29 (1933). [35] Neyman J., Sur la verification des hypotheses statistiques composees, Bull. soc. math. France 63 (1935). [36] N eyman J., Outline of a theory of statistical estimation based on the classical theory of probability, Phil. Trans. Roy. Soc. A236 (1937). [37] N eyman J. and P e a r s о n E. S., Contributions to the theory of testing statistical hypotheses, Stat. Res. Mem. Pts. I and II (1936, 1938). [38] Neyman J., L’estimation statistique traitee comme un probleme classique de probabilite, Actualites sci. ind. 739 (1938). [39] Paulson Edward, A note on the efficiency of the Wald sequential test., Ann. Math. Stat. 18 (1947). [40] Pitman E. J. G., The «closest» estimate of statistical para- meters, Proc. Cambridge Phil. Soc. 33 (1937). [41] P i tm an E. J. G., The estimation of location and scale pa- rameters of a continuous population of any given form, Biomet- rica 30 (1939). [42] P 1 а с к e t t R. L., Boundaries of minimum size in binomial sampling, Ann. Math. Stat. 19 (1948). [42a] Polya George, Exact formulas in the sequential ana- lusis of attributes, University of California Press, 1948. [43] Robbins Herbert, Convergence of distributions, Ann. Math. Stat. 19 (1948). [43a] Robinson Jubia, A note on exact sequential analysis, University of California Press, 1948. [44] Сакс, Теория интеграла, M., ИЛ, 1949. [45] Samuelson Paul A., Exact distribution of continuous variables in sequential analysis, Econometrica 16 (1948). [46] Savage L. J., A uniqueness theorem for unbiased sequential binomial estimation, Ann. Math. Stat. 18 (1947). [47] S i 1 b e r J., Multiple sampling for variables, Ann. Math. Stat. 19 (1948). (48] S о b e 1 M., Complete classes of decision functions for some standard sequential and non-sequential problems (to be publi- shed). [48a] Sobel M. and Wald A., A sequential decision procedure for choosing one of three hypotheses concerning the unknown mean of a normal destribution, Ann. Math. Stat. 20 (1949). [48b] Statistical Research Group, Columbia University, Sequential Analysis of Statistical Data: Application, Columbia Uinversity Press, New York, 1945. [49] Stein Charles," A two-sample test for a linear hypothe- sis whose power is independent of the variance, Ann. Math. Stat. 17 (1945). [50] Stein Charles, A note on cumulative sums, Ann. Math. Stat. 17 (1946).
ЛИТЕРАТУРА 521 [51] S t e i л Charles and Wald A., Sequential confidence intervals for the mean of a normal distribution with known variance, Ann. Math. Stat. 18 (1947). [52] Stein С. M., On sequences of experiments, Ann. Math. JStat. 19 (1948). [53] Stockman С. M. and Armitage P., Some properties of closed sequential schemes, Suppl. J. Roy. Stat. Soc. 8 (1946). [54] V i 1 1 e J., Note sur la theorie generale des jeux on intervient 1’habilite des jouers, in the book «Applications aux jeux de hasard», by Emile Borel and Jean Ville, vol. IV, Fascicule II of the traite du calcul des probabilites ei de ses applications, par Emile Borel (1938). [55] Von Neumann J. and Morgenstern 0., Theory of games and economic behaviour, Princeton University Press, Princeton, 1944. Готовится русский перевод. [56] Wald A., Contributions to the theory of statistical estimation and testing hypotheses, Ann. Math. Stat. 10 (1939). [57] W a 1 d A., On cumulative sums of random variables, Ann. Math. Stat. 15 (1944). [58] W a 1 d A., Generalization of a theorem by von Neumann concerning zero sum two person games, Ann. Math. 46 (1945). [59] W a 1 d A., Statistical decision functions which minimize the maximum Risk., Ann. Math. 46 (1945). [60] W a 1 d A., Some generalizations of the theory of cumulative sums of random variables, Ann. Math. Stat. 16 (1945). [61] W a 1 d A., Sequential tests of statistical hupotheses, Ann. Math. Stat. 18 (1945). [61a] Wald A., Sequential method of sampling for deciding bet- ween two courses of action, J. Amer. Stat. Assoc. 40 (1945). [62] W a 1 d A., Some improvements in setting limits for the expec- ted number of observations required by a sequential probability ratio test. Ann. Math. Stat. 17 (1946). [63] Wald A., Differentiation under the expectation sign in the Fundamental identity of sequential analysis, Ann. Math. Stat. 17 (1946). [64] Wald A., Limit destribution of the maximum and minimum of successive cumulative sums of random variables, Bull. Amer. Math. Soc. 53 (1947). [65] Вальд А., Последовательный анализ, пер. с англ., М., Физматгиз, 1960. [66] W а 1 d A., An essentially complete class of admissible deci- sion function, Ann. Math. Stat. 13 (1947). [67] W a 1 d A., Foundations of a general theory of sequential de- cision function, Econometrica 15 (1947). [68] W a 1 d A., On distribution of the maximum of successive cu- mulative sums of independently but not identically distributed chance variable, Bull. Amer. Math. Soc. 54 (1948). [69] Wald A., Wolfowitz J., Optimum character of the sequential probability ratio test, Ann. Bath. Stat. 19 (1948). [70] Wald A., Statistical decision functions, Ann. Math. Stat. 20 (1949).
522 А. ВАЛЬД [71] W a 1 d A., Wolfowitz J., Bayes solution of sequential decision problems, Ann. Math. Stat. 21 (1950). [72] Widder DavidVernon, The Laplace transform, Prin- ceton, 1946. [73] Wolfowitz J., On sequential binomial estimation, Ann. Math. Stat. 17 (1946). [74] W о 1 f о w i t z J.T Consistency of sequential binomial esti- .. mates, Ann. Math. Stat. 18 (1947). [75] W о 1 f о w i t z J., The efficiency of sequential estimates and Wald’s equation for sequential processes, Ann. Math. Stat. 18 (1947). [75a] Wolfowitz J., Minimax Estimates of the mean of a . normal distribution with known variance, Ann. Math. Stat. 21, № 2 (1950). [76] Zorn Max, A remark on method in transfinite algebra, Bull. Amer. Math., Soc. 41 (1935).
ПОЗИЦИОННЫЕ ИГРЫ Сборник статей под редакцией Н. Н. Воробьева и И. Н. Врублевской М., 1967 г., 524 стр. с илл. Редактор С. А. Широкова Техн, редактор С. Я. Шкляр Корректор И. Я. Криги таль Сдано в набор 14/1 1967 г. Подписано к печати 27/VII1967 г Бумага 84х108*/з2. Физ. печ. Л. 16,375. Условн. печ. л. 27,51. Уч.-изд. л. 26,69. Тираж 7500 экз. Т-07058. Цена книг и 2 р. 10 к. Заказ № 2456 Издательство «Наука». Главная редакция физико - м ате матическ о й литер атуры Москва, В-71, Ленинский проспект, 15. 2-я типография издательства «Наука» Шубинский пер.. 10. *
ИЗДАТЕЛЬСТВО «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМА! ИЧЕСКОЙ ЛИТЕРАТУРЫ Москва, В-71, Ленинский проспект, 15 ИМЕЕТСЯ В ПРОДАЖЕ: Бесконечные антагонистические игры, под ред. Н. Н. Во робьева, 1963, 504 стр., 1 р. 43 к. Бусленко Н.П. и Шрейдер Ю. А., Метод статистических испытаний (Монте-Карло) и его реализа- ция на цифровых вычислительных машинах, 1967, 226 стр., 54 коп. (Сория «Библиотека прикладного анализа и вычисли- тельной математики»). Климов' Г. П., Стохастические системы обслужива- ния, 1966, 270 стр., 70 коп. (Серия «Библиотека прикладно- го анализа и вычислительной математики»). Коуден Д. И., Статистические методы контроля ка- чества, перев. с англ., 1961, 623 стр., 2 р. 88 к. (Серия «Физи- ко-математическая библиотека инженера»). Романовский В. И., Дискретные цепи Маркова, 1949, 436 стр., 1 р. 72 к. Перечисленные книги требуйте в магазинах Книготор- га. Письменный заказ можно направить также в ближайший отдел «Книга — почтой» республиканского, областного, кра- евого книготорга. Литература будет выслана наложенным платежом. При отсутствии этих книг на месте следует обратиться по адресу: Москва, К-31, Петровка, 15, магазин № 8 Москниги, Отдел «Книга — почтой».
ЗБГ