Text
                    Д. М. КОМСКИЙ, Б. М. ИГОШЕВ
ЭЛЕКТРОННЫЕ
АВТОМАТЫ
И ИГРЫ
Scan Pirat
МОСКВА ЭНЕРГОИЗДАТ 1981

ББК 32.816 К 63 УДК 519.713 + 319 83 Рецензент А. В. Шилейко Комский Д. М., Игошев Б. М. К 63 Электронные автоматы и игры. — М.: Энергоиз- дат, 1981. — 168 с., ил. 65 к. В популярной форме излагаются элементарные сведения по теории игр и идеи, лежащие в основе работы автоматов игрового типа. При- водятся схемы и описания конструкций простых кибернетических уст- ройств (играющих автоматов), рекомендуемых для самостоятельного изготовления в любительских условиях. Для широкого круга читателей, интересующихся автоматикой, тех- нической кибернетикой и теорией игр, увлекающихся конструировани- ем различных технических самоделок. 30501-596 К----------- 194-82 1502000000 051(01)—81 ББК 32,816 6Ф6.5 ДАВИД МАТВЕЕВИЧ КОМСКИЙ И БОРИС МИХАЙЛОВИЧ ИГОШЕВ ЭЛЕКТРОННЫЕ АВТОМАТЫ И ИГРЫ Редактор издательства Н В. Ефимова Обложка художника Е Н. Волкова Технический редактор А. С. Д а в ы д о в а Корректор М. Г. Гулина ИБ № 2654 Сдано в набор 17 06 81. Подписано в печать 13.11,81. Т-27761. Формат 84ХIO8V32. Бумага типографская № 3. Гаон, шрифта литературная. Печать высокая. Усл. печ. л 8,82 Уч.-изд. л. 9,05. Тираж 150 000 экз. Заказ № 788 Цена 65 к. Энергоиздат, 113114, Москва, М-114, Шлюзовая наб., 10 Владимирская типография «Союзполиграфпрома» при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли 600000, г. Владимир, Октябрьский проспект, д 7 @ Энергоиздат, 1981
РАССМАТРИВАЯ ЭТИ ВЕЩИ БЛИЖЕ, ЧИТАТЕЛЬ ВСКОРЕ УВИДИТ В НИХ НЕ ТОЛЬКО ПРОСТЫЕ ИГ- РЫ, НО И ОСНОВАНИЕ ДЛЯ ИНТЕРЕСНЫХ И ГЛУ- БОКИХ РАЗМЫШЛЕНИИ. ХРИСТИАН ГЮЙГЕНС, 1657 г. КОНСТРУИРОВАНИЕ ИГРАЮЩИХ МАШИН НА ПЕРВЫЙ ВЗГЛЯД МОЖЕТ ПОКАЗАТЬСЯ СКОРЕЕ ИНТЕРЕСНЫМ ВРЕМЯПРЕПРОВОЖДЕНИЕМ, ЧЕМ СЕРЬЕЗНОЙ НАУЧНОЙ ЗАДАЧЕЙ... ОДНАКО ЭТА РАБОТА ИМЕЕТ СВОЮ СЕРЬЕЗНУЮ СТОРОНУ И ВАЖНУЮ ЦЕЛЬ. КЛОД ШЕННОН, 1949 г. Предисловие Когда лет 30 тому назад на страницах газет и жур* налов стали появляться сообщения о создании элек- тронных кибернетических машин, способных играть в домино, шашки, шахматы и друрие игры, читатели по- разному воспринимали эти известия. Одни, удивленно всплескивая руками, говорили: «Подумать только! До чего дошла техника!» Другие пожимали плечами: «Не- ужели ученым больше делать нечего?» — «Что вы, —• возражали третьи. — Пусть забавляются. Надо же и ученым отдохнуть после напряженной работы». И невдомек было и тем, и другим, и третьим, что конструирование играющих машин — это работа напря- женная, серьезная и очень важная: появление теории игр и играющих машин раскрывало новые, широкие воз- можности для решения многих важнейших народнохо- зяйственных задач. Теперь иные времена. Теория игр стала сегодня обыч- ным учебным предметом для студентов экономических, математических и некоторых других факультетов, а бу- 1* 3
дущие инженеры — специалисты -по автоматике — на студенческой скамье изучают игровые системы автома- тического управления. Исследования, связанные с раз- работкой теоретических проблем в этой области, с соз- данием играющих машин и программ для них, интенсив- но ведутся во многих научных учреждениях у нас в стране и за рубежом. Конструированием же простейших играющих автоматов в последние годы с увлечением на- чинают заниматься энтузиасты технического творчества всех возрастов, даже юные техники. Ведь это так инте- ресно: своими руками построить умный автомат, способ- ный обыграть любого партнера — человека! Наша книга написана прежде всего именно для та- ких энтузиастов технического творчества, которые жела- ли бы познакомиться с принципами построения и дей- ствия играющих автоматов, с тем чтобы в дальнейшем, возможно, приобщиться к созданию подобных киберне- тических устройств и даже собственноручно построить некоторые из них. Эти читатели найдут здесь подробные описания некоторых простых играющих автоматов, а также рекомендации по их изготовлению и налажива- нию. Описанные электронные кибернетические устрой- ства разнообразны по характеру и степени сложности, но вполне доступны для изготовления в любительских условиях. Все они были сконструированы и построены в технических кружках ц других творческих коллекти- вах любителей под руководством и при непосредствен- ном участии авторов. Многие из этих автоматов демон- стрировались на областных, республиканских и всесоюз- ных выставках. Авторы надеются, что читатели — энтузиасты техни- ческого творчества, конструируя подобные кибернетиче- ские устройства, получат полезные знания в области ав- томатики и кибернетики, а также практические умения и навыки, которые, несомненно, пригодятся в будущем. А построенные ими играющие автоматы доставят впо- следствии немало радостных минут умельцам и их друзьям во время демонстраций на вечерах заниматель- ной техники, выставках, лекциях и конференциях, посвя- щенных электронике и кибернетике. * Однако содержание нашей книги не исчерпывается описанием простых играющих автоматов. Рассматривая различные конструкции этих электронных устройств и излагая принципы их работы, авторы не могли не кос- 4
нуться, хотя бы кратко, основных понятий и важнейших идей теории игр, на которых базируются эти принципы. Ведь именно математическая теория игр — один из главных разделов кибернетики — дает научно обосно- ванные рекомендации поведения в конфликтных ситуа- циях, указывая, «как играть, чтобы не проиграть». Поэтому пытливый и любознательный читатель встретится на страницах книги с описаниями некоторых игр разных времен и народов, убедится в том, что иг- ры — это не только развлечения в часы досуга и спор- тивные состязания, познакомится с классификацией игр и различными методами их анализа. Все это позволит ему получить начальные представления о теории игр, о различных приложениях этой науки и ее роли в созда- нии автоматов, способных решать игровые задачи. Исходя из сказанного выше, авторы адресуют свою книгу не только- энтузиастам и любителям технического творчества, но и рассчитывают на благосклонное внима- ние к ней самого широкого круга читателей, интересую- щихся достижениями электроники, автоматики и кибер- нетики. Книга может быть полезна также для лекторов и пропагандистов, учителей, руководителей технических кружков школ и внешкольных детских учреждений. Отзывы и замечания просим посылать по адресу: 113114 Москва, М-114, Шлюзовая наб., д. 10, Эцерго- издат. Авторы
ГЛАВА ПЕРВАЯ ИГРЫ И АВТОМАТЫ Игры на каждом шагу Сколько существует на свете различных игр? Тыся- чи? Десятки тысяч? Или, может быть, миллионы? Вряд ли кто ответит на этот вопрос хотя бы прибли- зительно. И уже, конечно, ни одному человеку не пере- играть всех игр — на это просто не хватит человеческой жизни. Игр существует множество. Рожденные различными народами в разные эпохи, они легко шагают через века и континенты, сопровождая человека на всем его жиз- ненном пути — от младенческих лет до глубокой старо- сти. И у каждой игры свои правила, свои особенности. Настольные игры, например, не похожи на подвижные, спортивные игры отличаются от литературных. Хоккей не спутаешь с баскетболом, а шахматы — с лото. И все же, несмотря на это несходство, есть один, главный при- знак, одинаково присущий всем без исключения играм. Это — наличие конфликта, столкновения интересов. Двое играют в шашки. Каждому во что бы то ни ста- ло хочется выиграть. Но чтобы выиграть, нужно нанести поражение своему противнику. Интересы игроков стал- киваются в остром конфликте. Дети играют во дворе в салки. «Салка, салка, дого- ни-ка!»— выкрикивают они, бегая вокруг «салки» — то- го, кто водит. И тот стремится догнать и «осалить» кого- либо из играющих — прикоснуться к нему рукой. Они же стараются увернуться, не дать догнать себя. Опять столкновение интересов. На ледяном поле встречаются прославленные хоккей- ные команды СССР и ЧССР. Эта игра должна решить, какая из команд станет чемпионом мира. Чехословацкие хоккеисты, безусловно, приложат все силы, чтобы побе- 6
дить. Но и игроки сборной СССР полны решимости'вы» играть встречу. Снова столкновение интересов, кон- фликтная ситуация, которая разрешается только в игре. Конфликтные ситуации, в которых сталкиваются про- тивоположные интересы двух или большего числа лиц, наблюдаются не только в развлечениях и спорте. Торопясь на работу, вы вышли на улицу и подходите к перекрестку. Надо бы поскорее пересечь улицу и про- должать путь. Но... красный огонек светофора принуж- дает вас остановиться, чтобы переждать поток автома- шин. Они тоже спешат, и интересы водителей вступили в конфликт с вашими интересами. Вы решили воспользоваться трамваем и подходите к остановке. Здесь в ожидании трамвая уже собрались два-три1 десятка других граждан. И хотя вам хотелось бы поскорее занять место в салоне вагона, приходится стать в очередь — ваши интересы столкнулись с интере- сами других пассажиров. Разумеется, далеко не все жизненные конфликты столь примитивны и не всегда они так просто разреша- ются. Многие конфликты гораздо серьезнее и сложнее. Иногда столкновение интересов отдельных людей дости- гает большой остроты и драматизма, а развитие кон- фликта приводит порой даже к трагической развязке. Не случайно конфликты, столкновения интересов при- знаны одной из главных тем в художественной литера- туре. Почти каждое литературное произведение содер- жит не менее двух участников, имеющих различные (во всяком случае, не совпадающие) интересы. В таких ус- ловиях действия этих героев неизбежно сопровождаются развитием некоторого конфликта, который обычно так или иначе разрешается, иногда мирно, даже полюбовно, иногда драматически. Авторы художественных произве- дений описывают и анализируют на страницах своих поэм, рассказов, повестей, новелл сложнейшие жизнен- ные конфликты. До сих пор лучшими источниками на- ших знаний о человеческом конфликте являются класси- ческая трагедия и серьезный роман. Однако в последнее время все большее внимание изу- чению конфликтных ситуаций начинают уделять мате- матики — специалисты по теории игр. Дело в том, что под игрой можно понимать вообще всякий вид соревно- вания с определенной системой правил, условий и огра-
ничений, в соответствии с которыми действуют участни- ки игры, добиваясь выигрыша. А под такое определение подходят не только спортивные игры и игры-развлече- ния, но и многое другое. Фактически это определение по- зволяет рассматривать игру как модель любого кон- фликта. Противостоят ли деятельности человека в кон- фликте интересы других людей или стихийные силы природы, с точки зрения теории игр, это не меняет су- щества дела. С конфликтными ситуациями и играми нам прихо- дится сталкиваться буквально на каждом шагу. При этом в некоторых конфликтах против нас выступает ре- альный противник, заинтересованный в нашем пораже- нии; этот противник не только сознательно препятствует нашему успеху, но и старается сделать все от него зави- сящее, чтобы добиться своей победы. В иных же кон- фликтных ситуациях такого реального противника нет, против нас действуют лишь «слепые силы природы». Природа незлонамеренна, она просто поступает так, а не иначе: иногда во вред человеку, а иногда — к его вы- годе; но всегда ее действия влияют на результат наших действий. Поэтому, если мы не знаем заранее, как будут проявляться в том или ином конфликте силы природы, мы можем считать природу своим партнером в некото- рой игре. Каждый раз, вступая в игру, мы сталкиваемся с не- обходимостью принимать решения: как лучше всего по- ступить в сложившейся ситуации? Как играть, чтобы не проиграть? Не всегда легко ответить на эти вопросы. И далеко не каждый игрок, вступая в игру, знает заранее, какой путь может привести его к выигрышу. Нередко бывает и так, что запальчивый игрок, начинавший игру, будучи вполне уверенным в своем превосходстве над противни- ком, в ходе игры вдруг с ужасом обнаруживает, что ча- ша весов склоняется не в его сторону; тщетны его отча- янные попытки исправить дело, поражение становится неминуемым! Почему же, все-таки, люди вступают в игру? Что толкает их на борьбу, соревнования и другие конфлик- ты даже в тех случаях, когда объективными причинами они в действительности с самого начала обречены на поражение? Что движет игроком? Прежде всего, конечно, это — стремление улучшить 8
свое положение и надежда (иногда — слепая) на выиг- рыш. Игрок — всегда оптимист. Не имея возможности предвидеть заранее исход игры, он все же верит, что добьется победы. Несомненно также, что важнейшим фактором здесь является-и сама неопределенность исхода игры, т. е. то обстоятельство, что обычно игрокам заранее неизвестно, кто выиграет, а кто испытает горечь поражения. Именно неопределенность исхода побуждает людей к сознатель- ному вступлению в конфликт. Именно это обстоятель- ство привлекает к играм не только участников, но и на-- блюдателей, болельщиков. Математическая теория игр занимается научным ана- лизом игр — моделей различных конфликтов. Методы анализа зависят от характера игр и во многом опреде- ляются причинами неопределенности их исхода. В чем же причины этой неопределенности? Почему игроки обычно, вступая в игру, не знают, каким будет ее результат? С чисто качественной точки зрения причины неопределенности исхода игры можно разделить на не- сколько групп. 1. Существуют игры, в которых правила игры, в принципе, дают возможность каждому игроку проанали- зировать все разнообразные варианты своего поведения и, сравнив эти варианты, избрать тот из них, который ведет к наилучшему (для этого игрока) результату. Не- определенность исхода таких игр связана обычно с тем, что количество возможных вариантов (комбинаций) в игре слишком велико, так что практически игрок не мо- жет перебрать и проанализировать все эти варианты (во многих играх для этого даже не хватило бы всей чело- веческой жизни!). Игры этой группы называются ком- бинаторными. В качестве примеров явно выражен- ных комбинаторных игр можно назвать шашки, шахма- ты. В дальнейшем мы убедимся, что существует немало и других игр, неопределенность исхода которых вызва- на именно их «комбинаторной» сложностью. Научная разработка методов анализа таких игр и способов опре- деления «правильного», оптимального поведения игрока в этих играх ведется с помощью различных математиче- ских приемов; в частности, при этом используется и ком- бинаторика — раздел математической науки, который занимается изучением комбинаций и перестановок пред- метов. 9
2. Другим источником неопределенности исхода игры является влияние различных случайных факторов. Во многих играх случайные события могут оказывать реша-~ ющие воздействия на результаты игры. Нередко это да- же' специально предусмотрено правилами игры (броса- ние жребия, монеты и пр.). Случайное может также по- являться в игре в результате действия тех или иных «стихийных сил» (рассеивание при стрельбе, метеороло- гические условия и т. п.). Игры, исход которых оказыва- ется неопределенным исключительно в силу случайных причин, называются азартными играми (от фран- цузского hasard— случай). Типичные примеры таких игр — рулетка, разного рода игры в кости, игра в «ор- лянку». Говорить о «правильности», оптимальности по- ведения игрока в азартной игре не приходится: ведь исход игры здесь не зависит от его действий. Игрок мо- жет лишь решить, принимать или не принимать участие в игре. При научном анализе азартных игр широко ис- пользуется теория вероятностей — наука о закономерно- стях случайных явлений; нередко и здесь полезным ока- зывается также применение комбинаторики. 3. Неопределенность исхода игры может быть вызва- на также и тем, что каждый из игроков, принимая ре- шение о выборе образа действий во время игры, не знает, какой стратегии будет придерживаться его про- тивник. При этом неведение игрока о поведении и наме- рениях его противника носит принципиальный характер (оно, например, может быть обусловлено правилами игры). Игры, в которых неопределенность исхода возни- кает по указанной причине, называются стратегиче- скими играми. Простейшим примером такой игры яв- ляется игра в «две монетки»: два участника игры одно- временно кладут на стол по монете; если окажется, что монеты выложены одинаковыми сторонами вверх, то выигрывает первый игрок, в противном случае — второй. Для анализа стратегических игр и решения вопроса о «правильности», оптимальности поведения игроков в та- ких играх приходится использовать и комбинаторику, и теорию вероятностей, и ряд других специальных раз- делов математической науки. Таким образом, анализ причин неопределенности ис- хода игры позволяет нам разделить все игры на три ос- новные группы: комбинаторные, азартные и стратеги- ческие. Ю
Разумеется, можно указать игры, сочетающие в себе черты комбинаторных и азартных игр (например, раз- ного рода карточные пасьянсы, где неопределенность обусловлена, с одной стороны, случайным расположени- ем карт в колоде, а с другой — комбинаторной слож- ностью конфигураций, составленных из открытых карт на столе). Точно так же стратегичность игры может со- четаться с ее комбинаторностью (например, «морской бой» — разновидность шахмат, где каждый игрок играет на своей доске, не зная расположения фигур противни- ка), с азартностью (домино.), а также с комбинатор- ностью и азартностью одновременно (преферанс, в кото- ром азартность проистекает от случайного расклада карт, стратегичность — от назначения игры и определе- ния «сноса», а комбинаторность — от трудности ориен- тировки в раскладах карт даже в тех случаях, когда они раскрыты). Все это требует еще большего разнообразия приемов и методов для научного исследования игровых задач и вместе с тем вызывает необходимость подробной классификации игр. Вообще игры можно классифицировать по различ- ным признакам. .Так, игры можно разделить на антаго- нистические и неантагонистические, исходя из такого признака, как отношение игроков к исходу игры. По числу ходов игры подразделяются на конечные (т. е. за- канчивающиеся после конечного числа ходов) и беско- нечные. По количеству участников игры делятся на иг- ры одного игрока (карточные пасьянсы, «игра в пятнад- цать» и т.п.), парные игры — с двумя участниками (шашки, шахматы, фехтование, бокс) и множествен- ные— с тремя и более участниками (домино, некоторые карточные игры). В некоторых множественных играх участники игры образуют коалиции. При наличии двух постоянных коалиций множественная игра фактически превращается в парную. Так, например, игра в домино является коалиционной игрой, если четыре игрока груп- пируются попарно. Различают игры и по сумме выигрыша. В шахматах, домино, многих карточных играх один игрок выигрывает то, что проигрывают остальные; общая сумма выигрыша всех игроков равна нулю. Поэтому такие игры называ- ются играми с нулевой суммой. Игры, в которых выиг- рыш одного и проигрыш другого не равны, называются играми с ненулевой суммой. 11
Важнейшей характеристикой игры является характер и объем сведений о ходе игры, которыми располагают ее участники. Если каждый из игроков полностью осве- домлен о состоянии игры на всех ее этапах и знает в каждый момент все ресурсы и возможности своих про- тивников (игра ведется «в открытую»), то такая игра называется игрой с полной информацией, К таким иг- рам относятся шашки, шахматы, «крестики — нолики». Имеются игры, в которых информация б ходе игры неполная, ее участники не знают точно сил и возможно- стей противника (например, неизвестно, как распредели- лись карты или косточки домино в начале игры). Эти игры носят название игр с неполной информацией. Игры, исход которых случаен и не зависит от поведе- ния игроков, мы назвали выше случайными или азарт- ными. В отличие от них игры, в которых нет случайно- стей и результат полностью определяется поведением игроков, их личными ходами (комбинаторные и некото- рые стратегические игры), называются детерминирован- ными играми. Итак, в теории всякий конфликт может быть пред- ставлен в виде игры, а каждая игра может быть охарак- теризована рядом признаков и отнесена в зависимости от этого к определенному классу. Например, шахматы — это антагонистическая конечная парная детерминирован- ная комбинаторная игра с нулевой суммой и полной ин- формацией. Разумеется, при исследовании конфликтных ситуаций математики не ограничиваются их представлением в ви- де игр (моделированием) и классификацией этих игр. «Сортировка» игр нужна лишь для того, чтобы легче было для однотипных игр найти общие методы их реше- ния — выработать рекомендации по наиболее рациональ- ному образу, действий в ходе развития конфликтной си- туации. Именно в этом и заключается основная цель ма- тематической теории игр. В последующих главах читатель познакомится с эле- ментами математической теории различных игр: комби- наторных, азартных, стратегических. При этом довольно много внимания придется уделить азартным играм. Не потому, конечно, что мы собираемся рекламировать та- кие игры, как «орлянка», рулетка, игра в кости или в карты. Эти и некоторые другие азартные игры на деньги и иные материальные ценности, разжигающие нездоро- 12
вый ажиотаж и низменные страсти, безусловно, достой- ны решительного осуждения. Нас будет интересовать лишь случайность их исхода, так как случай, как мы уже знаем, нередко оказывает решающее влияние на исход конфликтов, весьма далеких от игр типа рулетки или «орлянки». Вместе с тем названные игры благодаря простоте условий и четкости правил могут служить на- глядными схемами, на которых очень удобно изучать закономерности, присущие многим гораздо более слож- ным конфликтам. Анализ некоторых азартных игр по- зволит нам -также легко усвоить математические поня- тия, которые понадобятся при знакомстве с более слож- ными стратегическими играми, а также с принципами работы отдельных узлов и устройств, используемых в играющих автоматах. Бесстрастные партнеры Около двухсот лет тому назад по странам Европы .разъезжал человек, именовавший себя придворным со- ветником австрийской императрицы Марии-Терезии, изобретателем и механиком Вольфгангом фон Кемпеле- ном. Останавливаясь в столицах и больших городах, он демонстрировал всюду построенную им чудесную маши- ну — механического игрока в шахматы. «Почтеннейшей публике» показывали громоздкий ящик, в котором был расположен сложный механизм: хитроумное сплетение валов, эксцентриков, шестеренок, пружин. На ящике была укреплена большая кукла со специальными захватами на руках вместо пальцев, оде- тая в экзотический турецкий наряд. Зрителям предостав- лялась возможность осмотреть и даже ощупать рычаги, соединяющие руки-захваты с механизмом внутри ящика. Перед «турком» на крышке ящика располагалась шах- матная доска. Желающим предлагали ...сыграть с кук- лой в шахматы. В глубоком изумлении следили зрители за игрой. «Турок», управляемый загадочным механиз- мом, иногда подолгу думал над очередным ходом, но за- тем, ловко захватывал нужную фигуру, уверенно пере- ставлял ее на доске. Через каждые двенадцать ходов изобретатель заводил механизм автомата с помощью огромного железного ключа. Играла кукла-машина очень хорошо. Она могла ра- зыгрывать тонкие комбинации, подстраивала своему 13
противнику самые замысловатые ловушки и почти всег- да выигрывала. Но даже редкие поражения шахматного автомата не могли уменьшить всеобщий восторг и изум- ление публики. Слава о диковинной машине быстро рас- пространилась по всей Европе. Механическим шахматистом заинтересовался даже Наполеон Бонапарт, страстный любитель шахмат. Им- ператор Франции изъявил желание сыграть с машиной. Этот необычный» поединок состоялся в торжественной обстановке в присутствии многочисленной придворной знати в Шенбрунне в 1809 г. и закончился поражением знаменитого полководца. После смерти Кемпелена механического «турка»- шахматиста приобрел импрессарио Мальзель, который долго еще продолжал показывать его в городах Герма- нии, а в 1826 г. отправился с «чудесной машиной» за океан, в Нью-Йорк, надеясь разбогатеть на широко раз- рекламированных сеансах игры. Машина Кемпелена и в Америке вызвала подлинную сенсацию, а также бур- ную дискуссию о возможном внутреннем устройстве ме- ханизма и принципе его работы. Между прочим, в этой дискуссии принял участие известный американский пи- сатель Эдгар По, написавший по эт<?му поводу большой очерк, в котором доказывал, что „механический игрок, демонстрируемый Мальзелем,—не более чем мистифика- ция. Впоследствии, когда «секрет» машины Кемпелена был раскрыт, оказалось что Эдгар По был прав. Рассказывают, что в городе Филадельфии во время одной из демонстраций «чудесной машины», когда она уже одерживала победу над очередным своим противни- ком, в здании музея, где показывали машину, вспыхнул пожар. Крики и замешательство зрителей «испугали» машину. Она прекратила игру, затем крышка ящика приподнялась и из него выбрался небольшого роста че- ловек... И только тогда выяснилось, что движениями куклы во время игры управлял опытный шахматист, укрывающийся в тайнике, тщательно спрятанном среди механизмов. Сложное и оригинальное устройство давало ему возможность следить за расположением фигур на шахматной доске, а система рычагов и передач помога- ла перемещать фигуры. Шахматный «автомат» Вольфганга фон Кемпелена был, конечно, грубым надувательством «почтеннейшей публики»: ведь играл-то в шахматы, думал, разыгрывал 14
комбинации не хитроумный механизм, а человек! Тем не менее нельзя не отдать должное высокому мастерству венгерского механика, сумевшего в те далекие годы соз- дать столь сложный и четко действовавший механизм. Впрочем, для конца XVIII — начала XIX вв. вообще было характерно страстное увлечение многих талантли- вых часовщиков и механиков машинами и устройствами, способными воспроизводить действия живых существ. Интерес широкой публики к таким машинам был очень велик: ведь на протяжении веков люди мечтали о созда- нии искусственного человека (гомункулюса), мысль об этом занимала их умы не менее, чем заманчивые попыт- ки открыть философский камень — средство превращать все металлы в золото. Конструирование и постройка та- ких человекоподобных моделей-автоматов были тогда как бы экзаменом на аттестат технической зрелости ме- ханика, сулили ему известность и славу. Собственно го- воря, многих мастеров-механиков того времени даже неправильно называть часовщиками. Это были талант- ливые инженеры-конструкторы. Некоторые из них до- стигали в своей работе столь высокого мастерства, что их изделия представляли собой замечательные произве- дения искусства. Именно в эти годы жили и создавали своих андро- идов— механических аналогов животных ц людей — швейцарские часовщики Пьер и Анри ДрО, французский механик Жак Вокансон, австрийский мастер Фридрих Кнаусс, выдающийся русский механик Иван Петрович Кулибин и другие. К числу таких талантливых механи- ков своего времени принадлежал и Вольфганг фон Кем- пелен. Позднее, в XIX в., «большая» техника заметно охладела к механическим моделям живых организмов, а потом и вовсе потеряла к ним интерес. Андроиды нашли свой последний приют в тихих залах технических музеев. А в XX в. на смену им пришли «электрические люди» — роботы. Новые времена принесли с собой и новые идеи. На- ряду с валами, эксцентриками, шестеренками и пружи- нами в дело пошли электромагнитные реле, конденсато- ры, фотоэлементы, электронные лампы, транзисторы. Инженеры и изобретатели, придавая своим конструк- циям внешнее сходство с человеком и животными, могли теперь добиваться гораздо большего подобия, чем это удавалось создателям андроидов. Роботов заставляли не 15
только двигаться, но видеть и слышать, произносить слова и даже целые фразы, отвечать на вопросы, выпол- нять различные команды и пр. «Электрические люди» приобрели большую популярность. Как когда-то андро- идов, их стали возить по разным городам и показывать публике, демонстрировать на выставках. Неудивительно, что появились электронные устройства, подобные псев- доавтомату Кемпелена. Вот что рассказал об одной из таких современных мистификаций в своей лекции в октябре 1955 г. круп- нейший американский кибернетик Клод Шеннон. «Не- сколько лет тому назад мое внимание привлек совре- менный двойник Мальзельского автомата. Один мой друг из Калифорнии написал мне, что на местной вы- ставке и по телевидению показывали машину, играю- щую в шашки. Победить ее было почти невозможно — даже игру с чемпионом США она свела вничью, — и большинство считало, что это и в самом деле не что ийОе, как электронная вычислительная машина. Иссле- довав проблему программирования игры в шахматы и шашки, я был настроен довольно скептически, особенно из-за того, что машина играла так хорошо и была такой портативной. Пдэтому я предложил произвести осмотр устройства. После изрядной «сыскной» работы мой друг, наконец, выследил игрока в шашки на старом складе. Он сообщил, что единственной «электронной частью» машины был электрический вентилятор для спрятанного человека-оператора» [26]. Конечно, в век электроники, радио и телевидения нет необходимости прятать человека внутрь шахматной ма- шины. Он может управлять ее движениями по радио — даже на большом расстоянии. Ведь управляют же опе- раторы с Земли космическими аппаратами, удаленными на многие миллионы километров! Но если машина — это только руки (механические или электрические — все равно), помогающие человеку передвигать фигуры на шахматной доске, то такую машину еще нельзя считать автоматическим игроком. Настоящий играющий автомат должен сам анализировать ситуацию, складывающую- ся на каждом этапе игры, и самостоятельно выбирать очередной ход, стремясь к выигрышу. Возможны ли такие автоматы? Да, возможны. Первый играющий автомат сконструировал и по- строил еще в начале этого столетия испанский ученый, 16
президент Академии наук в Мадриде Леонардо Торрес-и* Квеведо. Этот автомат представлял собой механизм, разыгрывавший окончание шахматной партии королем и ладьей белых против черного короля, которым играл человек — противник автомата. Как известно, в таком ладейном эндшпиле результат игры заранее предопреде- лен в пользу белых, и существует сравнительно простой алгоритм1, ведущий к их выигрышу при любом на- чальном расположении фигур и любых возможных хо- дах черного короля: ладья и король белых оттесняют черного короля на край шахматной доски, после чего на крайней горизонтали ему объявляется мат. Для реализации этого алгоритма изобретатель скон- струировал довольно сложное (по тем временам) элект- ромеханическое устройство. Каждое поле шахматной доски было составлено из трех металлических пласти- нок, изолированных одна от другой резиновыми про- кладками. Пластинки эти, служившие электрическими контактами, были соединены с источником тока и систе- мой переключателей и электромагнитов, расположенных под шахматной доской. Черный король, игравший про- тив автомата, имел металлическое основание. При уста- новке этой фигуры на то или иное поле шахматной дос- ки замыкалась соответствующая электрическая цепь и в автомат поступал сигнал, приводивший в движение электромагниты. Белые фигуры были изготовлены из дерева, но в основании каждой из них имелось отвер- стие, в которое был вставлен железный шарик. Поэтому электромагниты, передвигаясь под шахматной доской при каждом очередном ходе автомата, увлекали за со- бой одну из белых фигур — короля или ладью, пере- мещая их в. соответствий с выигрывающим алгорит- мом. Если человек, игравший с автоматом, нарушал пра- вила игры, появлялась световая надпись Первая ошибка и автомат переставал играть до тех пор, пока его про- тивник не исправлял ошибку. В случае второго наруше- ния правил партнером автомат высвечивал на табло надпись Вторая ошибка, а при третьей ошибке автомат «сердился» и прекращал игру. 1 1 Алгоритм — точное предписание, определяющее содержание и последовательность действий, которые нужно выполнить для полу- чения определенного результата. 2-788 17
Играющий автомат Л. Торреса-и-Квеведо впервые экспонировался на Всемирной выставке в Париже еще перед первой мировой войной, но впоследствии был поч- ти забыт. Однако много лет спустя он снова оказался в центре внимания парижан: на конгрессе кибернети- ков, состоявшемся в Париже в 1951 г., сын изобретателя Гонзалес Торрес-и-Квеведо продемонстрировал «элект- рического игрока в шахматы», сконструированного его отцом. В,автомат были введены некоторые усовершен- ствования, соответствующие «духу времени»: когда ко- роль черных оказывался под шахом, громкоговоритель, установленный в автомате, восклицал: «Шах королю!» А в конце игры, одерживая победу над партнером-чело- веком, он триумфально возвещал: «Мат!» Присутство- вавший на конгрессе выдающийся ученый, «отец кибер- нетики» Норберт Винер согласился сыграть несколько почетных поединков с автоматом. Но и он не мог избе- жать поражения! Играющий автомат Квеведо действовал против свое- го партнера совершенно самостоятельно и всегда побеж- дал, если последний не нарушал правил игры. Однако, разумеется, лишь с большой степенью условности мож- но считать, что этот автомат анализировал складывав- шуюся перед каждым ходом ситуацию. Фактически все возможные в игре позиции были заранее предусмотрены изобретателем, и на каждый ход черного короля в кон- струкцию автомата была «вложена» возможность ответ- ного хода, безусловно ведущего к победе. Вместе с тем автомат Квеведо, реализовавший специфический алго- ритм выигрыша в ладейном эндшпиле, был непригоден, в принципе, для решения каких-либо других игровых задач Позднее, в 30-х и 40-х гг. нашего столетия, различ- ными конструкторами было создано немало других элек- тромеханических и электронных устройств, подобно ав- томату Квеведо, предназначенных для реализации выиг- рывающих алгоритмов в простых комбинаторных играх. Цель изготовления таких играющих автоматов в боль- шинстве случаев заключалась в демонстрации перед широкой публикой возможностей техники своего време- ни. Поэтому такие автоматы появлялись обычно на крупных международных технических выставках, и их показ носил скорее рекламный, нежели научный ха- рактер. 18
Так, в 1939 г. на Всемирной выставке в Нью-Йорке демонстрировался один из первых автоматов, построен- ных специально для игры в «Ним» (в этой игре двое поочередно берут по определенным правилам камешки из двух пли нескольких кучек; выигрывает тот, кому достанется последний камешек). Очевидцы рассказыва- ют, что интерес посетителей выставки к этому экспона- ту был огромный. С утра до позднего вечера небывалое оживление царило в павильоне, где показывали этот автомат. Громкие споры, восхищенные возгласы и скеп- тические замечания сменялись тишиной, полной напря- женного ожидания. Нетерпеливая молодежь, степенные отцы семейств и почтенные леди — все с увлечением иг- рали с автоматом в камешки, или, точнее, в лампочки, ибо вместо обычных для игры в «Ним» камешков здесь использовались электрические лампочки накаливания, включаемые поочередно автоматом и его партнером-че- ловеком. Автомат, представлявший собой релейно-кон- тактное устройство, играл, следуя выигрышной стратегии, и всегда побеждал. Впоследствии были построены и другие автоматы для этой игры. В некоторые конструкции была «заложена» более широкая программа действий: автомат выигры- вал, когда выигрыш вообще был возможен, но обычно он предоставлял первый ход человеку в выигрышной по- зиции, так что последний мог и выиграть, если играл безошибочно; если же противник допускал хотя бы один ошибочный ход, то автомат перехватывал инициативу и выигрывал. В 1940 г. У. Кейстером была построена одна из пер- вых электрических машин для игры в «крестики и ноли- ки» на поле из девяти клеток, а позднее появились ана- логичные устройства для других подобных игр. Все эти автоматы создавались главным образом в рекламных, учебных и иных специальных целях, и каждая из них была приспособлена для решения только одной, кон- кретной игровой задачи. Переворот в применении автоматических устройств для решения игровых задач произошел в конце 40-х гг. нашего столетия, когда появились и стали все шире ис- пользоваться для решения различных практических и научных задач ЭВМ.. Современная ЭВМ. — это довольно сложный ком- плекс электронной и электротехнической аппаратуры. 2* 19
В состав ЭВМ входят многие тысячи полупроводнико- вых диодов, транзисторов, конденсаторов, а также мик- ромодули, интегральные микросхемы и другие детали. Все они группируются в систему связанных между собой блоков и устройств. Главнейшие из них: запоминающее устройство (память машины),. управляющее устройство, арифметическое устройство, а также устройство ввода исходных"данных и устройство вывода результатов. Для того чтобы ЭВМ могла решить задачу, в нее вводится программа решения — совокупность команд, показываю- щих, какие действия и в какой последовательности нуж- но производить над исходными данными. Эти данные также вводятся в память машины. Затем арифметиче- ское устройство приступает к вычислениям согласно командам, поступающим с управляющего устройства. Промежуточные результаты накапливаются в памяти машины и используются по мере надобности арифмети- ческим устройством для продолжения вычислений. Окон- чательный ответ подается на устройство вывода резуль- татов, где ему придается форма, удобная для прочтения и изучения. Важнейшие достоинства цифровых ЭВМ — их быст- родействие (десятки миллионов вычислительных опера- ций в секунду) и универсальность: одна и та же ЭВМ может решать самые разнообразные математические и логические задачи. Почему же с появлением ЭВМ именно к этим маши- нам обратились конструкторы играющих устройств — ав- томатов? Дело в том, что для принятия решения в конфликт- ной ситуации обычно приходится выполнить ряд расчет- ных и других логических операций. При этом во многих случаях необходимо выполнить большой объем вычисле- ний в предельно сжатые сроки. А ЭВМ способны успеш- но справиться с этим, совершая такие действия автома- тически и с большой скоростью. Поэтому неудивительно, что сразу же после создания первых ЭВМ возникла идея применить их для решения игровых задач. И в са- мом деле, вскоре появились составленные математика- ми программы для «работы» ЭВМ в качестве партнеров в таких играх, как, например, «Ним», «крестики — ноли- ки», домино, некоторые карточные игры и простейшие игры на шахматной доске. На научных конференциях и технических выставках стали все чаще демонстрировать 20
игровые способности различных компьютеров (так стали называть ЭВМ), причем последние справлялись с возло- женной на них ролью весьма успешно. В 1949 г. Клод Шеннон высказал ряд важных сооб- ражений о возможности машинной игры в шахматы, дав тем самым толчок для большого количества исследова- ний в этом направлении. Целые коллективы ученых в разных странах включились в работу по созданию искус- ственного «электронного шахматиста», ибо стало ясно, что успех в этом деле открывает путь к решению самых сложных проблем управления. Ведь машина, умеющая хорошо играть в шахматы, найдет себя и в таких слож- ных «играх», где выигрышем будет сталь, зерно, авто- мобили, электроэнергия, здоровье и безопасность людей. Сам К. Шеннон привел целый список задач, автомати- зация решения которых в той или иной мере аналогична автоматизации игры в шахматы: перевод с одного языка на другой, конструирование релейно-контактных схем, оркестровка мелодий, управление распределением теле- фонных вызовов, военно-стратегические проблемы и дру- гие. Многие из этих задач уже теперь успешно реша- ются. Разработка методов решения с помощью ЭВМ игровых задач позволяет ученым и инженерам глубже исследовать возможности этих кибернетических уст- ройств, улучшать их и совершенствовать, расширяя сфе- ру их применения. Каким же образом выполняет ЭВМ роль партнера в различных играх? В настоящее время известно немало разнообразных принципов, которые могут быть положе- ны в основу выступления компьютера на этом поприще. Выбор того или иного из них зависит главным образом от характера и сложности игры. Обратимся, например, к таким играм, в основе кото- рых лежит строгая и хорошо разработанная математи- ческая теория (сюда относятся, как мы дальше увидим, многие комбинаторные игры). Эти игры позволяют в любом положении путем относительно несложных вы- числений определить ход, ведущий к выигрышу. Поэто- му здесь для ЭВМ нет никаких трудностей в «овладе- нии» мастерством игрока. Достаточно ввести в машину соответствующую программу — и она станет достойным противником в игре с человеком. В качестве примера приведем автоматизацию с по- мощью ЭВМ игры в «Ним» с тремя кучками предметов 21
в таком ее варианте: каждый игрок при своем очеред- ном ходе может взять любое число предметов, но только из одной кучки, и выигрывает тот, «чья последняя рука» (т. е. кто возьмет последний предмет). В следующей гла- ве мы подробно исследуем подобные игры и убедимся в том, что здесь для каждого игрока возможна одна из двух ситуаций. При первой ситуации игрок всегда мо- жет делать ходы, ведущие к его бесспорному выигрышу, а при наличии второй ситуации этот игрок может про- играть при правильной игре противника, его выигрыш возможен только в случае ошибки противника. В 1955 г. Н. А. Криницким была составлена програм- ма, по которой ЭВМ «Стрела» могла играть в «Ним» против человека. Программа эта предписывает машине действовать так, что при наличии для нее первой ситуа- ции она всегда может совершать только правильные хо- ды (ведущие к ее выигрышу). При наличии для нее второй ситуации машина делает ходы, при которых ошибка со стороны противника наиболее вероятна. Внешне игра машины с человеком выглядит так. На картонном листе, разграфленном на три части, раскла- дывают фишки. Оператор — человек, работающий за пультом управления ЭВМ, вводит в память машины ин- формацию о том, сколько фишек лежит в каждой кучке и кому принадлежит первый ход. После каждого хода противника с пульта вводят информацию о том, из ка- кой кучки и сколько фишек он взял, и нажимают кнопку с надписью Пуск. В течение долей секунды ЭВМ «обду- мывает» свой ход, т. е. производит необходимые вычис- ления, в результате чего получается ответ машины. За- тем она останавливается, и на пульте вспыхивают лам- почки, по которым можно узнать, из какой кучки и сколько фишек машина «берет». Если ЭВМ находится в ситуации бесспорного выигрыша, то загорается еще дополнительная сигнальная лампочка. По этому сигна- лу оператор, демонстрирующий игру машины, заранее знает, что ее противник должен проиграть. Многократно проводившиеся опыты показали, что ЭВМ'играет в «Ним» и другие подобные игры в сотни раз быстрее человека и не совершает ошибок, которые нередко допускает даже игрок, хорошо знающий алго- ритм оптимальной игры. Иной принцип используется при составлении про- граммы работы ЭВМ для таких иГр, где нельзя указать 22
строго определенные математические формулы, по ко- торым можно было бы вычислить ходы, ведущие к вы- игрышу. Если число различных позиций в игре не слиш- ком велико, то в запоминающее устройство машины вводятся все возможные варианты игры — составляется «словарь» игры, т. е. набор рекомендаций вида: «Если противник пойдет..., то надо отвечать ходом...» Это — своеобразный «рецепт» на все случаи, которые могут возникнуть в игре. Когда машине нужно сделать очеред- ной ход, она просматривает свой «словарь» и выби-рает наилучший ход для продолжения игры. Такая машина всегда играет оптимально. Наибольшее, на что может надеяться ее противник, — это ничья, если только вооб- ще она возможна. Примерами таких программ, основан- ных на использовании «словаря» с перечнем всех воз- можных вариантов игры, могут служить программы для игры в «крестики — нолики» на поле из девяти клеток или программа для игры «Волк и охотники» на шахмат- ной доске. Надо заметить, что программы для игр машин, со- ставленные на основании алгоритма типа «словарь», большого практического значения не имеют, так как да- же для таких игр с полной информацией, какими явля- ются шашки (не говоря уже о шахматах), создание «словаря» практически невозможно из-за слишком боль- шого количества вариантов. Для большинства игр, име- ющих практическое значение, не может быть указан безусловно выигрывающий алгоритм, и невозможно соз- дать «словарь» оптимальных ходов для всех возможных ситуаций. Как же в таких случаях составляется руко- водство к действию для машинной игры? Если точное решение игры неизвестно, то все же не- редко оказывается возможным сформулировать некото- рые общие принципы, которых следует придерживаться во время игры. Для таких игр программа работы ЭВМ составляется так, чтобы при выборе машиной очередно- го хода эти общие принципы удовлетворялись наилуч- шим образом. Разумеется, поскольку использования только общих принципов не всегда бывает достаточно для достижения победы, составленная на их основе про- грамма не может обеспечить безупречную игру машины. Однако ЭВМ способна в этом случае делать достаточно хорошие ходы, если только общие принципы тщательно продуманы. 23
Примером реализации в программе для ЭВМ общих стратегических принципов этого типа является использо- вание идеи К.'Шеннона о числовой оценке позиции во время игры в шахматы с помощью так называемой «функции позиции». Такая функция дает возможность количественно оценить ситуацию с точки зрения одного из игроков (машины). При этом учитываются наличие тех или иных фигур, их взаимное расположение, подвиж- ность, т. е. количество полей доски, находящихся под боем у той и другой стороны, и т. п. Экспериментально подбирая значения численных оценок фигур, можно по- строить алгоритм, по которому машина будет играть на уровне шахматиста-любителя. Например, в одной из подобных программ, разрабо- танной Г. Шлибсом, были предложены следующие чис- ленные оценки фигур: король — 200; ферзь — 9; ладья — 5; слон — 3; конь — 3; пешка — 1; отстающая пешка — 0,5; изолированная пешка — 0,4; сдвоенная пешка — 0,3. Выбор очередного хода машина осуществляет пу- тем перебора всех возможных вариантов ходов и всех возможных ответов противника на два или три хода вперед. Для каждой возможной ситуации машина вычисляет функцию позиции и затем выбирает тот ход, который обещает привести (через два или три хода со- ответственно) к наибольшему значению этой функ- ции. Кроме того, программа предусматривает также проверку ряда дополнительных условий: нет ли на дос- ке матовой ситуации, не находится ли король под ша- хом, не стоят ли свои фигуры под ударом фигур про- тивника, нет ли связок и т. п. Играет ЭВМ по такой программе вполне коррект- но, она соблюдает правила игры и может выиграть у слабого или даже среднего игрока. Машина никог- да не «прозевает» свою фигуру и вовремя безоши- бочно возьмет фигуру противника. Если есть возмож- ность, то машина уйдет от мата, но не упустит случая сделать мат противнику, если только ’матовая позиция попала в число ближайших, «просматриваемых» ею ходов. Но сильный игрок,, способный продумать пар- тию на большее число ходов вперед, чем машина, бе- зусловно, выиграет у нее. Особенно ощутимы недостатки программы такого типа в партиях «позиционных», в которых нет за- метного изменения положения на протяжении несколь- 24
ких ходов. К- Шеннон иллюстрирует это забавным эпизодом, который произошел однажды с составите- лем подобной программы для игры ЭВМ в шашки А Л. Сэмюэлем. Когда ученый ввел впервые свою программу в машину и нажал пусковую кнопку для первого хода, машина бешено проработала несколько минут, а затем бодро отпечатала: «Я сдаюсь!» Шашечные и шахматные задачи двух- и трехходов- ки и простые шахматные эндшпили решаются маши- ной, работающей по такой программе, хорошо и быст- ро. Конечно, перебирая многочисленные варианты хо- дов, машина ведег себя не совсем разумно: она просматривает все, в том числе и явно абсурдные ва- рианты, над которыми шахматист-челковек никогда бы не задумался. Выполнение такой ненужной работы компенсируется лишь быстродействием машины, ее способностью рассчитывать многие тысячи вариан- тов в секунду. Но никакое быстродействие не спасет машину от цейтнота, если, пытаясь улучшить ее игру, мы поже- лаем запрограммировать перебор всевозможных ва- риантов не на три, а скажем, на пять или десять хо- дов вперед. В самом деле, при игре в шахматы в обычных позициях в дебюте число допустимых прави- лами, ходов колеблется от 20 до 30—35. Сколько же вариантов пришлось бы рассчитывать машине на пять ходов перед выбором каждого очередного хода? Если считать даже только по 20 вариантов на каж- дом ходу, то получится 2О10 вариантов — несколько больше 10 триллионов! При скорости счета 10 тысяч вариантов в секунду для выбора очередного хода ма- шине понадобилось бы около 30 лет! Стремительное развитие вычислительной техники в последние годы позволяет значительно увеличить быстродействие ЭВМ, но, тем не менее, вряд ли удастся добиться заметного улучшения игры машины- шахматиста, увеличивая дальность расчета всех вари- антов. Не простой перебор всех вариантов на много ходов вперед, а правильный отбор лишь некоторых, особо перспективных из них и более далекий их рас- чет— таков путь совершенствования программы для машинной игры в шахматы. Значительные успехи на этом пути достигнуты в последние годы советскими исследователями, которые !5
работают под руководством доктора технических наук, экс-чемпиона мира по шахматам М. М. Ботвинника, разработавшего теорию моделирования мышления че- ловека-шахматиста. Созданная этими учеными шах- матная программа «Пионер», по словам М. М. Бот- винника, пока «по-видимому, единственная программа, использующая те же методы, что и шахматный мас- тер». Подобно шахматному мастеру, «Пионер» не рассматривает ходы, заведомо лишенные смысла, он достаточно быстро и эффектно решает сложные шах- матные этюды, которые явно не под силу програм- мам, основанным на простом переборе всех вариан- тов. Теперь наши ученые занимаются «доводкой» этой программы, готовая ее к выступлению в очередном чемпионате мира среди ЭВМ-шахматистов. Проведение таких чемпионатов мира среди шах- матных компьютеров становится уже традиционным. Вот что рассказывает об этом гроссмейстер М. М. Ботвинник. «Раз в три года ученые ряда стран, где ведутся работы в области шахматного программирования, проводят чемпионаты мира среди компьютеров. Тур- ниры приурочиваются к конгрессам ИФИП (Между- народная федерация по обработке информации) и служат средством обмена результатами исследований в весьма важной области науки. Чемпионат машин—' зрелище прелюбопытное. За шахматными досками си- дят авторы программ. По специальным каналам связи они сообщают своим компьютерам, находящимся на далеком расстоянии, очередной ход «противника». Ответный ход ЭВМ воспроизводится на телевизоре (дисплее) и повторяется на шахматной доске. В ожи- дании ученые дружелюбно беседуют, анализируют по- зицию, спорят, шутят и нередко критикуют игру своих программ. Да это и понятно: турнир компьютеров — спортивное соревнование лишь по форме, оно пресле- дует научные цели [3]. На первом таком чемпионате, состоявшемся в ав- густе 1974 г. в Стокгольме (Швеция), в борьбе за ти- тул сильнейшего электронного шахматиста планеты участвовали двенадцать ЭВМ из восьми стран мира. Наша «Каисса», созданная под руководством В. Ар- лазарова и М. Донского, победила австрийскую ЭВМ «Франц», американские «Тич II», «Хаос» и «Острич» 26
и, набрав четыре очка из четырех возможных, заво- евала звание первого чемпиона мира среди шахмат- ных ЭВМ. Во втором чемпионате мира, который со- стоялся в августе 1977 г. в Торонто (Канада), основ- ное соперничество вновь разыгралось между сильней- шими ЭВМ (и программами!) советских и амери- канских ученых. На этот раз победу одержала амери- канская «Чесс 4.6», разработанная Д. Слейтом и Л. Аткиным. В этой программе был предусмотрен простой перебор всех возможных вариантов игры на три хода (шесть полуходов) вперед, и для ее реали- зации американские ученые использовали универсаль- ную ЭВМ. По оценкам специалистов «Чесс 4.6.» игра- ла в силу шахматиста-перворазрядника. На третьем чемпионате мира среди ЭВМ-шахма- тистов, состоявшемся в 1980 г., первое место опять завоевала американская ЭВМ на этот раз не универ- сальная, а специально сконструированная и построен- ная энтузиастами — математиками К. Томсоном и Дж. Кондоном для своей шахматной программы «Белл». И здесь был использован метод простого пе- ребора всех вариантов, но применение специализи- рованной ЭВМ позволило увеличить предельную «дли- ну» рассматриваемых вариантов до восьми полухо- дов, что и обеспечило, по мнению М. М. Ботвинника, победу в чемпионате. Программа «Белл» достигла уровня игры кандидата в мастера. Однако применение специализированных ЭВМ не устраняет недостатки метода простого перебора всех вариантов игры, ибо, как мы видели, с увеличением длины вариантов число рассматриваемых позиций ка- тастрофически быстро растет. Дальнейший рост мастерства электронных шахматистов возможен лишь при более эффективных методах использования воз- можностей ЭВМ. Есть все основания ожидать, что будущий ЭВМ- чемпион будет опытным шахматным мастером. Применение современных ЭВМ позволяет уже се- годня решать весьма сложные игровые задачи, а не- далекое' будущее рисует еще более радужные перс- пективы. Однако не следует упускать из виду игровые возможности и «способности» более простых электро- технических и электронных устройств. Для автомати- зации многих игр (не таких сложных, как шашки или 27
шахматы) вовсе не обязательно использовать ЭВМ—• эти пока еще слишком дорогие и сложные детища кибернетики. Разнообразные играющие автоматы мо- гут-быть построены на основе сравнительно - неболь- шого числа таких широко распространенных в люби- тельской практике элементов и деталей, как транзис- торы, полупроводниковые диоды, электромагнитные реле, лампочки для карманного фонаря, выключате- ли, кнопки. Играют эти автоматы не хуже настоящих ЭВМ, а устроены значительно проще и в отличие от ЭВМ вполне доступны для изготовления в любительс- ких условиях. В следующих главах будет рассказано о простых самодельных играющих автоматах и подробно описаны конструкции некоторых из них. ГЛАВА ВТОРАЯ В ДЕБРЯХ КОМБИНАТОРИКИ Комбинаторные игры В 1612 г. в городе Лионе увидело свет сочинение французского математика Баше де Мезирьяка «Зани- мательные и приятные числовые задачи». В этой книге среди разнообразных забавных задач и упражнений была описана незатейливая, но интересная игра, дол- го кочевавшая впоследствии в различных вариантах по многочисленным сборникам математических игр и развлечений и известная теперь под названием игры Баше. Вот один из вариантов этой игры. Из кучки, содержащей вначале определенное коли- чество каких-либо предметов, двое играющих берут поочередно каждый раз по одному или по два предме- та. Выигрывает тот, кто своим очередным ходом сможет забрать все оставшиеся предметы. Предложите кому-либо из своих приятелей сы- грать в эту игру несколько партий, воспользовавшись в качестве предметов спичками, камешками, орехами или чем-нибудь другим. С чего вы начнете игру? 28
Можно, например, взять одну спичку, а можно — две. На каждый из этих ходов ваш партнер ответит также взятием одной или двух спичек. Значит, всего возможно 2X2 = 4 варианта первого хода. Для вто- рых ходов, очевидно, также возможны четыре раз- личных варианта, а всего первые два хода можно осу- ществить 16 различными способами (4X4=16). Для первых трех ходов (при достаточно большом коли- честве спичек) находим уже 4X4X4 = 64 варианта развития игры; далее по мере увеличения исходного количества спичек число различных вариантов быстро возрастает. Если спичек в кучке немного, то все возможные ва- рианты ходов нетрудно перебрать в уме и сравнить, Чтобы выбрать из них наилучший. Ну, а если спичек так много, что партия игры растягивается на десяток и более ходов? Тогда количество возможных вариан- тов будет уже исчисляться многими сотнями и даже тысячами! Вряд ли кто-либо из читателей придет в восторг от такого способа поиска наилучшего хода, при котором. приходится перебирать и сравнивать ты- сячи вариантов! Поэтому обычно игроки, ранее не знакомые с иг- рой Баше, берут спички просто наугад. Игра при этом идет с переменным успехом, случайно выигрывает то один, то другой из партнеров. А между тем исход этой игры зависит не от случайного' стечения обсто- ятельств, а вполне закономерен. И когда играющие в этом убеждаются, интерес к игре сразу же пропадает: что же это за игра, если все заранее предопределено! Теория игры Баше очень проста. Неблагоприятным для игрока, делающего очередной ход, будет число предметов (обозначим его т), равное или кратное 3. Действительно, когда т — 3, то при любом ходе игрока противник может сразу забрать оставшиеся один или два предмета и выиграть. Если же т — Зп (где п—лю- бое целое число), то после любого хода игрока про- тивник, сделав соответствующий ответный ход, мо- жет оставить 3 (п—1) предметов, а при следующем своем ходе — 3 (п—2) предметов и т. д., доведя, на- конец, число предметов в кучке до 3, что обеспечивает ему выигрыш. В случаях, когда исходное количество предметов не кратно 3 (т. е. m=3n-|-l или т = Зп-\~2), первый игрок, взяв своим ходом один или два предмета 29
и оставив в кучке Зп предметов, обречет своего против- ника на проигрыш. Итак, выигрышная стратегия в описанном варианте игры Баше сводится к следующему: уступать право первого хода противнику, если исходное число пред- метов в кучке кратно 3; начинать игру самому в слу- чае, если это число не кратно 3; своим очередным хо- дом дополнять число предметов, взятых противником, до 3 (оставляя число предметов, кратное 3). Пусть, например, исходное число спичек равно 12. Можно подсчитать, что при этом возможны 229 раз- личных вариантов развития игры. Однако нет необ- ходимости перебирать и анализировать все эти вари- анты в поисках оптимального хода. Предложите ваше- му противнику сделать первый ход й поступайте далее в соответствии с указанным выше алгоритмом: если противник возьмет две спички, то вам следует брать одну, а если он берет одну спичку, то вы берете две. Противник может вести себя как угодно (в пре- делах правил игры), но он не в состоянии будет из- менить предрешенный результат игры — свой проиг- рыш. Развитие игры при выборе игроками различных ва- риантов стратегий удобно изображать графически в виде так называемого дерева игры. На рис.1 пред- ставлено такое дерево для игры Баше при 12 спич- как в кучке (в предположении, что один из игроков — игрок В — придерживается выигрышной стратегии). Узлы дерева (кружки) соответствуют возможным по- зициям в игре. Внутри каждого узла под чертой за- писано, сколько в кучке сталось спичек, а над чертой буквами А или В указано, кто из игроков должен де- лать ход в этой позиции. Стрелки, исходящие из уз- лов, и поставленные рядом с ними числа обозначают ходы игроков и количества взятых ими спичек (в со- ответствии с правилами игры). Заштрихованные узлы соответствуют заключительным позициям при выигры- ше игрока В. Каждая партия игры представляется на дереве последовательной цепочкой узлов и стре- лок, соединяющей узел исходной позиции с одним из узлов конечной позиции (еще раз подчеркнем, что на этом дереве игры указаны не все возможные ва- рианты развития игры, а лишь те, которые ведут к 30
выигрышу В при использовании им выигрышной стратегии). Рассматривая дерево игры Баше, нетрудно убедить- ся в том, что игроку В всегда обеспечен выигрыш, если игру начинает игрок А. Разумеется, успех В будет Рис. 1. Дерево игры Баше. полным, если его партнер А незнаком с теорией игры. В противном случае он откажется начинать игру, пред- видя свой проигрыш! Игре Баше можно придать и иной вид. Вычертите на полоске бумаги игровое поле, состоящее из 13 кле- ток, расположенных в ряд (рис. 2); в левую крайнюю клетку поместите фишку (монету, пуговицу или какой- 31
нибудь иной мелкий предмет). Теперь пусть двое иг- рающих по очереди передвигают фишку вправо на од- ну или две клетки. Выигрывает тот, кому удастся пос- тавить фишку в правую крайнюю клетку (так что его противнику будет некуда ходить). Представляем читателю самостоятельно убедиться в том, что отличие этой разновидности игры Баше от ———r—i-q—i Рис. 2. Игра Баше на поле из RL-LLJJ 1.ZD..U.1-0 13 клеток. игры с кучкой спичек — чисто внешнее. Обе разновид- ности, как говорят математики, являются изоморф- ными (слово «изоморфизм» происходит от греческих слов «изос—постоянный, неизменный и «морфэ»—- форма). Здесь было подробно рассказано лишь об одном варианте игры Баше. Известно много других вариантов этой простой комбинаторной игры. От описанного ва- рианта они могут отличаться прежде всего исходным числом предметов: оно может быть и больше, и меньше двенадцати. Иными могут быть и правила взятия пред- метов из кучки во время игры. Например, правила эти могут допускать одновременное взятие не только одного или двух, но и трех, и четырех, и даже более предме- тов1. Наконец, в некоторых вариантах игры Баше вы- игравшим считается не тот, кто возьмет последний пред- мет, а тот, кто заставит сделать это своего противника. При переходе от одного варианта игры Баше к дру- гому выигрышная стратегия, разумеется, несколько видоизменяется в соответствии с изменением правил игры. Так, например, если правилами игры будет разре- шено игроку брать за один ход один, два или три пред- мета, то для того, чтобы взять последний предмет и выиграть, следует: уступать первый ход противнику, если исходное число предметов кратно 4; начинать игру самому, если это число не кратно 4; своим очередным ходом дополнять число предметов, взятых противником, до 4 (оставляя в кучке число предметов, кратное 4). 1 В книге самого Баше де Мезирьяка эта игра была описана в такой форме, двое называют поочередно числа ог единицы до деся- ти, и выигрывает тот, кто первый доведет до ста сумму чисел, наз- ванных обоими игроками. 32
Если согласно правилам игры тот, кому приходится взять последний предмет, проигрывает (и каждому раз- решается одновременное взятие одного или двух пред- метов), то выигрышная стратегия такова: уступать первый ход противнику, если исходное число предметов в кучке равно З/г+1; начинать игру самому, если это число равно Зп или 3«+2; своим очередным ходом брать из кучки столько предметов (один или два), чтобы оста- валось 3«+1 предметов. Аналогично видоизменяется выигрышная стратегия при других вариантах игры Баше. Но всегда такая стра- тегия существует, обеспечивая победу одному из иг- роков. Значительно сложнее игры Баше другая подобная иг- ра, которая была известна еще в древнем Китае под на- званием «Цзяньшицзы». В переводе «цзяньшицзы» озна- чает «выбирание камней». Камни (или какие-либо иные предметы) в начале игры находятся в двух кучках. Двое игроков по очереди берут либо произвольное число кам- ней из одной кучки (можно взять даже все камни сра- зу), либо по одинаковому (тоже произвольному) числу камней из каждой. Выигрывает тот, кто при своем оче- редном ходе заберет все оставшиеся камни. Нетрудно убедиться в комбинаторной сложности этой игры. Ведь даже при небольших количествах камней в каждой из куч в начале игры общее число вариантов поведения игроков очень ве.лико. Тем не менее теорети- ческий анализ позволяет и здесь сформулировать для одного из игроков алгоритм, всегда ведущий к выигры- шу. Не будем подробно- останавливаться на всех дета- лях математической теории игры «Цзяньшицзы» [8]. Обратимся сразу к выводам этой теории. Пары чисел, обозначающих количества камней в кучках перед ходом каждого игрока, называют позиция- ми в игре. Среди возможных позиций в теории выделя- ются так называемые особые или проигрышные позиции. Вот первый десяток особых позиций: (0, 0), (1, 2), (3, 5), (4, 7), (6, 10), (8_ 13), (9, 15), (И, 18), (12, 20), (14, 23). В теории доказываются следующие свойства особых по- зиций: при любом ходе из особой позиции (в соответст- вии с правилами игры) происходит переход в неособую позицию; от любой неособой позиции соответствующим ходом (согласно правилам игры) можно перейти к осо- бой позиции. 3—788 33
Из этих свойств особых позиций следует, что если один из игроков делает свой ход'из особой позиции, то его партнер ответным ходом может привести игру к другой особой позиции, с меньшим числом камней в каж- дой кучке. Повторяя далее такой же маневр при после- дующих ходах, партнер в конце концов приведет игру к позиции (0, 0), т. е. выиграет. Итак, выигрышная стратегия здесь сводится к сле- дующему: уступать право первого хода партнеру, если числа камней в кучках образуют особую позицию; начи- нать игру самому в случаях, если эти числа образуют неособую позицию; при каждом своем очередном ходе переходить от неособой позиции, созданной предыдущим ходом партнера, к новой особой позиции. На рис. 3 изображено дерево игры «Цзяньшицзы» для выигрышной стратегии игрока В, играющего с иг- роком А, который начинает игру. Здесь исходные числа камней в кучках равны 4 и 7, т. е. составляют особую (проигрышную для начинающего) позицию. Кружками на схеме, как и ранее, показаны возможные позиции в игре: в каждом кружке под чертой записана позиция, а над чертой буквами А и В указано, кто из игроков должен делать ход в этой позиции. Стрелки, соединяю- щие кружки, и поставленные рядом цифры обозначают ходы игроков и числа взятых ими из каждой кучки кам- ней. Заштрихованные кружки соответствуют заключи- тельной позиции (0, 0) — при выигрыше игрока В. .Пусть, например, игрок А, начиная игру, берет толь- ко один камешек из первой кучки, перейдя тем самым к позиции (3, 7). Игрок В в.ответ возьмет из второй куч- ки два камня, и в результате получится особая позиция (3, 5). Если теперь игрок А возьмет, например, по од- ному камешку из каждой кучки, перейдя к позиции (2, 4)> то игрок В своим очередным ходом возьмет три ка- мешка из второй кучки, так что снова получится особая позиция (2, 1). Как бы далее ни поступил игрок А, иг- рок В ответным ходом заберет все оставшиеся камешки и выиграет. Аналогично игра развивается и в других случаях. Игрок А всегда обречен на проигрыш. Познакомимся теперь с еще одной игрой в камешки, немного похожей на игру Баше, — игрой «Набери чет». Здесь также имеется кучка, из которой двое играющих по очереди берут камешки, но по другим правилам: кто возьмет последний камень — это не имеет значения. Вы- 34

игравшим считается тот из игроков, у кого к концу игры будет набрано четное число камешков. Всего в- начале игры имеется 13 камешков; за один ход игроку разре- шается взять от одного до четырех (не более) камешков. «Набери чет» — типичная комбинаторная игра. Хотя она и значительно сложнее, чем игра Баше, здесь также Рис. 4. Дерево игры «Набери чет». исход всегда предопределен; тот из игроков, который начинает игру, при умелом поведении противника обре- чен на проигрыш. Чтобы убедиться в этом, рассмотрим дерево игры'«Набери чет». На рис. 4 дерево игры изо- 36
бражено для того случая, когда один из игроков М поль- зуется выигрышной стратегией, а другой игрок Ч лишен этой возможности (мы убедимся далее, что роль игрока М может быть передана автомату). Проследим по дереву игры, как проходит какая-ли- бо из партий. Пусть, например, игрок Ч делает первый ход, взяв четыре камешка. В кучке остается девять, и игрок М ответным ходом берет два из них. Теперь в кучке осталось семь камней. Предположим, что игрок Ч вторым ходом берет один камешек. Тогда игрок М возь- мет также только один кам'ень, в кучке останется пять камней, а на руках у каждого из игроков будет нечетное число камешков: у игрока Ч их будет 4+1=5, а у иг- рока М 2+1=3. Теперь ясно, что игрок Ч обречен: сколько бы камешков он ни взял при третьем ходе — один, два, три или четыре — игрок М в любом случае может взять ответным ходом нечетное количество кам- ней (три или один). Набрав, таким образом, в общем четное количество, он обеспечивает себе выигрыш. Даже если после третьего хода у игрока Ч окажется четкое количество взятых камней, игрок М «заставит» его взять четвертым ходом последний оставшийся камень и дове- сти общую сумму взятых камней до нечетного числа. Разумеется, и здесь алгоритм победы гарантирует выигрыш М лишь при условии, что игру (в особой по- зиции) начинает Ч. Ну, а если игрок Ч откажется начи- нать и предложит сделать это игроку Л4? Тогда послед- нему останется лишь надеяться на ошибку партнера во время игры или на то, что тот не знает выигрышной стра- тегии. С внимательным и теоретически подготовленным противником начинать игру в этом случае безнадежно. Многие игры, для которых полем «боя» является шахматная доска, очень похожи на описанные нами иг- ры в камешки и такж’е относятся к классу комбинатор- ных игр. Вот простой пример такой игры. В верхнем правом углу доски на поле h8 стоит шаш- ка. Двое играющих ходят ею по очереди, передвигая шашку на одно из соседних полей. Допускаются лишь на- правления движения, указанные на рис. 5. Выигрывает тот, кто своим очередным ходом поставит шашку на нижнее левое поле al. В этой несложной игре тоже существует простой ал- горитм победы для того, кто начинает игру. Этот игрок должен ставить шашку только на поля, отмеченные на 37
рис. 6 знаком «—», что он всегда может сделать, так как эти поля находятся в четных строках и четных столбцах, считая сверху справа. При такой стратегии первого игрока его противник каждый раз будет вынуж- ден делать ход с поля, отмеченного «—», а эти поля, как Рис. 5. Пример комбинаторной игры. Рис 6. Проигрышные («—») по- ля комбинаторной игры. дым) позициям. Поэтому второго игрока неминуемо ждет поражение. ‘ Интересную игру, немного похожую на эту, можно разыгрывать на шахматной доске перестановкой одного ферзя; игра так и называется — «Одинокий ферзь». В на- чале игры ферзь устанавливается на одном из полей шах- матной доски, например на поле е8 (рис. 7). Двое игро- ков по очереди передвигают ферзя, причем за один ход каждый может передвинуть его на произвольное число клеток либо вниз по вертикали, либо влево по горизон- тали, либо влево и вниз по диагонали. Выигрывает тот, кто своим очередным ходом загонит ферзя в левый ниж- ний угол (на поле al), так что его противнику некуда будет ходить. Как найти выигрышную стратегию для этой игры? Очевидно, поле al (рис. 8) является проигрышным; обо- значим его знаком «—». Далее, все поля, из которых хо- дом ферзя можно попасть на поле al, являются выиг- рышными; отметим эти поля знаком «+». С полей ЬЗ и с2 все ходы, дозволенные правилами игры, ведут на «плюсы». Значит, эти поля проигрышные, обозначим их 38
«—». А поля, из которых можно попасть ходом ферзя на ЬЗ или с2, — выигрышные; обозначим их «+». Продол- жая рассуждать таким образом, завершим расстановку <+» и «—» на всех полях шахматной доски. Теперь легко убедиться в том, что выигрышные поля («4-») — это те, из которых хотя бы один ход ведет на Рис 7. Игра «-Одинокий ферзь». Исходная позиция (стрелками показаны допустимые ходы ферзя). Рис. 8 Выигрышные (« + ») и проигрышные («—») поля шах- матной доски в игре «Одинокий ферзь». проигрышные, а проигрышные поля («—») — те, из ко-» торых любой ход ведет на выигрышные. Поэтому, если ферзЪ стоит в исходном положении на проигрышном по- ле, вы непременно добьетесь победы, предоставив пер- вый ход противнику и делая ответные ходы на поля, обозначенные «минусами». Интересно заметить, что игра «Одинокий ферзь» изо- морфна описанной выше китайской игре «Цзяныпицзы». В этом нетрудно убедиться. Разложим камешки первой кучки по одному у каждой вертикали шахматной доски, начиная с Ь, а камешки второй кучки — по одному у каждой горизонтали, начиная со второй (рис. 9). Дого- воримся из первой кучки брать самые правые камни, а из второй — самые верхние. Пусть ферзь стоит на од- ной горизонтали с самым верхним камнем и на одной вертикали с самым правым. Из рисунка видно, что если убирается камень из первой кучки, то ферзь сдвигается 39
Рис 9 Изоморфизм игр «Оди- нокий ферзь» и «Цзяньшицзы». на одно поле влево, если из второй — на одно поле вниз и т. д. Теперь читателю должно быть понятно, что обе игры изоморфны: положения ферзя на.полях al, ЬЗ, с2, d6, е8, f4, h5 соответствуют особым (проигрышным) позициям в игре «Цзяньшицзы». Предлагаем читателю начертить дерево игры для- «Одинокого ферзя». Если в качестве исходного положе- ния избрать положение фер- 'зя на поле е8, что соответ- ствует особой позиции (4, 7), то это дерево получится точно таким же, как изо- браженное на рис. 3 дерево игры «Цзяньшицзы» (см. рис. 25). Внимательный читатель успел уже, вероятно, заме- тить, что все описанные здесь игры в камешки, как и* ' игры на шахматной доске, при всем их различии в ха- рактере, условиях и матема- тических приемах анализа сходны между собой. Это проявляется не только в са- мом факте существования алгоритма победы для одного ‘ из игроков, но и в том, как формулируется этот алгоритм. В самом деле, какой бы логический прием ни применя- ли при анализе каждой из игр, всегда выделялся неко- торый класс особых позиций, обладающих своеобразным свойством «устойчивости»: всякий ход, сделанный из особой позиции, порождает неособую позицию; если же позиция неособая, то существует такой ход, который позволяет снова сделать позицию особой. И всегда иг- рок, оказавшийся вынужденным делать ход в особой по- зиции, обречен на проигрыш, а игроку, делающему ход в неособой позиции, гарантируется победа, если он дей- ствует в соответствии с выигрышным алгоритмом. Разумеется, эта закономерность имеет место не толь- ко в играх с камешками и играх на шахматной доске. Рас- - смотренный нами класс игр гораздо шире. Приведем еще один образец простой комбинаторной игры. Два игрока поочередно кладут одинаковые монеты на круглый стол, 40
выбирая каждый раз произвольное положение центра монеты. Взаимн'ое накрывание монет не допускается. Выигрывает тот из игроков, кто положит последнюю мо- нету (когда места для других монет на столе уже не будет). Выигрышная стратегия здесь заключается в том, что- бы, начиная игру, положить монету в центр стола, а да- лее на каждый ход противника отвечать симметричным ходом. Читателю нетрудно убедиться, что в этой игре все позиции делятся на особые и неособые и что алго- ритм победы фактически предписывает начинающему игру своим очередным ходом всегда переходить от неосо- бой позиции к особой. Следует еще раз подчеркнуть, что все описанные здесь игры представляют интерес лишь до тех пор, пока участники игры незнакомы с теорией, не знают выигрыш- ную стратегию. Если один из игроков узнает алгоритм победы, то, следуя ему, он будет неизменно выигрывать, пока его противник не поймет, что играть бессмысленно. Если же выигрышную стратегию узнают оба игрока, то сам процесс игры вообще потеряет для них всякий ин- терес: исчезнет неопределенность ее исхода. Аналогично обстоит дело и* с другими комбинаторными играми, для которых разработана законченная теория и сформули- рован алгоритм беспроигрышной игры. Автоматы играют в камешки Если найден и четко сформулирован алгоритм для решения какой-либо задачи, то, как известно, реализа- цию этого алгоритма всегда можно возложить на более или менее сложное автоматическое устройство. Поэтому в комбинаторных играх, для которых разработана за- конченная теория, роль одного из игроков, придержи- вающегося беспроигрышной стратегии, с успехом может выполнять автомат. Игра в камешки, придуманная Баше де Мезирья- ком, — одна из простейших комбинаторных игр. Она лег- че других подобных игр поддается автоматизации. Бла- годаря предельной простоте выигрывающего алгоритма электрическая схема автомата для игры Баше оказы- вается настолько несложной, что за ее сборку смело бе- рутся даже начинающие любители в школьных техниче- ских кружках. Тем не менее на новичков, для которых 41
исход игры не очевиден, такие играющие автоматы, по- беждающие своего противника много раз подряд с не- изменным успехом, производят большое впечатление. Мы опишем здесь три конструкции автоматов для иг- ры Баше, несколько различающиеся по степени сложно- сти и правилам игры. Разобравшись в описанных схе- мах, читатель при желании сможет не только построить любое из этих автоматических устройств, но и сконст- Рис. 10. Внешний вид автомата «Побеждает последний». руировать свой вариант играющего автомата, внеся в конструкцию и схему изменения и усовершенствования, которые сочтет нужными. Играющий автомат «Побеждает последний». Автомат представляет собой небольшой ящичек, н£ лицевой па- нели которого (рис. 10) расположены в ряд 12 лампочек с укрепленными под ними выключателями, кнопка Ход автомата, световые табло Вы проиграли и Вы выигра- ли (последнее является чисто декоративным и никогда не включается, поскольку всегда побеждает автомат), сетевой выключатель. Двое играющих (один из них — автомат) поочередно отключают произвольное число ламп, но не менее одной и не более трех за один ход. Лампочки должны выклю- чаться последовательно, одна за другой, начиная слева. Не разрешается оставлять очередные лампочки вклю- ченными, «перескакивая» через них, а также пропускать свой очередной ход. Человек, играющий с автоматом, после каждого своего хода должен нажимать кнопку Ход 42
автомата. Выигравшим считается тот из игроков, кто своим очередным ходом выключит последнюю лампочку. Принципиальная схема автомата приведена ла рис. 11. Стратегия игры автомата построена на правиле: предоставлять противнику первый ход и каждый раз, де- лая ответный ход, дополнять до четырех число выклю- ченных им ламп. Это, как мы видели ранее, позво- ляет автомату выигры- вать при любых ходах противника. Автомат первым не начнет игры: при нажа- тии кнопки Кн1 (Ход ав- томата) цепь питания ре- ле остается разомкнутой и они не срабатывают — все лампочки остаются включенными. Игру дол- жен начинать противник автомата. Если он сдела- ет первый ход, выключив выключателем В1.1 лам- почку Л1, то при этом на контакты кнопки Кн1 че- рез контакты В1.2 будет подано напряжение; вне зависимости от того, вы- ключил ли партнер ав- томата одну лишь лам- почку Л1 или еще и лам- пы Л2 и ЛЗ (выклю- чателями В2.1 и ВЗ.Г), кнопки Кн1 сработает реле Р1 и самоблокируется кон- тактами Р1.1, а его контакты Р1.2 отключат всю группу ламп Л1—Л4. Таким образом, число ламп, погашенных противником, автомат всегда дополняет до четырех. При втором ходе противника автомата (выключении выключателем В5.1 лампы Л5) контактами В5.2 подго- тавливается к включению реле Р2. После нажатия кноп- ки Кн1 реле Р2 срабатывает, самоблокируется контак- тами Р2.1, а контактами Р2.2 отключает вторую группу ламп Л5—Л8. Аналогично выполняется и третий ход, Рис. 11. Принципиальная схема автомата «Побеждает послед- ний». при последующем нажатии 43
причем последнюю лампочку Л12 выключает всегда ав- томат, одновременно включая (контактами Р3.2) лам- почку Л13, подсвечивающую световое табло Вы проиг- рали. После того как все выключатели возвращены в ис- ходное состояние и произведено кратковременное отклю- чение сетевого питания, автомат готов к новой партии игры. В автомате использованы: лампы ЛН 3,5 Вх0,28 А; выключатели ТП1-2; Р1—РЗ — реле РЭС-9 (паспорт РС4.524.200); /(н/— кнопка типа К1; диоды Д1—Д4 — Д226Б; сердечник трансформатора Тр1 набран из плас- тин Ш18, толщина пакета 20 мм (обмотка I содержит 2640 витков провода ПЭЛ-0,31; обмотка // — 228 витков ПЭЛ-0,31; обмотка /// — 75 витков ПЭЛ-0,5). Играющий автомат «Последний проигрывает». Ли- цевая панель этого автомата подобна описанной выше, но на ней расположены в ряд не 12, а всего 7 горящих ламп с относящимися к ним выключателями. Иные и правила игры. Оба игрока (один из которых — автомат) поочередно выключают по одной или по две (не более!) лампы. Побеждает здесь не тот, кто выключит .послед- нюю лампу, а игрок, который заставит сделать это свое- го противника. Начинает игру всегда человек — партнер автомата, и после каждого своего хода он нажимает кнопку Ход автомата. Принципиальная схема этого играющего автомата приведена на рис. 12. Выигрышная стратегия здесь, как мы уже знаем, состоит в том, чтобы предоставить свое- му противнику первый ход и каждый раз, отвечая, до- полнять до трех число выключенных им ламп. Если противник автомата сделает первый ход, вы- ключив выключателем В1.2 лампу Л1, то после нажа- тия кнопки Кн.1.1 (Ход автомата) сработает реле Р1 (контакты В 1.1 замкнуты). Это реле самоблокируется контактами Р1.1, а контакты Р1.2 отключают лампы Л2 и ЛЗ. Независимо от того, выключил ли человек одну лишь лампу Л1 или еще и лампу Л2, реле Р1 отключает лампы Л2 и ЛЗ, дополняя тем самым до трех число по- гашенных ламп. После второго хода человека (выклю- чения выключателем В4.2 лампы Л4) нажатие кнопки Кн.1.1 вызывает срабатывание реле Р2. Это реле само- блокируется контактами Р2.1-, контакты Р2.2 отключа- ют лампы Л5 и Л6. Поскольку после второго ответного 44
хода автомата невыключенной остается только послед- няя лампа Л7, противник автомата вынужден своим оче- редным ходом «взять» ее (т. е. выключить) выключате- лем В7.1 и проигрывает. При этом включается лампа Л8, подсвечивающая табло Вы проиграли. После возвращения всех выключателей в исходное положение и кратковременного отключения сетевого пи- Рис. 12. Принципиальная схема автомата «Последний проигрывает», тания автомат готов к новой партии игры. Все детали этого автомата: лампочки, выключатели, реле, кнопка, блок питания — такие же, как и .для автомата «Побеж- дает последнйй». Автомат, контролирующий корректность противника. Играющие автоматы, с которыми познакомился чита- тель, обладают существенным недостатком: они факти- чески не следят за действиями противника и слепо сле- дуют своей программе, поэтому их легко «сбить с толку», нарушив правила игры (например, «взяв» одним ходом сразу четыре лампы или две-три лампы, не расположен- ные рядом на панели). Автомат при этом будет по-преж- нему выполнять заложенную в него программу, рассчи- танную на корректную игру и лишенную' смысла в изменившихся условиях. Игра, конечно, будет сор- вана, 45
Но ведь настоящий игрок всегда следит за игрой и, если бы его противник попытался играть нечестно, нару- шая правила, он бы не допустил этого. А нельзя ли пре- дусмотреть в устройстве автомата определенную реак- цию на «нечестную» игру партнера?- Можно ли сделать, например, так, чтобы при нарушении правил игры авто- мат (который сам всегда играет корректно) прекращал игру и указывал своему партнеру на допущенные им нарушения, а посде исправления этих нарушений возоб- новлял игру? Рассмотрим одну из возможных конструкций такого автомата для игры «Последний проигрывает». Лицевая Рис. 13. Внешний вид играющего автомата. панель этого автомата подобна описанным ранее, до- бавлены лишь световые табло Начните игру и Вы нару- шили правила игры, а также выключатель Игра с авто- матом (рис. 13). В электрическую схему автомата, изоб- раженную на рис. 12, также внесено добавление: в точ- ках а и б к ней подключен блок контроля корректности игры (рис. 14). Поясним работу этого блока. Возможны три вида нарушений правил игры со сто- роны партнера автомата: попытка «заставить» автомат начать игру первым, выключение одним очередным хо- дом более двух ламп и выключение ламп не по порядку (т. е. «перескакивание» через горящую лампочку). Если тот, кто играет с автоматом, не сделав своего хода, на- жмет кнопку Кн1.2 (Ход автомата), то загорится лампа Л9, подсвечивающая табло Начните игру. После того как противник автомата, сделав свой первый ход, отклю- чит лампу Л1 (выключателем В1), лампа Л9 при на- 16
жатии кнопки К.н1.2гзагораться не будет (разомкнуты контакты ВЕЗ) и автомат сделает ответный ход. Если человек, играющий с автоматом, включит бо- лее двух ламп подряд, например лампы Л1, Л2 и ЛЗ (или лампы Л4, Л5 и Л6), то замкнутся контакты В3.2 (или контакты В6.2) и загорится лампочка ЛЮ, подсве- Рис. 14. Схема блока контроля корректности игры. чивающая табло Вы нарушили правила игры, которая будет гореть до тех пор, пока нарушение правил не бу- дет устранено. Точно так же, если человеком будет на- рушена последовательность выключения ламп, напри- мер, при первом ходе он оставит лампу Л1 невыклю- ченной, а сразу выключит лампу Л2, то загорится лам- па ЛЮ (ибо контакты В 1.3 останутся неразомкнутыми, а В2.2 будут замкнуты при выключении лампы Л2). Выключатель В9 (Игра с, автоматом), установленный на лицевой панели, позволяет использовать автомат для игры двух человек друг с другбм. Для работы в этом режиме выключатель В9 должен быть разомкнут, т. е. блок контроля корректности игры отключен. При этом становится возможным выключать одну за другой про- извольное число ламп; кнопка Ход автомата не ис- пользуется. Каждый из играющих делает ходы в соот- ветствии с правилами игры. Играющий автомат «Набери чет». Автомат, придер- живающийся выигрышной стратегии в комбинаторной игре «Набери чет», о которой мы рассказали ранее, не- много сложнее описанных автоматов для игры Баше. Он 47
также представляет собой релейно-контактное устройст- во с лампочками и выключателями, играющими роль предметов в кучке. Все основные детали и узлы, а также органы управления размещены на его лицевой панели (рис. 15); лампочки и выключатели установлены в один ряд._ На лицевой панели расположена также табличка с правилами игры, которая содержит следующий текст: Правила игры. На панели расположены 13 горящих лампочек. Двое играющих по очереди отключают от од- НАЧг-МТЕ ИГР^ Ваш хсд ОООООООООО’ООО Вы ВЫИГРАЛИ Вы ПРОИГРАЛИ Рис 15 Лицевая панель играющего автомата «Набери чет». ной до четырех (не более!) ламп. Лампочки нужно вы- ключать последовательно, одну за другой, начиная сле- ва. Не разрешается оставлять очередные лампочки включенными, «перескакивая» через них, а также про- пускать свой очередной ход. Выигрывает тот, у кого к концу игры будет на счету четное число выключенных лампочек. Автомат может заменить одного из играющих. Для игры с автоматом после каждого своего хода нажи- майте кнопку Ход автомата. На рис. 16 приведена принципиальная схема играю- щего автомата. Воспользуемся этой схемой для анали- за его работы. Для подготовки автомата к работе нужно установить все выключатели лампочек В1—В13 в положение Вклю- чено и затем включить выключатель сети В14. При этом 48
лампочки Л1—Л13 должны загореться, что будет озна- чать, что автомат готов к игре. Первый ход должен сделать противник автомата. Если же нажать кнопку Кл1 (Ход автомата), пытаясь заставить автомат начать игру, то'напряжение поступит с выпрямителя через контакты В1.2 на обмотку реле Р1, Рис 16. Принципиальная схема играющего автомата «Набери чет». это реле сработает и его контакты Р1.2 включат лам- *почку Л15, подсвечивающую табло Начните игру. В то же время контакты Р1.1 блокируют это реле, и оно оста- нется включенным даже после отпускания кнопки К.н1. Противник автомата вынужден сделать первый ход, чтобы начать игру. Первым своим ходом он выключает лампочку Л1 (вы- ключателем В1), а затем, при желании, и лампы Л2, ЛЗ и Л4. Какой бы ход ни сделал партнер автомата, кон- такты В1.2 отключают обмотку реле Р1 и табло Начните игру гаснет. Далее, в зависимости от того, сколько ламп 4—788 49
выключает он при первом своем ходе, логическая кон- тактная цепь выключателей В1.2, В2.2, ВЗ.З, В4.2 подго- тавливает к включению одно из реле Р2, РЗ или Р4. Реле Р2 подготавливается к включению в тех случаях, когда после ответного хода автомата в «кучке» должно остаться 11 камешков — горящих лампочек; реле РЗ или Р4 — в тех случаях, когда должно остаться соответст- венно 7 или 6 горящих лампочек. Чтобы автомат с'делал ответный ход, нужно нажать кнопку К.н1. При этом напряжение питания поступает на логическую цепь выключателей В1—В4 и далее' через последовательность замкнутых контактов — на обмотку того из реле Р2, РЗ или Р4, которое было подготовлено к включению. Это реле срабатывает, и его контакты выполняют следующие операции: контакты Р2.1, Р3.1 или Р4.1 обеспечивают блокировку сработавшего реле; контакты Р2.3, РЗ.З или Р4.3 подготавливают к вклю- чению следующую группу выключателей в логической цепи (ВЗ—В6, В7—В10 или В8—ВЦ соответственно) — автомат выбирает варианты продолжения игры; контак- ты Р2.2, Р3.2 или Р4.2 отключают необходимое количе- ство лампочек, выполняя ответный ход автомата и остав- ляя горящими соответственно И, 7 'или 6 лампочек (см. дерево игры на рис. 4); эти же контакты включают лампочку Л16, подсвечивающую табло Ваш ход. Теперь противник автомата должен сделать второй -ход. Этот ход он начинает отключением 3-й, 7-й или 8-й лампочек (вЯключателями ВЗ, В7 или В8), в зависимо- сти от того, какой вариант продолжения игры был из- бран при первом ходе. Световое табло Ваш ход гаснет, так как контакты В3.2, В7.2 или В8.2 отключают лам- почку Л16. Далее противник автомата может (при же- лании) этим своим ходом выключить еще одну, две или три последующие лампочки. При этом логическая кон- тактная цепь выключателей подготавливает к включе- нию одно из реле РЗ—Р6 или Р7 соответственно для слу- чаев, когда после второго хода автомата в кучке должно остаться 7, 6, 5, 1 или 0 камешков-лампочек. Для второго ответного хода автомата снова нажима- ется кнопка Кн1. Как и при первом ходе автомата, это вызывает срабатывание одного из реле — того, которое было подготовлено к включению. Если сработало реле Р7, то отключенными оказываются все лампочки Л1—> Л13, игра заканчивается выигрышем автомата. Контак- 50
ты Р7.2 включают лампочку Л14, подсвечивающую таб- ло Вы проиграли. Если же сработало какое-либо другое реле (РЗ—Р5 или Р6), то игра должна быть продол- жена. При этом, как и при первом ходе автомата, кон- такты сработавшего реле обеспечивают его самоблоки- ровку, отключают необходимое число лампочек, выпол- няя ответный ход автомата, и включают лампочку Р16, подсвечивающую табло Ваш ход. Кроме того, контак- ты РЗ.З, Р4.3 и Р5.3 подготавливают к включению оче- редную группу выключателей в логической цепи. Если сработало реле Р6, то после второго ответного хода автомата остается лишь одна горящая.лампочка Л13. Противник автомата вынужден выключить ее (вы- ключателем В13), делая свой третий ход, и игра закан- чивается его проигрышем. Выключатель В13.1 гасит лампочку Л13 и включает лампочку Л14, которая под- свечивает табло Вы проиграли. В то же время другой контакт выключателя В13.2 размыкает цепь питания лампочки Л16, и гаснет табло Ваш ход. Если же сработало одно из реле РЗ, Р4 или Р5, то после второго хода автомата остаются 7, 6 или 5 горя- щих лампочек. Противник автомата имеет возможность в этих случаях при третьем своем ходе выключить от одной до четырех ламцочек, как и ранее.’ После того как он сделает свой ход, для ответного хода автомата нуж- но снова нажать кнопку Кн1. Узлы и элементы автомата взаимодействуют при этом аналогично. Игра может закончиться после третьего или четвер- того ответного хода автомата, а также после четвертого или пятого хода человека. Исход игры всегда один и тот же: у автомата, оказывается четное число «взятых» лампочек, а у его партнера — нечетное. Для того чтобы подготовить автомат к следующей партии игры, нужно отключить выключатель сети В14, вернуть все выключатели лампочек в исходное положе- ние, затем снова включить сетевой выключатель. ~В описанном играющем автомате применяют: лам- почки ЛИ 3,5 В X 0,28 А; в качестве выключателей В1— В13 используются телефонные ключи типа КТРО или какие-либо другие многополюсные выключатели; выклю- чатель сети — типа ТП1-2; Р1, Р6, Р7 — реле РЭС-9 (паспорт РС4.524.200); Р2—Р5 — реле РЭС-22 (паспорт РФ4.500.131); Д1—Д6 — диоды Д226Б (диоды Д5—Д8 включены в цепь для того, чтобы исключить ненужные 4* 51
Рис. 17. Схема вклю- чения неоновых лам- почек. связи между ее элементами); С1 — конденсатор электро- литический емкостью 20 мкФ, 50 В; Кн1 — кнопка типа К1; сетевой трансформатор собирается из пластин Ш20, толщина пакета 45 мм (обмотка I содержит 1320 витков провода ПЭЛ-0,31; обмотка II— 20 витков провода ПЭ-1,2; обмотка III— 180 витков провода ПЭ-0,62). Вместо используемых в играющем автомате лампо- чек накаливания, для питания которых требуется отдель- ная обмотка сетевого трансформато- ра, можно применить неоновые лам- почки тлеющего разряда типа ТН-0,2, ток которых составляет все- го 1—2 мА. Последовательно с каж- дой лампочкой включается балласт- ный резистор на 80—100 кОм, как показано на рис. if. Разумеется, при этом придется внести изменения в описанную схему блока питания: обмотка II исключается, на неоно- вые лампочки следует подать на- пряжение 220 В от сети переменного тока. Автомат для игры «Набери чет» можно использовать для игры двух человек между собой-. При этом кнопка Ход автомата не используется, каждый из игроков делает ходы по очере- ди, отключая лампочки с помощью выключателей В1— В13. После окончания игры вспыхивает табло Вы про- играли. Этот сигнал нужно отнести на счет того из игро- ков, у которого оказалось нечетное число «взятых» лам- почек. Перебрось мостик Эта комбинаторная игра родилась в Америке, аме- риканцы называют ее «Бридж-ит». «Перебрось мос- тик» — приблизительный перевод этого названия. На рис. 18 показана специальная доска для игры «Бридж- ит». На квадратном поле отмечены узлы двух прямо- угольных решеток, вдвинутых одна в другую: узлы одной решетки обовначены кружками, узлы другой — квадра- тиками. Участники игры (их двое) по очереди проводят вертикальные или горизонтальные линии — мостики, со- единяя два одинаковых узла. Один из игроков соединя- 52
ет кружки, другой — квадратики. Диагональными линия- ми узлы соединять не разрешается, а вертикальные и горизонтальные линии противников нигде не должны пересекаться. Выигрывает тот, кто первым построит ло- маную линию, соединяющую две противоположные сто- Рис. 18. Доска для игры «Бридж-ит». резисторов в К. Шеннона. Рис. 19. Цепь «Птичьей клетке» роны игрового поля: игрок, соединяющий кружки, — верх и низ, а игрок, соединяющий квадратики, —• правую и левую стороны поля. Попробуйте нарисовать на листе бумаги игровое по- ле и сыграть с приятелем несколько партий. Вы убеди- тесь, что хотя правила игры и несложны, совсем не про- сто найти путь к победе. Сколько различных вариантов возникает во время игры! Одно время «Бридж-ит» была весьма популярна сре- ди американских школьников. Доска для этой игры по- явилась в продаже. Кружки и квадратики на доске бы- ли выпуклыми и могли соединяться с помощью малень- ких пластмассовых цветных мостиков, длина которых позволяла соединять лишь два соседних узла, причем каждый из игроков имел мостики своего цвета. Благода- ря этому можно было вносить в игры интересные изме- нения, подробное объяснение которых давалось в прила- гаемой к комплекту инструкции. Например, каждый из игроков получал ограниченное число мостиков, и если, «построив» все эти мостики, игроки не могли добиться победы, то разрешалось продолжать игру, сдвигая при каждом ходе по одному мостику в новое положение. 53
Комбинаторная сложность «Бридж-ит» привлекла внимание и ученых — специалистов по теории игр. Бы- ло доказано, что здесь существует выигрышная страте- гия, обеспечивающая победу тому игроку, который начи- нает игру. Однако найти алгоритм победы удалось лишь после долгих и упорных поисков. В 1951 г. Клод Шеннон, много занимавшийся проб- лемой играющих автоматов (о чем мы уже рассказывали в предыдущей главе), сконструировал и построил авто- мат, который с успехом играл в «Бридж-ит» (сам ученый называл эту игру «Птичья клетка»). Основным узлом этого играющего автомата было сравнительно неслож- ное аналоговое вычислительное устройство на резисто- рах. Принцип действия автомата Шеннона заключается в следующем. Сеть резисторов соответствует линиям- мостикам, которые может провести во время игры один из игроков, например игрок А (рис. 19). Все резисторы одинаковы. Когда А во время очередного хода проводит отрезок прямой (мостик), соответствующий этому от- резку резистор замыкается накоротко (шунтируется); когда игрок В в свою очередь проводит отрезок прямой, от пересекает одну из «линий» А и соответствующий этой линии участок электрической цепи размыкается. Таким образом, если выигрывает А, то замкнутой на- коротко оказывается вся цепь (ее сопротивление пада- ет до нуля), а если-выигрывает В, то ток в цепи полно- стью прекращается (сопротивление становится бесконеч- ным). Автомат либо замыкает, либо размыкает рези- стор с наибольшим падением напряжения. Если же та- ких резисторов оказывается два или больше, то выбор одного из них производится случайным образом. В первоначальной конструкции автомата Шеннона роль резисторов выполняли лампочки накаливания, и та лампочка, которая светилась ярче других, показывала, какой нужно делать очередной ход. Поскольку, однако, решить, какая из ламп светится ярче, во многих случаях было довольно затруднительно, ученый заменил лампы накаливания неоновыми лампочками тлеющего разряда, а цепь была рассчитана так, что светиться могла только одна лампа (остальные Лампы в это время были запер- ты). Делая ход, игроки поворачивали выключатели, ко- торые в начале игры находились в нейтральном положе- нии. Один из игроков поворачивал выключатели в поло- жение Включено, другой — в положение Выключено. 54
Если автомату Шеннона предоставлялась возмож- ность начать игру, то он всегда выигрывал. Если же первый ход принадлежал человеку, то ему не составляло труда обыграть автомат, но стоило лишь игроку совер- шить сколько-нибудь значительную ошибку, как автомат тут же выигрывал. Выигрышная стратегия для игры «Бридж-ит» была сформулирована американским специалистом по теории игр О. Гроссом и оказалась очень простой. Все объясне- ние этого ученого состоит из чертежа (рис. 20) и краткой инструкции: «Вы начинаете игру и делаете ход, обозна- ченный линией в левом ниж- нем углу чертежа. Дальше надо играть так: каждый раз, когда мостик, проведен- ный противником, пересека- ет конец какой-либо пунк- тирной линии, Вы должны проводить мостик, пересека- ющий второй конец той же линии». Реализацию этой вы- игрышной стратегии может • о •• • • D S □ □ • ® "С ® b s □ ч . □ z □ □ х X ------- ® ч ® 4 ® х® х а х □ хП / □ 4 □ ч □ X --' в 4 ® х ® х® х ® □ X □ Z □ сГч П4' □ IX О х® X® X ® сГч а'4 сГч С?4 □ ® в ® @ Рис. 20. К объяснению выиг- рышной стратегии в игре «Бридж-ит». осуществлять автомат, кон- струкция которого гораздо проще автомата Шеннона. Начиная игру и соединяя мостиками кружки, он всегда будет побеждать партнера-человека, соединяющего свои- ми мостиками квадратики. Для уяснения принципа действия такого играющего автомата изобразим раздельно прямоугольные решетки, из узлов которых составлено игровое поле (рис. 21), и пронумеруем линии — мостики, соединяющие квадра- тики, числами от 1 до 48. Затем для каждого мостика первой решетки найдем во второй решетке соответствую- щий ему (согласно выигрышной стратегии) мостик и припишем ему тот же номер. Например, ходу человека, соединившего два квадратика мостиком 8, соответствует ответный ход автомата — проведение мостика, который соединяет два кружка на участке 8. Цифрой 0 обозна- чим мостик, с проведения которого начинает игру ав- томат. 55
Рис. 21. Прямоугольные решетки игрового поля, а —для человека — противника автомата; б — для автомата. Рис. 22. Внешний вид автомата для игры «Бридж-ит». На лицевой панели автомата для игры в «Бридж-ит» изображено игровое поле (рис. £2). Кружки соединены пластинками — мостиками из матового оргстекла (на рисунке они обозначены пунктирными линиями), кото- рые прикрывают прямоугольные отверстия в лицевой па- нели. Против каждого отверстия снизу укреплена лам- почка так, чтобы при ее включении высвечивалась вся 56
пластинка из органического стекла, соединяющая два кружка: подсвечиванием этой пластинки отмечается ход автомата. Человек — партнер автомата свои ходы фиксирует соединением квадратиков мостиками-пере- мычками. Для этого вокруг каждого квадратика уста- новлены металлические контактные гнезда. Конструкция мостика-перемычки показана на рис. 23. Рис. 23. Конструкция перемыч- ки-мостика для игрока-челове- ка. Рис. 24. Принципиальная схема автомата для игры «Бридж-ит». Электрическая цепь автомата (рис. 24) содержит блок питания, 48 пар гнезд (Гн!—Г.н48) и 49 лампочек (Л1—Л49). Лампочки на схеме'обозначены теми же порядковыми номерами, что и пары гнезд, при замыкании которых эти лампочки загораются, и мостики на рис. 21. Например, если противник ...автомата своим очередным ходом устанавливает мостик-перемычку 2, то замыка- ются гнезда Гн2 и загорается лампочка Л2, указывая ответный ход автомата. Гнезда для мостика под номе- ром 0 не соединяются ни с какими лампами, потому что игру начинает автомат и после включения выключателем В сетевого питания он своим первым ходом занимает участок 0 (загорается лампочка Л49). Поскольку линии игроков не должны пересекаться, человек не сможет по- ставить мостик на участке 0. - В корпусе автомата на лицевой панели предусмотрен ящичек для хранения перемычек-мостиков. В конструкции автомата применены: лампы накали- вания ЛН 3,5 ВХ0,28 А; В/— выключатель ТП1-2; се- тевой трансформатор Тр набран из пластин Ш32, тол- щина пакета 20 мм (первичная обмотка / состоит из 2000 витков провода ПЭЛ-0,18; обмоткр //—35 витков провода ПЭ-1,2). Заметим, что нетрудно усовершенствовать описанный автомат таким образом, чтобы на его игровом поле мог- 57
ли играть два человека — друг с другом. Для этого по- требуется еще один комплект перемычек (другого цве- та)—для второго игрока-человека, который будет со- единять кружки (квадратики по-прежнему будет соединять первый игрок). Кроме того, для установки мостиков второго игрока потребуется сделать гнезда и вокруг кружков. Электропитание при таком режиме иг- ры не включается, начинать игру может любой из иг- роков. На шахматной доске Играющий автомат «Одинокий ферзь». Мы уже от- мечали ранее, что к классу комбинаторных игр отно- сятся многие игры-развлечения, разыгрываемые на шахматной доске. В качестве примера была проанали- зирована подробно игра «Одинокий ферзь». Расскажем теперь, как построить простой электронный автомат, реа- лизующий алгоритм победы в этой игре с партнером-че- ловеком. Дерево игры для автомата, играющего в соответствии с таким алгоритмом, представлено на рис. 25 (как мы уже убедились, оно подобно дереву игры «Цзяньшицзы», ибо обе эти игры изоморфны). Здесь, как и на других подобных схемах, каждая отдельная партия графически представляется последовательной цепью стрелок и круж- ков, соединяющих кружков исходной позиции с кружком конечной позиции. На рис. 26 проигрышные поля шахматной доски от- мечены кружками; поле е8, на котором находится ферзь в начале игры, обозначено буквой Ф, а остальные про- игрышные поля (d6, ЬЗ, с2, al) пронумерованы циф- рами 1, 2, 3 и 4. Выигрышные поля, с которых после хода человека автомат делает ход на одно из проигрышных полей, отмечены той же цифрой, что и это проигрышное поле (например, поля d8, d7 и е7 обозначены цифрой 1, так как с этих полей автомат делает ход на проигрыш- ное поле d6, обозначенное также цифрой /). Сопостав- ляя дерево игры, изображенное на рис. 25, с изображе- нием на рис. 26, видим, что поля hl—h8, gl—g8, fl—f8, а также поля a5, a7, Ь7, c4, сЗ, c7 являются неигровыми, так как противник автомата не может ставить на них ферзя согласно правилам игры; автомату же «ходить» на эти поля невыгодно. Отметим, кроме того, что на по- 58

ля al, с2, ЬЗ и d6 может «ходить» только автомат. Не- трудно убедиться, что в этих условиях автомат неиз- бежно должен выигрывать после первого, второго или третьего хода. Внешний вид играющего автомата показан на рис. 27. На лицевой панели изображена шахматная доска, Рис. 26. Проигрышные и выиг- рышные поля игры «Одинокий ферзь». Рис 27 Внешний вид играюще- го автомата «Одинокий ферзь». в каждом поле которой имеется отверстие, куда при ходе игрока-человека вставляют штекер-ферзь. Под отвер- стием установлена пара контактов, которые замыкаются, если вставляется штекер (разумеется, под неигровыми полями контактов нет — они не нужны). В начале игры ферзь устанавливают в отверстие на поле е8, затем включается выключатель блока питания и противник ав- томата получает право первого хода. Делая ход ферзем, он должен извлечь штекер-ферзь из гнезда на поле е8 и вставить его в отверстие соответствующего поля. При этом замыкаются контакты этого поля и автомат делает ответный ход, подсвечивая лампочкой поле шахматной доски, на которое он переставляет ферзя. Далее следует переставить штекер-ферзь на указанное автоматом по- ле, после чего его противник получает право сделать аналогично следующий ход. Игра продолжается до тех пор, пока автомат не сделает ход на поле al (игра за- канчивается выигрышем автомата). 60
Принципиальная электрическая схема автомата по- казана на рис. 28 (схема разработана Е. И. Фединги- ным). Ее основой являются четыре триггера, собранных на транзисторах Т1—Т8. В коллекторную цепь левого (по схеме) транзистора каждого триггера включена лам- почка накаливания (Л1—Л4), а в коллекторную цепь Рис. 28 Принципиальная схема играющего автомата «Одинокий ферзь» правого транзистора — резистор (R9—R12). Контакты В1 изображают на схеме контактные пары, расположен- ные под отверстиями в тех полях, из которых можно сделать ход на проигрышное поле d6 (эти контактные пары соединены параллельно). Аналогично контакты В2, ВЗ и В4 относятся к тем полям, с которых можно сделать ход соответственно на поля ЬЗ, с2 и al. Сопротивление холодных нитей накала дамп Л1—Л4. примерно в 5 раз меньше, чем в нагретом состоянии. При включении питания (выключателем В5) транзисто- ры Т2, Т4, Тб и Т8 триггеров открываются, транзисторы же Т1, ТЗ, Тб и Т7 закрываются, поэтому ни одна лам- почка не горит. Первым должен сделать ход противник автомата. Допустим, что он переставил ферзя на поле d8. При этом замыкаются контакты В1 и отрицательное напря- жение поступает на базу транзистора Т1. Этот транзис- тор открывается, и загорается лампа Л1, расположен- ная под полем d6, указывая, что ответным ходом авто- мат переставляет ферзя на это поле. Транзистор Т2 запирается.
Далее предположим, что противник автомата пере- ставил ферзя на поле Ь4. Теперь замыкаются контакты В2 и отрицательное напряжение подается на базу тран- зистора ТЗ, который открывается, и загорается лампоч- ка Л2, подсвечивающая поле ЬЗ. Это указывает, что от- ветный ход автомат делает на поле ЬЗ. Одновременно закрывается транзистор Т4, и с его коллектора через диод Д1 на базу транзистора Т2 подается открывающее его отрицательное напряжение. Первый триггер (на транзисторах Т1 и Т2) переключается в исходное устой- чивое состояние, и лампа Л1 гаснет. Если следующий ход человек сделает на поле Ы, то замкнутся контак- ты В4. Аналогично предыдущему лампа Л2 погаснет, и загорится лампа Л4, подсвечивающая поле al, — авто- мат выиграл. Для возврата автомата в исходное состоя- ние нужно выключить -питание, установить штекер- ферзь в гнездо поля е8 и снова включить питание. Аналогично работает автомат и при других вариантах стратегии противника, причем в некоторых случаях мо- жет включаться и лампочка ЛЗ, подсвечивающая по- ле с2. , В автомате применены: Т1—Т8 — транзисторы М.П42; Д1—Д5— диоды Д9Ж; R1—R8— резисторы с сопротивлениями по 36 Ом типа УЛМ; R9—R12 — резис- торы с сопротивлением по 10 Ом при рассеиваемой мощ- ности не менее 1 Вт (такие резисторы можно изготовить, намотав несколько метров тонкого провода ПЭЛ на ре- зисторы типа МЛТ-0,5 с сопротивлением не менее 100 Ом); R13—R16 — резисторы с сопротивлениями по 2,2 кОм типа МЛТ; лампы типа ЛН 3,5 ВХ0,28 А; вы- ключатель питания — тумблер типа ТП1-2. Контакты в гнездах полей шахматной доски самодельные. В каче- стве источника питания используется батарея 3336Л. Лицевую панель автомата можно изготовить из лис- тового органического стекла, раскрашенного под шахмат- ную доску. Под лицевой панелью располагается еще од- на панель из листового гетинакса, на которой в соответ- ствующих местах укреплены лампочки и контактные пары. На этой же панели укрепляется решетка из тексто- лита, которая делит панель на клетки так, чтобы каж- дая лампочка подсвечивала только одно поле. Все ос- тальные детали (транзисторы, резисторы, диоды) могут быть смонтированы на отдельной небольшой плате из гетинакса, которую крепят к первой гетинаксовой пане- 62
ли. Футляр можно изготовить из текстолита, органиче- ского стекла или другого листового материала. Играющий автомат «Ход конем». Игра «Ход конем» отличается от игры «Одинокий.ферзь» тем, что здесь иг- роки поочередно переставляют на шахматной доске не ферзя, а коня. Ходить конем можно на два поля вниз и потом на одно поле вправо или влево, или на два поля влево и потом на одно поле вверх или вниз (рис. 29). Выигрывает тот, кто поставит своим очередным ходом Рис. 29. Допустимые ходы иг- роков в игре «Ход конем». Рис. 30. Выигрышные («+») и проигрышные («—>>) поля шах- матной доски в игре «Ход ко- нем». коня в положение, при котором противнику будет неку- да ходить, или, другими словами, поставит коня на одно из полей: al, а2, Ы, Ь2. Анализ этой комбинаторной игры аналогичен анали- зу игры «Одинокий ферзь». На рис. 30 показаны выиг- рышные («+») и проигрышные («—») поля для этой игры. Выигрышную стратегию здесь можно сформулиро- вать так: если конь стоит на проигрышном поле, непре- менно добьемся победы, предоставив право первого хода противнику и затем своим очередным ходом ставя коня на одно из полей, обозначенных минусом; если же конь стоит вначале на выигрышном поле, то нужно делать первый ход, бтавя коня на поле, обозначенное минусом. Дерево игры для автомата, придерживающегося такой выигрышной стратегии, изображено на рис. 31 (здесь в исходной позиции конь стоит на поле й&). 63
Рис. 31. Дерево игры «Ход конем». На рис. 32 исходное положение коня на поле h8 обо- значено буквой К; проигрышные поля, на которые авто- мат делает ответные ходы, отмечены кружками и про- нумерованы цифрами от 1 до 5. Такими же цифрами отмечены выигрышные поля, с которых после хода чело- Рис. 32. Проигрышные и выиг- рышные поля игры «Ход конем» века автомат делает очеред- ные ходы на проигрышные поля (например, поля f7 и g6, а также проигрышное поле е5 обозначены цифрой /). Как нетрудно видеть, в этой игре игровыми являют- ся лишь немногие поля шахматной доски: al, а5, Ь2, ЬЗ, с2, с4, сб, d3, el, е5, f3, f7, g6, h8‘; при этом на поля е5, el, Ь2, а5, al ход делает только автомат. Внешне этот автомат мо- жет выглядеть так же, как и автомат для игры «Одино- кий ферзь» (см. рис. 27), но 64
штекер выполняют в виде шахматного коня. Принципи- альные схемы автоматов тоже очень схожи. Основой схемы автомата для игры «Ход конем» являются пять триггерных ячеек (рис. 33), которые управляют включе- нием лампочек подсвета полей шахматной доски так же, как четыре триггера в схеме автомата для 'игры «Одино- кий ферзь». Например, допустим, что первым ходом противник автомата переставил коня с h8 на поле f7. При этом контакты ВЧ замкнутся, в результате чего на базу транзистора 77 будет подано отрицательное напря- Рис. 33. Принципиальная схема играющего автомата «Ход конем». жение. Транзистор откроется, и загорится лампа Л1, рас- положенная под полем е5, указывая, что ответным хо- дом автомат переставляет коня на поле е5. Далее предположим, что человек переставил коня с поля е5 на поле сб. Теперь замкнутся контакты В2, от- рицательное напряжение будет подано на базу транзис- тора ТЗ, который откроется, и загорится лаь1па Л2, под- свечивающая поле а5. Это укажет, что ответный ход-ав- томат делает на поле а5. Одновременно транзистор Т4 закроется, и с его коллектора через диод Д1 на базу транзистора Т2 будет подано открывающее его отрица- тельное напряжение. Первый триггер (на транзисторах 5—788 65
Т1 и Т2) при этом переключится в первое устойчивое состояние, и лампа Л1 погаснет. Если следующий ход че- ловек сделает на поле ЬЗ, то замкнутся контакты В5 —> лампа Л2 погаснет, а загорится лампа Л5, подсвечиваю- щая поле al, — автомат выиграл. Для возврата автома- та в исходное состояние нужно выключить питание, уста- новить коня в гнездо поля h8 и снова включить питание. В иных вариантах этой игры автомат может вклю- чать другие лампочки, действуя согласно выигрышной стратегии. Детали и материалы для изготовления опи- санного автомата — такие же, как и для автомата «Оди- нокий ферзь». * * * На основе логических цепей с электромагнитными ре- ле и триггерами можно конструировать многие другие кибернетические устройства, играющие в комбинаторные игры подобно описанным выше автоматам. Необходимо лишь знать алгоритм беспроигрышной игры. Но по мере увеличения комбинаторной сложности игр разработка теории, нахождение классов особых и неособых пози- ций, а значит, и формулировка выигрывающего алгорит- ма становятся все более затруднительными. С другой стороны, чем сложнее игра (обилие игровых вариантов и позиций, разнообразие возможных ходов игроков), тем более сложным и даже громоздким должен получиться соответствующий играющий автомат. При этом услож- нение играющих автоматов с переходом к все более сложным комбинаторным играм должно носить в основ- ном лишь количественный характер. Возможно, вместо десятка реле, триггеров, лампочек конструктору более сложного автомата понадобится применить сотню или боле₽ таких элементов. Принципиально же автоматы для сложных комбинаторных игр не будут заметно отли- чаться от простых устройств, которые мы описали в этой главе: та же детерминированность действий и однознач- ная, заранее предусмотренная реакция автомата на лю- бой возможный ход его противника, та же обреченность последнего и неизбежное Вы проиграли в конце каждой партии.
ГЛАВА ТРЕТЬЯ КОГДА ИСХОД ИГРЫ СЛУЧАЕН Азартные игры «— Бросьте жребий, доктор! — сказал капитан. Доктор вынул из кармана серебряную монету и под- нял ее кверху. — Решетка! — закричал Грушницкий поспешно, как человек, которого вдруг разбудил дружеский толчок. — Орел! — сказал я. Монета взвилась и упала, звеня; все бросились к ней. — Вы счастливы, — сказал я Грушницкому, — вам стрелять первому!» Читатель, конечно, помнит эту сцену из романа М. Ю. Лермонтова «Герой нашего времени». Бросание жребия... Сколько раз каждому из нас при- ходилось в той или иной форме доверяться случаю, при- нимая участие в жеребьевке, пусть при менее драмати- ческих обстоятельствах, чем в приведенном выше отрыв- ке: при разделе чего-либо, установлении очередности или по какому-нибудь иному поводу! Особенно часто к же- ребьевке прибегают в спортивных состязаниях и в дру- гих играх, например, чтобы определить, кому начинать игру. Нетрудно видеть, впрочем, что само бросание жре- бия — это тоже игра, но такая игра, исход которой слу- чаен и никак не зависит от опыта, знаний, умения, а так- же от поведения игроков. При каждом отдельном бро- сании монеты, например, выпадает одно из двух: лицевая сторона (герб) или оборотная (решка). Однако со- вершенно невозможно заранее с достоверностью утверж- дать, какой стороной монета упадет, и игроки бессиль- ны каким-либо образом повлиять на результат. Неуди- вительно поэтому, что суеверные люди при бросании жребия нередко воспринимают его исход как проявление некой сверхъестественной силы — «рока» или «судьбы», которая иногда бывает благосклонна к одному из играю- щих, а в иных случаях, «поворачивается к нему спиной». Бросание жребия — типичная азартная игра, извест- ная, вероятно, с самых древних времен. Другая подобная игра, почти столь же древняя — игра в кости. Известный итальянский математик Джероламо Кардано (1501— 5* 67
1576) в своей «Книге об игре в кости» утверждал, что эта игра была придумана в XII в. до нашей эры, во время Троянской войны. Осада Трои длилась десять лет, и вои- ны изнывали от безделья. Для спасения от скуки и были придуманы игральные кости. На одной из ваз (амфор), относящихся к VI в. до нашей эры, даже изображены герои Троянской войны Аякс и Ахилл, играющие в кости, Кардано приводил в своей книге много рассказов древ- них об игре в кости. Разумеется, версия Кардано об изобретении игры в кости — это только легенда. В действительности же раз- личные варианты игры существовали гораздо раньше? разнообразные типы игральных костей встречаются в ар- хеологических раскопках начиная с V в. до нашей эры. Самое большое распространение получили в древно- сти и в средние века игры, в которых использовалась игральная кость в виде кубика с нанесенными на грани точками от одной до шести. Правила игры были самыми разнообразными. В простейших случаях игроки по оче- реди бросали кости и выигрывал тот, у кого выпадало большее число очков (некоторые варианты игры были еще более простыми: игроки загадывали, что выпадет — «чет» или «нечет»), В более сложных играх каждый из игроков бросал по две или даже по три кости; в неко- торых играх ставки делались на выпадение опреде- ленного числа очков при заданном числе бросаний и т. п. Дальнейшим развитием игры в кости была рулетка, различные разновидности которой появились в XI— XII вв. во многих странах. А позднее (в XIV в.) сначала во Франции, а затем и в других странах получили рас- пространение игральные карты. Во многих карточных играх, в отличие от игры в кости и рулетки, игроки име- ли возможность в какой-то мере оказывать влияние на ход и исход игры в меру своих знаний и опыта. Азартные игры далеко не всегда были безобидным и приятным развлечением. В считанные минуты азартный и отчаянный игрок мог сказочно разбогатеть или пре- вратиться в нищего, «спустить» все до последнего гро- ша. Жажда наживы, стремление к легкому и быстрому обогащению при помощи азартной игры пробуждали в игроках самые низменые инстинкты. Нередко азартные игры бывали причиной насилий, убийств и других тяж- ких преступлений. 68
Писатели разных времен и народов: Данте Алигьери и Франсуа Рабле, Шарль де Костер и Оноре де Бальзак, Александр Пушкин и Федор Достоевский, Джек Лондон и -Стефан Цвейг — поведали нам немало историй, боль- шей частью мрачных и драматических, так .или иначе связанных с азартными играми. Большой интерес к изучению азартных игр издавна проявляли математики. Вычисление шансов игроков за- нимало умы многих знаменитых ученых в XVII—XVIII вв. Анализом азартных игр занимались Галилео Галилей, Блез Паскаль, Христиан Гюйгенс, Яков Бернулли, Лео- нард Эйлер и другие выдающиеся математики. Азартные игры интересовали их лишь как очень удобная схема для выражения разнообразных законо- мерностей и задач, встречавшихся в различных сферах человеческой деятельности. Ученые, занимавшиеся ис- следованиями в этой области, фактически разрабатыва- ли основы теории вероятностей — важнейшей математи- ческой науки, которая впоследствии дала средства и методы для исчерпывающего анализа таких задач. Вме- сте с тем уделяя много внимания задачам, связанным с азартными играми, ученые, как правило, тех, кто увле- кается такими играми, осуждали. Французский матема- тик и философ П. Р. Монмор в предисловии к своей кни- ге «Анализ азартных игр» писал: «В этом трактате я в первую очередь имел в виду удовольствие математи- ков, а не пользу игроков; по нашему мнению, те, кто те- ряет на игры время, заслуживают терять в них свои деньги». При анализе азартных игр важное значение имеет определение шансов каждого из игроков. В некоторых иг- рах дать такую оценку шансов совсем нетрудно, в осо- бенности, если платежи игроков одинаковы (т. е. каж- дый из них- платит в случае проигрыша своему против- нику одну и ту же сумму). Например, при игре в «орлянку», бросая монету, ожи- дают, что она упадет вверх орлом или решкой. При мно- гократном бросании каждая из сторон будет выпадать одинаково часто: в половине общего числа бросаний. В этом случае говорят, что вероятность выпадения каждой стороны монеты равна 1/2. Если обозначить ве- роятность буквой Р, то это можно записать так: Рг = 1/2; Рр=1/2. Так"как оба исхода бросания монеты равнове- роятны, то, очевидно, шансы обоих игроков при игре в «орлянку» одинаковы. 69
Другой пример — простейший вариант игры в кости, при котором бросается одна кость и в случае выпадения грани с четным числом очков выигрывает первый игрок, а в случае, если это число нечетное, — второй. Кость-ку- бик при бросании может лечь на стол любой из своих шести граней вверх, и все грани равноправны. Поэтому вероятность выпадения каждой грани равна 1/6. Так как четные- числа очков (2, 4, 6) нанесены на трех гранях из шести, то вероятность выигрыша первого игрока P1 = _L.3 =-L, 6 2 Такова же вероятность выигрыша и второго игрока, ибо граней с нечетным числом очков (1, 3, 5) тоже три.’ Р2 = — .3 = -L. 2 6 2 Следовательно, и в этой простой азартной игре шан- сы игроков равны. Далее увидим, что так бывает далеко не всегда: су- ществуют такие азартные игры, в которых один из' иг- роков цмеет меньше шансов на выигрыш, чем другой. В связи с этим вводится понятие о справедливых и несправедливых азартных играх. Азартную игру можно считать справедливой по отношению ко всем ее участникам, если шансы игроков перед началом игры равны. Это значит, что если сыграть очень большое число партий такой игры (при одной и той же ставке в каждой партии), то каждый игрок при- мерно столько же выиграет, сколько и проиграет. Каждого, кто собирается принять участие в азартной игре, волнует вопрос, справедлива ли эта игра по отно- шению к нему. Как мы уже убедились, это нетрудно оп- ределить, если платежи игроков одинаковы. В этом слу- чае достаточно установить, что выигрыши участников игры в каждой партии равновероятны, — это и будет означать, что игра справедлива; если же вероятности выигрыша неодинаковы, то такая азартная игра н е- справедлива по отношению к тому из игроков,-для которого вероятность выигрыша меньше. Так, нетрудно видеть, что справедливой мы можем считать игру в «ор- лянку» и простейшую игру в кости в рассмотренных вы- ше примерах. Допустим теперь, что во втором из этих примеров правила игры сформулированы иначе: при вы- 70
падении грани с шестью очками выигрывает игрок А, а во всех остальных случаях — игрок В (платежи по- прежнему одинаковы). При этих условиях игра будет яв- но несправедлива по отношению к игроку А, так как ве- роятность выигрыша для него равна 1/6, тогда как для игрока В она равна 5/6. В игре, состоящей из многих партий, игрок А заведомо окажется в проигрыше. Известно много более сложных азартных игр, прави- ла которых предусматривают неодинаковые платежи иг- роков при различных исходах. В таких играх даже рав- ные вероятности исходов еще не означают справедливо- сти игры по отношению ко всем ее участникам. Нередко же в игре при разных платежах еще и вероятности ис- ходов различны. Как же определять в подобных случа- ях, справедлива ли азартная игра? Для этого вводится понятие математического ожидания выигрыша — так в теории игр называ- ют сумму произведений выигрышей, получаемых участ- ником игры при различных ее исходах, на вероятности этих исходов. Если в азартной игре возможно п различ- ных исходов и каждый Ай исход, происходящий с веро- ятностью Pi, приносит игроку выигрыш rrit, то матема- тическое ожидание выигрыша М = (=1 Если в азартной игре математическое ожидание вы- игрыша каждого из игроков оказывается равным нулю, то это свидетельствует о том, что игра справедлива. На- оборот, если математическое ожидание выигрыша для игроков не равно нулю, то игра неправедлива; он^ вы- годна для того игрока, у которого значение М положи- тельно, и невыгодна для того, у которого оно отрица- тельно. Приведем примеры анализа некоторых азартных игр. Игра «Встреча». Это азартная карточная игра. Иг- рают двое. Каждый из игроков имеет по полной колоде карт. Тщательно перетасовав карты, игроки извлекают (каждый из своей колоды) по одной карте и сравнива- ют их; карты извлекаются одна за другой до тех пор, пока не будут извлечены две одинаковые карты одно- временно, и тогда игрок А выигрывает Если же такая «встреча» одинаковых карт не состоится вовсе, то выиг- 71
равшим считается игрок В. Проигравший платит выиг- равшему 1 франк. Справедлива ли эта азартная игра? Расчет вероятностей выигрыша для этой игры вы- полнил в свое время знаменитый математик Леонард Эй- лер. Прежде всего для облегчения расчетов заменим иг- ральные карты занумерованными билетами: 1, 2, 3 и т. д, Далее будем считать, что игрок А извлекает билеты по порядку, начиная с билета 1. Предположим,что «колода» игрока состоит всего из одной карты (билета). Тогда, очевидно, вероятность выигрыша игрока А будет Рд—1, а вероятность выигрыша игрока В равна Рв—0. Пусть теперь каждый имеет по два билета. Ясно, что в этом случае Рл = 1/2, Рв—1/2. Если оба игрока имеют по три билета, то в этом случае, когда А извлекает билеты в порядке 1, 2, 3, игрок В может извлечь свои билеты шестью различными спо- собами (табл. 1). Таблица 1 в 1 2 3 4 5 6 2 3 3 3 2 1 1 1 2 1 1 2 2 3 1 3 2 3 Все эти шесть вариантов исхода равновероятны. Здесь видно, что выигрышу игрока А благоприятны че- тыре исхода, а выигрышу игрока В — два исхода. Следо- вательно, Рд=4/6=0,667; Рв=2/6=0,333. Если у каждого будет по четыре карты (билета), то игрок В сможет извлечь свои билеты 24 различными способами (табл.2). Таблица 2 А . В 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 15 17 18 19 20 21 22 23 24 1 1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 2 2 2 3 3 4 4 3 3 4 4 1 1 4 4 1 1 2 2 1 1 2 2 3 3 3 3 4 4 2 2 3 4 1 1 3 4 3 1 2 2 4 1 4 2 3 3 1 1 2 4 4 3 2 4 3 2 1 4 3 1 3 4 2 1 4 2 4 1 3 2 1 3 2 1 72
Легко подсчитать, что в этом случае Рд=15/24= =0,625; Рв=9/24=0,375. При пяти картах табл. 2 будет иметь 120 столбцов. Выполняя дальнейшие расчеты, Эйлер показал, чго до мере увеличения числа карт в колодах вероятность вы- игрыша А приближается к значению Рл~1—1/е»0,632 (е=2,71828 — основание натуральных логарифмов); ве- роятность выигрыша игрока В при этом приближается к Рв=1/е?а 0,368. Эйлер доказал, что при числе карг в колодах, большем 20, значения вероятностей РА=0,632 и Рв=0,368 можно считать практически точными. Гак как обычно в игре используют колоду, содержащую 36 или 52 карты, то указанные значения вероятностей так- же можно считать точными. Таким образом, шансы игрока А в этой игре почти вдвое больше, чем шансы игрока В. Если платеж в игре равен 1 франку, то математическое ожидание выигрыша для А МА--= I- 0,632 — 1 • 0,368 = 0,264 франка, а математическое ожидание выигрыша для игрока В Мв = 1 • 0,368 — 1 • 0,632 = — 0,264 франка. Для справедливости игры ' В должен потребовать, чтобы А перед каждой партией игры платил ему 0,264 франка. Новогодняя лотерея. Для покрытия мелких расхо- дов, связанных с проведением новогоднего вечера в од- ном из учреждений, праздничная комиссия решила ра- зыграть среди его участников новогоднюю лотерею. Бы- ло выпущено и распространено 500 лотерейных билетов по цене 20 коп. за билет. Наименование, стоимость и количество выигрышей, разыгрываемых в этой лотерее, приводятся в табл. 3. Каково математическое ожидание выигрыша участ- ника лотереи? Справедлива ли эта азартная игра? Чтобы подсчитать математическое ожидание выиг- рыша участника лотереи, купившего да 20 коп. один ло- терейный билет, примем во внимание, что на этот билет можно получить названные в табл. 3 выигрыши со сле- дующими вероятностями: духи 2/500 или 0,004; подароч- ное издание 2/500 или 0,004; конфеты 3/500 или 0,006; авторучка 10/500 или 0,02; записная книжка 41/500 или 0,082. 73
Таблица 3 Наименование выигрышей Цена (в руб.) Количе- ство выи- грышей Сумма (в руб.) Флакон духов «Красная Москва» 5,3 2 10,6 Подарочное издание 4,7 2 9,4 Коробка конфет «Ассорти» 4,25 3 12,75 Шариковая авторучка 0,7 10 7,0 Записная книжка 0,25 41 10,25 Всего: 58 50,00 Лотерейный билет может оказаться и «пустым» (т. е. выигрыш будет равен нулю) с вероятностью 442/500 или 0,884. Принимая во внимание все эти вероятности и вы- ражая стоимости выигрышей и цену билета в рублях, вы- числяем математическое ожидание выигрыша: М = 5,3-0,004 + 4,7-0,004 + 4,25-0,006 + 0,7-0,02 + + 0,25 - 0,082 + 0 • 0,884 — 0,2 == — 0,1 руб, Математическое ожидание выигрыша получилось от- рицательным: каждый участник лотереи проигрывает в среднем по 0,1 руб. на одном лотерейном билете. Следо- вательно, игра несправедлива по отношению к участни- кам лотереи. Конечно, этого и следовало ожидать: ведь из суммы 100 руб., вырученной от продажи 500 билетов, только 50 руб. были возвращены участникам лотереи в виде выигрышей, остальные 50 руб. — «чистый доход» лотерейного предприятия. Собственно, ради этого дохо- да и была устроена лотерея. Для того чтобы эта игра была справедливой, следо- вало бы уменьшить вдвое стоимость одного лотерейного билета или сократить вдвое количество билетов! Но и в том, и в другом случае «чистый доход» лотереи обратит- ся в нуль, поэтому для организаторов лотереи ее прове- дение теряет всякий смысл. Заметим в заключение, что среднюю сумму проигры- ша, пришедшегося на один лотерейный билет в этой но- вогодней лотерее (т. е. численное значение математиче- ского ожидания выигрыша), можно вычислить и другим путем. Для этого достаточно разность между стоимо- 74
стью всех лотерейных билетов и стоимостью всех выиг- рышей разделить на общее число лотерейных билетов: (100 — 50)/500 = 0,1 руб. = 10 коп. Итак, рассмотренные нами примеры убедительно по- казывают, что если иметь в виду только абсолютное зна- чение ставки и ожидаемого выигрыша, то для принятия решения о целесообразности участия в азартной игре сле- дует определить, справедлива ли эта игра. Для этого, как мы видели, в простейших случаях достаточно лишь сравнить вероятности выигрыша каждого из игроков, а в более сложных — нужно вычислить математическое ожи- дание выигрыша. Игрок должен убедиться, что для него эта величина не является отрицательной. Если игрок, анализируя условия игры, обнаружит, что игра по отно- шению к нему несправедлива, он может отказаться от участия в этой игре. И наоборот, если он установит, что игра несправедлива по отношению к его противнику, то стоит играть; более того, следует даже попытаться «на- вязать» эту игру своему противнику, заставить его при- нять участие в игре. Чем больше математическое ожи- дание выигрыша, тем увереннее может игрок вступать в азартную игру, смелее доверяться случаю, в осо- бенности, если предстоит сыграть большую серию пар- тий. Разумеется, мы имеем в' виду азартные игры, кото- рые проводятся корректно (т. е. без жульничества), и предполагаем, что подсчет вероятности выигрыша и математического ожидания произведен правильно. Ошиб- ка в оценке вероятности того или иного исхода игры мо- жет очень дорого обойтись допустившему ее игроку. Очень убедительный пример этого приводит Я. И. Пе- рельман в рассказе «Пари», который мы воспроизводим здесь с некоторыми сокращениями [14]. «В столовой дома отдыха зашла речь за обеденным столом о том, как вычисляется вероятность событий. Объяснения давал молодой математик. — Неужели можно вычислить вероятность во всех случаях? — спросила одна из отдыхающих. — Возьмите такой пример. Я загадала, что первый прохожий, кото- рого мы увидим из окна столовой, будет мужчиной. Ка- кова вероятность, что я отгадала? — Вероятность, очевидно, равна половине, если только мы условимся и годовалого мальчика считать за 75
мужчину. Число мужчин на свете равно числу женщин. Далее молодой математик объяснил, как вычислить вероятность того, что мужчинами окажутся первые два, три, четыре, десять прохожих. Вероятность все умень- шается, и для десяти прохожих она уже меньше одной тысячной доли единицы. — Значит, — пояснил молодой математик, — если вы бьетесь об заклад, что первые десять прохожих все под- ряд окажутся мужчинами и ставите один рубль, то я могу ставить тысячу рублей за то, что этого не произой- дет. — Выгодное пари! — заявил чей-то голос... — Я бы рискнул рублем против тысячи даже за то, что сотня прохожих окажутся все подряд мужчинами. — А вы представляете себе, как мала вероятность такого события? — спросил математик. — Одна миллионная или что-нибудь в этом -роде? — Неизмеримо меньше! Одна миллионная получит- ся уже для 20 прохожих. Для сотни прохожих будем иметь... Дайте-ка я прикину на бумажке... Биллионная... Триллионная... Квадрильонная... Ого! Единица с трид- цатью нулями!.. — Внушительное число, что и говорить! Сколько же вы поставите против моего рубля? — Ха-ха!.. Все! Все, что у меня есть. — Все — это слишком много. Ставьте на кон ваш велосипед. Ведь не поставите? — Почему же нет? Пожалуйста! Пусть велосипед, если желаете. Я нисколько не рискую. — И я не рискую. Не велика сумма рубль. Зато могу выиграть велосипед, а вы почти ничего. — Да поймите же, что вы наверняка проиграете! Ве- лосипед вам никогда не достанется, а рубль ваш можно сказать уже в моем кармане... — Увлекаетесь, молодой человек, — раздался спо- койный голос старика, все время молча слушавшего спор. — Увлекаетесь... — Как?! И вы, профессор, рассуждаете по-обыва- тельски? — Подумали ли вы о том, что не все случаи здесь равновозможны? Расчет вероятности правилен лишь для каких событий? Для равновозможных, не так ли? А в рассматриваемом случае... Впрочем, — сказал старик, прислушиваясь, — сама действительность, кажется, сей- 76
час разъяснит вам вашу ошибку. Слышна военная музы- жа, не правда ли? — При чем тут музыка?..—начал было молодой ма- тематик и осекся. На лице его выразился испуг. Он сор* вался с места, бросился к окну и высунул голову. — Так и есть! — донесся его унылый голос. — Про- играно пари! Прощай мой велосипед... Через минуту всем стало ясно, в чем.дело. Мимо окон проходил батальон красноармейской пехоты»-. Поучительный рассказ Я. И. Перельмана не требует особых комментариев. Ошибка молодого математика с очевидностью показывает, как важно правильно оце- нить вероятности исходов в азартной игре. К сожале- нию, нередко это трудно сделать даже в самых простых играх. Так, если играют в «орлянку» и монета, исполь- зуемая для этого, слегка погнута или имеет какие-либо другие, особенности, изменяющие положение ее центра тяжести, то вероятности выпадения герба и решки не одинаковы. Игральные кости тоже лишь теоретически можно счи- тать идеальными. А ведь только для идеального куба вероятности выпадения всех граней одинаковы. У ре- альных костей центр тяжести может быть несколько сме- щен, что делает вероятности выпадения разных граней различными. Игрок может не знать этого и не учитывать, рассчитывая вероятности выпадения разных граней. То же можно сказать и о любом ином устройстве, с помо- щью которого определяют исход азартной игры, будь то карты, рулетка, урна с шарами или что-либо другое. Бывает, конечно, и наоборот: игрок обнаруживает какие-то особенности, влияющие на случайный исход иг- ры, и умело пользуется ими, чтобы выиграть. Такой слу- чай описал, например, Джек Лондон в рассказе «Ма- лыш видит сны» [24]. Герой рассказа Смок, играя в рулетку, знал, что у игроков всегда меньше шансов на выигрыш, чем у крупье. Но он много дней наблюдал за игрой и заметил одно обстоятельство, позволившее ему беспрерывно брать одну за другой 'большие ставки. Владельцы игорных столов захотели узнать секрет Смока. — Вы нас озадачили, — говорили они ему. — Мы ни- чего не понимаем. Нам известно, что в рулетке не может быть никаких систем. Это говорят все ученые-матема- тики... П
Но Смок продолжал выигрывать. Тогда владельцам рулетки пришлось выкупить унего «секрет». Оказалось, что никакого секрета нет. Просто игор- ный стол стоял близко к раскалённой печке, и колесо рулетки рассохлось, покоробилось. Это привело к появ- лению определенной закономерности в игре, которую и заметил хитрый Смок, изучивший повадки колеса. — Мы остались в дураках, — сказал Большой Бэрк, один из владельцев игорных столов. — Не удивительно, что он играл только за этим столом. За другим столом он не выиграл бы и кислого яблока... В некоторых случаях вывод о целесообразности учас- тия в азартной игре, сделанный только на основании суждения об абсолютном значении ставки и выигрыша, может оказаться неверным, ибо далеко не всегда для игрока ценность ставки определяется ее величиной, вы- раженной в деньгах. Мы уже убедились в этом на при- мере лотереи. В этой азартной игре многочисленные ее участники, несмотря на отрицательное значение мате- матического ожидания выигрыша (и, следовательно, яв- ную несправедливость игры по отношению к ним), все же охотно покупают лотерейные билеты. Здесь малая веро- ятность выигрыша большой суммы денег оценивается каждым игроком выше потери своей небольшой став- ки — стоимости лотерейного билета. Тйким образом, вопрос о целесообразности участия в азартной игре можно решить, руководствуясь не толь- ко объективной оценкой математического ожидания вы- игрыша, но и субъективной оценкой игроком «полезно- сти» того или иного исхода игры в данной конкретной си- туации. Кость бросает автомат В одном из простейших вариантов игры в кости иг- роки по очереди бросают шестигранный кубик-кость, и выигрывает тот, у кого выпадет большее число очков. При выпадении одинакового количества очков считает- ся, что партия игры закончилась вничью. Выше мы уже увидели, что такая азартная игра вполне справедлива: шансы игроков одинаковы, математическое ожидание выигрыша для каждого из них равно нулю. Кибернетическое устройство, которое здесь описано, имитирует бросание кости в этой игре. В роли одного из, 78
азартных игроков выступает сам автомат, а его против* ником является человек. Внешний вид автомата показан на рис. 34. На лице- вой панели расположены пульты игроков — человека и автомата. Каждый из этих пультов содержит пусковые кнопки (Ход человека и Ход автомата), шесть круглых табло с цифрами от 1 до 6 для фиксации выпадающих чисел (очков) и табло Выиграл. Вне пультов на панели |(Б ц1Й Г ХОД ЧЕЛОВмА Asioi 'т [rjTVnwi lj СХф (з) (р Ход АВТОМАТА Результат @ 4EJMEA Рис. 34. Внешний вид автомата, играющего в «костн». находится кнопка Результат, световое табло Ничья и выключатель сети. Игра человека с автоматом происходит так. После включения сетевого выключателя противник автомата нажимает «свою» кнопку (Ход человека) и, продержав ее в нажатом состоянии несколько секунд, отпускает. Затем он так же нажимает и отпускает кнопку Ход авто- мата. Пусковые кнопки связаны с генераторами случай- ных чисел от 1 до 6. Воздействуя на кнопку, мы осуще- ствляем выбор одного из этих чисел случайным обра- зом, что равносильно бросанию шестигранной кости. В качестве генератора случайных чисел в автомате использованы контактные дисковые коммутаторы. Вра- щающийся пластмассовый диск такого коммутатора (рис. 35) имеет шесть кольцевых «дорожек», по которым скользят шесть неподвижных щеток. Щетки эти соот- ветствуют граням игр'альной кости и пронумерованы цифрами от 1 до 6; каждая щетка соединена с соответ- 79
ствующей лампочкой на пульте игрока. У кольцевых «дорожек» на диске часть поверхности — сектор в 60° — покрыта медной фольгой, причем эти токопроводящие участки расположены таким образом, что щетки при вра- щении диска контактируют с фольгой поочередно. Седь- мая щетка прижата к диску в его центральной части, которая также покрыта медной фольгой. Таким образом, когда диск ' равномерно вращается, центральная седьмая щетка через медную фоль- I rU' ч I ГУ поочеРеДно замыкается с каждой из шести щеток, скользящих по , Рис. 35. Диск контактного коммутатора с ’ токопроводящими участками «дорожек». кольцевым «дорожкам». Если вращающийся диск оста- навливать в произвольно выбранные, случайные момен- ты времени, то при каждой такой остановке центральная щетка с равной вероятностью (Р—1/6) может оказаться присоединенной к любой из шести щеток. Соответствую- щая лампочка на пульте игрока, загораясь, указывает выбранное случайным образом число. Диск коммутатора приводится во вращение электро- двигателем, включение и выключение которого осуще- ствляют нажатием и отпусканием пусковой кнопки (Ход человека -или Ход автомата). Случайность выбора мо- мента остановки дисков обеспечивается тем, что игрок- человек вращающегося диска не видит. Аналогичные механизмы для случайного выбора со- стояния системы с заданной вероятностью применяют и в некоторых других играющих автоматах, которые будут описаны ниже. Принципиальная схема автомата приведена на рис. 36. Рассмотрим его работу на конкретных примерах. Включением выключателя сети В1 автомат приводится в исходное положение готовности начать игру. Затем че- ловек, играющий с автоматом, с помощью кнопок Кн1 и Кн2 приводит в действие электродвигатели Ml и М2 ге- нераторов случайных чисел; в результате этого диско- вый коммутатор ДК1 подготавливает к включению од- ну из лампочек Л1—Л6, а дисковый коммутатор ДД2 — одну из лампочек Л7—Л12. 'Лампы включены через дис- ковые коммутаторы последовательно с обмотками I и II 60
поляризованных реле К Pl и КР2. Параллельно с каж- дой лампой (кроме ламп Л1 и Л7) включен резистор. Сопротивления резисторов подобраны таким образом, что большее число случайного выбора соответствует большему суммарному току, проходящему через соответ- ствующую лампу и параллельный ей резистор. По- Рис. 36. Принципиальная схема автомата, играющего в «кости». скольку в автомате применены лампы накаливания ЛН 3,5 ЕХ0,28 А, то через лампы Л1 и Л7 проходит ток 0,28 А. Суммарный ток, протекающий через лампу Л2 и резистор R1, следует установить 0,34 А; через ЛЗ и R2 — 0,40 А; через Л4 и R3 — 0,46 А; через Л5 и R4 — 0,52 А; через Л6 и R5 — 0,58 А. Такие же токи устанав- ливаются и для ламп и резисторов Л8—Л12 и R6—R10. Рассчитаем сопротивление резистора R1. Суммарный ток через лампу Л2 и резистор R1 установили равным 6—788 81
0,34 А. Через лампу проходит ток 0,28 А (согласно пас- портным данным). Значит, через резистор должен про- ходить ток 0,34—0,28=0,06 А. Напряжение питания рав- но 3,5 В. Отсюда в соответствии с законом Ома нахо- дим В1=3,5/0,06=58 Ом. Предоставляем читателю выполнить подобные рас- четы номиналов других резисторов. Допустим, что в генераторах случайных чисел для человека «выпала» цифра 1 (коммутатор ДК1 подклю- чил лампочку Л1), а для автомата — цифра 3 (комму- татор ДК2 подключил лампочку Л9). Для подведения итогов партии нужно нажать кнопку КнЗ (Результат). При этом срабатывает реле Р4. Оно самоблокируется контактами Р4.1, контактами Р4.2 подготавливает к включению реле РЗ, а контактами Р4.3 замыкает цепь питания ламп. Зажигаются лампы Л1 и Л9, подсвечи- вая табло 1 на пульте человека и табло 3 на пульте ав- томата. Одновременно срабатывает реле КР2, контакты которого 1\Р2.1 переключаются. После отпускания кноп- ки КнЗ срабатывает реле РЗ (контакты Р4.2 замкнуты) и самоблокируется контактами Р3.1. Контакты Р3.2 за- мыкают цепь питания лампы Л14, которая подсвечивает табло Выиграл на пульте автомата. Рассмотрим теперь, каким образом в автомате срав- ниваются два числа и определяется, какое из них больше. Сравнение чисел осуществляют поляризованные ре- ле КР1 и КР2, каждое из которых имеет по три обмотки. Обмотки / и II каждого реле присоединены к цепи с лампами и к источнику постоянного тока — выпрямите- лю на диодах Д5—Д8, а обмотки III питаются от неза- висимого источника тока на диодах Д1—Д4. Направле- ние перебрасывания якоря реле зависит от полярности напряжения на обмотках: «+» на начале обмотки и «—» на конце ее вызывают замыкание якоря с правым кон- тактом. На схеме начала обмоток обозначены буквой Н. Токи через обмотки I и II поляризованных реле проте- кают следующим образом: «+» источника тока, начало обмотки I реле КР1, контакты «щетка-диск» коммутато- тора ДК2, лампа Л9 и резистор R7, «—» источника пи- тания; «+» источника питания, конец обмотки II реле КР1, контакты «щетка-диск» коммутатора ДК1, лампа Л1, «.—» источника питания; «+» источника питания, конец обмотки I реле КР2, контакты «щетка-диск» ком- 82
мутатора ДК2, лампа Л9 и резистор R7, «—» источника тока; «+» источника тока, начало обмотки II реле КР2, контакты «щетка-диск» коммутатора ДК1, лампа JII, «—» источника тока. Направления токов в обмотках I и II поляризован- ных реле противоположны, и создаваемые этими токами магнитные потоки будут направлены навстречу дру-г другу. Ток, который проходит через лампу Л9 и резис- тор R7 (0,40 А), больше тока, протекающего через лам- пу Л1 (0,28 А). Соответственно больше будет и создан- ный им магнитный поток. Следовательно, якорь реле ДР1 останется замкнутым с правым контактом (боль- ший ток проходит через обмотку I, «+» подключен к началу), а якорь реле КР2 замкнется с левым контак- том (больший ток проходит через обмотку I, но к нача- лу обмотки подключен «—»). Таким образом, как было уже'отмечено выше, включается лампа Л14, подсвечи- вая табло Выиграл на пульте автомата. Теперь рассмотрим, как автомат фиксирует ничью — ведь в этом случае токи в обмотках I и II реле КР1 и КР2 будут одинаковы. Здесь в действие вступают об- мотки III обоих реле. На обе обмотки, соединенные па- раллельно, подается напряжение от отдельного источни- ка питания. К началу обмоток III подключен «+» ис- точника питания. Ток, протекающий через обмотки, равен 0,03 А (меньше, чем разность двух токов, соответст- вующих двум последовательным числам выбора). По- этому в случае равенства чисел, выпавших у человека и у автомата, противоположно направленные магнитные потоки, создаваемые обмотками I и II, взаимно компен- сируются. Магнитные потоки, создаваемые токами в об- мотках III обоих реле, удержат якори этих реле у правых контактов. Следовательно, при нажатии и отпуска- нии кнопки КнЗ (Результат) срабатывает реле РЗ и кон- такты Р3.2 включают питание лампы Л13, которая под- свечивает табло Ничья. Чтобы начать новую партию иг- ры, необходимо на короткое время выключить и затем снова включить выключатель сети В1. , Настройка автомата сводится к подбору резисторов для обеспечения указанных суммарных токов, а также к подбору тока (резистором PH), протекающего через обмотки /// реле КР1 и КР2. В автомате применены: Ml и М2 — двигатели ДСД-60; КР1 и К.Р2 — реле РПС-7 (паспорт 6* 83
РС4.521.354Сп); РЗ — реле РЭС-9 (паспорт РС4.524.201); Р4 —реле РЭС-22 (паспорт РФ4.500.131); Кн1 и К.н.2— кнопки типа К1; КнЗ — кнопка (паспорт ПАЗ.604.019); сердечник трансформатора Тр набран из пластин Ш32, толщина пакета 20 мм (обмотка / состоит из 1220 вит- ков провода ПЭЛ-0,51; обмотка II — 20 витков провода ПЭЛ-51; обмотка III — 49 витков ПЭЛ-0,51; обмотка IV—150 витков ПЭЛ-31); диоды типа Д226Б; выклю- чатель В4 — однополюсный тумблер. Попытай счастья В последние годы во многих странах Запада в гости- ничных холлах, барах и кафе, в проходах и нишах уни- версальных магазинов и других общественных местах стали появляться сверкающие никелем и сталью хитро- умные играющие автоматы. Настойчиво обращая на се- бя внимание посетителей, они выставляют вперед ры- чаги управления. Истинная опасность «одноруких грабителей» — так прозвали играющие автоматы — в их притягательной си- ле. Каждый из них сулит посетителю бара или магазина заманчивый и, казалось бы, верный и легкий денежный выигрыш, довольствуясь взамен лишь мелкой монетой в пять центов. Ну как здесь устоять против соблазна! Брось монетку в щель и дерни за рычаг — тотчас с характерным гудением завертятся под стеклом малень- кие диски, на которых изображены, например, яблоки, вишни, сливы, колокольчики и т. п. Если после останов- ки Дисков в единый желанный ряд выстроятся пять ко- локольчиков и пять яблок или, на худой конец, три ко- локольчика и два яблока, то из широкого раструба в нижней части автомата, как из рога изобилия, в под- ставленную ладонь, посыплются монеты. За 10 центов можно получить десять, двадцать, а если очень повезет, то даже сто монет. Есть и такие автоматы, где за пятак можно выиграть пять тысяч долларов! Для такой удачи нужно, чтобы под стеклом диски составили особенно ред- кую комбинацию фигурок. И тут же вспыхнет чарую- щим светом красная лампочка, зазвенит звонок, и подбе- жавшая девушка-кассирша выпишет счастливчику чек на пять тысяч. Но — увы! —обычно колокольчики, яблоки, вишни и сливы располагаются в живописном беспорядке, и игро- 84
кам, рискнувшим попытать счастья, остается лишь про- ститься грустным взглядом со своими центами. Удив- ляться здесь нечему. Конструкторы «одноруких грабите- лей» создают свои детища в строгом соответствии с рекомендациями теории игр, и их владельцы уверены в барыше: любая из азартных игр, сыграть в которую на- стойчиво Приглашают обывателя такие автоматы, по от- ношению к нему несправедлива. Обещая иллюзорный выигрыш каждому, «однорукий грабитель» готов вы- удить из кармана доверчивого партнера последние ме- дяки. Наряду с «однорукими грабителями» той же цели — выудить у обывателя его карманные центы, пфеннинги, франки — служат всевозможные игровые аттракционы, представляющие собой при ближайшем рассмотрении такие же несправедливые азартные игры. Вот один из подобных весьма распространенных за рубежом игро- вых аттракционов под названием «Попытай счастья». Он состоит из трех больших игральных костей, которые нуж- но скатывать по наклонной плоскости на' расположен- ную внизу горизонтальную поверхность, и крупных бе- лых цифр от 1 до 6, нарисованных на специальном щите. Играющий автомат может поставить на любую из цифр любую сумму денег. Затем он бросает кости. Если вы- бранное им число выпадет на одной из костей, он полу- чает обратно свою ставку плюс равную ей сумму денег. Если число, на которое он поставил, выпадет на двух костях, ему возвращают его ставку плюс удвоенную сум- му денег. Если же это число выпадет на всех .трех кос- тях, то он получит свою ставку и сверх нее утроенную сумму денег. Разумеется, если цифра, на которую он по- ставил, не выпадет ни на одной из костей, ставка счита- ется проигранной. Аттракцион выглядит весьма заманчивым, не прав- да ли? Попробуем, однако, вычислить, сколько можно выиг- рать на каждый поставленный доллар при достаточно длительной игре, состоящей из многих партий. Нетрудно убедиться, что три кости могут выпасть всего 216 равновероятными способами и в 91 случае иг- рок выигрывает. Поэтому вероятность выигрыша для не- го на каждой ставке равна 91/216. Предположим, что он бросает кости 216 раз, ставя каждый раз по одному дол- лару, и что его кости каждый раз выпадают по-разному. 85
Тогда в 75 выигрышных для него случаях выбранное иг- роком число выпадет лишь на одной из костей и, следо- вательно, игрок получит 150 долларов. В 15 случаях это число выпадет на двух костях сразу, и он получил 45 дол- ларов. Наконец, в одном случае заветное число выпадет сразу на трех костях, и игрок получит 4 доллара. Общая сумма, выплаченная ему, составит 199 долларов. Чтобы полечить е^, он поставит 216 долларов. Следовательно, при достаточно большом числе сыгранных партий он мо- жет надеяться получить взамен на каждый поставлен- ный доллар всего = 0,9212 доллара. Это значит, что владелец аттракциона на каждом по- ставленном игроком долларе получает барыш в 0,0788 доллара. Таким образом, математическое ожидание выигрыша в одной партии для игрока составляет —0,0788 доллара. Такую сумму в среднем будет проигрывать в каждой партии игрок, бросающий кости. Игра для него, очевид- но, несправедлива. Используя уже знакомые нам элементы и узлы элек- тротехнических и электронных устройств, можно постро- ить автомат, способный реализовать выявленные выше преимущества хозяина в его несправедливой азартной игре с посетителями аттракциона «Попытай счастья». Разумеется ставки, выигрыши и проигрыши в таком ав- томате будут учитываться только в очках: ведь этот ав- томат подобно заправскому «однорукому грабителю», лишь изредка станет щедро и в большом количестве «да- рить» победные очки тому или иному из своих партнеров; чаще же последние будут проигрывать свои ставки, так что при достаточно длинной серии партий счет всегда будет в пользу автомата Внешний вид играющего автомата «Попытай сча- стья» показан на рис. 37. На его лицевой панели нахо- дятся выключатель сети, табло Ставка и Выбор числа с относящимися к ним выключателями, три кнопки Ход, кнопка -Результат и световые табло Вы проиграли и Вы выиграли. Для подготовки автомата к игре включается сетевой выключатель Игра человека с автоматом происходит следующим образом Человек выбирает на табло Выбор 86
числа одно из шести чисел (1, 2.6) и включает соот- ветствующий выключатель — загорается лампочка, под- свечивающая это число. Затем на табло Ставка он включением одного из трех выключателей ставит на вы- бранное число одно, два или три очка (максимальная ставка в игре ограничена тремя очками). После этого человек поочередно нажимает каждую из трех кнопок Ход (как бы бросая три игральные кости). Последую- щее нажатие кнопки Результат вызывает подсвечивание Рис 37 Внешний вид автомата для азартной игры «Попытай счастья». числа выигранных или проигранных очков на табло Вы выиграли или Вы проиграли. Принципиальная схема автомата приведена на рис. 38 Рассмотрим работу машины на конкретном при- мере. Предположим, что человек выбрал число 5 (вклю- чил выключатель В5) и поставил на него 2 очка (вклю- чил выключатель В8). При этом контакты В5 2 включа- ют лампы Л17, которая на табло Выбор числа подсвечи- вает цифру 5; контакты В8.5 включают лампу ЛИ, под- свечивающую на табло Ставка цифру 2. После этого че- ловек нажимает первую кнопку Ход (Кн2). Цепь пита- ния электродвигателя Ml замыкается, и закрепленный на его валу диск коммутатора ДК1 начинает вращать- ся. Затем нажимается вторая (КнЗ) и третья (Кн4) кнопки, приводя в действие двигатели М2 и М3. В кон- 87
струкции автомата использованы генераторы случай- ных чисел с дисковыми коммутаторами ДК1, ДК2 и ДКЗ, подобными описанным ранее (см. рис. 35). Допустим, что после того, как человек нежа" все три кнопки, щетка, соединенная с выключателем В5 1 и Рис. 38. Принципиальная схема автомата для азартной игры «Попы- тай счастья», 88
скользящая по диску коммутатора ДК2, после останов- ки этого диска оказалась на полоске медной фольги. Бу- дем считать, что соответствующие щетки двух других дисков, соединенные с выключателем В5.1, оказались вне полосок медной фольги. При нажатии кнопки Кн1 (Результат) замыкается цепь питания реле Р6; оно срабатывает и самоблокиру- ется контактами Р6.1. Контакты Р6.3 подключают элек- тропитание к реле Р1—Р4 и Р7—Р9. При этом реле Р8 срабатывает (образована замкнутая цепь: «+» выпря- мителя, замкнутые контакты Р6.3, обмотка реле Р8, центральная щетка, медная фольга диска, щегка, соеди- ненная с выключателем В5.1, «—» выпрямителя). Кон- такты Р8.1 замыкаются, и реле Р1 срабатывает. При отпускании кнопки Кн1 реле Р5 срабатывает (контакты Р6.2 замкнуты) и самоблокируется контак- тами Р5.1. Контакты Р5.2 включают лампочку Л2, под- свечивающую цифру 2 на табло Вы выиграли (ток идет через замкнутые контакты Р1.1, замкнутые контакты В9.1 и переключенные контакты В8.1). Отметим, что вы- ключатели В7, В8 и В9 включаются в тех случаях, ког- да человек делает ставку соответственно в одно, два и три очка. Если бы человек сделал ставку в 3 очка (включил выключатель В9), то контакты В9.1 в рассматриваемом нами примере включили бы лампочку ЛЗ, подсвечива- ющую цифру 3 на табло Вы выиграли. Ставка в одно очко, сделанная человеком (включением выключателя В7), привела бы к включению лампы Л1, подсвечиваю- щей цифру 1. Такое подсвечивание лампами цифр 1, 2 или 3 на табло Вы выиграли имеет место в том слу- чае, если выбранное человеком число выпало лишь один раз (сработало одно реле — Р8, контакты Р8.1 которо- го включили реле РГ). Срабатывание реле Р1 происхо- дит, когда выбранное человеком число выпало один раз (цепь питания реле Р1 замыкается одним из контактов Р7.1, Р8.1 или Р9.1). Срабатывание реле Р2 происходит, когда выбранное число выпало два раза (цепь питания реле Р2 замыкается последовательным соединением пар контактов Р7.2 и Р9.1, Р8.2 и Р9.1, Р8.1 и Р7.2). Сраба- тывание реле РЗ происходит, когда выбранное число выпало три раза (цепь питания реле РЗ замыкается тре- мя последовательно соединенными контактами Р9.1, Р8.2, Р7.3), 89
Для того чтобы исключить возможность ложного сра- батывания реле Р1—РЗ (например, при выпадении вы- бранного числа два раза логическая цепочка контактов реле Р7—Р9 замыкает цепь питания не только реле Р2, но и Р1), в схеме предусмотрена блокировка. Сработав- шее реле Р2 своими контактами Р2.1 разрывает цепь питания реле Р1; сработавшее реле РЗ своими контак- тами Р3.1 отключает питание реле Р1 и Р2. В зависимости от того, сколько раз выпало выбран- ное число и какую ставку сделал человек, на табло Вы выиграли подсвечиваются цифры 1, 2, 3, 4, 6, 9 (при ставке'1 очко в логической цепочке, включающей пита- ние ламп Л1-*-Л6, нет изменений; при ставке 2 очка —- переключаются контакты В8.1—В8.3\ при ставке 3 оч- ка— переключаются контакты В9.1—В9.3). Например, если выбранное число выпало два раза (сработало реле Р2 и контакты Р2.2 замкнулись) и сделана ставка в 3 оч- ка (переключены контакты В9.2), то замкнется цепь пи- тания лампы Л5, подсвечивающей на табло Вы выигра- ли цифру 6 — количество выигранных очков. Если же выбранное число не выпадет ни разу (ни одно из реле Р7—Р9 не сработало), то сработает реле Р4 (контакты Р7.4, Р8.3, Р9.2 образуют замкнутую цепь), которое контактами Р4.1 включает цепь питания ламп Л7—Л9 на табло Вы проиграли, В зависимости от сделанной ставки загорится одна из ламп, указывая про- игрыш (1, 2 или 3 очка). Например, если ставка 1 очко (замкнуты контакты В7.1), то загорится лампа Л7, под- свечивающая цифру 1^ при ставке 2 очка (замкнуты контакты В8.4) загорится лампа Л8, подсвечивающая цифру 2; если ставка 3 очка (замкнуты контакты В9.4), то загорится лампа Л9, подсвечивающая цифру 3. Для того чтобы подготовить автомат к новой партии игры, необходимо выключателем В14 отключить пита- ние сети, установить в исходное положение те из выклю- чателей на табло Ставка и Выбор числа, которые были включены, и снова включить сетевое питание. В автомате применены: лампы ЛН 3,5 ВХ0,28 А; двигатели типа ДСД-60; Pl, Р9 — реле РЭС-9 (паспорт РС4.524.201)Р2 — Р8 — реле РЭС-22 (паспорт РФ4.500.131); Кн1 — кнопка (паспорт НАЗ.604.019); Кн2—Кн4—кнопки типа KI: В1 — В6—выключатели ТП2-1; В7 — В9 — телефонные ключи Типа КТРО с необ- ходимым числом контактных групп; сердечник трансфер- 90
матора набран из пластин Ш32, пакет 20 мм (обмотка I содержит 1220 витков провода ПЭЛ-0,51; обмотка //— 150 витков провода ПЭЛ-0,31; обмотка III — 20 витков провода ПЭЛ-0,51); Д1— Д7— диоды Д226Б (диоды Д1 — ДЗ включены в логическую цепь для того, чтобы исключить ненужные связи между цепями, подающими напряжение на реле Р1 — РЗ). В специальной отладке правильно собранный автомат не нуждается. Описанный играющий автомат можно дополнить блоком подсчета результатов игры, который учитывает Рис. 39. Схема блока подсчета результатов игры, число набранных игроками (человеком и автоматом) очков в серии партий. Принципиальная схема такого блока приведена на рис. 39. Блок подключается к точ- кам а и б выпрямителя (см. рис. 38). Он состоит из ге- нератора импульсов на транзисторе Т2, реле времени на транзисторе Т1 и счетчиков Сч1 и Сч2, суммирующих выигрыш (в очках) человека и автомата. Работает блок подсчета результатов игры следую- щим образом. Контакты реле РИД генератора импуль- сов, подключаемого на определенное время к источни- ку питания контактами Р10.1 реле времени, замыкают и размыкают цепи питания счетчиков Сч1 (Выигрыш че- ловека) или Сч2 (Выигрыш автомата) в зависимости от 91
положения контактов Р4.2. Выдержка реле времени, а следовательно, и число импульсов, поданных на счетчи- ки Сч1 или Сч2 контактами Р11.2, зависит от того, ка- кой из резисторов R1—R6 подключен логической цепоч- кой контактов реле Р1—Р4 и выключателей В7—В9. Рассмотрим работу блока во взятом нами ранее кон- кретном примере игры: человек сделал ставку в 2 очка (включил выключатель В8) на число 5 (включил выклю- чатель В5), и это число выпало один раз (сработало ре- ле Р1). Сработавшее после отпускания кнопки Кн1 {Ре- зультат) реле Р5 своими контактами Р5.3 подключает к базе транзистора Т1 отрицательно заряженную об- кладку конденсатора С2; транзистор Т1 открывается, и реле РЮ срабатывает. Конденсатор С2 начинает разря- жаться по двум параллельным цепям: резистор R7, эмит- терный переход транзистора Т1, резистор R8-, резистор R2, переключенные контакты В8.7, контакты В9.7, за- мкнутые контакты Р1.2. По мере разряда конденсатора токи в базовой и коллекторной цепях уменьшаются, и через некоторое время, определяемое резистором R2, ре- ле РЮ отключается. Отметим, что, как только реле РЮ сработает, его контакты Р10.1 подключают к источнику питания гене- ратор импульсов на транзисторе Т2. После заряда koh- денсатора СЗ открывается транзистор Т2, в результате чего срабатывает реле Р11 и его контакты Р11.2, замы- каясь, подключают счетчики Сч1 или Сч2 к источнику питания. В нашем примере напряжение будет подано на счетчик Сч1 (Выигрыш человека), и он отсчитает одно очко. После срабатывания реле PH его контакты Pi 1.1 размыкаютс,ч, и конденсатор СЗ начинает разряжаться. Через некоторое время напряжение на конденсаторе СЗ и коллекторный ток транзистора настолько уменьшатся, что реле PH отпустит якорь, контакты P1J.1 снова за- мкнутся, и весь цикл будет повторен. В данном приме- ре реле PH сработает и отпустит якорь два раза — счет- чик Сч1 зафиксирует два очка. Налаживание блока подсчета результатов игры сле- дует начинать с установки времени цикла срабатыва- ние— отключение реле PH. Подбирая резисторы R9— RH, добиваются, Чтобы время цикла равнялось ппибли- зительно 0,5—I с. Затем подбором резисторов R1—R6 устанавливают время выдержки реле РЮ. Сопротивле- ние резистора R1 должно быть таким, чтобы реле РЮ 92
оставалось включенным в течение одного цикла сраба- тывания реле Р11, сопротивление резистора R2— в те- чение двух циклов, резистора R3— трех циклов, резис- тора R4 — четырех циклов, резистора R5 — шести цик- лов, резистора R6 — девяти циклов. В блоке применены следующие детали: РЮ — реле РЭС-10 (паспорт РС4.524.305); Р11 — реле РЭС-9 (пас- порт РС4.524.201); Т1 и Т2— транзисторы МП39 и МП42 с коэффициентом /г21э не менее 50; Сч1 и Сч2 — электромагнитные счетчики СБ-IM/100 или СЭИ-1. Раз- мещаются они на лицеЬой панели автомата. Следует иметь в виду, что при использовании счетчиков типа СБ-1М/100 необходимо удалить у них тумблеры и уд- линить головки установки нуля (с помощью стержней, которые можно вывести на заднюю стенку автомата), ГЛАВА ЧЕТВЕРТАЯ КТО КОГО! Стратегические игры У американских школьников весьма популярна игра в «чет и нечет» (распространенная, впрочем, и во мно- гих других странах). Игра эта очень проста. Один из играющих зажимает в руке несколько мелких предметов (горошин, спичек, монет и т.п.), а другой должен отга- дать, четное у него число или нечетное. Отгадает — вы- играл, не отгадает — проиграл. Есть и более сложный вариант этой игры, называемый иногда игрой в «три пальца». В этом варианте игроки одновременно и неза- висимо друг от друга показывают один, два или три пальца; если общее число показанных пальцев оказы- вается четным, то второй игрок должен уплатить пер- вому определенную сумму (скажем, в долларах или центдх), в противном случае первый игрок платит вто- рому. При всей примитивности этих игр они в известном смысле гораздо более трудны для анализа, чем уже зна- комые нам азартные и комбинаторные. В азартной иг- ре, как мы уже отмечали, оба противника не могут сво- 93
ими действиями активно влиять на ее исход; в комбина- торной игре один из игроков также фактически лишен этой возможности (если другой пользуется выигрыва- ющим алгоритмом). В отличие от этого в игре «чет и не- чет» активно действуют, стремясь перехитрить друг дру- га, оба игрока. И каждый из них, делая свой выбор, не знает наверняка намерений противника. Именно это об- стоятельство и делает забаву американских школьников настоящей стратегической игрой. Как же следует вести себя игроку в подобных играх? С ответом на этот вопрос дело обстоит значительно сложнее, чем при анализе игр азартных или комбина- тррных. Ведь сам по себе выбор четного или нечетного числа не может считаться ни хорошим, ни плохим хо- дом. Как справедливо заметил один из основателей ки- бернетики Норберт Винер: «... эффективность оружия за- висит от того, какое имеется другое оружие, способное противостоять ему» [21]. В этом-то и заключается глав- ная трудность анализа стратегических игр. Не случайно, вероятно, в отличие от азартных и ком- бинаторных игр, корни математической разработки ко- торых уходят вглубь столетий, стратегические игры ста- ли изучаться математиками лишь сравнительно недав- но. Начало этому направлению в науке было положено работами Э. Бореля и Дж. фон Неймана еще в 20-х го- дах этого столетия, но особенно интенсивно оно начало разрабатываться после 1944 г., когда Дж. фон Нейман и’О. Моргенштерн опубликовали первое систематическое и фундаментальное исследование по теории стратегиче- ских игр — книгу «Теория игр и экономическое поведе- ние», в которой были сформулированы основные принципы научного анализа действий в конфликт- ных ситуациях. В наши дни, как уже отмечалось, тео- рия стратегических игр быстро и успешно развива- ется. Самым простым и вместе с тем наиболее хорошо изученным классом стратегических игр являются парные конечные игры с нулевой суммой. В таких играх интере- сы игроков прямо противоположны, выигрыш одного из них равен проигрышу другого. По'этому здесь можно рассматривать выигрыш только одного игрока, считая, что этот игрок стремится к достижению его максимума, тогда как второй игрок старается свести этот выигрыш к минимуму. Упомянутые выше развлечения американ- 94
ских школьников и являются примерами такйх парных конечных игр с нулевой суммой. Проанализируем подробнее одну из них, например игру в «три пальца!». Очевидно, что эта игра детерминированная (каждый из игроков, показывая пальцы, делает личный ход, слу- чайностей в игре нет). Ясно также, что она принадлежит к играм с неполной информацией (выбирая свой ход, игрок не знает, какой ход сделает противник). Игрок А может выбрать один из трех вариантов хо- да, или, как говорят, у него три стратегии: Hi — пока- зать один палец; А2— два пальца; А3— три пальца. У игрока В тоже имеются три аналогичные страте- гии: Bi, В2 и В3. Так как у каждого игрока — по три стратегии, то та- кую игру называют игрой 3X3. Все возможные резуль- таты игры для различных стратегий, выбранных игро- ками А и В, а также соответствующие выигрыши игро- ка А удобно представить в виде табл. 4 («матрица игры» или «платежная матрица»). { Таблица 4 А В Bi Вг в3 2 —3 4 Аа —3 4 —5 А3 4 —5 6 Здесь на пересечении каждой пары стратегий игро- ков А и В записан выигрыш, который игрок В платит игроку А в результате игры (конечно, если выигрыш от- рицателен, то на самом деле игрок А платит игроку В), Например, если игрок А воспользуется стратегией А3 (покажет три пальца), а игрок В изберет стратегию В2 (покажет два пальца), то в результате общее число по- казанных пальцев будет нечетным и равным 5. В табл. 4 число —5 на пересечении третьей строки и второго столб- ца указывает, что в этом случае выигрыш игрока А со- ставит —5 центов, т. е. он проиграет игроку В 5 центов. Игрокам известны все возможные исходы игры. Ка- кую же стратегию наиболее целесообразно избрать каж- дому из них? 95
Нетрудно сообразить,’ что на любую из стратегий, выбранных игроком А, его противник может ответить худшим для А образом. Так, например, для игрока А весьма соблазнительно воспользоваться стратегией А3, которая сулит ему выигрыш 6 или по крайней мере 4 цента (в случаях применения игроком В стратегий В3 или Вг соответственно). Но если при этом игрок В избе- рет стратегию В2, то для игрока А дело обернется круп- ным проигрышем в 5 центов. Аналогично, выбирая стра- тегию Аг или А2, игрок А также не может быть уверен в выигрыше. Разумеется, в таком же затруднительном положении находится игрок В, который не знает, как сыграет А. В «умной» и осторожной игре без горячности, аван- тюризма и риска каждый из игроков не столько стре- мится к выигрышу, сколько к тому чтобы уберечься от проигрыша. Практический же опыт учит нас, что наибо- лее ощутимый проигрыш доставляет недооценка сил и умений противника. Поэтому каждому из игроков сле- дует исходить из предположения, что его противник из- берет наилучшую для себя стратегию. В соответствии с этим он должен выбрать свою стратегию так, чтобы наи- лучшая стратегия противника дала противнику наи- меньший выигрыш. Следовательно, для игрока А наибо- лее «безопасной» стратегией будет такая, у которой минимальный выигрыш является наибольшим по срав- нению с минимальными выигрышами всех других его стратегий. Для стратегии Ai наименьшее значение выигрыша равно —3, для стратегии А2 оно равно —5, для стратегии А3 также —5. Максимальным из всех этих минимальных значений является число —3, которому соответствует стратегия Ai. Эта стратегия называется максиминной (от слов «максимум из минимумов»), а соответствующий ей выигрыш (в данном случае число —3) носит назва- ние нижней цены игры. Очевидно, нижняя цена игры — это тот гарантированный наименьший выигрыш, который может обеспечить себе игрок А, если он будет придерживаться наиболее осторожной, «перестраховоч- ной максиминной стратегии А} (в нашем примере мак- симинная стратегия гарантирует ему проигрыш не бо- лее 3 центов). По совершенно аналогичным • соображениям игрок В в расчете на умелое поведение игрока А должен от- 96
дать предпочтение той своей стратегии, у которой мак- симальный выигрыш противника будет наименьшим из максимальных выигрышей всех его стратегий. Для стра- тегии Bi наибольшее значение выигрыша равно 4, для стратегии В2 также равно 4, а для стратегии В3 равно 6. Минимальный из этих максимумов равен 4 — это верх- няя цена и г р ы, ей соответствуют две минимакс- ные стратегии Вг и В2. Применяя любую из этих страте- гий игрок В гарантирован, что проиграет не более 4 центов. Но стратегия В2 все же предпочтительнее, так как здесь игрок В имеет возможность выиграть 5 центов, тогда как, применяя стратегию он можег выиграть только 3 цента. Принцип осторожности, предписывающий игрокам выбор максиминной и минимаксной стратегий, называ- ют «принципом минимакса». Отступая от этого принципа в надежде на более крупный выигрыш, каж- дый из игроков идет на риск, связанный с возможностью более крупного проигрыша. Из всего сказанного не следует, однако, что при мно- гократном повторении этой игры наиболее безопасно для каждого из игроков все время придерживаться одной и той же максиминной (или минимаксной) стратегии. В самом деле, допустим, что игрок А до абсурда «сверх- осторожный» человек, и неуклонно придерживается во всех партиях игры своей максиминной стратегии At (т. е. всегда показывает один палец). Тогда уже по результа- там первых нескольких партий его противник догада- ется об этом и в дальнейшем будет неизменно отвечать выбором стратегии В2 (т. е. всегда показывать два паль- ца), обрекая игрока А на постоянный (хотя и не самый крупный) проигрыш. Мы видим, таким образом, что в подобных играх большое значение имеет фактор «разведки» — получе- ние каждым игроком информации, на основании кото- рой он мог бы «прогнозировать» стратегии, выбираемые противником. Чтобы затруднить противнику получение такой информации, нужно, очевидно, время от времени (от партии к партии) менять свою стратегию. Как это следует делать, увидим позднее, а пока обратим внима- ние на то, что в этой игре оба игрока, отклоняясь от своих максиминной и минимаксной стратегий, должны скрывать свои намерения друг ют друга, лишь при этом условии каждый из них может уберечь себя от проигрыша. 97
Но есть и такие игры, в которых осторожному игро- ку незачем отклоняться от максиминной (минимаксной) стратегии даже при многократном повторении игры и нет надобности скрывать это от своего противника (он может играть «в открытую»). Речь идет об играх, у ко- торых значения верхней и нижней цен игры совпадают. В таких случаях это общее значение минимакса и мак- симина (его называют чистой ценой игры или просто ценой иг р ы) является наименьшим в твоей строке матрицы и наибольшим в своем столбце, а об игре го- ворят, что ее матрица имеет седловую точку (это название объясняется тем, что подобная точка есть на поверхности седла: она занимает наивысшее положение при поперечном его сечении и наинизшее—при продоль- ном разрезе). Седловая точка лежит на пересечении минимаксной и максиминной стратегий. Эти стратегии являются оп- тимальными для обоих игроков. Если один из них решил придерживаться своей оптимальной стратегии, то для другого отклонение от своей оптимальной стратегии не- целесообразно, ибо в лучшем случае при этом его вы- игрыш останется неизменным, а в худшем — уменьшит- ся. При этом наличие у любого из игроков информации о том, что его противник избрал свою оптимальную стратегию, не может изменить поведение этого игрока: если только последний не хочет действовать против сво- их же интересов, он и сам вынужден будет придержи- ваться своей оптимальной стратегии. Игры, имеющие в матрице седловую точку, встреча- ются на практике, хотя и не очень часто. Между про- чим, в теории доказывается, что седловую точку имеет всякая игра с полной информацией. Значение чистой цены игры позволяет судить о том, справедлива ли эта игра по отношению к ее участникам. Очевидно, для справедливости игры нужно, чтобы чистая цена игры была равна нулю (это значит, что пара опти- мальных стратегий ведет к ничьей). Если же чистая цена игры не равна нулю, то по отношению к одному из партнеров эта игра несправедлива: даже если он будет выбирать свою оптимальную стратегию, его по- теря в каждой партии будет не меньше цены игры. Приведем примеры конфликтных ситуаций, которые могут быть представлены как стратегические парные ко- 98
нечные игры с нулевой суммой, имеющие в матрице сед- ловую точку. Битва в Ново-Гвинейском море. Это один из эпизо- дов второй мировой войны [1,23], разыгравшийся в кри- тические дни боев американцев с японцами за Новую Гвинею. Американская разведка получила тогда сведе- ния о том, что японцы собираются послать караван су- дов с войсками и провиантом из порта Рабаул на вос- точной оконечности Новой Британии в порт Лаэ, распо- ложенный в Новой Гвинее к западу от Новой Британии (рис. 40). Перед американской авиацией была постав- лена задача — обнаружить в море и разбомбить япон- ский караван. Корабли японцев могли пройти к Новой Гвинее либо с севера от Новой Британии, где метеорологи предска- зывали пасмурную погоду и плохую видимость, либо обогнув этот остров с юга, где ожидалась ясная погода. 7* 99
Плавание в обоих случаях должно было занять около трех дней, поэтому для американцев было очень важно возможно быстрее обнаружить суда противника в море, чтобы потом бомбить их до самого прибытия в Лаэ,- Для быстрейшего обнаружения японского каравана ге- нерал Кенией, командовавший американской авиацией, должен был сосредоточить основную часть своих само- летов-разведчиков либо на южном, либо на северном пу- ти. Таким образом, у американцев могло быть два ре- шения: Ai — сосредоточить самолеты-разведчики на юж- ном пути; А2 — сосредоточить самолеты-разведчики на северном пути. У японцев также могло быть два решения: Hi — от- править караван судов южным путем; Я2— отправить караван судов северным путем. Результаты использования противниками различных решений штаб Кеннея оценил следующим образом. Ai—Hi. Самолеты американцев благодаря ясной по- годе в первый же день обнаруживают японский караван и могут бомбить его на протяжении трех дней. Ai—Я2. После напрасных поисков каравана на юж- ном пути в течение первого дня самолеты-разведчики пе- ребрасываются на север, где из-за тумана и плохой ви- димости жатрачивают на поиски и обнаружение врага еще один день; на бомбардировку японских судов оста- ется только один день. Д2—Я\. Затратив первый день на тщетные поиски японцев на северном пути и не найдя их там, самолеты- разведчики на следующий день направляются на юг и сразу же (ясная погода!) обнаруживают японские суда; на бомбардировку врага остается два дня. А2—Я1. Самолеты-разведчики затрачивают целый день на поиски и обнаружение вражеских кораблей на северном пути (из-за пасмурной погоды и плохой види- мости); бомбежка может продолжаться в течение двух дней. На основании приведенных оценок можно составить матрицу (табл. 5) этой игры 2\2, в которой исходы для различных выборов игроков даны в днях бомбардиро- вочного времени. Выпишем теперь справа каждой строки матрицы зна- чение наименьшего элемента этой строки и отметим звездочкой наибольшее из этих чисел — максимин. За- тем выпишем снизу каждого столбца наибольший эле- 100
Таблица 5 Американцы Японцы Я1 Яг Л 3 1 А. 2 2 мент этого столбца и отметим звездочкой наименьшее из этих чисел — минимакс (табл. 6). Таблица 6 Американцы Японцы я, Яг А, 3 1 А. 2 2 3 2* Мы видим, что минимакс и максимин совпадают. Следовательно, игра имеет седловую точку, лежащую на пересечении стратегий А2 и Яг. Чистая цена игры равна двум дням бомбардировочного времени. . Стратегии А2 и Яг действительно были выбраны со- ответственно американским и японским командованием. Японские корабли были обнаружены разведывательной авиацией американцев на следующий день после их вы- хода в море и в результате двухдневных бомбардировок понесли тяжелые потери. Однако нельзя считать, что японское командование приняло ошибочное решение, на- правив караван судов по северному пути: в сложившей- ся обстановке выбор японцами южного пути мог привес- ти к еще большим потерям. Предотвращение угона автомобилей. Угон автомоби- лей, к сожалению, иногда имеет место, являясь нередко причиной и более серьезных правонарушений. Для пре- дотвращения угона на одном автозаводе принято реше- ние устанавливать в автомобилях устройство, препятст- вующее запуску двигателя посторонними лицами. Уст- ройство это должно имитировать неисправность в одном 101
из звеньев системы запуска. Цель установки можно счи- тать достигнутой, если злоумышленник в течение опре- деленного времени не сможет запустить двигатель. В конструкторском бюро завода были созданы три различных устройства, которые блокируют соответствен- но подачу топлива, зажигание и стартер. Какое из этих устройств пустить в серийное производство? Для решения этого вопроса проведены испытания: «посторонним» лицам предлагалось за кратчайшее вре- мя запустить любыми способами двигатель автомаши- ны, оборудованный одним из устройств. «Злоумышлен- ник», обнаружив наличие «неисправности», стремился устранить ее. При этом оказалось, что время, затрачи- ваемое на запуск двигателя, зависит только от того, ка- кое из звеньев системы запуска (систему подачи топли- ва, систему зажигания или стартер) «злоумышленник» проверял в первую очередь. Таким образом, налицо конфликтная ситуация: кон- структор— игрок К — стремится устранить возможность запуска двигателя посторонними лицами; злоумышлен- ник— игрок 3 — преследует прямо противоположные цели. Стратегии игрока К: Ki — установить устройство, имитирующее неисправность системы подачи топлива; К.2 — установить устройство, имитирующее неисправ- ность системы зажигания; К3 — установить устройство, имитирующее неисправность стартера. Стратегии игрока 3:31— прежде всего искать неис- правность в системе подачи топлива; 32 — начинать с по- иска неисправности в системе зажигания; З3 — первой искать неисправность в стартере. В результате проведенных на заводе испытаний для каждой пары стратегий определен процент неудачных попыток запуска двигателя. Этот показатель удобен для оценки исходов игры: игрок К стремится сделать про- цент неудачных попыток запуска наибольшим (максими- зировать его), а игрок 3 старается сделать этот про- цент наименьшим (минимизировать его, или, что то же самое, максимизировать процент удачных попыток). За- писывая для каждой пары стратегий процент неудачных попыток запуска двигателя (по данным заводских ис- пытаний), составим матрицу игры (табл. 7). Находим максимин и минимакс (они, как и в преды- дущем примере, обозначены звездочками). Их равенст- 102
Таблица 7 к 31 3 32 Зз Кг 85 88 97 85 Кг 92 90 95 90* К3 99 85 84 84 99 90* 97 во определяет чистую цепу игры — 90% неудач при попытках запуска двигателя посторонними лицами. Сед- ловая точка лежит на пересечении оптимальных страте- гий Л'2 и 32. Игрок К может быть уверен, что, применяя стратегию К2, он обеспечит 90% неудач игрока 3; по- следний, в свою очередь, выбирая стратегию 32, не поз- воляет противнику сделать этот процент более высо- ким. Итак, разрешение конфликта — в рекомендации ус- танавливать на автомашины устройство, блокирующее систему зажигания: это гарантирует неудачу при попыт- ках угона в девяти случаях из десяти. Установка других блокирующих устройств такой гарантии не дает. В приведенных примерах матрицы игр имеют седло- вую точку; это позволило определить пары оптимальных стратегий для участников игры. Однако, как мы уже от- мечали, для многих игр матрица не имеет седловой точ- ки. Например, седловой точки нет в матрице проанали- зированной нами выше игры в «три пальца»: в этой игре минимакс (4) и максимин (—3) неодинаковы. Нет сед- ловой точки и в простейшем варианте игры в «чет и не- чет». Убедимся в этом. У каждого игрока здесь по две стратегии: Ai— зажать в руке четное число спичек; А2 — зажать в руке нечетное число спичек; В,—назвать «чет»; Ё2 — назвать «нечет». Если выигрыш игрока А оценить как 1, а проигрыш его — как —1, то матрица игры будет иметь следующий вид, представленный табл. 8. В этой игре 2X2 любая стратегия игрока А являет- ся его максиминной, а любая стратегия игрока В — его 103
Таблица 8 А д в2 Л2 1 —1 1 1 минимаксной стратегией. Но минимакс ( + 1) и макси- мин (—1) не равны, так что седловой точки нет. Какое же поведение игроков будет здесь наилучшим, оптимальным? Мы уже отмечали, что в подобных случаях при мно- гократном проведении игры игроку нужно чередовать выбор стратегий от партии к партии. Но как это сделать? Может быть, игроку А следует менять свои страте- гии по очереди: в первой партии взять «чет», во вто- рой-— «нечет», в третьей партии — снова «чет» и т. д.? Вряд ли это целесообразно. Ведь если игрок В доста- точно наблюдателен и сообразителен, то он быстро раз- гадает маневр противника и начнет систематически вы- игрывать! К аналогичному выводу мы придем, если предполо- жим, что игроку А следует чередовать свои стратегии каким-либо более сложным, но закономерным способом. Рано или поздно эту закономерность противник обнару- жит. Следовательно, игроку А нужно так чередовать свои стратегии, чтобы результаты предыдущих партий игры не давали противнику никакой информации о по- ведении игрока А в последующих партиях. Для этого, очевидно, ему нужно чередовать свои стратегии случай- ным образом или, как говорят в теории игр, использо- вать смешанную стратегию (отдельные стратегии Ai и А2 называются в этом случае чистыми стратегиями). Очевидно, аналогичным образом должен вести себя и игрок В. Возникает вопрос: в какой пропорции лучше всего здесь «смешивать» игрокам свои чистые стратегии при многократном повторении игры? Какую из чистых стра- тегий применять чаще, какую — реже? Для стратегических игр 2X2 теория дает сравни- тельно простой ответ на этот вопрос. 104
В общем виде матрицу игры 2X2 можно представить в виде табл. 9. Здесь буквами ац, а2ь «ц’, а22 обозначены выигрыши игрока А при различных исходах игры. Оказывается, что оптимальным будет такое поведение игроков А и В, Таблица 9 А В вг «11 «12 4г «21 °22 при котором они используют свои чистые стратегии с ве- роятностями [5], равными р (А.) = —---------7 ; <£ц Т О 22 ^12 " Р (А,) = Р2 ~ ; Оц а12 а21 Р (К \ п — “12 г — 41 । ац + Й22 — аи— «21 P(B^q2------------------------ Я11 T а22 «12 «21 В теории доказывается 'также, что при использова- нии игроками своих смешанных стратегий средняя цена игры будет равна математическому ожиданию выигрыша (проигрыша) игрока А, которое вычисляется по формуле /И ₽ «иРх?! + «Х2Й72 + a^P-Ph + а22Рг$2' Попробуем, например, применить эти формулы для определения оптимальных смешанных стратегий игроков и средней цены игры в игре 2X2 <Лет и нечет», В этой игре аи ~ 1» °12 ~ 1 > 4^21 ““ ”” 1 , 4^22 1 , Вычисляя вероятности использования игроком А сво- их чистых стратегий, получаем: Р(Лх) = 1/2; Р(А2)= 1/2. 8—788 105
Аналогично найдем для игрока В: Р(В1) = 1/2-, Р(В£ = 1/2, Средняя цена игры Л1=0. Следовательно, оптимальная смешанная стратегия для каждого из игроков здесь состоит в том, чтобы слу- чайным образом чередовать свои чистые стратегии, поль- зуясь каждой из них одинаково часто (с вероятностью 1/2). Для этого, например, игрок В может перед каж- дой партией игры бросать монету, и если выпадет герб, говорить «чет», а если выпадет решка — называть «не- чет». Аналогично может поступать и игрок А. При этом средний выигрыш, приходящийся на одну партию, будет равен нулю, что свидетельствует о справедливости игры. Конечно, полученный нами вывод интуитивно был до- статочно ясен заранее, так как оба игрока в игре «чет и нечет» находятся в равных условиях. Рассмотрим те- перь примеры более сложных игровых задач этого типа, где решения не являются столь очевидными. Военный эпизод. Во многих игровых задачах военно- го содержания, встречающихся в исследованиях по тео- рии стратегических игр, фигурирует анекдотический пер- сонаж — полковник Блотто. Этот доблестный военачаль- ник организует оборону и наступление, штурмует крепости и горные перевалы, отражает атаки превосходя- щих сил противника и неизменно добивается успеха, следуя рекомендациям теории игр. Рассмотрим и мы в виде примера случай из богатой военной практики пол- ковника Блотто [5, 18, 20]. Полковник Блотто отправляет для бомбардировки военного объекта противника два самолета: один из них несет бомбы, а другой имеет задачу прикрыть бомбар- дировщик-носитель от противника. Самолеты летят в та- ком строю, что летящий первым находится под более эффективной защитбй пушек второго бомбардировщика, чем второй — под защитой первого. У полковника Блот- то есть опасение, как бы носитель бомб не был сбит истребителями противника, которые могут напасть по пути на один из самолетов. Проблема, стоящая перед полковником Блотто, за- ключается в следующем: кому лететь первым — бомбар- дировщику-носителю или самолету, выполняющему вспо- могательную задачу? 106
Б п Z7i 80 100 100 60 Здесь у полковника Блотто возможны две стратегии: Б[ — приказать носителю бомб лететь впереди; Б2— приказать носителю бомб лететь позади. У противника тдкже две стратегии: II-t— истребите- лям атаковать первый самолет; П2— истребителям ата- ковать второй самолет. Военной практикой установлено, что носитель бомб имеет 80 шансов из 100 выжить, если он атакуется ис- требителями в более выгодном положении (т. е. когда летит впереди); 60 из 100, если его атакуют в менее вы- годном положении (т. е. когда он летит вторым), и 100 шансов из 100, если истребители вообще на него не на- падают. Эта ситуация может быть представлена матри- цей (табл. 10). - Таблица 10 Здесь выигрыш пол- ковника Блотто равен чис- лу шансов выжить (и, сле- довательно, выполнить свою задачу) бомбарди- ровщику, несущему бом- бы. Платежная матрица не имеет седловой точки, ___________________________ поэтому полковнику Блотто нужно пользоваться смешан- ной стратегией. Подставляя значения шансов на выживание аи=80, а12=а21 = ЮО, а22=60 в формулу для определения оп- тимальных вероятностей применения игроками своих чистых стратегий, находим: Р (Б1) =------60 ~ 100---= — ; Р (Б2) = — ; v ' 80 + 60— 100— 100 3 2 3 ;>№) = А; Р(772) = А. 3 3 Как мы видим, оптимальная смешанная стратегия полковника Блотто состоит в том, что при каждом вы- лете бомбардировщик-носитель с вероятностью 2/3 дол- жен лететь первым и с вероятностью 1/3 лететь вторым. В этом случае средняя цена игры: 9 9 19 19 М = 80- ------- + 100- ----- + 100- А . + 3 3 3 3 3 3 + 60. А ._Ь = 8бА, зз з т. е. шансы бомбардировщика-носителя выж'ить при 8* 107
встрече с истребителями противника (и значит, шансы 4 2 полковника Блотто на успех операции) равны 86— из 100. Свою смешанную стратегию полковник Блотто мо- жет осуществить, например, так. Перед вылетом он пред- лагает командиру бомбардировщика-носителя тянуть одну из трех спичек, среди которых имеется сломанная. Если тот вытащит целую спичку, то он летит первым, а если вытащит сломанную, то летит вторым. Что же касается противника, то для него оптималь- ная смешанная стратегия состоит в том, чтобы в каждом воздушном бою против бомбардировщиков с вероятно- стью 2/3 атаковать первый самолет и с вероятностью 1/3 второй. При этом шансы полковника Блотто на успех 2 операции будут не больше чем 86—из 100. Заметим, что если бы полковник Блотто стал при- менять только свою чистую стратегию Б\ (всегда посы- лая-бомбардировщик-носитель впереди), что, на первый взгляд, кажется наиболее естественным, то противник, применяя свою чистую стратегию ГЦ (т. е. атакуя всег- да первый самолет), снизил бы шансы полковника Блотто па успех операции до 80%. Таким образом, при- менение смешанной стратегии повышает шансы полков- ника Блотто. Игра «Веришь — не веришь» [5]. Мы рассмотрим упрощенный вариант этой карточной игры. Имеются две карты: туз и двойка. Игрок А берет наугад одну из них. Игрок В не видит, какую карту взял А. Если А взял ту- за, он заявляет «У меня туз» и требует у противника 1 руб. Если же А взял двойку, то он может либо ска- зать, что у него туз, и потребовать у противника 1 руб., либо признаться, что у него двойка, и уплатить против- нику 1 руб. Игрок В, если ему добровольно платят рубль, может только принять его. Если же у него потребуют рубль, то он может либо поверить игроку А, что у того туз, и от- дать ему 1 руб., либо не поверить ему и потребовать от А открыть карту. Если при этом окажется, что у А дей- ствительно туз, то В должен уплатить противнику 2 руб.; если же обнаружится, что А обманывает, и у него двой- ка, то игрок А должен уплатить игроку В 2 руб. Нужно проанализировать эту игру и определить оп- тимальные стратегии игроков. ' 108
Игра эта имеет сравнительно сложную структуру. Каждая из партий состоит из одного обязательного слу- чайного хода игрока А — выбора одной из двух карт — и двух личных ходов игроков А и В, которые в игре не обязательно осуществляются. Очевидно, у игрока А имеются две стратегии; Ai — обманывать, Аг — не обманывать. У игрока В также две стратегии: Bi—верить, В2 — не верить. Чтобы постро- ить матрицу игры, вычислим средний выигрыш игрока А при каждой комбинации стратегий (в предположении, что игра многократно повторяется). 1. Ai—Bi (Д обманывает, В верит). Если А взял ту- за (вероятность этого 1/2), то у него нет личного хода, он требует 1 руб.; игрок В верит ему и платит. Выигрыш игрока А равен 1 руб. Если А выбрал двойку (вероятность этого также 1/2), то он обманывает, требуя 1 руб.; В верит ему и платит 1 руб. Средний выигрыш «и = у- •1 + у- •1 = 1 Руб* 2. Л1—Вг (Л обманывает, В не верит). Если А взял туза, то у него нет личного хода, он требует 1 руб. Игрок В не верит и после проверки вынужден уплатить 2 руб. Игрок А взял двойку, но говорит, что у него туз, и требует 1 руб.; В не верит и после проверки получает от А 2 руб. (выигрыш А равен 2 руб.). Средний выигрыш «12-= -у--2 + -у -(-2) = о. 3. Аг—Bi (Л не обманывает, В верит). Если А взял туза, он требует 1 руб.; В верит ему и платит; выигрыш равен 1 руб. Игрок А взял туза, признается в этом и платит 1 руб., игроку В остается только принять выигрыш (для А вы- игрыш равен —1 руб.). Средний выигрыш , a2i = 4-.l+-L.(-1) = 0. 4. А2—Вг (А не обманывает, В не верит). Игрок А взял туза и требует 1 руб.; В не верит и в результате проверки должен уплатить 2 руб. игроку А. 109
Если А выбрал двойку, признается в этом и платит 1 руб., то В остается принять выигрыш (выигрыш А ра- вен — 1 руб.). Средний выигрыш = + у •(-!) = РУ6’ Теперь построим платежную матрицу (табл. 11). Таблица 11 А В Ву (верит) В2 (не верит) Ai (обманывает) 1 0 Л2 (ие обманывает) 0 1/2 Эта матрица не имеет седловой точки, так как мак- симин (0) и минимакс (1/2) не равны. Оптимальные сме- шанные стратегии игроков могут быть найдены с по- мощью приведенных выше формул для определения ве- роятностей использования игроками своих чистых стра- тегий: р (Дх) = JJ2— -L ; Р(Л2)=-1; v 1 + 1/2 3 v ' 3 □ о Следовательно, игрок А должен в одной трети всех случаев пользоваться своей первой чистой стратегией — обманывать, а в двух третях — пользоваться второй чис- той стратегией — не обманывать. Такая смешанная стратегия обеспечит игроку А в каждой партии в сред- нем выигрыш, равный математическому ожиданию: Тот факт, что средний выигрыш в каждой партии оказался больше нуля, указывает на несправедливость игры по отношению к игроку В. Для игрока А игра вы- годна; пользуясь своей оптимальной смешанной страте- гией, он может обеспечить себе положительный средний выигрыш. 110
Интересно отметить, что если бы игрок А действовал в игре «сверхосторожно» и никогда не -обманывал (т. е. всегда применял свою чистую стратегию А2), то его средний выигрыш в каждой партии был бы равен нулю. Поэтому применение смешанной стратегии позволяет А реализовать свое преимущество над В в условиях игры. Для игрока В оптимальная смешанная стратегия за- ключается в том, чтобы в одном случае из трех обхо- диться без проверки утверждения игрока А, а в двух других случаях проверять его утверждение (т. е. не верить). При этом условии он будет в среднем на каж- дую партию проигрывать 1/3 руб. Если он станет поль- зоваться все время своей чистой стратегией В2 (не ве- рить), то средний его проигрыш возрастет до 1/2 руб. Итак, мы убедились, что в стратегических играх 2X2 путем несложных вычислений можно найти опти- мальные смешанные стратегии игроков и среднюю цену игры Но как быть, если игроки имеют в игре по три или больше чистых стратегий, а седловой точки в матрице нет? По мере возрастания числа чистых стратегий труд- ности анализа игр, конечно, возрастают. Для решения игровых задач приходится применять более сложные математические методы. В этой популярной книге мы не имеем возможности подробно рассказать о них. Отме- тим только, что математики достаточно хорошо разрабо- тали общие методы решения парных конечных игр с ну- левой суммой. Для решения этих игр используются такие специальные приемы, как метод линейного програм- мирования и метод итераций, с которыми читатель смо- жет познакомиться, воспользовавшись специальной лите- ратурой, указанной в конце книги. Между прочим, с помощью этих методов решена и игра в «три пальца». Найдено [6], что в этой игре опти- мальной смешанной стратегией каждого из игроков является такая, при которой два пальца показываются вдвое чаще, чем один или три. Если оба игрока пользу- ются такой смешанной стратегией, то средний выигрыш каждого равен нулю; отклонение же от нее грозит от- клоняющемуся проигрышем. Мы познакомились здесь с наиболее простыми пар- ными конечными играми с нулевой суммой и с простей- шими методами их'решения. Гораздо более сложными являются парные бесконечные игры, игры с ненулевой 111
суммой, а также игры трех и более лиц, коалиционные игры. Разработка математической теории игр продолжа- ется, так как достижения этой теории находят многообе- щающие приложения в самых различных областях прак- тической деятельности человека. Автомат блефует Блеф — это такой прием игры в покер, когда игрок пытается ввести в заблуждение и запугать своих против- ников, создавая впечатление, что у него на .руках име- ются более сильные карты, чем это есть в действитель- ности. Подобным приемом, не нарушая правил игры, мо- гут пользоваться игроки и в некоторых других стратеги- ческих играх, в частности, в игре «Веришь —не веришь». В комбинаторных играх автомату, как и опытному игроку-человеку, владеющему теорией, нет необходимо- сти прибегать к блефу: он играет в соответствии с зало- женной в память беспроигрышной стратегией, и у про- тивника не остается ни малейшего шанса на выигрыш. Если же мы намерены приобщить автомат к стратегиче- ской игре, то, естественно, следует предусмотреть в про- грамме его работы и умение «блефовать» — коль скоро этот прием обеспечивает реализацию оптимальной стра- тегии. Возможно ли это? Мы сейчас убедимся, что в азартно-стратегической игре «Веришь — не веришь» функцию одного из игроков, а именно, игрока А, может успешно выполнять сравни- тельно простое кибернетическое устройство. Мы заменим карты двумя разноцветными лампочками. Пусть, напри- мер, красная лампочка обозначает туза, а зеленая— двойку. В том, какая из лампочек включена, наш ав- томат прекрасно «разберется». Когда цгрок А берет со стола одну из карт, он с рав- ной вероятностью может взять туза или двойку. Заменяя карты лампочками, мы должны предусмотреть такое устройство, которое включало бы наугад одну из лампо- чек также с равной вероятностью. В качестве этого уст- ройства можно использовать электромагнитное поляри- зованное реле. Его особенностью является зависимость направления отклонения якоря от направления тока в обмотке. Если подключить обмотку такого реле к источ- нику переменного тока (рис. 41), то якорь реле будет 112
через исполнительные кон- с равной вероятностью. Зеленый КрйеныЯ Рис. 41. Устройство для случай- ного выбора одной из Двух лам- почек. вибрировать с частотой сети, отклоняясь поочередно то в одну, то в другую сторону; в момент выключения тока (при отпускании кнопки Кн1) якорь с равной вероятно- стью может остановиться как в правом, так и в левом положении. Поэтому красная и зеленая лампочки, под- ключенные к источнику тока такты реле, будут загораться Итак, случайный выбор одной из двух карт игроком А можно моделировать та- ким же случайным включе- нием одной из двух лампо- чек. Теперь нужно запрограм- мировать дальнейшее пове- дение игрока А (авюмата): сделать так, чтобы он слу- чайным обраром, но в отно- шении 1: 2 чередовал свои чистые стратегии. Выполнение этой задачи нетрудно возложить на уже знакомый нам дисковый контактный коммутатор. У пластмассового диска коммутатора одна треть (сектор в 120°) покрывается медной фольгой (рис. 42, а). Одна щетка прижимается к диску в центральной его части, другая щетка — на периферии. Если вращающийся диск время от времени останавливать, то контакт щетка —- Рис. 42. Устройство для случайного выбора чистых стратегий. диск будет проводить электрический ток лишь в одной трети всех случаев — когда щетка оказывается при- жатой к фольге. Токопроводящий 120-градусный сек- тор целесообразно разделить на несколько более узких, расположенных симметрично на диске, например на че- 113
тире 30-градусных сектора, как показано на рис. 42,5. Если теперь в электрическую цепь последовательно со щетками и диском включить обмотку нейтрального электромагнитного реле, то контакты последнего будут переключать две исполнительные цепи (в моменты оста- новок диска) случайным образом, но в отношении 1 : 2 (т. е. одна из цепей будет включаться вдвое чаще, чем другая). Далее мы увидим, как описанное устройство может быть использовано для управления поведением играющего автомата, который выполняет роль игрока А. Внешний вид этого автомата показан на рис 43 Пи- тается он от сети переменного тока. В средней части Рис 43 Внешний вид играющего автомата «Веришь — не веришь1». лицевой панели в специальной нише, которая закрыва- ется заслонкой 1, расположены красная и зеленая лам- почки. В начале каждой партии нажатием кнопки Вы- бор 2 включается электромагнитное поляризованное реле. После отпускания кнопки одна из лампочек — красная или зеленая — оказывается включенной. Обе лампочки закрыты заслонкой, так что противник автома- та (игрок В) не видит, какая из лампочек включена. В верхней части панели расположены две сигнальные лампочки — красная 3 и зеленая 4. Одну из них включа- ет сам автомат после отпускания кнопки Выбор в соот- ветствии с оптимальной стратегией игрока А: автомат включает или сигнальную лампочку того же цвета, что и горящая лампочка под заслонкой (в этом случае он не 114
обманывает), или красную, когда под заслонкой горит зеленая лампочка (в этом случае автомат пытается об- мануть своего противника, прибегая к блефу). Если автомат включил зеленую сигнальную лампоч- ку, т. е. он признается, что под заслонкой горит зеленая лампочка, то его противнику остается лишь принять выигрыш — одно очко, поверив ему. Для этого против- ник автомата нажимает кнопку Верю 5 и счетчик 6 его очков (один из двух счетчиков, расположенных в верх- ней лицевой панели) отсчитывает одно очко. Если же автомат вклюрил красную сигнальную лам- почку, т. е. он утверждает, что под заслонкой горит красная лампочка (возможно, что это правда, а может быть, что автомат блефует — под заслонкой в действи- тельности горит зеленая лампочка), то у противника автомата два возможных варианта действий: он может поверить автомату и нажать кнопку Верю — при этом счетчик очков автомата 7 отсчитает ему одно очко; мо- жет не поверить автомату и отодвинуть вправо заслонку 1 (на которой, написано Не верю), чтобы проверить, какая из лампочек в действительности включена; если автомат не обманывал и под заслонкой горит красная лампочка, то счетчик очков автомата отсчитывает ему два очка; если же автомат блефовал (под заслонкой го- рит зеленая лампочка), то два очка отсчитает счетчик противника автомата. На этом партия игры автомата с человеком заканчи- вается. Чтобы приступить к следующей партии игры, нужно кратковременно нажать кнопку Сброс 8. При этом все механизмы автомата возвращаются в исходное положение, но счетчики сохраняют набранные ранее ко- личества очков (установка счетчиков на нуль произво- дится в самом начале игры с помощью специального ры- чага 9). Количество партий в игре практически неогра- ниченно. Побеждает тот из игроков, кто наберет за время игры большее число очков. Для анализа работы играющего автомата обратимся к его принципиальной схеме, изображенной на рис. 44. При включении выключателя сети В1 напряжение по- ступает на обмотку / трансформатора Тр блока питания автомата. Лампочка Л1 (индикатор включения) загора- ется, сигнализируя о готовности автомата к игре. Чтобы начать игру, человек, играющий с автоматом (игрок В), нажимает и через 2—3 с отпускает кнопку Км/ Выбор. 115
При нажатии кнопки Кн1 напряжение поступает на об- мотку реле Р1, это реле срабатывает; его контакты Р1.1 включают двигатель Ml, который начинает вращать кон- тактный диск устройства выбора чистых стратегий. •Одновременно контакты Р1.2 подают напряжение на об- мотку реле Р2, а контакты Р1.3 подают напряжение на обмотку поляризованного реле КР9. Реле Р2 срабатыва- ет, его контакты Р2.1 обеспечивают блокировку (само- питание) этого реле, а контакты Р2.2 подготавливают к Рис. 44. Принципиальная схема играющего автомата «Веришь — не веришь». включению лампочки Л2—ЛЗ и сигнальные лампочки Л4—Л5. Якорь реле КР9 начинает вибрировать с частотой сети, его контакты KJP9.1 попеременно замыкают и раз- мыкают цепь обмотки реле Р4 (однако реле Р4 не сра- батывает, ибо контакты Р1.2 находятся в левом положе- нии и напряжение на обмотку реле Р4 не поступает). При отпускании кнопки К.н1 реле Р1 отключается; его контакты Р1.1 отключают двигатель Ml и контактный 116
диск останавливается. При этом в зависимости от поло- жения, которое занял остановившийся контактный диск, реле РЗ с вероятностью 1/3 оказывается подготовленным к включению через контакты «щетка — диск». Контакты Р1.3 отключают поляризованное реле К.Р9 и подают на- пряжение на лампочки Л2—Л5. Контакты КР9.1 оказываются или замкнутыми (с ве- роятностью 1/2), или разомкнутыми (с вероятностью также 1/2) — это зависит от того, в каком из крайних положений остановился якорь поляризованного реле. Контакты Р1.2 подают напряжение на логическое уст- ройство автомата. Если контакты КР9.1 оказались замкнутыми, то сработает реле Р4\ его контакты Р4.3 включают красную лампочку ЛЗ под заслонкой; контакты Р4.2 подготавли- вают к включению счетчик очков автомата Сч2; контак- ты Р4.1 включают обмотку реле РЗ и это реле срабаты- вает (независимо от положения контактного диска). Контакты Р3.1 включают красную сигнальную лампочку Л5 — автомат «заявляет», что под заслонкой горит крас- ная лампа ЛЗ. Одновременно контакты Р3.2 подготавли- вают к включению узел логического устройства, содер- жащий реле Р6—Р8. Контакты РЗ.З подготавливают к включению счетчик очков автомата Сч2. Если же контакты КР9.1 оказались разомкнуты- ми, то реле Р4 не срабатывает; под заслонкой включа- ется зеленая лампочка Л2. В зависимости от положения контактного диска реле РЗ или срабатывает (вероят- ность этого равна 1/3), или не срабатывает (вероятность этого 2/3), соответственно этому контакты реле Р3.1 подают напряжение или на красную сигнальную лампоч- ку Л5, или на зеленую Л4 (в первом случае автомат пытается обмануть противника, «утверждая», что под заслонкой горит красная лампочка; во втором случае автомат «признается», что под заслонкой горит зеленая лампочка). Контакты РЗ.З подготавливают к включению соответственно или счетчик Сч2, или счетчик Сч1. Далее ответный ход должен сделать противник ав- томата (игрок В). При горящей лампочке Л4 он должен поверить автомату. Если же горит лампочка Л5, то он может верить, а может и не верить автомату. Если человек решил поверить автомату, то он на- жимает на кнопку К.н2 Верю. При этом срабатывает ре- ле Р5. Контакты Р5.1 обеспечивают блокировку этого 117
реле; вместе с тем они отключают питание узла логиче- ского устройства с реле Р6—Р8\ контакты Р5.2 подают напряжение на тот из счетчиков очков, который был подготовлен к включению. Если кнопка Кн2 Верю была нажата, когда горела красная сигнальная лампочка Л5 (контакты Р3.1 и РЗ.З находились в правых положениях), то срабатывает счет- чик очков автомата Сч2, отсчитывая одно очко в его пользу. Если же кнопка была нажата при горящей зеле- ной лампочке Л4 (контакты Р3.1 и РЗ.З в левых положе- ниях), то срабатывает счетчик очков человека Сч1, от- считывая одно очко в его пользу. Предположим теперь, что человек решил не верить автомату, тогда он должен отодвинуть заслонку, чтобы увидеть, какая из лампочек (Л2 или ЛЗ) в действитель- ности горит. При отодвигании заслонки замыкаются кон- такты кнопки КнЗ Не верю. Это вызывает срабатывание реле Р6. Контакты Р6.1 подают напряжение на обмотку реле Р8', контакты Р6.2 подают напряжение на один из счетчиков. Если кнопка КнЗ была нажата при горящей красной лампочке ЛЗ (контакты Р4.3 и Р4.2 находились в пра- вых положениях), то срабатывает счетчик Сч2\ если же при нажатии кнопки КнЗ горела зеленая лампочка Л2 (контакты Р4.3 и Р4.2 были в левых положениях), то срабатывает счетчик Сч1. Сработавший счетчик отсчи- тывает первое очко. Далее, реле Р8, срабатывая, своими контактами Р8.2 блокируется, а контактами Р8.1 подго- тавливает к включению цепочку R2—СЗ и реле Р7. После отпускания заслонки она под действием пру- жины возвращается в исходное положение, закрывая лампочки Л2 и ЛЗ. При этом отпускается и контакт кнопки КнЗ', реле Р6 отключается, его контакты Р6.2 размыкаются, а контакты Р6.1 подают напряжение на цепочку R2—C3 и реле Р7. Через 2—3 с (время выдерж- ки определяется постоянной времени /?С-цепочки) на- пряжение на конденсаторе СЗ достигнет напряжения срабатывания реле Р7 и последнее срабатывает. Контак- ты Р7.1 обеспечивают блокировку реле Р7, а контакты Р7.2 подают напряжение на подготовленный к включе- нию счетчик (Сч1 или Сч2), который отсчитывает второе очко. На этом партия игры заканчивается. Нажатием кноп- ки Сброс отключается питание всех реле Р1—Р8, 118
логическое устройство автомата возвращается в исход- ное состояние, и можно нажатием кнопки 1\н1 Выбор начинать следующую партию. При многократном повторении игры автомат всегда включает красную сигнальную лампочку Л5, если под заслонкой включилась красная лампочка ЛЗ. Если же под заслонкой загорелась зеленая лампочка Л2, то в 2/3 случаев автомат «признается» в этом, включая зеленую лампочку Л4, а в 1/3 всех случаев он «пытается» обма- нуть противника, включая лампочку Л5. Обе эти чистые стратегии автомат чередует случайным образом. Это обеспечивает ему, как мы уже знаем, средний выигрыш в 1/3 очка в каждой партии. В конструкции автомата использованы: КР9 — поля- ризованное реле РП-5; Р2, Р5, Р7, Р8 — реле РЭС-9 (паспорт РС4.524.201); Р1, РЗ, Р4, Р6 — реле РЭС-22 (паспорт РФ4.500.131); Сч1 и Сч2 — СЭИ-1; Л1—Л5 — лампочки ЛИ 3,5В><0,28А; С1 и С2 — конденсаторы электролитические, 100 мкФ, 150 В; СЗ — конденсатор 200 мкФ, 50 В; сопротивления резисторов R1 и R2 под- бирают при налаживании автомата; Ml—двигатель ДСД-60; 1\н1—Кн4 — кнопки самодельные (кнопка КнЗ конструктивно совмещена с заслонкой таким образом, что при отодвигании заслонки контакты кнопки замыка- ются, а при отпускании заслонки она возвращается в исходное положение и контакты кнопки размыкаются), выключатель сети В1 — однополюсный * тумблер; Д1—Д8 — диоды Д226Б; трансформатор Тр набирлют из пластин Ш20, пакет 20 мм (сетевая обмотка содержит 2750 витков провода ПЭЛ-0,15, обмотка II— 300 витков провода ПЭЛ-0,35, обмотка III — 600 витков провода ПЭЛ-0,35, обмотка IV — 44 витка провода ПЭЛ-0,5). Все детали и узлы автомата монтируют на горизон- тальном шасси и лицевой панели из текстолита. Шасси устанавливают в футляре. На специальной табличке, прикрепленной к лицевой панели, пишут правила игры. Описанный автомат для игры «Веришь — не веришь» был построен студентами физического факультета Свердловского педагогического института. Для проверки «игровых способностей» автомата студенты установили его в одной из комнат общежития и'предложили всем желающим играть с ним (предварительно были зафик- сированы рычаги сброса в счетчиках очков, чтобы их нельзя было возвращать на нуль). В течение нескольких 119
дней студенты сыграли с автоматом в общей сложности около 2000 партий, и к моменту окончания этого своеоб- разного состязания игроков и автомата счет был 1782 : 1098 в пользу автомата. Кот и мышь в лабиринте Во времена императрицы Марии Терезии австрийское военное интенданство, дабы выстоять от нашествия мы- шей и сохранить в целости содержимое своих складоц, завело на этих складах казенных кошек. Кошки были призваны на службу без «права на пенсию» и значились в документах под рубрикой «императорские королевские кошки военных, складов». Однако «их высочества импе- раторские королевские кошки» во-многих случаях не вы- полняли своего долга, дело дошло до того, что в царст- вование императора Леопольда (1790—1792 гг.) на воен- ном складе в Погоржельце шесть кошек, причисленных к этому складу, по приговору военного суда были пове- шены. Впрочем, говорят, что истинными виновниками порчи и исчезновения обмундирования со склада были не королевские кошки, и даже не мыши, а некоторые гос- пода из интенданства, предъявившие бедным и безответ- ным животным обвинение в том, что они не ловили мышей... Коты должны ловить мышей — так уж заведено на белом свете, а мыши—-прятаться от котов. И, разуме- Рис. 45. Лабиринт для кота и мыши. ется, каждая из сторон, не же- лая быть в проигрыше, идет на всяческие ухищрения: кот, не шевелясь, часами сидит в засаде или многократно обхо- дит свои владения; мышь хит- роумно маскирует свою норку, устраивает запасные ходы. Но случись неосторожной мыши попасть на глаза коту, и... Не предаваясь печали по случаю трагического для несчастной мыши исхода цстречи, предста- вим происшедший инцидент как некоторую игровую ситуацию. Предположим, что в какой-то момент кот и мышь по- падают одновременно в глухой лабиринт (рис. 45). Кот входит в левый верхний угол лабиринта, мышь — в пра- 120
вый нижний. Лабиринт условно разбит на ряд участков, расположенье между соседними пересечениями ходов. Для удобства каждому такому участку присвоен номер: 1, 2, 3,..., 12. Кот и мышь передвигаются с одинаковой скоростью. Они могут перемещаться прямо и заворачи- вать за угол, но возвращаться по только что пройденному Рис. 46. Стратегии кота и мыши. пути им запрещено. Если, пройдя три участка, мышь не встретилась с котом и спаслась, то она выиграла. В про- тивном случае она погибла (проиграла). И кот, и мышь знают о присутствии противника в лабиринте, но во вре- мя движения не располагают информацией о его место- нахождении и перемещении. Допустим, что они действуют по заранее составлен- ном5' плану — стратегии, и в пути своих стратегий не меняют. У кота и мыши имеется по восьми различных стратегий движения в лабиринте (рис. 46). Каждая стра- тегия движения составлена из трех участков лабиринта." Попробуем разобраться, как должны вести себя кот и мышь, чтобы оказаться в выигрыше. Для этого постро- им матрицу игры (табл. 12), обозначив стратегии кота Ki—Кз, а стратегии мыши М-.—Ms. В этой матрице исход партии «кот поймал мышь» оценивается как 1, а исход «кот упустил мышь» — как 0. Рассматривая заполненную матрицу, можно заметить, что для мыши наиболее выгодны первая ЛК и восьмая Ms стратегии, так как здесь опа проигрывает в двух слу- чаях из восьми. Коту же наиболее выгодны четвертая Ка и пятая У(5 стратегии, поскольку здесь он выигрывает 9—788 121
Таблица 12 к м Mt Л12 м, м, А, | М, | м, м„ Kt 0 0 0 1 (К 0 0 1 ат 0 1 1 1 1 1 1 0 А'з 0 [ ? 1 1 1 1 0 *4 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 Кз 0 1 1 1 1 1 1 0 к. 0 1 1 1 1 . 1 1 0 Кв 1 0 0 0 1 0 0 0 семь раз из восьми. Таким образом, матрицу игры можно значительно упростить (табл. 13), сохранив лишь по две стратегии кота и мыши: Таблица 13' к м м. | м. к, 1 0 Кь 0 1 Теперь ясно, что в этой стратегической игре 2X2 кот и мышь имеют равные шансы на успех: если, например, кот применяет стратегию Ki, то он с равной вероятно- стью может как выиграть, так и проиграть. Аналогичное положение и у мыши. Стратегии Kt и Кь равноценны, 122
так же как равноценны и стратегии AIi и М8. Очевидно, во время игры коту следует одинаково часто применять чистые стратегии /<4 и К5 — это будет его оптимальная смешанная стратегия. Мышь же, играя оптимально, должна так же смешивать свои стратегии Mi и Ms. Кот должен делать малые петли в лабиринте, а мышь — при- держиваться его внешних коридоров. При таком опти- мальном поведении игроков ни один из них не будет иметь преимуществ перед другим и при большом коли- честве сыгранных партий счет в игре будет примерно равным. Однако если игрокам эти оптимальные смешанные стратегии неизвестны и они действуют каждый раз на- угад, беспорядочно, то мышь будет проигрывать чаще, Рис. 47. Внешний вид автомата для игры «Кот и мышь в лабиринте». чем кот: обратите внимание на то, что в матрице игры 8X8 единиц больше, чем нулей. Проведенный нами анализ игры показывает, что оп- тимальная смешанная стратегия для кота довольно про- ста и ее вполне можно «заложить» в конструкцию не- сложного кибернетического устройства. Это позволяет построить играющий автомат, который будет придержи- ваться оптимальной смешанной стратегии кота в игре с противником — человеком, выступающим в роли мыши. Внешний вид играющего автомата «Кот и мышь в лабиринте» представлен на рис. 47. На лицевой панели изображен лабиринт.
Рядом с каждым участком лабиринта, за исключени- ем 11-го и 12-го, расположены тумблеры, включением которых противник автомата (мЪииь) фиксирует выбран- ный им путь. При этом соответствующие участки (кори- доры) лабиринта высвечиваются находящимися под па- нелью лампочками. На лицевой панели расположены так- же кнопки Ход кота и Счет, световые табло Вы выиграли и Вы проиграли, электромагнитные счетчики, регистри- рующие исход сыгранных партий, выключатель сети. Рпс. 48. Принципиальная схема играющего автомата «Кот и мышь в лабиринте». МЛш-гращ, Принципиальная схема играющего автомата пред- ставлена на рис. 48. На этой схеме тумблеры и включае- мые- ими лампочки обозначены теми же порядковыми номерами, что и соответствующие им участки лабирин- та. Например, тумблер В1 расположен рядом с участком 124
1 лабиринта и включает лампу Л1, подсвечивающую этот участок. В реальной конструкции автомата каждый участок лабиринта подсвечивается тремя параллельно соединенными лампочками, но на схеме (для упроще- ния) изображена только одна из них. Игру начинает противник автомата (мышь). Пред- положим, что он избрал путь, состоящий из участков 1, 2 и 5 — включил тумблеры Bl.l, В2.1, В5.1. При этом загораются лампы Л1, Л2 и Л5, подсвечивающие вы- бранный путь. После этого следует нажать кнопку Ход кота (К.Н1.1). При этом поляризованное реле КР1 под- ключается к источнику переменного напряжения, якорь этого реле начинает вибрировать с частотой сети, осу- ществляя случайный выбор одной из двух оптимальных стратегий кота (о таком устройстве для случайного выбо- ра одной из двух возможностей было подробно расска- зано в описании играющего автомата «Веришь — не веришь»). Одновременно контактами Кн1.2 замыкается цепь питания реле Р2, оно срабатывает и блокируется своими контактами Р2.1. После отпускания кнопки КЛ1.1 цепь питания реле КР1 размыкается, и в зависи- мости от положения контактов KP1J срабатывает реле РЗ или Р4. При срабатывании одного из этих реле про- исходит отключение другого. Например, если сработает реле Р4, то его контакты Р4.2 разрывают цепь питания реле РЗ. Это сделано для того, чтобы последующие на- жатия на кнопку Кн1 не изменяли первоначального выбора стратегии автомата. Необходимо отрегулировать контакты кнопки Кн1 так, чтобы при нажатии на нее контакты Кн1.3 размыкались раньше, чем замыкаются контакты Кн1-2. Иначе становится возможным ложное срабатывание одного из реле РЗ—Р4, если до того, как сработает реле Р2, контакты Кн1.3 не успеют разорвать цепь питания реле РЗ—Р4. При срабатывании реле РЗ загораются лампы Л12, Л13 и Л14, при срабатывании реле Р4 — лампы ЛИ, Л13 и Л14. Таким образом, включение реле РЗ означает применение автоматом стратегии Кг, а включение реле Р4 — применение стратегии 7G- Конструктивно лампа Л13 расположена в пятом участке лабиринта, т. е. там же, где и лампа Л5, а лампа Л14 — в шестом участке, вместе с лампой Л6 (в коридоре лабиринта лампы рас- полагаются в два ряда).
Если пути, выбранные автоматом (котом) и его про- тивником (мышью), пересекутся, то логическая цепочка, состоящая из контактов реле РЗ и Р4, переключателей В2.2, В4.2, В7.2, В9.2, замкнет цепь питания реле Р5, которое самоблокируется контактами Р5.1 и контактом Р5.3 включает лампу Л16, подсвечивающую табло «Вы проиграли». Если же пути игроков не пересекутся, то реле Р5 не сработает, и тогда загорится лампа Л15, подсвечивающая табло Вы выиграли. В автомате имеются устройства для подсчета резуль- татов сыгранных партий — счетчики выигрышей челове- ка Сч2 и автомата Сч1. За каждую выигранную партию победителю начисляется одно очко. Чтобы зафиксиро- вать результат игры, следует нажать кнопку Кн2 Счет. При этом: контакты Кн2.3 замыкают цепь питания счет- чиков Сч1 или Сч2, выбор которых определяется в зави- симости от положения переключающих контактов Р5.2. Чтобы исключить возможность многократного нажатия на кнопку Кн2 и тем самым начисления очков человеку, в схеме предусмотрена блокировка, действующая следу- ющим образом. Цепь питания счетчиков разомкнута контактами Р3.5 и Р4.5, поэтому нажатие кнопки Кн2.3 не приведет к отсчету результата до тех пор, пока не сработало реле РЗ или Р4. Кроме того, при нажатии кнопки Кн2.2 срабатывает реле Р6 и блокируется свои- ми контактами Р6.1. Одновременно его контакты Р6.2, замыкаясь, подготавливают к включению цепь питания реле Р7, срабатывание которого происходит в момент отпускания кнопки Кн2.1. Реле Р7 самоблокируется контактами Р7.1, а контактами Р7.2 разрывает цепь питания счетчиков Сч1 и Сч2, что исключает их срабаты- вание при повторном нажатии кнопки Кн2. Реле Р6 и Р7 будут работать только в случае, если замкнуты кон- такты Р3.4 или Р4.4, т. е. после того, как будет нажата кнопка К.н1, и автомат сделает выбор своей стратегии. Чтобы начать новую партию игры, необходимо отклю- чить автомат от сети выключателем В11, вернуть все тумблеры в исходное положение и снова включить сете- вое питание. Сброс результатов сыгранных партий осу- ществляется поворотом рычагов, расположенных на бо- ковой стенке у счетчиков. В автомате применены следующие детали и узлы: сетевой выключатель — однополюсный тумблер; КР1 — поляризованное реле РП-4, РП-5; Р2, Р6, Р7 — реле 126
РЭС-9 (паспорт РС4.524.201); Р5 — реле РЭС-22 (паспорт РФ4.500.131), в качестве реле РЗ и Р4 применяют по два реле типа РЭС-22 с параллельно сое- диненными обмотками; Сч1 и Сч2 — импульсные счет- чики СЭИ-1; сетевой транрформатор блока питания и диоды выпрямителей Д1—Д8 такие же, как и в играю- щем автомате «Веришь — не веришь»; лампочки подсве- та коридоров лабиринта ЛН 3,5 ВХ0,38 А. Лампочки под лицевой панелью помещены в специ- альные отражатели света, изготовленные из жести таким образом, что они повторяют по своей конфигурации кори- доры лабиринта. Этим достигается эффект высвечивания четких линий, указывающих пути кота и мыши. ГЛАВА ПЯТАЯ АВТОМАТЫ УЧАТСЯ ИГРАТЬ Как автоматы обучаются Гроссмейстерами не рождаются. Как ни талантлив будущий чемпион, начинать ему всегда ' приходится «с нуля», а путь к пьедесталу почета долог и тернист. Знакомство с правилами игры, первые робкие шаги но- вичка, многочисленные встречи с такими же, как и он, любителями...' Радость побед и — увы! — горечь пораже- ний. Потом — изучение партий, сыгранных лучшими мастерами прошлого и современности, знакомство с тео- рией. Упорная и напряженная учеба, тренировка... И игры, игры, игры — в матчах, турнирах, состязаниях всех рангов и уровней... Опыт ^мастерство приходят по- степенно. Нередко лишь через многие годы начинающий любитель превращается в прославленного чемпиона. Но если таков путь к мастерству человека, то почему бы не направить по этому же пути и играющую машину, запрограммировав у нее способность совершенство- ваться по мере накопления опыта? Эту мысль высказал еще Норберт Винер. «Предполо- жим,— писал он, — что после нескольких партий маши- на делает перерыв и использует свои возможности совсем для другой цели. В то время, когда она не пгра- 127
ет со своим противником, она изучает все предыдущие партии, записанные в ее памяти, производит оценку фигур в зависимости от их положения, мобильностц и т. д., анализирует наиболее выигрышные ситуации. Та- ким путем она изучает не только свои собственные ошибки, но и удачи своего противника. Теперь она заме- няет свои предыдущие ходы новыми и продолжает игру как новая, улучшенная машина. Такая машина больше не будет проявлять прежнего упорства, и комбинации, которые раньше против нее удавались, потеряют свою ценность. Более того, со временем машина, может изу- чить манеру игры своего противника» [22]. ‘Развивая эту мысль о создании самообучающихся машин, Норберт Винер в последних своих произведениях высказывал серьезные-опасения: не выйдут ли когда-ни- будь эти машины из повиновения и не станут ли они делать все, что им заблагорассудится? Ведь такая ма- шина, накопив достаточный опыт, делает уже не то, что ей приказывают, а то, чему она «научилась». Она может довольно быстро достичь такого уровня, когда ее конст- руктор уже не будет знать, какие изменения произошли в схеме-машины, ее поведение станет непредсказумым. «Отец кибернетики предостерегал, что если такие маши- ны попадут в руки недальновидных политиков, то они могут вовлечь человечество в самоубийственную войну. В последнее время исследования ученых, связанные с созданием и совершенствованием самообучающихся машин, играющих в различные игры, приобретают все большее значение. Для этой цели чаще всего использу- ются ЭВМ, обладающие достаточно большим объемом памяти, для них составляются специальные про- граммы. Одной из первых самообучающихся машин была IBM-704. Американский кибернетик Артур Л. Сэмюэль составил для этой машины программу игры в шашки таким образом, что она могла запоминать сыгранные партии, и играя, просматривать предыдущие партии и изменять свою стратегию, учитывая накопленный опыт. Вначале при игре с этой машиной Сэмюэлю удавалось легко у нее выигрывать. Однако она стала быстро со- вершенствоваться и вскоре уже играла настолько хоро- шо, что могла побеждать своего конструктора в каждой партии. В 1962 г. эта машина победила одного из луч- ших шашистов США, чемпиона штата Коннектикут Ро- 128
берта Нили. Вот что писал об этом матче побежденный чемпион: «Любопытно, что машина могла победить, только сделав несколько великолепных ходов; у меня же было несколько благоприятных возможностей для того, чтобы окончить игру вничью. Именно поэтому я продолжил игру. Но машина провела отличное оконча- ние, не сделав ни одной ошибки. В эндшпиле у меня не было подобного соперника с 1954 г., когда я проиграл последний раз». Для игры в шахматы подобной программы самообу- чения пока еще не создано. Несравненно более сложные тактические соображения и продвижения шахматных фи- гур предъявляют столь высокие требования к способно- стям ЭВМ и их программистов, что пока в этом направ- лении достигнуто еще немногое. Тем не менее есть все основания ожидать, что со временем и эта задача будет решена. Играющая машина имеет огромные преимущест- ва перед своим противником — человеком: она обладает отличной памятью и завидной выносливостью; во время матча она равнодушна к шуму в зале, не делает ошибок по невнимательности и способна анализировать ходы лучше, чем человек. Самообучающаяся машина, сыграв несколько тысяч партий с квалифицированными шахма- тистами, достигнет высокого мастерства. Американский математик Мартин Гарднер предло- жил даже запрограммировать машину таким образом, чтобы она длительно и ожесточенно сражалась против самой себя. Быстродействие машины позволит ей в короткое время приобрести опыт, далеко превосходящий опыт любого шахматиста. Для экспериментов с. самообучающимися играющими машинами необязательно иметь в своем распоряжении современную ЭВМ. Можно воспользоваться и более простыми устройствами. В частности, оригинальную и интересную идею создания простых самообучающихся машин из ...спичечных коробок предложил в 1961 г. шотландский ученый Дональд Мичи. Его самообучаю- щаяся машина для игры в «крестики — нолики» на поле из девяти клеток состоит из 300 Спичечных коробок. Автор назвал эту машину MENACE, что в переводе с английского означает «угроза», а расшифровывается так: Match-вох Educable Naughts and Crosses Engine — машина из спичечных коробок, обучаемая игре в «крес-1 тики — нолики». 129
На крышке каждой из спичечных коробок нарисована одна из позиций, встречающихся при игре в «крестики- нолики» перед ходом машины (игру всегда начинает ма- шина) . Внутри каждой коробки помещают разноцветные стеклянные бусинки, причем каждый цвет соответствует одному из возможных вариантов хода машины. В короб- ках, относящихся к первому ходу машины, лежат по че- тыре бусинки каждого цвета, в коробках второго хода машины — по три, в коробках третьего хода — по две бусинки каждого цвета и, наконец, в коробках четверто- го хода каждый цвет представлен лишь одной бусинкой. Чтобы узнать очередной ход машины, надо выбрать ко- робку, на которой изображена сложившаяся позиция, встряхнуть коробку и, отодвинуть крышку, извлечь на- угад (не глядя) одну бусинку; цвет извлеченной бусинки укажет, какой из возможных ходов «избрала» машина. Бусинку затем снова возвращают в коробку. После от- ветного хода человека (противника машины) таким же образом определяется следующий ход машины. Коробки, «принявшие участие» в игре, остаются открытыми до конца партии. Если машина выиграла, то ее «поощряют», добавляя в каждую открытую коробку по три бусинки того цвета, который соответствует сделанному ходу. Если игра за- кончилась вничью, то в каждую коробку добавляют только по одной такой бусинке. Если же машина проиг- рала, то ее «наказывают», вынимая из каждой коробки по одной бусинке, соответствующей сделанному ходу. Чем больше партий сыграет машина Мичи, тем лучше она «запоминает» ходы, ведущие к победе, и Тем упор- нее стремится избежать проигрышных ходов. Соревнуясь в игре со своей машиной, Д. Мичи уст- роил своеобразный двухдневный турнир. Было сыграно 220 партий в «крестики — нолики». Сначала изобрета- тель все время наказывал свое детище за плохую игру, но уже после двадцатой партии машина научилась за- канчивать все партии вничью. В расчете заманить про- тивника в ловушку, Мичи стал делать самые бессмыс- ленные ходы. Однако машина быстро научилась распоз- навать эти хитрости. Турнир закончился поражением изобретателя. Поскольку, вероятно, вряд ли кто-нибудь из читате- лей возьмется за изготовление самообучающейся маши- ны, для которой требуется 300 спичечных коробок, мы 130
предлагаем построить более простого «спичечного» ро- бота — машину, обучающуюся играть в знакомую нам игру Баше в том ее варианте, который мы назвали «По- следний проигрывает». Напомним, что в этой игре двое играющих по очереди берут предметы из кучки, содер- жащей вначале семь предметов, причем за один ход можно взять один или два предмета; проигравшим счи- тается тот, кто возьмет последний. Чтобы построить машину, способную быстро научить- ся выигрывать в этой игре, нужно всего шесть пустых спичечных коробок и одиннадцать одинаковых бусинок двух цветовых оттенков. На каждой коробке изобража- ют одну из схем, показанных на рис. 49. Эти схемы со- Рис 49. Варианты позиций перед ответным ходом «спичечного» ро- бота в игре «Последний проигрывает». ответствуют различным позициям, которые могут возни- кать во время игры перед ходом машины (начинать игру всегда должен ее противник). В верхней части каждой схемы кружком обведено число, показывающее, сколько предметов остается в кучке после хода человека, а стрел- ками обозначены варианты возможных ходов машины из данной позиции. Рядом с каждой стрелкой записано число предметов, которые «берет» своим ходом машина, а острие стрелки указывает, сколько предметов в кучке останется после этого. Римские цифры I—III в нижней части каждой схемы показывают, перед каким ответным 131
ходом машины возможно возникновение позиции, изо- браженной на данной схеме. Первые две схемы (на рис. 49, а и б) изображают позиции, возможные только после первого'хода человека; схемы на рис. 49, в и г соответ- ствуют позициям, которые могут возникнуть после второ- го хода человека; позиции на рис. 49, д и е возможны как после второго, так и после третьего хода противника машины. В каждую коробку нужно положить по одной бусин- ке определенного цвета на каждый вид стрелки на схе- ме — и «спичечный» робот готов к игре. Его допустимые правилами ходы изображены на схемах стрелками; он может делать любой ход и при том только законный, но у пего нет никакой предпочтительной стратегии — он еше не обучен выигрывающему алгоритму. Процесс обучения робота происходит следующим об- разом. Сделав первый ход, выберите ту из коробок с цифрой I, на которой изображена возникшая позиция. Встряхните коробку и, закрыв глаза, вытащите из нее наугад одну бусинку. Затем посмотрите, какого цвета эта бусинка, и сделайте за машину ответный ход, взяв указанное соответствующей стрелкой число предметов из кучки. Теперь снова ваш ход. Сделав его, повторите указанную процедуру с одной из коробок, обозначенных цифрами II или II—III. Так следует поступать, пока пар- тия не окончится. Если выиграет машина, положите все вынутые бусин- ки на место и играйте снова. Если же машина проиграет, то «накажите» ее, забрав из коробки ту бусинку, которая представляла последний ход машины. Все остальные бу- синки положите на место и продолжайте обучение — играйте снова. Если во вре.мя игры очередная коробка окажется пустой, то это значит, что все дальнейшие ходы робота ведут к его проигрышу и он сдается. В этом слу- чае надо его «наказать», забрав бусинку из предыдущей коробки. В процессе игры наш робот быстро накапливает опыт и обучается, и чем лучше играет партнер, тем быст- рее машина овладевает выигрышной стратегией. Чтобы прочно усвоить алгоритм победы, нашему ро- боту нужно потерпеть поражение не более чем в семи партиях (при этом из всех коробок изымаются бусинки, соответствующие таким ходам, которые могут привести к поражению машины). Поэтому во всяком турнире, состоящем более чем из 14 партий, общий счет будет в 132
пользу машины. Слабого игрока она может победить и при меньшем числе сыгранных в турнире партий, но га- рантировать ее идеальное обучение при этом мы не можем. На рис. 50 показаны в виде графика результаты ти- пичного турнира из 17 партий между машиной и челове- ком. Участок ломаной, направленный вниз, означает по- ражение машины, а участок ломаной, направленный вверх — ее выигрыш. Из графика видно, что сыграв Рис. 50. Результаты турнира че- ловека и робота, обучающегося игре «.Последний проигрывает». Выигрыш. уаишны Прокрыт машины 11 партий (и проиграв из них 7), машина в совершенстве овладела выигрышной стратегией. Можно придумать иную систему обучения «спичеч- ной» играющей машины. Например, для того чтобы ро- бот одерживал максимальное число побед в небольшом турнире из 20 партий, целесообразно не только «наказы- вать» его, отнимая бусинки при каждом поражении, но и «поощрять» при каждом выигрыше, добавляя в коробки бусинки соответствующего цвета. При таком методе «кнута и пряника» плохие ходы машины исключаются не так быстро, но зато робот становится менее склонным к ним. Интересно построить две машины с разными система- ми поощрений и наказаний, одинаково неопытные до на- чала обучения. Обе машины должны быть устроены та- ким образом, чтобы они могли не только делать ответные ходы, но и начинать игру первыми (для этого придется увеличить число элементов — спичечных коробок — в каждой из-машин). Тогда можно устроить между маши- нами турнир, предоставляя им право первого хода по очереди, и посмотреть, какая из машин победит. «Спичечные» обучающиеся машины, подобные опи- санным, могут быть построены и для других комбинатор- ных игр, например таких, как «Одинокий ферзь», «Ход конем», «Набери чет» и пр. По мере возрастания комби- наторной сложности игр количество используемых в ма- шинах спичечных коробок быстро увеличивается. 133
М. Гарднер — известный американский специалист в области занимательной математики — обратил внимание на то, что некоторые популярные игры, разыгрываемые на шахматной доске, при уменьшении размеров доски упрощаются настолько, что оказываются в пределах возможностей «спичечных» роботов. Так, например, этот ученый предложил «минишашки» на доске 4X4 (рис. 51), при которой еще сохраняются обычные правила игры. Рис. 51. Минишашки. Рис. 52. Мииишахматы. Построить «спичечную» обучаемую машину для та- кой игры нетрудно, и читатель при желании сможет это делать. Что же касается шахмат, то даже если свести их к доске малых размеров, при которых еще допустимы законные ходы (рис. 52), то сложность игры все же оста- ется за пределами возможностей робота из спичечных коробок. М. Гарднер предлагает такие «минишахматы» специалистам по ЭВМ, желающим разработать програм- му упрощенной машины, обучающейся игре в шахматы. «Минишахматы» полезны также для всех шахматистов, желающих сыграть короткую партию. После всего сказанного мы можем теперь сформули- ровать общий принцип обучения машины к о м б и н а- торным играм. Чтобы машина усвоила выигрывающий алгоритм, она должна, играя с противником, научиться отличать плохие ходы, ведущие к ее поражению, от хоро- ших ходов, ведущих к выигрышу; потом, в следующих партиях игры в каждой позиции ей следует выбирать только хорошие ходы, избегая плохих. Перед началом 134
обучения машине достаточно лишь знать правила игры. Впрочем, это последнее условие не является необходи- мым. Если засчитывать поражение машине всякий раз, когда она нарушает правила игры, то она будет относить все незаконные ходы к плохим и в дальнейшем станет их избегать. Не так ли и человек обучается комбинаторным играм? В стратегических играх дело с обучением ма- шины обстоит не так просто. Здесь, как мы уже отмеча- ли, каждый ход игрока сам по себе не может считаться ни хорошим, ни плохим: это зависит от того, какой ход избирает противник. Разгадывание психологии неприя- теля, его намерений является важнейшей задачей каж- дого из участников стратегической игры. В конечном итоге выигрывает тот, кто лучше сможет предвидеть действия противника. Поэтому для обучения машины стратегической игре нужно предоставить возможность этой машине, играя с противником, изучать его манеру игры, его склонность к тому или иному образу действий в различных ситуациях с тем, чтобы накопленную о про- тивнике информацию использовать в дальнейшем против него. Этот принцип был использован при создании несколь- ких различных играющих автоматов, обучаемых страте- гическим играм. Один из наиболее интересных автоматов этого типа был построен Д. Хагельбаргером для игры с человеком в «две монетки». Обычно в этой игре двое участников одновременно кладут на стол по монете либо гербом, либо решкой вверх. При совпадении выигрывает один игрок, в противном случае — другой (эта игра изо- морфна игре в «чет и нечет» и имеет такую же платеж- ную матрицу). В автомате Д. Хагельбаргера монеты были заменены специальным переключателем и двумя лампочками на пульте управления. Человек, игравший с автоматом, при выборе хода поворачивал переключа- тель, устанавливая его в одно из двух положений, отме- ченных знаками «-]-» и «—». Автомат, делая свой ход, включал одну из лампочек, также обозначенных «+» и «—». Если знаки, выбранные человеком и автоматом, совпадали, выигрывал автомат, а в противном случае выигрыш засчитывался его противнику. Мы уже знаем, что в подобных играх существует оп- тимальная смешанная стратегия для каждого из игро- 135
ков. Она состоит в том, чтобы случайным образом чере- довать чистые стратегии — рыбор герба («+») или реш- ки («—»), пользуясь каждой из этих стратегий одинако- во часто — с вероятностью 1/2. Если игроки придержи- ваются оптимальных смешанных стратегий, то математи- ческое ожидание выигрыша каждого из них равно нулю. Но обычно человек, играя в «две монетки», не придержи- вается такой благоразумной стратегии. Он действует не случайным образом, а закономерно, хотя в большинстве случаев закономерность игры им не осознается, и он уверен, что pro выбор носит случайный характер. Законо- мерность игры человека может быть обнаружена автома- том по небольшому ряду цоследовательных наблюдений. Автомат Д. Хагельбаргера, играя с человеком, запо- минал свои ходы и ходы противника в предыдущих пар- тиях, а также результаты этих партий. Анализируя эту информацию по мере ее накопления, он находил «психо- логическую стратегию», которой подсознательно придер- живался ее противник, и в соответствии с этим изменял свою стратегию, добиваясь выигрыша. Автомат легко выигрывал серию партий у противника, придерживав- шегося следующих трех периодических последовательно- стей выбора хода: -ф, -ф, -ф, ф, ...; —, —, —, —, ...; ф, —•, +, —, +, —, .... Если же человек чередовал свой вы- бор плюсов и минусов более сложным образом, то выиг- рыш автомата не был стопроцентным. Автомат сыграл со служащими компании «Белл» в Нью-Джерси (США) почти 10 тыс. партий, из них он выиграл 5218 партий.и проиграл 4577. Математики подсчитали, что такой счет мог бы возникнуть не из-за «умения» автомата, а благо- даря слепому случаю с вероятностью одной десятймтгл- лиардной. Значит, автомат победил своих соперников не случайно, а именно благодаря «умению» играть! Однако самым увлекательным было состязание авто- мата Д. Хагельбаргера с автоматом, который для этой же цели построил К- Шеннон. «Была сконструирована третья машина — посредник,— вспоминал К. Шеннон,— которая могла передавать информацию от одной машины к другой, считать очки и следить, чтобы игра велась по правилам. Все три машины были соединены вместе и играли несколько часов, причем зрители заключали не- большие пари и сопровождали игру громкими криками. Оказалось, что меньшая и, как предполагалось, менее «умная» машина победила большую со счетом около 55 136
на 45. Возможно, это произошло потому, что она быстрее меняла свои оценки действий партнер» Обе машины ста- раются найти схему друг друга, и как только одна нахо- дит эту схему, другая начинает проигрывать и меняет свою стратегию. Поэтому более гибкий тип имеет опре- деленные преимущества» [26]. Создание технических устройств, способных участво- вать в подобных, по существу психологических, играх заставляет нас пересмотреть представление об играю- щих автоматах. Мы видим, что игра автоматов не обяза- тельно должна отличаться какой-то удручающей стро- гостью, непогрешимостью приемов и оценок, хотя, конеч- но, автоматы склонны к такой «правильной» йгре боль- ше, чем люди. Образ холодного и бесстрастного автома- та-педанта, ставшего обычным для научно-фантастиче- ских произведений последних десятилетий, опровергается теорией игр и практикой создания играющих устройств. Его возможности значительно ниже возможностей совре- менных играющих автоматов, не говоря-уже об автома- тах будущего. Автомат учится играть в камешки Используя принцип обучения «спичечного» робота, предложенный Дональдом Мичи, можно построить не- сложный электронный автомат, обучающийся комбина- торной игре «Последний проигрывает». Как и в других описанных автоматах для игры Баше, здесь роль камеш- ков играют выключаемые автоматом и ее партнером лам- почки. На лицевой панели такого играющего автомата (рис. 53) расположены в ряд семь горящих лампочек, снабженных выключателями, кнопки Ход автомата, На- казание, Сброс, световые табло Вы проиграли и Вы вы- играли и выключатель питания*. Оба игрока (один из них автомат) по очереди отключают одну или две лампы. Проигравшим считается тот, кто своим очередным ходом должен будет выключить последнюю лампочку. Начина- ет игру всегда человек, после каждого своего хода он нажимает кнопку Ход автомата. В случае проигрыша ав- томата он должен нажать кнопку Наказание. Для подго- товки автомата к следующей партии йгры нажимается кнопка Сброс и все рычаги выключателей ламп возвра- щаются в исходное положение. 10—7ЯЯ 137
Принципиальная электрическая схема автомата при- ведена на рис. 54УБлок программы игры образуют реле Р1—Р6 с развязывающими диодами Д1—ДЮ. При сра- батывании реле Р1 его" контакты Р1.2 отключают лампу Л2 (автомат «берет» эту лампу), контакты Р2.2 отключа- ют лампу ЛЗ, контакты Р3.2—лампу Л4, контакты Рис. 53. Внешний вид обучающегося автомата для игры «Последний проигрывает». Р4.2—лампу Л5, контакты Р5.2—лампу Л6, контакты Р6.2—лампу Л7. «Отключение» проигрышных вариантов игры автома- та (вследствие его обучения) производит блок памяти, состоящий из реле Р7—Р11 с развязывающими диодами ДИ—Д15. Реле этого блока «запоминают» проигрышные, ходы и своими контактами отключают их, заменяя дру- гими. Так, после срабатывания реле Р7 автомат в пози- ции 2 (в кучке осталось два предмета, очередной ход должен сделать автомат) будет всегда брать один пред- мет (лампу Л6), оставляя противнику выключение лам- пы JI7 и тем самым обеспечивая себе выигрыш; после .срабатывания реле Р9 в’позиции 4 — лампы Л4 и Л5; после срабатывания реле'РЮ в позиции 6 — лампы Л2п ЛЗ; после срабатывания реле Р11 в позиции 5 —лам- пу ЛЗ. Случайный выбор одного из двух возможных вариан- тов хода автомата осуществляется контактами ДР16.1 поляризованного реле ДРЮ. При подключении обмотки этого реле к источнику переменного тока кнопкой Дн1.3 якорь будет вибрировать с частотой сети, отклоняясь по- очередно то в одну, то в другую сторону. В момент отклю- чения тока контакты КР 16.1 могут оказаться замкнуты- 138
Рис. 54. Схема обучающегося автомата со случайным выбором стра- тегии. 10* 139
ми или разомкнутыми. Если они замкнуты, то сработает реле Р13 и автомат в данной позиции «возьмет» две лам- пы, если разомкнуты, то реле Р13 не сработает и автомат отключит одну лампу. Рассмотрим работу автомата на конкретных приме- рах. Допустим, человек первый ход сделал выключате- лем В1— погасла лампа Л1. После нажатия кнопки Кп1 (Ход автомата) контакты К.Н1.3 замкнут цепь питания поляризованного реле КР16 и его якорь начнет вибриро- вать. Одновременно контакты К.н.1.1 замкнут цепь пита- ния реле Р12, которое сработает и контактами Р12.1 под- ключит к источнику питания реле Р13—Р15, причем реле Р15 сразу же сработает и контактами Р15.1 самоблоки- руется. При отпускании кнопки Кн1 сработает реле Р14 (контакты Р15.2 замкнуты) и его контакты Р14,2 под- ключат к источнику питания блок программы игры. Предположим, что после отпускания кнопки Кн1 кон- такты КР16.1 поляризованного реле оказались замкнуты- ми, в результате чего реле Р13 сработало. Значит, после замыкания контактов Р14.2 сработают также реле Р1 и Р2 (контакты В 1.2 и Р13.1 замкнуты), контактами Р1.1 и Р2.1 они самоблокируются, а контактами Р1.2 и Р2.2 отключают лампы Л2 и ЛЗ— автомат сделает ответный ход. Необходимо отметить, что конденсатор С1 после от- пускания кнопки Ход автомата разряжается через обмот- ку реле Р12 и таким образом задерживает его отпуска- ние (а соответственно и отпускание реле Р13—Р15) для того, чтобы реле блока программы игры успели сработать и самоблокироваться. Время задержки определяется ем- костью конденсатора С1 и должно быть около 0,4— 0,5 с. Допустим далее, что человек при втором ходе выклю- чателем В4.1 погасил лампу Л4. После нажатия кнопки Ход автомата (Кн1) устройство работает так же, как и при первом его ходе. Предположим, что на этот раз пос- ле отпускания кнопки Кн1 контакты КР16.1 оказались разомкнутыми и реле Р13 не сработало. В таком случае срабатывает реле Р4 (контакты В4.2 переключены),кон- тактами Р4.1 оно самоблокируется, а контактами Р4.2 отключает лампу Л5— автомат делает свой второй ход. Далее'человек делает третий ход — выключателем В6.1 гасит лампу Л6. Тогда после нажатия и отпускания кнопки Кн1 (Ход автомата) срабатывает реле Р6, кон- тактами Р6.1 оно самоблокируется, контактами Р6.2 от- 140
ключает лампу Л7 и включает лампу Л8, подсвечиваю- щую табло Вы выиграли. Поскольку автомат проиграл, надо нажать кнопку Кн2 (Наказание). При этом реле Р8 блока памяти сра- ботает (контакты Р4.3 и Р6.3 замкнуты) и контактами Р8.1 самоблокируется. Контакты Р8.2 замыкаются — те- перь в позиции 3 (возникающей, когда противник авто- мата делает ход выключателем В4 и ход должен сде- лать автомат) при нажатии кнопки Ход автомата будут срабатывать реле Р4 и Р5 и контактами Р4.2 и Р5.2 раз- рывать цепи питания ламп Л5 и Л6 независимо от того, какой выбор сделало реле КР16 — замкнуты или разомк- нуты контакты Р13.4. В последующих партиях игры ав- томат в этой позиции будет обеспечивать себе выигрыш. Нажав кнопку ХнЗ (Сброс)—при этом отпускают все ранее сработавшие реле блока программы игры — и установив выключатели В1—В7 в исходное положение, противник автомата может начинать новую партию игры. Предположим, что в следующей партии первым хо- дом человек выключателями В1 и В2 «берет» лампы Л1 и Л2. Пусть после нажатия и опускания кнопки Ход ав- томата контакты КР16.1 поляризованного реле ХР16 будут разомкнуты. Сработает реле Р2, контактами Р2.1 оно самоблокируется, контактами Р2.2 отключит лампу ЛЗ. Допустим, второй ход человек делает выключателем В4 — «берет» лампу Л4. Теперь при ходе автомата сра- ботают реле Р4 и Р5 (контакты Р8.2 замкнуты), само- блокируются контактами Р4.1 и Р5.1, а контактами Р4.2 и Р5.2 отключат лампы Л5 и Л6. Как видим, в этой пар- тии игры автомат в позиции 3, в отличие от предыдущей партии, берет 2 предмета (автомат «обучился» и играет оптимально) и тем самым обеспечивает себе выигрыш, ибо следующим ходом человек вынужден выключить последнюю лампу Л7 (выключателем В7.1). При этом загорается лампа Л9, подсвечивающая табло Вы проиг- рали. Аналогично работает автомат при всех других вари-, анТах игры. Чтобы пройти полный курс обучения и в дальнейшем играть безупречно, автомат должен проиг- рать пять партий (при этом в блоке памяти сработают реле Р7—Р11 и автомат «запомнит», как не следует иг- рать) . В конструкции описанного автомата можно использо- вать: Л1—Л9 — лампы накаливания ЛН 3,5 В X 0,28 А; 141
Pl—P6 — реле РЭС-22 (паспорт РФ4.500.131); Р7—PH, Р14 и Р15 — реле РЭС-9 (паспорт РС4.524.200); Р12 — реле РСМ-1 (паспорт Ю.171.81.37)^ Р13 — реле РС-13 (паспорт РС4.523.017); КР16 — реле РП-4; В1—В7 — выключатели ТП1-2; В8 — ТВ2-1. Кнопки могут быть самодельными, изготовленными из контактных пружин реле. Силовой трансформатор Тр намотан на сердечнике из пластин Ш32, толщина пакета 20 мм (обмотка 1 со- держит 1220 витков, обмотка 11—150 витков, обмот- ка III — 20 витков провода ПЭВ-1 или ПЭЛ-0,47). В описанном играющем автомате выбор его стратегии (взять один или два предмета) определяется датчиком двух равновероятных стратегий — контактами поляризо- ванного реле. Можно, однако, применить и другой прин- цип— последовательный перебор стратегий. Примени- Рис. 55. Схема обучающегося автомата с последовательным перебо- ром стратегий. 142
дельно к нашему автомату это будет выглядеть так: в любой позиции автомат своим ходом отключает одну, лампочку; если он выиграет, то и в последующих парти- ях будет в этой позиции выключать одну лампочку; если ще он проиграет, то меняет стратегию — в этой же пози; ции в следующий раз будет выключать две лампочки. Принципиальная схема такого автомата с последова- тельным перебором стратегий изображена на рис. 55. После срабатывания реле Р7 блока памяти автомат бу- дет выключать две лампочки в позиции 4, после сраба- тывания реле Р8 — две лампочки в позиции 6, после сра- батывания реле Р9 — две лампочки в позиции 3. В ос- тальном он работает так же, как первый автомат. Используя рассмотренные принципы обучения, мож- но сконструировать обучающиеся автоматы для таких игр, как «Побеждает последний», «Набери чет», «Ход конем» и другие комбинаторные игры. Представляет большой интерес создание таких самообучающихся иг- рающих автоматов, у которых процесс обучения осуще- ствлялся бы не только отбрасыванием проигрышных стратегий, но и увеличением вероятности выбора выиг- рышных стратегий. Проницательный партнер В начале этой главы мы рассказали о созданном Д. Хагельбаргером автомате для стратегической игры в «две монетки», который мог в процессе игры изучать поведение противника-человека и с учетом накопленного опыта перестраивать свою стратегию, добиваясь выиг- рыша. Автомат Д. Хагельбаргера — это довольно слож- ное кибернетическое устройство, содержащее более ста электромагнитных реле, шаговых искателей и много дру- гих электромеханических и электронных узлов. Однако вполне возможно, сохранив и использовав основные идеи автора этого автомата, существенно упростить его схему и конструкцию и построить простой играющий автомат, способный вести себя в этой игре подобно электронному игроку американского кибернетика. Наш проницательный партнер, как и автомат Д. Ха- гельбаргера, в каждой партии игры делает выбор хода на основе исходов двух предыдущих партий. В случае выигрыша в двух последних партиях он сохраняет выбор, сделанный в последней партии; при проигрыше два раза 143
подряд ой с равной вероятностью выбирает герб («+») или решка («—»); если же в двух последних партиях игры имел место один выигрыш и один проигрыш авто- мата, то он с вероятностью 0,75 сохраняет выбор, сде- ланный в последней партии. Именно такая гибкость стра- тегии позволяет автомату добиться перевеса в общем счете очков. На лицевой панели автомата (рис. 56) расположены: выключатель питания, ключ Ход человека, кнопки Ход Рис. 56. Внешний вид играющего автомата. автомата и Сброс, две пары лампочек, отмеченные зна- ками «+» и «—» и фиксирующие ходы человека и авто- мата, световые табло Вы проиграли и Вы выигра- ли, а также счетчики выигрышей человека и ав- томата. Кроме того, на панели укреплена табличка с правилами игры, которые сводятся к следующему. Вклю- чив питание автомата, человек посредством ключа должен сделать свой ход, выбирая «+» или «—», на лицевой панели загорается соответствующая лампочка. Затем нужно нажать кнопку Ход автомата. При этом свой вы- бор делает автомат (на панели также зажигается соот- ветствующая лампа). Если знаки, выбранные авто- матом и человеком, совпали, то выиграл автомат — вспыхивает табло Вы проиграли, и счетчик его очков фиксирует одно очко; если же игроками были выбраны разные знаки, то выиграл противник автомата — вспых- нет табло Вы выиграли, и одно очко отметит счетчик вы- 144
игрышей человека. После этого нужно, нажав кнопку Сброс, подготовить автомат к следующей партии. Принципиальная электрическая схема автомата по- казана на рис. 57. Основные блоки автомата: блок уп- равления, собранный на основе двух реле времени с тран- зисторами Т1 и Т2 и электромагнитных реле Р5—PH; блок выбора хода автомата с электромагнитным реле Р4 и дисковым коммутатором ДК1, который приводится в движение двигателем Ml и обеспечивает случайный выбор хода с заданной вероятностью; блок памяти на электромагнитных реле Р1—РЗ и диодах Д1 и Д2; блок индикации, содержащий индикаторные лампы Л1—Л4 для фиксации ходов человека и автомата и лампы Л5— Л6 для подсвета табло Вы проиграли и Вы выиграли; блок счета очков автомата и его противника, собранный на основе электромагнитных импульсных счетчиков Сч1 и Сч2; блок питания с трансформатором Тр и выпрями- телями на диодах ДЗ—Д6. Работу автомата удобно рассмотреть на конкретных примерах его игры с человеком. При включении выклю- чателя питания В4 выпрямленное напряжение поступает на реле времени с транзисторами Т1 и Т2. Транзистор Т2 открывается (на его базу подается отрицательный потенциал через резистор R5), и реле PH срабатывает, его контакты Р11.1 в блоке 5 и контакты Р11.2 в блоке 3 размыкаются. Транзистор Т1 оказывается закрытым, поэ- тому реле РЮ в его коллекторной цепи не срабатывает. В этом состоянии автомат готов начать игру. Допустим теперь, что, начиная первую партию, про- тивник автомата выбрал «+» и перевел в соответствую- щее положение ключ В1. При этом контактами В 1.3 включается лампочка Л1, подсвечивающая этот знак на лицевой панели. Чтобы свой ход сделал автомат, следует нажать кнопку Кн1 (Ход автомата). При этом контакты Кн1.2 замыкают цепь питания двигателя Ml и он при- водит в движение дисковый коммутатор ДК.1. Этот ком- мутатор состоит из подвижного пластмассового диска, частично покрытого медной фольгой, и четырех непод- вижных контактных щеток. К щетке Щ4, которая при- жата в центральной части диска, подводится напряжение от выпрямителя; остальные три щетки через логическую цепочку контактов реле Р1—РЗ блока памяти могут со- единяться с обмоткой реле Р4. Колццевые поверхности частей диска, по которым скользят при его вращении 145
Рис. 57. Принципиальная схема играющего автомата. 'Вы Выиграли. Вы проиграли.
щетки. Щ1, Щ2 и ЩЗ, соответственно на 3/4, 1/2 и 1/4 части покрыты металлической фольгой. При случайной и произвольной продолжительности работы двигателя после его остановки контакты щетка —диск будут про- пускать ток лишь в случаях: щетка Щ1 — в среднем в трех случаях из четырех, Щ2— в одном случае из двух, ЩЗ — в одном случае из четырех. Поэтому реле Р4 будет срабатывать случайным образом, но с вероятностями 3/4, 1/2 или 1/4 в зависимости от того, к какой из щеток присоединена обмотка этого реле (для обеспечения более точной выдержки указанных вероятностей целесообразно токопроводящие участки диска раз- бить на узкие секторы, как показа- но на рис. 58). Если реле Р4 срабо- тает, то это означает, что автомат- выбрал «+»,'— контакты Р4.5 вклю- чают лампу Л4, подсвечивающую этот знак на лицевой панели; если же реле Р4 не сработает, то контак- ты Р4.5 включают лампу ЛЗ — авто- мат выбирает «—». Итак, при нажатии кнопки Ход автомата контакты К.н.1.2 включают Рис. 58. Диск ком- мутатора с токопро- водящими секторами. двигатель дискового коммутатора, а контакты Дн/J замыкают цепь пи- тания обмотки реле Р5. Диск начи- нает вращаться; реле Р5 срабаты- вает и самоблокируется контактами Р5.1, а контакты Р5.2 подготавливают к включению реле Р4 и Р6. После отпускания кнопки Ди/ (Ход автомата) двигатель Ml останавливается, а контакты Kftl.l под- ключают положительный полюс источника питания к обмотке реле,- Р4. Одновременно срабатывает реле Р6 и самоблокируется контактами Р6.Р, контакты Р6.2, замыкаясь, подготавливают к включению счетчики Сч1 и Сч2; контакты Р6.3 подключают питание к лам- почкам ЛЗ (—) или Л4 (+), а также к лампочкам Л5 (табло Вы проиграли) или Л6 (табло Вы выиграли). Контакты Р6.4 размыкают цепь питания двигателя Ml, исключая возможность повторного его включения нажа- тием кнопки Ди/, если противник автомата, видя небла- гоприятный исход данной партии, пытается изменить его выбор. Контакты Р6.5 подключают к источнику тока об- мотку реле Р8, которое, однако, срабатывает не сразу, 147.
так как параллельно его обмотке включен конденсатор С2 большой емкости. Этот конденсатор задерживает срабатывание реле Р8, давая возможность реле Р4 (в случае его срабатывания) самоблокироваться контак- тами Р4.1 (одновременно переключаются контакты реле Р4 в других блоках). В первой партии игры автомат, делая свой ход, может выбрать с равной вероятностью «Н-» и «—», Для реали- зации этой стратегии контакты Р2.2 и РЗ.З присоединя- ют к обмотке реле Р4 щетку Щ2. Допустим, что автомат выбрал «+». Реле Р4 сработало и самоблокировалось (контактами Р4.1)-, на лицевой панели загорелась лам- почка Л4- (+) и вспыхнуло табло Вы проиграли (лам- почка Л5) — эта партия игры закончилась выигрышем автомата. По прошествии нескольких десятых долей секунды должно включиться в работу реле Р8, срабатывание ко- торого было задержано процессом зарядки конденсато- ра С2. Сработав, это реле контактами Р8.2 отключает питание логической цепочки блока выбора хода (это не- обходимо для того, чтобы последующие переключения в блоке памяти не могли изменить сделанный автоматом выбор, а контактами Р8.1 переключают заряженный конденсатор СЗ на режим разряда (через'цепочку рези- сторов), приводя в действие реле времени на транзисторе Т1. Этот транзистор открывается, и реле Р10 срабаты- вает. Контакты Р10.2 подключают питание к обмотке реле Р7, зашунтированной конденсатором С1; реле Р7 через некоторое время срабатывает, и его контакты Р7.1 размыкаются. Конденсатор С4 начинает разряжаться, и по мере его разряда ток в цепи базы транзистора Т2 будет уменьшаться — это вызовет уменьшение коллек- торного тока и последующее отключение реле Р11. Кон- такты Р11.1 и Р11.2 замкнутся и к источнику питания будут подключены счетчики и блок памяти. В рассматриваемом примере сработает счетчик Сч1 (В1.2 в положении «-)-» и контакты Р4.3 переключены), отсчитывая одно очко в пользу автомата. В блоке памя- ти срабатывает реле Р2, регистрируя выигрыш автомата (В1.1 в положении «+» и контакты Р4.2 переключены), и реле Р1, фиксируя выбор автоматом знака «+». Отметим, что- в блоке памяти реле Р1 «запоминает» выбор, сделанный автоматом в последней партии, а реле Р2 и РЗ хранят сведения о исходе двух последних партий 148
(срабатывание реле Pl означает выбор автоматом знака «+»; срабатывание реле Р2 и РЗ — выигрыш автомата, несрабатывание — его проигрыш). Параметры обоих реле времени (на транзисторах Т1 и Т2) необходимо подобрать таким образом, чтобы реле РЮ работало до тех пор, пока не отключится реле PH (регулировка выдержки времени производится резисто- рами R3 и R7 с переменными сопротивлениями). После того как реле РЮ отключится, контакты Р10.2 разомк- нут цепь питания реле Р7. Реле Р7 через долю секунды отключается (задержка определяется емкостью кон- денсатора С1) и контактами Р7.1 подключает «—» вы- прямителя к реле времени на транзисторе Т2. Реле PH сработает и отключит контактами Р11.1 и Р11.2 соответ- ственно питание счетчиков и блок памяти. Последующее нажатие кнопки Кн2 Сброс приводит к размыканию цепи питания реле Р5—Р8 и их отклю- чению контактами Кн2.2. Одновременно контакты Кн2.1 включают реле Р9 (в качстве контактов Rh2.1 применен кнопочный выключатель от настольной лампы, поэтому после отпускания кнопки Rh2 контакты Кн.2.1 остаются замкнутыми; для их размыкания нужно еще раз нажать кнопку Кн2, что будет сделано после следующей партии игры); контакты Р9.1 переключаются, обеспечивая пода- чу напряжения в следующей партии на реле РЗ. Продолжим рассмотрение работы автомата на при- мере второй партии игры. Автомат работает совершенно аналогично описанному ранее, но только выбор «+» бу- дет осуществляться уже с вероятностью 0,75 (реле Р1 и Р2 сработали, и логическая цепочка подключила к реле Р4 щетку Щ1), Это вполне соответствует алгоритму иг- ры, поскольку при наличии в двух предыдущих партиях одного проигрыша и одного выигрыша выбор автомата в последней партии сохраняется с вероятностью 0,75. В предыдущей партии автомат выбрал «-(-» и выиграл, а поскольку в его памяти нет результата более ранней партии, он «считает» ее проигранной. Допустим, что и в этой партии автомат выбрал «-)-» (реле Р4 сработало), и человек тоже выбрал «+». Рас- смотрим, каким образом блок памяти, состоящий из ре- ле Р1—РЗ, запоминает исход двух последних партий игры и выбор автомата в последней партии, освобож- даясь от сведений об исходе более ранних партий. Сра- батывание реле РЮ (оно срабатывает после того, 149
как автомат сделает свой ход) приводит к отключению контактами Р10.1 цепи самоблокировки реле Р1—РЗ. Ре- ле Р1 отключается («забывает» выбор автомата в преды- дущей партии) и готово «запомнить» выбор, сделанный автоматом в данной партии. Однако реле Р2 не отклю- чается («помнит» исход последней партии), потому что контакты Р9.2 (реле Р9 включено, и контакты Р9.2 пере- ключены) включены параллельно контактам Р10.1 и, хо- тя контакты Р10.1 разомкнуты, на реле Р2 подается на- пряжение. Цепь самоблокировки реле РЗ также размы- кается контактами Р10.1. При отключении реле PH в блок памяти на реле Р1 и РЗ подается напряжение (через контакты Р11.2 и це- почку «выигрыш-проигрыш», состоящую из В 1.1 и Р4.2), они срабатывают и самоблокируются. Теперь после окон- чания этой партии игры нужно снова нажать кнопку Кн2 Сброс. При нажатии этой кнопки контакты Кн2.1 разры- вают цепь питания реле Р9 (кнопочный выключатель отключает обмотку этого реле). После двух сыгранных партий (в рассматриваемом здесь примере) на счету автомата два выигрыша (реле Р2 и РЗ включены). В третьей партии при нажатии кноп- ки Кн1 Ход автомата сработавшее реле РЮ контактами Р10.1 отключает цепь самоблокировки реле Р1—РЗ. Ре- ле Р1 и Р2 отключаются (Р/ «забывает» выбор автомата в предыдущей партии, а реле Р2 — исход игры в первой сыгранной автоматом партии игры). Реле РЗ не отклю- чается («помнит» исход второй партии), потому что кон- такты Р9.2 подают напряжение в цепь самоблокировки этого реле. После того как реле PH отключится, напря- жение подается на реле Р1 и Р2 и, в зависимости от того, какой выбор был сделан человеком и автоматом, реле сработают или не сработают. Поскольку реле РЮ отключается после разряда кон- денсатора СЗ раньше, чем снова включается реле PH (контакты Р10.2 разорвут цепь питания Р7, которое отключится не сразу, а через некоторое время, необходимое для разряда конденсатора С1 через обмот- ку реле Р7, и лишь затем контакты Р7.1 замкнутся и реле PH сработает), контакты РЮ.1 'замкнутся раньше, чем разомкнутся контакты Р11.2, и сработавшие реле блока памяти успеют самоблокироваться до того, как подача напряжения в блок памяти прекратится. Таким образом, контакты Р9.1 обеспечивают попеременное соединение 150
реле Р2 и РЗ с источником электропитания через логи- ческую цепочку выигрыш — проигрыш (В1.1 и Р4.2) а контакты Р9.2 обеспечивают попеременное подключение напряжения к цепям самоблокировки реле Р2 и РЗ с тем, чтобы при размыкании контактов Р10.1 отключалось то реле, которое должно «забыть» старый результат игры и «запомнить» новый. Наличие в цепях самоблокировки реле Р2 и РЗ дио- дов Д1 и Д2 позволяет избежать ложной подачи напря- жения на одно из этих реле. В автомате применены: лампы накаливания ЛН 3,5 ВХ Х0,28 A; Ml—электродвигатель ДСД-60; Сч1 и Сч2 — электромагнитные импульсные счетчики СЭИ-1; Р1,РЗ — реле РЭС-9 (паспорт РФ4.500.131); Р2, Р5, Р7 — Р11— Рис 59. Конструкция кнопки Рис. 60. Конструкция кнопки «Ход автомата». «Сброс». реле РЭС-9 (паспорт РС4.524.201); Р6 — реле РС-13 (паспорт РС4.525.017); переключатель В1 — телефонный ключ типа КТРО; Кн1 — самодельная кнопка, набрана из контактных групп реле или телефонного ключа (рис. 59); Кн2 — кнопочный выключатель Кн2.1, с которым механи- чески соединена группа размыкающих контактов Дн2.2 (рис. 60) (кнопочный выключатель 1 смонтирован на железной скобе 2, которую крепят на лицевой панели с обратной стороны; кнопка выключателя 3 удлиняется стержнем с головкой 4 — их склеивают клеем БФ-6; к кнопке 3 жестко крепят пластину 5, посредством которой при нажатии на кнопку Кн2 размыкаются контакты К3.2); Т1—Т2 — транзисторы МП42 с коэффициентом Й21э=50-=-70; С1—С4 — конденсаторы электролитические 500 мкФ, 25 В; Д1—Д6 — диоды Д226Б; трансформатор блока питания собран из пластин Ш20, толщина набора 20 мм /сетевая обмотка 1 содержит 2750 витков провода ПЭЛ-0,15; обмотка II — 300 витков провода ПЭЛ-0,35; обмотка III — 44 витка провода ПЭЛ-0,5). 151
При правильном выполнении всех электрических со- единений автомат не нуждается в наладке. Необходимо лишь установить (при помощи резисторов R3 и R7) вре- мя выдержки реле РЮ и ^11 таким образом, чтобы реле РЮ работало до тех пор, пока не отключится реле Р11, а продолжительность времени с момента отпускания че- ловеком кнопки Кн1 до момента отсчета показаний на счетчиках не превышала 2—3 с (чтобы не затягивался процесс игры), ГЛАВА ШЕСТАЯ ИГРЫ «БЕЗ ПРАВИЛ» Рефлексивные игры «Долго длилась осада Трои. Но все же никак не мог- ли греки овладеть городом. Тогда Одиссей уверил гре- ков действовать хитростью. Знаменитый художник Эпей соорудил громадного деревянного коня. В него вошли Неоптолем, Менелай, Диомид, Одисбей и другие герои. Вся внутренность коня заполнилась вооруженными вои- нами. Затем греки сожгли все постройки в своем лагере, сели на корабли и отплыли в открытое море. С высоких стен Трои осажденные видели необычай- ное движение в стане греков. Поняли они, что греки по- кинули Троаду. Ликуя, вышли троянцы из города. Они были уверены, что теперь кончилась осада, миновали все бедствия. Вдруг в изумлении остановились троянцы: оии увидели деревянного коня. Смотрели они на него и терялись в догадках, что это за изумительное соору-, жение. Начался спор. Одни советовали бросить коня в море, другие же — везти в город, и поставить на ^акрополе. И помрачили боги разум троянцев —они все-таки ре- шили везти в город коня. Разобрали они часть город- ской стены, так как громадного коня нельзя было про- везти через ворота, и с ликованием, под музыку и пение, наконец, притащили коня в акрополь. Наступила ночь. Троя погрузилась в глубокий сон. Осторожно, стараясь не производить шума оружием, выш- 152
ли из коня герои, рассыпались по погруженным в сон ули- цам. На помощь героям явились и остальные греки, укры- вавшиеся на кораблях за островом Тенедосом. Через про- лом в стене ворвались они в Трою. Началась ужасная битва. Запылали дома, кровавым заревом освещая гиб- нущую Трою. Никого не щадили греки... По столбам дыма и громадному зареву ночью узнали окрестные на- роды, что пала Троя, которая была самым могуществен- ным городом в Азии...» Конфликт, описанный в этом отрывке из пересказан- ной К. А. Куном «Энеиды» древнеримского поэта Вер- гилия [11], следует отнести к играм особого рода — та- ким стратегическим играм, в которых один из игроков стремится обмануть и перехитрить другого, имитируя с этой целью рассуждения своего противника. Подобные игры, где дозволенными считаются любые обманные дей- ствия участников, являются довольно точными моделя- ми многих реальных жизненных конфликтов. Имея в виду эту особенность стратегических игр, их иногда на- зывают рефлексивными играми (термин «рефлек- сивный» подчеркивает, что игроки отражают в мышле- нии рассуждения друг друга). К обычным приемам иг- _ роков в рефлексивных играх можно отнести распростра- нение ложных слухов, маскировку и другие способы дезинформации противника, интриги, клевету, шантаж и различные формы провокации (от детской забавы с подброшенным кошельком, моментально уплывающим, как только прохожий нагибается за ним, до воздействий идеологического характера). Главным инструментом достижения превосходства в рефлексивной игре является ложь, обман партнера в той или иной форме; побеждает здесь тот из игроков, кто обладает более высоким рангом рефлексии, т. е. луч- ше может проимитировать ход рассуждений противника при выборе образа действий. Этот более хитрый и ковар- ный игрок фактически управляет во время игры поведе- нием своего доверчивого партнера, хотя последний и не догадывается об этом. Чрезвычайно интересным и перспективным представ- ляется использование ЭВМ и других кибернетических устройств-автоматов для осуществления рефлексивного управления поведением противника в различных страте- гических играх. Об этом многократно свидетельствуют любопытные опыты по изучению возможности рефлек- П—788 153
сивного взаимодействия человека с играющей машиной, выполненные в Московском энергетическом институте советскими кибернетиками В. А. Лефевром и Г. Л. Смо- ляном. Специально изготовленное устройство имело на лице- вой панели лабиринт с несколькими выходами (рис. 61). В центральную часть лабиринта помещался «пут- ник», который мог передвигаться в поисках выхода. Дви- жениями «путника» управлял программный блок, в ко- тором не было информации о том, где находятся выхо- ды из лабиринта. Перед че- ловеком ставилась задача: не выпустить «путника» из лабиринта. Игра происходила так. Перед каждым ходом маши- ны человек нажимал спе- циальные кнопки, давая ей указания, в какую сторону передвинуть «путника». Ма- шина же при каждом своем ходе могла «послушаться» человека и последовать его указаниям, но могла и «не послушаться», передвинув «путника» в противополож- ном направлении. При правильных выборах направле- ния движения «путник» мог выбраться из лабиринта за пять ходов. Разумеется, человеку следовало стремиться своими указаниями дезинформировать машину, скрывая от нее сведения об истинном расположении выходов из лабиринта. Человек побеждал, если ему удавалось про- держать «путника» в лабиринте более 25 ходов; в про- тивном случае победа присуждалась мащине. В качестве противников машины выступали 32 сту- дента МЭИ. Каждый из них инструктировался перед игрой, а затем играл с машиной две партии. Всего было сыграно 64 партии. Оказалось, что машина побеждает гораздо чаще, чем человек. По данным 64 партий была вычислена средняя продолжительность блуждания «пут- ника» в лабиринте в условиях противодействия со сто- роны человека. Она оказалась равной 15 ходам в пер- вых партиях и 18 ходам—во вторых. Этот результат был сопоставлен со средним числом ходов, которые соверша- 154
ет блуждающий «путник», если он, выбираясь из лаби- ринта, избирает направления своих перемещений нау- гад, не принимая во внимание противодействующие указания человека. Среднее число ходов «путника» при случайном блуждании оказалось равным -25. Это свиде- тельствует о том, что противодействие человека помо- гает машине ускорить вывод «путника» из лабиринта. Такое улучшение поведения достигается машиной бла- годаря тому, что она проводит рефлексивное управление своим противником. Рассмотрим одну из партий, развернутое по ходам изображение которой приведено на рис. 62, а. По гори- зонтали пронумерованы ходы машины — шаги «путни- ка», по вертикали — узловые точки лабиринта от центра, обозначенного цифрой 1, до одного из выходов, обозна- ченных цифрой 6. Жирными стрелками на рисунке-от- мечены перемещения «путника», пунктирные стрелки обозначают указания человека. Первые пять ходов ма- шина выполняет указания человека (пунктирные линчи стрелок совпадают с жирными). У человека на протя- жении этих ходов создается впечатление, что машина его всегда слушается. Поэтому он и в следующих ходах продолжает свою тактику — указывает «путнику» путь И* 155
к центру лабиринта. Но с 6-го хода машина меняет свою тактику и начинает действовать противоположно указа- ниям своего противника. Последний не успевает осознать это, продолжает выводить «путника» к центру и проиг- рывает. В другой партии (рис. 62, б) вскоре после 6-го хода человек сумел проимитировать начавшееся непослуша- ние и стал указывать-правильный путь к выходу из ла- биринта. Начиная с 12-го хода машина вновь слушается; человек для осознания этой перемены потратил два хода. На 14-м ходу машина вновь меняет свое поведение, но человек, убежденный еще в послушании «путника», не успевает изменить свою тактику и выпускает «путника» из лабиринта. В. А. Лефевр и Г. Л. Смолян подчеркивают, что в этих опытах победа машины «объясняется тем, что она формирует вполне определенное поведение человека, использует его, тем самым формируя новое, затем .меня- ет свое, формирует другое поведение и т. д., в среднем обгоняя человека. В этих партиях автомату удавалось провести рефлексивное управление и выудить у челове- ка информацию, необходимую для более быстрого реше- ния задачи ...» [12], Без путеводной нити Ариадны Приведем здесь описание сравнительно простого ки- бернетического устройства, которое подобно программ- ному блоку в опытах В. А. Лефевра и Г. Л. Смоляна способно рефлексивно взаимодействовать со своим про- тивником— человеком и благодаря сознательному про- тиводействию последнего улучшает свое «поведение». Для этого еще раз обратимся к древнегреческой мифо- логии. Читатель, конечно, помнит легенду о подвиге Тезея; который пробрался в огромный лабиринт критского ца- ря Миноса, где обитало страшное чудовище Минотавр, пожиравшее людей, и убил его. Согласно этому мифу вы- браться из лабиринта герою помогла дочь царя Ариад- на, снабдившая Тезея для этого клубком ниток. Блуж- дая по запутанным переходам лабиринта в поисках вра- га, Тезей разматывал клубок, а потом, расправившись с чудовищем, по нитке смог найти выход из лабиринта. В нашей истории действуют персонажи из этого древ- 156
негреческого мифа, но несколько изменена фабула леген- ды. В центре составленного из ромбов симметричного лабиринта (рис. 63) находится «путник», которого по- добно легендарному герою назовем Тезеем. Ему необхо- димо пробраться из центра лабиринта к одному из вы- ходов, обозначенных на схеме узлами 1 и 15. У нашего Тезея, в отличие от его легендарного тезки, нет спаси- Рис. 63. Лабиринт для игры «Тезей и Минотавр». тельной путеводной нити Ариадны. К тому же в каждом узле лабиринта Тезея ожидает вездесущий противник — назовем его по аналогии с чудовищем из греческого ми- фа Минотавром. Минотавр указывает Тезею, куда ему идти. Эти указания могут быть верными или неверны- ми. Дело в том, что, как известно Тезею, у одного из выходов Минотавр хранит несметные сокровища. Одна- ко, какой из выходов (7 или 15) ведет к кладу, Мино- тавр, разумеется, скрывает и уж всячески будет старать- ся запутать Тезея, чтобы он туда не попал. Сознавая это, Тезей может следовать указаниям Минотавра, но может и направляться в противоположную сторону. Сумеет ли Тезей перехитрить Минотавра и, «выудив» у него необходимую информацию, попасть к нужному выходу из лабиринта? Описанные выше опыты московских кибернетиков показывают нам, как должен действовать Тезей, чтобы добиться успеха. Очевидно, ему следует воспользоваться противодействием Минотавра и вступить £ ним. в рефлек- сивное взаимодействие. Например, Тезей может первые несколько ходов беспрекословно выполнять указания своего противника, формируя у него убеждение в «пос- лушании», а затем это сформировавшееся убеждение использовать в своих интересах. Рассмотрим один из вариантов, по которому могут развиваться события. Предположим, что Минотавр спрятал свои сокрови- ща у выхода 7, а Тезей вначале находится в узле 8. 157
I. Минотавр указывает на узел 9, Тезей переходит в узел 9. 2. Минотавр указывает на узел 11, Тезей переходит в узел 11, 3. Минотавр указывает на узел 12, но Тезей, не выпол- нив это указание, переходит в противоположный узел 10. 4. Однако Минотавр еще верит, что Тезей «послушен» и, пытаясь направить его в другой конец лабиринта, указывает на узел 11. Но Тезей не подчиняется и выби- рает противоположный узел 8. 5. Двух «непослушаний» вполне достаточно, чтобы убедить Минотавра, что теперь Тезей ему не повинуется. Минотавр указывает на узел 7, полагая, что Тезей вы- берет противоположный узел 9. Однако и Тезей, исходит из того, что он «переучил» Минотавра, й выполняет его указание — переходит в узел 7. 6. Минотавр помнит, что раньше Тезей «слушался» два хода подряд; поэтому указать путь, ведущий к выходу 1, он опасается: а вдруг Тезей все-таки послу- шается». Поэтому Минотавр -указывает на узел 8. Однако Тезей учел опасения Минотавра и переходит в противоположный узел 5. 7. Запутавшийся Минотавр предполагает, что уж теперь-то его противник снова должен быть «непос- лушным»,— и указывает на узел 3. Однако Тезей под- чиняется и переходит в узел 3. 8. Полагая, что Тезей не может быть два раза подряд «послушным». Минотавр указывает на узел 2. Но Тезей учитывает это, и снова подчиняется — переходит в узел 2. 9. В панике Минотавр указывает на узел 4, пытаясь увести Тезея от выхода из лабиринта. Однако Тейзей не ошибается и выбирает противоположный узел 1. Путь к сокровищам Минотавра открыт. Таким образом, в данном варианте взаимодействия Тезея с Минотавром всего девять ходов потребовалось герою, чтобы найти нужный выход из лабиринта. Если бы он в каждом узле определял направление своего движения наугад, то для выхода из лабиринта ему потребовалось бы в среднем около 25 ходов; при этом, возможно, он нашел бы и не тот выход, который ему нужен. Следовательно, налицо оптимизация действий Тезея, который сумел (в рассматриваемом примере) путем рефлексивного управления Минотавром получить 158
от него столь тщательно скрываемые сведения и найти нужный ему выход из лабиринта. В описываемом ниже автомате роль Тезея играет релейноконтактное логическое устройство; функцию Минотавра выполняет играющий с автоматом человек. Внешний вид автомата показан на рис. 64. На лицевой панели изображен лабиринт, в узлах которого установ- лены электрические лампочки. Две из них (в узлах 1 и 15)'— окрашены в красный цвет, остальные лампоч- ки — в зеленый. Во время игры загорающиеся лампочки Рис. 64. Внешний вид играющего автомата «Тезей и’Минотавр». указывают местонахождение Тезея. Здесь же на лице* вой панели расположены: выключатель сети, Переклю- чатель Выход для фиксации задуманного человеком вы- хода из лабиринта (/ или 15— того, где «укрыты сок- ровища»), переключатель программ поведения Тезея, кнопки Ход Тезея и Сброс, счетчик числа ходов Тезея, а также световые табло Лабиринт пуст и Конец прог- раммы — под табличкой Вы выиграли, и световое табло Выход найден — под табличкой Вы проиграли. На спе- циальной боковой панели автомата слева находится плата ввода программ, прикрытая крышкой. Каждый переход, соединяющий два соседних узла лабиринта на лицевой панели, имеет посередине ром- бовидное гнездо. Оно предназначено для установки штекера, который представляет собой трехгранный стержень с укрепленной на нем стрелкой (рис. 65). С помощью этого штекера-стрелки во время игры 159
противник автомата (Минотавр) указывает ему (Те- зею) направление движения. Если вставить штекер в гнездо, то трехгранный стержень войдет в ту полови- ну ромба, куда указывает стрелка. Например, если стрелка указывает на переход из узла 12 в узел 11 (рис. 66), то стержень штекера войдет в левую поло- вину ромбического отверстия; если же нужно указать на переход из узла 11 в узел 12, то стержень войдет в правую половину гнезда. Под лицевой панелью у каждого гнезда укреплены три группы контактов. Две группы, расположенные у остроугольных вершин ромба, состоят из двух пар нормально разомкнутых контактов (рис. 67, а). Третья группа, укрепленная у одной из тупоугольных вершин ромба, образует одну пару замыкающих контактов (рис. 67, б). При установке штекера в гнездо всегда будут замыкаться контакты у тупоугольной вершины ромба и контакты, расположенные у той остроугольной вершины, куда направлена стрелка штекера. Например, если ввести штекер в гнездо, изображенное на рис. 66, таким образом, чтобы стрелка указывала направление от узла 11 к узлу 12, то замкнутся контакты, располо- женные справа, и контакты у тупоугольной вершины ромба. Контакты, установленные около тупоугольных вер- шин всех ромбических гнезд, соединяются параллельно и на принципиальной схеме автомата (рис. 68) обозна- чены как один выключатель В80. Контакты же, распо- ложенные около остроугольных вершин ромба, объеди- нены в группы. В табл. 14 в правой колонке указаны контакты, которые соединены между собой параллель- но, а в левой — условные обозначения этих контактов на принципиальной схеме. Обозначения контактов в Рис. 65. Штекер. Рис. 66. Ромбовидное гнездо для штекера. 160
Рис. 67. Устройство контактных групп гнезда. правой колонке таблицы даны в соответствии с номе- рами узлов лабиринта, между которыми они находятся. Например, контакты, укрепленные в той вершине ром- ба, которая направлена от узла И к узлу 12, обознача- ются 11-12 (т. е. эти контакты замыкаются, когда ште- кер-стрелка указывает направление от узла 11 к узлу 72); контакты, укрепленные на противоположной вер- шине ромба, обозначаются 12-11, Аналогично обозна- Таблица 14 Обозна- чение контак- тов на схеме Номера контактов, объединенных в группы Обозна- чение контак- тов на схеме Номера контактов^ объединенных в группы В1 2—1 В14 12-14, 13—14 В2 3—2, 4—2 В15 14—15 ВЗ 5—3, 2—3 В16 2—3, 2—4 В4 5—4, 2—4 В17 3—5, 4—5 В5 3—5, 4—5, 6—5, 7—5 В18 2—1, 5—6, 5—7 В6 5—6, 8—6 В19 3—2, 4—2, 6—8, 7—8 Ь7 5—7, 8—7 В20 5—3, 5—4, 8—9, 8— 10 Ви 6—8, 7—8, 9—8, 10—8 В21 6—5, 7—5,9—11, 10—11 В9 8—9, 11—9 В22 8—6, 8—7, 11—12, В10 8—10, 11—10 11—13 ВЦ 9—11, 10—11, 12—11, В23 9—8, 10—8, 12-14, 13-11 13—14 В12 11—12, 14—12 В24 11-9, 11-10, 14-15 В13 11—13, 14—13 В25 12—11, 13—11 В26 14—12, 14—13 161
Рис. 68. Принципиальная схема «Тезей и Минотавр». 162
чаются контакты, расположенные у других гнезд. Контактные группы 1-2 и 15-14 отсутствуют — они не нужны. Заметим, что каждая контактная группа встречается в правой колонке таблицы дважды, пос- кольку она состоит из двух пар контактов. Например одна пара контактов 7-5 соответствует В5, дру. гя — В21. Чтобы задать программу действий автомата, т. е. определить, будет ли Тезей, делая свой тот или иной очередной ход, верить человеку (Минотавру) или пет, служат выключатели В27—В51 (1-я программа) и В52—В76 (2-я программа). Включение выключателя означает, что автомат не верит, выключение — верит. Конструктивно выключатели выполнены в виде замыкаю- щих контактов, которые замыкаются при введении спе- циальных круглых штекеров в гнезда на плате про- грамм. На этой плате расположены два ряда гнезд, под ними укреплены контакты для установки штекеров — по 25 гнезд в ряду. Выключатели В27—В51 — соедине- ны с контактными ламелями П1И1.1 шагового искателя, а выключатели В52—В76 — с ламелями ШИ 1.2. Таким образом, в автомат можно ввести две различные двад- цатипятиходовые программы действий Тезея. Перед началом игры установкой штекеров в гнезда на плате программ вводят программы действий автома- та (разумеется, программы вводит один человек, а иг- рает с автоматом — другой). Например, если предста- вить первую программу последовательностью знаков « + » и «—», где «плюс» означает «послушание» авто- мата, а «минус» — «непослушание»: + + Н--------Н-------+ Ч--------F + Ч-------Д + -------!—|—| ; т0 штекеры нужно вставить в гнезда верхнего ряда 4, 5, 7, 8, 11, 15, 16, 19, 20, 21, 25. На принципиальной схеме это соответствует замыка- нию контактов ВЗО, В31, ВЗЗ, В34, В37, В41, В42, В45, В46, В47, В51. Затем крышка платы программ закры- вается, чтобы исключить возможность «подсматривания» со стороны противника автомата во время игры. Далее, начиная игру с автоматом, человек должен установить переключателем В79 (Bbijcod) номер выхода из лабирин- та (/ или 15), который он будет «защищать». На прин- ципиальной схеме переключатель В79 установлен в по- ложение, соответствующее выходу 1. 163
Рассмотрим работу автомата на конкретных приме- рах. Допустим, что первым своим ходом человек (Ми- нотавр) направляет автомат (Тезея) из узла 8 в узел 9 — вставляет штекер-стрелку в гнездо 8-9. При этом замыкаются контакты В9, В20, ‘В80. После нажатия кнопки Кн2 (Ход Тезея) срабатывает реле РЗ и контакта- ми Р3.1 самоблокируется; одновременно через контакты Кн2.1 напряжение подается на обмотку шагового иска- теля, и его щетки делают один шаг. После отпускания замыкается цепь питания реле Р2 (контакты К.н2.2 и Р3.2 замкнуты). Реле Р2 срабатывает и самоблокиру- ется контактами Р2.1. Контакты Р2.2 замыкаются и подают напряжение на обмотку реле Р1. Предположим, что автомат играет согласно приведенной выше 1-й программе, т. е. выключатель В28 не замкнут. Тогда реле Р1 не сработает после срабатывания реле Р2; контакты Р2.4 замкнутся, подавая напряжение на лам- пу Л9 (контакты В9 замкнуты); лампа Л9 загорает- ся— Тезей поверил человеку и перешел в узел 9. Если бы при введении программы выключатель В28 был включен, то после замыкания контактов Р2.2 сра- ботало реле Р1 и его контакты Р1.1 переключились. Тогда загорелась бы лампочка Л7 (контакты В20 зам- кнуты)— Тезей не поверил бы Минотавру и перешел в узел 7. При нажатии кнопки Кн2 контакты Кн2.1 замы- кают цепь питания катушки счетчика Сч2, который фиксирует число ходов, сделанных Тезеем. После этого человек должен сделать следующий ход. Для этого ему нужно вынуть штекер-стрелку из гнезда 8-9 (при этом размыкаются контакты' В80 и отключаются реле Р1, Р2 и РЗ, а горевшая лампочка Л9 или Л7 гаснет) и вставить его в другое гнездо, соответственно тому, куда он направляет Тезея. Потом нажатием кнопки Кн2 ход предоставляется автомату. Если Тезей выйдет в тот конец лабиринта, который «защищался» человеком, то загорается лампа Л16, подсвечивающая табло Выход найден под' табличкой Вы проиграли: ведь такой исход игры означает, что Тезею удалось провести рефлексивное управление про- тивником и выудить у него необходимую информацию. Например, если переключатель В79 (Выход) был уста- новлен в положение 1 и Тезей вышел в выход 1 (заго- релась лампа Л1), то включается цепь питания лам- пы Л16. 164
Если же Тезей выйдет в другой конец лабиринта (в нашем примере в выход 15), то загорается лампа Л15, а также лампа Л17, подсвечивающая табло Ла- биринт пуст под табличкой Вы выиграли: в этом слу- чае Минотавр не дал Тезею проникнуть к «сокрови- щам»— автомат проиграл. Проигрыш засчитывается автомату и в том случае, если Тезей не сумел найти вы- ход к «сокровищам» за 25 ходов. При таком исходе загорается лампа Л18, подсвечивающая табло Конец программы под табличкой. Вы выиграли (подвижная щетка третьего ряда контактных ламелей ШИ1.3, дой- дя до конца ряда, замыкает цепь питания лампы Л18). Если противник автомата желает продолжить игру, узнать, сколько еще ходов он сможет продержать Тезея в лабиринтё, ему нужно переключением В77 (Програм- ма) включить 2-ю программу действий Тезея. Для того чтобы привести автомат в исходное состоя- ние готовности к следующей партий игры, необходимо нажать кнопку Сброс (Кн1). При этом через замкнутые контакты Кн1, самопрерывающиеся контакты искателя ШИ1.4, головные контакты ШИ1.5 (эти контакты раз- мыкаются в момент установления подвижных щеток искателя в исходное положение) напряжение питания будет подано на обмотку искателя, и его подвижные щетки вернутся в исходное положение. Кроме того, нужно вернуть в исходное положение (установить на нуль) счетный механизм счетчика ходов Тезея Сч2. Следует отметить, что по сути дела в этой игре идет состязание не между человеком и автоматом, а между двумя людьми: составителем программ и играющим с автоматом человеком. Составление эффективно рефлек- сирующих программ — дело довольно сложное и тре- бующее некоторого опыта. Приводим в качестве примера еще одну программу: + +---------Ч----------Н-------+ + Ч-------F + + — — + + — —. В автомате применены: лампы ЛН 3,5 ВХ0,28 А; шаговый искатель — типа И25/8 (паспорт РСЗ.250.041 Сп); Р1— реле РЭС-10 (паспорт РС4.524.302); Р2— реле РЭС-22 (паспорт РФ4.500. 131); РЗ — реле РЭС-9 (паспорт РС4. 524. 200); Сч2 — счетчик СЭИ-1 или СБ-IM/100; Д1—Д19 — диоды Д226Б; сердечник транс- форматора набран из пластин Ш32, пакет толщиной 165
20 мм (обмотка I состоит из 1220 витков провода ПЭЛ-0,51; обмотка II — 150 витков провода ПЭЛ-0,51; обмотка III—20 витков провода ПЭЛ-0,51). Построив автомат, читатели могут сами попробовать подобрать эффективно рефлексирующие программы. Для этого нужно будет провести небольшой экспери- мент— опробовать разработанные программы на двух- трех десятках людей. Отметив, какая из программ быст- рее всего выводит Тезея из лабиринта к «сокровищам», можно сделать вывод о степени ее эффективности. Заключение Наша небольшая экскурсия в мир игр и играющих электронных автоматов подошла к концу. Читатель по- знакомился с некоторыми понятиями теории игр, узнал простейшие методы решения игровых задач, получил представление о том, каким образом, используя элемен- ты и узлы электронной техники, можно создавать (даже собирать своими руками!) кибернетические играющие устройства, способные не только успешно противостоять игроку-человеку, но и превзойти его в различных играх. Авторы надеются, что читателя заинтересовали рас- сказы об играх и играющих автоматах. Возможно, про- чтя эту книгу, он даже рискнет испытать свои силы, взявшись за конструирование и постройку электронного играющего устройства — одного из тех, которые описа- ны на страницах книги, или совсем иного, прообраз ко- торого ему подсказала окружающая действительность. Ведь игры, как мы убедились, встречаются в жизни на каждом шагу! Для автоматизации решения игровых за- дач читатель может выбрать любую из них —в соответ- ствии со своими интересами, знаниями, вкусом и мате- риальными возможностями. Разумеется, авторы полагают, что в этой работе чи- татель не ограничится простым копированием описан- ных устройств, а будет экспериментировать, искать пу- ти к их дальнейшему улучшению и совершенствованию, возможно, найдет свои идеи и принципы действия «ум- ных» кибернетических партнеров. Для этого, вероятно, ему понадобится прочесть и изучить еще немало других 166
книг, не раз обращаться за советом и консультацией! ведь рассказанное в нашей книге — ого только первые шаги как в теории игр, так и в практике конструирова- ния играющих «киберов». И пусть, может- быть, не сразу ^.работает электрон- ное детище — не следует отчаиваться. Так ведут себя почти’все «новорожденные» машины. Доводка конст- рукции, устранение мелких погрешностей проектирова- ния и монтажа — неизбежный, хотя и не очень приятный этап работы. Зато как радостно видеть созданный свои- ми руками автомат, еще недавно существовавший толь- ко в мечте или на бумаге—и вот теперь настоящий, ра- ботающий, хочется сказать «живой» — так быстро, четко и логично действует он, выбирая свой очередной ход в игре с партнером-человеком! Тот, кто однажды испытал это удовольствие, уже не может согласиться на меньшее. Расставаясь с читателем, авторы от всей души же- лают ему больших успехов в приобщении к созданию автоматов для решения игровых задач. Список литературы 1. Введение в теорию выработки решений/В. А. Абчук, Л. А. Емельянов и др. — М.: Воениздат, 1972. — 342 с. 2. Ботвинник М. М. О кибернетической цели игры. — М.: Совет- ское радио, 1975. — 88 с. 3. Ботвинник М. М. «Пионер» готовится к чемпионату. — Прав- да, 1977, 24 ноября. 4. Ботвинник М. М. О решении неточных переборных задач.— М.: Советское радио, 1979.— 152 с. 5. Вентцель Е. С. Элементы теории игр. — М.: Физматгиз, 1959. — 68 с 6. Вентцель Е. С. Исследование операций. — М.: Советское ра- дио, 1972,—542 с, 167
7. Воробьев Н. Н. Развитие теории игр. — В кн.: Дж. Фон Ней- мац и О. Моргенштерн «Теория игр и экономическое поведение». — М.: Наука, 1970, с. 633—694. 8. Доморяд А. П. Математические игры и развлечения. — М.: Физматгиз, 1961. — 268 с. 9. Игошев Б. М., Комский Д. М. Кибернетика в самоделках. — М.: Энергия, 1978. — 128 с. 10. Комский Д. М,, Гордии А. Б. Увлекательная кибернетика.— Свердловск: Средне-Уральское книжное издательство, 1969. — 216 с. 11. Кун Н. А. Легенды и мифы древней Греции. — М.: Учпед- гиз, 1955. — 500 с. 12. Лефевр В. А., Смолян Г. Л. Алгебра конфликта. — М.: Зна- ние, 1968. — 64 с. 13. Методическое пособие для школьного конструкторского кружка/Под ред. Д. М. Комского — Свердловск.: Тр. Свердл. пед. ин-та, вып. 3, 1967.—80 с.; вып. 4, 1970.—100 с., выл. 5, 1974.—84 с.: вып. 6, 1975,— НО с. 14. Перельман Я. И. Живая математика. — М.: Наука, 1974.— 160 с. 15. Полетаев И. А. Сигнал.—М.: Советское радио, 1958.—1 404 с. ' 16. Поспелов Д. А. Игры и автоматы. — М.: Энергия, 1966.— 136 с. 17. Простая кибернетика. Сборник статей. — М.: Молодая гвар- дия, 1965. — 160 с. 18. Розанов Ю. А. Теория вероятностей и ее приложения.— В кн.: О некоторых вопросах современной математики и кибернети- ки, — М.: Просвещение, 1965, с. 132—133. 19. Борель Э. Веооятность и достоверность. — М.: Наука, 1969. — 110 с. 20. Вильямс Дж. Д. Совершенный стратег. — М.: Советское ра- дио, 1960. — 272 с. 21 Винер Н. Кибернетика и общество. — М.: Изд-во иностр, лит., 1958. — 200 с. 22. Винер Н. Об обучающихся и самовоспроизводяшихся маши- нах.— В кн.: Возможное и невозможное-в кибернетике’/ Под ред. А. Берга и Э. Кольмана — М: Изд-во АН СССР, 1963. — 224 с. 23. Гасс С. Путешествие в страну "линейного программирова- ния. — М : Мир, 1973. — 175 с. 24. Лондон Дж. Сочинения. Т. 3. — М.: Гослитиздат, 1955, с. 478—492. 25. Льюс Р., Райфа X. Игры и решения. — М.: Изд-во иностр, лит., 1931. — 608 с. 26. Шеннон К. Работы по теории информации и кибернетике. — М.: Изд-во иностр, лит. 1963. — 686 с.
Оглавление Предисловие.............................................. & Глава первая. Игры и автоматы . - - • Игры на каждом шагу................................ 6 Бесстрастные партнеры.................- - * *3 Глава вторая. В дебрях комбинаторна» . . . - 28 Комбинаторные игры................................. 28 Автоматы играют в камешки . . . ’1 Перебрось мостик.................................- На шахматной доске....................................«о •Глава третья. Когда исход игры случае» .... - *:,7 Азартные игры...................... ~ - ®7 Кость бросает автомат 78 Попытай счастья ...... ™ 'Глава четвертая. Кто кого? ........ 93 Стратегические игры.......................- 93 Автомат блефует..................... .... 42 Кот и мышь в лабиринте ... 120 Глава пятая. Автоматы учатся играть ...... 127 Как автоматы обучаются ......... 127 Автомат учится играть в камешки ....... 137 Проницательный партнер ......... ИЗ ’Глава шестая. Игры «без правил» ...... 152 Рефлексивные игры................................. 152 Без путеводной нити Ариадны ........ 156 Заключение.......................................... 166 •Список литературы........................................ 167