Text
                    Мир
МАТЕМАТИКИ
45
Математика
и выборы
Принятие решений
DW3OSTINI


Мир математики
Мир математики Висенц Торра Математика и выборы Принятие решений Москва - 2014 D^AGOSTTNI
УДК 51(0.062) ББК 22.1 М63 М63 Мир математики: в 45 т. Т. 45: ВисенцТорра. Математика и выборы. Принятие реше- ний. / Пер. с исп. — М.: Де Агостини, 2014. — 160 с. Теория принятия решений объясняет, как мы делаем выводы (прежде всего в повсед- невной жизни). Эта дисциплина находится на стыке экономики, статистики, психологии и информатики. В книге, которую вы держите в руках, рассмотрено несколько наиболее важных разделов теории принятия решений. Основное внимание уделено математическим моделям, позволяющим находить оптимальные решения. Кроме того, автор подробно рас- сказал о многокритериальном принятии решений, принятии решений в условиях противо- действия (теории игр и применении искусственного интеллекта в играх), а также о методах общественного выбора, в том числе об избирательных системах. ISBN 978-5-9774-0682-6 ISBN 978-5-9774-0778-6 (т. 45) УДК 51(0.062) ББК 22.1 © Vicen^ Tbrra, 2014 (текст) © RBA Coleccionables S.A., 2014 © ООО «Де Агостини», 2014 Иллюстрации предоставлены: Archivo de Imagenes del Patrimonio Cultural Prusiano (Bildarchiv PreuBischer Kulturbesitz); Archivo RBA; Peter Badge; James Bogle; Boston Gazette; Jon Callas, San Jose, California; Jean-Baptiste Greuze/Palacio de Versalles; Johann Rudolf Huber/ Scientific Identity; iStockphoto; Rembrandt Peale/ White House Historical Association; Presidencia de la Nacion Argentina; Rebelde sin causa (escena); Scientific Identity; Joan Pejoan. Все права защищены. Полное или частичное воспроизведение без разрешения издателя 1апрещено.
Содержание Предисловие........................................................... 9 Глава 1. Методы принятия решений...................................... И Проблема № 1: противоречивые критерии ................................ 12 Проблема № 2: риск и неопределенность................................ 12 Проблема № 3: противодействие........................................ 13 Классификация задач теории принятия решений в условиях определенности. 13 Принятие решений: классификация...................................... 14 Многообъектное принятие решений ..................................... 15 Многокритериальное принятие решений: представление предпочтений....... 15 Отношения предпочтения............................................... 16 Формализация отношений предпочтения............................... 17 Принятие решения на основе отношений предпочтения................. 17 Функции полезности................................................... 19 Представление отношений предпочтения.............................. 20 Как определяются функции полезности............................... 21 Функции полезности и монотонность................................. 23 Принятие решений на основе критериев, выраженных отношениями предпочтения.......................................... 24 Принятие решений на основе критериев, выраженных функцией полезности . 25 Среднее арифметическое и функции агрегирования....................... 27 Граница Парето ...................................................... 29 Автоматическое обучение и многокритериальное принятие решений ....... 31 [лава 2. Теория и практика: модели, больше моделей! ................. 33 Транзитивность и нетранзитивность.................................... 33 Исходный пример Люче.............................................. 34 Формализация отношений предпочтения ~ и <: полупорядок .............. 35 Представление отношений строгого предпочтения........................ 35 Модели принятия решений ............................................. 37 Систематические ошибки и дисперсия .................................. 38 Систематическая ошибка............................................ 38 Дисперсия......................................................... 39 5
СОДЕРЖАНИЕ Компромисс между систематической ошибкой и дисперсией при построении моделей ........................................... 40 Нормативные и описательные теории................................... 42 Искусственный интеллект: рациональность или человечность............ 43 Глава 3. Многокритериальное принятие решений и агрегирование......... 45 Агрегирование предпочтений: теория общественного выбора............. 45 Теорема Эрроу о невозможности коллективного выбора .............. 48 Исключение условия универсальности (С1).......................... 51 Предпочтение с одним максимумом............................... 52 Исключение условия независимости от посторонних альтернатив (С4). 53 Выборы без победителя в соответствии с методом Кондорсе.......... 56 Метод Коупленда............................................... 58 Правило Борда................................................. 59 Различие между методом Кондорсе и правилом Борда.............. 60 Агрегирование полезности ........................................... 62 Не все критерии одинаково важны. Среднее взвешенное.............. 63 Существование определяющих критериев. Операции над множествами.... 64 Взаимная компенсация критериев. Порядковые статистики............ 65 Взаимодействие критериев. Интеграл Шоке.......................... 66 Неаддитивная мера для поездки в Японию........................ 67 Как функция агрегирования связана с границей Парето................. 68 Глава 4. Принятие решений в условиях неопределенности............... 69 Интерпретации вероятности........................................... 71 Объективная вероятность.......................................... 71 Субъективная вероятность......................................... 71 Риск и неопределенность, субъективная и объективная вероятность .... 72 Классическая модель ожидаемой полезности ........................... 72 Первый пример: Алисия и деньги .................................. 73 Второй пример: Берта и путешествия .............................. 73 Классическая модель субъективной ожидаемой полезности............... 76 Урна с 90 шарами................................................. 76 Вероятности в задаче об урне с 90 шарами ........................ 77 Два акта в задаче об урне с 90 шарами............................ 77 Парадокс Алле....................................................... 80 6
СОДЕРЖАНИЕ Парадокс Элсберга.................................................. 81 Модели риска и неопределенности.................................... 82 Неопределенность................................................... 82 Нечеткие множества и вероятности................................ 85 Меры неопределенности ............................................. 86 Меры неопределенности: меры вероятности......................... 86 Меры неопределенности: меры возможности......................... 87 Глава 5. Принятие решений в условиях противодействия............... 89 Статические игры................................................... 89 Дилемма заключенного............................................ 90 Представление задачи ......................................... 90 Выбор стратегии............................................... 91 Строго доминирующие стратегии................................. 92 Строго доминирующая стратегия ................................ 92 Слабо доминирующие стратегии ................................. 92 Доминирование и оптимум по Парето............................... 93 Полезность смешанных стратегий ................................. 93 Равновесие Нэша для игр с двумя игроками........................ 94 «Камень, ножницы, бумага»....................................... 95 Игры с нулевой суммой........................................... 96 Существование равновесия Нэша................................... 96 Доминирующие стратегии и равновесие Нэша...................... 97 Теорема о равенстве полезности в равновесии Нэша ............. 99 Другие примеры игр............................................. 101 Теория кооперативных игр .......................................104 Характеристическая функция кооперативной игры ................104 Структура коалиции ...........................................106 Вектор полезности.............................................107 Полезность структуры коалиции.................................107 Простые игры .................................................107 Выигрышная коалиция...........................................108 Минимальная выигрышная коалиция ..............................108 Диктатор......................................................108 Монотонные игры...............................................109 Пример немонотонной игры. Производство мороженого .............110 7
СОДЕРЖАНИЕ Аддитивные игры............................................ 111 Супераддитивные игры....................................... 111 Индексы Банцафа и Шепли..................................... ИЗ Динамические игры: принятие решений в играх против компьютера... 114 Идеальные решения в играх.....................................114 Неидеальные решения ..........................................122 [лава 6. Избирательные системы... 123 Мажоритарные системы.............................................123 Мажоритарная система относительного большинства...............123 Одобрительное голосование ....................................124 Рейтинговое голосование...................................... 126 Система Льюиса Кэрролла .................................... 128 Пропорциональные системы ....................................... 128 Ограниченное голосование......................................128 Представительное голосование 129 Кумулятивное голосование .....................................129 Пропорциональное представление партий............................130 Метод д’Ондта или Джефферсона ................................130 Метод Сент-Лагю (Вебстера) .................................. 132 Методы наибольшего остатка....................................135 Система единого передаваемого голоса..........................137 Смешанная пропорциональная система............................138 Открытые списки, партийные списки и дополнительные одномандатные округа в пропорциональных системах ...........139 Избирательные округа .........................................139 «Джерримендеринг».............................................141 Первый пример.............................................. 141 Второй пример ............................................ 142 Участие в выборах и объявление кандидатов........................143 Эпилог.......................................................... 145 Библиография................................................... 147 Алфавитный указатель ............................................149 8
Предисловие Каждый день мы принимаем решения, определяющие нашу жизнь. То, как мы это делаем, изучает теория принятия решений — дисциплина, лежащая на стыке эконо- мики, статистики и психологии. Сегодня, благодаря развитию искусственного ин- теллекта, к ним присоединилась и информатика. В книге, которую вы держите в ру- ках, рассмотрено несколько наиболее важных разделов теории принятия решений. Основное внимание уделено математическим моделям, позволяющим делать опти- мальный выбор. Одна из первых трудностей во время принятия решения возникает, например, если у нас есть несколько противоречащих друг другу критериев или когда решение требуется принять в условиях риска и неопределенности. Иногда решения нужно принимать с учетом того, что в то же время свои решения принимает и противник, который, разумеется, стремится к увеличению собственной выгоды, возможно в ущерб нам. В этой книге на примерах рассматривается тема многокритериального принятия решений. Вы увидите, что при этом необходимо агрегировать, то есть сочетать, раз- личные предпочтения и функции полезности. Мы изучим некоторые методы, соз- данные для подобного агрегирования, а также методы общественного выбора, по- зволяющие упорядочивать имеющиеся варианты. Еще одна тема, рассматриваемая в этой книге, — принятие решений в условиях противодействия, то есть при наличии активного противника, который может при- нимать решения одновременно с нами либо по очереди. В первом случае мы рас- смотрим некоторые моменты теории игр, во втором — опишем методы, которые используются в искусственном интеллекте, так как задачи именно такого типа реша- ются во время игр против компьютера. Последняя глава книги посвящена избирательным системам, которые позволя- ют людям выражать свои предпочтения и описывают агрегирование результатов голосования при избрании отдельных кандидатов или при выборах в парламент. Следовательно, избирательные системы тесно связаны с принятием решений, точнее говоря, с методами социального выбора, которые рассматриваются в первой главе. 9

Глава 1 Методы принятия решений В повседневной жизни проблема принятия решений возникает, когда нам дается не- сколько альтернативных вариантов и нужно выбрать только один из них. Пред- полагается, что мы делаем выбор не случайно, а в соответствии с определенными критериями. Теория принятия решений рассматривает все процессы, связанные с выбором лучших вариантов из множества доступных альтернатив. Чтобы проиллюстрировать проблематику принятия решений и возможные ме- тоды, рассмотрим следующий пример. Члены семьи решили поменять автомобиль и теперь выбирают ему замену из нескольких вариантов: Ford Т, Seat 600, Simca 1000, «Фольксваген Жук» и Сйгоёп Acadiane. Процесс принятия решения заклю- чается в выборе одного из этих автомобилей. Члены семьи садятся за стол, чтобы обсудить будущую покупку. Каждый го- ворит о своих потребностях, которые следует учесть. Именно эти факторы опре- деляют критерии, позволяющие выбрать наиболее подходящий автомобиль. Для членов семьи значение может иметь количество мест (в семье трое детей), безопас- ность и цена. Возможно, что члены семьи определили какую-то максимальную цену и не рассматривают более дорогие модели. Также можно учесть комфортабельность автомобиля, объем его багажника и даже максимальную скорость. Каждый из этих факторов определяет отдельный критерий, который нужно учитывать при выборе. Будем считать, что в нашем при- мере семья рассматривает пять следующих критериев: число мест, безопасность, цена, комфортабельность и объем багажника. Как правило, выбор оптимального варианта сопровождается различными труд- ностями. Расскажем о некоторых из них подробнее. И
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ Проблема № 1: противоречивые критерии Несколько критериев принятия решения могут противоречить друг другу, и, как пра- вило, нельзя выбрать какой-то один вариант, который будет оптимальным по всем критериям. Следовательно, нужно найти компромиссное решение. К примеру, когда мы рассматриваем автомобили, то может оказаться, что деше- вая модель не слишком удобна и не так безопасна, как остальные. Более того, связь между этими параметрами часто оказывается обратной: чем безопаснее и комфорта- бельнее автомобиль, тем меньше нас будет устраивать его цена. Подобные ситуации возникают в большинстве задач, связанных с принятием решений. Проблема № 2: риск и неопределенность В предыдущем примере результат наших действий известен, и мы оцениваем при- нятое решение на основе этого результата. Иными словами, при выборе автомобиля нам заранее известна его цена и объем багажника, и мы учитываем эти параметры при оценке. Однако последствия возможных решений не всегда очевидны — к примеру, ког- да врач должен определить, какое лекарство следует прописать тяжелобольному. Эффективность и побочные действия разных лекарств различаются, более того, сле- дует предположить и возможность неправильной постановки диагноза, и даже не до конца ясную причину недомогания. В классической теории принятия решений различают принятие решений в усло- виях неопределенности и принятие решений в условиях риска. Принятие решения в условиях неопределенности означает, что возможные варианты неизвестны или несопоставимы, как в примере с лекарством. Принятие решения в условиях риска означает, что любое действие ведет к нескольким возможным ситуациям (они на- зываются состояниями), при этом их вероятности известны, как, например, в ситуа- циях, где присутствует случайность (например, в лотерее), и мы знаем вероятности различных исходов. Помимо неопределенности, обычно описываемой при помощи вероятностей, рас- сматриваются и другие виды неопределенности. В реальных задачах доступная ин- формация может иметь самую разную природу и порой оказывается нечеткой или неточной. Неопределенность может описываться не только распределением вероят- ностей, но и другими способами, в частности в терминах теории нечетких множеств. 12
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ Различие между классическими и нечеткими множествами заключается в том, что в случае с классическими множествами элементы базового множества либо при- надлежат им, либо нет, в то время как для нечетких возможна частичная принадлеж- ность. Подробнее эта тема рассмотрена в главе 4. Чтобы отличить задачи принятия решений в условиях риска или неопределен- ности от задач, в которых риск и неопределенность отсутствуют, будем называть последние задачами принятия решений в условиях определенности. О задачах этой группы мы поговорим позднее. Проблема № 3: противодействие Эта проблема возникает в случаях, когда наши решения вступают в конфликт с ре- шениями других людей, которые являются нашими оппонентами и, следовательно, пытаются противодействовать нам. Классические примеры подобных случаев — игры, к примеру, «Крестики-нолики» или шахматы. Рассмотрим игру «Крестики-нолики», в которой участники последовательно размещают знаки на игровом поле размером 3x3 клетки. На каждом ходу игрок должен решить, куда поставить следующий знак, чтобы повысить вероятность вы- игрыша, выставив в ряд три своих знака. Однако соперник стремится помешать ему и при этом одержать верх. В игре «Крестики-нолики» участники принимают решения поочередно, в других ситуациях соперники должны принять решение одновременно — например, в слу- чае, когда два предприятия определяют цены на продукцию или объем выпуска. Принятие решений в ситуациях, где задействованы два игрока или более, изу- чается в теории игр. Эти же ситуации рассматриваются в информатике, в частно- сти в искусственном интеллекте, где основное внимание уделяется играм, в которых игроки делают ходы по очереди. В рамках искусственного интеллекта были созда- ны методы и алгоритмы эффективной игры, позволяющие программам обыгрывать человека. Классификация задач теории принятия решений в условиях определенности В процессе принятия решений возникают трудности, различные задачи обладают особыми характеристиками, поэтому в теории принятия решений выделяют несколь- ко разделов. Далее мы перечислим эти разделы и выделим их основные отличия. 13
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ С одной стороны, выделяют задачи многокритериального принятия решении — к ним относится задача о выборе автомобиля. В таких задачах имеется несколько альтернативных вариантов, каждый из которых оценивается по ряду критериев. Число вариантов и критериев является конечным. Существует два подхода к многокритериальному принятию решений. В первом из них предполагается, что принятие решения можно формализовать, то есть раз- работать средства для его формального описания. Во втором подходе изучаются методы, позволяющие зафиксировать, понять и проанализировать различия между критериями и точками зрения. С другой стороны, выделяют задачи многообъектного принятия решений, в кото- рых множество альтернативных вариантов не является конечным. В задачах такого типа один из вариантов представляет собой переменную, которая может принимать произвольное значение на определенном интервале. Пример такой переменной — цена при продаже автомобиля, которая может принимать любое значение от О до 20 тысяч евро. Еще один пример — объем выпуска продукции. В таких случаях используются иные методы, чем при выборе из конечного множества альтернатив. Задачи с непрерывными переменными изучаются в теории многообъектного при- нятия решений. Как правило, они формулируются в виде задач оптимизации и ре- шаются методами математического программирования, в частности так называемым симплекс - методом. Для их решения применяются и другие методы оптимизации, например генети- ческие алгоритмы, созданные по аналогии с механизмами генетической эволюции. При использовании генетических алгоритмов возможные решения задачи выража- ются в виде так называемых хромосом, которые часто представляют собой векто- ры бит. В ходе решения определяется множество хромосом (множество частичных решений задачи), которые затем скрещиваются с образованием нового множества хромосом. В соответствии с этой аналогией вероятность «выживания» хромосом, которые представляют собой худшие решения, меньше, и «выживают» только луч- шие решения. Спустя несколько поколений (скрещиваний) формируются более удачные решения, чем те, что были определены вначале. Принятие решений: классификация В соответствии с вышесказанным мы можем классифицировать различные задачи, связанные с принятием решений, следующим образом. — Принятие решений в условиях определенности: 14
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ • многообъектное принятие решений: бесконечное множество вариантов; • многокритериальное принятие решений: конечное множество вариантов. — Принятие решений в условиях риска и неопределенности. — Принятие решений в условиях противодействия. Теперь мы коротко объясним многообъектное принятие решений, а остаток этой главы и две последующие посвятим принятию решений в условиях определенности, в частности многокритериальному принятию решений. Принятие решений в услови- ях риска и неопределенности мы рассмотрим в главе 4, принятие решений в условиях противодействия — в главе 5. Многообъектное принятие решений Когда множество альтернативных вариантов бесконечно, методы многокритериаль- ного принятия решений неприменимы, так как они основаны на перечислении раз- личных вариантов и их сравнении согласно имеющимся критериям. Задачи такого типа формулируются как задачи математической оптимизации: в них определяется функция, которую необходимо максимизировать (функция прибыли) или миними- зировать (функция затрат). Кроме того, как правило, при выборе варианта необ- ходимо учитывать ряд ограничений. Математические задачи такого типа решаются методами теории оптимизации. Рассмотрим в качестве примера задачу о выборе одного из двух сортов угля для выработки электроэнергии на угольной электростанции. Каждый сорт имеет свои недостатки (выбросы углекислого газа). Наша цель — получить максимальную вы- году и соблюсти при этом ограничения на объем выбросов. В задаче рассматриваются непрерывные переменные, поскольку сочетание двух сортов угля может быть любым (при условии что объем угля каждого сорта будет положительным). Впрочем, нашим требованиям будут удовлетворять не все воз- можные сочетания — в некоторых случаях объем выбросов может оказаться слиш- ком большим. Многокритериальное принятие решений: представление предпочтений Когда мы рассматриваем множество альтернативных вариантов, наши предпочтения можно выразить двумя основными способами: с помощью отношений предпочтения 15
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ и с помощью функций полезности. И отношения предпочтения, и функции полезно- сти можно использовать, к примеру, для упорядочения автомобилей согласно нашим предпочтениям относительно цены. Можно сказать, что функции полезности обыч- но рассматриваются как математическое представление отношений предпочтения. Отношения предпочтения При выборе одного из двух вариантов, например автомобиля Simca 1000 или Citroen Acadiane, отношение предпочтения позволяет указать, что Simca 1000 нравится нам больше, чем Сйгоёп Acadiane, но это предпочтение имеет не количественный, а ка- чественный характер: мы не можем сказать, насколько больше он нам нравится. Отношение предпочтения называется полным, если для каждой пары вариантов всегда известен предпочтительный выбор; в противном случае отношение называ- ется неполным. Отношение предпочтения может быть неполным из-за недостатка информации: к примеру, мы не можем сказать, какая машина удобнее — Biscooter 100 или Isetta. Иногда отношение можно дополнить подробным анализом всех возможных вариан- тов (к примеру, мы можем протестировать все автомобили). Но даже в таких случа- ях избежать неполноты часто не удается. Как правило, ожидается, что отношение предпочтения обладает свойством тран- зитивности: если автомобиль А предпочтительнее В, а В — предпочтительнее С, то А предпочтительнее С. Хотя это условие кажется совершенно ожидаемым и ло- гичным, при опросах с целью изучения предпочтений оказывается, что оно выпол- няется не всегда. Продемонстрируем проблему транзитивности на примере. Допустим, мы хотим выпить кофе. Возможно, мы не заметим разницы между чашкой кофе без сахара и чашкой кофе, куда бросили всего одну крупинку сахара. Аналогично, мы не по- чувствуем разницы между чашкой кофе с одной и с двумя крупинками. Можно сделать вывод: мы не заметим разницы между чашкой кофе, куда добавили опреде- ленное число крупинок, и чашкой, куда добавили на одну крупинку больше. Однако весьма вероятно, что мы заметим разницу между чашкой кофе без сахара и чашкой кофе, куда насыпали килограмм сахара. В последнем случае свойство транзитив- ности не выполняется. Оставим пока возможные проблемы и будем предполагать, что свойство транзи- тивности выполняется всегда. 16
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ Формализация отношений предпочтения С точки зрения математики отношение предпочтения — это бинарное отношение на пространстве альтернатив X. Тогда отношение предпочтения представляет собой подмножество X х X. Если пара элементов (х, у) принадлежит этому подмноже- ству, то говорят, что элемент х предпочтительнее элемента у. Будем обозначать это отношение предпочтения так: х у (или у < х). — Отношение предпочтения является полным тогда и только тогда, когда для любой пары х, у на множестве X либо х у, либо у х. — Отношение предпочтения является транзитивным тогда и только тогда, когда для любых х, у, z на множестве X при х у и у z справедливо соотношение х > z. — Отношение предпочтения является рефлексивным, если для любого х на мно- жестве X справедливо х > х. В теории принятия решений отношение предпочтения, обладающее тремя ука- занными свойствами, называется рациональным. В общем случае отношение, обла- дающее этими свойствами, в математике называется полным предпорядком. Можно заметить, что последнее свойство (рефлексивности) необязательно, так как выво- дится из первого (свойства полноты). Принятие решения на основе отношений предпочтения Вернемся к примеру с автомобилями. Семье нужно решить, как упорядочить авто- мобили по каждому из пяти рассматриваемых критериев: число мест, безопасность, цена, комфортабельность и объем багажника. Предположим, что члены семьи ос- мотрели все автомобили (а может, даже посидели внутри). Кроме того, доступна следующая информация. — Ford Т — двухместный автомобиль, изготовленный в 1925 году. Указано, что автомобиль находится в хорошем состоянии и стоит 33 тысячи евро. — Seat 600 находится не в лучшем состоянии и стоит 700 евро. — Автомобиль Simca 1000 был выпущен в 1977 году и стоит 1 тысячу евро. — «Фольксваген Жук» был изготовлен в 1968 году и стоит 6 тысяч евро. — Citroen Acadiane — фургон, выпущенный в 1981 году, ценой 2 тысячи евро. 17
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ Члены семьи обсудили преимущества и недостатки всех автомобилей по пяти рассматриваемым критериям и расположили их в порядке предпочтения, как указа- но ниже. Будем обозначать отношение предпочтения знаком >. Так, если автомо- биль СТ предпочтительнее С2, то Cl > С2. — По числу мест: Simca 1000 > «Фольксваген Жук» > Seat 600 > Citroen Acadiane > Ford T. — По безопасности: «Фольксваген Жук» > Сйгоёп Acadiane > Simca 1000 > Ford Т > Seat 600. — По цене: Seat 600 > Simca 1000 > Сйгоёп Acadiane ^«Фольксваген Жук»> Ford Т. — По комфортабельности: «Фольксваген Жук» > Simca 1000 > Сйгоёп Acadiane > Ford Т > Seat 600. — По объему багажника: «Фольксваген Жук» > Simca 1000 > Seat 600 Сйгоёп Acadiane > Ford Т. Эта информация представлена в таблице ниже. Чем предпочтительнее автомо- биль, тем больше знаков «+» в соответствующей ячейке таблицы. Число мест Безопас- ность Цена Комфорта- бельность Объем багажника FordT + ++ + ++ + Seat 600 +++ + +++++ + +++ Simca 1000 +++++ +++ ++++ ++++ ++++ «Фольксваген Жук» ++++ +++++ ++ +++++ +++++ СИгоёп Acadiane ++ ++++ +++ +++ ++ Задача заключается в том, чтобы выбрать лучший автомобиль на основе при- веденной информации. Упорядочить автомобили от лучшего к худшему по большин- ству указанных критериев нам поможет теория общественного выбора. Чуть позже мы покажем, как это делается, а пока отметим, что некоторые крите- рии противоречат друг другу. К примеру, Seat 600 — лучший автомобиль по цене, но худший по безопасности и комфортабельности. «Фольксваген Жук», напротив, лучший по безопасности и комфортабельности, но второй по дороговизне. A Ford Т получил низкие оценки почти по всем критериям (очевидно, что членам семьи не по- нравился автомобиль, выпущенный в 1925 году). 18
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ Нетрудно видеть, что если мы учитываем всего один критерий, то подобных трудностей не наблюдается. Так, если нас интересует только цена, то мы можем упорядочить автомобили по этому критерию и купить самый дешевый. Функции полезности Функции полезности (англ, utility functions, payoff functions, score functions) позво- ляют оценить предпочтения количественно, так как дают числовую оценку всех рас- сматриваемых вариантов. Вернемся к примеру с автомобилями. Присвоим значение 100 автомобилю, ко- торый полностью удовлетворяет нас по некоторому критерию, значение 0 — ав- томобилю, который нас совершенно не удовлетворяет. Так, если цена некоторого автомобиля А устраивает нас на все 100%, присвоим этому автомобилю значение 100. Если же автомобиль оказался слишком дорогим и мы не можем купить его, присвоим ему значение 0. Чем доступнее цена, тем выше будет соответствующее значение. — Удовлетворенность Ценой (Ford Т) = 0. — Удовлетворенность Ценой (Seat 600) = 100. — Удовлетворенность Ценой (Simca 1000) = 100. — Удовлетворенность Ценой («Фольксваген Жук») — 30. — Удовлетворенность Ценой (Citroen Acadiane) = 60. Что касается числа мест, члены семьи решили, что Ford Т неприемлем, так как в нем всего 2 места, а сиденья Citroen Acadiane и Seat 600 не слишком удобны (Citroen оказался чуть хуже, чем Seat). По этому критерию автомобили получили следующие значения. — Удовлетворенность Числом Мест (Ford Т) = 0. — Удовлетворенность Числом Мест (Seat 600) = 60. — Удовлетворенность Числом Мест (Simca 1000) = 100. — Удовлетворенность Числом Мест («Фольксваген Жук») — 80. — Удовлетворенность Числом Мест (Citroen Acadiane) = 20. Выполним аналогичные действия для всех остальных критериев. Полученная ин- формация отражена в следующей таблице. 19
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ Число мест Безопас- ность Цена Комфорта- бельность Объем багажника FordT 0 20 0 20 0 Seat 600 60 0 100 0 50 Simca 1000 100 30 100 50 70 «Фольксваген Жук» 80 50 30 70 100 СИгоёп Acadiane 20 40 60 40 0 В таблице проявляется отмеченная выше противоречивость критериев, затрудня- ющая принятие решения. Так, цена вступает в противоречие с комфортабельностью и безопасностью: более дорогие автомобили удобнее и безопаснее дешевых. Кроме того, чем больше мест в автомобиле, тем обычно выше цена. Представление отношений предпочтения Между отношениями предпочтения и функциями полезности можно определить со- ответствие следующим образом. Функция полезности и называется представлением отношения предпочтения > на множестве X, если для любых х, у на множестве X таких, что х у, выполняется соотношение н(х) > н(у). Следующая теорема, основанная на утверждении, выведенном Георгом Кантором в 1895 году, устанавливает важную связь предпочтений и полезности. Согласно этой теореме, функции полезности являются математическим представлением отношений предпочтения. Для данного множества альтернативных вариантов функция полезности, ко- торая является представлением отношения предпочтения, существует тогда и только тогда, когда это отношение рационально. Заметим, что функции полезности, приведенные в таблице для числа мест, без- опасности, комфортабельности и объема багажника, представляют собой представ- ления предпочтений, приведенных в предыдущей таблице. В случае с ценой это не так: хотя Seat 600 и Simca 1000 имеют полезность 100, выполняется соотношение Seat 600 > Simca 1000, но не Simca 1000 > Seat 600. Отношения предпочтения рациональны, так как они обладают свойствами пол- ноты, транзитивности и рефлексивности (мы не указали, что любой автомобиль х удовлетворяет соотношению х х, однако это утверждение вполне логично). 20
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ КАНТОР ПРОТИВ КРОНЕКЕРА Основным вкладом в математику немецкого ученого Георга Кантора (1845-1918) стало создание теории множеств, которая составляет основу современной математики, и исследование бесконечных множеств. Кантор, в частности, рассмотрел соответствие между вещественными и целыми числами и доказал, что бесконечное множество вещественных чисел больше, чем множество целых чисел. Исследование различ- ных видов бесконечности и вывод о существовании бесконечно! о числа бесконечностей вызвали жест- кую критику со стороны современников, в частности Леопольда Кронекера и Анри Пуанкаре, а также не- которых философов (например, Витгенштейна) и даже богословов. Кронекер (1823-1891), который был учителем Кантора, считал, что существование множе- ства элементов с определенными характеристиками нельзя доказать, не приведя конкретного примера такого множества. Именно поэтому Кронекер считает- ся одним из основателей конструктивистской школы, согласно которой для доказательства существования математического объекта нужно обязательно найти хотя бы один такой объект. Гэорг Кантор (вверху) и Леопольд Кронекер. В этом примере мы предположили, что члены семьи присвоили каждому авто- мобилю некоторое значение по каждому критерию в соответствии со своими пред- почтениями. Как определяются функции полезности Числовая оценка каждому критерию может быть присвоена на основе вспомогатель- ной функции, определенной для характеристик автомобиля, связанных с этим кри- терием. Допустим, чтобы оценить, в какой мере Simca 1000 удовлетворяет нашему критерию ожидаемой цены, можно применить функцию, которую мы определим для 21
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ цен. В нашем примере можно указать, что бюджет на покупку автомобиля состав- ляет 10 тысяч евро, так что любая цена, меньшая либо равная 1 тысяче евро, будет для нас идеальной (то есть будет удовлетворять нас на 100 %), а цена, превышаю- щая 10 тысяч евро, будет совершенно неудовлетворительной (0%). Для значений от 1 тысячи до 10 тысяч евро используем линейную функцию. Согласно указанной информации функция полезности цены для некоторой цены х определяется так: 100, если х меньше либо равен 1 тысяче евро; 0, если х больше 10 тысяч евро; (10000 — х) / 90 евро, если х находится на интервале от 1 тысячи до 10 ты- сяч евро. Математическое выражение этой функции будет таким: fp(x)=- 100 (10 000-х)/90 0 если х sslOOO если X е (1000,10 000) если х 10 000 График этой функции выглядит следующим образом. Определив функцию полезности, мы можем вычислить удовлетворенность по критерию «цена» для автомобиля Simca 1000. Обозначим цену автомобиля через ueHa(Simca 1000), вспомогательную функцию цены — через fp(ueHa(Simca 1000)). Функция полезности укажет, в какой мере Simca 1000 удовлетворяет нашим требо- ваниям к цене. Так как цена Simca 1000 составляет 1 тысячу евро, имеем: fp(ueHa(Simca 1000)) — /р(1000) = 100. 22
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ По той же причине имеем: fp(uena(Seat 600)) = 100. Аналогично, для Citroen Acadiane ценой в 2 тысячи евро имеем: fp(u,eHa(Citroen Acadiane)) — /р(2000) = (10000 — 2000) /90 — 800/9. Для «Фольксвагена Жука» имеем: /р(и,ена(«Фольксваген Жук»)) — fp(6000) — (10000 — 6000) /90 = 400/9. Представленные числа отличаются от указанных в таблице. Заметим, что раз- личные функции дадут разные значения функции полезности. Члены семьи должны выбрать функцию полезности в соответствии со своими интересами и заполнить та- блицу значений этой функции. Функция полезности цены позволяет оценить любой автомобиль, цена которого известна. Для любого автомобиля значение /р(иена( автомобиль)) будет количе- ственной оценкой его цены на интервале [0, 100]. Следовательно, применив преж- нюю нотацию, имеем: для любого автомобиля выполняется соотношение Удовлет- воренность Ценой(автомобиль) = /р(цена (автомобиль)). Функции полезности и монотонность Значение функции полезности возрастает с уменьшением цены: чем она меньше, тем выше удовлетворенность. В таком случае говорят, что между ценой и полезно- стью существует монотонная связь. Но так бывает не всегда — в качестве примера можно привести удовлетворенность объемом багажника. Члены семьи предпочита- ют вместительный багажник — к примеру, багажник объемом 1 м3 будет предпо- чтительнее багажника объемом 0,25 м3. Однако слишком большой багажник им, возможно, не нужен, и начиная с определенного объема его размеры будут скорее представлять неудобство. Иными словами, семье нужен вместительный автомо- биль, но не фургон. В этом случае функция полезности уже не будет монотонной в зависимости от размеров багажника. Между прочим, именно так мы рассуждали, когда присваивали Сйгоёп Acadiane полезность, равную нулю. Предположим, что оптимальный объем багажника равен 1 м3. При возрастании объема до этой величины удовлетворенность также возрастает, при превышении 23
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ этого значения — убывает. Предположим, что удовлетворенность является ли- нейной на промежутке в 0,2 м3 и равна нулю за пределами интервала [0,8; 1,2]. Соответствующая функция полезности будет выглядеть так: О 100- 5()0|л -1| О если л$(),8 если л-£ (0,8; 1,2). если Л'^1.2 График этой функции представлен на рисунке. В этих примерах мы оценивали критерии на интервале [0, 100]. Однако можно использовать и другие интервалы, в том числе такие, которые нельзя выразить в чис- ленном виде. К примеру, оценки можно выразить словами «очень мало», «мало», «средне», «много», «очень много». Принятие решений на основе критериев, выраженных отношениями предпочтения Посмотрим, как мы принимаем решение, когда информация о критериях выражена в виде отношений предпочтения. В таких случаях совокупное предпочтение определяется на основе отдельных предпочтений по каждому критерию. После того как совокупное предпочтение опре- делено, в зависимости от него выбирается лучший вариант. В соответствии с этим описанием процесс принятия решения выглядит так. 24
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ 1. Моделирование задачи. Определение альтернативных вариантов, крите- риев, формирование предпочтений по каждому из них. В примере с выбором автомобиля мы представили эту информацию в виде таблицы. 2. Агрегирование предпочтений. На основе предпочтений по каждому кри- терию определяется новое совокупное предпочтение, в котором сводятся воедино предпочтения по разным критериям. Полученное предпочтение на- зывается агрегированным, средним или общественным. 3. Выбор вариантов. На основе агрегированного предпочтения выбирается вариант с наивысшей оценкой. О том, как строится агрегированное предпочтение, мы расскажем в главе 3. Чтобы проиллюстрировать этот процесс, мы привели таблицу с предпочтениями для всех критериев выбора автомобиля. В таблице также указано одно из возмож- ных агрегированных предпочтений, которое определяется на шаге 2. На шаге 3 мы выберем Simca 1000, так как на основе полученного агрегированного предпочтения автомобили (в порядке предпочтения) будут располагаться следующим образом: Simca 1000 > «Фольксваген Жук» > Seat 600 > Citroen Acadiane > Ford T. В следующей таблице сведены воедино предпочтения членов семьи для всех рас- смотренных критериев. Чем больше знаков «+», тем предпочтительнее автомобиль по указанному критерию. Число мест Безопас- ность Цена Комфор- табель- ность Объем багажника Агрегирован- ное предпо- чтение FordT ++ + ++ + + Seat 600 +++ + +++++ + +++ ++ Simca 1000 +++++ +++ ++++ ++++ ++++ ++++ «Фольксваген Жук» ++++ +++++ ++ +++++ • +++++ +++++ Сйгоёп Acadiane ++ ++++ +++ +++ ++ +++ Принятие решений на основе критериев, выраженных функцией полезности Если информация о разных критериях выражена при помощи функции полезности, то лучшие варианты логично выбрать так: сначала каким-то образом агрегировать полезность, затем выбрать варианты с наивысшей агрегированной оценкой. Значит, принятие решения в общем виде будет выглядеть следующим образом. 25
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ 1. Моделирование задачи. Определение альтернативных вариантов, критери- ев и полезности каждого варианта по каждому критерию. Этот шаг равно- силен построению таблицы критериев и полезностей, как в примере с авто- мобилями. 2. Агрегирование полезностей. Для каждого варианта на основе различных критериев подсчитывается его агрегированная полезность. 3. Упорядочение вариантов. Варианты упорядочиваются по агрегированной полезности, вычисленной на предыдущем шаге. 4. Выбор вариантов. Выбор лучшего варианта (или вариантов). Агрегированное значение проще всего вычислить как обычную среднюю полез- ность. Проиллюстрируем описанный процесс на примере среднего арифметическо- го. Рассчитаем агрегированную полезность для каждого автомобиля и обозначим ее функцией Агрегированная Полезность. Начнем с агрегированной полезности автомобиля Ford Т: Агрегированная Полезность(Роп1 Т) = (0 + 20 + 0 + 20 + 0)/5 = 40/5 = 8. Значения в скобках взяты из строки таблицы, соответствующей Ford Т (первая строка таблицы на следующей странице). Аналогично рассчитывается агрегированная полезность для других автомобилей: — Агрегированная Полезность(8еа1 600) — (60 + 0 +100 + 0 + + 50)/5 = 210/5 = 42. — Агрегированная Полезность(8ипса 1000) = (100 + 30 +100 + 50 + + 70)/5 = 350/5 = 70. — Агрегированная Полезность(«Фольксваген Жук») = (80 + 50 + 30 + 70 + + 100)/5 = 330/5 = 66. — Агрегированная Полезность(СИгоёп Acadiane) — (20 + 40 + 60 + 40 + + 0)/5 = 160/5 = 32. Теперь переходим к упорядочению вариантов. Согласно значениям агрегирован- ной полезности, которые включают всю необходимую информацию, автомобили в порядке предпочтения будут располагаться следующим образом: Simca 1000 > «Фольксваген Жук» > Seat 600 > Сйгоёп Acadiane > Ford Т. Следовательно, на основе всей доступной информации наиболее предпочтитель- ным автомобилем для семьи будет Simca 1000. 26
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ В следующей таблице серым цветом выделены результаты проведенных расче- тов и автомобиль, который в итоге выберет семья. Число мест Безопас- ность Цена Комфор- табель- ность Объем багажника Агрегиро- ванная полезность FordT 0 20 0 20 0 8 Seat 600 60 0 100 0 50 42 Simca 1000 100 30 100 50 70 70 «Фольксваген Жук» 80 50 30 70 100 66 СИгоёп Acadiane 20 40 60 40 0 32 Среднее арифметическое и функции агрегирования В предыдущем разделе мы показали, что выбор лучшего варианта производит- ся на основе функции, которая представляет собой среднее значение полезностей по разным критериям. Простейшая из таких функций — среднее арифметическое, однако агрегировать значения полезности можно и другими способами. Далее мы рассмотрим несколько ситуаций, в которых среднее арифметическое неприменимо. 1. Не все критерии одинаково важны. Все мы знаем, что при выборе автомо- биля безопасность важнее, чем удобство. Допустим, что даны два автомоби- ля, С1И С2, с одинаковой ценой, объемом багажника и числом мест, при этом первый безопаснее, но не столь комфортабелен, второй — наоборот. В такой ситуации предпочтительным скорее окажется более безопасный автомобиль, но выразить это предпочтение при помощи среднего арифметического нельзя. Проиллюстрируем этот пример таблицей, представленной на следующей странице. Два рассматриваемых автомобиля отличаются только безопасно- стью и комфортабельностью. Оценка безопасности первого автомобиля равна 70, оценка комфортабельности — 20, для второго автомобиля — наоборот. Возможно, в такой ситуации члены семьи предпочтут автомобиль С1, однако если мы применим среднее арифметическое, то общие оценки автомобилей будут одинаковыми. 27
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ Число мест Безопас- ность Цена Комфорта- бельность Объем багажника Агрегиро- ванная полезность С1 100 70 100 20 80 74 С2 100 20 100 70 80 74 2. Существуют определяющие критерии. При выборе автомобиля определя- ющим критерием обычно является цена. Если цена слишком высока, то уже не важно, насколько хорош автомобиль по остальным критериям. Иными словами, мы не купим недоступно дорогой автомобиль ни при каких условиях. Так как среднее арифметическое допускает некоторую взаимную компенса- цию значений, в подобных ситуациях оно оказывается неприменимым. 3. Взаимная компенсация критериев. Мы указали, что среднее арифметиче- ское допускает некоторую компенсацию значений, но не позволяет предста- вить все возможные разновидности компенсации. Если мы оптимистичны, то хорошей оценки по единственному критерию может оказаться достаточно для того, чтобы предпочесть определенный вариант. К примеру, когда преподаватель просматривает оценки студентов, чтобы на- значить им темы курсовых проектов, для него, возможно, не будет иметь зна- чения, в какой дисциплине отличился студент — математике, информатике или физике, так как хорошая оценка по любому из этих предметов скомпен- сирует плохие оценки по другим. В этом случае преподаватель отдаст предпо- чтение студенту, который выделяется в одной из этих дисциплин, а не тому, кто получил средние оценки по всем предметам. Среднее взвешенное не по- зволяет описать столь высокий уровень компенсации. Но если преподаватель слишком строг (или пессимистичен), то он будет ис- кать студента, оптимального по всем критериям, то есть того, кто прекрасно проявил себя во всех дисциплинах, и, возможно, отдаст предпочтение студен- ту со средними оценками по всем дисциплинам, а не тому, кто получил высо- кий балл по одному предмету, но провалился по остальным. 4. Взаимодействие критериев. Некоторые пары рассматриваемых критериев могут быть избыточными, к примеру комфортабельность и удобство. Также могут присутствовать критерии с высокой степенью корреляции. При исполь- зовании среднего арифметического варианты, получившие высокие оценки по таким критериям, получают преимущество. 28
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ В подобных ситуациях среднее арифметическое следует заменить другими функ- циями агрегирования. Граница Парето Как мы уже говорили, проблема принятия решения возникает в силу противоречи- вости критериев. В результате, как правило, выделяются пары вариантов, в которых первый вариант лучше по одному критерию, второй — по другому. В подобных слу- чаях мы не можем определить, какой вариант лучше, не располагая дополнительной информацией. Впрочем, в некоторых ситуациях для двух данных вариантов можно определить лучший — он будет предпочтительнее другого по всем критериям. В нашем примере с автомобилями подобная ситуация возникает при рассмотре- нии Seat 600 и Simca 1000. Напомним оценки этих автомобилей по всем критериям. Число мест Безопас- ность Цена Комфорта- бельность Объем багажника Seat 600 60 0 100 0 50 Simca 1000 100 30 100 50 70 Нетрудно видеть, что Simca 1000 всегда получает как минимум те же оценки, что Seat 600. Это означает, что Seat 600 ни при каких обстоятельствах не будет пред- почтительнее, чем Simca 1000. Такое отношение между альтернативными вариантами называется доминирова- нием по Парето. Формальное определение доминирования по Парето звучит так: Для двух векторов и = (нг ..., иД и v — (о1 ..., иД, соответствующих оценкам двух вариантов по п критериям, говорят, что вектор и доминирует над векто- ром v, если для любого критерия i выполняется соотношение v и., а также найдется как минимум одно значение, для которого о. < и. В этом определении предполагается, что наша цель — повысить удовлетворен- ность (полезность), следовательно, оптимальным будет решение с более высокими оценками. Разумеется, мы можем аналогично определить доминирование для случа- ев, когда требуется найти наименьшее значение, например при минимизации затрат. 29
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ В нашем примере доминирование наблюдается еще в одной паре: можно заме- тить, что Simca 1000 также доминирует над Ford Т. Seat 600 и Ford Т, напротив, не связаны никаким отношением доминирования — ни один из этих автомобилей не доминирует над другим. Число мест Безопас- ность Цена Комфорта- бельность Объем багажника FordT 0 20 0 20 0 Seat 600 60 0 100 0 50 Simca 1000 100 30 100 50 70 Следовательно, единственными отношениями такого типа будут: — Ford Т < Simca 1000; — Seat 600 < Simca 1000. Эти отношения указывают, что ни Ford Т, ни Seat 600 не будут выбраны ни в од- ном случае (если же они будут выбраны, то нужно будет выбрать и Simca 1000). Следовательно, вне зависимости от приоритетов членов семьи, Simca 1000 всегда будет лучше, чем Ford Т или Seat 600. В теории принятия решений интерес представляют недоминируемые варианты. Если рассуждать рационально, то интерес представляют только недоминируемые варианты, и только их следует принимать во внимание при выборе. В примере с ав- томобилями недоминируемые варианты таковы: — Simca 1000; — «Фольксваген Жук»; — Citroen Acadiane. Можно видеть, что эти варианты являются недоминируемыми потому, что каж- дый из них по сравнению с остальными оказывается более выгодным по крайней мере по одному из критериев. К примеру, Simca 1000 выгоднее остальных автомо- билей по цене, «Фольксваген Жук» — по объему багажника, Citroen опережает Simca 100 по безопасности, а «Фольксваген Жук» — по цене. Множество недоминируемых вариантов называется множеством Парето, или границей Парето. Если мы рассматриваем единственный критерий, то граница Па- рето будет состоять из одного варианта с наивысшей оценкой. 30
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ ВИЛЬФРЕДО ПАРЕТО (1848-1923) Граница Парето названа в честь Вильфредо Парето, итальянского социолога, экономиста и философа, который внес важнейший вклад в изучение распре- деления благ. Парето учился в Туринском универси- тете, преподавал во Флорентийском университете,, позднее - в Лозаннском университете. В его честь названа не только граница Парето, но и принцип Па- рето, который основан на следующем наблюдении, сделанном ученым в 1906 году: 80 процентов всей земли в Италии принадлежало 20 процентам насе- ления. Другими словами, если какой-то вариант, не входящий в множество Парето, имеет более высокую оценку по одному критерию, то он обязательно будет иметь более низкую оценку по какому-то другому критерию. Citroen Acadiane и «Фольксваген Жук» безопаснее, но дороже, чем Simca 1000, а также отстают по другим показателям. Граница Парето определяется так. Для данного множества альтернатив U, выраженных векторами и = (нг ..., иД, которые содержат оценки по п критериев, границей Парето называется множество и G U такое, что не существует никакого другого v G U такого, что vдоминирует над и. Элементы границы Парето называются оптимумами по Парето. Автоматическое обучение и многокритериальное принятие решений Для создания компьютерной программы, способной автоматически принимать ре- шения при многокритериальном выборе, можно использовать информацию о том, как решения принимают люди. К примеру, можно сначала подготовить таблицы, как при выборе автомобиля. Значения в них могут частично определяться функциями, 31
МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ АВТОМАТИЧЕСКОЕ ОБУЧЕНИЕ Автоматическое обучение - раздел искусственного интеллекта, в котором рассматриваются алгоритмы и методы, позволяющие повышать эффективность работы систем. Алгоритмы автоматического обуче- ния извлекают из имеющегося набора данных ряд правил и закономерностей, которые могут быть по- лезны для принятия решений или классификации. Пример автоматической системы классификации - система, которая отправляет в папку «Спам» неже- лательные электронные письма. Среди алгоритмов и методов автоматического обучения различают обу- чение с учителем, обучение без учителя и обучение с подкреплением. В обучении с учителем для каждого элемента множества данных определен результат, который должна «выучить» система. К примеру, если мы хотим создать систему определения спама, то для каждого элемента этого множества сообщений будет указано, является ли сообщение спамом или нет. При обучении без учителя подобные результаты неизвестны. В примере с множеством со- общений при обучении без учителя алгоритм должен самостоятельно найти отличия между со- общениями, при этом информация о том, какие сообщения являются спамом, а какие - нет, отсутствует. При обучении с подкреплением существует система поощрения или наказания, которая за- действуется по окончании работы алгоритма. К примеру, «наказание» задействуется тогда, когда система неверно классифицирует сообщение, и результат ее работы необходимо исправить вручную. Автоматическое обучение с учителем связано с построением статистических моделей. В ка- честве примера статистической модели можно привести линейную регрессию. С точки зре- ния обучения эта модель описывает метод обучения с учителем, в котором результат выражен в числовом виде. подобными тем, что мы привели для цены и объема багажника. Далее нужно опро- сить несколько человек и узнать их предпочтения. На основе информации в табли- цах и сведений о предпочтениях система автоматического обучения определяет такой способ агрегирования полезности, который точнее всего описывает принятые реше- ния. Построенную систему можно назвать моделью принятия решений опрошенных людей. На нее влияют выбранные примеры, форма таблиц и другие свойства. 32
Глава 2 Теория и практика: модели, больше моделей! В задаче принятия решения, описанной в предыдущей главе, присутствуют две вза- имосвязанные цели: во-первых, нужно помочь людям принять решение, во-вторых, иногда необходимо смоделировать процесс принятия решения человеком. Теоремы о представлении и функции полезности можно рассматривать как математические модели предпочтений людей. Выбор функции агрегирования также можно рассма- тривать как способ смоделировать синтез информации, выполняемый людьми. Зная функции, неявно используемые для принятия решения, мы можем понять, как мы связываем между собой альтернативные варианты, и, к примеру, определить, когда мы компенсируем критерии, а когда — нет. При построении модели (системы или компьютерной программы, которая по- могает принять решение) мы определяем свойства, которыми она должна обладать. Это свойства, которые мы либо считаем «хорошими» сами по себе, либо регулярно замечаем в окружающем нас мире. При построении модели не всегда понятно, какие свойства в нее следует включить. К примеру, если мы моделируем поведение чело- века или группы людей, следует задаться вопросом: должна ли модель абсолютно достоверно описывать все принимаемые решения и воспроизводить все разновид- ности поведения? Далее мы обсудим этот вопрос чуть более подробно. Как видите, применять тео- рию на практике не всегда просто! Транзитивность и нетранзитивность Ранее мы показали, что одно из необходимых свойств, которыми должны обладать отношения предпочтения — это свойство транзитивности. Транзитивность означа- ет, что если для трех альтернативных вариантов х, у, z выполняются соотношения 33
ТЕОРИЯ И ПРАКТИКА: МОДЕЛИ. БОЛЬШЕ МОДЕЛЕЙ! х у и у z, то должно выполняться и соотношение х^- z. Мы также рассмотрели пример с сахаром в кофе, где свойство транзитивности не выполняется. Допустим, что мы купили сахар в достаточно больших крупинках, чтобы раз- ница в одну крупинку сахара в кофе была незаметной, а разница в две крупинки уже ощущалась. В частности, чашка кофе с одной крупинкой сахара будет для нас предпочтительнее, чем с тремя крупинками. Однако мы не различаем ни чашки кофе с одной и двумя крупинками, ни чашки с двумя и тремя крупинками. Следовательно, так как разница в одну крупинку для нас неразличима, выполняется соотношение 3 крупинки > 2 крупинки и 2 крупинки > 1 крупинка, но соотношение 3 крупинки > > 1 крупинки уже не будет выполняться, так как в этом случае разница будет за- метна. Очевидно, что корень этой задачи кроется в человеческой природе: стимулы ощущаются только при превышении определенного порога. Следовательно, соблю- дение транзитивности в некоторых сценариях оказывается проблематичным. Задачи такого типа в 1956 году рассмотрел математик и социолог Данкан Люче, который ввел понятие безразличия. Основная идея Люче заключалась в том, чтобы представить ситуацию, в которой упорядочить пары вариантов нельзя. Исходный пример Люче Мы нашли человека, для которого чашка кофе с одним кубиком сахара предпочти- тельнее, чем чашка кофе с пятью кубиками сахара. Приготовим 401 чашку кофе, куда добавим (1 + i/100)x граммов сахара, где i = 0, 1, ..., 400, ах — вес одного кубика сахара. Испытуемый не ощутит разницы между чашками под номерами i и i + 1, однако разница между чашками под номерами i = 0 и i = 400 будет для него ощутимой. Формальное определение основано на строгом отношении, на основе которого и определяется отношение безразличия. Будем называть альтернативные вари- анты х и у безразличными тогда и только тогда, когда х не предпочтительнее у, а у не предпочтительнее х. Будем обозначать строгое предпочтение для пары аль- тернативных вариантов х и у как х < у, безразличие между х и у — как х ~ у. Тогда при х ~ у не выполняется ни х < у, ни у < х. Отношения ~ и < должны обладать рядом свойств, при соблюдении которых пара отношений ~ и < называется полу порядком. 34
ТЕОРИЯ И ПРАКТИКА; МОДЕЛИ. БОЛЬШЕ МОДЕЛЕЙ! Формализация отношений предпочтения ~ и <: полупорядок С точки зрения математики пара отношений ~ и < определяет полупорядок, если выполняются следующие условия: — отношение < не обладает рефлексивностью, то есть > < > не выполняется ни для какого х: — композиция отношений < о ~ о < включена в отношение <; — композиция отношений < о < о ~ включена в отношение <. Для двух отношений А, В на множестве X (иными словами, А и В представляют собой подмножества X х X), композиция отношений А о В определяется так: имеем хА о By тогда и только тогда, когда существует z на множестве X такое, что хА z и zBy. К примеру, композиция х < о ~ у определена тогда и только тогда, когда суще- ствует элемент z такой, что х < z и z ~ у. Ранее мы показали, что для любого отношения рационального предпочтения су- ществует функция полезности, описывающая это отношение. Аюче доказал анало- гичный результат для отношений, включающих отношение безразличия. Он связал приведенные отношения с функцией полезности и показал, что мы предпочитаем один вариант другому тогда, когда разница в полезности превышает определенное значение. Если же эта разница не превышает порогового значения, варианты будут для нас безразличными. Далее мы рассмотрим представление отношений предпочтения с безразличием. Представление отношений строгого предпочтения Функция полезности и описывает отношение строгого предпочтения > на множе- стве X, если для любых х, у на множестве X таких, что х > у, выполняется соот- ношение и(х) — и(у) > 1. Теорема Аюче, связывающая отношения предпочтения с безразличием и функ- цией полезности, гласит: 35
ТЕОРИЯ И ПРАКТИКА: МОДЕЛИ, БОЛЬШЕ МОДЕЛЕЙ! Для данного множества альтернативных вариантов функция полезности, ко- торая является представлением отношения предпочтения, существует тогда и только тогда, когда это отношение является полу порядком. Для данного рационального предпочтения можно определить сразу несколько описывающих его функций полезности. Более того, одно и то же предпочтение будет результатом любого монотонного преобразования полезности. Допустим, что мы рассматриваем безопасность автомобилей и наши предпочте- ния таковы: «Фольксваген Жук» > Сйгоёп Acadiane > Simca 1000 > Ford Т > Seat 600. Можно определить полезность так же, как и раньше. — Удовлетворенность Безопасностью(Рогс1 Т) = 20. — Удовлетворенность Безопасностью(8еа1 600) — 0. — Удовлетворенность Безопасностью(81тса 1000) = 30. — Удовлетворенность Безопасностью(«Фольксваген Жук») = 50. — Удовлетворенность Безопасностью(СМгоёп Acadiane) = 40. В этом случае мы, в принципе, можем выбрать любые другие значения при ус- ловии, что варианты будут располагаться в указанном выше порядке. К примеру, корректными также будут значения 2, 0, 35, 58 и 400 соответственно. Когда мы рассматриваем отношения предпочтения с безразличием, выбор функ- ций полезности ограничен. Так, нас уже не будет устраивать произвольное моно- тонное преобразование полезности. К примеру, для рациональных отношений пред- почтения можно изменить масштаб функции полезности, умножив или разделив ее значения на 100 и возведя их в квадрат. В любом из этих случаев предпочтение будет одинаковым. Если же мы рассматриваем предпочтения с безразличием, все обстоит иначе. Достаточно показать, что пара х ~ у означает либо н(х) — u(y) < 1, либо н(у) — и (х) < 1. В этом случае корректными значениями функции полезно- сти будут и(х) = 0,9, н(у) = 1,8. Если же мы определим новую полезность ulOO как полезность и, увеличенную в 100 раз, то получим и100(х) = 90, ul00(y) = = 180, и отношение х ~ у уже не будет выполняться. Аналогично, если мы опреде- лим функцию и2 как квадрат полезности и, то получим, что и2(х) = 0,81, и2(х) — = 3,24. Соотношение х ~ у в этом случае также не будет выполняться. 36
ТЕОРИЯ И ПРАКТИКА: МОДЕЛИ, БОЛЬШЕ МОДЕЛЕЙ! Ранее мы рассмотрели две модели: в первой отношение предпочтения обладает транзитивностью, во второй транзитивности нет, но наблюдается частичный поря- док. Это модели рационального предпочтения и полупорядка соответственно. Существуют модели, в которых выбор имеет случайную составляющую. Иными словами, для данной пары альтернативных вариантов рассматриваемый человек или множество людей не всегда выберут один и тот же вариант — их выбор будет опи- сываться неким распределением вероятностей. Выше мы уже отмечали, что для кон- кретного отношения предпочтения существует функция полезности определенного вида. Такие же функции существуют и для случаев, когда предпочтения и выбор описываются неким распределением вероятностей. В этих ситуациях значения по- лезности также ограничены отношениями предпочтений на основе полупорядков. Модели принятия решений Мы рассмотрели несколько разных моделей предпочтений: в первой предполага- лось, что выполняется свойство транзитивности, во второй мы отказались от этого свойства и включили в модель отношение безразличия, в третьей предположили, что выбор имеет случайную составляющую. Какая из этих моделей корректна? ЭФФЕКТ РАМОК Эффект рамок (англ, framing effect) - явление, при котором люди по-разному реагируют на одно и то же решение в зависимости оттого, как оно представлено: как выигрышное или проигрыш- ное. Как правило, лк-ди консервативны и с гремятся избежать риска в ситуациях, которые считают позитивными. В этом случае люди считают, что принятое решение подразумевает некий ущерб. Если же мы, напротив, сталкиваемся с ситуацией, которую считаем негативной, то стремимся рисковать: мы считаем, что принятое решение может принести некую выгоду. Даниэль Канеман и АмосТверски в 1981 году опубликовали исследование, в котором пока- зали, как различные формулировки одного и того же вопроса влияют на принимаемое решение. Их открытие было подтверждено в последующих работах. Также было доказано, что эффект ра- мок связан с возрастом: чем старше человек, тем этот эффект выше. Дети принимают решения скорее в соответствии с вероятностями, независимо от выгоды или ущерба для себя. Кроме того, Боаз Кейсар с соавторами (2012) показал, что если мы в процессе принятия решения рассуждаем на иностранном языке, го эффект рамок не проявляется. 37
ТЕОРИЯ И ПРАКТИКА: МОДЕЛИ, БОЛЬШЕ МОДЕЛЕЙ! Модели представляют собой лишь приближенное описание реального процесса принятия решений, то есть абстракцию и упрощение реальности. Следовательно, при сравнении результатов моделей с реальностью наблюдаются расхождения. Аб- солютная точность в 100 % достигается лишь в очень немногих случаях. Ошибка, то есть расхождение между тем, что происходит на самом деле, и тем, что должно произойти согласно модели, может быть вызвана более или менее случайными при- чинами или недостатками самой модели. Во втором случае стоит заменить модель другой, с новыми свойствами. Впрочем, далеко не всегда очевидно, когда следует сменить модель — для этого необходимо определить, что исходные гипотезы нарушаются не случайно, а систе- матически. Если решения, предлагаемые моделью, ошибочны, всегда можно по- пытаться подобрать другую, более сложную модель, где эти ошибки исправлены, однако на практике такой подход не всегда оказывается удачным. Эта проблема рас- сматривается в автоматическом обучении и статистическом обучении. Систематические ошибки и дисперсия В автоматическом и статистическом обучении рассматриваются модели принятия решений, которые могут применяться в компьютерных системах. Применение этих моделей для принятия решений мы вкратце обсудили в конце первой главы. Для объяснения ошибок таких моделей используются понятия систематической ошибки и дисперсии. Систематическая ошибка Систематическая ошибка модели заключается в том, что модель отражает лишь не- которые аспекты реальности. Мы показали, что модель Аюче позволяет выразить безразличие — характери- стику, которую нельзя представить в модели с рациональными отношениями пред- почтения. Аналогично, когда мы выполняем агрегирование полезности при помощи средне- го взвешенного, то можем представить ситуации, в которых критерии имеют раз- ные веса. Если мы применим агрегирование при помощи среднего арифметического и среднего взвешенного, чтобы спрогнозировать, какое решение примут клиенты нашего автосалона, то в случае со средним взвешенным систематическая ошибка будет меньше. 38
ТЕОРИЯ И ПРАКТИКА: МОДЕЛИ. БОЛЬШЕ МОДЕЛЕЙ! Для данной функции /, модели М, аппроксимирующей функцию /, и значения х() (входного значения функции и модели) систематическая ошибка модели М для х() определяется так: Систематическая Оишбка(М(х0))==Е(М(х0)) Здесь Е(М(х0)) обозначает ожидаемое значение для х(). ОЖИДАЕМОЕ ЗНАЧЕНИЕ МОДЕЛИ В автоматическом и статистическом обучении модели строятся на основе множества экспери- ментальных данных. Различным экспериментальным данным соответствуют слегка отличающи- еся модели. Иными словами, для одного и того же входного значения х0 модели будут слегка отличаться. Ожидаемое значение модели приближенно рассчитывается как средний результат, полученный при помощи моделей, составленных для разных экспериментальных данных. Дисперсия Еще одна важная характеристика рассматриваемых моделей — это дисперсия ито- говых значений. Если дисперсия велика, то в среднем корректная модель в общем случае будет выдавать значения, достаточно далекие от нужных. Для данной функции /, модели М, аппроксимирующей функцию /, и значения >'() (входного значения функции и модели) дисперсия модели М для >'() определяется так: Дисперсиях,)) = £([М(х0) - £(М(х„))]2). Здесь Е(М(х0)) обозначает ожидаемое значение модели для Д'(), a E([M(xQ) — - Е(М(х0))]2) — ожидаемое значение квадрата расхождения между фактическим и средним значением модели. Это выражение равносильно следующему: E(M(xo)) = (l//V)ZeCDM/xo)), где N — число элементов множества экспериментальных данных. В общем случае интерес представляют модели с малой систематической ошибкой и малой величиной дисперсии, то есть модели, в которых возвращаемое значение в среднем близко к ожидаемому, а ошибка, как правило, невелика. 39
ТЕОРИЯ И ПРАКТИКА: МОДЕЛИ, БОЛЬШЕ МОДЕЛЕЙ! Предположим, что компьютерная программа научилась принимать решения на основе нескольких примеров, описанных участником исследования, пытаясь де- лать это так же, как опрошенный. Следовательно, систематическая ошибка будет наблюдаться, если определенные решения, принимаемые нашей программой, всегда будут неудачными — например, потому, что она не «понимает», что цена автомо- биля слишком высока, и, несмотря на прекрасные оценки по остальным критериям, участник исследования никогда не выберет этот автомобиль. Для системы характер- на высокая дисперсия, если ее решения значительно отличаются друг от друга. Компромисс между систематической ошибкой и дисперсией при построении моделей В общем случае, если дано несколько моделей различной сложности, то чем слож- нее модель, тем меньше ее систематическая ошибка. Рост сложности означает, что модель имеет больше параметров, а значит, и больше возможностей адаптироваться к ситуации или экспериментальным данным. В частности, если мы хотим, чтобы компьютерная система воспроизводила решения группы людей, то с увеличением сложности модели ее прогнозы будут все точнее описывать реальные решения. Эта ситуация представлена на следующем рисунке. К примеру, если мы рассмотрим модели, описанные выше, то получим, что тран- зитивная модель проще, чем модель Аюче, поэтому в системе, созданной на основе модели Аюче, систематическая ошибка может быть меньше, чем в системе, постро- енной на транзитивной модели. Однако в результате роста сложности определить систему будет труднее, кроме того, может возрасти дисперсия. 40
ТЕОРИЯ И ПРАКТИКА: МОДЕЛИ, БОЛЬШЕ МОДЕЛЕЙ! При построении компьютерной системы на основе множества данных или ре- зультатов экспериментов система будет вести себя по-разному в зависимости от того, какие данные мы использовали при ее построении: разным данным будут соответствовать разные системы. Чем выше сложность модели, тем больше будут отличаться построенные системы при изменении данных, и в результате возрастет дисперсия. Эта закономерность представлена на следующем графике. Следовательно, по мере увеличения сложности систематическая ошибка, как пра- вило, уменьшается, но дисперсия возрастает. Так как мы хотим обеспечить малую систематическую ошибку и малую дисперсию, нужно найти некую точку равновесия. В автоматическом обучении при построении систем на основе исходных данных эффективность работы системы оценивается на тестовом множестве. Оценка про- изводится следующим образом. Дается несколько примеров, для которых результат работы системы известен. Эти примеры делятся на две группы: примеры первой группы используются для построения системы, примеры второй группы — для по- следующей оценки. Первая группа называется обучающим множеством, вторая — тестовым множеством. Следовательно, мы строим систему на основе обучающего множества. Когда система определена, мы поочередно рассматриваем все примеры из тестового множества и убеждаемся, что результат работы совпадает с тем, что указан в примере. Рассмотрим множество из 100 клиентов автосалона. Для каждого клиента ука- жем всю информацию о критериях, предпочтениях и о принятом решении, то есть о том, какой автомобиль он в итоге купил. Разделим это множество данных на две группы. В первую группу войдут 70 клиентов, во вторую — 30 оставшихся. Первая группа станет обучающим множеством, вторая — тестовым. Далее передадим дан- 41
ТЕОРИЯ И ПРАКТИКА: МОДЕЛИ, БОЛЬШЕ МОДЕЛЕЙ! ные о 70 клиентах компьютерной программе, которая построит нашу модель клиен- тов. Иными словами, результатом работы компьютерной программы станет новая программа, которую мы назовем РЕШАТЕЛЬ. Эта программа будет задавать клиентам ряд вопросов и рекомендовать автомобиль в зависимости от полученных ответов. Чтобы оценить работу программы РЕШАТЕЛЬ, поочередно введем в нее данные о 30 оставшихся клиентах (то есть тестовое множество) и посмотрим, каки- ми окажутся рекомендации. Так как мы заранее знаем, какой выбор сделали эти 30 клиентов, мы сможем определить, верное ли решение принял РЕШАТЕЛЬ. Чем сложнее РЕШАТЕЛЬ, тем больше результаты его работы будут совпадать с решениями 70 клиентов, использованными при создании программы. Системати- ческая ошибка уменьшится, но отклонение результатов для оставшихся 30 клиентов возрастет, то есть увеличится дисперсия. Нормативные и описательные теории И в теории принятия решений, и в экономике различают описательные и норматив- ные теории. Нормативная теория принятия решений изучает то, как люди должны принимать решения, описательная теория — то, как решения принимаются на самом деле. Экономист Ицхак Гильбоа указывает, что на практике это различие не столь важно, так как исследования и анализ, выполняемые в рамках этих двух теорий, одинаковы и различаются только обоснованием, или вводной частью. Таким обра- зом, рассмотрев проблему транзитивности (как мы уже указывали, свойство тран- зитивности в случае принятия решений выполняется не всегда), имеем: — в описательной теории принятия решений мы назвали бы транзитивность характеристикой человека, принимающего решение; — в нормативной теории принятия решений мы назвали бы транзитивность характеристикой, которую люди должны учитывать в момент принятия ре- шений. Кроме того, и в нормативной, и в описательной теории можно столкнуться с тем, что эта характеристика не наблюдается. Исследования в теории принятия решений основываются на двух приближени- ях. С одной стороны, верно, что требования описательной теории определяют на- правление развития новых моделей. Анализ поведения людей и процессов принятия 42
ТЕОРИЯ И ПРАКТИКА: МОДЕЛИ, БОЛЬШЕ МОДЕЛЕЙ! решении ведет к развитию новых методов, описывающих эти процессы. Сюда, к примеру, относится упомянутая выше работа Аюче, а также проведенное им иссле- дование парадокса Элсберга, о котором мы поговорим в главе 4. Также наблюдается и обратный процесс: в ходе изучения моделей исследователи определяют «хорошие» свойства и разрабатывают методы, обладающие такими свойствами. Нормативные и описательные аспекты также наблюдаются в изучении искус- ственного интеллекта. В нем различие между нормативными и описательными тео- риями играет важную роль, так как соответствует разным способам решения задач. Расскажем о них подробнее. Искусственный интеллект: рациональность или человечность Вопрос о том, должно ли поведение систем быть сопоставимо с поведением челове- ка, является дискуссионным. Стюарт Рассел и Питер Норвиг делят существующие определения искусственного интеллекта на две группы. В первой основное внимание уделяется поведению системы (тому, что происходит) и ее рассуждениям (почему это происходит), а во второй — оценке эффективности системы, то есть сравнению результатов ее работы с результатами рассуждений человека или некоего идеального интеллекта. В этой классификации выделяют четыре альтернативных определения искусственного интеллекта. 1. Системы, которые мыслят как люди. 2. Системы, которые действуют как люди. 3. Системы, которые мыслят рационально. 4. Системы, которые действуют рационально. Системы, которые мыслят как люди, стремятся воспроизвести когнитивные про- цессы человека. Создателей таких систем интересует не только результат, но и спо- собы его достижения. Исследования в этой области близки к когнитивистике. В случае с компьютерными системами, которые действуют как люди, основное внимание уделяется результатам работы, а не процессам, происходящим внутри си- стем. Тем не менее результаты работы сравниваются с результатами действий чело- века. Если результат работы системы отличается от результата действий человека, модель меняется. Примером оценки систем по такой модели является известный тест Тьюринга. 43
ТЕОРИЯ И ПРАКТИКА: МОДЕЛИ, БОЛЬШЕ МОДЕЛЕЙ! Система, которая мыслит рационально, — это система, следующая логической модели, где заключения исходят из предпосылок. К таким моделям, в частности, относятся аристотелева логика и логика предикатов, а также формальные модели принятия решений. Система, которая действует рационально, — это система, где более важную роль играют сами действия, а не внутренние процессы. Здесь смысл работы системы за- ключается в том, чтобы достичь поставленных целей. Если мы посмотрим на решения, принимаемые системой, с позиции описатель- ной теории принятия решений, о которой говорили в предыдущем разделе, то уви- дим, что в описательной теории искусственный интеллект главным образом рас- сматривается как система, действующая подобно человеку. В нормативной теории, напротив, искусственный интеллект преимущественно рассматривается как система, действующая рационально. ТЕСТ ТЬЮРИНГА Британский математик и специалист по криптографии Алан Тьюринг (1912- 1954) в 1950 году предложил оценивать ис- кусственный интеллект с помощью теста, ко- торый сегодня носит его имя. Тест Тьюринга проходит следующим образом. В комнате находится судья, который общается с ком- пьютер м и человеком через терминал. И компьютер, и человек находятся в другой комнате, и судья их не видит. Судья задает вопросы компьютеру и человеку, не зная, кто есть кто. Если он не сможет отличить компьютер от человека, это означает, что Статуя Алана Тьюринга из угольного сланца в Национальном музее компьютеров в Блетчли-парке (Англия). компьютер прошел тест Тьюринга, то есть программа по интеллектуальному уровню равна че- ловеку. Полностью пройти тест Тьюринга до сих пор не удалось ни одной компьютерной про- грамме. Однако в некоторых областях компьютеры демонстрируют более высокие результаты, чем человек. Один из таких примеров - программа Watson, разработанная компанией IBM для участия в американской телеигре «Jeopardy!» (на российском телевидении выходил ее аналог - «Своя игра»), где участники отвечают на вопросы на разные темы. 44
Глава 3 Многокритериальное принятие решений и агрегирование В первой главе мы показали, что при многокритериальном принятии решений мы вы- ражаем критерии в виде отношений предпочтения или функций полезности. Чтобы принять решение, необходимо агрегировать множество предпочтений или значений полезности в единственное предпочтение или полезность — так мы сможем выбрать оптимальный вариант. В этой главе мы опишем несколько способов определения агрегированных предпочтений и агрегированной полезности. Сначала мы рассмо- трим агрегированные предпочтения, затем — агрегированную полезность. Агрегирование предпочтений: теория общественного выбора Теория общественного выбора — это дисциплина, которая изучает агрегирование предпочтений, то есть определение совокупного предпочтения, учитывающего все элементы исходного множества предпочтений. В первой главе мы показали, что проблема агрегирования возникает, когда мы выражаем свое мнение по различным критериям при помощи отношений предпо- чтения. В таком случае выбрать оптимальный вариант можно, например, объединив множество отношений предпочтения в одно агрегированное отношение. В примере, приведенном в прошлой главе, проблема агрегирования возникла при определении лучшего автомобиля по пяти критериям: число мест, безопасность, цена, комфорта- бельность и объем багажника. Впрочем, подобные проблемы возникают и в других контекстах, например когда группа людей (каждый со своими предпочтениями) должна принять общее реше- ние. Здесь в качестве примера можно привести голосование на выборах. Некоторые методы, имеющие отношение к системам общественного выбора, мы рассмотрим в главе 6, посвященной избирательным системам. Один из таких методов — рей- тинговое голосование (в этом случае альтернативными вариантами будут различные кандидаты). 45
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ В теории общественного выбора, как правило, идет речь об избирателях и кан- дидатах, которые, соответственно, аналогичны критериям и альтернативным вари- антам в многокритериальных методах принятия решений. В обоих случаях, несмо- тря на разницу в областях применения, используются одни и те же математические модели и методы агрегирования. Далее мы поговорим как об избирателях, которые располагают кандидатов в порядке предпочтения, так и о критериях упорядочения альтернативных вариантов. Чтобы проиллюстрировать соответствие между этими двумя типами задач, рассмотрим следующий пример. Пять членов совета (пять из- бирателей) должны выбрать президента компании. Кандидаты таковы: Алисия, Берта, Клаудия, Давид и Элеонор. Пять избирателей должны записать в своих бюллетенях кандидатов в порядке предпочтения. Результаты голосования оказались такими. Избиратель 1 Избиратель 2 Избиратель 3 Избиратель 4 Избиратель 5 Клаудия Давид Берта Давид Давид Давид Элеонор Клаудия Клаудия Клаудия Берта Клаудия Элеонор Элеонор Берта Элеонор Алисия Давид Алисия Элеонор Алисия Берта Алисия Берта Алисия Представим результаты в виде списка избирателей и кандидатов и укажем, какое место занял каждый кандидат в списках избирателей. Получим следующую таблицу. Избиратель 1 Избиратель 2 Избиратель 3 Избиратель 4 Избиратель 5 Алисия 5 4 5 4 5 Берта 3 5 1 5 3 Клаудия 1 3 2 2 2 Давид 2 1 4 1 1 Элеонор 4 2 3 3 4 Эта таблица эквивалентна приведенной ниже таблице для пяти критериев вы- бора автомобиля. 46
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ Избиратель 1/ Число мест Избиратель 2/ Безопасность Избиратель 3/ Цена Избиратель 4/ Комфортабель- ность Избиратель 5/ Объем багажника Ford Т/ Алисия + ++ + ++ + Seat 600/ Берта +++ + +++++ + +++ Simca 1000/ Клаудия +++++ +++ ++++ ++++ ++++ «Фольксва- ген Жук»/ Давид ++++ +++++ ++ +++++ +++++ СКгоёп Acadiane/ Элеонор ++ ++++ +++ +++ ++ ПОИСКОВЫЕ СИСТЕМЫ И ТЕОРИЯ ОБЩЕСТВЕННОГО ВЫБОРА Ситуации, в которых необходимо рассмотреть методы общественного выбора, возникают и в цифровом мире - например, при поиске в интернете при помощи метапоисковой систе- мы. Метапоисковая система передает запрос пользователя различным поисковым системам, а затем объединяет полученные результаты. Так как результаты поиска представляют собой упорядоченные списки ссылок, метапоисковая система сводит множество предпочтений (упо- рядоченный список ссылок) к одному новому предпочтению (новому упорядоченному списку ссылок). С точки зрения общественного выбора отдельные поисковые системы соответствуют избирателям, ссылки - кандидатам. Системы поиска и метапоиска информации в интернете относятся к более широкой дисциплине - информационному поиску, в которой изучаются ме- ханизмы получения информации, относящейся к запросу. Мы можем потребовать, чтобы метод работал следующим образом: если все предпочитают вариант х, а не у, то в итоге вариант х должен быть предпочтитель- нее у. Методы агрегирования можно определить разными способами. Так, можно указать множество условий, которые кажутся «естественными», и установить, какие методы удовлетворяют этим условиям. В этом случае все полученные методы будут корректными. Такому подходу соответствует теорема Эрроу, так как она, прежде всего, опре- деляет, какие именно условия «кажутся естественными». Впрочем, позднее Эрроу 47
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ доказал, что не существует модели общественного выбора, удовлетворяющей всем условиям, которые «кажутся естественными». Далее мы покажем, какие именно ус- ловия рассмотрел Эрроу. Теорема Эрроу о невозможности коллективного выбора В теореме Эрроу считается, что число избирателей конечное и больше единицы, а число кандидатов равно трем или более. Разумеется, в случае с единственным из- бирателем окончательное решение принимает именно этот избиратель, и проблема выбора отсутствует. Говоря о числе кандидатов, отметим: если их всего двое, то для принятия решения будет достаточно простого большинства голосов. Следовательно, имеем следующее условие, которое обозначим СО. СО: а) Число избирателей конечно и больше единицы. б) Число кандидатов больше либо равно трем. Первое условие, которое мы рассмотрим, касается возможных вариантов упоря- дочения кандидатов в бюллетенях избирателей. Допускается любой полный пред- порядок (или рациональное отношение предпочтения), иными словами, избиратель может расположить кандидатов в любом порядке. Избиратель может даже указать, что несколько кандидатов для него одинаково предпочтительны. Будем называть описанное условие условием универсальности и обозначим его через С1. С1 — Универсальность. Избиратели могут указать любой порядок кандида- тов при условии, что этот порядок будет полным предпорядком. Второе условие таково: результат агрегирования также должен представлять со- бой упорядоченный список кандидатов. Здесь несколько кандидатов в списке так- же могут быть одинаково предпочтительными. Таким образом, результат агрегиро- вания будет представлять собой упорядоченный список кандидатов, обладающий теми же свойствами, что и списки, составленные избирателями. Если говорить более формально, результат агрегирования будет представлять собой полный предпоря- док. Будем называть описанное условие условием транзитивности и обозначим его через С2. С2 — Транзитивность. Результат агрегирования — полный предпорядок. 48
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ Третье условие — единогласие. Если все избиратели предпочитают одного кан- дидата другому, при агрегировании предпочтений эти два кандидата должны распо- лагаться в том же порядке. В нашем примере все избиратели предпочитают Давида Алисии, и, в соответствии с условием единогласия, в итоговом списке Давид также будет располагаться выше, чем Алисия. СЗ — Единогласие. Если все избиратели предпочитают кандидата х канди- дату у, то в результате агрегирования эти два кандидата должны рас- полагаться в соответствующем порядке. Четвертое условие — независимость от посторонних альтернатив. Согласно этому условию при рассмотрении пары кандидатов прочие кандидаты не повлияют на предпочтение избирателей в этой паре. К примеру, решение о том, кто из двух кандидатов предпочтительнее, Клаудия или Давид, должно быть продиктовано ис- ключительно мнением избирателей о Давиде и Клаудии, а не мнением о других кан- дидатах — Алисии, Берте и Элеонор. Таково условие С4. С4 — Независимость от посторонних альтернатив. Агрегированное предпо- чтение для пары кандидатов х, у зависит только от предпочтений из- бирателей для пары х, у. Пятое условие гласит: функция агрегирования не должна всегда совпадать с мне- нием какого-то конкретного избирателя. Это условие называется отсутствием дик- татора. Диктатор появляется в следующем случае: если какой-то конкретный изби- ратель предпочитает одного кандидата другому, то в результате агрегирования более предпочтительным всякий раз будет оказываться именно этот кандидат. С5 — Отсутствие диктатора. Ни один избиратель не может быть дикта- тором. Избиратель называется диктатором, если всякий раз, когда он предпочитает кандидата х другому кандидату у, в результате агрегиро- вания кандидат х оказывается наиболее предпочтительным вне зависи- мости от мнения остальных избирателей. Согласно теореме Эрроу о невозможности коллективного выбора не существует функции агрегирования предпочтений, которая бы удовлетворяла всем перечислен- ным условиям. 49
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ Если число избирателей конечно и больше единицы, а число кандидатов больше либо равно трем, не существует метода агрегирования предпочтений, который 1) был бы применим к любому множеству полных предпорядков, 2) определял бы полный предпорядок, 3) удовлетворял бы условиям единогла- сия, независимости от посторонних альтернатив и отсутствия диктатора. Как мы уже говорили, эти условия кажутся вполне естественными, однако не су- ществует такой функции, которая удовлетворяла бы всем им одновременно. Найти метод, который позволил бы выбрать лучшего кандидата на основе полного пред- порядка, можно единственным способом — исключить одно из перечисленных ус- ловий. Иными словами, определить искомый метод можно только в слз'чае, если одно из «естественных» условий, которые мы только что рассмотрели, не будет вы- полняться! Какие же условия можно исключить, чтобы определить возможные функции агрегирования предпочтений? — Исключить условие универсальности (С1). В этом случае некоторые по- рядки предпочтения кандидатов окажутся недопустимыми. — Исключить условие единогласия (СЗ). В этом случае, даже если все из- биратели предпочтут кандидата х, а не у, в итоговом списке кандидат у будет располагаться выше, чем х. — Исключить условие независимости от посторонних альтернатив (С4). Иными словами, в этом случае выбор лучшего кандидата в паре также бу- дет зависеть от позиций других кандидатов. А что можно сказать об исключении двух других условий? — Исключить условие транзитивности (С2). Доказано, что исключение этого условия не позволяет существенно улучшить решение задачи. Можно показать, что существуют функции агрегирования, удовлетворяющие всем прочим условиям, при этом в них отсутствует диктатор, но имеются так на- зываемые олигархи, иными словами, существует подмножество избирате- лей, которые, придя к соглашению, всегда будут определять итог выборов. — Исключить отсутствие диктатора (С5). Этот случай, очевидно, соответ- ствует диктатуре. Задача имеет решение, однако оно не относится к обла- сти общественного выбора. 50
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ Так как мы не можем исключить ни условие С2, ни условие С5, рассмотрим ис- ключение других условий. Уделим основное внимание исключению условий С1 и С4. Исключение условия универсальности (С1) Существуют функции агрегирования предпочтений, в которых определенные поряд- ки предпочтения кандидатов не допускаются. Может показаться, что в таком случае мы ограничиваем возможность избирателей высказать свое мнение, однако в не- которых ситуациях это ограничение имеет смысл и позволяет исключить слишком большие расхождения между избирателями. Еще одно ограничение: отношение предпочтения должно иметь единственный максимум, определенный на основе некоего скрытого порядка следования альтерна- тив или кандидатов. Так, кандидатов можно расположить вдоль оси, идущей слева направо, и каждый избиратель может выбрать оптимальную для себя точку на этой оси. Чем дальше кандидаты будут располагаться от этой оптимальной точки, тем меньше будет интерес избирателя к ним. К примеру, даны партии: крайне левая (КЛП), левая (ЛП) , центристская (ЦП), правая (ПП) и крайне правая (КПП). Расположим их вдоль оси, идущей справа налево (КПП ПП >р ЦП >р ЛП > КЛП). В этом случае ни один избира- тель не сможет упорядочить партии следующим образом: КПП > КЛП > ЛП > ПП > ЦП. Такой порядок противоречит упорядоченности партий справа налево: если из- биратель предпочитает КПП, то предпочтение относительно остальных партий определяется полностью. Если бы избиратель был сторонником центристской пар- тии, то обязательно выполнялось бы соотношение ЦП ЛП > КЛП, а также соотношение ЦП > ПП > КПП. Отношение предпочтения с одним максимумом не определяет порядок следования кандидатов полностью, поэтому порядок следо- вания, например, партий ЛП и ПП будет зависеть от избирателя. Еще один пример отношения предпочтения с одним максимумом — присужде- ние денежной премии. Допустим, что члены комиссии должны определить размер премии. Они сочтут некое значение оптимальным, и по мере удаления от него их предпочтение будет уменьшаться. К примеру, если один из членов комиссии хо- чет присудить премию в 100 евро, то 100 евро для него предпочтительнее, чем 50, 50 — предпочтительнее, чем 25, а 25 — предпочтительнее, чем 0. Нельзя, чтобы и 100 евро, и 25 были предпочтительнее 50. 51
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ Предпочтение с одним максимумом Для данного множества кандидатов X = {х1... х^}, упорядоченного следующим об- разом: х. х. +1, отношение предпочтения с одним максимумом > определено тогда, когда найдется элемент х* такой, что если для любых х и х' х <х х' <х х*. то х' > х; X* <х х' ^х X, то х' > X. Это предпочтение представлено на двух иллюстрациях ниже Отношение в обоих случаях будет одинаковым: A <v В <v С <v D <v Е < v F. л л л л л В первом случае избиратель предпочтет кандидата х* = А, следовательно, все прочие кандидаты окажутся менее предпочтительными и будут располагаться в по- рядке удаления от А. Таким образом, первый избиратель упорядочит кандидатов так: A>B>C>D>E>F. х*А В С D Е F Предпочтение с одним максимумом для первого избирателя в соответствии с порядком А <ХВ <ХС <XD <ХЕ <х F. Оптимальным кандидатом для этого избирателя будет кандидат х*= А. Во втором случае избиратель предпочтет кандидата х* = С. Следовательно, порядок его предпочтений будет таким: С > D > Е > F, а также С > В > А. На этом бюллетене кандидаты, в соответствии с иллюстрацией, будут располагаться в следующем порядке: C>B>E)>A>E>F. А В х*С D Предпочтение с одним максимумом для второго избирателя в соответствии с порядком А <х В <х С <XD<X Е<х F. Оптимальным для этого избирателя будет кандидат х* = С. 52
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ Отношение, представленное на следующей иллюстрации, уже не будет иметь один максимум — четко видно, что максимумов два. А В С D Е F Ситуация, в которой порядок А <ХВ <ХС <XD <ХЕ<XF не соответствует предпочтению с одним максимумом. Задача Эрроу имеет решение, если число избирателей нечетно, а их предпочте- ния ограничены предпочтением с одним максимумом. Тогда всем остальным усло- виям удовлетворяет правило большинства голосов (метод Кондорсе). Если мы вы- числим медианное значение максимумов для всех избирателей, то получим такой же результат. Это значение проще всего вычислить в примере с денежной премией. Исключение условия независимости от посторонних альтернатив (С4) Существуют различные методы, в которых условие независимости от посторонних альтернатив не рассматривается. Так, методы Кондорсе и Борда оба применяются для выбора единственного варианта из возможных. Избирательная система, применяемая на выборах, удовлетворяет принципу Кон- дорсе в следующем случае: если некий кандидат опережает всех остальных, рассмо- тренных по отдельности, то этот кандидат одерживает победу на выборах. Если говорить более формальным языком, для пары кандидатов х и у канди- дат х называется общественно предпочтительным по отношению к у, если большин- ство избирателей предпочитают кандидата х, а не у. Следовательно, в соответствии с принципом Кондорсе победителем станет кандидат, который будет общественно предпочтительным по отношению ко всем остальным. Кандидат х будет более общественно предпочтительным, чем кандидат у, тогда и только тогда, когда число избирателей, которые предпочли кандидата х кандида- ту у, будет больше числа избирателей, которые предпочли у, а не х. Метод Кондорсе определяется следующим образом. 53
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ 1. Избиратель упорядочивает кандидатов в соответствии со своими предпо- чтениями. 2. Для каждой пары кандидатов хну определяется, согласно ли большинство с тем, что х лучше у. Если большинство предпочитает х, то х будет обще- ственно предпочтительнее у. 3. Если некий кандидат всегда выигрывает, он и станет победителем по методу Кондорсе. Теперь покажем, как применить метод Кондорсе в рассмотренной задаче о вы- боре президента компании. Напомним порядок кандидатов в бюллетенях. Избиратель 1 Избиратель 2 Избиратель 3 Избиратель 4 Избиратель 5 Клаудия Давид Берта Давид Давид Давид Элеонор Клаудия Клаудия Клаудия Берта Клаудия Элеонор Элеонор Берта Элеонор Алисия Давид Алисия Элеонор Алисия Берта Алисия Берта Алисия По методу Кондорсе сначала для каждой пары кандидатов х и у нужно опре- делить, кто из них предпочтительнее. Иными словами, требуется выяснить, кого предпочитает большинство: Алисию или Берту, Алисию или Клаудию, Алисию или Давида, Алисию или Элеонор, Берту или Алисию, Берту или Клаудию и так далее. Начнем с пары кандидатов Алисия — Берта. Для избирателей 2 и 4 более пред- почтительный кандидат — Алисия, для избирателей 1, 3 и 5, напротив, Берта. Име- ем 2 голоса за и 3 — против. Следовательно, для большинства Алисия не будет предпочтительнее Берты. Теперь рассмотрим пару Алисия — Клаудия. Ни один избиратель не предпочел Алисию — все предпочли Клаудию. Имеем 0 голосов за, 5 — против. Аналогично в паре Алисия — Давид никто не предпочел Алисию — все пред- почли Давида. Следовательно, Алисия получила 0 голосов за, 5 — против. В паре Алисия — Элеонор вновь никто не предпочел Алисию — все отдали свой голос Элеонор. Следовательно, Алисия вновь получила 0 голосов за и 5 — против. Проведем аналогичные подсчеты для всех остальных пар кандидатов. Резуль- таты попарного сравнения кандидатов приведены в таблице ниже. К примеру, в третьей строке указано число избирателей, считающих, что Клаудия лучше, чем 54
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ Алисия, Берта, Давид и Элеонор соответственно. В ячейке таблицы, где Клаудия сравнивается сама с собой, стоит прочерк —. Алисия Берта Клаудия Давид Элеонор Алисия — 2 0 0 0 Берта 3 — 1 1 3 Клаудия 5 4 — 2 4 Давид 5 4 3 — 4 Элеонор 5 2 1 1 — Заметим, что каждой паре кандидатов соответствует два элемента матрицы: первый указывает, является ли х более общественно предпочтительным, чем у, вто- рой — является ли у более общественно предпочтительным, чем х. Разумеется, сумма этих двух элементов равна числу избирателей. К примеру, если мы рассмо- трим пару Алисия — Берта, то увидим, что Берта одержала верх 3 раза, Алисия — 2 раза. Сумма голосов равна 5. В нашем примере х будет более общественно предпочтительным, чем у, если за х проголосовало три избирателя или более. Отметим в нашей таблице только те пары, в которых один из кандидатов получил большинство голосов. Алисия Берта Клаудия Давид Элеонор Алисия Берта XX XX Клаудия XX XX XX Давид XX XX XX XX Элеонор XX Из таблицы видно, что Давид оказался общественно предпочтительнее всех про- чих кандидатов. Следовательно, именно он одержит победу по методу Кондорсе. Напомним, что этот пример с выборами президента компании эквивалентен примеру с выбором автомобиля: мы попросту заменили автомобили на кандидатов, а критерии — на избирателей. Следовательно, если мы вернемся к проблеме вы- бора автомобиля, то по принципу Кондорсе наиболее предпочтительным окажется «Фольксваген Жук». 55
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ МАРКИЗ ДЕ КОНДОРСЕ Мари Жан Антуан Николя де Нарита, маркиз де Кондорсе, родился во Франции 17 сентября 1743 года. Он обучался в Наваррском коллеже в Париже. Когда Кондорсе было 16 лет, его та- лант заметил математик и философ д’Аламбер, и тот сразу же стал его любимым учеником. Вопреки воле родных, Кондорсе отказался от военной карьеры и выбрал математику. Его первые труды были посвящены интегральному исчислению и теории вероятностей. С 1774 года Кондорсе интересуется философскими и поли- тическими вопросами. Он был противником смертной казни и защитником прав человека, также защищал права женщин, евреев и черно- кожих. Маркиз был сторонником избирательного права для женщин и народного образования. Одна из пяти статей, посвященных этим темам, содержит раздел с красноречивым названием: «Неравенство в образовании есть один из основных источников тирании». В своих заметках Кондорсе отстаивал необходимость всеобщего образования и считал, что ученикам должны преподаваться одинаковые предметы вне зависимости от пола. В 1785 году было опубликовано эссе, в котором он описал парадокс, носящий его имя, и определил так называемый принцип Кондорсе. После взятия Бастилии и по окончании Революции маркиз активно участвовал в вос- становлении Франции, однако его выступление против казни Людовика XVi и, прежде всего, критика конституции, представленной Мари-Жаном Эро де Сешелем, вызвали недовольство якобинцев и стали причиной его ареста. 28 марта 1794 года де Кондорсе был найден мертвым в тюремной камере. Портрет маркиза де Кондорсе кисти французского художника Жан-Батиста Грёза. Выборы без победителя в соответствии с методом Кондорсе В нашем примере в предыдущем разделе мы смогли найти решение по принципу Кондорсе, однако так происходит не всегда. В некоторых ситуациях определить 56
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ победителя по принципу Кондорсе невозможно, например если общественное пред- почтение не отдается ни одному кандидату. Рассмотрим пример с тремя избирателями и тремя кандидатами: Алисией, Бертой и Клаудией. Предпочтения избирателей таковы. Избиратель 1: Алисия > Берта > Клаудия. Избиратель 2: Берта > Клаудия > Алисия. Избиратель 3: Клаудия > Алисия > Берта. Теперь для каждой пары кандидатов х и у определим, кого предпочитает боль- шинство — х или у. Получим следующую таблицу предпочтений. Алисия Берта Клаудия Алисия X Берта X Клаудия X Как видите, каждый кандидат опережает лишь одного другого, поэтому в соот- ветствии с принципом Кондорсе на этих выборах не будет победителя. Между про- чим, общественное предпочтение в этом случае описывается отношением предпочте- ния, которое не является рациональным (то есть не является полным предпорядком). Избиратели предпочитают Алисию Берте, Берту — Клаудии, Клаудию — Алисии. Подобная ситуация, когда определить победителя невозможно, известна как па- радокс Кондорсе и заключается в следующем: для каждого кандидата найдется другой, которого предпочтет большинство. В нашем примере имеем: — если мы рассмотрим Алисию, то большинство предпочтет Клаудию; — если мы рассмотрим Клаудию, то большинство предпочтет Берту; — если мы рассмотрим Берту, то большинство предпочтет Алисию. Существует ряд методов, которые удовлетворяют принципу Кондорсе и при этом также позволяют найти решение в случаях, когда решения, соответствующего принципу Кондорсе, не существует. Один из таких методов — метод Коупленда. 57
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ ИЗУЧЕНИЕ ПАРАДОКСА КОНДОРСЕ И ЧАСТОТА ЕГО ВОЗНИКНОВЕНИЯ Можно задаться вопросом, как часто при выборах возникает парадокс Кондорсе и каковы его преимущества и недостатки. В общем случае подобные ситуации считаются неблагоприятны- ми, поскольку определить победителя в них сложнее, а результат выборов в большей степени подвержен возможным манипуляциям. Тем не менее некоторые исследователи указывают, что парадокс Кондорсе может иметь свои преимущества. К примеру, Николас Миллер (1983) ут- верждает, что в подобных ситуациях избиратели меняют предпочтения и поддерживают новые коалиции, что повышает политическую стабильность - так, благодаря смене коалиций мень- шинства не будут долгое время оставаться на вторых ролях. Частоту возникновения парадокса Кондорсе изучали многие исследователи. Первым из них в 1785 году стал сам Кондорсе. Чтобы определить, как часто возникает парадокс Кондорсе, необходимо высказать несколько предположений относительно возможных предпочтений изби- рателей и (или) о типе отношений между парами кандидатов. Кондорсе, к примеру, рассмотрел случай, в котором большинство с равной вероятностью может либо предпочесть кандидата х кандидату у, либо кандидата у - кандидату х. Уильям Герлейн рассмотрел случай, в котором избиратели с равной вероятностью могут склониться к любому рациональному предпочтению. Это условие, которое на английском языке называется Impartial Anonymous Culture (аноним- ная беспристрастная культура, IAC), не слишком реалистично. Более реалистичные ситуации рассмотрели тот же Герлейн, а также Цетлин, Регенветт и Грофма (2003). Было показано, что в случаях, когда вероятности выбора различных предпочтений ближе к реальности, вероятность парадокса Кондорсе снижается. Метод Коупленда В методе Коупленда победителем считается кандидат, который опережает большин- ство соперников (необязательно всех). 1. Избиратель упорядочивает кандидатов согласно своим предпочтениям. 2. Для каждой пары кандидатов х и у определяется, согласно ли большинство с тем, что х лучше у. Если большинство предпочитает х, то х будет обще- ственно предпочтительнее у. 3. Для каждого кандидата определяется число соперников, которых он опере- жает по мнению большинства. 4. Выбирается кандидат, одержавший верх над большинством соперников. 58
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ Метод Коупленда допускает ничейные исходы, как, например, в нашем примере с тремя избирателями и тремя кандидатами — Алисией, Бертой и Клаудией. Можно заметить, что в этом случае каждый кандидат, по мнению избирателей, опережает только одного соперника. Следовательно, по методу Коупленда все три кандидата будут равны. Правило Борда В этом методе учитывается положение, которое занимает каждый кандидат в изби- рательных бюллетенях. Если дано п кандидатов, то первому кандидату в бюллетене присваивается значение п, второму — п — 1, третьему — п — 2 и так далее для всех бюллетеней. Полученные значения складываются, и победу одерживает кандидат с наибольшей суммой. Более формально правило Борда определяется так. 1. Избиратель упорядочивает кандидатов согласно своим предпочтениям. Обо- значим число кандидатов через п. 2. Для каждого бюллетеня первому кандидату присвоим значение п, второму кандидату — п — 1, третьему — п — 2 и так далее до последнего. 3. Для каждого кандидата вычислим сумму значений, присвоенных на преды- дущем шаге. 4. Выбирается кандидат с наибольшей суммой. Вернемся к примеру с выбором президента компании. Так как избиратели выби- рают из пяти кандидатов, то, в соответствии с описанием, присвоим значение 5 кан- дидатам, указанным в бюллетенях первыми, 4 — кандидатам, указанным вторыми, и так далее. В частности, по мнению первого избирателя Клаудия получит 5 баллов, Давид — 4, Берта — 3, Элеонор — 2, Алисия — 1. Избиратель 1 Избиратель 2 Избиратель 3 Избиратель 4 Избиратель 5 Алисия 1 2 1 2 1 Берта 3 1 5 1 3 Клаудия 5 3 4 4 4 Давид 4 5 2 5 5 Элеонор 2 4 3 3 2 59
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ Далее нужно определить сумму баллов для каждого кандидата. Алисия получит 1+2+1+2+1=7 баллов, Берта — 3 + 1 + 5 + 1 + 3 = 13, Клаудия — 5 + 3 + + 4 + 4 + 4 = 20, Давид — 4 + 5 + 2 + 5 + 5 = 21, Элеонор — 2 + 4 + 3 + 3 + + 2 = 14 баллов. По правилу Борда, в этом случае победителем вновь станет Давид. Различие между методом Кондорсе и правилом Борда В приведенном выше примере результаты, полученные по методу Кондорсе и пра- вилу Борда, совпадают, однако так происходит не всегда, поскольку правило Борда не удовлетворяет принципу Кондорсе. Рассмотрим пример. Предположим, что трем избирателям нужно выбрать одного из четырех канди- датов: Алисию, Берту, Клаудию и Давида. Избиратели заполнили бюллетени сле- дующим образом. Избиратель 1: Берта > Алисия > Клаудия > Давид. Избиратель 2: Алисия > Клаудия > Давид > Берта. Избиратель 3: Берта > Алисия > Клаудия > Давид. Сначала определим результат по методу Кондорсе. Для этого нужно рассмо- треть пары кандидатов и определить, какой кандидат является наиболее обществен- но предпочтительным. Информация представлена в таблице. Алисия Берта Клаудия Давид Алисия — 1 3 3 Берта 2 — 2 2 Клаудия 0 1 — 3 Давид 0 1 0 -- Так как общественное предпочтение наблюдается в случае, когда мнения двух или более избирателей совпадают, большинство сходится на том, что лучший кан- дидат — это Берта. Большинство считает, что Берта лучше, чем Алисия, Клаудия и Давид. Следовательно, Берта одержит победу в выборах по методу Кондорсе. Теперь определим исход выборов по правилу Борда. В этом случае каждому кан- дидату нужно присвоить определенное число баллов в соответствии с предпочтени- ями избирателей. Кандидаты получат следующие баллы. 60
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ Алисия: 3 + 4 + 3 = 10. Берта: 4 +1 + 4 = 9. Клаудия: 2 + 3 + 2 = 7. Давид: 1 + 2 + 1 = 4. Так как по правилу Борда выигрывает кандидат с наибольшей суммой баллов, победу одержит Алисия. Поскольку победителем по методу Кондорсе стала Берта, мы видим, что в общем случае исходы выборов, определенные по правилу Борда и по методу Кондорсе, будут отличаться. Если мы обратим внимание на предпочтения избирателей, то увидим, что Алисия, которая оказалась победительницей по правилу Борда, занимает высокое место во всех предпочтениях. На первое место ее поставил всего один избиратель (так как с точки зрения большинства Берта лучше, Алисия не может выиграть выборы по методу Кондорсе), но остальные отдали ей второе место. Победитель ДО КОНДОРСЕ И БОРДА Методы Кондорсе и Борда были «изобретены» задолго до того, как эти ученые появились на свет. Раймунд Луллий, живший в XIII веке, в своей книге «Бланкерна» описал метод вы- бора настоятельницы монастыря, который представлял собой метод Кондорсе (Коу- пленда). Луллий также описал свой метод в двух трудах, написанных на латыни, под на- званием Artificium elections personarum и De arte eleccionis. Николай Кузанский, знакомый с методом Луллия. определил альтернатив- ный метод, который сегодня известен как метод Борда, и описал его в 1431 году в тру- де под названием De concordantia catholica («О согласии католиков»). И Луллий, и Ни- колай Кузанский ставили перед собой одну цель - найти метод честных выборов церковных Раймунд Луллий проповедует. Гравюра. сановников. 61
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ по методу Кондорсе, Берта, в бюллетене второго избирателя оказалась на послед- нем месте. Это означает: Алисию считают хорошим кандидатом все избиратели, а Берту — не все. В этом смысле правило Борда описывает скорее общее согласие (согласован- ность разных порядков предпочтения), а в методе Кондорсе основное внимание уде- ляется кандидату с лучшей позицией. Помимо метода Кондорсе и правила Борда, существуют и другие методы агре- гирования предпочтений. Как мы уже указывали выше, с аналогичной точки зрения можно рассмотреть некоторые избирательные системы. Мы поговорим о них под- робнее в главе 5. Агрегирование полезности В первой главе мы показали, что в процессе принятия решений необходимо исполь- зовать функции агрегирования, объединяющие значения полезности, которые мы присваиваем каждому критерию. Существует обширное множество таких функций, различающихся в зависимости от требований к процессу принятия решения. Кроме того, в предыдущей главе мы показали, что одной из возможных функций агрегирования является среднее арифметическое, однако существуют и другие воз- можные функции. Мы обсудили четыре ситуации, в которых среднее арифметиче- ское оказывается неприменимым. Напомним их. 1. Не все критерии одинаково важны. В качестве примера критериев разной важности можно привести безопасность и комфортабельность. 2. Существуют определяющие критерии. Покупатель не выберет автомо- биль со слишком высокой ценой, сколь бы привлекательными ни были про- чие характеристики. 3. Взаимная компенсация критериев. Компенсация критериев будет наи- большей, если для того, чтобы сделать выбор в пользу определенного вари- анта, будет достаточно хорошей оценки всего по одному критерию. 4. Взаимодействие критериев. Такие критерии, как «комфортабельность» и «удобство», либо избыточны, либо между ними наблюдается высокая кор- реляция. Существуют функции агрегирования, позволяющие представить все эти си- туации. Рассмотрим некоторые из них на все том же примере с автомобилями. 62
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ В некоторых случаях изменение функции не приведет к изменению результата (итогового выбора). В целом представленные функции обладают разными свой- ствами, поэтому иногда порядок следования вариантов будет отличаться. Для каж- дой из этих функций можно найти частный случай, когда пара объектов на границе Парето поменяется местами. Не все критерии одинаково важны. Среднее взвешенное Как правило, на школьных экзаменах разные задачи оцениваются разным количе- ством баллов. Преподаватель придает определенным задачам больший вес, после чего находит среднее значение с учетом указанных весов. В этом случае преподава- тель рассчитывает среднее взвешенное. Именно расчет среднего взвешенного чаще всего используется для корректировки значимости различных критериев. Если дано п критериев С1... Сп, то для каждого альтернативного варианта имеем п значений полезности и{, ..., ип. Тогда среднее взвешенное значение (англ, weighted mean, со- кращенно WM) этих критериев будет равно: WM(ur ..., ип) = Е. и. р., где (рг ..., р) — вес, или важность критериев. Веса должны быть положительны- ми, их сумма должна равняться единице. В примере с выбором автомобиля семья может посчитать самым важным крите- рием безопасность (и присвоить этому критерию вес в 50% от общего значения), затем — объем багажника, чтобы перевозить чемоданы во время путешествий (30 %), далее цену (10 %), число мест (5 %) и комфортабельность (также 5 %). В этом случае итоговый результат для Ford Т, вычисленный с использованием среднего взвешенного, будет таким: — Агрегированная Полезность(Рогс1 Т) = (0,05 • 0 + 0,50 • 20 + 0,10 • 0 + + 0,05-20+ 0,30-0) = 11. Полезность по каждому критерию умножается на соответствующий вес: полез- ность числа мест (0) — на 0,05, полезность безопасности (20) — на 0,50, полез- ность цены (0) — на 0,10, полезность комфортабельности (20) — на 0,05, полез- ность объема багажника (0) — на 0,30. Итоговое значение равно И. 63
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ Вычислим полезность других автомобилей. — Агрегированная Полезность(8еа1 600) = (0,05 • 60 + 0,50 • 0 + 0,10 • 100 + + 0,05 -0 + 0,30 -50) = 28,0. — Агрегированная Полезность(8ипса1000) = (0,05 • 100 + 0,50 • 30 + 0,10 х х 100 + 0,05 • 50 + 0,30 • 70) = 53,5. — Агрегированная Полезность(«Фольксваген Жук») = (0,05 • 80 + 0,50 • 50 + +0,10 • 30 + 0,05 • 70 + 0,30 • 100 = 65,5. — Агрегированная Полезность(СИгоёп Acadiane) = (0,05 • 20 + 0,50 • 40 + + 0,10 • 60 + 0,05 • 40 + 0,30 • 0)= 29,0. Результатом этих расчетов будет следующий порядок следования вариантов: «Фольксваген Жук» > Simca 1000 > Сйгоёп Acadiane > Seat 600 > Ford Т. Как видите, лучшим вариантом вновь оказался «Фольксваген Жук». Существование определяющих критериев. Операции над множествами Если функция полезности равна нулю в случае, когда не выполняется какой-то опре- деляющий критерий, то иногда этой нулевой оценки достаточно, чтобы агрегирован- ная полезность равнялась нулю. Для описания такой ситуации можно использовать среднее геометрическое (англ, geometric mean, GM). Оно всегда равно нулю, если нулю равно одно из исходных значений. Среднее геометрическое определяется так: GM(tz , а ) = (а-...-а )1/". v 1 п' ' 1 п ' В примере с автомобилями получим следующие результаты. — Полезность Среднее FeoMempunecKoe^Ford Т) = (0 • 20 • 0 • 20 • О)1/5 = 0. — Полезность Среднее Геометрическое(8еа1 600) = (60 • 0 • 100 • 0 • 50)1/5 = = 0. — Полезность Среднее Геометрическое(81тса 1000) — (100 • 30 • 100 • 50 х х 7О)1/5 = 63,714. — Полезность СреднееГеометрическое(«ФольксвагенЖук») = (80-50-30X х 70-100)^ = 60,933. 64
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ — Полезность Среднее Геометрическое^СМгоёп Acadiane) = (20 • 40 • 60 • 40 X х0)1/5 = 0. Семья выберет автомобиль Simca 1000, вторым вариантом будет «Фольксваген Жук». Все остальные автомобили имеют полезность, равную нулю. Взаимная компенсация критериев. Порядковые статистики Если один из вариантов получил хорошие оценки по достаточному числу критериев, его можно принять даже, если оценки по другим критериям окажутся невысокими. Для описания такой ситуации используют порядковые статистики. К примеру, если мы считаем, что тот или иной вариант можно счесть хорошим всего по какому-то одному критерию, то агрегированным значением полезности будет наибольшее среди значений полезности по одиночным критериям. — Максимальная Полезность(РоМ Т) = тах(0, 20, 0, 20, 0) = 20. — Максимальная Полезность^ eat 600) = тах(60, 0, 100, 0, 50) —100. — Максимальная Полезность(81тса 1000) = тах(100,30,100,50,70) = 100. — Максимальная Полезность(«Фольксваген Жук») — тах(80, 50, 30, 70, 100) = 100 — Максимальная Полезность(СИгоёп Acadiane) — п?ах(20, 40, 60, 40, 0) = 60. Как видите, мы не можем сделать выбор между тремя автомобилями, причем один из них, Seat 600, получил две очень низкие оценки и над ним доминирует Simca 1000. Но так как мы принимаем во внимание только наибольшее значение, эти две модели неотличимы. Если мы хотим сделать выбор с высокой степенью компенсации критериев, сле- дует выбрать второе по убыванию значение функции полезности. — Полезность2 По Порядку (Ford Т) = Второе Наибольшее(0, 20, 0, 20, 0) = 20. — Полезность2 По Порядку(8еа1 600) = Второе Наибольшее(60, 0, 100, 0, 50) = 60. — Полезность2 По Порядку(8'ипса 1000) = Второе Наибольшее^ОО, 30, 100,50, 70)= =100. 65
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ — Полезность2 По Порядку («Фольксваген Жук») = Второе Наиболь- шее (80, 50, 30, 70,100) = 80. — Полезность2 По Порядку (Citroen Acadiane) = Второе Наиболыиее(20, 40, 60, 40, 0) = 40. Автомобилем с наивысшей оценкой вновь оказался Simca 1000, так как он полу- чил оценку 100 по двум критериям. По результатам агрегирования с учетом компенсации критериев автомобили будут располагаться в следующем порядке: Simca 1000 > «Фольксваген Жук» > Seat 600 > Citroen Acadiane > Ford T. Взаимодействие критериев. Интеграл Шоке Чтобы учесть взаимодействие критериев при агрегировании полезности, необходи- мы какие-то функции или показатели, которые позволяют выразить и (или) опре- делить такое взаимодействие. Примером таких показателей служат неаддитивные меры. Вернемся к примеру, когда мы определили вес каждого критерия. Мы указа- ли, что веса должны быть положительными, а их сумма должна равняться единице. Веса рассматривались только для отдельных критериев, но точно так же, как мы оцениваем важность одиночного критерия (к примеру, безопасности), мы можем оценить важность пары критериев (например, безопасности и комфортабельности). В этом случае важность множества можно представить как суммарную важность отдельных критериев. В нашем примере важность безопасности равна 0,50, важность комфортабель- ности — 0,05, следовательно, важность пары критериев (безопасность, комфорта- бельность) равна 0,55. Такое приближение корректно для независимых критериев. Если же критерии зависят друг от друга, то множеству этих критериев можно присвоить некое значе- ние, отличное от суммы весов отдельных критериев. Функция, определяющая со- вокупную важность критериев, монотонна относительно включения множеств. До- пустим, что дана такая функция, которая ставит в соответствие каждому множеству критериев некое значение (важность). Подобные функции называются неаддитив- ными мерами. Пример неаддитивной меры мы приведем ниже. 66
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ После того как мы определили такую функцию, необходимо найти агрегирован- ное значение полезности с учетом этой функции. Объединить значения полезности с учетом важности всех множеств критериев позволяет интеграл Шоке. Неаддитивные меры — не единственное название функций такого типа. Также их называют нечеткими мерами или предмерами. Интеграл Шоке был описан в 1954 году французским математиком Гюставом Шоке (1915—2006). НЕЧЕТКИЕ ИНТЕГРАЛЫ Интеграл Шоке - не единственный интеграл, позволяющий выполнить агрегирование множе- ства значений относительно неаддитивной меры. Так, японский профессор Мичио Сугено опи- сал интеграл, который сегодня носит его имя, в своей диссертации на соискание доктора техни- ческих наук. Диссертация была защищена в 1974 году в Токийском технологическом институте. Сугенч - известный специалист по теории нечетких множеств, совершивший несколько важ- ных открытий в этой области: в частности, он стал автором системы Такаги - Сугено и неадди- тивной меры - лямбды Сугено. Неаддитивная мера для поездки в Японию Предположим, что Алисия хочет в ближайшее время съездить в Японию и гото- вится к поездке. Она планирует посетить три города — Токио, Нагано и Киото — и выражает свои предпочтения при помощи неаддитивной меры. Мера множества городов обозначает желание Алисии посетить именно эти города, а не какие-то дру- гие. Эта мера неаддитивна — к примеру, Алисии будет достаточно посетить только Токио или только Киото (она присвоила обоим этим городам значения больше 0,5). Если же она посетит оба этих города, соответствующая мера составит «всего» 0,9. Если Алисия посетит все три города, то удовлетворенность окажется максимальной. Этой ситуации соответствует значение 1. Как вы увидите чуть позже, порядок пред- почтений Алисии таков: сначала Токио, затем Киото и, наконец, Нагано. -т({})=0. — т({Токио}) = 0,7; пг({Киото}) = 0,5; п?({Нагано}) = 0,2. — т({Токио, Киото}) — 0,9; т({Киото, Нагано}) = 0,6; т({ТЬкио, Нагано}) = = 0,8. — т({Токио, Киото, Нагано}) = 1. 67
МНОГОКРИТЕРИАЛЬНОЕ ПРИНЯТИЕ РЕШЕНИЙ И АГРЕГИРОВАНИЕ Как функция агрегирования связана с границей Парето Как мы уже говорили, на границе Парето располагаются варианты, представляю- щие особый интерес. Ранее мы показали, что функции агрегирования преобразу- ют таблицу с информацией о различных критериях в таблицу, состоящую из одного столбца, которую очень просто упорядочить. Следовательно, функция агрегирова- ния определяет некий порядок, а разные функции агрегирования определяют разные порядки. Следовательно, при выборе функции агрегирования мы неявно выбираем конкретный порядок следования вариантов. Более того, для каждого возможного порядка следования вариантов на границе Парето можно найти функцию агрегиро- вания, которая позволит воспроизвести именно такой порядок. 68
Глава 4 Принятие решений в условиях неопределенности Как мы уже отмечали в главе 1, иногда мы точно не знаем, каким может быть эффект нашего решения. Рассмотрим два примера. 1. У нас есть 100 евро и мы думаем о том, чтобы купить лотерейный билет. В этом случае альтернативных вариантов два: купить билет или не купить. Допустим, что в лотерее участвует всего 10 билетов, а выигрыш составляет 500 евро. Если мы не купим билет, выигрыш очевиден: мы не выиграем ни- чего. Если же мы купим билет, то неизвестно, получим ли какую-то выгоду. Однако вероятность выигрыша в этом случае также очевидна (если лотерея проводится по правилам): из 10 лотерейных билетов выигрывает один. 2. Мы решили организовать вечеринку в феврале, чтобы собрать деньги на пу- тешествие. Если мы проведем ее на улице и будет хорошая погода, мы соберем много денег. Если же пойдет дождь или снег, праздник не удастся и мы не со- берем денег вовсе. Если же мы проведем вечеринку в помещении и пойдет дождь или будет холодно, собранная сумма будет приемлемой, а если погода будет хорошей, то мы не соберем большую сумму. Сейчас Рождество, нельзя точно сказать, какой будет погода в феврале. Мы также не знаем точно, ка- кую сумму нам удастся собрать в обоих случаях. В классической теории принятия решений обычно различают принятие решений в условиях неопределенности и принятие решений в условиях риска. Принятие ре- шений в условиях риска означает, что мы не можем с абсолютной уверенностью предсказать исход ситуации, но можем описать то, что мы не знаем, с помощью известного распределения вероятностей. Принятие решений в условиях неопреде- ленности означает, что такое распределение неизвестно или не существует. В задаче о лотерее распределение вероятностей известно, следовательно, речь идет о приня- тии решения в условиях риска. В задаче о вечеринке речь идет о принятии решения в условиях неопределенности. 69
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Проблемы, связанные с принятием решения в условиях неопределенности, могут быть вызваны разными причинами, поэтому выделяют несколько видов неопреде- ленности. Для каждого из них были разработаны особые методы. Так, одной из причин неопределенности может быть неточность (англ, imprecision). Яркий пример неточности — информация вида «температура состав- ляет от 20 до 25 °C». В этом случае если нас спросят, равна ли температура 23 °C, мы можем дать только один ответ — «да, это возможно». Хотя вопрос абсолют- но точен, ответить на него нельзя из-за неточности доступной информации. Кроме того, доступная информация может быть нечеткой — например, «температура равна примерно 22 °C». Для решения задач, связанных с неточностью, можно использо- вать нечеткие множества. Еще один тип неопределенности — это случайность (англ, randomness). Для ре- шения задач, в которых неопределенность имеет случайную природу, часто исполь- зуются вероятностные модели. Рассмотрим классические модели принятия решений в условиях неопределенно- сти и в условиях риска, основанные на распределениях вероятностей. РЕШЕНИЕ, РИСК И НЕОПРЕДЕЛЕННОСТЬ Разделение риска и неопределенности берет начало в классической теории принятия реше- ний, изложенной в книге Фрэнка Хайнемана Найта «Риск, неопределенность и прибыль» («Risk, Uncertainty and Profit», 1921). С таким разделением согласны не все, и некоторые специалисты считают его ненужным. Один из них - Жан-Поль Чавас, который возражает как раз против необходимости такого раз- деления: по его мнению, риск и неопределенность можно сравнительно легко различить, если грамотно выбрать трактовку понятия вероятности. Как следствие (а также потому, что научная дискуссия на эту тему не вызвала обширного эмпирического анализа), Чавас использует тер- мины «риск» и «неопределенность» как синонимы. Он указывает три причины существования событий, связанных с риском: неспособность проконтролировать и измерить некоторые при- чины событий, наши ограниченные способности к обработке информации и затраты, связанные с получением информации и ее обработкой. В книге «Теория принятия решений в условиях неопределенности» (Theory of Decision under Uncertainty, 2009) Ицхак Гильбоа обсуждает труд- ности этой теории, применяемые в ней модели, а также причины ее существования. Он также рассказывает о трудностях при определении вероятностей и приводит различные системы ак- сиом и альтернативные теории. 70
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Интерпретации вероятности В аксиоматике теории вероятностей ничего не говорится ни о смысле понятия «ве- роятность», ни о том, как ее следует определять. Сегодня существует несколько ин- терпретаций этого понятия, среди которых выделяют два основных класса — объ- ективную и субъективную вероятность. Объективная вероятность Объективная вероятность также называется физической или частотной. Она назы- вается физической в том смысле, что определяется на основе некой физической си- стемы со случайным поведением, которая позволяет определить предельную частоту определенного исхода в длительной последовательности схожих событий. В каче- стве примера можно привести выбор числа на колесе рулетки. Важно отметить, что в первом примере с лотереей мы использовали определение вероятности именно та- кого типа. Субъективная вероятность Здесь вероятность понимается как степень уверенности конкретного человека. Эта степень уверенности является личной в том смысле, что степень уверенности разных людей в одной и той же ситуации вовсе не обязательно одинакова. Одну из первых теорий, доказывающих существование субъективной вероятно- сти, создал итальянский математик Бруно де Финетти (1906—1985). Его теория основана на ставках, совершаемых человеком на неком множестве объектов, а также на предпочтениях этого человека относительно возможных размеров ставок. На ос- нове свойств, которые считаются обязательными при рассмотрении предпочтений относительно ставок, де Финетти сформулировал теорему о существовании вектора вероятностей. Эти вероятности и называются субъективными. Позднее американский ученый Леонард Сэвидж (1917—1971) продолжил рас- суждения де Финетти и доказал еще одну теорему, включавшую функцию полез- ности и распределение вероятностей. Так Сэвидж сформулировал фундаментальное понятие субъективной ожидаемой полезности. Эта теорема основана на уже упо- мянутой теореме Бруно де Финетти и еще одной теореме фон Неймана и Морген- штерна, в которой они ввели функцию полезности (модель ожидаемой полезности). О теореме Сэвиджа мы поговорим чуть позже. 71
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Помимо объективной и субъективной вероятности, существуют и другие, в част- ности логическая вероятность. Эта вероятность подобна субъективной вероятности в том, что определяется как степень уверенности, но, в отличие от нее, является ра- циональной. Это означает, что в одних и тех же условиях степень уверенности всех людей будет одинаковой. Субъективная и логическая вероятности представляют собой разновидности так называемой байесовской вероятности, которая противопо- ставляется физической и объективной вероятности. Риск и неопределенность, субъективная и объективная вероятность Напомним, что мы говорим о принятии решения в условиях риска, когда нам извест- но распределение вероятностей. Если же распределение вероятностей неизвестно, речь идет о приня гии решения в условиях неопределенности. Итак, в примере с лотереей решение принимается в условиях риска: нам известно распределение вероятностей, описывающее возможные выигрыши. В общем случае, когда мы имеем дело с объективной вероятностью, речь идет о принятии решения в условиях риска. В таких случаях преимущественно использу- ется модель ожидаемой полезности фон Неймана и Моргенштерна. Классической моделью принятия решения в условиях неопределенности является модель субъек- тивной ожидаемой полезности Сэвиджа. Если речь идет о неопределенности, ис- пользуются субъективные вероятности. Классическая модель ожидаемой полезности Классическая модель принятия решений в условиях риска основывается на извест- ной вероятности. В модели ожидаемой полезности, разработанной фон Нейманом и Моргенштерном, на основе ряда предпосылок доказывается существование не- которой функции полезности. Рассмотрим эту модель подробнее. Дано множество альтернативных вариантов X. Предполагается, что человек, который должен выбрать один из вариантов на множестве X, имеет определенные предпочтения относительно распределений вероятностей на этом множестве. Такие распределения называются лотереями. На множество X не накладывается никаких ограничений: оно может быть как числовым, так и нечисловым. Рассмотрим два примера. В первом примере альтернативными вариантами будут денежные премии, во втором премиями будут путешествия. 72
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Первый пример: Алисия и деньги У Алисии три варианта: выиграть 0 евро, выиграть 1 миллион евро или выиграть 5 миллионов евро. Мы сформулировали две лотереи (игры), и Алисия должна вы- брать одну из них. Первая лотерея гарантирует выигрыш в 1 миллион евро. Рас- пределение вероятностей в ней будет таким: (0, 1, 0). Вторая лотерея описывается распределением вероятностей (0,01; 0,89; 0,10) — это означает, что вероятность не выиграть ничего равна 0,01, вероятность выиграть 1 миллион евро равна 0,89, вероятность выиграть 5 миллионов евро — 0,10. В этом случае Алисия выбирает гарантированный выигрыш в 1 миллион евро. Выигрыш: 0 евро Выигрыш: 1 000 000 евро Выигрыш: 5 000 000 евро Лотерея А 0 1 0 Лотерея В 0,01 0,89 0,10 Второй пример: Берта и путешествия Берте предложили три варианта путешествий: однодневный гастрономический тур в Реус (город в Каталонии), неделя в Париже и месяц в Лондоне. Как и раньше, Берту спрашивают о распределении вероятностей и ее предпочтениях относительно этих вероятностей. Какой вариант выберет Берта? Она предпочтет гарантирован- но провести неделю в Париже, чем некоторую вероятность выиграть либо поездку в Лондон, либо отправиться на обед в Реус. Выигрыш: обед в Реусе Выигрыш: неделя в Париже Выигрыш: месяц в Лондоне Лотерея А 0 1 0 Лотерея В 0,01 0,89 0,10 Фон Нейман и Моргенштерн получили следующий результат: если предпочте- ния Алисии и Берты относительно распределений вероятностей (лотерей) удовлет- воряют определенным свойствам, то существует некая функция полезности воз- можных вариантов, и Алисия и Берта в момент выбора стремятся максимизировать ожидаемую полезность. Рассмотрим этот результат подробнее. Сначала посмотрим, какие свойства предпочтений относительно вероятностей казались логичными фон Нейману и Моргенштерну. Здесь будем обозначать рас- 73
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ пределения вероятностей (лотереи) через Р, Q, R, а Р > Q будет означать, что Алисия (или Берта) предпочитает вероятность Р вероятности Q. Для формализации задачи необходимо рассмотреть сочетания вероятностей. Для любой пары вероятностей Р и Q и некоторого значения ОС на интервале [0,1] опре- деляется вероятность (ocR + (1 — ОС) Q) как сочетание вероятностей для элементов множества X. Имеем: (осР + (1 — OC)Q)(x) = осР(х) + (1 — OC)Q(x). Теперь рассмотрим условия (аксиомы) фон Неймана и Моргенштерна. 1. Рациональное предпочтение. Отношение предпочтения > описывает рацио- нальное предпочтение, то есть обладает полнотой, транзитивностью и рефлек- сивностью. Определение рационального предпочтения мы привели в первой главе. 2. Независимость. Для любого распределения Р, Q и R и произвольного чис- ла ОС на интервале (0, 1) Р > Q тогда и только тогда, когда ОСР + (1 — OC)R > OcQ + (1 — OC)R. 3. Непрерывность. Для любого распределения Р, Q и R при Р > Q и Q > R существуют ОС и Р на интервале (0, 1) такие, что aP+(l-a)R>QMQ>pP + (l-p)R. Теперь прокомментируем, почему были выбраны именно эти условия. Первое ус- ловие обозначает рациональность отношения предпочтения >. Этот вопрос мы уже обсудили в первой главе. Согласно второму условию, предпочтение между Р и Q не зависит от R. Когда мы предпочитаем вероятность Р вероятности Q, сочетание Р и Q с третьей вероятностью R (для любого ОС) не меняет исходного предпочте- ния. Третье условие означает, что небольшое изменение вероятностей не изменяет строгого предпочтения. Заметьте, что в уравнении используется строгое предпо- чтение >, а не предпочтение >. Теорема фон Неймана и Моргенштерна гласит: если отношения предпочтения Алисии и Берты относительно вероятностей удовлетворяют трем перечисленным условиям, то Алисия и Берта выражают свои предпочтения при помощи функции полезности, определенной для рассматриваемых альтернатив. Иными словами, Алисия определяет полезность каждой денежной премии, Берта — полезность каждого путешествия. Кроме того, теорема гласит, что если мы предложим Алисии 74
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Даниил Бернулли на гравюре швейцарского художника Иоганна Рудольфа Губера. ОЖИДАЕМАЯ ВЫГОДА Упрощенным вариантом модели фон Неймана и Моргенштерна является модель ожидаемой вы- годы. Можно считать, что люди стремятся максими- зировать экономическую выгоду, и полезность для них не более чем экономическая выгода. В модели ожидаемой выгоды (ЕВ от английского Expected Benefit) имеем: Р > Q тогда и только тогда, когда ЕВ (выгода, Р) > ЕВ (выгода, Q), где ЕВ (выгода, Р) -Е р (х) выгода (х). Первая особенность этой модели заключается в том, что она не столь гибкая, как модель фон Неймана и Моргенштерна. В частности, в ситуа- ции, подобной той, с которой столкнулась Алисия, все люди должны вести себя одинаково, так как выгода и вероятности одинаковы для всех. В задаче Алисии имеем ЕВ (выгода, лотерея А) = = 1 000 000, ЕВ (выгода, лотерея В) = 0,01 0 + 0,89 • 1 000 000 + 0,10-5 000 000 = 1390 000. Согласно этой модели все люди, действующие рационально (в том числе и Алисия), предпочтут вторую лотерею, а не первую. Тем не менее доказано, что в действительности большинство людей предпочтет гарантированный выигрыш в 1 млн евро. Объяснить подобный выбор можно при помощи модели фон Неймана и Моргенштерна. Применив эту модель, можно убедиться, что для Алисии 1 млн евро полезнее, чем 0 евро, а 5 млн евро - полезнее, чем 1 млн. Тем не менее модель также допускает случай, когда Алисия не считает 5 млн евро в пять раз полезнее, чем 1 млн евро, поэтому не выберет второй вариант. Проблема предпочтения в зависимости от полезности, а не цены или экономической вы- годы была сформулирована еще в XVIII веке математиками Габриэлем Крамером и Даниилом Бернулли. Николай Бернулли в 1713 году доказал, что модель принятия решений на основе выгоды описывает ряд предпочтений, которые не наблюдаются на практике. Бернулли сфор- мулировал так называемый Санкт-Петербургский парадокс: при выборе из двух вариантов та- ких, что в первом ожидаемая выгода бесконечно велика, а во втором выгода имеет конечное значение, большинство людей выбирает вариант с конечной выгодой. Первое решение этого парадокса предложил Габриэль Крамер в 1728 году, а Даниил Бернулли сформулировал реше- ние на основе ожидаемой полезности. Фон Нейман и Моргенштерн опубликовали свою теорему о представлении, которую мы уже упоминали, в 1944 году. 75
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ две вероятности и заставим ее выбрать одну из них, то Алисия будет стремиться максимизировать ожидаемую полезность — отсюда и название «модель ожидаемой полезности». Прежде чем привести формулировку теоремы, посмотрим, что такое ожидаемая полезность, хотя ее определение в действительности следует из теоремы. Нам по- требуется функция полезности на множестве альтернативных вариантов. Этой функ- цией, как и в первой главе, будет некая функция и, которая для данного варианта х на множестве X принимает некое числовое значение. Следовательно, для данного распределения вероятностей Р на множестве X ожидаемая полезность EU (u, Р) определяется так: EU(u,P) = \ р(х) и(х). Теорема фон Неймана и Моргенштерна гласит: отношение > удовлетворяет условиям рационального предпочтения, независимости и непрерывности тогда и только тогда, когда существует функция полезности и такая, что для любого распределения вероятностей Р и Q имеем Р^ Q тогда и только тогда, когда EU(u,P) EU(u,Q). Как мы уже говорили, эта теорема отражает следующий факт: если отношения предпочтения Алисии > удовлетворяют приведенным выше аксиомам, то можно считать, что Алисия принимает решения на основе воображаемой функции полез- ности и выбирает Р, а не Q, когда ожидаемая полезность Р больше полезности Q. Классическая модель субъективной ожидаемой полезности В модели Сэвиджа используются два основных понятия: состояние и результат. Имеем множество состояний, которое обозначим через S, и множество результатов, которое обозначим через X. Проиллюстрируем эти два понятия на примере. Урна с 90 шарами Рассмотрим задачу об урне с 90 шарами, окрашенными в красный, черный и желтый цвет. Мы вытаскиваем шар из урны и в зависимости от его цвета получаем опреде- ленный выигрыш. Извлечение шара определенного цвета описывается множеством состояний: S — {красный, черный, желтый}. Результатами, или выигрышами, в этом примере будут денежные премии. Допустим, что премия может равняться 0 76
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ либо 100 евро. Следовательно, множество результатов X будет определяться так: X = {0,100}. Напомним, что по одной из предпосылок теоремы фон Неймана и Моргенштерна в модели известен ряд вероятностей, а сама теорема гласит, что существует некая функция полезности, на основе которой можно представить предпочтения человека. Как мы уже отмечали, с этой теоремой связана еще одна теорема, доказанная де Финетти, согласно которой при соблюдении определенных свойств предпочтений существует распределение вероятностей (субъективная вероятность). Теорема Сэвиджа гласит: если предпочтения человека удовлетворяют опреде- ленным условиям, то существует как вероятность, так и функция полезности, опи- сывающая эти предпочтения. Эта теорема отличается от теоремы фон Неймана и Моргенштерна тем, что существование вероятностей следует из нее самой. Вероятности в задаче об урне с 90 шарами Напомним, что множество состояний в задаче таково: «извлечен красный шар», «извлечен черный шар», «извлечен желтый шар». Теорема гласит: если бы Алисия решала эту задачу, ее решения можно было бы объяснить тем, что она присвоила всем возможным исходам определенные субъективные вероятности. Таким образом, каждому элементу множества S = {красный, черный, желтый} соответствовала бы некая субъективная вероятность. Теорема Сэвиджа, как и вышеупомянутая теорема фон Неймана и Моргенштер- на, основывается на множестве альтернативных вариантов, которые предлагаются игроку, а тот упорядочивает их согласно своим предпочтениям. Альтернативные ва- рианты называются актами. Акт — это функция, которая для заданного состояния возвращает некий результат. Два примера актов приведены ниже. Два акта в задаче об урне с 90 шарами Алисия рассматривает две разные функции (акта). Каждая из них указывает ре- зультат (выгоду) для всех возможных состояний. В интересующей нас задаче ре- зультат, указываемый функцией, эквивалентен выигрышу Алисии для определен- ного исхода (то есть в ситуации, когда она извлекает из урны определенный шар). Первая функция (акт) указывает, что Алисия выиграет 100 евро, если шар окажется красным, и 0 евро, если шар окажется черным или желтым. Вторая функция (акт) указывает, что Алисия получит 100 евро, если шар окажется черным, а в двух дру- 77
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ гих случаях не получит ничего. Эти два акта представлены в следующей таблице. Первый обозначим через fR, второй — через //у. Красный Черный Желтый fR 100 0 0 fN 0 100 0 Алисия упорядочивает эти акты в соответствии со своими предпочтениями. При этом она учитывает дополнительную информацию, к примеру количество ша- ров каждого цвета в урне. Алисия может посчитать обе функции эквивалентными. Если же ей известно, что все шары в урне красные, она выберет первую функцию. Теперь рассмотрим условия (аксиомы), которым, согласно теореме Сэвиджа, должны удовлетворять предпочтения Алисии, чтобы существовали вероятность и функция полезности. Распределение вероятностей определяется на множестве со- стояний, функция полезности — на множестве результатов. Аксиомы таковы. Р1 — рациональное предпочтение. Это условие, уже упоминавшееся ранее, указывает, что отношение порядка является полным и транзитивным. Р2 — независимость, или принцип уверенности. Это условие указывает, что в случае, когда на некотором множестве состояний два акта совпадают, предпочтение не поменяется, если мы заменим совпадающие значения другими, которые также будут совпадать. В случае с Алисией это условие означает: так как ценность желтого шара в fR и fN одинакова, она не по- влияет на ее предпочтения. Если мы изменим это значение на 10 и в fR, и в fN, порядок предпочтения вариантов для Алисии не изменится. РЗ — монотонность событий. Если результат х предпочтительнее результа- та у, то в случае, когда для ряда состояний один акт дает результат х, дру- гой акт — результат у, а во всех остальных состояниях эти два акта со- впадают, следует отдать предпочтение акту с результатом х. Если Алисия предпочитает выигрыш в 100 евро выигрышу в 0 евро, то она предпочтет акт (100, и, v) акту (0, и, о) независимо от значений и и о. Р4 — слабая сравнительная вероятность. Рассмотрим два события (подмно- жества S), Л и В. Допустим, что в первом акте результат х присваивается состояниям Л, результат х' — состояниям, не принадлежащим Л, во вто- ром акте результат х присваивается состояниям В, результат х' — состоя- ниям, не принадлежащим В. Также допустим, что х предпочтительнее х', 78
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ z предпочтительнее z . Если мы заменим хи х результатами гиг', наши предпочтения относительно актов не должны измениться. Чтобы обо- сновать это свойство, рассмотрим схожую задачу, но для пяти шаров — красного, черного, желтого, зеленого и синего — и минимального набора результатов X = {0, 100, 200}. Если теперь мы представим Алисии акты /1 = (100,100,0,0,0) и/2 = (0,0,0,100.100) (в них х = 100, х' = 0, А = = {красный, черный}, В = {зеленый, синий}), она предпочтет акт /1 акту/2. Если же мы представим ей акты f\z = (200, 200, 100, 100, 100) и f2z = (100, 100, 100, 200, 200), она также должна будет предпочесть акт /lz акту /2z. В этом случае имеем z = 200, z — 100. Алисия пред- почитает акт /1 акту /2 потому, что считает А более вероятным, чем В (в противном случае она бы выбрала акт/2, который принес бы ей больше денег!). Р5 — невырожденность. Существует как минимум одна пара результатов х и х' таких, что х будет предпочтительнее х'. Это свойство означает, что Алисия как минимум в одном случае предпочтет один акт другому. Рб — непрерывность малых событий. Для любого результата х и для любой пары актов f и g таких, что / предпочтительнее g, существует разбиение множества S с событиями Е} ..., Ek такое, что для любого Е справедливо />8в И где fxA — функция, которая возвращает значение х, если s принадлежит А, в про- тивном случае — сам акт /. По теореме Сэвиджа, при выполнении вышеперечисленных аксиом отноше- ние предпочтения можно представить при помощи распределения вероятностей на множестве состояний S и функции полезности, определенной на множестве ре- зультатов. Кроме того, предпочтение определяется в результате максимизации вы- ражения, которое в этом случае называется субъективной ожидаемой полезностью. Отношение > удовлетворяет условиям рационального предпочтения, независи- мости, монотонности событий, невырожденности и непрерывности малых событий только если существуют вероятность Р и функция полезности и такие, что / g тогда и только тогда, когда SE U(f)^ SE U(g), где SEU(f, и, Р) — субъективная ожидаемая полезность: SEUU,u,P) = Zu(f(s))P(s). 79
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ ШЕСТЬ АКСИОМ СЭВИДЖА В формулировке теоремы Сэвиджа мы привели шесть аксиом. Этих аксиом достаточно для рас- смотрения конечного числа состояний и результатов. Ицхак Гильбоа считает, что аксиома Р6 носит чисто технический характер. Более того, можно доказать, что без этой аксиомы предпо- чтения относительно актов должны описываться качественной оценкой вероятности. Отношение между событиями (множествами состояний) 2: к является качественной оценкой вероятности тогда и только тогда, когда выполняются следующие условия: - отношение является полным и транзитивным; - для любых А, ВиСсЭпри/1пС = ВпС, условие А>В выполняется тогда и только тогда, когда A u С >к В и С; - для любого А с S, А >РС 0, и S >РС 0. Парадокс Алле В реальном мире модель ожидаемой полезности не всегда оказывается корректной. Один из таких случаев описывает парадокс Алле. Этот парадокс имеет отношение к уже рассмотренной выше задаче об Алисии и деньгах. Напомним, что у Алисии три варианта: выиграть 0 евро, выиграть 1 млн евро или выиграть 5 млн евро. Ранее ей нужно было предпочесть одну из двух лоте- рей (игр), теперь — одну из четырех, представленных в следующей таблице. Выигрыш: 0 евро Выигрыш: 1 млн евро Выигрыш: 5 млн евро Лотерея А 0 1 0 Лотерея В 0,01 0,89 0,10 Лотерея С 0,89 0,11 0 Лотерея D 0,9 0 0.1 Как мы уже говорили, большинство людей при выборе между А и В предпо- чтут А — этот вариант гарантирует выигрыш в один миллион евро. А вот при вы- боре между С и D большинство предпочтет D. Поведение людей в этом случае нельзя описать при помощи ожидаемой полезно- сти, так как не существует такой функции полезности, которая воспроизводила бы принимаемые ими решения. 80
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Тем не менее существует модель на основе неаддитивной меры и интеграла Шоке, которая позволяет представить подобное поведение. О неаддитивных мерах и интегралах Шоке мы уже говорили. Неаддитивная мера и интеграл Шоке по- зволяют объединять информацию (значения полезности) с учетом взаимодействия, в данном случае взаимодействия между выигрышами. Парадокс Элсберга Этот парадокс имеет отношение к описанной выше задаче об Алисии и урне с 90 шарами. Напомним, что в этой задаче в урне находилось 90 шаров, окрашенных в красный, черный или желтый цвет, и мы рассмотрели возможные акты, которые Алисия сравнивала между собой. В парадоксе Элсберга число красных шаров в урне известно — их ровно 30, точное число черных и желтых шаров неизвестно. Так как шаров всего 90, мы знаем, что черных и желтых шаров в сумме 60. Рассмотрим четыре акта (два из них мы уже рассмотрели ранее). Красный Черный Желтый 100 0 0 fN 0 100 0 100 0 100 ^NA 0 100 100 Если мы проанализируем поведение людей в этом случае, то увидим, что боль- шинство предпочтет акт fR акту fN и, в свою очередь, акт fNA акту Однако опи- сать такие предпочтения при помощи модели субъективной ожидаемой полезности нельзя. Иными словами, не существует такой пары функций полезность — вероят- ность, которая описывала бы такие предпочтения. Так как большинство людей высказывает именно предпочтения, которые нельзя представить при помощи этой модели, специалисты рассмотрели альтернативные модели. Одна из них — модель ожидаемой полезности Шоке, в которой распреде- ление вероятностей на множестве состояний заменено неаддитивной мерой на том же множестве состояний. Следовательно, вместо того чтобы вычислить SEC(/,u,P) = Lu(/(s))P(s), 81
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ (это выражение описывает субъективную ожидаемую полезность при помощи сред- него взвешенного с распределением вероятности и соответствует классическому ин- тегралу), мы применим интеграл Шоке. Получим где С/ — интеграл Шоке функции и относительно неаддитивной меры v. Модели риска и неопределенности В этой главе мы рассмотрели классические модели принятия решений в условиях риска и неопределенности. Мы показали, что оба типа моделей основаны на теории вероятностей, и обсудили два парадокса, которые можно разрешить, если вместо классических вероятностей применить модели на основе неаддитивных мер. В начале главы мы отметили, что описать неопределенность и работать с ней можно не только при помощи вероятностей. Рассмотрим альтернативные подходы. Неопределенность Ранее мы указывали, что неопределенность может быть вызвана разными причи- нами. Наиболее известная из них связана со случайностью. Один из классических примеров неопределенности — игра в кости: в момент броска мы не знаем, сколько очков выпадет. Если неопределенность вызвана случайностью, то при ее рассмотре- нии обычно применяются распределения вероятностей. Для идеальной игральной кости вероятности выпадения всех граней (всех чисел от 1 до 6) одинаковы, поэтому используется равномерное распределение вероятностей. Еще одной причиной неопределенности может быть неточность. Пример не- точности — сообщение: сегодня температура воздуха составляет от 16 до 19 °C, а какая-либо другая информация отсутствует. В этом случае существуют множества возможных и невозможных значений. К примеру, если нас спросят, равна ли тем- пература воздуха 14 °C, мы ответим отрицательно. Так же мы ответим на вопрос, равна ли температура воздуха 20 °C. Но если нас спросят, равна ли температура воздуха 17 °C, мы сможем сказать, что это возможно, но не более того. Как измерить неопределенность такого типа? Будем рассуждать точно так же, как и в случае, когда причиной неопределенности является случайность. Используем функцию, которая ставит в соответствие всем возможным значениям рассматривае- мой величины числа из интервала [0,1]. Но эта функция не будет функцией вероят- 82
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ ности. Если мы знаем, что определенное значение (или высказывание) невозмож- но, эта функция принимает значение 0. Если значение или высказывание возможно (то есть не противоречит имеющейся информации), функция принимает значение 1. Обозначим эту функцию через Л и получим, что в нашем примере с температурой от 16 до 19 °C л(х) = 1 для всех х на интервале [16,19] и л(х) = 0 за пределами это- го интервала. В условиях неточности эта функция принимает только значения 0 и 1. С неточностью связано понятие нечеткости, позволяющее описывать ситуации, когда переход от ложного к истинному осуществляется плавно. К примеру, допу- стим, что нам сказали: «Клаудия высокая». Если нас спросят, равен ли рост Клаудии 1,60 м, мы с уверенностью сможем ответить отрицательно. Если же затем нас спро- сят, равен ли ее рост 1,75, мы сможем сказать, что это возможно. Как и раньше, мы можем выразить степень уверенности для определенных значений (высказываний) при помощи функции Л. Получим л(1,60) = 0, Л(1,75) — 1. Аналогично, л(1,55) — = 0, л(1,80) = 1. Но что мы ответим, если нас спросят о каком-то промежуточном значении? Сможем ли мы четко указать границу, разделяющую «нет» и «возмож- но»? Каким будет граничное значение — 1,75? Допустим, что мы выбрали значе- ние 1,75 м. Если рост Алисии равен 1,74 м, она не будет высокой (получим Л(1,74) = = 0). Она также не будет высокой, если ее рост составляет 1,745 м или 1,74999 м. Следовательно, л(1,74999) — 0. Нет, кажется, здесь что-то не так. Дело в том, что свойство «быть высоким» нечеткое, и определить такую границу нельзя. Описать нечеткие понятия помогут нечеткие множества. Когда речь идет о клас- сических множествах, то элемент либо принадлежит множеству, либо нет. К при- меру, множество четных чисел на гранях игрального кубика таково: {2, 4, 6}. Для любого целого числа от 1 до 6 точно известно, принадлежит ли оно этому множе- ству. Классические множества можно представить как перечень принадлежащих им объектов, а также при помощи функции, которая для каждого объекта базового множества принимает значение 0, если объект не принадлежит рассматриваемому множеству («ложь»), и 1 — если принадлежит («истина»). В нашем примере такая функция будет принимать значение 1 тогда и только тогда, когда ее аргумент равен 2, 4 или 6. Нечеткие множества представляют собой обобщение классических множеств. В них функция принадлежности может принимать не только значения 0 или 1, но и промежуточные, иными словами, некий объект базового множества может принадлежать нечеткому множеству лишь частично. В классическом случае имеем функцию, которая может принимать только два значения: 0 («ложь») и 1 («исти- на»). В случае с нечетким множеством имеем функции, которые принимают зна- 83
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ чения на всем интервале [0, 1]. Значения 0 и 1 играют ту же роль, что и раньше: О обозначает абсолютную ложь, 1 — абсолютную истину. Промежуточные значения обозначают частичную принадлежность множеству. Вернемся к примеру с ростом. Множество высоких женщин, к которому принад- лежит Алисия, можно определить при помощи функции, которая женщинам ростом менее 1,65 м ставит в соответствие значение 0, женщинам выше 1,75 м — значе- ние 1. Поскольку рост Алисии равен 1,74 м, мы присвоим ей значение, близкое к 1, а так как рост Берты равен 1,73 м, ей будет соответствовать чуть меньшее значение. Тем не менее нельзя сказать, что Алисия или Берта не принадлежит множеству вы- соких женщин. Чтобы несколько уточнить ситуацию, необходимо определить функцию, описы- вающую понятие «высокий» для Алисии и Берты. Функции, описывающие клас- сические множества, называются характеристическими, функции, описывающие нечеткие множества, — функциями принадлежности. Определим функцию принад- лежности множеству высоких женщин. Используем следующую функцию: О если (х —1,65) -10 если 1 если х s 1,65 xG (1,65; 1,75). х s 1,75 Как видите, эта функция для любого роста свыше 1,75 м принимает значение 1, для любого роста менее 1,65 м — значение 0. Кроме того, в случае Алисии, рост которой равен 1,74 м, функция принимает значение 0,9, в случае с Бертой (ее рост равен 1,73 м) — значение 0,8. Это означает, что Алисия высокая с уверенностью 0,9, а Берта высокая с уверенностью 0,8. Уверенность в том, что Алисия высокая, есть степень истины высказывания «Алисия высокая» и описывается приведенной выше функцией Л. В нашем случае рост Алисии равен 1,74, поэтому имеем тс( «Алисия высокая» ) = Ц(1,74). При наличии нечеткой информации, как в этом случае, Л может принимать лю- бое значение на интервале [0,1]. Для Алисии значение этой функции равно 0,9, для Берты — 0,8. Функция ТС представляет собой меру неопределенности. Вероятности также представляют собой меры неопределенности, но обладают иными свойствами, а мера неопределенности 71 описывает возможность. 84
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Подведем итог. Мы показали, что неопределенность может быть вызвана слу- чайностью и неточностью (а также нечеткостью). Мы также показали, что суще- ствуют разные меры неопределенности. В следующем разделе мы подчеркнем раз- личия между нечеткими множествами и вероятностями, а затем вернемся к мерам неопределенности. Нечеткие множества и вероятности С формальной точки зрения распределение вероятностей определяет некое значение на интервале [0, 1] для каждого элемента базового множества. Аналогично, функ- ция принадлежности также определяет некое значение на интервале [0, 1] для каж- дого элемента базового множества. Значит ли это, что распределение вероятностей и функция принадлежности — одно и то же? Вовсе нет. Если речь идет о вероятности, верен лишь один из альтернативных вариантов, а если информация представлена при помощи нечеткого множества, этого не происходит. Если мы знаем, что Алисия высокая с уверенностью 0,9, это не означает, что она с большей вероятностью высокая, нежели низкая, — Алисия высокая, но не совсем. Это и есть частичная уверенность. Если мы купили лотерей- ный билет, и вероятность выигрыша равна 0,9, мы можем либо выиграть, либо про- играть, других вариантов нет. Вероятность 0,9 не означает, что мы получим 90 % выигрыша. Чтобы продемонстрировать разницу между этими двумя понятиями, Джеймс Бездек в 1993 году представил следующий пример. Пусть базовое множество — множество всех жидкостей во Вселенной, а нечет- кое подмножество L = {все питьевые жидкости = жидкости, пригодные для питья}. Теперь представим, что мы находимся на необитаемом острове и ничего не пили целую неделю. Мы нашли две бутылки А и В такие, что функция принад- лежности (Ле L) — 0,91, вероятность (В Е L) = 0,91. Из какой бутылки следует выпить? Большинство читателей, знакомых с основами теории нечетких множеств, сразу же поймут, что А может содержать, к примеру, протухшую воду, но не опас- ную жидкость наподобие соляной кислоты (если только тот, кто определил нечеткое множество, нас не обманул). Таким образом, принадлежность, равная 0,91, означа- ет, что содержимое А «достаточно похоже» на жидкость, которую можно безопасно пить (чистую воду). С другой стороны, вероятность того, что в В находится питье- вая жидкость, равна 0,91 — это означает, что по результатам достаточно большого числа экспериментов содержимое В представляет собой питьевую жидкость в 91 % случаев. А что же остальные 9 %? В этом случае содержимое бутылки будет непри- 85
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ годным для питья (возможно, даже смертельным) почти в каждом десятом случае. Следовательно, большинство людей предпочтут выпить протухшую воду и выберут бутылку Л. Меры неопределенности Вы увидели, что распределение вероятностей — не единственная мера неопределен- ности: мы также упомянули распределения возможности. Рассмотрим более общее определение. Мера неопределенности на базовом множестве X (для простоты предположим, что множество X конечное) — это функция, которая удовлетворяет следующим ус- ловиям. 1. ц(0) = О. 2. ц(Х) = 1. 3. Если A cz В, то ц(Л) < ц(В). Как видите, точно таким же условиям должны удовлетворять неаддитивные меры. Таким образом, меры неопределенности — это неаддитивные меры. Область значений этих неаддитивных мер — это интервал [0, 1], то есть для любого подмножества X соответствующая мера будет находиться на интервале от О до 1. Разумеется, 0 обозначает полное отсутствие уверенности, 1 — абсолютную уверенность. Таковы основные условия, которым должны удовлетворять меры неопределен- ности. Кроме того, и меры вероятности, и меры возможности удовлетворяют неко- торым другим условиям, которые мы рассмотрим далее. Меры неопределенности: меры вероятности Меры вероятности не только удовлетворяют вышеперечисленным условиям, но и яв- ляются аддитивными. Так, для двух непересекающихся множеств А и В (А ГУ В = 0, то есть пересечение этих множеств есть пустое множество) все вероятности удов- летворяют условию: |1(/ЮВ) = Ц(Л) + ц(В). 86
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Интересно следствие из этого свойства: для любого множества вероятность равна сумме вероятностей элементов этого множества. Имеем: ц(Л) = ХбЛц({х}). При помощи мер вероятности на основе определенной информации можно вы- яснить, какова неопределенность заданного высказывания. К примеру, если мы бро- сили игральный кубик (идеально сбалансированный) и выпало четное число очков, то можно найти вероятность того, что выпало 1, 2 или 3 очка. Так как нам известно, что выпало четное число очков, а распределение вероятностей равномерно, вероят- ность выпадения 1, 2 или 3 рассчитывается так: ц({1,2,3}) = |1({1}) + ц({2}) + |1({3}) = 0 + 1/3+ 0 = 1/3. Как известно, для работы с мерами вероятностей существует ряд методов — на ум сразу же приходят условные вероятности, теорема Байеса и другие. Меры неопределенности: меры возможности Меры возможности, помимо вышеперечисленных условий, также могут опреде- ляться как некий максимум. Так, для двух непересекающихся множеств Аи В меры возможности удовлетворяют условию: |1(Л оВ) = тах(ц(Л), |1(В)). Это условие подразумевает, что возможность для любого множества определяет- ся через возможности элементов множества следующим образом: |1(Л) = таххеЛ Ц({х}). Нам сказали, что Диана высокая, и мы хотим узнать, находится ли ее рост на ин- тервале от 1,65 до 1,70 м. Вычислим меру возможности, применив определенную выше функцию принадлежности: Ц([1,65; 1,70]) = maxx6,,т) ц({х}) = 0,5. Так как функция принадлежности множеству высоких людей возрастает, она принимает максимальное значение на интервале [1,65; 1,70] в точке 1,70. Значение функции в этой точке равно 0,5. 87
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Для работы с мерами вероятности существует множество понятий и методов. Аналогично, существуют многочисленные методы работы с мерами возможности и с различными разновидностями мер неопределенности вообще (для определения их сочетаний, вычисления условных мер и пр.). Существуют и другие меры неопределенности, помимо представленных выше, в частности меры необходимости, двойственные мерам возможности. Также опреде- лены меры доверия и допустимости. Все они представляют собой меры неопределен- ности, так как удовлетворяют трем перечисленным выше условиям. 88
Глава 5 Принятие решений в условиях противодействия В первой главе мы упомянули, что одна из проблем в процессе принятия решений возникает тогда, когда вместе с нами решения принимают другие люди, не разде- ляющие наших интересов. Эта проблема рассматривается в теории игр и в особом разделе информатики под названием искусственный интеллект. В этой области люди (или, в информатике, программы), которые должны при- нять решение, называются игроками, а принимаемые ими решения — стратегиями. Игроки участвуют в игре с целью получения выгоды. Выгода описывается функ- цией, которая ставит в соответствие всем стратегиям всех игроков некоторые зна- чения. Эта функция опять-таки называется функцией полезности, или платежной функцией (англ, payoff function). Она является функцией полезности в том смысле, что ее значение необязательно напрямую соответствует, к примеру, денежной сумме выигрыша и может представлять собой меру выгоды, полученной от этих денег. Цель каждого игрока — получить максимальную выгоду, то есть обеспечить максимальную полезность. Так как каждый игрок имеет свои интересы, ему соот- ветствует индивидуальная платежная функция. В статических играх противники определяют стратегию (то есть принимают ре- шения) одновременно, или, что аналогично, выбирают стратегию, не зная стратегий других игроков. Динамическими называются игры, в которых стратегии определя- ются последовательно. Статические игры Сначала рассмотрим статические игры и ограничимся играми для двух игроков (хотя игроков может быть и больше). Известный пример статической игры для двух игро- ков — дилемма заключенного. Согласно Аюче и Раиффа (1958), автором этой игры является математик Альберт Такер. 89
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Дилемма заключенного Два человека были задержаны и помещены в отдельные камеры так, что они не мо- гут общаться друг с другом. Их подозревают в ограблении, но у обвинения недо- статочно улик. Окружной прокурор предлагает каждому заключенному (по отдель- ности) два варианта: либо признаться в совершении ограбления, либо нет. Если ни- кто из подозреваемых не признается, они будут приговорены к небольшому сроку заключения за незаконное владение оружием. Если признается только один из них, он получит условный срок, а его сообщник, не признавшийся в совершении престу- пления, будет приговорен к нескольким годам тюрьмы. Если признаются оба, они получат одинаковый, но сокращенный, срок заключения. Допустим, что если признаются оба, каждый получит 4 года тюрьмы. Если один признается, а другой — нет, то первый останется на свободе, а второй проведет 5 лет в тюрьме. Если не признается ни один из них, каждый получит 2 года тюрьмы. Представление задачи Задачи такого типа представляются в виде таблицы или матрицы. Эта таблица на- зывается нормальной формой. Каждому заключенному соответствует одно измере- ние таблицы, а число ячеек в каждом измерении равно числу возможных стратегий. Следовательно, каждая ячейка таблицы будет содержать функцию полезности игро- ков для определенных стратегий. Если первому игроку доступны стратегии А = {ар ..., аД, а второму — стра- тегии В = {bv ..., 1>п}, то таблица будет состоять из п столбцов и т строк: каждой стратегии множества А будет соответствовать одна строка, каждой стратегии мно- жества В — один столбец. Так, в ячейке, находящейся в строке номер i и столбце номер j, будут приведены функции полезности игроков для случая, когда первый игрок выбирает стратегию а., второй — стратегию b. Обозначим функцию полезно- сти первого игрока через второго игрока — через 712. Тогда ТГ^а., Ь.) будет полез- ностью первого игрока в случае, когда он применит стратегию а, а второй игрок — стратегию b. Полезность второго игрока в этом случае равна 712(а., Ь.). Важно, что функция, приведенная в таблице, является функцией полезности и не описывает выгоду игроков напрямую (разницу между полезностью и выгодой мы уже объясняли). Для простоты предположим, что полезность для заключенного напрямую соответствует числу лет, проведенных в тюрьме. Далее мы изложим ди- лемму заключенного в нормальной форме. 90
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ На основе всего вышесказанного имеем: в дилемме заключенного действуют два игрока, при этом каждому из них доступны две стратегии — либо признать свою вину, либо нет. Обозначим эти стратегии через П и Н. Следовательно, А = В = {Н, П}. Имеем таблицу размером 2x2. Ячейки таблицы будут содержать следующие значения. п\П, П) - Л2(П, П) - —4. л/Н, Н) = л2(Н, Н) = —2. т^П, Н) = 0, л2(П, Н) = —5. л,(Н, /7) = —5, л2(Н, П) = 0. Следовательно, нормальной формой задачи будет следующая таблица, в которой А обозначает первого игрока, В — второго. В: Не признаться (Н) В: Признаться (П) А: Не признаться (Н) -2,-2 -5,0 А: Признаться (П) 0,-5 -4,-4 Выбор стратегии Теперь, когда мы сформулировали задачу, определим метод выбора оптимальной стратегии. Для этого рассмотрим игрока А. Он должен сделать выбор (признаться или нет) с учетом двух возможных вариантов для игрока В, который также может либо признать свою вину, либо нет. Изложим два этих варианта подробнее. — Игрок В решил не признаваться. Если в этом случае игрок А признается, то останется на свободе, в противном случае он будет приговорен к 2 годам тюрьмы. Следовательно, ему лучше признаться. — Игрок В решил признаться. В этом случае если игрок А признается, то полу- чит 4 года тюрьмы, в противном случае — 5 лет. Следовательно, ему лучше признаться. Вывод: игроку Л лучше признаться, так как эта стратегия более выгодна вне за- висимости от действий второго игрока. 91
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Если мы рассмотрим задачу с точки зрения игрока В, то также увидим, что при- знаться выгоднее. — игрок А решил не признаваться. Игроку В лучше признаться — в этом слу- чае он не отправится в тюрьму; — игрок А решил признаться. Игроку В лучше признаться — в этом случае он получит 4 года тюрьмы. Для игрока А стратегия «признаться» является доминирующей, так как ее по- лезность всегда будет больше, чем полезность прочих стратегий, независимо от дей- ствий игрока В. Причем эта стратегия будет для игрока А строго доминирующей. Рассмотрим определение строгого и слабого доминирования. Строго доминирующие стратегии Для первого игрока стратегия называется строго доминирующей по отношению к Sj, если для любой стратегии s2 для второго игрока выполняется соотношение ^i(si »s2) > ^i(si’ s2^’ иными словами, если полезность стратегии больше полезности для всех страте- гий второго игрока. Строго доминирующая стратегия Строго доминирующей называется стратегия, над которой не доминирует никакая другая стратегия. Слабо доминирующие стратегии Для первого игрока стратегия называется слабо доминирующей по отношению к sv если для любой стратегии s2 для второго игрока выполняется соотношение ^l(sl » s2 ) S2 иными словами, если полезность стратегии больше или равна полезности s1 для всех стратегий второго игрока. 92
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Доминирование и оптимум по Парето В задачах теории игр вновь появляется понятие доминирования по Парето и опти- мума по Парето. Решение называется оптимальным по Парето, если полезность для одного из игроков нельзя увеличить, не уменьшив полезность для другого. В случае с дилеммой заключенного оптимумами по Парето являются пары стра- тегий (Н, Н), (П, Н) и (Н, П). Пара стратегий (/7, П), напротив, не принадлежит границе Парето, так как полезности 7Т1 (/7, П) = Л2(/7, П) = —4 меньше, чем полез- ности стратегий (Н, Н) (^(Н, Н) - Л2(Н, Н) = —2). Остальные стратегии при- надлежат границе Парето потому, что (Н.щ лучше, чем (П, Н), по одной из двух полезностей, но хуже — по другой; аналогично и по отношению к стратегии (Н, П). Для пары стратегий (Н. П) и (П. Н) ситуация будет аналогичной. В играх также рассматриваются случаи, когда выбор стратегии определяется не- ким распределением вероятностей. Такие стратегии называются смешанными. Для смешанных стратегий для каждого игрока со множеством стратегий 5 дано рас- пределение вероятностей на S, то есть набор значений (p(s1), p(s2), ..., p(sn)), где p(sj) — вероятность выбора sr p(s2) — вероятность выбора s2h так далее до sn. Основу смешанной стратегии составляет множество стратегий, каждой из кото- рых соответствует некая вероятность, отличная от нуля. Чтобы отличить смешанные стратегии от тех, что мы рассмотрели выше (стра- тегии без распределения вероятностей), будем называть последние чистыми страте- гиями. К примеру, в дилемме заключенного на множестве стратегий (Н, П) может быть задано распределение вероятностей Р1 = (0,2; 0,8). В этом случае первый игрок выберет вариант «не признаваться» с вероятностью 0,2, вариант «признаться» — с вероятностью 0,8. Мы показали, как определяется полезность для каждой пары чистых стратегий. Посмотрим, как узнать полезность смешанной стратегии. Вычислим ее через рас- пределения вероятностей и полезности чистых стратегий. Полезность смешанных стратегий В игре для двух игроков со смешанными стратегиями для первого игрока и Р2 — для второго полезность смешанной стратегии (Рг Р2) вычисляется следующим образом: 93
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ = Ч \ p(s) P(S2> s2> К2^1’ ^2) = Ч Ч P(S1) P(S2) K2(S1’ S2)- Если смешанной является всего одна стратегия из двух, расчеты будут проще. Пример: ^i(sr ^2) — ^s2P^s2^ ?MS1 ’ s2 )• К смешанным стратегиям применимы понятия строгого и слабого доминирова- ния, а также доминирования и оптимума по Парето. Найти решение дилеммы заключенного нетрудно, но подобные задачи не всегда решаются так просто. Прояснить проблему решения таких задач поможет равно- весие Нэша. Равновесие Нэша для игр с двумя игроками Равновесие Нэша — это пара стратегий (смешанных) (s*r s*2) таких, что для любой (смешанной) стратегии s1 выполняется соотношение Я1($*г s*2)>K1(s1, s*2) и для любой (смешанной) стратегии s2 выполняется соотношение K2(s*,. s*2)>rc2(s*1>S2). Это означает, что если мы зафиксируем стратегию для первого игрока, то любое изменение стратегии для второго игрока ухудшит результат. Приведенное выше определение верно для любого типа стратегий, поэтому оно должно выполняться для любой смешанной стратегии. Заметьте, что если оно вы- полняется для чистых стратегий, то выполняется и для смешанных, но не наоборот. Существует теорема, согласно которой для данной пары чистых стратегий, удов- летворяющих этим неравенствам для прочих чистых стратегий, наблюдается рав- новесие Нэша. Точная формулировка этой теоремы, которая называется теоремой о равновесии для двух игроков, звучит так: если в игре для двух игроков существует пара чистых стратегий (s*r s*2) такая, что для любой чистой стратегии выполняется соотношение 7C1(s*1,s*2)>7C1(s1,s*2), 94
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ а для любой чистой стратегии s2 выполняется соотношение K2(s*1,s*2) 7C2(s*1,s2 ), то пара чистых стратегий (s*r s*2) описывает равновесие Нэша. В дилемме заключенного есть пара чистых стратегий, определяющих равновесие Нэша — это пара (/7, П). Нетрудно видеть, что для любой чистой стратегии s1 справедливо Л//7, П)Ж^Г П), так как я/77, П) = —4 > п/77, П) = —4 И л/77, П) = —4 > л{(Н, П) = -5. Аналогично, в этой задаче для любой чистой стратегии s2 справедливо: п2(П, П)>п2(П, s2). Можно заметить, что если игра проходит нормальным образом, то равновесие в ячейке (s*j, s*2) наблюдается тогда, когда значение полезности в этой ячейке будет наибольшим в строке или столбце (в зависимости от игрока). В дилемме за- ключенного такой ячейкой будет (/7, /7). Этой ячейке, как мы уже отмечали, соот- ветствует равновесие Нэша. «Камень, ножницы, бумага» Рассмотрим игру «Камень, ножницы, бумага» для двух игроков. Как известно, каждый игрок может выбрать один из трех альтернативных вариантов (стратегий): камень, ножницы или бумагу. Если игроки выбирают разные варианты, то бума- га побеждает камень, камень побеждает ножницы, а ножницы побеждают бумагу. Если игроки выбирают один и тот же вариант, игра заканчивается вничью. Эту игру можно представить для двух игроков с тремя стратегиями. Обозначим игроков буквами А и В. Стратегиями игроков будут, разумеется, камень, ножницы и бумага. Следовательно, А — В — {камень, ножницы, бумага}. Функция полезно- сти принимает три возможных значения: 1, 0, —1. Когда игрок побеждает оппонента, мы присваиваем ему большее значение (1), в случае поражения — меньшее (—1), в случае ничьей — 0. Следовательно, имеем, к примеру, /^(камень, ножницы) = 1, 71 (камень, ножницы) = —1, /^(бумага, бумага) — 0 и Л2(бумага, бумага) = 0. 95
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ На основе этой информации представим задачу в нормальной форме в виде таблицы. В: Камень В: Бумага В: Ножницы А: Камень 0,0 -1,1 1, -1 А: Бумага 1, -1 0,0 -1,1 А: Ножницы -1, 1 1, -1 0,0 В нормальной форме этой задачи можно увидеть, что не существует такой пары чистых стратегий, которая бы описывала равновесие Нэша. Кроме того, заметим, что все пары стратегий находятся на границе Парето. На- помним, что это означает: для того, чтобы улучшить положение одного игрока, не- обходимо ухудшить положение другого. Более того, выделяют особое семейство игр, в которых подобная ситуация наблюдается всегда, — это игры с нулевой суммой. Игры с нулевой суммой Игра с нулевой суммой (англ, zero-sum game) — это игра, в которой сумма полезно- стей для каждой пары стратегий равна нулю. Иными словами, это игры, в которых выигрыш одного игрока всегда будет равен проигрышу другого. «Камень, ножницы, бумага» — игра с нулевой суммой, дилемма заключенно- го — нет. Нетрудно видеть, что... — ^(/7, П) + л2(П, /7) = — 4 — 4 = — 8. — п/Н, Н) + л2(Н, Н) = — 2 — 2 = — 4. — Н) + л2(П, Н) = 0 - 5 = - 5. — л/Н, П) + л2(Н, /7) = — 5 + 0 = — 5. В играх с нулевой суммой все пары стратегий находятся на границе Парето. Существование равновесия Нэша Мы показали, что в дилемме заключенного имеется пара чистых стратегий, опреде- ляющих равновесие Нэша, но в игре «Камень, ножницы, бумага» такой пары стра- тегий нет. Нэш доказал, что если использовать смешанные стратегии, то равновесия 96
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ можно достичь в любой игре. Этот результат известен как теорема Нэша о равно- весии и звучит так: в любой игре с конечным числом игроков и конечным числом стратегий для каж- дого игрока имеется как минимум одно множество стратегий (смешанных), опи- сывающих равновесие Нэша. Отсюда следует, что равновесие Нэша присутствует в любой игре для двух игро- ков с конечным числом стратегий, в частности в игре «Камень, ножницы, бумага». Однако в этой игре равновесие достигается только при использовании смешанных стратегий. Доминирующие стратегии и равновесие Нэша Ранее мы уже приводили определение доминирующей стратегии. Если игрок име- ет доминирующую стратегию, то для этой стратегии существует равновесие Нэша. Если эта стратегия является строго доминирующей, то игрок будет использовать ее во всех равновесиях Нэша. Если в игре для двух игроков оба игрока имеют доми- нирующие стратегии, то существует единственное равновесие Нэша, определяемое этими двумя стратегиями. Опишем равновесие Нэша в произвольных играх для двух игроков с двумя стра- тегиями. Обозначим первого игрока через Л, второго — через В. Обозначим стра- тегии игроков А = {А^, А2} и В = {Вр В2}. Допустим, что нормальная форма игры выглядит следующим образом. В.В, В:В2 A: At a. b с, d А:А2 е, f g.h Это означает, что Л^А^, В0 = а, Л2(Ар В}) = Ь, Л}(А}, В2) = с, Л2(Ар В2) = d. В этой задаче равновесие Нэша в чистых стратегиях наблюдается при выполне- нии одного из следующих условий. — (Др Bt) — чистая стратегия в равновесии Нэша при а^е и — (Др В2) — чистая стратегия в равновесии Нэша при с > g и d > Ь. 97
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ — (А2, В}) — чистая стратегия в равновесии Нэша, когда е > а и /> h. — (А2, В2) — чистая стратегия в равновесии Нэша, когда g^c и h^f. Нетрудно видеть, что эти условия описывают дилемму заключенного. Если А^ — = Н, А2 = П, В} = Н, В2 — П, то равновесие будет наблюдаться в случае (А2 = П, В2 = П), поскольку, как мы уже показали, g — —4 с = —5, h = —4 > /= —5. Если ни одно из перечисленных выше четырех условий не выполняется, равнове- сие Нэша в чистых стратегиях отсутствует. Рассмотрим равновесие Нэша в случае с одной смешанной стратегией. Прежде чем перейти к рассмотрению смешанных стратегий, покажем, в каких ситуациях отсутствует решение в чистых стратегиях. -(АЛ) не соответствует равновесию Нэша, если • а < е и b > d либо • а е и b < d. — (Лр В2) не соответствует равновесию Нэша, если • с < g и J > Ь либо • c^g и d<b. -(A2,BJ не соответствует равновесию Нэша, если • е < а и f^-h либо • е > а и /< h. - (А2, в2) не соответствует равновесию Нэша, если • g < С И /1 / либо • g>cnh<f. Ни одна из этих чистых стратегий не будет соответствовать равновесию Нэша, если все условия выполняются одновременно. Так как некоторые из условий проти- воречат друг другу и не могут сочетаться, равновесие Нэша отсутствует лишь в двух случаях: — а < е, /< h, g<c, d< b; — a> e, / > h, g> c, d> b. Следовательно, в этих двух случаях необходимо найти смешанную стратегию, которая будет описывать равновесие Нэша. Мы опишем эту проблему чуть позже, а пока рассмотрим следующую теорему. 98
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Теорема о равенстве полезности в равновесии Нэша Если смешанная стратегия (Р*, Q*) описывает равновесие Нэша, то для любой стратегии .st в основе Р* выполняется равенство лД^*)=л/Р* Q*) и для любой стратегии s2 в основе Q* выполняется равенство л2(Р*, s2)= Л2(Р*, Q*). Напомним, что основу смешанной стратегии составляет множество стратегий, каждой из которых соответствует некая ненулевая вероятность. Рассмотрим две смешанные стратегии Р* и Q*. Р* соответствует первому игро- ку и выбору или А2, Q* — второму игроку и выбору В} или В2. Используем Р* = = (р*, 1 — р*) и Q* = (q*, 1 — q*). Так как речь идет о смешанных стратегиях, необходимо, чтобы р* и q* не равнялись ни нулю, ни единице — эти случаи соот- ветствуют чистым стратегиям. Основу Р* будут составлять и А2, основу Q* — В} и В,. Применив теорему о равенстве полезности в равновесии Нэша, получим, что должны выполняться следующие условия: 1) для стратегий в основе Р* (то есть А} иЛ2) Л1(Л1, Q*)= л/Л2, Q*)= л/Р* Q*), 2) для стратегий в основе Q* (то есть В^ и В2) к2(Р*, BJ= к2(Р*, В2)= к2(Р*, Q*). Эти уравнения позволяют вычислить вероятности р* и q*. Начнем с первого уравнения n}(AvQ*)=^(A2,Q*). Ранее мы показали, что полезность смешанной стратегии можно вычислить через вероятности и полезности чистых стратегий. Применим это выражение и исполь- зуем полезности, приведенные в нормальной форме: п/Лр В}) = а, п/Лр В2) = = с, л/Л2, BJ = е, 7Т2(>42, В2) = g. Получим следующие выражения: Л,(Л,, Q*) = p(s2) Л,(Л,, s2) = ,* Л,(Л,, В,) + (1 - ,*)Л/Д.В,) = q*a +(1 - q*)c. л,(Л2, О*)=Е12р(52)л](Л2,82)=р*л](Л2,В1) + (1—</*)л((Л2,В2) = д*е+(1 —p*)g. 99
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Как мы уже показали, эти выражения должны совпадать. Следовательно, q*a +(1 — <7*)с — q*e +(1— q*)g- Выразим q*’. <7* = (c-g)/(e-g-a + c). Аналогично из уравнения Л2(Р*, = Л2(Р*, В2) получим значение р*. Выразим оба члена уравнения в соответствии с уравнением полезности смешанной стратегии и заменим значения полезности выражениями, приведенными в нормальной форме. Получим: л2(Р*,В|) = 11рЦ)л2(5,.В1)=р*л2(Л1,В1) + (1-р*)л2(Л2,В1)=р*Ь+(1-р*)/; л2(Р*,В2)=Е ,рЦ) л2(з,,В2)=р*л2(Л,,В2) + (1 -р*) л2(Л2,В2)=p*d+(l-p*)/>. Теперь рассмотрим уравнение Л2(Р*, В}) = Л2(Р*, В ) с учетом двух полученных выражений. Должно выполняться равенство: р* b +(1— p*)f—p*d +(1—p*)h. Выразим р* из этого уравнения: p*=(h-n/(h-d+b-f). Ранее мы показали, что смешанные стратегии применяются в двух следующих случаях: — а < е, /< h, g< с, d<b; — а> е, f> h, g> с, d> b. Нетрудно видеть, что в этих двух случаях имеем р* G (0,1) и q*e (0,1) . Покажем, например, что в первом случае выполняется условие q* G (0,1). Заметьте, что в пер- вом случае из а < е следует, что 0 < е — а, а из g < с следует, что 0 < с — g. Таким образом, (с — g) / ((с — g) + (е — а)) также будет больше нуля и меньше единицы. Так как это выражение эквивалентно расчетной формуле q*, будет выполняться ус- ловие q* G (0,1). Объединим полученные результаты в теорему. Рассмотрим игру для двух игроков Л и В с двумя стратегиями соответственно: А— {А^ А2}, В= {В}, В2}. Используем функции полезности, приведенные в та- блице на стр. 96. Тогда при 100
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ — а<е, f <h, g<c, d< i, — a>e, f>h, g<c, d>b равновесие Нэша не будет наблюдаться ни для одной чистой стратегии. Равно- весие Нэша будет определяться смешанной стратегией (р*, q*), где р* и q* опре- деляются следующим образом: -P^(h-f)/(h-d+b-n, — q* = (c-g)/(e-g-a + с). НЭШИ ЕГО ТЕОРЕМА Теорема Нэша, согласно которой в любой игре найдется как минимум одно множество смешанных стратегий, описывающих равновесие, была доказа- на Джоном Форбсом Нэшем в докторской диссерта- ции в 1950 году и опубликована годом позже. Этот результат стал обобщением аналогичной теоремы Джона фон Неймана и Оскара Моргенштерна для игр с нулевой суммой. В своей книге по теории игр, опубликованной в 1944 году, фон Нейман и Мор- генштерн доказали, что для игр с нулевой суммой существует смешанная стратегия, и описали алго- ритм ее нахождения, получивший название «метод Американский математик Джон Форбс Нэш (р. 1928). В1994 году за вклад в теорию игр он был удостоен Нобелевской премии по экономике. минимакса». Другие примеры игр Рассмотрим несколько игр для двух игроков с двумя стратегиями. В задаче, ко- торую Люче и Раиффа назвали «Битвой полов» (англ. The battle of sexes), каж- дый из двух игроков (муж и жена) может провести вечер одним из двух способов: отправиться на футбол или на балет. Муж предпочитает футбол, жена — балет. Соответствующие полезности приведены в таблице на следующей странице. Величины полезности указывают, что муж предпочитает футбол балету, а жена — балет футболу, но оба предпочитают пойти куда-нибудь вместе. 101
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ В: Футбол В: Балет А: Футбол 2,1 -1, -1 А: Балет -1, -1 1,2 Нетрудно видеть, что в этой игре присутствуют два равновесия Нэша: пара (футбол, футбол) и пара (балет, балет). Другие авторы в своих статьях описали различные варианты этой задачи — одни рассмотрели борьбу и оперу, другие — концерт Баха и концерт Стравинского. Вторая игра, которая называется «Струсил — проиграл» (англ. Game of chicken), формулируется следующим образом. Два водителя едут навстречу друг другу. Каж- дый из них может либо свернуть в сторону (и проиграть — это вариант С), либо до самого конца ехать прямо (/7). Исход, при котором оба водителя сворачивают в сторону, имеет полезность (3, 3). Если не свернет ни один, они могут получи гь се- рьезные травмы и даже погибнуть — этому исходу мы присвоим полезность (1, 1). Если один свернет в сторону, а другой — нет, то победитель потешит свое самолю- бие (полезность в этом случае будет равна 4), а для проигравшего полезность будет равна 2 (меньше, чем для того, кто свернул, но больше, чем в случае с серьезными травмами или смертельным исходом). Следовательно, нормальная форма этой задачи будет выглядеть так. В: С В: П А: С 3,3 2,4 А: П 4,2 1,1 В этом примере нет чистой стратегии, которой бы соответствовало равновесие Нэша. Однако есть смешанные стратегии, при которых будет наблюдаться равнове- сие. Применим формулу из предыдущего примера, подставив в нее значения а = 3, b = 3, с = 2, d = 4, е = 4, / = 2, g = 1, h = 1: Р* = (Л-/)/(Л-J + b-/) = (l-2)/(l-4 + 3-2) = l/2; <7*=(c-g)/(e-g-a + c) = (2-l)/(4-l-3 + 2) = l/2. Полезность двух игроков будет равна 5/2, что показано ниже: 711(Л1, Q*) = q*a +(1- q*) с = 3/2 + 2/2 = 5/2; я2(Р* Bt) = р*ь +(1-р*)/= 3/2 + 2/2 = 5/2. 102
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Кадр из фильма «Бунтарь без идеала> Сцена игры «Струсил — проиграл», рничество героев оканчивается траги «СТРУСИЛ - ПРОИГРАЛ» Эндрю Колман в своей книге «Теория игр и ее применение в обществен- ных и биологических науках» («Game Theory and Its Applications in the Social and Biological Sciences», 1995) приво- дит несколько цитат и историй, свя- занных с этой игрой. Отметим фильм «Бунтарь без идеала» (1955) режиссе- ра Николаса Рэя: герои фильма Джим (Джеймс Дин) и Базз (Кори Аллен) играют в игру «Струсил - проиграл» и мчатся на двух авто- мобилях к обрыву. Один из игроков говорит: «Едем к обрыву. Первый, кто струсит - проиграл». Намного более древний пример подобной гонки приведен в «Илиаде» Гомера, где Антилох участвует в гонке на колесницах с Менелаем на похоронных играх в память Патрокла (Песнь XXIII «Илиады», стихи примерно 400-450). В определенный момент гонки дорога сужается, и Ме- нелай велит Антилоху подождать и обогнать его позже, когда дорога станет пошире. Антилох не слушает его и еще больше подгоняет коней. Менелай придерживает коней и проигрывает: Царь Менелай устрашился и к Нестора сыну воскликнул: «Правишь без разума, Несторов сын! Удержи колесницу! Видишь, дорога тесна, впереди обгоняй, по широкой; Здесь лишь и мне и себе повредишь: колесницы сшибутся!» Так говорил он; но Несторов сын обскакать горячился; [...] Столько вперед ускакал Антилох; кобылицы отстали Сына Атреева; их запускать и сам перестал он В страхе, что узкой дорог ой бегущие кони столкнутся, Их колесницы, сшибясь, опрокинутся, и среди поля Сами слетят на прах, за победой риставшие оба1. Колман в своей книге также отмечает некоторые особенности игры «Струсил - проиграл». Одна из них заключается в том, что избежать игры с настойчивым соперником невозможно - отказ равносилен поражению. Другая особенность состоит в том, что игрок, способный убе- дить соперника в том, что ни в коем случае не свернет в сторону, выигрывает, если соперник действует рационально. Таким образом, игрок, действия которого кажутся иррациональными, имеет преимущество. 1 Перевод H. И.Гнедича. 103
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Теория кооперативных игр Дилемма заключенного — некооперативная игра: кооперация между заключенными невозможна, так как предполагается, что они не могут общаться друг с другом. Если они могут поговорить, то оптимальным решением будет не признаваться. Таким же будет их выбор и в случае, если оба определят стратегию заранее. Случаи, в которых возможна кооперация между игроками, изучаются в теории кооперативных игр. В ее рамках предполагается, что существуют методы, позволя- ющие игрокам достичь согласия. В теории кооперативных игр необходимо описать некий метод, позволяющий выразить сотрудничество между игроками. Рассмотрим игру для п игроков и обо- значим множество игроков буквой N. Для простоты будем использовать множество N = {1, 2, ..., п}. Чтобы описать сотрудничество между игроками, применим так называемую характеристическую функцию. Характеристическая функция кооперативной игры Для данного множества из п игроков N = {1, 2, ..., п} характеристическая функ- ция — это функция v: 2N —>R, то есть функция, которая ставит в соответствие каж- дому подмножеству N некое значение на множестве вещественных чисел R. Каждое подмножество N представляет собой множество игроков. Следователь- но, если А — произвольное множество игроков, то v(A) определяет значение для коалиции игроков А. Классический пример кооперативной игры — деятельность политических пар- тий в парламенте (при условии, что соблюдается партийная дисциплина, то есть все члены партии голосуют одинаково). В этом случае характеристическая функция по- зволяет представить принятие закона парламентской коалицией. Рассмотрим в качестве примера парламент из 100 членов, в котором законы при- нимаются простым большинством голосов. Следовательно, чтобы принять закон, необходим 51 голос. В парламенте представлены пять следующих партий (для каж- дой указано число парламентских мест): — партия РА: 5 мест; — партия РВ: 30 мест; 104
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ — партия PC: 6 мест; — партия PD: 22 места; — партия РЕ: 37 мест. Теперь обозначим партийные коалиции, имеющие большинство, при помощи ха- рактеристической функции. Обозначим эту функцию через v. Если партийная коа- лиция А может принять закон без поддержки других партий, значение v(A) будет равно 1, в противном случае — 0. К примеру, v({P4, РВ}) указывает, может ли коалиция партий РА и РВ принять закон, если все остальные партии проголосу- ют против. В соответствии с приведенными данными эта коалиция будет насчиты- вать 5 + 30 = 35 членов — меньше необходимого большинства. Следовательно, и({РА, РВ}) = 0. Аналогично v({P4, PC)) — 0, так как эта коалиция включает всего И членов, а п({Р4, РВ, PC}) = 0, так как эта коалиция насчитывает всего 41 кресло. Коалиция партий РВ и PD, напротив, контролирует 52 места — этого достаточно для принятия законов. Таким образом, v({PB, PD}) — 1. Далее пере- числены все возможные коалиции и соответствующие значения характеристической функции. — р(0)=о. - v({PA}) = v({PB}) = v({PC}) = v({PD}) = v({PE}) = 0. — v ({PA, PB}) = v ({PA, PC}) = v ({PA, PD}) = v ({PA, PE}) = v ({PB, PC}) = v({PC, PD}) = v ({PC, PE}) = 0. — v({PB, PD}) = v({PB, PE}) = v({PD, PE}) = 1. — v({PA, PB, PC}) = 0. — V ({PA, PB, PD}) = V ({PA, PB, PE}) = V ({PB, PC, PD}) = v ({PB, PC, PE}) =v({PC, PD, PE}) = 1. — V ({PA PB, PC, PD}) = V ({PA, PB, PC, PE}) = V ({PB, PC, PD, PE}) = 1. — V ({PA, PB, PC, PD, PE}) = 1. В этом примере характеристическая функция обозначает возможность принятия закона и принимает только значения 0 и 1. В других ситуациях характеристическая функция может описывать производство или блага, полученные в результате со- трудничества отдельных субъектов (например, компаний). Рассмотрим пример. Мы открыли кафе-мороженое и занимаемся подбором поставщиков. Свою продукцию нам предлагают три городские фабрики: одна из них изготавливает вафельные рожки, две другие — мороженое. Обозначим эти 105
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ фабрики через Р, Mi и М2 соответственно. Фабрика Ml поставляет мороженое более высокого качества, чем М2, но ее затраты на производство выше, а объемы поставок — меньше. Определим игру, описывающую эту ситуацию. Во-первых, так как мы не можем продавать пустые рожки, их полезность равна нулю. Однако мы можем продавать мороженое без рожков, в одноразовых стаканчиках. Далее, если мы рассмотрим стаканчики и производство Ml и М2, то увидим, что выгода от со- трудничества с М2 выше, чем от сотрудничества с Ml. Для некоторых клиентов наличие мороженого с двух фабрик всегда будет преимуществом. — п(0) = о. — V ({Р}) = О, V ({Ml}) = 0,85, V ({М2}) = 1,1. — v ({Р, Ml}) = 0,85, v ({Р, М2}) = 1,1, v ({Ml, М2}) = 1,2. — v({P, Н1,Н2}) = 1,5. В теории кооперативных игр учитываются два аспекта. Первый — разделе- ние игроков на коалиции, то есть структуры коалиций. С точки зрения математики структура представляет собой разбиение множества игроков. Второй аспект заклю- чается в том, как распределить значение характеристической функции между чле- нами коалиции. Структура коалиции Структуру коалиции можно определить следующим образом. Для данного множества игроков N и характеристической функции v для множе- ства N структурой коалиции на N называется набор непустых множеств CS = = {Сг ..., Cfc}, обладающих следующими свойствами. 1. Объединение всех множеств равно N. 2. Пересечение любой пары неодинаковых множеств С. И С. — пустое множе- ство. Это определение означает, что все игроки распределены между множествами С}, Ck и ни один игрок не может находиться одновременно в двух множествах или более. 106
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Вектор полезности Структура коалиции может быть дополнена вектором полезности. Для данного множества игроков N характеристической функции v, определенной на N, и структуры коалиции CS = {Ср СД вектор х — (хр хп) называется вектором полезности для структуры коалиции CS, если... 1. Все значения х. положительны. Формально это условие выражается так: х. > О для любого i G N. 2. Сумма значений для членов коалиции х не превосходит значение, которое принимает характеристическая функция для этой коалиции ^i&Cj x.^v(C ) для любого С. G CS. Полезность структуры коалиции Полезность для структуры коалиции равна сумме полезностей элементов коалиции: u(GS)=ZCeCSv(C). Так, в примере с мороженым для структуры CS = {{Ml}, {Р, М2}} полезность GS будет равна: V (CS) = ZCeCS и (С) = V ({Hl}) + V ({С,772}) = 0,85 +1,1 = 1,95. Существует множество разновидностей характеристических функций, объеди- ненных в группы. Рассмотрим некоторые из них. Простые игры Простой называется игра, в которой характеристическая функция может принимать только значения 0 или 1. Пример простой игры — рассмотренная выше ситуация в парламенте. В описании простых игр употребляются термины, как правило отно- сящиеся к выборам. Формальное определение простой игры следующее. Для данного множества игроков N характеристическая функция v, определенная на множестве /V, называется простой, если для любой коалиции С выполняется условие о(С) G {0, 1}. 107
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Выигрышная коалиция Выигрышная коалиция определяется следующим образом. Для данного множества игроков N и простой игры v коалиция С называется вы- игрышной, если f(C) — 1. Минимальная выигрышная коалиция Выигрышная коалиция называется минимальной выигрышной (англ, minimal winning coalition), если она перестает быть таковой в случае, когда ее покидает один из чле- нов. Формальное определение звучит так: для множества игроков N и простой игры v коалиция С называется минимальной выигрышной, если о(С) = 1 и для любого DcC (где D * С) v(D) = 0. В нашем примере характеристическая функция принимает значение 1 для следу- ющих множеств. — V ({РВ, PD}) = V ({РВ, РЕ}) = 1, V ({PD, РЕ}) =1. — V ({РА, РВ, PD}) = V ({РА, РВ, РЕ}) = 1. — v ({РВ, PC, PD}) = v ({РВ, PC, РЕ}) = v ({PC, PD, РЕ}) = 1. — v ({РА, РВ, PC, PD}) = 1,о ({РА, РВ, PC, РЕ}) = 1, v ({РВ, PC, PD, РЕ}) = 1. v ({РА, РВ, PC, PD, РЕ}) = 1. Следовательно, перечисленные выше коалиции ({РВ, PD}, {РВ, РЕ} и про- чие) будут выигрышными, однако не все они будут минимальными выигрышными. К примеру, минимальной выигрышной не будет коалиция {РВ, PC, PD, РЕ}, так как коалиция {PD, РЕ}, также выигрышная, является ее подмножеством. Таким образом, если партия PC, РВ или обе сразу покинут эту коалицию, она сохранит большинство. Минимальные выигрышные коалиции таковы: {РВ, PD}, {РВ, РЕ}, {PD, РЕ}. Диктатор Взяв за основу определение минимальной выигрышной коалиции, также можно определить диктатора. 108
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Для данного множества игроков N и простой игры v игрок i называется диктато- ром, если i — единственная минимальная выигрышная коалиция в игре. Если в парламенте законы принимаются простым большинством голосов и одна из партий имеет абсолютное большинство (более половины мест), то согласно при- веденному определению эта партия будет диктатором. Теперь предположим, что были проведены новые выборы и партия РЕ получила больше парламентских мест за счет других партий, обеспечив себе абсолютное боль- шинство. Новое распределение парламентских кресел представлено ниже: — партия РА: 6 мест; — партия РВ: 20 мест; — партия PC: 5 мест; — партия PD: 17 мест; — партия РЕ: 52 места. Как видите, в этом парламенте характеристическая функция принимает значе- ние 1 только для коалиций, в которые входит партия РЕ. Коалиция {РЕ} — мини- мальная выигрышная коалиция, РЕ — диктатор. Монотонные игры К семейству монотонных игр относятся игры, в которых с увеличением числа эле- ментов множества его ценность возрастает. Пример монотонной игры — описан- ная выше задача о парламенте. Разумеется, если некая коалиция имеет большин- ство и к ней добавится еще одна партия, то за коалицией сохранится большинство. Формальное определение игр такого типа приведено ниже. Заметим также, что монотонной является игра, описанная в примере с мороженым. Для данного множества игроков N характеристическая функция п, определенная на множестве N, является монотонной, если для любой пары коалиций С и D таких, что CgzD, выполняется условие п(С) < v(D). Не все игры являются монотонными. Монотонность может нарушиться, если мы добавим в коалицию нового игрока так, что полученная выгода уменьшится из-за роста издержек на координирование действий, коммуникацию или производство. 109
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Также монотонной не является игра, в которой появление нового игрока по какой- либо причине затрудняет достижение поставленных целей. Вернемся к задаче с мороженым и будем предполагать, что фабрики Ml и М2 не сотрудничают. Пример немонотонной игры. Производство мороженого Спустя несколько месяцев после того, как мы открыли магазин, компании Ml и М2 сообщили об изменении цен на продукцию. Теперь цена будет зависеть от того, сколько мороженого мы у них купим. Если мы будем закупать все мороженое у од- ной компании, то получим большую скидку. Если же мы разделим заказы между двумя фабриками, то воспользоваться скидкой уже не сможем. Пересчитаем нашу НАЗВАНИЯ ХАРАКТЕРИСТИЧЕСКИХ ФУНКЦИЙ Характеристические функции, применяемые в теории игр, - это функции, определенные на множествах. Формальное определение характеристической функции не накладывает ни- каких ограничений на ее тип. Единственное условие таково: значения функции должны быть вещественными числами В специализированной литературе функции такого типа фигурируют под разными названия- ми. При рассмотрении монотонных игр эти функции также называются неаддитивными мерами и нечеткими мерами. В общем случае характеристические функции соответствуют немонотон- ным нечетким мерам. Напомним, что о неаддитивных мерах мы уже говорили в главе 3, посвященной многокри- териальному принятию решений и агрегированию, а также в главе 4, где шла речь о принятии решений в условиях риска и неопределенности. В главе 3 мы использовали эти меры для того, чтобы выразить важность критериев. Такой способ их использования аналогичен описанному в главе 5. Ценность коалиции критериев выражается монотонной характеристической функцией (чем больше критериев, там важнее их множество). Монотонной игрой также является пример с путешествием Алисии в Японию, приведенный в главе 3: чем больше городов посетит Алисия, тем больше ей понравится поездка. В силу этой связи (эквивалентности) между характеристиче- скими функциями, описанными в этой главе, и рассмотренными ранее мерами некоторые ме- тоды теории игр оказываются полезными и при многокритериальном принятии решений. Здесь в качестве примера можно привести распределение полезности коалиции между ее членами 110
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ выгоду. Единственные изменения будут наблюдаться в случае, если мы закупаем мо- роженое у двух компаний. В этом случае р({М1, М2}) < р({М1}) и v({MX, М2}) < < v({M2}). Аналогичные соотношения будут выполняться и при учете вафельных рожков: v({P, MX, М2}) < v({P, Ml}), v({P, MX, М2}) < v({P, М2}). Рассмотрим определение v. — p(0)=O. — v ({P})=0, v ({Ml}) = 0,85, v ({М2}) = 1,1. — v ({P, Ml}) = 0,85, v ({P, М2}) = 1,1, v ({Ml, М2}) = 0,6. — v({P, MX, М2}) = 0,7. Аддитивные игры Простейшие монотонные игры — это аддитивные игры, в которых оценка коалиции не превышает сумму оценок ее членов. Если игры оцениваются на интервале [0, 1], эти оценки соответствуют вероятностям. Супераддитивные игры Еще одно семейство мер — меры супераддитивных игр. В таких играх для двух непересекающихся коалиций (не имеющих общих членов) выгода от формирования общей коалиции будет выше, чем выгода от двух коалиций, рассмотренных по от- дельности. Эти игры описывают ситуации, в которых сотрудничество выгодно: для данного множества игроков N характеристическая функция и, определен- ная на множестве N, называется супераддитивной, если для любой пары коа- лиций С и D таких, что их пересечение представляет собой пустое множество (CnD = 0), выполняется условие и (С ) + v(D) ^v(CuD). В качестве примера супераддитивной игры можно рассмотреть блюда в ресто- ране. Так, выгоднее съесть паэлью, чем ее ингредиенты — вареный рис, вареные очищенные креветки, помидоры и лук — по отдельности. Игра, описанная в примере с парламентом, является супераддитивной: если мы рассмотрим пары непересекающихся коалиций, всегда найдется пара, которая не имеет большинства. Следовательно, всегда будет выполняться соотношение и( С ) + + p(D) = 1 или 0. В случаях, когда эта сумма равна 1, будет выполняться равенство 111
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ и(С О D) = 1. Так как в играх, описывающих принятие закона, эта сумма всегда равна 0 либо 1 (закон можно либо принять, либо нет), супераддитивность может нарушиться только в одном случае — когда найдутся сразу две непересекающи- еся коалиции, имеющие большинство, то есть контролирующие больше половины парламентских мест. Но это невозможно: две непересекающиеся группы, каждой из которых принадлежит больше половины мест в парламенте, не могут существо- вать одновременно. Игра, описанная в первом примере с кафе-мороженым, не является суперадди- тивной: достаточно показать, что v({M2}) — 1,1, v({P, Ml}) = 0,85, a v({P, Mi, М2}) = 1,5. Эти значения нарушают условие супераддитивности. Обратите внима- ние, что V ({М2}) + V ({Р, Ml}) = 1,1 + 0,85 > V ({Р, Ml, М2}) = 1,5, в то время как условие супераддитивности выглядит так: V ({М2}) + V ({Р, Ml}) = 1,1 + 0,85 < V ({Р, Ml, М2}). Игра, описанная во втором примере с кафе-мороженым, также не может быть супераддитивной, так как не является монотонной. Супераддитивными могут быть только монотонные игры. В качестве примера можно рассмотреть то же уравнение: V ({М2}) + V ({Р, Ml}) = 1,1 + 0,85 = 1,95 > V ({Р, Ml, М2}) = 0,7. Различие между монотонностью и супераддитивностью заключается в том, что в первом случае мы всего лишь указываем, что с увеличением числа игроков общая выгода повышается, при этом выгода для самих игроков необязательно воз- растает. Такую ситуацию можно наблюдать в первом примере с кафе-мороженым. Описанная игра является монотонной, так как и({Р, Ml}) = 0,85 < и({Р, Ml, М2}) = = 1,5, но не супераддитивной, так как разность f({P, Ml, М2}) — и({Р, Ml}) недо- статочно велика (она не превышает и({М2})). В этом случае лучше продать рожок с мороженым Ml и бумажный стаканчик с мороженым М2, чем один рожок с двумя сортами мороженого. Для любой данной игры, которая не является супераддитивной, определить другую, супераддитивную игру несложно. В новой игре значение для коали- ции будет определяться как лучший результат, которого могут достичь ее члены 112
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ при оптимальной организации. Это означает, что если мы рассмотрим два непере- секающихся множества и объединим их, то в игре, которая не является суперадди- тивной, оптимальным сочетанием будет то, в котором игроки действуют независимо. Следовательно, оценка объединения множеств будет точнее всего соответствовать сумме оценок исходных множеств. Если же игра, напротив, является суперадди- тивной, то будет лучше, чтобы две группы действовали совместно. Результат их совместной работы и будет оценкой множества. Индексы Банцафа и Шепли Ранее мы отмечали, что один из важных аспектов кооперативных игр заключается в том, как распределить значение характеристической функции между членами ко- алиции. Два возможных способа распределения описываются при помощи индек- сов Банцафа и Шепли. К примеру, если мы обозначим индекс Шепли для игры v и игрока i через ф.(и), то получим Z.e N ф.(ь>) = 1. Аналогично для индекса Банцафа. К примеру, когда игрок z0 является диктатором, имеем ф;0(г>) = 1 и ф (и) = 0 для любого z, отличного от i0. ИНДЕКСЫ БАНЦАФА И ШЕПЛИ ПРИ МНОГОКРИТЕРИАЛЬНОМ ПРИНЯТИИ РЕШЕНИЙ Ранее мы уже отмечали, что некоторые результаты в теории кооперативных игр представляют интерес при многокритериальном принятии решений, так как неаддитивные меры, которые мы используем при агрегировании с помощью интеграла Шоке, соответствуют приведенным выше характеристическим функциям (в случаях, когда эти функции монотонны). Здесь полезными оказываются индексы Банцафа и Шепли, которые позволяют распределить значение коалиции между ее членами, что представляет интерес при многокритериальном принятии решений. В за - дачах многокритериального принятия решений, в которых используются неаддитивные меры, более важными являются множества критериев, а не критерии по отдельности. Неаддитивные меры позволяют показать, что группы критериев являются избыточными или, напротив, допол- няют друг друга. Описать такие ситуации при помощи аддитивных мер нельзя. В то же время неаддитивные меры не позволяют получить общее представление о важности отдельных атри- бутов. Для количественной оценки этой важности и используются индексы Банцафа и Шепли. ИЗ
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Динамические игры: принятие решений в играх против компьютера В качестве примеров динамических игр, в которых игроки принимают решения по- следовательно, можно привести шахматы и «Крестики-нолики». Игры такого типа были широко изучены в искусственном интеллекте. Как известно, в 1997 году супер- компьютер Deep Blue выиграл партию в шахматы у чемпиона мира Гарри Каспарова, а до этого человек уже проигрывал программам в игры «Отелло», шашки и др. Шахматные автоматы и программы имеют долгую историю. К примеру, в 1912 году инженер Леонардо Торрес Кеведо сконструировал автомат, способный обыгрывать человека в окончании «король и ладья против короля». Автомат играл королем и ладьей, человек — королем. Позднее, примерно в 1950 году, инженер и математик Клод Элвуд Шеннон создал одну из первых программ для игры в шах- маты. Создание игровой программы не представляет никакой сложности с формальной или теоретической точки зрения, так как алгоритм принятия оптимальных решений прекрасно известен. Однако реализация теоретических методов на практике воз- можна не для всех игр, а лишь для некоторых, например «Крестики-нолики». Это объясняется сложностью игры, причем под сложностью понимается не сложность обучения игре или самого игрового процесса, а число вариантов, которые необходи- мо рассмотреть, чтобы принять решение. К примеру, научиться играть в шахматы нетрудно, однако сложность шахмат очень высока. В средней шахматной партии совершается примерно 100 ходов — по 50 на игрока. На каждом ходу игрок с учетом свободных фигур и их возможных ходов рассматривает в среднем 35 вариантов. Таким образом, чтобы принять опти- мальное решение, шахматная программа должна оценить примерно 351ОП возможных позиций — совершенно невообразимая величина. Сегодня компьютерные программы опережают лучших игроков-людей во многих играх. Но есть игры, которые до сих пор не поддаются программам, одна из них — игра го. Идеальные решения в играх Посмотрим, как компьютерные программы принимают оптимальные решения в играх. Начнем с того, что рассмотрим игру всего для двух игроков, которые де- 114
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ лают ходы по очереди. Предположим, что в игре отсутствует элемент случайности (то есть игроки, к примеру, не бросают кубик на каждом ходу). К таким играм от- носятся шахматы и классические «Крестики-нолики». Последнюю и рассмотрим, чтобы показать, как программа принимает решение. Будем считать, что наша программа в процессе принятия идеального решения не имеет ограничений по времени и объему памяти — это значит, что она может думать над ходом все время мира и сохранять любую необходимую информацию без ограничений. Предположим, что человек ставит на игровом поле крестики, программа — но- лики. Зададим программе конкретную позицию, которая может выглядеть, напри- мер, следующим образом. Чтобы принять идеальное решение, компьютер рассмотрит все возможные ва- рианты. В игре «Крестики-нолики» возможными вариантами будут пять клеток, куда можно поставить нолик. На рисунке в верхней части изображена доска, в ниж- ней — пять возможных вариантов. Для каждого из вариантов программа должна определить, закончена ли партия или же человек может сделать следующий ход. Если программа определила, что партия закончена, позиции присваивается некое числовое значение. Можно заме- тить, что если мы будем присваивать значение 1 позициям, в которых выигрывают «нолики», 0 — ничейным позициям, а —1 — позициям, в которых выигрывают 115
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ «крестики», то цель программы (которая играет «ноликами») будет заключаться в том, чтобы максимизировать результат. Человек (он играет «крестиками»), на- против, должен будет минимизировать результат. К примеру, для «ноликов» выи- грыш (1) предпочтительнее ничьей (0), а ничья предпочтительнее поражения (—1). Если же в заданной позиции игру можно продолжить, то программа начинает моделировать ходы противника-человека. Она рассматривает возможные вариан- ты и рассчитывает позиции для каждого из них. В нашем примере ни один из пяти вариантов не приводит к окончанию партии, поэтому программа поочередно рассмо- трит все варианты и смоделирует возможные ходы соперника. На следующем рисунке представлены возможные ходы человека после первого хода компьютера. Человек может поставить крестик в одну из четырех пустых кле- ток игрового поля. Следовательно, компьютер сгенерирует четыре новые позиции. Для каждой из них программа сначала определит, закончена ли партия или можно продолжать игру. Во всех четырех случаях игру можно продолжать, поэтому программа оценит возможные варианты: по три для каждой позиции. Рассмотрим первый из них, изображенный слева. Программа определяет, в какие клетки можно поставить «нолик». Возможны три варианта, которым соответствуют три позиции. 116
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ В одной из них игра заканчивается с победой «ноликов». Следовательно, эта пози- ция получит оценку 1. В двух других позициях игра продолжится. Возможные ходы для первой позиции с предыдущей иллюстрации представлены ниже. Обратите внимание, что сначала рассматриваются возможные ходы «ноли- ков», затем — «крестиков», после чего — снова «ноликов». Так мы определим финальные позиции для каждого варианта. На иллюстрации приведена оценка всех позиций, в которых партия заканчивает- ся: в двух случаях выигрывают «нолики», в трех игра завершается ничьей. На основе приведенных позиций можно предсказать, какие ходы сделает каж- дый игрок до конца партии. В простейших случаях на поле остается всего одна 117
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ пустая клетка. Очевидно, что в таких случаях компьютер в нее поставит «нолик». На основе этого наблюдения можно оценить позиции, приведенные в предпослед- нем ряду. Заметим, что хотя в этих позициях игра еще не закончена, они имеют те же оценки, что и позиции из нижнего ряда. Хотя на поле остается всего одна пустая клетка, мы можем определить, выиграют ли «нолики». Приведенная ниже иллюстрация совпадает с предыдущей, но на ней приведены оценки для позиций из предпоследнего ряда. X X X • хе «хе • х • •х• ех• х • • хе» хх хх I1 1° • хе е х е х ее х е е х х • х е х 1 о е х е эхе х е х хе хе х е х 1° 1° е х е е х е х е х х е е х е е х е х о о Так как теперь мы знаем оценки позиций из предпоследнего ряда, можно рас- смотреть варианты предыдущего хода. Логично думать, что если игрок, который ставит «крестики», выигрывает, когда позиция имеет оценку —1, завершает партию ничьей, когда позиция имеет оценку 0, и проигрывает, когда позиция имеет оценку 1, он всегда будет выбирать позиции с наименьшей оценкой. К примеру, в первой по- 118
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ зиции, изображенной на иллюстрации во втором ряду, тот, кто играет «крестиками», выберет второй вариант, так как полученная позиция будет иметь меньшую оценку и будет ничейной, а не проигрышной. Так будет действовать тот, кто играет «крести- ками» (при условии, что он рассуждает рационально). Следовательно, выбранную позицию можно считать эквивалентной другой позиции с оценкой 0. Аналогично, во второй позиции, изображенной в том же ряду, игрок выберет тот вариант, который приведет к позиции с наименьшей оценкой. В этом случае оба воз- можных варианта имеют оценку 0, а следовательно, эквивалентны. Таким образом, вторая позиция эквивалентна позиции с оценкой 0. Оценки этих позиций, определенные в соответствии со всем, что было сказано выше, приведены на иллюстрации. Мы также указали, что игрок выберет вариант, соответствующий позиции с наименьшей оценкой. X • X» • X • • X • хее хе хе мин хх хх хе хех р р |0 р ехе ехе ехе ехе хее хее хех хее МАКС ххе хех хее хех 119
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Теперь, когда мы знаем оценки позиций в третьем ряду, можно подняться еще на один уровень и узнать, какой вариант выберет тот, кто играет «ноликами», на предыдущем ходу. Очевидно, что он выберет вариант, которому соответству- ет позиция с наибольшей оценкой. Следовательно, он предпочтет третий вариант во втором ряду — это означает, что первая позиция в первом ряду эквивалентна по- зиции, в которой побеждают «нолики». Таким образом, эта позиция имеет оценку 1. На следующем рисунке показано, что игрок, который должен сделать ход в по- зициях, изображенных в первом ряду, всегда выбирает позиции с наибольшей оцен- кой. Все они выигрышные, поэтому имеют оценку 1. Мы не будем подробно описы- вать проведенные рассуждения — они аналогичны уже выполненным. 120
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Аналогичным образом можно оценить позиции в верхних рядах и на последнем уровне определить, в каком из вариантов результат будет наилучшим. Далее при- ведены оценки для позиций, изображенных на первом рисунке. х 4 х хе х хх Здесь мы указали оценки для всех позиций. Заметьте, что на первом уровне тот, кто играет «ноликами», выберет первый вариант, так как только он ведет к победе, а все остальные — к поражению: на следующем ходу противник поставит три «кре- стика» в ряд. Решение принимается так: игрок выбирает позицию, которая приносит наибольшую выгоду, в этом случае — позицию с оценкой 1. Этот метод определения лучшего хода называется методом минимакса. Как мы показали, один игрок выбирает ходы, которые приводят к позиции с минимальной оценкой (из возможных), другой — ходы, которые ведут к позиции с максимальной оценкой (из возможных). 121
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ПРОТИВОДЕЙСТВИЯ Неидеальные решения Описанный в предыдущем разделе метод можно было бы применить и в таких играх, как шахматы и го, если бы не существовало ограничений по времени и объ- ему памяти. В этом методе рассматриваются все возможные позиции, что в слу- чае с шахматами и го невозможно. Как мы уже упоминали, в шахматах число воз- можных позиций достигает 35100. В реальных играх все позиции до победы одного из игроков или ничьей, как правило, не рассматриваются. Вместо этого формируется частичное дерево позиций, и в случаях, когда мы не хотим разрабатывать позицию (например, если время на ход заканчивается), используется функция, которая воз- вращает приближенную оценку. Значение этой функции близко к оценке, которую мы получили бы, если бы просчитали все возможные варианты для этой позиции до конца. В таких случаях принятое решение будет неидеальным. Чем точнее значе- ние этой функции соответствует реальной оценке и чем больше позиций рассмотрит программа, тем лучше будет принятое решение. Похожий метод можно применить и в играх, где присутствует элемент случай- ности. К примеру, если игроки перед каждым ходом бросают кубик, то при оценке мы будем учитывать, что на кубике может выпасть от 1 до 6 очков, при этом ве- роятности выпадения всех граней одинаковы. Далее на основе этих вероятностей и оценок всех позиций, соответствующих возможным результатам броска кубика, определяется оценка текущей позиции. 122
Глава 6 Избирательные системы Система выбора руководства страны зависит от множества факторов. Один из них — избирательная система, описывающая, как именно избираются кандидаты на государственные посты. Кроме того, избирательный процесс зависит от границ избирательных округов, условий, которым должны удовлетворять партии, коалиции и группы избирателей, а также от ряда ограничений, соблюдаемых при определении итогов выборов. Рассмотрим некоторые из существующих избирательных систем. Первое разли- чие между ними заключается в том, что в одних системах выбирается единственный кандидат (такие системы называются мажоритарными), в других — множество кандидатов. Как известно, в обоих случаях выбор кандидата или кандидатов может производиться разными способами. Различия между избирательными системами заключаются, с одной стороны, в том, как избиратели выражают свои предпочте- ния, с другой стороны — в том, как проходит сам избирательный процесс. Мажоритарные системы Мажоритарные избирательные системы применяются, когда нужно избрать един- ственного кандидата — например, мэра, губернатора или президента. Они также используются в случаях, когда нужно избрать единственного представителя от из- бирательного округа. Мажоритарная система относительного большинства Эта избирательная система также известна как система простого большин- ства, или ио англоязычному названию first-past-the-post. Она распространена в Великобритании, также часто применяется в США. Голосование и подсчет голо- сов в этой системе производятся следующим образом. 1. Избиратель отмечает в своем бюллетене единственного кандидата. 2. Избранным считается кандидат, набравший большинство голосов. 123
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ В некоторых странах в тех случаях, когда ни один из кандидатов не набрал до- статочного количества голосов (например, абсолютного большинства), проводится второй тур выборов. ВЫБОРЫ С ДВУМЯ ТУРАМИ ГОЛОСОВАНИЯ Выборы президента проводятся в два тура во мно- гих странах мира - к примеру, во Франции, со- гласно конституции 1958 года. Если ни одному из кандидатов не удается набрать абсолютного большинства голосов, через две недели после первого тура голосования проводится второй тур, в котором участвуют всего два кандидата, набрав- шие больше всего голосов в первом туре. Согласно аргентинской конституции 1994 года, для опреде- ления победителя на выборах президента и вице- президента достаточно 45% голосов, или даже 40%, если отрыв от кандидата, занявшего второе место, превышает 10%. В1995 году Карлос Сауль Менем был избран президентом Аргентины, набрав менее 50 % голосов (49,94 %). Одобрительное голосование Эта избирательная система предназначена для выбора одного кандидата. Голосование и подсчет голосов в этой системе производятся следующим образом. 1. Избиратель получает бюллетень с именами всех кандидатов и отмечает тех, кто, по его мнению, достоин занимать должность. В отличие от других систем, кандидат может быть либо выбран, либо нет (накапливать голоса нельзя). 2. Во время подсчета определяется число голосов за каждого кандидата во всех бюллетенях. 3. Побеждает кандидат, набравший большинство голосов. 124
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ Многие авторы, среди них Брамс и Фишберн, считают, что эта система лучше подходит для выборов единственного кандидата. 1. Одобрительное голосование более гибкое. Избиратели могут выбрать тех кандидатов, кого считают достойными. При этом они не стремятся голосовать за кандидата, которого на самом деле не поддерживают, лишь бы не допустить нежелательного исхода выборов (такое голосование называется стратегиче- ским), поэтому одобрительное голосование точнее выражает предпочтения электората. 2. Одобрительное голосование помогает выбрать самого сильного кандида- та. В некоторых случаях в системе относительного большинства должность получает кандидат, заручившийся поддержкой крупного меньшинства. При одобрительном голосовании, напротив, побеждают кандидаты, которых под- держивает большинство. Заметьте, что избиратели, принадлежащие к мень- шинству, возможно, выберут не только своего кандидата, но и других, которые им понравятся. В результате будет избран кандидат, пользующийся поддерж- кой большинства. Такая ситуация в системе относительного большинства не- возможна, так как избиратель должен выбрать только одного кандидата и мо- жет столкнуться с дилеммой: кому отдать свой голос — кандидату, точнее отражающему его интересы, или кандидату, который будет избран с большей вероятностью ? 3. Миноритарные кандидаты смогут узнать, какова их реальная поддержка. В мажоритарной системе относительного большинства избиратели часто от- дают свой голос не тем, кого на самом деле поддерживают, а тем, кто будет из- бран с большей вероятностью. Таким образом, в этой системе поддержка ми- норитарных кандидатов, как правило, оказывается ниже реальной. При одо- брительном голосовании избиратель не чувствует подобного давления и может одновременно поддержать своего кандидата, пусть и непопулярного, и другого (других) кандидатов, которые имеют больше шансов. 4. Результаты одобрительного голосования не так сильно зависят от числа кандидатов. В мажоритарной системе относительного большинства с увели- чением числа кандидатов голоса могут распределиться между ними, и в итоге будет выбран кандидат с немногочисленными, но преданными сторонниками. При одобрительном голосовании подобная ситуация невозможна, так как с добавлением в бюллетени новых кандидатов голоса, отданные прежним кан- дидатам, не перераспределятся. 125
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ МАЖОРИТАРНАЯ СИСТЕМА ОТНОСИТЕЛЬНОГО БОЛЬШИНСТВА И РАСПРЕДЕЛЕНИЕ ГОЛОСОВ Пример распределения голосов наблюдался на выборах президента Франции в 2002 году. В выборах участвовалс 16 кандидатов, и ни одному из них не удалось преодолеть отметку в 20% голосов. Более 10% голосов получили три кандидата: Жак Ширак (5665855 голосов, или 19,88%), Жан-Мари Ле Пен (4804713 голосов, или 16,86%) и Лионель Жоспен (4610 ИЗ го- лосов, или 16,18%). Следующий кандидат, Франсуа Байру, получил всего 6,84% голосов. Жак Ширак и Жан-Мари Ле Пен прошли во второй тур, где Ширак получил 25 537 956 голосов (82,21%), Ле Пен - 5525032 голоса (17,79%). Считается, что если бы во второй тур вместо Жана-Мари Ле Пена прошел Лионель Жоспен, то голоса распределились бы более равномерно. Рейтинговое голосование Рейтинговое голосование (англ, instant-runoff voting) — еще одна система для вы- бора единственного кандидата. Ее важное отличие от других систем заключается в том, что избиратели могут упорядочивать кандидатов согласно своим предпо- чтениям. Голосование и подсчет голосов в этой системе производятся следующим образом. 1. Избиратель в бюллетене перечисляет кандидатов в порядке предпочтения. Таким образом, для каждого избирателя определяется упорядоченный список кандидатов. 2. Если один из кандидатов указан первым более чем в половине бюллетеней, он одерживает победу. 3. Если ни один из кандидатов не одержал верх, из рассмотрения исключается кандидат, набравший меньше всего голосов. В этом случае бюллетени, отдан- ные в пользу исключенного кандидата, перераспределяются в пользу канди- датов, которые были указаны в этих бюллетенях на втором месте. Так голоса исключенного кандидата распределяются между остальными. К примеру, если мы проголосовали за Альбу, Бланку, Кристину и Давинию (именно в таком порядке) и Альба оказалась исключена, то наш голос переходит Бланке. 4. Если теперь один из кандидатов набрал больше половины голосов, он счи- тается победителем. В противном случае кандидат, набравший меньше всего голосов, исключается, и голоса, отданные в его пользу, перераспределяются 126
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ между остальными кандидатами согласно предпочтениям избирателей. Если в предыдущем примере из рассмотрения исключается Бланка, то голос пере- ходит третьему кандидату — Кристине. Этот процесс повторяется до тех пор, пока один из кандидатов не получит большинства. Эта система также называется преференциальным (англ, preferential vote) или альтернативным голосованием (англ, alternative vote) и используется, к примеру, в Австралии при выборе членов палаты представителей, а также на президентских выборах в Индии и Ирландии. В этих странах утверждена система единого передаваемого голоса, схожая с рей- тинговым голосованием, которая применяется при выборе кандидатов не на одну, а сразу на несколько должностей. Один из недостатков этой избирательной системы заключается в том, что она не обладает монотонностью. Иными словами, если в этой системе избиратель ука- зывает кандидата на первом месте в своем бюллетене, шансы этого кандидата на по- беду могут снизиться. Может произойти так, что если избиратель укажет кандидата не на первом, а на более низком месте, например, на третьем, то кандидат, не зани- мавший лидирующей позиции, в итоге одержит победу. Однако среди всех методов, в которых избиратели указывают предпочте- ния по порядку, эффект от стратегического голосования в этом случае считается наименьшим. РЕФЕРЕНДУМ В ВЕЛИКОБРИТАНИИ 5 мая 2011 года в Великобритании был проведен референдум о замене традиционной мажо- ритарной системы относительного большинства рейтинговым голосованием. Население про- голосовало против, и мажоритарная система относительного большинства была сохранена. В референдуме приняло участие 42,2 % избирателей, из которых 32,1 % проголосовали в под- держку изменений, 67,9% - в пользу существующей системы. Консервативная партия провела кампанию против изменений в избирательной системе, а партия либеральных демократов со- вместно с ирландскими организациями «Шинн Фейн» и Шотландской национальной партией выступили за. Лейбористская партия, в свою очередь, не сделала какого-либо официального заявления, однако некоторые ее лидеры также высказывались в поддержку изменений. 127
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ Система Льюиса Кэрролла Английский математик Чарльз Доджсон, более известный как Дьюис Кэрролл, также разработал собственную мажоритарную избирательную систему. В научной статье Бартольди, Тови и Трика под названием «Схемы голосования, в которых порой непросто определить победителя» показано, что для определения победителя в системе Кэрролла требуется решить задачу очень высокой вычислительной слож- ности. Метод Кэрролла таков. 1. Избиратель упорядочивает кандидатов согласно своим предпочтениям. 2. Победителем считается кандидат, который займет первое место по методу Кондорсе с наименьшим числом перестановок. Пропорциональные системы Когда необходимо выбрать нескольких кандидатов, выборы также могут проводить- ся разными способами. Применяемые в подобных случаях избирательные системы различаются в зависимости от того, какая информация предоставляется электорату и как проходят сами выборы. К примеру, в некоторых системах избиратели выби- рают только одну партию из предложенных, в других, как мы уже рассказывали, кандидатов можно упорядочивать. Если цель выборов — определить несколько кандидатов от различных партий, то партии часто получают число мандатов, про- порциональное числу проголосовавших за них избирателей. Рассмотрим избира- тельные системы, разработанные для таких выборов. Ограниченное голосование В этой системе число голосов избирателя меньше числа вакантных мест. Допустим, что избиратель может указать не более с кандидатов, а общее число победителей равно е. В этом случае голосование проводится следующим образом. 1. Избиратель получает бюллетень с именами кандидатов и указывает на нем не более с имен. 2. При подсчете голоса, отданные в пользу каждого кандидата, складываются, и выборы выигрывают кандидаты, получившие наибольшее число голосов. 128
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ Эта избирательная система применяется в Испании на выборах в сенат и в Ги- бралтаре на выборах в парламент. В обоих случаях избирательный блок, имеющий большинство голосов, как правило, получает столько мест, сколько кандидатов мо- жет указать избиратель в бюллетене, миноритарному блоку достаются оставшиеся парламентские кресла, а кандидаты от прочих избирательных блоков обычно не по- лучают мандатов вовсе. В этой системе (в англоязычной литературе она называется limited voting) присутствует тенденция к стратегическому голосованию. Представительное голосование Эта система напоминает предыдущую и применяется на некоторых выборах в США, Великобритании и Канаде. Процедура проходит следующим образом. 1. Избиратель получает бюллетень с именами кандидатов и указывает на нем от 1 до е имен. 2. Мандаты достаются первым е кандидатам с наибольшим числом голосов. Как и в предыдущем случае, миноритарные партии обычно теряют голоса из- за стратегического голосования, что способствует созданию коалиций. При этом, в отличие от ограниченного голосования, все избранные кандидаты могут принадле- жать к одной и той же партии или альянсу. Следовательно, эта система не является пропорциональной, тем не менее иногда эта особенность считается преимуществом с точки зрения управления. В англоязычных источниках представительное голосова- ние называется plurality-at-large voting, или block vote. Кумулятивное голосование Отличительная особенность этой системы заключается в том, что за одного и того же кандидата можно проголосовать несколько раз. Голосование проводится следующим образом. 1. Избиратель получает бюллетень с именами кандидатов и распределяет свои голоса между ними. В одних разновидностях этой системы избиратель рас- пределяет целое число голосов (например, 45 голосов в пользу кандидата/1), в других — долю от общего числа голосов (к примеру, 35,3% в пользу кан- дидата А). 129
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ 2. При подсчете определяется сумма голосов (или процентов голосов) для каж- дого кандидата. Эта система, как правило, не является пропорциональной, если избиратели рас- пределяют голоса между кандидатами от одной партии. В этом случае кумулятивное голосование дает результаты, схожие с представительным и ограниченным голосо- ванием. Существует несколько стратегий кумулятивного голосования, в частности передача всех голосов единственному кандидату. В англоязычной литературе эта из- бирательная система называется cumulative voting, или multi-voting. Пропорциональное представление партий Далее мы рассмотрим методы голосования, разработанные для выборов, в которых участвует несколько партий. Цель — выбрать кандидатов так, чтобы соотношение парламентских кресел максимально соответствовало распределению голосов в поль- зу каждой партии. Хотя далее мы расскажем о методах, направленных на выбор кандидатов от каждой партии, они применимы для любого пропорционального голо- сования, например при определении числа кресел для каждого избирательного окру- га в зависимости от численности его населения. Метод д’Ондта иди Джефферсона Методы д’Ондта и Джефферсона, пусть и отличаются по своей сути, дают одина- ковые результаты, поэтому с точки зрения математики они эквивалентны. Томас Джефферсон разработал свой метод в 1792 году, чтобы определить число мест в па- лате представителей от каждого штата США. Система Джефферсона такова... 1. Подсчитываем голоса {Г) в пользу каждой партии (/7). 2. Выбираем партию с максимальным числом голосов и отдаем ей одно парламентское кресло. Теперь делим количество ее голосов на (s + 1), где s — число кресел этой партии на данный момент. Таким образом, от числа голосов мы перешли к некоторому коэффициенту, который используется в дальнейшем. 3. Будем повторять шаг 2 до тех пор, пока все кресла не будут распределены. 130
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ ТОМАС ДЖЕФФЕРСОН Томас Джефферсон (1743-1826) был третьим президентом Соединенных Штатов Америки и основным автором Декларации независимо- сти. Он был очень образованным человеком. Когда президент Джон Кеннеди 29 апреля 1962 года выступил с речью на банкете, где со- бралось 49 нобелевских лауреатов, то упомянул президента Джефферсона:«[...] Мне кажется, сегодняшний ужин - величайшее собрание та- лантов и титанов человеческой мысли за всю историю Белого дома. Единственным исклю- чением, возможно, были ужины, на которых присутствовал только один человек - Томас Джефферсон. Кто-то однажды назвал Томаса Джефферсона 32-летним джентльменом, спо- собным вычислить затмение, обследовать уча- сток, пережать артерию, составить план здания, расследовать дело, укротить коня и станцевать менуэт». Портрет Томаса Джефферсона кисти Рембрандта Пила (1800). Допустим, что нам нужно распределить девять кресел между пятью партия- ми — А, В, С, D и Е, которые получили 100 тысяч, 85 тысяч, 50 тысяч, 40 тысяч и 25 тысяч голосов соответственно. В таблице на следующей странице приведены значения Г (/7) / (s +1) для s — 0, ..., 5. В первой строке указано число избирателей, отдавших свои голоса каждой партии. Некоторые числа заключены в скобки — это значит, что они не нужны для вычислений. Так как больше всего голосов получила партия А, первое место в парламенте бу- дет отведено ей. Следовательно, затем нужно вычислить Г(партия А) = 100000/ /(1 + 1) = 50000. Теперь нужно выбрать партию, для которой коэффициент будет наибольшим. Это партия В, получившая 85 тысяч голосов. Ей будет отведено второе кресло. Пересчитаем коэффициент для этой партии: так как партия В имеет одно кресло, вычислим Г(партия В) = 85000/ (1 + 1) = 42500. 131
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ Отдадим третье кресло партии с наибольшим коэффициентом. Это будет пар- тия А (одинаковый с ней коэффициент также будет иметь партия С). Пересчитаем коэффициент для партии А. Он будет равен Г(партия А) — 100000/ (2 + 1) = = 33 333, так как теперь партия А имеет два парламентских кресла. Повторим шаг 4 и отдадим четвертое кресло партии С, пятое — партии В, ше- стое — партии D, седьмое — партии А, восьмое — партии В, девятое — партии А. Следовательно, партия А получит 4 места, партия В — 3, партии С и D — по одному. Д'Ондт Партия А Партия В Партия С Партия D Партия Е Голоса Г(П)/1 100 000 85 000 50 000 40 000 25 000 Г(П)/2 50 000 42 500 25 000 20 000 (12 500) Г(П)/3 33 333 28 333 (16 666) (13 333) (8333) Г(П)/4 25 000 21 250 (12 500) (10 000) (6250) Г(П)/5 20 000 (17 000) (10 000) (8000) (5000) Метод Сент-Лагю (Вебстера) Методы Сент-Лагю и Вебстера с точки зрения математики эквивалентны, хотя спо- собы вычисления результатов в них отличаются. Эти методы аналогичны методу д’Ондта и отличаются только коэффициента- ми. В методе д’Ондта используется коэффициент Г(П) / (s + 1), в методе Сент- Лагю — Г(П) / (2s + 1). Следовательно, мы будем делить число голосов на 1, 3, 5, 7 и так далее, поэтому метод Сент-Лагю также называют методом нечетных чисел. В некоторых странах используется особая разновидность этого метода, в кото- рой получить первое парламентское кресло сложнее: первое значение делителя равно не 1, а 1,4, то есть число голосов последовательно делится на 1,4; 3; 5; 7 и так далее. Метод Сент-Лагю выглядит так. 1. Подсчитываются голоса в пользу каждой партии. 2. Всем партиям отводится 0 мест. Для каждой партии вычислим ЦП) / (2s + +1) для s — 0, то есть ЦП) /1. 3. Выберем партию, для которой полученное число будет наибольшим, и отдадим ей одно парламентское место. Так как теперь этой партии отведено одно место, вычислим Г(П) / (2s + 1) для s = l. 132
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ 4. Выберем партию, для которой полученное число будет наибольшим, и отдадим ей одно парламентское кресло. Теперь у этой партии s кресел. Вычислим Г(П) / / (2s +1) для этого значения s. Будем повторять этот шаг до тех пор, пока не будут распределены все места в парламенте. В иллюстративных целях применим метод Сент-Лагю к результатам тех же вы- боров, что и в примере для метода д’Ондта. В этом случае первое кресло также по- лучит партия А. Пересчитаем коэффициент для этой партии: так как партия Л име- ет одно кресло, Г(партия А) = 100000/ (2’1+1)= 100000 / 3 = 33333. Следовательно, второе кресло получит партия В, так как теперь ее коэффициент будет самым высоким. Пересчитаем коэффициент для партии В: Г(партия В) / / (2 • 1 + 1) = 85000/3 = 28333. Следовательно, третье кресло достанется пар- тии С. Нетрудно видеть, что здесь метод Сент-Лагю отличается от метода д’Ондта, в котором третье кресло досталось партии А. Пересчитаем коэффициент для пар- тии С. Он будет равен Г(партия С) = 16 666. Четвертое кресло получит партия D, пятое — партия Е. Согласно правилу д’Ондта, пятая партия не будет представлена в парламенте, а здесь она получит пятое кресло. Шестое кресло отойдет партии А, седьмое — партии В, восьмое — партии А, девятое — партии В. Следовательно, партия А получит 3 кресла, партия В — 3, партии С, D и Е — по одному. Сент-Лагю Партия А Партия В Партия С Партия D Партия Е Голоса Г(П)/1 100 000 85 000 50 000 40 000 25 000 Г(П)/3 33 333 28 333 16 666 13 333 8333 Г(П)/5 20 000 17 000 (10 000) (8000) (5000) Г(Л)/7 14 285 12 142 (7142) (5714) (3571) На следующей странице приведена таблица результатов, полученных по мето- ду Сент-Лагю, где в первом коэффициенте вместо 1 используется значение 1,4. Заметим, что для девяти мест в парламенте результат выборов будет таким же, что и для коэффициента со значением 1. Тем не менее порядок распределения пар- ламентских кресел будет иным, и последнее место на этот раз достанется партии Е. Это означает, что если мы используем значение 1,4, то в парламенте из вось- ми мест пятая партия представлена не будет. Если же мы используем значение 1, 133
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ то партия Е получит одно кресло, а партия В останется без последнего кресла. Как можно заметить, в этом случае результат выборов в парламент на восемь мест будет тем же, что и по правилу д’Ондта, так как партия А потеряет последнее кресло. Сент-Лапо Партия А Партия В Партия С Партия D Партия Е Голоса 100 000 85 000 50 000 40 000 25 000 Г(Л)/1,4 71428 60 714 35 714 28 571 17 857 Г(П)/3 33 333 28 333 16 666 13 333 8333 Г(П)/5 20 000 17 000 (10 000) (8000) (5000) Г(П)/7 14 285 12 142 (7142) (5714) (3571) Далее представлены итоговые таблицы, демонстрирующие распределение парла- ментских кресел по трем рассмотренным методам. Обратите внимание, что с поли- тической точки зрения различия могут оказаться весьма существенными. Партия А ни разу не получила абсолютного большинства, но по методу д’Ондта ей достаточ- но вступить в коалицию с любой другой партией, чтобы образовать большинство. В выборах по методу Сент-Аагю партии А потребуется сформировать коалицию уже с двумя партиями. Кроме того, в этом случае две ведущие партии получили одинаковое число кресел, чего не наблюдается в выборах по методу д’Ондта. В при- мере с восемью креслами парламент, избранный по методу Сент-Аагю, получается раздробленным. Таким образом, метод д’Ондта выгоден для более крупных партий, а метод Сент-Аагю — для более мелких. Для 9 кресел Партия А Партия В Партия С Партия D Партия Е Д’Ондт 4 3 1 1 0 Сент-Лапо (с коэфф. 1 и 1,4) 3 3 1 1 1 Для 8 кресел Партия А Партия В Партия С Партия D Партия Е Метод Д’Ондта (Сент-Лапо с коэфф. 1,4) 3 3 1 1 0 Сент-Лапо 3 2 1 1 1 134
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ Методы наибольшего остатка Существует ряд методов, имеющих общую особенность: в них число голосов делит- ся на некий коэффициент. Эти методы отличаются в зависимости от применяемых коэффициентов. Квота Хэйра, или «естественная квота», определяется следующим образом. 1. Подсчитываются голоса в пользу каждой партии. Определяется общее число голосов. 2. Рассчитывается коэффициент с = общее число голосов / число парламентских кресел. 3. Число голосов в пользу каждой партии Г(П) делится на коэффициент с. 4. Целая часть от деления указывает число мест для каждой партии. 5. Определяется число мест, оставшихся незанятыми. 6. Для каждой партии вычисляется разность между квотой, найденной на шаге 3, и целой частью этой квоты. 7. Партии упорядочиваются в соответствии с полученными коэффициентами. Оставшиеся места отводятся партиям с наибольшими разностями. Применим этот метод к результатам выборов, которые мы рассмотрели ранее. В этом случае общее число голосов составляет 300 000. Рассмотрим пример с девя- тью парламентскими креслами. На втором шаге вычислим коэффициент с = общее число голосов / число кресел = 300000/9 = 33333,33. На шаге 3 для каждой пар- тии П нужно разделить значение ЦП) на с. Результаты деления указаны в таблице на следующей странице. На шаге 4 распределим кресла между партиями в первый раз. Число кресел для каждой партии на этом шаге определяется как целая часть числа, найденного на шаге 3. Эти числа также приведены в таблице. Партия А по- лучит 3 кресла, партия В — 2, партия С — 1, еще 1 — партия D. Итак, на шаге 4 мы распределили 7 кресел, следовательно, осталось распределить еще 2 (число сво- бодных кресел определяется на шаге 5). Далее, на шаге 6, найдем описанные выше разности. Для партии А эта разность будет равна 0, так как соответствующий ей коэффициент — целое число. Для партии В эта разность составляет 0,55, для пар- тии С — 0,5, для партии D — 0,2, для партии Е — 0,75. Так как осталось распре- делить два кресла, а две наибольшие разности соответствуют партиям Ей В, именно эти партии получат два последних кресла. Следовательно, партии А и В получат по 3 кресла, все остальные — по 1. 135
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ Метод Хэйра Партия А Партия В Партия С Партия D Партия Е Голоса 100 000 85 000 50 000 40 000 25 000 Шаг 3: Г(П)/с 3 2,55 1,5 1,2 0,75 Шаг 4: 3 2 1 1 0 Шаг 5: разность 0 0,55 0,5 0,2 0,75 Шаг 7: 1 1 ВСЕГО КРЕСЕЛ 3 3 1 1 1 Метод Друпа полностью аналогичен предыдущему с той лишь разницей, что на шаге 2 рассчитывается следующий коэффициент: с = 1 + (общее число голосов/ (1 + число кресел)). В примере с парламентом из девяти мест значение с будет таким: с = 1 + (300 000 / (1 + 9)) = 30 001. Расчеты для этого коэффициента приведены в таблице. Заметим, что места ока- зались распределены между партиями точно так же, как и в предыдущем случае. Метод Друпа Партия А Партия В Партия С Партия D Партия Е Голоса 100 000 85 000 50 000 40 000 25 000 Шаг 3: Г(П)/с 3,333 2,833 1,666 1,333 0,833 Шаг 4: 3 2 1 1 0 Шаг 5: разность 0,333 0,833 0,666 0,333 0,833 Шаг 7: 1 1 ВСЕГО КРЕСЕЛ 3 3 1 1 1 В методе Империали на шаге 2 используется коэффициент с = общее число голосов/ (2 + число кресел). В примере с парламентом из девяти кресел значение этого коэффициента будет таким: С = 300 000/(2 + 9) - 27 272,727. 136
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ Далее приведена таблица со всеми расчетами для метода Империали. Как види- те, парламентские кресла распределены точно так же, как и в предыдущих случаях. Imperial! Партия А Партия В Партия С Партия D Партия Е Голоса 100 000 85 000 50 000 40 000 25 000 Шаг 3: Г(П)/с 3,666 3,116 1,833 1,466 0,916 Шаг 4: 3 3 1 1 0 Шаг 5: разность 0,666 0,116 0,833 0,466 0,916 Шаг 7: 1 1 ВСЕГО КРЕСЕЛ 3 3 1 1 1 Мы показали, что три метода наибольшего остатка дают одинаковые результа- ты. Все они совпадают с результатами, полученными по методу д’Ондта, который был описан выше, однако так происходит не всегда. В общем случае в методе Хэйра преимущество имеют малые партии, в методе Империали — крупные. Система единого передаваемого голоса Эта система, которая в англоязычной литературе называется single transferable vote, также является пропорциональной. Голосование проводится следующим образом. 1. Избиратель перечисляет кандидатов в бюллетене в порядке предпочтения. Так каждый избиратель определяет упорядоченный список кандидатов. 2. Чтобы получить мандат, кандидатам необходимо набрать определенное мини- мальное число голосов. Один из самых используемых в этой системе коэффи- циентов — это описанный выше коэффициент Друпа, который рассчитыва- ется следующим образом: с = (общее число голосов/ (общее число кресел + + 1)) + 1. 3. Подсчитывается число голосов в пользу кандидатов, которые указаны в бюл- летенях первыми. Мандаты достаются кандидатам, которые набрали больше необходимого минимума голосов. 4. Голоса, набранные победителями сверх минимума с, передаются следующим кандидатам в соответствии с предпочтениями избирателей. 137
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ 5. Если ни один кандидат не набрал больше необходимого минимума голосов, то кандидат, набравший меньше всего голосов, исключается, и голоса, отдан- ные в его пользу, перераспределяются между остальными кандидатами со- гласно предпочтениям избирателей. 6. Шаги 3, 4 и 5 повторяют до тех пор, пока все кресла не будут распределены. Когда число оставшихся кандидатов становится равным числу кресел, места присваиваются им напрямую, и процесс на этом заканчивается. Смешанная пропорциональная система Эта система сочетает особенности мажоритарных и пропорциональных систем. Каждый избиратель имеет два голоса: первый он отдает представителю своего окру- га, второй — той или иной партии. Представители округов определяются большин- ством голосов (по мажоритарной системе относительного большинства). Парламент формируется, во-первых, из представителей округов, во-вторых, из представителей партий в соответствии с распределением голосов, полученных партиями: число депутатов от каждой партии соответствует числу голосов, отдан- ных в ее пользу. ПРОПОРЦИОНАЛЬНЫЕ ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ И НЕВОЗМОЖНОСТЬ ВЫБОРА Мы уже рассказали о теореме Эрроу о невозможности коллективного выбора. Но известна и теорема о невозможности для пропорциональной системы, доказанная Мишелем Балински и Пейтоном Янгом. Согласно этой теореме, существует три «естественных» условия, несовме- стимых между собой, и не существует такой системы распределения мандатов, которая удов- летворяла бы всем этим условиям одновременно. Эти условия таковы. 1. Число кресел каждой партии определяется как одно из двух целых чисел, ближайших к чис- лу, соответствующему доле голосов в пользу этой партии. К примеру, если партия набрала 33,33 ’/о голосов, а в парламенте 100 мест, то эта партия должна получить 33 или 34 кресла. 2. Если число парламентских кресел увеличивается, то число кресел партии не может умень- шиться. Иными словами, если партии было отведено 34 кресла в парламенте из 100 кресел, и число кресел увеличилось до 101, то в новом парламенте партия должна иметь не менее 34 кресел. 3. Если число избирателей партии Д возрастает быстрее, чем число избирателей партии В, то парламентские кресла не должны переходить от партии Д к партии В. 138
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ Открытые списки, партийные списки и дополнительные одномандатные округа в пропорциональных системах В пропорциональных избирательных системах победители могут определяться од- ним из трех способов. При использовании партийных списков избранные канди- даты определяются партией, и избиратели никак не могут повлиять на ее решение. При использовании открытых списков избиратели напрямую определяют кандида- тов, которые в итоге пройдут в парламент. При использовании партийных списков с дополнительными одномандатными округами избиратели на уровне округов го- лосуют напрямую за кандидата от определенной партии. Если какой-то кандидат набрал большинство голосов, это еще не значит, что именно он автоматически будет избран в парламент. Голоса, отданные в пользу кандидатов от одной и той же пар- тии, объединяются на уровне партии, чтобы число ее представителей в парламенте было пропорционально числу голосов избирателей. После того как голоса объедине- ны и рассчитано число представителей от каждой партии, определяется необходимое число кандидатов, которые пройдут в парламент. Отбор начинается с кандидатов с наибольшим процентом голосов. Избирательные округа Избирательный округ — это территория, от которой избирателями совместно вы- бирается одно или более должностных лиц. В пропорциональной избирательной системе, то есть в случае, когда число избранных кандидатов от каждой партии про- порционально числу голосов, от одного избирательного округа, как правило, вы- бирается несколько депутатов. Кроме того, чем больше избирательные округа, тем выше пропорциональность. Оптимальная пропорциональность достигается в случае с одним избирательным округом и пропорциональной системой голосования. Выбор избирательной системы зависит не только от пропорциональности — это еще и политический вопрос. В пропорциональных избирательных системах роль отдельных кандидатов не столь велика, и определяющее положение занимают партии. Избиратели голо- суют за избирательную программу партии, и косвенно предполагается, что избран- ные должностные лица, например депутаты парламента, будут следовать политике партии и голосовать в соответствии с партийной дисциплиной. Смена партий пар- ламентариями или нарушение партийной дисциплины противоречат основам такой избирательной системы 139
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ Если же, напротив, считается, что избранное должностное лицо верой и прав- дой представляет свой регион, то можно определить избирательные округа меньше- го размера, в которых будет избираться только одно должностное лицо. По этому принципу организована английская система. В таком парламенте кандидат в боль- шей степени зависит от своего избирательного округа, и депутаты могут проголосо- вать против законопроекта, одобренного большинством партии, если этот законо- проект отрицательно скажется на жителях их округа. Смешанная пропорциональная система, используемая на выборах в немецкий бундестаг, была специально разработана для того, чтобы все избирательные округа были представлены в парламенте и в то же время соблюдалась пропорциональность. Распределение числа избранных кандидатов (англ, apportionment) в каждом из- бирательном округе может осуществляться по-разному. Если число избирателей в разных округах отличается, то число кандидатов, избираемых от округов, может определяться так, чтобы дискриминировать отдельные группы избирателей (в ан- глоязычных источниках такое явление называется malapportionment) или, напротив, ОДИН ЧЕЛОВЕК - ОДИН ГОЛОС Конечная цель организации избирательных округов и определения числа представителей от каждого округа - справедливое распределение голосов. Организаторы выборов часто ста- раются следовать принципу «один человек - один голос». Но всегда делать это не удается даже в самых пропорциональных избирательных системах. Еще один фактор, влияющий на «себесто- имость» парламентариев в голосах - участие избирателей в выборах. Профессор политологии Джеймс Кэмпбелл 20 лет назад заметил, что членам Конгресса США от демократической партии было легче избраться от округов с низкой явкой, чем от округов с высокой явкой Гэдди, Верт и Буллок (2012) проанализировали, как явка в избирательных округах и раз- личия в численности избирателей между округами влияют на исход выборов. Они утверждают: несмотря на то что в последние 50 лет округа были изменены так, чтобы выровнять численность их населения, разница в явке ведет к тому, что «себестоимость» парламентария, выраженная в голосах, в разных округах до сих пор заметно отличается. В частности, исследователи по- казали, что в одних округах явка оказалась минимум в три раза выше, чем в других. Эта раз- ница в явке, из которой следует отличие в «себестоимости» парламентариев в разных округах, сравнима с разницей, которая шестьдесят лет назад была вызвана различиями в численности населения округов. 140
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ уравнять их в правах. Здесь в качестве примера можно привести федерации, все члены которых имеют одинаковое представительство в парламенте. В 1964 году Верховный суд США постановил, что численность населения изби- рательных округов должна быть примерно одинаковой. До принятия этого вердикта некоторые городские округа были представлены в законодательных органах недо- статочно. Предельный случай наблюдался в законодательном собрании штата Нью- Гэмпшир, где по одному представителю имели и округ с населением в 3 человека, и округ с населением в 3244 человека. При распределении мест по избирательным округам в соответствии с числен- ностью их населения используются различные методы. Описанные методы можно применить и для определения числа мест, которые достанутся отдельным партиям. Как мы уже говорили, метод д’Ондта, или метод Джефферсона, равно как и метод Вебстера были разработаны в США именно с этой целью. В Швеции для распре- деления парламентских кресел используется метод Гамильтона. «Джерримендеринг» В мажоритарных системах, где кандидаты выбираются непропорционально числу голосов, изменение границ избирательных округов может сказаться на составе пар- ламента. Изменение границ округов для получения политического преимущества на- зывается «джерримендеринг». Рассмотрим два его примера. Первый пример Допустим, что выборы в национальный парламент из 20 мест проводятся по ма- жоритарной избирательной системе. Страна делится на 20 избирательных окру- гов, и от каждого округа избирается по одному парламентарию. В девяти округах большинство голосов, как правило, получает партия А, в И — партия В, поэтому правящей партией обычно оказывается В. После политического кризиса к власти приходит партия А и проводит избирательную реформу: число избирательных окру- гов сокращается с 20 до 17. В ходе реформы ни один из девяти округов, где преиму- щество традиционно имеет партия А, не претерпевают существенных изменений. Некоторые из И оставшихся округов объединяются попарно. После реформы тра- диционное большинство меняется: в девяти округах, как правило, побеждают кан- дидаты от партии А, в восьми — кандидаты от партии В. Следовательно, по итогам выборов правящей партией чаще становится партия А. 141
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ «ДЖЕРРИМЕНДЕРИНГ» Слово «джерримендеринг» было придумано в США. Впервые оно появилось в газете Boston Gazette, издававшейся в городе Бостон, штат Массачусетс, 26 марта 1812 года. Это слово об- разовано слиянием слов Gerry (фамилию Джер- ри носил девятый губернатор штата Массачусетс) и mander- от слова salamander («саламандра»). В 1812 году губернатор Массачусетса Элбридж Томас Джерри (1744-1814) принял закон, со- гласно которому границы избирательных округов штата изменялись в пользу демократическо-ре- спубликанской партии, к которой принадлежал Джерри. В результате изменений округ Эссекс стал по форме напоминать саламандру. Словом Gerry-Mander была озаглавлена опубликованная в газете карикатура, на которой было напи- сано: «Чудовище, появившееся в Юж- ном округе Эссекса первого января». На карикатуре было изображено фан- тастическое животное, по форме напо- минавшее избирательный округ. Карта округа Южный Эссекс (слева), который, по мнению некоторых, напоминал саламандру. Элбридж Томас Джерри (вверху), изображенный на этом портрете кисти Джеймса Богла, был губернатором штата Массачусетс с 1810 по 1812 год, а с 1813 года и до смерти в 1814 году занимал пост вице-президента США. Второй пример Вновь рассмотрим выборы в национальный парламент из 20 мест, которые про- водятся по мажоритарной системе. В этом случае один из регионов страны, раз- деленный на два округа, по историческим и культурным причинам имеет отличную 142
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ от остальных политическую окраску. Обозначим партию, имеющую большинство в этом регионе, через С. В остальных регионах страны большинство обычно име- ют партии А и В. Партия С оказывается партией меньшинства, и от того, к кому она примкнет, будет зависеть итоговый расклад сил в парламенте. Чтобы избежать нежелательных последствий, главы партий А и В решили изменить систему изби- рательных округов. Оба округа, где большинство голосов получала партия С, были присоединены к соседним округам, где одерживали верх партии А или В. После реформы партия С уже не могла одержать победу ни в одном округе, и парламент стал двухпартийным. Аналогичного результата можно достичь с большей эффективностью, если раз- делить каждый из округов, где партия С имеет большинство, на несколько частей и присоединить их к округам, где популярностью пользуются партии А или В. Так голоса, отданные в пользу партии С, распределятся с большей вероятностью, и эта партия утратит большинство. Двумя основными приемами джерримендеринга служат концентрация и рассея- ние избирателей, описанные в первом и втором примере соответственно. Участие в выборах и объявление кандидатов Возможности политиков также ограничивают условия, которые должна выполнить партия, чтобы представить на выборах своих кандидатов. В одних странах для участия в выборах достаточно просто зарегистрировать пар- тию, в других — необходимо выполнить ряд дополнительных условий. К примеру, согласно закону, вступившему в силу в Испании в 2011 году, для участия в общих выборах политические партии, которые на данный момент не пред- ставлены в кортесах (органах законодательной власти. — Прим, перев.), должны собрать определенное число подписей, составляющее 0,1% от численности изби- рателей в каждом округе. Это требование, которое ранее не было обязательным, законодательно закреплено в январе 2011 года. Необходимость сбора подписей, возможно, отчасти объясняет, почему на вы- борах 2011 года было представлено меньше партий, чем на предыдущих выборах в 2008 году: из 92 партий осталось лишь 72. В 2004 году на выборах в Испании участвовали 96 партий. После окончания выборов распределение представителей партий происходит со- гласно действующему законодательству. В представительных системах получение голоса не означает автоматического избрания на должность — для этого необходи- 143
ИЗБИРАТЕЛЬНЫЕ СИСТЕМЫ мо набрать определенный процентный минимум голосов. Для разных выборов про- центный минимум определяется на уровне избирательного округа либо на уровне всей страны. Это различие, разумеется, также влияет на результат выборов. К при- меру, в Швеции на парламентских выборах и выборах в Европарламент предста- витель округа должен набрать либо 4 °/о голосов по всей стране, либо свыше 12 % в одном из округов, на выборах в совет округа — 3 % голосов по всей стране. В Испании, напротив, процентный минимум, который необходимо набрать по всей стране, отсутствует, и некоторые партии заявляются на выборы не во всех округах. Кроме того, мандаты часто получают депутаты от партий, набравших менее 4 % голосов. К примеру, на выборах 2008 года Объединенные левые, третья партия по числу голосов избирателей, получили всего 3,77 °/о голосов. 144
Эпилог В этой книге мы привели общий обзор тем, связанных с принятием решений — в частности, мы рассказали о многокритериальном принятии решений, принятии решений в условиях противодействия и методах общественного выбора, в том числе об избирательных системах. Мы также рассмотрели другие важные темы, среди них — многообъектное принятие решений. Что касается принятия решений в условиях неопределенности, мы уделили ос- новное внимание преимущественно классическим методам, хотя на сегодняшний день существует множество альтернативных моделей. Часть их была разработана в рамках искусственного интеллекта для последующего использования в интеллек- туальных системах, которые должны уметь анализировать данные и принимать ре- шения. Мы отметили, что необходимо адекватно представлять неточность и нечет- кость, к примеру при помощи нечетких множеств. Сегодня существует множество систем, разработанных с использованием нечетких множеств и нечеткой логики, а также теории вероятностей, в частности графические вероятностные модели, кото- рые играют особую роль в решении реальных задач. Мы также повторили некоторые вопросы теории игр и компьютерных алгорит- мов в играх. Эти темы охватывают намного больше вопросов, чем нам удалось рас- смотреть на страницах этой небольшой книги, поэтому мы приглашаем читателя об- ратиться к дополнительной литературе и продолжить изучение самостоятельно. 145

Библиография COLMAN, А.М., Game Theory and Its Applications in the Social and Biological Scien- ces, Oxford, Butterworth-Heinemann, 1995. COLOMER, J.M., Como votamos. Los sistemas electorates del mundo: pasado, presente у futuro, Barcelona, Gedisa, 2004. GlLBOA, I., Theory of decision under uncertainty, Cambridge University Press, 2009. KLIR, G.J. Y YUAN B., Fuzzy Sets and Fuzzy Logic: Theory and Applications, Lon- dres, Prentice Hall International (UK) Limited, 1995. KNIGHT F.H., Riesgo, incertidumbre у beneficio, Madrid, M. Aguilar, 1947. MYERSON, R.B., Game Theory, Harvard University Press, 1991. RAPOPORT, A., Decision Theory and Decision Behaviour, Dordrecht, Kluwer Acade- mic Publishers, 1989. RUSSELL, S. Y NoRVIG, P., Artificial Intelligence. A Modern Approach, Nueva Jersey, Pearson, 2009. TORRA, V. Y NARUKAWA Y., Modeling Decisions: Information Fusion and Aggrega- tion Operators, Berlin, Springer, 2007. WEBB, J.N., Game Theory: Decisions, Interaction and Evolution, Berlin, Springer, 2007. 147

Алфавитный указатель Jeopardy! 44 Watson (компьютерная программа) 44 агрегирование полезности 26, 38, 62-61 предпочтений 25, 44—50, 61 Без дек, Джеймс 85 Бернулли, Даниил 75 вероятность объективная 71, 72 субъективная 71 взаимная компенсация критериев 28, 62, 65 взаимодействие критериев 28, 62, 66 голосование кумулятивное 129, 131 ограниченное 128—130 одобрительное 124, 125 представительное 129, 130 Гильбоа, Ицхак 42, 70, 80 Гомер 103 де Финетти, Бруно 71, 77 джерримендеринг 141-143 Джефферсон, Томас 130, 131 Джефферсона метод см. метод д’Ондта или Джефферсона 41 дилемма заключенного 89—98, 104 дисперсия 38—42 Доджсон, Чарльз 128 игра аддитивная 111 динамическая 89,114 кооперативная 104, 106, ИЗ монотонная 109-113 с нулевой суммой 96, 101 статическая 89 супераддитивная 111-113 избирательные системы мажоритарные 123—128, 141 пропорциональные 128—131 индексы Банцафа и Шепли ИЗ искусственный интеллект 9, 13, 32, 43, 44, 89,114,141 «Камень, ножницы, бумага» 95—97 Кантор, Георг 20, 21 Кеннеди, Джон Фицджеральд 131 Колман, Эндрю 103 Кондорсе, Жан Антуан Николя 56 Крамер, Габриэль 75 Кронекер, Леопольд 21 Луллий, Раймунд 61 мера аддитивная ИЗ возможности 87, 81 неаддитивная 66, 67, 81 неопределенности 84, 86 метод д’Ондта или Джефферсона 130— 134,137,141 Кондорсе 53—61 Сент-Лагю (Вебстера) 132—134 методы наибольшего остатка 135—131 модель ожидаемой полезности 136 Моргенштерн, Оскар 71—77, 79, 101 Найт, Фрэнк Хайнеман 70 независимость от посторонних альтер- натив 49, 50, 53 неточность 70, 82, 83, 85 нечеткие интегралы 61 149
АЛФАВИТНЫЙ УКАЗАТЕЛЬ нечеткое множество 83 нечеткость 83, 85,141 Николай Кузанский 61 Нэш, Джон Форбс 101 Нэша равновесие 94—99, 101 обучение автоматическое 31, 32, 38, 39, 41 статистическое 38, 39 ожидаемая выгода 75 отношение предпочтения 16—18, 20, 24, 25, 33-37, 45, 57, 75 рациональное 36, 38, 48, 74, 76, 78 с безразличием 35 строгое 35—37 парадокс Алле 80, 81 Кондорсе 56—57 Санкт-Петербургский 75 Элсберга 43, 81 Парето, Вильфредо 31 граница 29—31, 63, 65, 68, 93, 96 доминирование по 29, 93 оптимум по 31, 93 принцип 31 поисковые системы 47 полезность ожидаемая 71-73, 75, 76, 80, 81 субъективная ожидаемая 71, 72, 76, 79, 81, 82 правило Борда 53, 59—62 предпочтение с одним максимумом 51-51 принятие решений в условиях неопределенности 15,110 многокритериальное 14-16, 45- 68,110,145 в условиях противодействия 13, 15 многообъектное 14, 15 в условиях определенности 13—11 пропорциональное представление пар- тий 130,138,140 Пуанкаре, Анри 21 рейтинговое голосование 45, 126— 127 решения идеальные в играх 114-121 неидеальные 121 система единого передаваемого голоса 127,137,138 систематическая ошибка 38—42 смешанная пропорциональная система 138 среднее арифметическое 27—29, 38, 61 взвешенное 28, 38, 63, 82 стратегия 89—91, 130 доминирующая 92, 97 слабо доминирующая 92 смешанная 93-94 строго доминирующая 92, 97 чистая 93-99,101 Сугено, Мичио 67 Сэвидж, Леонард 70, 72, 77—80 теорема Байеса 87 Люче 35 Нэша 94, 97, 99,101 Сэвиджа 71, 77—80 фон Неймана и Моргенштерна 74-79 150
АЛФАВИТНЫЙ УКАЗАТЕЛЬ Эрроу о невозможности коллектив- ного выбора 47 теория общественного выбора 18 фон Нейман, Джон 71-77, 79,101 функция агрегирования 27—29, 33, 49—51, 62, 64 полезности 9,16,19-25, 33, 35— 37, 45, 64, 65, 71-74, 76-81, 90, 95,100 принадлежности 83—85, 87 характеристическая 84,104-113 Чавас, Жан-Поль 70 Шоке интеграл 66, 67, 81, 82, ИЗ Шоке, Гюстав 67 151
Научно-популярное издание Выходит в свет отдельными томами с 2014 года Мир математики Том 45 Висеиц Торра Математика и выборы. Принятие решений РОССИЯ Издатель, учредитель, редакция: ООО «Де Агостини», Россия Юридический адрес: Россия, 105066, г. Москва, ул. Александра Лукьянова, д. 3, стр. 1 Письма читателей по данному адресу не при- нимаются. Генеральный директор: Николаос Скилакис Главный редактор: Анастасия Жаркова Выпускающий редактор: Людмила Виноградова Финансовый директор: Полина Быстрова Коммерческий директор: Александр Якутов Менеджер по маркетингу: Михаил Ткачук Менеджер по продукту: Яна Чухиль Для заказа пропущенных книг и по всем вопро- сам, касающимся информации о коллекции, за- ходите на сайт www.deagostini.ru, по остальным вопросам обращайтесь по телефону бесплатной горячей линии в России: ® 8-800-200-02-01 Телефон горячей линии для читателей Москвы: ® 8-495-660-02-02 Адрес для писем читателей: Россия, 600001, г. Владимир, а/я 30, «Де Агостини», «Мир математики» Пожалуйста, указывайте в письмах свои кон- тактные данные для обратной связи (телефон или e-mail). Распространение: ООО «Бурда Дистрибьюшен Сервисиз» УКРАИНА Издатель и учредитель: ООО «Де Агостини Паблишинг» Украина Юридический адрес: 01032, Украина, г. Киев, ул. Саксаганского, 119 Генеральный директор: Екатерина Клименко Для заказа пропущенных книг и по всем вопро- сам, касающимся информации о коллекции, за- ходите на сайт www.deagostini.ua, по остальным вопросам обращайтесь по телефону бесплатной горячей линии в Украине: ® 0-800-500-8-40 Адрес для писем читателей: Украина, 01033, г. Киев, а/я «Де Агостини», «Мир математики» УкраГна, 01033, м. Ки!'в, а/с «Де Агоспж» БЕЛАРУСЬ Импортер и дистрибьютор в РБ: ООО «Росчерк», 220037, г. Минск, ул. Авангардная, 48а, литер 8/к, тел./факс: (+375 17) 331-94-41 Телефон «горячей линии» в РБ: ® + 375 17 279-87-87 (пн-пт, 9.00-21.00) Адрес для писем читателей: Республика Беларусь, 220040, г. Минск, а/я 224, ООО «Росчерк», «Де Агостини», «Мир математики» КАЗАХСТАН Распространение: ТОО «КГП «Бурда-Алатау Пресс» Издатель оставляет за собой право увеличить реко- мендуемую розничную цену книг. Издатель остав- ляет за собой право изменять последовательность заявленных тем томов издания и их содержание. Отпечатано в соответствии с предоставленными материалами в типографии: Grafica Veneta S.p.A Via Malcanton 2 35010 Trebaseleghe (PD) Italy Подписано в печать: 08.10.2014 Дата поступления в продажу на территории России: 25.11.2014 Формат 70 х 100 / 16. Гарнитура «Academy». Печать офсетная. Бумага офсетная. Печ. л. 5. Усл. печ. л. 6,48. Тираж: 28 600 экз. © VicenQ Тогга, 2014 (текст) © RBA Collecionables S.A., 2014 © ООО «Де Агостини», 2014 ISBN 978-5-9774-0682-6 ISBN 978-5-9774-0778-6 (т. 45) @ Данный знак информационной про- дукции размещен в соответствии с требования- ми Федерального закона от 29 декабря 2010 г. № 436-ФЗ «О защите детей от информации, при- чиняющей вред их здоровью и развитию». Издание для взрослых, не подлежит обязатель- ному подтверждению соответствия единым требо- ваниям, установленным Техническим регламентом Таможенного союза «О безопасности продукции, предназначенной для детей и подростков» ТР ТС 007/2011 от 23 сентября 2011 г. № 797.
Математика и выборы Принятие решений Теория принятия решений объясняет, как мы делаем выводы (прежде всего в повседневной жизни). Эта дисциплина находится на стыке экономики, статистики, психологии и информатики. В книге, которую вы держите в руках, рассмотрено несколько наиболее важных разделов теории принятия решений. Основное внимание уделено математическим моделям, позволяющим находить оптимальные решения. Кроме того, автор подробно рассказал о многокритериальном принятии решений, принятии решений в условиях противодействия (теории игр и применении искусственного интеллекта в играх), а также о методах общественного выбора, в том числе об избирательных системах. ISBN 978-59774 .682-6 12+ 9 785977 406826